老古开发网首页
导航:老古开发网首页文章索引文章分类DSP数字信号处理→[C6000软件优化经验总结(2)]
| -文章搜索 - 最新文章 - |

C6000软件优化经验总结(2)

发布时间:2006年7月28日 点击次数:1003
来源:无忧电子开发网   作者:
 

四、

       1、源代码:

void fir_fxd1(short input[], short coefs[], short out[])

{

    int i, j;

    for (i = 0; i < 40; i++)

    {

      for (j = 0; j < 16; j++)

            out[i*16+j]= coefs[j] * input[i + 15 - j];

   }

}

       2、改编后的代码:

void fir_fxd2(const short input[], const short coefs[], short out[])

{

   int i, j;

 

    for (i = 0; i < 40; i++)

    {

      for (j = 0; j < 16; j++)

            out[i*16+j]= coefs[j] * input[i + 15 - j];

   }

        3、优化方法说明:

       C6000编译器如果确定两条指令是不相关的,则安排它们并行执行。 关键字const可以指定一个变量或者一个变量的存储单元保持不变。这有助于帮助编译器确定指令的不相关性。例如上例中,源代码不能并行执行,而结果改编后的代码可以并行执行。

       4、技巧:

       使用const可以限定目标,确定存在于循环迭代中的存储器的不相关性。

五、

       1、源代码:

void vecsum(short *sum, short *in1, short *in2, unsigned int N)

{

    int i;

 

    for (i = 0; i < N; i++)

        sum[i] = in1[i] + in2[i];

}

       2、改编后的代码:

void vecsum6(int *sum, const int *in1, const int *in2, unsigned int N)

{

    int i;

    int sz = N >> 2;

 

    _nassert(N >= 20);

 

    for (i = 0; i < sz; i += 2)

    {

        sum[i]   = _add2(in1[i]  , in2[i]);

        sum[i+1] = _add2(in1[i+1], in2[i+1]);

    }

}

       3、优化方法说明:

源代码中,函数变量的定义是 short *sum, short *in1, short *in2,  改编后的代码函数变量是 int *sum, const int *in1, const int *in2,  整数类型由16位改编成32位,这时使用内联指令“_add2”一次可以完成两组16位整数的加法,效率提高一倍。注意这里还使用了关键字const和内联指令_nassert优化源代码。

       4、技巧

用内联指令_add2、_mpyhl、_mpylh完成两组16位数的加法和乘法,效率比单纯16位数的加法和乘法提高一倍。

       六、if...else...语句的优化

(一)

       1、源代码:

    if (sub (ltpg, LTP_GAIN_THR1) <= 0)

    {

        adapt = 0;                          

    }

    else

    {     

        if (sub (ltpg, LTP_GAIN_THR2) <= 0)

        {

            adapt = 1;                      

        }

        else

        {

            adapt = 2;                      

        }

    }

       2、改编后的代码:

 adapt = (ltpg>LTP_GAIN_THR1) + (ltpg>LTP_GAIN_THR2);

(二)

       1、源代码:

    if (adapt == 0)

    {

        if (filt>5443)

        {

            result = 0;

        }

        else

        {

            if (filt < 0)

            {

                result = 16384; 

            }

            else

            {  

                filt = _sshl (filt, 18)>>16; // Q15

                result = _ssub (16384, _smpy(24660, filt)>>16);

            }

        }

    }

    else

    {

        result = 0;

    }

       2、改编后的代码:

    filt1 = _sshl (filt, 18)>>16;

    tmp = _smpy(24660, filt1)>>16;

    result = _ssub(16384, tmp * (filt>=0));

    result = result * (!((adapt!=0) (filt>5443)));

       (三)

       1、源代码:

static Word16 saturate(Word32 L_var1)

{

 Word16 swOut;

 

 if (L_var1 > SW_MAX)

 {

  swOut = SW_MAX;

  giOverflow = 1;

 }

 else if (L_var1 < SW_MIN)

 {

  swOut = SW_MIN;

  giOverflow = 1;

 }

 else

  swOut = (Word16) L_var1;  /* automatic type conversion */

 return (swOut);

}

       2、改编后的代码:

static inline Word32 L_shl(Word32 a,Word16 b)   

{

return ((Word32)((b) < 0 ? (Word32)(a) >> (-(b)) : _sshl((a),(b)))) ;

}

       3、优化方法说明:

       如果在循环中出现if...else...语句,由于if...else...语句中有跳转指令,而每个跳转指令有5个延迟间隙,因此程序执行时间延长;另外,循环内跳转也使软件流水受到阻塞。直接使用逻辑判断语句可以去除不必要的跳转。例如在例1的源代码最多有两次跳转,而改编后不存在跳转。例2 和例3同样也去掉了跳转。

       4、技巧:

       尽可能地用逻辑判断语句替代if...else...语句,减少跳转语句。

七、

       1、源程序

 dm = 0x7FFF;

 for (j = 0; j < nsiz[m]; j = add(j, 1))

 {

  if (d[j] <= dm)

  {

   dm = d[j];

   jj = j;

  }

 }

 index[m] = jj;

       2、优化后的程序

 dm0 = dm1 = 0x7fff;

         d0  = (Word16 *)&d[0];

         d1  = (Word16 *)&d[1];

 #pragma MUST_ITERATE(32,256,64);

 for (j = 0; j < Nsiz; j+=2)

 {

  n0 = *d0;

  d0 += 2;

  n1 = *d1;  

  d1 += 2;

  if (n0 <= dm0)

  {

   dm0 = n0;

   jj0 = j;

  }

  if (n1 <= dm1)

  {

   dm1 = n1;

   jj1 = j+1;

  }

 }

 if (dm1 != dm0)

 {

  index[m] = (dm1 < dm0)? jj1:jj0;

 }

 else

 {

  index[m] = (jj1 > jj0)? jj1:jj0;

 }

       3、优化说明

        求数组的最小值程序,优化时为了提高程序效率在一个循环之内计算N=1,3,5..和n=2,4,6...的最小值,然后在比较二者的大小以求得整个数组的最小值。

 


欢迎进入老古论坛进行讨论
[DSP数字信号处理] 相关文章:
DSP HPI口与PC104总线接口的FPGA设计
简介:
摘 要 通过对TI公司TMS320C5000系列DSP HPI总线和PC104总线时序的分析,以VHDL语言为工具,使用Altera的FPGA芯片EP1K50,设计完成PCI04总线和DSP HPI总线之间的通信接口,并在一款以TMS320VC5409DSP为数据采集处理器、研华嵌入式工控主板PCM-5825为系统主板组成的嵌入式数据采集系统申得到了运用;给出与整个接口设计相关的VHDL源代码和在PCM-5825上验证接口设计的X86汇编语言程序。 关键词 DSP HPI PC104总线 FPGA VHDL源代码 在一款嵌入式数据采......

电力电子装置控制系统的DSP设计方案
DSP集成开发环境中的混合编程及FFT算法的实现
嵌入式实时系统开发的正确选择
如何在网络视像系统设计中使用数字信号处理器
linux资源
[转帖]做DSP最应该懂得157个问题(1)
[转帖]做DSP最应该懂得157个问题(3)2006
DSP学习进阶【转载】
dsp网络资源
 
下一个:[DSP数字信号处理]C6000软件优化经验总结(1)
简介:
一、c6x的编译的常用选项 (一)c6x的编译程序为&#8220;cl6x.exe&#8221;使用的方法 Cl6x [options] [filenames] Cl6x: 编译程序 ......
 

上一个:[DSP数字信号处理]德金融时报:英特尔利诱德零售商禁售AMD产品

老古开发网版权所有 2006年9月 asp.Net V2.0 设计:老古
页面缓存:否 执行时间:16毫秒