|
技术交流 | 电路欣赏 | 工控天地 | 数字广电 | 通信技术 | 电源技术 | 测控之家 | EMC技术 | ARM技术 | EDA技术 | PCB技术 | 嵌入式系统 驱动编程 | 集成电路 | 器件替换 | 模拟技术 | 新手园地 | 单 片 机 | DSP技术 | MCU技术 | IC 设计 | IC 产业 | CAN-bus/DeviceNe |
DSP浮点转Q 的一些资料 |
作者:ARC的蜈蚣 栏目:DSP技术 |
如何上传? * - 本贴最后修改时间:2006-3-22 18:10:57 修改者:ARC的蜈蚣 |
2楼: | >>参与讨论 | |||||||||||||||||||||||||||||||||||||||||||||||||||
作者: ARC的蜈蚣 于 2006/3/22 18:20:00 发布:
上传不了文件,只好贴上(有些特殊字符看不到) 第3章 DSP芯片的定点运算 3.1 数 的 定 标 在定点DSP芯片中,采用定点数进行数值运算,其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长,一般为16位或24位。显然,字长越长,所能表示的数的范围越大,精度也越高。如无特别说明,本书均以16位字长为例。 DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负,0表示数值为正,1则表示数值为负。其余15位表示数值的大小。因此 二进制数0010000000000011b=8195 二进制数1111111111111100b=-4 对DSP芯片而言,参与数值运算的数就是16位的整型数。但在许多情况下,数学运算过程中的数不一定都是整数。那么,DSP芯片是如何处理小数的呢?应该说,DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢?当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。 通过设定小数点在16位数中的不同位置,就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。 从表3.1可以看出,同样一个16位数,若小数点设定的位置不同,它所表示的数也就不同。例如: 16进制数2000H=8192,用Q0表示 16进制数2000H=0.25,用Q15表示 但对于DSP芯片来说,处理方法是完全相同的。 从表3.1还可以看出,不同的Q所表示的数不仅范围不同,而且精度也不相同。Q越大,数值范围越小,但精度越高;相反,Q越小,数值范围越大,但精度就越低。例如,Q0的数值范围是-32768.html">32768到+32767,其精度为1,而Q15的数值范围为-1到0.9999695,精度为 1/32768.html">32768 = 0.00003051。因此,对定点数而言,数值范围与精度是一对矛盾,一个变量要想能够表示比较大的数值范围,必须以牺牲精度为代价;而想提高精度,则数的表示范围就相应地减小。在实际的定点算法中,为了达到最佳的性能,必须充分考虑到这一点。 浮点数与定点数的转换关系可表示为: 浮点数(x)转换为定点数( ): 定点数( )转换为浮点数(x): 例如,浮点数 x=0.5,定标 Q=15,则定点数 = ,式中 表示下取整。反之,一个用 Q=15 表示的定点数16384,其浮点数为16384×2-15 =16384/32768.html">32768=0.5。 表3.1 Q表示、S表示及数值范围
3.2 高级语言:从浮点到定点 在编写DSP模拟算法时,为了方便,一般都是采用高级语言(如C语言)来编写模拟程序。程序中所用的变量一般既有整型数,又有浮点数。如例3.1程序中的变量i是整型数,而pi是浮点数,hamwindow则是浮点数组。 例3.1 256点汉明窗计算 int i; float pi=3.14159; float hamwindow[256]; for(i=0;i<256;i++) hamwindow[i]=0.54-0.46*cos(2.0*pi*i/255); 如果要将上述程序用某种定点DSP芯片来实现,则需将上述程序改写为DSP芯片的汇编语言程序。为了DSP程序调试的方便及模拟定点DSP实现时的算法性能,在编写DSP汇编程序之前一般需将高级语言浮点算法改写为高级语言定点算法。下面讨论基本算术运算的定点实现方法。 3.2.1 加法/减法运算的C语言定点模拟 设浮点加法运算的表达式为: float x,y,z; z=x+y; 将浮点加法/减法转化为定点加法/减法时最重要的一点就是必须保证两个操作数的定标值一样。若两者不一样,则在做加法/减法运算前先进行小数点的调整。为保证运算精度,需使Q值小的数调整为与另一个数的Q值一样大。此外,在做加法/减法运算时,必须注意结果可能会超过16位表示。如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度。 1.结果不超过16位表示范围 设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法/减法结果z的定标值为Qz,则 z=x+y Þ = = Þ 所以定点加法可以描述为: int x,y,z; LONG TEMP; /*临时变量*/ TEMP=y<<(Qx-Qy); TEMP=x+TEMP; z=(int)(TEMP>>(Qx-Qz)), 若Qx≥Qz z=(int)(TEMP<<(Qz-Qx)), 若QxQ≤z 例3.2 定点加法 设x=0.5,y=3.1,则浮点运算结果为z=x+y=0.5+3.1=3.6; Qx=15,Qy=13,Qz=13,则定点加法为: x=16384;y=25395; TEMP=25395<<2=101580; TEMP=x+TEMP=16384+101580=117964; z=(int)(117964L>>2)=29491; 因为z的Q值为13,所以定点值z=29491即为浮点值z=29491/8192=3.6。 例3.3 定点减法 设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1; Qx=13,Qy=13,Qz=15,则定点减法为: x=24576;y=25295; TEMP=25395; TEMP=x-TEMP=24576-25395=-819; 因为Qx<Qz,故 z=(int)(-819<<2)=-3276。由于z的Q值为15,所以定点值z=-3276即为浮点值z=-3276/32768.html">32768»-0.1。 2.结果超过16位表示范围 设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法结果z的定标值为Qz,则定点加法为: int x,y; LONG TEMP,z; TEMP=y<<(Qx-Qy); TEMP=x+TEMP; z=TEMP>>(Qx-Qz),若Qx≥Qz z=TEMP<<(Qz-Qx),若Qx≤Qz 例3.4 结果超过16位的定点加法 设x=15000,y=20000,则浮点运算值为z=x+y=35000,显然z>32767,因此 Qx=1,Qy=0,Qz=0,则定点加法为: x=30000;y=20000; TEMP=20000<<1=40000; TEMP=TEMP+x=40000+30000=70000; z=70000L>>1=35000; 因为z的Q值为0,所以定点值z=35000就是浮点值,这里z是一个长整型数。 当加法或加法的结果超过16位表示范围时,如果程序员事先能够了解到这种情况,并且需要保证运算精度时,则必须保持32位结果。如果程序中是按照16位数进行运算的,则超过16位实际上就是出现了溢出。如果不采取适当的措施,则数据溢出会导致运算精度的严重恶化。一般的定点DSP芯片都设有溢出保护功能,当溢出保护功能有效时,一旦出现溢出,则累加器ACC的结果为最大的饱和值(上溢为7FFFH,下溢为8001H),从而达到防止溢出引起精度严重恶化的目的。 3.2.2 乘法运算的C语言定点模拟 设浮点乘法运算的表达式为: float x,y,z; z = xy; 假设经过统计后x的定标值为Qx,y的定标值为Qy,乘积z的定标值为Qz,则 z = xy Þ = Þ = 所以定点表示的乘法为: int x,y,z; LONG TEMP; TEMP = (LONG)x; z = (TEMP×y) >> (Qx+Qy-Qz); 例3.5 定点乘法 设x = 18.4,y = 36.8,则浮点运算值为z =18.4×36.8 = 677.12; 根据上节,得Qx = 10,Qy = 9,Qz = 5,所以 x = 18841;y = 18841; TEMP = 18841L; z = (18841L*18841)>>(10+9-5) = 354983281L>>14 = 21666; 因为z的定标值为5,故定点 z = 21666即为浮点的 z = 21666/32 = 677.08。 3.2.3 除法运算的C语言 |
3楼: | >>参与讨论 |
作者: ARC的蜈蚣 于 2006/3/22 18:21:00 发布:
接着来 3.2.4 程序变量的Q值确定 在前面几节介绍的例子中,由于x、y、z的值都是已知的,因此从浮点变为定点时Q值很好确定。在实际的DSP应用中,程序中参与运算的都是变量,那么如何确定浮点程序中变量的Q值呢? 从前面的分析可以知道,确定变量的Q值实际上就是确定变量的动态范围,动态范围确定了,则Q值也就确定了。 设变量的绝对值的最大值为 ,注意 必须小于或等于32767。取一个整数n,使它满足 则有 Q = 15-n 例如,某变量的值在-1至+1之间,即 <1,因此n = 0,Q=15-n = 15。 确定了变量的 就可以确定其Q值,那么变量的 又是如何确定的呢?一般来说,确定变量的 有两种方法:一种是理论分析法,另一种是统计分析法。 1.理论分析法 有些变量的动态范围通过理论分析是可以确定的。例如: (1) 三角函数,y = sin(x)或y = cos(x),由三角函数知识可知,|y|≤1; (2) 汉明窗,y(n) = 0.54-0.46cos [2pn/(N-1)] ,0≤n≤N-1。因为-1≤cos [2pn/(N-1)]≤1,所以0.08≤y(n)≤1.0; (3) FIR卷积。y(n)= ,设 ,且x(n)是模拟信号12位量化值,即有 ≤211,则 ≤211; (4) 理论已经证明,在自相关线性预测编码(LPC)的程序设计中,反射系数 满足下列不等式: ,i= 1,2,…,p, p为LPC的阶数。 2.统计分析法 对于理论上无法确定范围的变量,一般采用统计分析的方法来确定其动态范围。所谓统计分析,就是用足够多的输入信号样值来确定程序中变量的动态范围,这里输入信号一方面要有一定的数量,另一方面必须尽可能地涉及各种情况。例如,在语音信号分析中,统计分析时就必须采集足够多的语音信号样值,并且在所采集的语音样值中,应尽可能地包含各种情况,如音量的大小、声音的种类(男声、女声) 等。只有这样,统计出来的结果才能具有典型性。 当然,统计分析毕竟不可能涉及所有可能发生的情况,因此,对统计得出的结果在程序设计时可采取一些保护措施,如适当牺牲一些精度,Q值取比统计值稍大些,使用DSP芯片提供的溢出保护功能等。 3.2.5 浮点至定点变换的C程序举例 本节通过一个例子来说明C程序从浮点变换至定点的方法。这是一个对语音信号(0.3kHz~3.4kHz)进行低通滤波的C语言程序,低通滤波的截止频率为800Hz,滤波器采用19点的有限冲击响应FIR滤波。语音信号的采样频率为8kHz,每个语音样值按16位整型数存放在insp.dat文件中。 例3.7 语音信号800Hz 19点FIR低通滤波C语言浮点程序 #include <stdio.h> const int length = 180 /*语音帧长为180点=22.5ms@8kHz采样*/ void FILTER(int xin[ ],int xout[ ],int n,float h[ ]); /*滤波子程序说明*/ /*19点滤波器系数*/ static float h[19]= {0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568, -0.008692503,0.06446265,0.1544655,0.2289794,0.257883, 0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568, -0.04743239,-0.02881839,-0.009012882,0.01218354}; static int x1[length+20]; /*低通滤波浮点子程序*/ void FILTER(int xin[ ],int xout[ ],int n,float h[ ]) { int i,j; float sum; for(i=0;i<length;i++) x1[n+i-1]=xin[i]; for (i=0;i<length;i++) { sum=0.0; for(j=0;j<n;j++) sum+=h[j]*x1[i-j+n-1]; xout[i]=(int)sum; } for(i=0;i<(n-1);i++) x1[n-i-2]=xin[length-1-i]; } /*主程序*/ void main( ) { FILE *fp1,*fp2; int frame,indata[length],outdata[length]; fp1=fopen(insp.dat,"rb"); /*输入语音文件*/ fp2=fopen(outsp.dat,"wb"); /*滤波后语音文件*/ frame=0; while(feof(fp1)==0) { frame++; printf("frame=%d\n",frame); for(i=0;i<length;i++) indata[i]=getw(fp1); /*取一帧语音数据*/ FILTER(indata,outdata,19,h); /*调用低通滤波子程序*/ for(i=0;i<length;i++) putw(outdata[i],fp2); /*将滤波后的样值写入文件*/ } fcloseall( ); /*关闭文件*/ return(0); } 例3.8 语音信号800Hz 19点FIR低通滤波C语言定点程序 #include <stdio.h> const int length=180; void FILTER(int xin[ ],int xout[ ],int n,int h[ ]); static int h[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450, 7503,5061,2112,-285,-1503,-1555,-945,-296,399}; /*Q15*/ static int x1[length+20]; /*低通滤波定点子程序*/ void FILTER(int xin[ ],int xout[ ],int n,int h[ ]) { int i,j; LONG sum; for(i=0;i<length;i++) x1[n+i-1]=xin[i]; for (i=0;i<length;i++) { sum=0; for(j=0;j<n;j++) sum+=(LONG)h[j]*x1[i-j+n-1]; xout[i]=sum>>15; } for(i=0;i<(n-1);i++) x1[n-i-2]=xin[length-i-1]; } 主程序与浮点的完全一样。 3.3 DSP定点算术运算 定点DSP芯片的数值表示是基于2的补码表示形式。每个16位数用1个符号位、i个整数位和15-i个小数位来表示。因此数00000010.10100000表示的值为 =2.625,这个数可用Q8格式(8个小数位)来表示,它表示的数值范围为-128~+127.996,一个Q8定点数的小数精度为1/256=0.004。 虽然特殊情况(如动态范围和精度要求)必须使用混合表示法,但是,更通常的是全部以Q15格式表示的小数或以Q0格式表示的整数来工作。这一点对于主要是乘法和累加的信号处理算法特别现实,小数乘以小数得小数,整数乘以整数得整数。当然,乘积累加时可能会出现溢出现象,在这种情况下,程序员应当了解数学里面的物理过程以注意可能的溢出情况。下面讨论乘法、加法和除法的DSP定点运算,汇编程序以TMS320C25为例。 3.3.1 定点乘法 2个定点数相乘时可以分为下列3种情况: 1.小数乘小数 Q15×Q15=Q30 例3.9 0.5*0.5 = 0.25 0.100000000000000 ;Q15 × 0.100000000000000 ;Q15 00.010000000000000000000000000000=0.25 ;Q30 2个Q15的小数相乘后得到1个Q30的小数,即有2个符号位。一般情况下相乘后得到的满精度数不必全部保留,而只需保留16位单精度数。由于相乘后得到的高16位不满15位的小数精度,为了达到15位精度,可将乘积左移1位,下面是上述乘法的TMS320C25程序: LT OP1 ;OP1=4000H(0.5/Q15) MPY OP2 ;OP2=4000H(0.5/Q15) PAC SACH ANS,1 ;ANS=2000H(0.25/Q15) 2.整数乘整数 Q0×Q0 = Q0 例3.10 17×(-5)=-85 0000000000010001=17 × 1111111111111011=-5 11111111111111111111111110101011=-85 3.混合表示法 许多情况下,运算过程中为了既满足数值的动态范围又保证一定的精度,就必须采用Q0与Q15之间的表示法。比如,数值1.2345,显然Q15无法表示,而若用Q0表示,则最接近的数是1,精度无法保证。因此,数1.2345最佳的表示法是Q14。 例3.11 1.5×0.75 = 1.125 01.10000000000000 = 1.5 ;Q14 × 00.11000000000000 = 0.75 ;Q14 0001.0010000000000000000000000000 = 1.125;Q28 Q14的最大值不大于2,因 |
4楼: | >>参与讨论 |
作者: ARC的蜈蚣 于 2006/3/22 18:21:00 发布:
最后 (1) 分子小于分母 DIV_A: LT NUMERA MPY DENOM PAC SACH TEMSGN ;取商的符号 LAC DENOM ABS SACL DENOM ;使分母为正 ZALH NUMERA ;使分子为正 ABS RPTK 14 SUBC DENOM ;除循环15次 SACL QUOT LAC TEMSGN BGEZ A1 ;若符号为正,则完成 ZAC SUB QUOT SACL QUOT ;若为负,则商为负 A1: RET 这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。 (2) 规定商的精度 DIV_B: LT NUMERA MPY DENOM PAC SACH TEMSGN ;取商的符号 LAC DENOM ABS SACL DENOM ;使分母为正 LACK 15 ADD FRAC SACL FRAC ;计算循环计数器 LAC NUMERA ABS ;使分子为正 RPT FRAC SUBC DENOM ;除循环16+FRAC次 SACL QUOT LAC TEMSGN BGEZ B1 ;若符号为正,则完成 ZAC SUB QUOT SACL QUOT ;若为负,则商为负 B1: RET 与DIV_A相同,这个程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN为暂存单元。FRAC中规定商的精度,如商的精度为Q13,则调用程序前FRAC单元中的值应为13。 3.4 非线性运算的定点快速实现 在数值运算中,除基本的加减乘除运算外,还有其他许多非线性运算,如对数运算、开方运算、指数运算、三角函数运算等,实现这些非线性运算的方法一般有:(1)调用DSP编译系统的库函数;(2)查表法;(3)混合法。下面分别介绍这三种方法。 1.调用DSP编译系统的库函数 TMS320C2X/C5X 的C编译器提供了比较丰富的运行支持库函数。在这些库函数中,包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在C程序中(也可在汇编程序中)只要采用与库函数相同的变量定义,就可以直接调用。例如,在库函数中,定义了以10为底的常用对数log10( ): #include <math.h> double log10(double x); 在C程序中按如下方式调用: float x,y; x = 10.0; y = log10(x); 从上例可以看出,库函数中的常用对数log10( )要求的输入值为浮点数,返回值也为浮点数,运算的精度完全可以保证。直接调用库函数非常方便,但由于运算量大,很难在实时DSP中得到应用。 2.查表法 在实时DSP应用中实现非线性运算,一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格。显然输入的范围越大,精度要求越高,则所需的表格就越大,即存储量也越大。查表法求值所需的计算就是根据输入值确定表的地址,根据地址就可得到相应的值,因而运算量较小。查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况,例3.12和例3.13分别说明这两种情况。 例3.12 已知正弦函数y=cos(x),制作一个512点表格,并说明查表方法。 由于正弦函数是周期函数,函数值在-1至+1之间,用查表法比较合适。 由于Q15的表示范围为-1至32767/32768之间,原则上讲-1至+1的范围必须用Q14表示。但一般从方便和总体精度考虑,类似情况仍用Q15表示,此时+1用32767来表示。 (1) 产生512点值的C语言程序如下所示: #define N 512 #define pi 3.14159 int sin_tab[512]; void main( ) { int i; for(i=0;i<N;i++) sin_tab[i]=(int)(32767*sin(2*pi*i/N)); } (2) 查表 查表实际上就是根据输入值确定表的地址。设输入x在0~2p之间,则x对应于512点表的地址为:index = (int)(512*x/2p),则 y = sin(x) = sin_tab[index]。 如果x用Q12定点数表示,将512/2p用Q8表示为 20861,则计算正弦表的地址的公式为:index = (x*20861L)>>20。 例3.13 用查表法求以2为底的对数,已知自变量取值范围为0.5~1,要求将自变量范围均匀划分为10等分。试制作这个表格并说明查表方法。 (1) 做表: y = log2(x),由于x在0.5到1之间,因此y在-1到0之间,x和y均可用Q15表示。由于对x均匀划分为10段,因此,10段对应于输入x的范围如表3.2所示。若每一段的对数值都取第1点的对数值,则表中第1段的对数值为y0(Q15) = (int)(log2(0.5)×32768),第2段的对数值为y1(Q15) = (int)(log2(0.55)×32768),依次类推。 表3.2 logtab0 10点对数表(输入0.5~1) 地址 输入值 对数值(Q15) 0 0.50~0.55 -32768 1 0.55~0.60 -28262 2 0.60~0.65 -24149 3 0.65~0.70 -20365 4 0.70~0.75 -16862 5 0.75~0.80 -13600 6 0.80~0.85 -10549 7 0.85~0.90 -7683 8 0.90~0.95 -4981 9 0.95~1.00 -2425 (2) 查表: 查表时,先根据输入值计算表的地址,计算方法为:index=((x-16384)×20)>>15。式中,index就是查表用的地址。例如,已知输入x= 26869,则index=6,因此y=-10549。 3.混合法 (1) 提高查表法的精度 上述方法查表所得结果的精度随表的大小而变化,表越大,则精度越高,但存储量也越大。当系统的存储量有限而精度要求也较高时,查表法就不太适合。那么能否在适当增加运算量的情况下提高非线性运算的精度呢?下面介绍一种查表结合少量运算来计算非线性函数的混合法,这种方法适用于在输入变量的范围内函数呈单调变化的情形。 混合法是在查表的基础上采用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法,如图3.1所示。 仍以求以2为底的对数为例(例3.13)。设输入值为x,则精确的对数值为y,在表格值的两点之间作一直线,用y'作为y的近似值,则有: y'=y0+ y 图3.1 提高精度的折线近似法 其中y0由查表求得。现在只需在查表求得y0的基础上增加 y即可。 y的计算方法如下: y=( x/ x0) y= x( y0/ x0) 式中 y0/ x0对每一段来说是一个恒定值,可作一个表格直接查得。此外计算 x时需用到每段横坐标的起始值,这个值也可作一个表格。这样共有三个大小均为10的表格,分别为存储每段起点对数值的表logtab0、存储每段 y0/ x0 值的表logtab1和存储每段输入起始值x0的表logtab2,表logtab1和表logtab2可用下列两个数组表示: int logt |
5楼: | >>参与讨论 |
作者: ARC的蜈蚣 于 2006/3/22 18:22:00 发布:
谁告诉我如何上传文件? 我将整个文件上传,就可以看到其中的特殊字符。 |
6楼: | >>参与讨论 |
作者: yueywe 于 2006/3/24 10:39:00 发布:
很多地方有 很多地方有 DSP资料多的地方www.61ic.com |
|
|
免费注册为维库电子开发网会员,参与电子工程师社区讨论,点此进入 |
Copyright © 1998-2006 www.dzsc.com 浙ICP证030469号 |