DSP浮点转定点方法总结

上传人：简*** IP属地：湖北上传时间：2020-03-30 格式：DOC 页数：18 大小：231KB 积分：9.6 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

CII Technologies Inc 目录目录目录定点运定点运算算方法方法 3 1 1 数的定标 3 1 2C语言从浮点到定点 4 1 2 1 加法 4 1 2 2乘法 6 1 2 3除法 7 1 2 4 三角函数运算 8 1 2 5 开方运算 9 1 3 附录 10 1 3 1 附录1 定点函数库 10 1 3 2附录2 正弦和余弦表 28 CII Technologies Inc 浮点转定点方法总结定点运算方法定点运算方法 1 1 数数的的定定标标对某些处理器而言参与数值运算的数就是 16 位的整型数但在许多情况下数学运算过程中的数不一定都是整数那么如何处理小数的呢应该说处理器本身无能为力那么是不是就不能处理各种小数呢当然不是这其中的关键就是由程序员来确定一个数的小数点处于 16 位中的哪一位这就是数的定标通过设定小数点在 16 位数中的不同位置就可以表示不同大小和不同精度的小数了数的定标用 Q 表示法表 1 1 列出了一个 16 位数的 16 种 Q 表示能表示的十进制数值范围和近似的精度 Q 表示精度近似十进制数表示范围 Q150 00002 1 X 0 9999695 Q140 00005 2 X 1 9999390 Q130 0001 4 X 3 9998779 Q120 0002 8 X 7 9997559 Q110 0005 16 X 15 9995117 Q100 001 32 X 31 9990234 Q90 002 64 X 63 9980469 Q80 005 128 X 127 9960938 Q70 01 256 X 255 9921875 Q60 02 512 X 511 9804375 Q50 04 1024 X 1023 96875 Q40 08 2048 X 2047 9375 Q30 1 4096 X 4095 875 Q20 25 8192 X 8191 75 Q10 5 16384 X 16383 5 Q01 32768 X 32767 表 1 1 Q 表示 S 表示及数值范围从表 1 1 可以看出同样一个 16 位数若小数点设定的位置不同它所表示的数也就不同例如 16 进制数 2000H 8192 用 Q0 表示 16 进制数 2000H 0 25 用 Q15 表示从表 1 1 还可以看出不同的 Q 所表示的数不仅范围不同而且精度也不相同 Q 越大数值范围越小但精度越高相反 Q 越小数值范围越大但精度就越低例如 Q0 的数值范围是 32768 到 32767 其精度为 1 而 Q15 的数值范围为 1 到 0 9999695 精 CII Technologies Inc 浮点转定点方法总结度为 1 32768 0 00003051 因此对定点数而言数值范围与精度是一对矛盾一个变量要想能够表示比较大的数值范围必须以牺牲精度为代价而想提高精度则数的表示范围就相应地减小在实际的定点算法中为了达到最佳的性能必须充分考虑到这一点浮点数与定点数的转换关系可表示为浮点数 x 转换为定点数 xq Q q x2x int 定点数转换为浮点数 x q x Q q x 2 float x 例如浮点数 x 0 5 定标 Q 15 则定点数式中表 q x 16384327685 0 示下取整反之一个用 Q 15 表示的定点数 16384 其浮点数为 16384 2 15 16384 32768 0 5 1 2c 语言从浮点到定点语言从浮点到定点下面所描述的几种基本运算是浮点到定点转换中经常遇到的从中可以体会到一些基本的技巧和方法 1 2 1 加法加法设浮点加法运算的表达式为 float x y z z x y 将浮点加法减法转化为定点加法减法时最重要的一点就是必须保证两个操作数的定标值一样若两者不一样则在做加法减法运算前先进行小数点的调整为保证运算精度需使 Q 值小的数调整为与另一个数的 Q 值一样大此外在做加法减法运算时必须注意结果可能会超过 16 位表示即数的动态范围如果加法减法的结果超出 16 位的表示范围则必须保留 32 位结果以保证运算的精度 1 结果不超过 16 位表示范围设 x 的 Q 值为 Qx y 的 Q 值为 Qy 且 Qx Qy 加法减法结果 z 的定标值为 Qz 则 z x y y xz Q q Q q Q q yxz 222 x yx x Q QQ q Q q yx 222 x yx Q QQ qq yx 2 2 2 2 xz yx QQ QQ qqq yxz 一般情况我们取 x y 和 z 的定标值相同即 Qx Qy Qz Qa 所以定点加法可以描述为 short x y z Qa CII Technologies Inc 浮点转定点方法总结 z add x y Qa 函数 add 有防饱和机制如果可以确信 x y 不会溢出 2 15 z 2 15 1 可以直接写为 z x y 定点减法 short x y z Qa z sub x y Qa 函数 sub 有防饱和机制如果可以确信 x y 不会溢出 2 15 z Qy 加法结果 z 的定标值为 Qz 则定点加法为 int x y long temp z temp y Qx Qz 若 Qx Qz z temp Qz Qx 若 Qx Qz 一般情况我们取 x y 和 z 的定标值相同即 Qx Qy Qz Qa 所以定点加法可以描述为 int x y z Qa z L add x y Qa 函数 L add 有防饱和机制如果可以确信 x y 不会溢出 2 31 z 2 31 1 可以直接写为 z x y 定点减法 int x y z Qa z L sub x y Qa 函数 L sub 有防饱和机制如果可以确信 x y 不会溢出 2 31 z Qx Qy 1 Qz 上式中 x 乘 y 的定标本来应该是 Qx Qy 但为了处理方便函数 L mult 多乘了一次 2 因此要再加 1 函数 L mult 有防饱和机制如果可以确信 z x y 不会溢出 2 31 z Qx Qy Qz 2 结果超过 32 位表示范围这种情况下位数超出了标准 c 语言的数的表示范围只能用数组来保存变量定点乘法可表示为 define NN DIGIT unsigned int NN DIGIT x digits NN DIGIT y digits NN DIGIT z 2 digits NN Mult z x y digits 应注意的是以上 32 位乘法都是无符号数操作如果需要做有符号数乘法则需要根据乘数的符号来判断例 1 设 x 18 4 y 36 8 则浮点运算值为 z 18 4 36 8 677 12 设 Qx 10 Qy 9 Qz 5 所以 int x 18841 Q10 int y 18841 Q9 z L mult 18841 18841 10 9 1 5 354983281L 14 21666 因为 z 的定标值为 5 故定点 z 21666 即为浮点的 z 21666 32 677 08 CII Technologies Inc 浮点转定点方法总结例 2 设 x 18 4 y 36 8 则浮点运算值为 z 18 4 36 8 677 12 define NN DIGIT unsigned int 设 Qx 20 Qy 20 Qy 20 所以 NN DIGIT x 18 4 1 20 Q20 NN DIGIT y 36 8 1 20 Q20 NN DIGIT z 2 Q20 NN Mult z Q40 NN Rshift z z 20 1 Q 40 20 1 2 3 除法除法 1 32 位除法设浮点除法运算的表达式为 float x y z z x y 假设经过统计后被除数 x 的定标值为 Qx 除数 y 的定标值为 Qy 商 z 的定标值为 Qz 则 z x y z Q q z 2 y x Q q Q q y x 2 2 q QQQ q q y x z yxz 2 所以定点表示的除法为 int x y z z L shl x Qz Qx Qy y Qz 2 32 位以上的除法这种情况下位数超出了标准 c 语言的数的表示范围只能用数组来保存变量 define NN DIGIT unsigned int NN DIGIT x 2 digits Qx NN DIGIT y digits Qy NN DIGIT z digits Qz NN Lshift x x Qz Qx Qy 2 NN Div z x 2 digits y digits 做以上运算是要保证 Qz Qx Qy 32 否则要多次移位来实现应注意的是以上除法都是无符号数操作如果需要做有符号数除法需要根据被除数和除数的符号来判断例 1 设 x 18 4 y 36 8 浮点运算值为 z x y 18 4 36 8 0 5 根据上节得 Qx 10 Qy 9 Qz 15 所以有 CII Technologies Inc 浮点转定点方法总结 int x 18841 y 18841 z L shl x 15 10 9 18841 308690944L 18841 16384 因为商 z 的定标值为 15 所以定点 z 16384 即为浮点 z 16384 215 0 5 1 2 4 三角函数运算三角函数运算 1 正弦和余弦一般求 cos sin 用查表法方法是预先定义正弦和余弦表表的长度及表中各元素的定标是根据精度要求确定的精度要求越高表的长度及元素的定标都可以增加余弦表制作步骤 1 计算 cos 2 pi t N 其中 0 t N 1 N 是 0 2 pi 之间的采样点数 2 将以上结果浮点数按精度要求定标如 Q15 3 建立数组 tab cos N 将以上结果作为该数组的元素正弦表的定义方法同上附录 2 中给出了余弦表 tab cos 360 和正弦表 tab sin 360 精度是 Q15 例 1 求 cos 2 pi x 32 x 是定标为 Qx 的整数 cos 2 pi x 32 cos 2 pi 360 x 32 360 程序如下 int u L mult 360 x 32 360 Qx int result result tab cos u Qx 例 2 求 cos x x 是定标为 Qx 的整数 cos x cos 2 pi 360 x 2 pi 360 程序如下 int pi Qx 3 1415 1 Qx Qx int u L mult 360 x 2 pi Qx 360 Q0 int result result tab cos u Qx 上式中将 pi 定标为 Qx 的定点数如何进一步提高精度一般可以增加表的长度即采样点数来提高精度但在现有采样情况下也有办法来提高精度方法是求出两采样点之间的斜率根据当前采样点的位置求出更加精确的值 t t 1 t ab cos t t ab cos t 1 posi t i on 例 3 求 cos x x 是定标为 Qx 的整数 CII Technologies Inc 浮点转定点方法总结 int pi Qx 3 1415 1 0 5 时可以采用拟合的方法因此 x abs x 0 5 y atan x 0 06 x 2 0 5 x 0 3 0 5 abs x 5 拟合可以调用 matlab 的命令 ployfit 来做例如 x start 0 1 stop y atan x pa polyfit x y 2 上式中的运算都是简单的乘法运算较为简单 1 2 5 开方运算开方运算浮点开方运算描述为 float x y y sqrt x 定点求开方有多种方法各种方法在收敛速度上不尽相同下面介绍几种常用的迭代算法 1 Newton Raphson Babylonian 算法给定整数 N 求 sqrt N 首先确定初值 x 0 然后利用一个简单的迭代公式 x n 1 x n N x n 2 迭代次数的选择迭代次数与初值 x 0 的选取很有关系 x 0 越接近 sqrt N 收敛越快但总的来说该方法收敛较快缺点是收敛时间不确定 2 确定收敛速度的算法该方法描述如下 int sqrt int x int test step if x 0 return 1 if x 0 return 0 step 1 15 test 0 while step 0 CII Technologies Inc 浮点转定点方法总结 register int h h test step test step if h 1 return test 以上例子是 32 位开放运算 32 位以上的开方运算可参考附录 1 void fixsqrt UINT4 a UINT4 b int digits 方法同上求开方还可以运用线性拟合的方法由于曲线变化较快必须根据自变量的范围分段拟合才能达到理想的精度 1 3 附录附录 1 3 1 附录附录 1 定点函数库定点函数库 Function Name L add Purpose 32 bits addition of the two 32 bits variables L var1 L var2 with overflow control and saturation the result is set at 2147483647 when overflow occurs or at 2147483648 when underflow occurs Complexity weight 2 Inputs L var1 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var3 0 x7fff ffff L var2 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var3 0 x7fff ffff Outputs none Return Value CII Technologies Inc 浮点转定点方法总结 L var out 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var out 0 x7fff ffff Word32 L add Word32 L var1 Word32 L var2 Function Name L sub Purpose 32 bits subtraction of the two 32 bits variables L var1 L var2 with overflow control and saturation the result is set at 214783647 when overflow occurs or at 214783648 when underflow occurs Complexity weight 2 Inputs L var1 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var3 0 x7fff ffff L var2 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var3 0 x7fff ffff Outputs none Return Value L var out 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var out 0 x7fff ffff Word32 L sub Word32 L var1 Word32 L var2 CII Technologies Inc 浮点转定点方法总结 Function Name add Purpose Performs the addition var1 var2 with overflow control and saturation the 16 bit result is set at 32767 when overflow occurs or at 32768 when underflow occurs Complexity weight 1 Inputs var1 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff var2 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff Outputs none Return Value var out 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var out 0 x0000 7fff Word16 add Word16 var1 Word16 var2 Function Name sature Purpose Limit the 32 bit input to the range of a 16 bit word CII Technologies Inc 浮点转定点方法总结 Inputs L var1 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var1 0 x7fff ffff Outputs none Return Value var out 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var out 0 x0000 7fff Word16 sature Word32 L var1 Function Name sub Purpose Performs the subtraction var1 var2 with overflow control and satu ration the 16 bit result is set at 32767 when overflow occurs or at 32768 when underflow occurs Complexity weight 1 Inputs var1 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff var2 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff CII Technologies Inc 浮点转定点方法总结 Outputs none Return Value var out 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var out 0 x0000 7fff Word16 sub Word16 var1 Word16 var2 Function Name L mult Purpose L mult is the 32 bit result of the multiplication of var1 times var2 with one shift left i e L mult var1 var2 shl var1 times var2 1 and L mult 32768 32768 2147483647 Complexity weight 1 Inputs var1 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff var2 16 bit short signed integer Word16 whose value falls in the range 0 xffff 8000 var1 0 x0000 7fff Outputs none Return Value L var out CII Technologies Inc 浮点转定点方法总结 32 bit long signed integer Word32 whose value falls in the range 0 x8000 0000 L var out 0 x7fff ffff Word32 L mult Word16 var1 Word16 var2 Computes the square root of a fixpoint number a square b length a digits b 2 digits void fixsqrt UINT4 a UINT4 b int digits UINT4 step digits UINT4 step UINT4 h digits 2 UINT4 test digits UINT4 h test step UINT4 malloc digits sizeof UINT4 h UINT4 malloc 2 digits sizeof UINT4 test UINT4 malloc digits sizeof UINT4 if x 0 return 1 if x 0 return 0 NN AssignZero step digits step digits 1 1 NN DIGIT BITS 1 a 0 NN AssignZero a digits while step 0 while NN Digits step digits 0 h a step a step test test NN Add test a step digits NN Mult h test test digits if h 1 NN RShift step step 1 digits free h free test free step Computes a b c Returns carry Lengths a digits b digits c digits NN DIGIT NN Add a b c digits NN DIGIT a b c unsigned int digits Computes a b c Returns borrow Lengths a digits b digits c digits NN DIGIT NN Sub a b c digits NN DIGIT a b c unsigned int digits

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

DSP浮点转定点方法总结

文档简介

温馨提示

最新文档

评论

DSP浮点转定点方法总结

文档简介

温馨提示

最新文档

评论

相关文档