Lec2-3 Computer Arithmetic( CORDIC) (2).ppt

上传人：s*** IP属地：河南上传时间：2020-02-09 格式：PPT 页数：62 大小：2.16MB 积分：20 举报 版权申诉

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt_第2页

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt_第3页

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt_第4页

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt_第5页

已阅读5页，还剩57页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

实时信号处理系统设计与实现王明全wmingquan 4 2012 第2章数字系统与代数运算实现讲授内容安排 1 数字表示定点数非传统定点数浮点数2 二进制加法器流水线加法器模加法器3 二进制乘法器4 二进制除法器线性收敛除法快速除法器设计5 浮点运算实现定点浮点格式转换浮点加乘除运算浮点倒数运算6 MAC和SOP分布式算法7 CORDIC算法 VI MAC和SOP 传统可编程DSP处理方式 1 DSP算法中的乘累加 Multiply Accumulate MAC 计算非常密集考虑线性卷积和对于每个采样y n 都需要进行包含L次乘法和L 1次加法的积之和 SumofProducts SOP 计算在电路结构上对应1个N N位乘法器和1个与之相连接的累加器采用MAC单元计算内积MAC内部采用N N位乘法器乘积为2N位字长若操作数俱为有符号数乘积有效位为2N 1位累加器需要增加额外K位来保证足够的动态范围传统可编程DSP处理方式 2 传统可编程DSP处理方式 3 举例 ADSP21xx内部有1个16 16位阵列乘法器和1个40位具有额外8位累加器可以至少实现28次累加而影响输出精度如果操作数都是有符号数就可以进行29次累加其内部还有1个桶状移位寄存器用于在一个时钟周期内实现预定格式输出问题在定点PDSP中要考虑溢出并且在实时计算中不希望出现中断检测和响应累加器溢出会中断数据流并且会带来显著的时序负担正确选择保护位的长度可以消除这一负担分布式运算 DistributedArithmetic DA 分布式运算 DistributedArithmetic DA 是一种重要的FPGA技术由Croisier于1973年首先提出广泛用于计算SOP卷积相关 DFT和RNS逆映射都可以归纳为SOP计算采用通用乘法器构造MAC计算效率很低例如采用传统的运算单元完成1个滤波器周期需要N个MAC周期即使采用流水线收效也不大 DA设计的前提条件若系数c n 已知则部分乘积项c n x n 由通用乘法变成常系数乘法缩放无符号DA系统设计 1 考虑内积假设系数c n 为已知常数 x n 为变量无符号DA系统假设变量x n 可以表示为其中xb n 表示x n 的第b位 x n 是x的第n次采样则内积y可以表示为无符号DA系统设计 2 重新分布求和次序有无符号DA系统设计 3 内积运算的实现用1个LUT实现映射f c n xb n 预先对1个2N字的LUT进行设定输入为N位向量xb xb 0 xb 1 xb n 1 输出为f c n xb n 对每个LUT输出值f c n xb n 乘以权重2b 用移位加法器实现累加运算运算时间为N个LUT周期无符号DA系统设计 4 移位加法器DA结构无符号DA内积举例 1 定义3阶内积设系数位宽为3 值为c 0 2 c 1 3 c 2 1 实现f c n xb n 的LUT为无符号DA内积举例 2 对于输入内积值为验算无符号DA内积举例 3 在电路设计中为避免使用筒状移位器可以采用在每次迭代对累加器的值右移1位来代替对每个中间值移b位的操作计算迟滞假设LUT和通用乘法器的延迟同为 LUT MUL 则DA系统的计算迟滞为B LUT PDSP的计算迟滞为N MUL 对于较小位宽值B DA设计的速度明显快于基于MAC的设计有符号DA系统 DA系统如何处理有符号2的补码数有符号2的补码数最高位 MSB 为符号位例如 310 410 010 110 11002c 00002c 00012c 11012c有符号数x n 的 B 1 位表达式为改造无符号DA结构以适应有符号运算累加器增加加减控制 LUTROM增加一位输入有符号DA内积举例 1 对于3阶内积设输入4位2的补码数系数为c 0 2 c 1 3 c 2 1 实现f c n xb n 的LUT为有符号DA内积举例 2 x k 的值为 x 0 110 00012C x 1 310 11012C x 2 710 01112C输出为验算改进的DA系统结构 1 进行改进的目的降低电路规模当系数的数量N太大而难以用单个LUT实现全字时 LUT的位宽值系数的个数可以将LUT划分成几个小LUT进行计算最后将结果相加适当引入流水线不会降低运算速度但可显著缩小设计的规模注意 LUT的规模随地址空间输入数量N 的增加而呈指数放大假设长度为LN的内积可以由L个独立的N阶并行DALUT实现规模优化DA系统结构 4NDA系统实现需要另外增加3个加法器 LUT的规模从24N B降为2N B 改进的DA系统结构 2 提高运算速度以增加LUT 寄存器和加法器为代价原理一个执行N阶SOP计算的常规DA结构每一次输入N个字中每一个字的一位如果一次能输入每个字中两位则运行速度翻番如果N的值限制为4或8 DA系统的速度优于所有PDSP VII CORDIC算法 CORDIC算法 1 如何在FPGA设计中实现超越函数例如方法1 采用Taylor级数估算方法2 采用CORDIC算法 CORDIC算法 2 CORDIC CoordinateRotationDigitalComputer 算法亦称逐位法 digit by digitmethod 或Volder算法是一种计算超越函数的简单高效算法采用加减移位和LUT实现通常在无硬件乘法器如微控制器和可用门资源有限如FPGA 的情况下使用 CORDIC算法最早由JackE Volder于1956年提出用于开发B 58战略轰炸机的导航计算机 Convair航空公司英国数学家HenryBriggs1624年也曾提出过类似算法 HP公司的JohnS Walther进一步扩展了CORDIC算法使之能够计算双曲函数指数函数对数乘除法和平方根 CORDIC算法在FPGA上的实现最早由UMeyerB se完成 1995年笛卡尔坐标平面旋转在xy坐标平面上将点 x1 y1 旋转角度到点 x2 y2 的标准方法如下所示这种旋转被称为平面旋转向量旋转或者是线性矩阵代数中的Givens旋转笛卡尔坐标平面旋转上面的方程组同样可写成矩阵向量形式 90o相移为伪旋转通过提出因数cos 方程可写成下面的形式如果去掉cos 项得到伪旋转方程式即旋转的角度是正确的但是x和y的值增加cos 1 倍由于cos 1 1 所以模值变大注意并不能通过适当的数学方法去除cos 1 项然而去除cos 项可以简化坐标平面旋转的计算操作伪旋转 CORDIC算法 CORDIC算法的核心是伪旋转角度其中tan i 2 i 故方程为 CORDIC算法中每次迭代 i 的旋转角度表精确到9位小数 CORDIC算法在CORDIC算法中把变换改成了迭代算法将各种可能的旋转角度加以限制使得对任意角度的旋转能够通过一系列连续小角度的旋转迭代i来完成旋转角度遵循法则 tan i 2 i 遵循该法则乘以正切项转变成了移位操作前几次迭代的形式为第1次迭代旋转45o第2次迭代旋转26 6o第3次迭代旋转14o 注意每次旋转的方向都影响到最终要旋转的累积角度在 99 7o 99 7o的范围内的任意角度都可以旋转满足法则的所有角度的总和tan i 2 i为99 7 对于该范围之外的角度可使用三角恒等式转化成该范围内的角度角分辨率的数据位数与最终的精度有关 1 0607252941 1 6467602 因此在13次旋转后为了标定伪旋转的幅度要求乘以一个系数1 64676024187 角分辨率的数据位数对最终的旋转精度非常关键角度累加器对于每一次迭代伪旋转可表示为其中di 1 为判决算子用于确定旋转的方向是顺时针还是逆时针 di的值取决于操作模式引入第三个方程角度累加器方程用于在每次迭代过程中追踪累加的旋转角度上述三个方程式为圆周坐标系中用于角度旋转的CORDIC算法的表达式移位加法算法原始的算法现在已经被减化为使用向量的伪旋转来表示的迭代移位相加算法每次迭代需要进行 2次移位1次查找表查询 i 值 3次加法进行迭代移位相加的前提是去掉cos 项移位加法算法伸缩因子伸缩因子也称增益因子是伪旋转的副产物当简化算法允许伪旋转时 cos 项被忽略这样输出的x n y n 被伸缩Kn倍如果迭代次数可知则可以预先计算伸缩因子Kn和1 Kn 并将1 Kn与x n 和y n 相乘来校正x n 和y n 的最终真值旋转模式 CORDIC方法有两种操作模式操作模式决定了控制算子di的条件旋转模式向量 x 0 y 0 0 0 通过旋转使得角度寄存器值z n 迭代收敛为0 旋转角z 0 已知计算向量旋转后的最终的坐标 X n Y n t选择di sign z i z i 0 n次迭代后得到通过设置x 0 1 Kn和y 0 0可以计算cosz 0 和sinz 0 旋转模式举例当z 0 30o时计算sinz 0 和cosz 0 向量模式向量模式向量 x 0 y 0 0 0 通过旋转使得y n 迭代收敛为0旋转角未知 z 0 0 选择di sign x i y i y i 0 n次迭代后得到通过设定x 0 1和z 0 0来计算tan 1z 0 向量模式举例当y 0 2并且x 0 1时计算tan 1 y 0 x 0 圆坐标系在圆坐标系中可以利用CORDIC算法计算下列函数若采用其它的坐标系可以利用CORDIC算法计算更多的函数如乘除法线性坐标系和双曲坐标系线性坐标系双曲坐标系线性坐标系和双曲坐标系采用其它坐标系的CORDIC算法的优点是可以计算更多的函数而缺点则是系统将变得更加复杂当把CORDIC算法用于线性或双曲坐标系时在圆周坐标系中的旋转角度集将不再有效而采用其它的两种旋转角度集可以推导出可在3个坐标系中表示CORDIC方程的通用公式在该方程式中引入两个新变量变量表示选用何种坐标系变量e i 表示在相应的坐标系中旋转的角度集通用的CORDIC方程 CORDIC方程可被归纳到包括圆线性和双曲等三个坐标系中圆周旋转线性旋转双曲旋转 CORDIC函数计算 CORDIC函数计算当把CORDIC算法用于线性旋转时伸缩因子K0与圆周旋转的伸缩因子K不同 K0 1 当把CORDIC算法用于双曲旋转时伸缩因子K 与圆周旋转的伸缩因子K不同双曲伸缩因子K 使用下列方程计算 CORDIC计算超越函数 CORDIC算法几乎可以计算所有的超越函数正确选择初始值能直接计算函数X Y Y X sin Z cos Z tan 1 Z sinh Z cosh Z tanh Z 其它的函数计算尽管CORDIC算法仅能够直接计算少量的函数但更多的函数可以通过间接的方法来获得举例计算tanz首先在圆旋转模式中采用CORDIC算法直接计算cosz和sinz 然后将cosz和sinz的值回馈到系统中使用线性矢量模式并用前者除以后者得到tanz 其它的函数计算其它的函数可以通过选择适当的初始化将多种操作模式组合计算而得其它的函数计算精度和收敛性在三角函数中 k位的精度要求k次迭代使用 99 7o z 99 7o范围内的角度圆周和线性CORDIC一定收敛对于该范围之外的角度需要使用标准三角恒等式使用双曲CORDIC时旋转不一定收敛如果重复某些迭代 CORDIC将收敛 i 4 13 40 k 3k 1 FPGA实现理想的CORDIC架构取决于具体应用中速率与面积的权衡可以将CORDIC方程直接综合为迭代型的位并行结构但是位并行变量移位器不能很好地被综合到FPGA中需要多个FPGA逻辑单元导致设计规模变大位串行结构最小面积的架构变量移位寄存器的实现迭代型位串行结构设计迭代型位串行结构设计迭代型位串行结构构成包括3个位串行加减法器 3个移位寄存器以及一个串行ROM 存放旋转角度同时需要2个MUX实现可变位移器每个移位寄存器必须具有与字宽相等的长度因此每次迭代都需要将该逻辑电路运行w次 w 字宽度操作首先通过将初值x 0 y 0 和z 0 载入相应的移位寄存器中数据通过串行加减法器右移并被返回到移位寄存器的左端变量移位器通过2个复用器来实现在每次迭代的初始阶段两个MUX均被设置为从移位寄存器中读取合适的抽头数据来自每个MUX的数据被传送到了相应的加减法器在每次迭代的开始 x y和z寄存器的符号被读出以便将加减法器设置到正确的操作模式在最后一次迭代过程中结果可直接从加法器减法器中读取迭代型位串行结构设计使用移位寄存器和MUX实现可变移位器例如对储存在移位寄存器中的数据执行2 3的移位操作需要在每次迭代的初始就设定好MUX的选择线以此来控制需要移位的次数 CORDIC全流水线结构圆周系统向量化全流水线CORDIC结构实现举例圆周系统向量化CORDIC结构第一次迭代向量从II象限旋转到I象限或者从III象限旋转到IV象限移位序列为 0 0 1 2 前4个步骤的旋转角度为arctan 90 arctan 2 0 45 arctan 2 1 26 5 arctan 2 2 14 输入和输出为8bit 向量化全流水线CORDIC结构Verilog设计 1 modulecordic clk x in y in r phi eps parameterW 7 Bitwidth 1inputclk input W 0 x in y in output W 0 r phi eps reg W 0 r phi eps Thereisnobitaccessin2Darraytypes inVerilog thereforeusesinglevectorsreg W 0 x0 y0 z0 reg W 0 x1 y1 z1 reg W 0 x2 y2 z2 reg W 0 x3 y3 z3 always posedgeclk begin Inferregisterif x in 0 Testforx in 0rotatebegin 0 90

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt

文档简介

温馨提示

最新文档

评论

Lec2-3 Computer Arithmetic( CORDIC) (2).ppt

文档简介

温馨提示

最新文档

评论

相关文档