




已阅读5页,还剩89页未读, 继续免费阅读
(电子科学与技术专业论文)yhftdx浮点乘法器的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
l i l ll l ll l ll llll lli ll li 17 9 5 8 8 4 t h e d e s i g na n di m p l e m e n t a t i o no f f l o a t i n g - - p o i n tm u l t i p l i e rf o ry h f t - - d x c a n d i d a t e :y a n gh o n g - j i e a d v i s o r :p r o f p e n gy a n - x i at h e s i s s u b m i t t e di np a r t i a lf u l f i l l m e n to ft h er e q u i r e m e n t s f o rt h ep r o f e s s i o n a ld e g r e eo fm a s t e ro fe n g i n e e r i n g i ns o f t w a r ee n g i n e e r i n g 一一 g r a d u a t es c h o o lo fn a t i o n a lu n i v e r s i t yo fd e f e n s et e c h n o l o g y c h a n g s h a ,h u n a n ,p r c h i n a j u n e 。2 0 1 0 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得 的研究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文题目:羔旦里! 二望茎显。基垂洼墨煎遮i 土皇塞丑 学位论文作者签名:孑鑫绉磨 日期:z p 力午月z 夕日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 学位论文题目:y 旦曼! 二q 圣翌。基苤洼墨鲍遮i 土复塞趣 学位论文作者签名: 作者指导教师签名: 夕, 7厶砑, 月 月 一o广b 年 年 夕 o , o 巩 幼沙 期 期 国防科学技术大学研究生院工稗硕+ 学何论文 目录 摘要j a b s t r a c t i i 第一章绪论1 1 1 数字信号处理器概述1 1 1 1 数字信号处理器的特点1 1 1 2 数字信号处理器发展状况l 1 2d s p 中的乘法器3 1 3 乘法器发展概述3 1 4 课题研究的主要内容5 1 5 课题研究所作的工作5 1 6 本文的结构5 第二章y h f t d x 体系结构与乘法部件一7 2 1y h f t d x 体系结构。7 2 1 1 f t d x 总体结构。7 2 1 2y h f t d x 内核结构7 2 2y h f t d x 的乘法器8 2 3i e e e 7 5 4 浮点运算标准9 2 3 1 浮点数的格式9 2 3 2 单精度浮点数表示。1 0 2 3 3 双精度浮点数表示l l 2 3 4 浮点数的舍入处理1 2 2 4 本章小结1 2 第三章乘法器的算法与实现结构1 3 3 1 乘法器类型13 3 1 1 串行乘法器13 3 1 2 线性阵列乘法器1 4 3 1 3 全阵列并行乘法器1 4 3 2 乘法器算法15 3 2 1 移位加算法15 3 2 2p e z a r i s 算法1 6 3 2 3b a u g h - w o o l e y 算法17 第1 页 国防科学技术大学研究生院工程硕士学位论文 3 2 4b o o t h 编码算法一l9 3 2 5 算法中的符号位处理2 3 3 2 6 有符号的b o o t h 乘法2 3 3 2 7 乘法器算法小结2 4 3 3 高速乘法器的实现结构2 4 3 3 1 阵列实现结构2 5 3 3 2 树形实现结构2 7 3 3 3 实现结构小结3 0 3 4 本章小结3l 第四章y h f t d x 浮点乘法器的设计3 2 4 1 浮点乘法器的总体设计3 2 4 1 1 浮点乘法器指令分析。3 2 4 1 2 结构设计3 3 4 1 3 流水线设计3 5 4 2 阵列乘法模块的设计3 6 4 2 1 操作数的选择3 6 4 2 2 操作数的类型判断。3 7 4 2 3 尾数的扩展及隐含位处理3 8 4 2 4b o o t h 编码及部分积产生3 9 4 2 5 乘法阵列。4 2 4 2 6 指数相加及符号位确定4 3 4 3 求和累加模块的设计。4 4 4 3 1 全加器。4 5 4 3 2 进位保留加法器的设计4 5 4 3 3 进位传播加法器的设计。4 6 4 3 4 移位逻辑设计。4 9 4 4 浮点结果处理模块设计5 0 4 4 1 尾数规格化与舍入处理。5 0 4 4 2 指数调整与溢出处理5 2 4 4 3 结果类型判断5 2 4 4 4 最终结果的生成5 3 4 5 结果写回模块设计5 3 4 6 本章小结5 4 第五章y h f t d x 浮点乘法器的验证与综合一5 6 第1 i 页 国防科学技术大学研究生院t 程硕十学位论文 5 1 验让方法学5 6 5 1 1 基于模拟的验证5 6 5 1 2 基于形式方法的验证5 7 5 2 模块级验证5 8 5 3 1 阵列乘法模块的验证。5 9 5 3 2 求和累加模块的验证6 0 5 3 4 浮点结果处理模块的验证一6 2 5 3 5 结果写回模块的验证。6 3 5 3 系统级验证方案及环境6 4 5 4 系统级验证6 6 5 5 覆盖率分析7 0 5 6 浮点乘法器的综合7 1 5 6 1 综合过程7 l 5 6 2 设计优化7 4 5 6 3 综合结果7 4 5 7 本章小结7 5 第六章结束语7 6 6 1 工作总结7 6 6 2 未来工作展望7 7 至定谢+ 7 8 参考文献7 9 作者在学期间所取得的学术成果8 2 第1 i i 页 国防科学技术大学研究生院t :程硕士学位论文 表目录 表2 1浮点乘法控制寄存器的功能描述9 表2 2i e e e 7 5 4 的浮点数格式1 0 表2 3 单精度浮点数表示11 表2 4 双精度浮点数表示1l 表3 1p e z a r i s 算法中的四种类型全加器1 6 表3 2b o o t h 编码规则表1 9 表3 3b o o t h2 编码规则表2 0 表3 4 b o o t h3 编码列表2 2 表4 1浮点乘法器指令功能3 2 表4 2 浮点数类型编码3 8 表4 3 尾数的扩展规则表3 9 表4 4b o o t h2 编码及控制信号4 0 表4 54 :2 压缩器的真值表4 2 表4 6 四种舍入模式的处理5 l 表4 7 溢出时的乘法结果5 3 表5 1符号位确定的验证激励5 9 表5 2 指数求和的验证激励5 9 表5 3 尾数乘积的验证激励6 0 表5 4 求和移位的激励6 l 表5 5 反馈移位的激励6 1 表5 6 尾数舍入验证激励6 2 表5 7 结果写回的验证激励6 4 表5 8 条件执行指令的条件判断6 7 表5 9 双精度浮点数的特殊值6 8 表5 1 0 单精度浮点数的特殊值6 8 表5 1 1 系统验证的输入激励6 9 表5 1 2 浮点乘法器的代码覆盖率统计。7 l 表5 1 3 综合结果对比7 4 表5 1 4 最终综合结果7 5 第1 v 页 国防科学技术大学研究生院丁程硕十学位论文 图目录 图2 1y h f t d x 总体结构7 图2 2i e e e 7 5 4 单精度浮点格式。1 1 图2 3i e e e 7 5 4 双精度格式l l 图3 1串行乘法器框图1 4 图3 2 线性阵列乘法器框图1 4 图3 35 5 位p e z a r i s 算法乘法阵列1 7 图3 4 b a u g h w o o l y 补码算法计算过程l8 图3 5b o o t h 编码操作l9 图3 61 6 位b o o t h2 编码乘法2 0 图3 7 同时处理无符号数和有符号数1 6 位b o o t h2 乘法一2 4 图3 83 :2 压缩器和4 :2 压缩器2 5 图3 9 简单阵列结构2 6 图3 1 0 树形结构的压缩器连接2 7 图3 1 1w a l l a c e 树形结构的结构图2 8 图3 1 24 :2 树压缩结构2 9 图3 134 :2 压缩器的c s a 实现2 9 图4 1浮点乘法器的结构:3 5 图4 2y h f t d x 浮点乘法器的流水线划分3 5 图4 3 阵列乘法单元的结构图3 6 图4 4 操作数读取的有限状态机。3 7 图4 5 全o 与全1 的判断逻辑图3 8 图4 6b o o t h2 编码的控制信号产生逻辑图4 0 图4 7b o o t h 编码中产生部分积的电路图4 1 图4 8y h f t d x 中乘法器的部分积形式4 l 图4 94 :2 压缩器的逻辑图4 3 图4 1 0 符号位的电路图4 4 图4 1 l 求和累加单元的结构图4 4 图4 12 全加器逻辑图4 5 图4 1 3 进位保留加法器的逻辑图4 5 图4 1 4 行波进位加法器4 6 图4 1 5 四位一组并行进位链4 7 图4 16 单级分组先行进位链4 7 第v 页 国防科学技术大学研究生院t 程硕+ 学位论文 图4 1 73 2 位并行加法器的两级分组先行进位链4 7 图4 18 两级分组先行进位链的大组进位链。4 8 图4 1 9 两级分组先行进位链的小组进位链4 9 图4 2 0 浮点结果处理单元的结构图5 0 图4 2 l 结果写回单元的结构图。5 4 图4 2 2 结果写回状态图。5 4 图5 1基于模拟的验证的流程图。5 7 图5 2阵列乘法模块的验证波形图6 0 图5 3求和累加模块的验证波形图6 1 图5 4 浮点结果处理模块的验证波形图6 3 图5 5 结果写回模块的验证波形图6 4 图5 6 浮点乘法器的系统级验证方案。6 5 图5 7 综合的输入与输出。7 2 图5 8 输入延时和输出延时。7 3 第v i 页 国防科学技术大学研究生院丁程硕十学位论文 摘要 乘法器是高性能数字信号处理器芯片的关键部件,也是进行实时、高速数字 信号处理的核心。随着d s p 芯片的广泛应用,乘法器作为d s p 中的关键部件,其 设计越来越受到人们的重视。 本文讨论了y h f t d x 处理器的浮点乘法器的设计与实现。y h f t d x 是一款 高性能定点浮点d s p 处理器,其中的浮点乘法运算是整个d s p 的关键路径所在。 为了满足高速浮点运算的要求,浮点乘法器需要在性能上达到很高的标准。 y h f t - d x 的浮点乘法器实现了单精度浮点乘法、双精度浮点乘法、单双精度浮点 乘法以及3 2 位定点乘法的功能。 本文首先介绍了y h f t d x 支持的i e e e 7 5 4 浮点运算标准,对i e e e 7 5 4 浮点 运算标准的浮点表示格式、精度、范围、舍入及规格化进行了分析。对决定乘法 器性能的两个因素:实现算法与实现结构,进行了深入研究。 对实现算法的研究主要是分析乘法运算中产生的部分积的数目以及部分积生 成电路的复杂度。通常来讲,产生部分积的数目越少的算法,其电路越复杂,因 此需要综合两点考虑来选择合适的算法。对实现结构的研究主要是分析实现结构 的部分积压缩速度以及结构规整性。 本文设计的浮点乘法器在算法上采用了目前广泛使用的b o o t h2 编码算法,实 现结构上采用了在求和速度和结构规整性方面都较好的4 :2 压缩树结构。4 :2 压缩 树结构采用了进位保留的思想,部分积压缩得到的结果是以伪和与局部进位形式 表示的冗余结果。最终结果需要再进行一次加法运算才能够得到。 本文所设计的浮点乘法器采用4 级流水线结构,使用第三方公司的0 1 3 u m c m o s 工艺进行综合。综合结果表明,浮点乘法器工作频率为5 0 0 m h z ,面积为 6 7 5 2 9 3 6 u m z ,功耗为2 2 3 4 2 4 m w ,满足y h f t d x 对浮点乘法器的性能要求。 关键字:i e e e 7 5 4 ,乘法器算法,实现结构,b o o t h2 编码,4 :2 压缩 第i 页 国防科学技术大学研究生院工程硕士学位论文 a b s t r a c t m u l t i p l i e r ,t h ec o r eo fr e a l t i m eh i g h s p e e ds i g n a lp r o c e s s i n gs y s t e m ,i st h ek e y c o m p o n e n ti nh i g h p e r f o r m a n c ed s p w i t ht h ee x t e n s i v ea p p l i c a t i o no fd s pc h i p , d i g i t a lm u l t i p l i e ri sb e c o m i n gt h ek e yp a r to fd s p ,a n di t sd e s i g ni sb e i n gp a i dm o r ea n d m o r ea t t e n t i o n t h i sp a p e rd i s c u s s e st h ef l o a t i n g - p o i n tm u l t i p l i e r sd e s i g na n di m p l e m e n t a t i o no f y h f t d x a sah i g hp e r f o r m a n c ef i x e d f l o a t i n g - p o i n td s p y h f t d xd e m a n d sh i g h p e r f o r m a n c eo fi t sf l o a t i n g p o i n tm u l t i p l i e r i no r d e rt om e e tt h er e q u i r e m e n t so f h i g h - s p e e df l o a t i n g - p o i n to p e r a t i o n s y h f t d xf l o a t i n g p o i n tm u l t i p l i e rp r o v i d e st h e f u n c t i o n si n c l u d i n g s i n g l e p r e c i s i o nf l o a t i n gp o i n tm u l t i p l i c a t i o n ,d o u b l ep r e c i s i o n f l o a t i n gp o i n tm u l t i p l i c a t i o n ,s i n g l e d o u b l ep r e c i s i o nf l o a t i n gp o i n tm u l t i p l i c a t i o na n d 3 2 一b i tf i x e d p o i n tm u l t i p l i c a t i o n t h i sp a p e rd i s c u s s e st h ei e e e 一7 5 4f l o a t i n gp o i n ts t a n d a r dt h a ty h f t - d x s u p p o r t s a n da n a l y z e st h es t a n d a r da b o u tf l o a t i n gp o i n tf o r m a t ,a c c u r a c y ,r a n g e ,r o u n d i n g ,a n d n o r m a l i z a t i o n w em a k ea ni n d e p t hr e s e a r c ho na l g o r i t h ma n ds t r u c t u r eo fm u l t i p l i e r t h a ta r et h et w ok e yf a c t o r sd e t e r m i n i n gt h ep e r f o r m a n c eo fam u l t i p l i e r f o ra l g o r i t h m ,i ti st oa n a l y z et h en u m b e r ,s p e e do ft h ep a r t i a lp r o d u c ta n dc o m p l e x c i r c u i to ft h ep a r t i a lp r o d u c t g e n e r a l l ys p e a k i n g ,t h ef e w e rp a r t i a lp r o d u c t ,t h em o r e c o m p l e xa n ds l o w e rt h ep a r t i a lp r o d u c tc i r c u i ti s ,s ob o t hn e e dc o n s i d e r i n gt os e l e c tt h e b e s ta l g o r i t h m a n a l y s i so ft h es t r u c t u r e si st os t u d yt h es u m - s p e e do f p a r t i a lp r o d u c t a n ds t r u c t u r er e g u l a r i t y f i n a l l y ,w ea d o p tb o o t h2e n c o d i n ga l g o r i t h mw i d e l yu s e dn o wa n da ta l g o r i t h m a n d4 :2c o m p r e s s i o nt r e es t r u c t u r ew h i c hc a nb e t t e ra c h i e v et h es u m s p e e do fp a r t i a l p r o d u c ta n ds t r u c t u r er e g u l a r i t y 4 :2c o m p r e s s i o nt r e es t r u c t u r ea d o p t st h e i d e ao f c a r r ys a v ea n di t sr e s u l ti se x p r e s s e dw i t ht h ep s e u d os u ma n dt h ec a r r y i no r d e rt og e t t h ee x a c tr e s u l t ,w en e e dt oa d dt h ep s e u d os u mw i t ht h ec a r r y ,s ot h i s p a p e ra l s o d e s i g n sah i g h - s p e e dc a r r yp r o p a g a t i o na d d e r t h ef l o a t i n g - p o i n tm u l t i p l i e ri nt h i sp a p e ra d o p t sa4 s t a g ep i p e l i n es t r u c t u r eu n d e r o 13u mc m o st e c h n o l o g yo fat h i r d - p a r t yc o m p a n y t h es y n t h e s i z er e s u l ts h o w st h a t , t h ef l o a t i n g - p o i n tm u l t i p l i e rc a nw o r ka tt h ef r e q u e n c yo f5 0 0 m h z i t sp e r f o r m a n c e m e e t st h e r e q u i r e m e n t so fy h f t d x t h ea r e ai s 6 7 5 2 9 3 6 u m 2 t h ep o w e ri s c o n s u m p t i o n2 2 3 4 2 4 m w k e yw o r d s :i e e e 一7 5 4 ,m u l t i p l i e ra l g o r i t h m ,i m p l e m e n t a t i o ns t r u c t u r e , b o o t h2 。4 :2c o m p r e s s i o n 第i i 页 国防科学技术大学研究生院丁程硕十学位论文 第一章绪论 1 1 数字信号处理器概述 1 1 1 数字信号处理器的特点 2 0 世纪6 0 年代以来,随着计算机和信息技术的飞速发展,数字信号处理技术 ( d s p ) 应运而生并被广泛应用。从8 0 年代初d s p 芯片诞生开始,d s p 芯片进入 飞速发展时期。d s p 能够实时、快速地实现各种数字信号处理算法,这样可以简 化信息处理的程序,提高信息处理的速度,大大地促进现代电子技术及信息技术 的发展。根据数字信号处理的特点及需求,现在的d s p 一般具有以下特点: 1 采用改进的哈佛结构,将程序空间与数据空间分开,每个空间都独立编址, 独立访问。对于每个空间,系统中都设置程序总线和数据总线,两条总线 独立工作,可同时访问数据空间和指令空间。 2 支持流水线操作,多条指令可并行执行,减少了指令的执行时间,从而获 得更高的指令吞吐率,增强了数据处理能力。 3 使用专用的硬件乘法器,可在一个指令周期内完成一次乘法和一次加法运 算。数字信号处理中包含大量的滤波及傅立叶变换等运算,这些运算都需 要乘法累加操作,使用专用的乘法器可大大提高d s p 处理器的性能。 4 支持并行执行,d s p 处理器中大都采用v l i w 或超标量体系结构,每个指 令周期可派发和执行多条指令。d s p 处理器内包含多个数据通路和功能单 元,可以同时处理多种不同类型的指令,大大提高了d s p 的性能。 5 片内具有快速r a m ,通常可通过独立的数据总线同时访问数据c a c h e 和指 令c a c h e 。 6 具有低开销或无开销循环及跳转的硬件支持,提高了处理速度。 7 配有中断处理、定时器、片内存储器和锁相环( p l l ) 等片内集成外设, 可以方便地实现一个嵌入式自封闭控制的处理系统。 8 带有d m a 控制器、外部存储器扩展接口、串行通信接口等,配合片内多 总线结构,可以实现大吞吐量数据传送。 1 1 2 数字信号处理器发展状况 世界上第一个单片d s p 芯片是1 9 7 8 年a m i 公司发布的$ 2 8 11 ,1 9 7 9 年美国 i n t e l 公司发布了商用可编程器件2 9 2 0 是d s p 芯片的一个重要里程碑。这两种芯片 都没有现代d s p 所必须具有的单周期乘法器。1 9 8 0 年,日本n e c 公司推出的“p 第1 页 国防科学技术大学研究生院t 程硕+ 学位论文 d 7 7 2 0 是第一个具有乘法器的商用d s p 芯片。1 9 8 2 年,口本的h i t a c h i 公司推出 了浮点d s p 芯片。1 9 8 3 年f u j i t s u 推出了m b 8 7 6 4 ,其指令周期为1 2 0 n s ,具有双 内部总线,从而使处理器的吞吐量发生了一次很大的飞跃。1 9 8 4 年a t & t 公司推 出了d s p 3 2 ,它是第一个到高性能浮点d s p 芯片。 1 9 8 0 年以后,d s p 芯片得到了突飞猛进的发展,d s p 芯片的应用越来越广泛。 从运算速度来看,m a c ( 一次乘法和一次加法) 时间已经从2 0 世纪8 0 年代初的 4 0 0 n s ( 如t m s 3 2 010 ) 降低到l0 n s 以下( 如t m s 3 2 0 c 5 4 x 、t m s 3 2 0 c 6 2 x 6 7 x 等) ,处理能力提高了几十倍。从面积上来看,d s p 芯片内部关键的乘法器部件 从1 9 8 0 年的占模片区( d i ea r e a ) 的4 0 左右下降到5 以下,片内r a m 数量增 加一个数量级以上。从制造工艺来看,1 9 8 0 年采用4 p m 的n 沟道m o s ( n m o s ) 工艺,而现在则普遍采用亚微米( m i c r o n ) 小于0 3 i - t m 的c m o s 工艺。d s p 芯片 的引脚数量从1 9 8 0 年的最多6 4 个增加到现在的2 0 0 个以上。此外,d s p 芯片的 成本、体积、重量和功耗都有很大程度的下降。 国外主要的d s p 制造商有:德州仪器( t i ) 、模拟器件公司( a d i ) 、摩托罗拉 ( m o t o r o l a ) 和朗讯科技( l u c e n t ) 等。其中,德州仪器公司( t e x a si n s t r u m e n t s , 简称t i ) 对d s p 芯片的发展起到了巨大的作用。 t i 公司在1 9 8 2 年成功推出其第一代d s p 芯片t m s 3 2 0 1 0 及其系列产品 t m s 3 2 0 1l 、t m s 3 2 0 c 1 0 c 1 4 c 1 5 c 1 6 c 1 7 等,之后相继推出了第二代d s p 芯片 t m s 3 2 0 2 0 、t m s 3 2 0 c 2 5 c 2 6 c 2 8 ,第三代d s p 芯片t m s 3 2 0 c 3 0 c 3 1 c 3 2 ,第四 代d s p 芯片t m s 3 2 0 c 4 0 c 4 4 ,第五代d s p 芯片t m s 3 2 0 c 5 x c 5 4 x x ,第二代d s p 芯片的改进型t m s 3 2 0 c 2 x x ,集多片d s p 芯片于一体的高性能d s p 芯片 t m s 3 2 0 c 8 x x 以及目前速度最快的第六代d s p 芯片t m s 3 2 0 c 6 2 x x c 6 7 x x 等。2 0 0 2 年初t i 公司又推出了内核电压为1 0 伏,功耗仅为2 5 0 毫瓦的t m s 3 2 0 c 6 4 11 d s p 。 如今t i 公司的一系列芯片己成为当今世界上最有影响力的d s p 芯片。t i 公司也 成为世界上最大的d s p 芯片供应商。其d s p 芯片的市场份额占到全世界的近5 0 。 美国模拟器件公司( a n a l o gd e v i c e s ,简称a d ) 在市场上也占有一点的份额,其 相继推出了一系列具有自己特点的d s p 芯片。其定点d s p 芯片有 a d s p 2 1 0 1 2 1 0 3 2 1 0 5 、a d s p 2 1 6 1 2 1 6 2 2 1 6 4 以及a d s p 2 1 7 1 2 1 8 1 ,浮点d s p 芯片 有a d s p 2 1 0 0 0 2 1 0 2 0 、a d s p 2 1 0 6 0 2 1 0 6 2 等。 与其他公司相比,m o t o r o l a 公司推出d s p 芯片相对较晚。1 9 8 6 年该公司推出 了定点处理器m c 5 6 0 0 1 ;1 9 9 0 年,公司推出了与i e e e 7 5 4 浮点运算标准兼容的 d s p 芯片m c 9 6 0 0 2 。 以d s p 处理器为核心的数字信号处理系统,集数据采集、传输、存储和高速 实时处理为一体,能充分体现数字信号处理的优越性。目前,数字信号处理器正 第2 页 国防科学技术大学研究生院丁稗硕十学何论文 在向高性能、高集成度、低功耗、低成本方向发展,各种新型d s p 不断推出,应 用技术和开发手段不断完善,其发展趋势可概括为以下几点。 1 高速度、高性能d s p 处理器。随着工艺的不断进步和开发手段的提高, d s p 处理器的速度也在不断提高,预计到2 0 1 0 年,单片d s p 芯片的运行 速度将达到2 0 0 0 m i p s 以上【l 】。 2 高度集成化。集滤波、d 、d a 、r o m 、r a m 和d s p 内核与一体的数 字模拟混合d s p 将有较大的发展和应用。 3 低功耗、低电压。进一步降低功耗,开发低电压d s p 内核,使其更适合 于个人通讯、便携式计算机以及便携式仪器仪表等。 4 开发专用d s p 芯片。为了满足系统级芯片的设计,开发基于d s p 内核的 a s i c 会有较大发展。 5 多d s p 协同工作以提高处理能力。 6 模块化、可重构化的d s pc o r e 。 1 2d s p 中的乘法器 d s p 作为一种高速专用的微处理器,它具有强大的运算功能和高速的数据传 输能力,广泛应用于数字信号处理及其相关的各个领域。其中,“乘加 运算是 数字信号处理中的最基本也是最重要的运算形式。在数字信号处理中的数字滤波、 快速傅里叶变换、h i l b e r t 变换、谱分析、卷积,语音处理,图像处理,数据加密 等处理都需要进行“乘加”运算。根据s f o b e r m a n 和m j f l y n n 的技术报告, 通过对n a sp a r a l l e lb e n c h m a r k s ,p e r f e c tb e n c h m a r k 和s p e c f p 9 2 等三种测试标准 进行测试,得到了各主要浮点运算的使用频率,其中浮点乘法的使用频率达到了 3 7 1 2 j 。因此,d s p 体系结构设计的重要特征是强调“乘加运算的高速处理能力。 软件来实现“乘加 运算,需要多次加法运算,效率低、速度慢、不能满足实时 高速信号处理的要求。在这种情况下,就必须采用专用的硬件乘法器,它能够在 单个时钟周期内完成一次“乘加 运算。硬件乘法器是高性能d s p 的重要部件之 一,是d s p 芯片实现实时高速信号处理的重要保障之一。乘法器在数字信号处理 系统中的重要作用,高性能乘法器的研究和实现具有十分重要的意义。 另一方面,在数字信号处理器中“乘加 运算通常是处理器的关键路径所在。 “乘加 运算的实现速度决定着d s p 的速度,而微处理中完成一次乘法运算所需 要的时间也基本上决定了处理器的工作主频。因此,优化乘法器的设计将大大改 善整个d s p 芯片的速度、面积、功耗等指标。 1 3 乘法器发展概述 第3 页 国防科学技术大学研究生院工程硕十学位论文 高性能乘法器的应用与浮点运算的发展紧密相关。浮点运算部件的设计和实 现相对定点运算部件较为复杂,在早期的计算机中没有专门的浮点运算部件。浮 点运算需要通过使用i b m 公司的j b a c k u s 发明的软件由定点运算部件完成。1 9 8 0 年i n t e l 公司设计开发的8 0 8 7 芯片中实现了高速、高效的浮点运算协处理器。从此, 乘法器成为独立的运算部件。发展到现在,在高性能处理器的定点运算单元和浮 点运算单元中都设有独立的乘法器,分别对定点乘法运算和浮点乘法运算进行处 理。在乘法器设计方面,为了加快乘法操作的执行速度和减少乘法器的面积,人 们对乘法器的算法和实现结构进行了大量深入的研究。概括起来,主要集中在以 下两个方面【2 】:1 部分积产生方面,减少部分积的数目,加快部分积的产生;2 部 分积压缩方面,采取更合理的实现结构,加快部分积压缩的速度。 部分积产生方面,a d b o o t h 在1 9 5 1 年提出的b o o t h 编码算法是乘法器研究 的里程碑,该算法的重要成就之一就是提出了对乘数进行再编码的思想,这种思 想是减少部分积数目的理论基础【3 】。之后的乘法器算法都是对这一算法的改进。改 进的方向主要集中在两点:减少部分积的数目和加快部分积产生的速度。其中 b o o t h2 编码算法是其中最有代表性的,也是现今使用最广泛的编码算法。b o o t h2 编码算法可以将部分积的数目减少一半,且部分积的产生电路也比较简单,可以 快速的产生部分积。进入上世纪九十年代之后,b e 诵e k 提出了冗余b o o t h3 算法, 后来基1 6 ( b o o t h4 ) 、基3 2 ,乃至基2 5 6 的b o o t h 算法也相继被提出和研究。但是 由于高阶b o o t h 算法实现较困难,在实际设计中采用高阶b o o t h 算法的很少,目前 b o o t h2 算法仍是最常用的算法。 部分积压缩方面,主要针对并行乘法器中的加法器阵列进行了深入的研究。 并行乘法器的结构可以分为两类【4 j :阵列乘法器和树形乘法器。其中w a l l a c e 树形 结构可以说是乘法器研究上的另一个里程碑,w a l l a c e 树形结构使用进位保留加法 器( c s a ) 来实现快速的部分积压缩,具有很高的压缩速度,但是因为其结构的不规 则性,使其难以实现。其后4 :2 压缩器的提出进一步提高了压缩比。现在广泛使用 的4 :2 压缩树就是用4 :2 压缩器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025黑龙江齐齐哈尔市建华区招聘教师50人模拟试卷及答案详解(夺冠)
- 高空清洗施工合同6篇
- 广播剧后期课件
- Hsp90β-IN-1-生命科学试剂-MCE
- 医疗救援服务协议书范文9篇
- 2025年芜湖安徽工程大学部分专业技术岗位招聘2人考前自测高频考点模拟试题及答案详解(各地真题)
- Glyco-α-muricholanoic-acid-生命科学试剂-MCE
- 2025年全自动地热恒压供水设备合作协议书
- 2025广西现代职业技术学院建筑工程学院招聘1人考前自测高频考点模拟试题及完整答案详解一套
- 2025年科创大数据项目发展计划
- 横河DCS-培训讲义课件
- 部编版三年级下册语文全册课件【完整版】
- 初中数学几何1000题专项训练(含详解分析)-最新
- 欧洲非常规的知识产权战略课件
- 外滩建筑介绍
- 青少年亲社会行为量表
- 你好,无废校园主题班会
- 购物中心公寓及写字楼勘察报告
- 中药煎服方法
- 研发支出辅助账汇总表
- 聚合物混凝土定义、分类和性质Polymerconcrete
评论
0/150
提交评论