




已阅读5页,还剩132页未读, 继续免费阅读
(微电子学与固体电子学专业论文)音频编解码专用dsp设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 、 l 、 j 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定,同意如下各 项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论 文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存论文; 学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权 按有关规定向国家有关部门或者机构送交论文的复印件和电子版;在不以赢利为 目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名:斫以枷 1 ,口雪 年于月i9 日 经指导教师同意,本学位论文属于保密,在 j 一年解密后适用本授权书。 指导教师签名: 斫铆r 矿 学位论文作者签名: 了糸彤杠 解密时间:y ,口年 7 月 日 各密级的最长保密年限及书写格式规定如下: ; 内部5 年( 最长5 年,可少于5 年) 秘密l o 年( 最长l o 年,可少于1 0 年) ; 。; 机密2 0 年( 最长2 0 年,可少于2 0 年) ; 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所 取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何 他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研 究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原 创性声明的法律责任由本人承担。 学位论文作者签名: 砰,师 砷j - 年厂月? 刁日 摘要 摘要 现代社会已经进入数字时代,许多航天设备、通讯产品,乃至家庭电子产品, 都对数字信号处理技术提出越来越高的要求。而数字信号处理器理所当然地成为 满足这种需求的产品,它以强大而快速的数字信号处理能力和方便的操作以及可 编程性,在各个方面发挥着举足轻重的作用,从而博得了使用者的青睐。而本文设 计的就是一种应用于语音处理方面的专用型的数字信号处理器,该处理器具有普 通的处理器的系统架构和适用于语音处理算法的精简指令集,并在此基础上外加 了用于与外界进行无线通讯以及与主机通讯的接口处理模块,当然也包括了数模 和模数转换模块。 - 精简的指令集和相对简单的系统架构降低了设计的复杂程度,另外独特的设 计方法也减小了最后芯片的面积和动态功耗,这些都为它应用于无线语音通信和 便携式音像设备提供了强有利的支持 关键词:d s p 音频编解码精简指令集流水线 a b s t r a c t t h ep r e s e n ts o c i e t yh a sc o m ei n t ot h ed i g i t a la g e i nm a n ya p p l i c a t i o nf i e l d s ,s u c ha ss p a c e f l i g h te q u i p m e n t s ,c o m m u n i c a t i o np r o d u c t sa n dh o u s e h o l de l e c t r o n i c a lp r o d u c t , p e o p l ep u t f o r w a r dh i g h e ra n dh i g h e rd e m a n d st od i g i t a ls i g n a lp r o c e s s i n gt e c h n o l o g y , t h u sd i g i t a ls i g n a l p r o c e s s o rb e c o m e st h ep r o d u c tw h i c hm e e t st h er e q u e s t b yi t sp o w e r f u ld i g i t a ls i g n a lp r o c e s s i n g a b i l i t y , c o n v e n i e n to p e r a t i o na n dp r o g r a m m a b l ef e a t u r e ,i th a sv e r yi m p o r t a n te f f e c to nm a n y f i e l d s ,s oi tb e c o m e saf a v o r i t et o o lf o rm a n yu s e r s i nt h i st h e s i s ,ak i n do fs p e c i a la p p l i c a t i o n d s pw h i c hi su s e dt oa u d i op r o c e s s i n gw i l lb ed e s i g n e d i na d d i t i o nt ou n i v e r s a lp r o c e s s o rs y s t e m s t r u c t u r ea n dr e d u c e di n s t r u c t i o ns e tf o ra u d i op r o c e s s i n ga l g o r i t h m , b a s e do nt h i ss t r u c t u r e ,a l s oi t i n d u c t ss o m ef u n c t i o nm o d e l sw h i c ha c ta saw i r e l e s sc o m m u n i c a t i o ni n t e r f a c ew i t ho u t s i d e i n s t r u m e n t so rap e r i p h e r a lc o m m u n i c a t i o ni n t e r f a c ew i t hh o s tm a c h i n e i ta l s oi n c l u d e sd a c o n v e r t o ra n da dc o n v e r t o r ,o fc o u r s e r e d u c e di n s t r u c t i o ns e ta n ds i m p l i f i e ds y s t e ms t r u c t u r er e d u c et h ec o m p l e xl e v e lo fd e s i g n , b e s i d e st h a t , t h eu n i q u ed 髂i g nm e t h o d sa l s om i n i s h st h ec h i pa r e aa n dd y n a m i cp o w e r d i s s i p a t i o n a l lo fa b o v ep r o v i d e sp o w e r f u ls u p p o r t sf o ri t sa p p l i c a t i o no fw i r e l e s sa u d i oc o m m u n i c a t i o na n d p o r t a b l ea u d i oe q u i p e m e n t k e yw o r d s :d s p , a u d i oc o d e , c , r e d u c e di n s t r u c t i o ns e t ,p i p e l i n e 目录 目录 第一章引言( 1 ) 1 1 d s p 芯片的概念n ) 1 2 d s p 芯片的发展p ) 1 3 d s p 芯片的分类邝) 1 4 d s p 芯片的主要性能指标( 6 ) 1 5 d s p 芯片的应用p ) 1 6 本论文目的和意义j ( 1 0 ) 第二章d s p 的基本结构( 1 1 ) 2 1d s p 基本结构( 1 1 ) 2 2 1 哈佛结构( 1 1 ) 2 2 2 流水线操作( 1 2 ) 2 2 3 专用的硬件乘法器( 1 3 ) 2 2 4 特殊的d s p 指令( 1 4 ) 2 2 5 快速的指令周期( 1 4 ) 2 2d s p 系统的特点( 1 5 ) 2 3d s p 的系统组成( 1 6 ) 2 4d s p 应用中常用的算法( 1 6 ) 2 5 d s p 的发展前景( 1 8 ) 第三章专用d s p 体系结构( 2 1 ) 3 1 设计结构和功能综述( 2 1 ) 3 2 存储器架构( 2 5 ) 3 3 中央处理单元( 2 6 ) 3 4 总线结构和模块组成( 2 7 ) 3 5 流水线结构的应用( 2 8 ) 3 6d s p 的寻址方式( 3 0 ) 3 7 高效的l a t c h 与d f f 相混合的设计方法( 3 0 ) 第四章a l u 部分的结构和功能分析 ( 3 2 ) 4 1 对m 部分系统结构的综述( 3 2 ) 4 2 指令延时部分( 3 5 ) 4 3 指令译码部分( 3 6 ) 4 4 移位寄存器( 5 0 ) 4 5 移位控制信号的译码( 5 3 ) 4 6 指令执行级( 5 8 ) 4 7p s r 中标志位的产生与更新一( 6 0 ) 4 8 中断控制单元( 6 1 ) 第五章d a g 结构及原理分析( 6 4 ) 5 1i rg e n 模块( 6 4 ) 5 2d a bg e n 的解析( 6 7 ) 5 3 d a gc t r l 模块( 7 2 ) 5 4 寄存器页的设计o ( 8 1 ) 目录 5 5 d a b m u x 。( 8 3 ) 5 6 n x t a rg e n 模块( 8 5 ) 5 7 l p e n dg e n 模块( 8 6 ) 第六章p a g 结构分析与设计( 8 8 ) 6 1 程序地址译码模块p o ) 6 2m x a r r y ( 地址输出产生及控制模块) 。( 9 5 ) 6 2 1r p t c m p 模块( 9 5 ) 6 2 2 r c l k 3 0 1 8 模块p 9 ) 6 2 3 p m x c t r l 3 0 1 8 模块( 1 0 0 ) 6 2 4 地址产生部分( 1 0 2 ) 6 2 5 关于地址产生模块地址来源的分析( 1 0 5 ) 第七章存储器的设计( 1 1 0 ) 7 1 只读程序存储器( p r o m ) ( 1 1 0 ) 7 2 可读写程序存储器( p r a m ) ( 1 1 1 ) 7 3s r a m 控制器( 1 1 2 ) 7 4 只读数据存储器( d r o m ) ( 1 1 4 ) 7 5 可读写数据存储i 器( d r a m ) ( 1 1 4 ) 第八章测试模式控制模块( 1 1 6 ) 第九章总结( 1 1 9 ) ! 改谢:( 1 2 0 ) 参考文献( 1 2 1 ) 附录a ( 1 2 2 ) 附录b ( 1 2 3 ) 音频编解码专用d s p 设计第一章引言 第一章引言 第一节d s p 芯片的概念 d s p 芯片,即数字信号处理器,是一种具有特殊结构的微处理器,如果不 严格区分,d s p 就是一种高速的m c u ,但用途却和普通的m c u 有较大的差别。 d s p 芯片的内部采用程序和数据分开的哈佛结构,即两部分的存储单元具有各 自独立的地址总线和数据或程序总线,这与我们常用的个人计算机中的冯诺依 曼结构是截然不同的。冯诺依曼结构普遍应用于通用计算机领域,采用数据和 程序空间统一编址的体系结构。一般d s p 芯片具有专门的硬件乘法器,不过这 也根据它的应用范围和领域而定,毕竟一个乘法器的硬件资源的开销是很大的, 而且一个高速的乘法运算单元,需要经过有经验的工程师巧妙的设计以及仔细 的布线才能达到预期的效果。如果d s p 应用的领域不需要高速的乘法运算能力, 那么大多都会被省略掉。由于流水线技术已经被成熟地应用于r i s c 和c i s c 中, 所以d s p 理所当然也广泛采用流水线操作,这大大的提高了指令执行的速度和 效率,不过也着实给设计带来了不小的困难,使得高速d s p 的设计变得更有挑 战性,这主要是由于流水线上的前后指令之间的条件和数据的依赖关系,使得 保证流水线正确运行的控制逻辑变得更复杂,而d s p 的数据通路也不断面临高 速时钟带来的挑战。除此之外一些d s p 还提供特殊的d s p 指令,可以用来快 速地实现各种数字信号处理算法,比如语音算法、视频算法、遗传算法等。根 据数字信号处理的要求,d s p 芯片一般具有如下的一些主要特点: ( 1 ) 在一个指令周期内可完成一次乘法( 如果d s p 中有单独的乘法运算单元 的话) 和一次加法,当然其他指令如o r ,a n d ,x o r ,s u b ,s h i f t 等也一 定是在一个周期内完成( 这样说不代表一个指令从取指令到最后执行完毕到回 写总共一个周期,而是流水线上的每一阶执行需要一个时钟周期,这样每个周 期都有一个指令执行) ,而对于其他的一些执行如除法、幂乘等,则需要多个 时钟周期才能完成。 第l 页 音频编解码专用d s p 设计 第一章引言 ( 2 ) 程序和数据空间分开,可以同时访问指令和数据,这在大多数d s p 中是 这样的结构。但也有的d s p 则采用了统一编址的结构,但在访问的时候依然是 独立的,比如a d i 的a d s p 2 1 8 x 、2 1 9 x ,以及2 1 0 0 系列等。这样做的好处也 许是使这个存储器空间更加紧凑,使人一目了然,更适合外围存储器的扩展以 及地址译码。 ( 3 ) 片内具有快速r a m ,这样的r a m 的确是不可或缺的。r a m 一般作为 d s p 计算中间的变量的存储空间,所以快速读取是首要的性能,这样才不会对 整个流水线带来性能的降低。其次大小也应该选取得当,这主要真对那些有不 同用途的d s p 而言的,比如对于一个音频处理的d s p 就不需要有与具有视频 编解码能力的d s p 有同样的r a m 空间,这样做实在是一种无谓的浪费,毕竟 芯片的面积是成本的一个比较大的决定因素,这些快速的r a m 通常可通过独 立的数据总线在两块中同时访问。无独有偶,在一些专用的d s p 中还包括了数 据r o m 单元,这样的r o m 单元通常用来存储d s p 初始化的常用数据,或者 用来存储滤波器中的常数系数等等,它们通常和r a m 统一编址,这一结构在 本文设计的d s p 结构中可以清晰的看到。 ( 4 ) 具有低开销或无开销循环及跳转的硬件支持。几乎所有的d s p 都具有跳 转和子程序调用的功能,这样会使应用程序的开发变得更为简单,也便于应用 程序的扩展,就像在c + + 中引入类的概念后带来的革新一样。由于在程序的执 行过程中经常要遇到跳转或者子程序调用的指令,所以不希望这样的指令消耗 更多的资源,所以必须要求这样的指令是低开销的。 ( 5 ) 快速的中断处理和硬件i o 支持。中断是处理器类数字设计中必须要考 虑到的方面,当然中断的向量种类都会随着d s p 应用的不同而不同,通常分为 内部中断和外部中断。内部中断主要有定时器溢出、除法溢出,以及低功耗或 者掉电等。外部一般包括串行输入串行输出,以及不同的触发中断等。一般在 专用d s p 中则包括接收串行数据的b u f f e r 输入满中断,或者输出中断等。这 些中断一旦发生,系统必须及时的将当前的断点完整且安全的保存到堆栈中, 然后去执行这个中断操作,一般中断程序被固化到一个固定的程序存储空间, 第2 页 音频编解码专用d s p 设计第一章引言 这样根据中断时产生的不同的中断码,跳转到相应的位置去执行中断。这样的 过程非常类似于子程序的调用过程,实际的硬件实现上它们也是非常的相似, 只是返回的指令不同。硬件i o 的支持更是不可缺少韵一个方面,它是外部环 境与内部处理器之间进行数据交换和通信的接口,为了方便的对接口进行控制, 几乎所有的d s p 都对硬件加的接口进行了寄存器方式的访问,并把它进行了 统一编址,或者独立编址( 如a d s p 2 1 9 1 ,2 1 9 2 等d s p ) ,这样大大方便了内部 与外部之间的沟通。 ( 6 ) 具有在单周期内操作的多个硬件地址产生器。这样说实际上包括两个方 面的内容,无论对于统一编址还是独立编址的d s p 来说,在单个周期内都要进 行数据地址产生和程序地址产生,首先程序地址产生,完成程序地址,继而访 问程序存储单元,输出程序机器码,而之后数据地址根据此时的程序码,进行 相应的数据地址产生操作,产生的数据地址可能用来访问存储器,也可能用来 访问外围的器件,比如c o d e c ,a d p c m ,a d c ,d a c 等,就像访问某个存 储单元一样。这样的体系结构使设计变得简单化,但地址的编排则需要下一番 心思去完成。 ( 7 ) 可以并行执行多个操作。这样的体系结构在专用d s p 中并不是很常见, 多见于通用d s p 中,比如,兀系列的片子和a d i 系列的片子都是如此。这种设 计一个最大的不同就是在设计中至少引入一个c a c h e ,有的是数据c a c h e , 有的则是程序c a c h e ,或者两个都有。由于c a c h e 本身是基于c a m ( 即关 联寻址存储器或者内容匹配存储器) 的设计,所以这个单元在功耗和面积上要 比一般r a m 大一些,设计难度也比较大。但c a c h e 的应用使得程序总线能 够空闲出来去访问程序空间中数据单元,这样就可以同时做到取指令、取数据 和取程序空间数据同时进行,这大大的提高了处理器本身的性能。但需要特别 额外的设计去提高c a c h e 中数据或者程序内容的命中率,这样才使得c a c h e 的应用变得真正有意义,c a c h e 的使用带来了整数运算的疯狂提速。 ( 8 ) 支持流水线操作,使取指、译码和执行等操作可以重叠执行,这在前面已 经介绍过,这样的设计统统都是基于流水线设计的处理器的一个基本特性。但 第3 页 音频编解码专用d s p 设计第一章引言 即便如此,它与通用微处理器相比,d s p 芯片的其他通用功能相对较弱些,但 它却有着普通处理器没有的强大的运算能力。 第二节d s p 芯片的发展 世界上第一个单片d s p 芯片是1 9 7 8 年a m i 公司宣布的$ 2 8 1 1 ,1 9 7 9 年美 国i i n t e l 公司发布的商用可编程期间2 9 2 0 是d s p 芯片的一个主要里程碑。这两 种芯片内部都没有现代d s p 芯片所必须的单周期芯片。1 9 8 0 年,日本n e c 公 司推出的f l p d 7 7 2 0 是第一个具有乘法器的商用d s p 芯片。第一个采用c m o s 工艺生产浮点d s p 芯片的是日本的h i t a c h i 公司,它于1 9 8 2 年推出了浮点d s p 芯片。1 9 8 3 年,日本的f u j i t s u 公司推出的m b 8 7 6 4 ,其指令周期为1 2 0 n s ,且 具有双内部总线,从而处理的吞吐量发生了一个大的飞跃。而第一个高性能的 浮点d s p 芯片应是a t & t 公司于1 9 8 4 年推出的d s p 3 2 。 在如此众多的d s p 芯片种类中,最成功的是美国德克萨斯仪器公司( t e x a s i n s t r u m e n t s ,简称,兀) 的一系列产品。1 1 公司在1 9 8 2 年成功推出启迪一代d s p 芯片t m s 3 2 0 1 0 及其系列产品t m s 3 2 0 1 1 、1 m s 3 2 c 1 0 c 1 4 肥1 5 c 1 6 c 1 7 等,之 后相继推出了第二代d s p 芯片t m s 3 2 0 2 0 、t m s 3 2 0 c 2 5 c 2 6 c 2 8 ,第三代d s p 芯片1 m s 3 2 c 3 0 c 3 1 c 3 2 ,第四代d s p 芯片t m s 3 2 c 4 0 c 4 4 ,第五代d s p 芯片 t m s 3 2 c 5 0 c 5 1 c 5 2 c 5 3 以及集多个d s p 于一体的高性能d s p 芯片 t m s 3 2 c 8 0 c 8 2 等。 美国模拟器件公司( a n a l o gd e v i c e s ,简称a d ) 在d s p 芯片市场上也占有 一定的份额,相继推出了一系列具有自己特点的d s p 芯片,其定点d s p 芯片 有a d s p 2 1 0 1 2 1 0 3 2 1 0 5 、a s d p 2 1 1 1 2 1 1 5 、a d s p 2 1 6 1 2 1 6 2 2 1 6 4 以及 a d s p 2 1 7 1 2 1 8 1 ,浮点d s p 芯片有a d s p 2 1 0 0 0 2 1 0 2 0 、a d s p 2 1 0 6 0 2 1 0 6 2 等。 自1 9 8 0 年以来,d s p 芯片得到了突飞猛进的发展,d s p 芯片的应用越来 越广泛。从运算速度来看,m a c ( 一次乘法和一次加法) 时间已经从8 0 年代 初的4 0 0 n s ( 如t m s 3 2 0 1 0 ) 降低到4 0 n s ( 如t m s 3 2 c 4 0 ) ,处理能力提高了 1 0 多倍。d s p 芯片内部关键的乘法器部件从1 9 8 0 年的占模区片( d i ea r e a ) 的4 0 第4 页 音频编解码专用d s p 设计第一章引言 左右下降到5 以下,片内删增加一个数量级以上。从制造工艺来看,1 9 8 0 年采用舡m 的n 沟道m o s 工艺,而现在则普遍采用亚微米c m o si 艺。d s p 芯片的引脚数量从1 9 8 0 年的最多6 4 个增加到现在的2 0 0 个以上,引脚数量的 增加,意味着结构灵活性的增加。此外,d s p 芯片的发展,是d s p 系统的成本、 体积、重量和功耗都有很大程度的下降。 第三节d s p 芯片的分类 d s p 的芯片可以按照以下的三种方式进行分类。 1 ) 按基础特性分 这是根据d s p 芯片的工作时钟和指令类型来分类的。如果d s p 芯片在某 时钟频率范围内的任何频率上能正常工作,除计算速度有变化外,没有性能的 下降,这类d s p 芯片一般称之为静态d s p 芯片,大多数的d s p 属于这种结构。 因为对于流水线架构,肯定会有它的速度极限,这样的关键路径,多是发生在 乘法操作或者乘加等运算中,这些操作的硬件延时,以及上级流水线的触发器 的延时和下级触发器所需要的建立时间的最大值,决定了这个系统能够稳定运 行的最小时钟周期,而对大于这个时间的时钟周期都不会引起运算失误的问题。 如果有两种或两种以上的d s p 芯片,它们的指令集和相应的机器代码机管 脚结构相互兼容,则这类d s p 芯片称之为一致性的d s p 芯片,现在在很多嵌 入式的音频和视频系统中,都使用了多核结构( 多见于数字机顶盒或者嵌入式 网络视频监视器中) ,这主要是为了满足快速运算的需要,而多个d s p 核之间 为了并行的进行运算往往需要访问一篇具有统一编址的程序或者数据空间,所 以要求它们有相互兼容的指令集。 2 ) 按数据格式分 这是根据d s p 芯片工作的数据格式来分类的。数据以定点格式工作的d s p 芯片称之为定点d s p 芯片,如1 1 公司t m s 3 2 0 c 1 ) ( c 2 x ,t m s 3 2 0 c 2 ) c ( c 5 x , t m s 3 2 0 第5 页 音频编解码专用d s p 设计 第一章引言 c 5 4 x c 6 2 x x 系列等等,a d i 公司的a d s p 2 1 x x 系列,a t & t 公司d s p l 6 1 6 a , m o t o l o r a 公司的m c 5 6 0 0 0 等。以浮点格式工作的称为d s p 芯片,如1 1 公司 t m s c 3 砌x c 6 7 x ,a d 公司的2 1 x x x 系列,a t & t 公司的d s p 3 2 3 2 c , m o t o l o r a 公司的m c 9 6 0 0 2 等。不同的浮点d s p 芯片所采用的浮点格式不完全 一样,有的d s p 芯片采用自定义的浮点格式,如t m s 3 2 0 c 3 x ,有的d s p 芯片 则采用i e e e 的标准浮点格式,如m o t o l o r a 公司的m c 9 6 0 0 2 ,f u j i t s i 公司的 m b 8 6 2 3 2 和z o r a n 公司的z r 3 5 3 2 5 等。而多数的浮点运算d s p 多见于通用 d s p 中,如a d s p 2 1 6 0 0 ,a d s p 2 1 0 2 0 系列。现在定点d s p 仍然处于主流低位, 这主要是由于它广泛的应用领域,如音频领域,但有的时候也可以用定点d s p 来完成类似浮点运算的功能。 3 ) 按用途分 按照d s p 芯片的用途来分,可分为通用型d s p 芯片和专用型的d s p 芯片。 通用型d s p 芯片适合普通的d s p 应用,如,n 公司的一系列d s p 芯片和a d i 的系列芯片。专用型d s p 芯片是为特定的d s p 运算而设计,更适合特殊的运 算,如音频编解码、数字滤波、卷积和f f t 等,如m o t o l o r a 公司的d s p 5 6 2 0 0 , z o r a n 公司的z r 3 4 8 8 1 ,i n m o s 公司的i m s a l 0 0 都属于专用型的。本文的 设计也是一种专用型的d s p ,它们主要用来完成音频的编解码运算。这类d s p 的特点是速度要求不是很快,但实用性很强,只是对于某种算法和应用来制定 所需要的指令集,所以整个设计的算数逻辑单元,以及地址产生和程序产生单 元显得比较简单,但体系结构上基本与通用d s p 相似。另外这种专用型的d s p 有自己一些特有的集成在内部的外围接口模块,比如串行输入输出模块,a d c , a d c ,c o d e c ,或者是a d p c m 硬件m u l a w 或者良l a w 压缩器等,这些 模块大大减少了核心部分运算的压力,就像应用于3 2 位x 8 6 处理器中的协处 理器一样。 第四节d s p 芯片的主要性能指标 设计d s p 芯片,最先考虑的是它的应用范围,继而应该就是和应用领域匹 配的性能指标,因为过于保守和低速的设计会导致不能正常使用,而过于快速 第6 页 音频编解码专用d s p 设计第一章引言 或者强大的功能的设计,又显得过于奢侈,从而提高了成本,所以性能的评估 成了一个必要的方面。只有正确对d s p 芯片进行评估才能进一步设计外围电路 及系统的其它电路。总的来说,d s p 芯片的性能选择应根据实际的应用系统需 要而确定。一般来说,d s p 芯片的性能应该考虑如下诸多因素。 1 ) d s p 芯片的运算速度。运算速度是d s p 芯片的一个最重要的性能指标,也 是选择d s p 芯片时所需要考虑的一个主要因素。d s p 芯片的运算速度可以用以 下几种性能指标来衡量: ( 1 ) 指令周期。就是执行一条指令所需要的时间,通常以n s 为单位,在 通常意义上说其实就是流水线每级的流水延时,它是d s p 速度的直观体现。 ( 2 ) m a c 时间或者加法时间( 对于本文的设计来说没有m a c ,所有的乘 法都是通过移位相加的多个指令周期来完成) 。即一次乘法加上一次加法的时 间,这就是上面提到的关键路径,它的延时大小会决定指令的最小周期,也就 是d s p 的最高时钟频率。 ( 3 ) f f t 执行时间。即运行一个n 点f f t 程序所需的时间。这样的操作 和性能多见于一些专用的数字信号处理的d s p 中,比如为了完成频谱分析,或 者频率检测等。对于f i t 的运算无非是一个乘加的过程,但有的d s p 为了更有 效的支持f f t 运算还引入了取反地址索引的运算方法,所以有时及时d s p 的指 令周期相同,但它们运算f f t 所用的时间依然有很大的差异。 ( 4 ) m i p s 。即每秒执行百万条指令,这个就是每秒执行的指令数,这个 基本上由指令周期决定了。 ( 5 ) m o p s 。即每秒执行百万次操作。 ( 6 ) m f l o p s 。即每秒执行百万次浮点操作,专指浮点型的d s p 。 ( 7 ) b o p s 。即每秒执行十亿次操作。 2 ) d s p 芯片的价格。根据一个价格实际的应用情况,来确定设计一个价格适 中的d s p 芯片。 3 ) d s p 芯片的硬件资源。( 硬件资源的有效利用会大大的降低成本) 第7 页 音频编解码专用d s p 设计第一章引言 4 ) d s p 芯片的运算速度。( 这个主要还是考虑到应用的领域和范围) 5 ) d s p 芯片的开发工具。( 主要分为通用型的和专用型的,通用型的开发软件 相对比较困难,因为首先是指令集的复杂,然后是通用性的考虑,而专用型工 具的开发,则显得相对容易,只需要开发针对这种d s p 指令集的工具即可,没 有一个确定的标准模式。) 6 ) d s p 芯片的功耗。( 这个也要根据d s p 所应用的领域来设计,比如d s p 是 用在有固定电源供电的地方( 如家用座机电话) ,还是用到无线通讯里( 如无绳电 话或者是手机中,显然对于功耗有着不同的要求标准) 。 7 ) 其它的因素,如封装的形式、质量标准、生命周期等。 d s p 应用系统的运算量是确定设计处理能力多大的d s p 芯片的基础。那 么如何确定d s p 系统的运算量以设计d s p 芯片呢? 1 ) 按样点处理 按样点处理就是d s p 算法对每一个输入样点循环一次。例如;一个采用 l m s 算法的2 5 6 抽头德的自适应f i r 滤波器,假定每个抽头的计算需要3 个 m a c 周期,则2 5 6 抽头计算需要2 5 6 * 3 = 7 6 8 个m a c 周期。如果采样频率为 8 k h z ,即样点之间的间隔为1 2 5 # s 的时间,d s p 芯片的m a c 周期为2 0 0 n s , 则7 6 8 个周期需要1 5 3 鲰s 的时间,显然无法实时处理,需要选用速度更快的 芯片。 2 ) 按帧处理 有些数字信号处理算法不是每个输入样点循环一次,而是每隔一定的时间 间隔( 通常称为帧) 循环一次。所以选择d s p 芯片应该比较一帧内d s p 芯片 的处理能力和d s p 算法的运算量。假设d s p 芯片的指令周期为p ( n s ) ,一帧 的时间为l t ( n s ) ,则该d s p 芯片在一帧内所提供的最大运算量为a t p 条指 令。 第8 页 音频编解码专用d s p 设计第一章引言 第五节d s p 芯片的应用 自从d s p 芯片诞生以来,d s p 芯片得到了飞速的发展。d s p 芯片高速发展, 一方面得益于集成电路的发展,另一方面也得益于巨大的市场。在短短的十多 年时间,d s p 芯片已经在信号处理、通信、雷达等许多领域得到广泛的应用。 目前,d s p 芯片的价格也越来越低,性能价格比日益提高,具有巨大的应用潜 力。d s p 芯片的应用领域主要有: ( 1 ) 信号处理:如数字滤波、自适应滤波、快速傅里叶变换、相关运算、频谱 分析、卷积等。 ( 2 ) 通信:如调制解调器、自适应均衡、数据加密、数据压缩、回坡抵消、多 路复用、传真、扩频通信、纠错编码、波形产生等。 ( 3 ) 语音:如语音编码、语音合成、语音识别、语音增强、说话人辨认、说话 人确认、语音邮件、语音储存等。 ( 4 ) 图像图形:如二维和三维图形处理、图像压缩与传输、图像增强、动画、 机器人视觉等。 ( 5 ) 军事:如保密通信、雷达处理、声纳处理、导航等。 ( 6 ) 仪器仪表:如频谱分析、函数发生、锁相环、地震处理等。 ( 7 ) 自动控制:如引擎控制、深空、自动驾驶、机器人控制、磁盘控制。 ( 8 ) 医疗:如助听、超声设备、诊断工具、病人监护等。 ( 9 ) 家用电器:如高保真音响、音乐合成、音调控制、玩具与游戏、数字电话 e g 视等。 d s p 应用广泛,其主要应用市场为3 c ( c o m m u n i c a t i o n 、c o m p u t e r 、 c o n s u m e r 通信、计算机、消费类) 领域,合占整个市场需求的9 0 。数字蜂 窝电话是d s p 最为重要的应用领域之一。由于d s p 具有强大的计算能力,使 得移动通信的蜂窝电话重新崛起,并造就了一批诸如g s m 、c d m a 等全数字 蜂窝电话网。在m o d e m 器件中,d s p 更是成效卓著,不仅大幅度提高了传输 速率,且具有接收动态图像能力。另外,可编程多媒体d s p 是p c 领域的主流 第9 页 音频编解码专用d s p 设计第一章引言 产品。以x d s lm o d e m 为代表的高速通信技术与m p e g 图像技术相结合,使 得高品质的音频和视频形式的计算机数据有可能实现实时交换。目前的硬盘空 间相当大,这主要得益于c d s p ( 可定制d s p ) 的巨大作用。预计在今后的p c 机中,一个d s p 即可完成全部所需的多媒体处理功能。d s p 也是消费类电子产 品中的关键器件。由于d s p 的广泛应用,数字音响设备的更新换代周期变得非 常短暂。用于图像处理的d s p ,目前已形成一个品种不少的产品群。一种是j p e g 标准的静态图像数据处理d s p ;另一种是用于动态图像数据处理的d s p 。 第六节本论文的目的和意义 本文介绍的论文主要针对于音频编解码的应用,所以在这个过程中要用到 音频处理中通常使用的c o d e c 模块,而且还具备了进行p c m 压扩编码的硬件 模块,以及最终完成a d p c m 编解码运算的软件,当然在软件操作中也包括低通 滤波的运算和回波抵消的算法,这些统统都会在d s p 核的内部由核心部分完成, 由于具备了这些条件这种d s p 可以很方便的应用于和音频相关的许多领域,包 括无绳电话,m p 3 机等方面 这种d s p 的设计初衷完全是处于专用的角度,所以简化了许多不必要的模 块,比如m a c , 比如数据或者程序c a c h e 等,还大大的减少了核心部分的 r e g i s t e rf i l e ,即使这样它还是对于语音处理方面绰绰有余,1 0 0 m h z 的处理 速度使它能同时完成4 个通道的无线电话会议,这在当前乃至未来都会有广阔的 应用空间,另外这种简化的设计也大大的减少了芯片的面积和功耗,使得它在无 线音频处理领域更具有优势 第l o 页 音频编解码专用d s p 设计第二章d s p 芯片的基本结构 第二章d s p 芯片的基本结构 第一节d s p 芯片的基本结构 2 1 1 哈佛结构 哈佛结构的主要特点是将程序和数据存储在不同的存储空间中,即程序存 储器和数据存储器是两个相互独立的存储器,每个存储器独立编址,独立访问。 与两个存储器相对应的是系统中设置了程序总线和数据总线,从而使数据的吞 吐率提高了一倍。由于程序和存储器在两个分开的空间中,因此取指和执行能 完全重叠。1 1 公司的d s p 芯片结构是基本哈佛结构的改进类型。改进之处是在 数据总线和程序总线之间进行局部的交叉连接,这一改进也被a d i 公司的系列 芯片所采用,这一改进允许数据存放在程序存储器中,并被算术运算指令直接 使用,增强了芯片的灵活性。只要调度好两个独立的总线就可使处理能力达到 最高,以实现全速运行。改进的哈佛结构还可使指令存储在高速缓存器( c a c h e ) 中,省去了从存储器中读取指令的时间,大大提高了运行速度。这种结构的基 本架构如图2 1 所示: 第1 1 页 音频编解码专用d s p 设计 第二章d s p 芯片的基本结构 程序总线 数据总线 图2 1 2 1 2 流水线操作 流水线操作与哈佛结构相关,d s p 芯片广泛采用流水线以减少指令执行的 时间,从而增强了处理器的处理能力。处理器可以并行处理二到四条指令,每 条指令处于流水线的不同阶段。在流水线操作中,一个任务被分解为若干个子 任务,各个任务可以在执行时相互重叠。d s p 指令系统的流水线操作是与哈佛 结构相配合的,增加了处理器的处理能力,把指令周期减小到最小值,同时也 就增加了信号处理器的吞吐量。以1 i 公司的t m s 3 2 0 系列产品为例,第一代 t m s 3 2 0 处理器( 例如t m s 3 2 0 c 1 0 ) 采用了二级流水线操作;第二代产品( 例 如t m s 3 2 0 c 2 5 ) 采用了三级流水线操作;第三代d s p 芯片( 例如t m s 3 2 0 c 3 0 ) 第1 2 页 音频编解码专用d s p 设计 第二章d s p 芯片的基本结构 采用了四级流水线操作。在流水线操作中,d s p 处理器可以同时并行处理2 4 条指令,每条指令处于其执行过程中的不同状态。如图2 2 所示是一个三级流 水线操作的例子。 c l k j o u t 图2 2 三级流水线操作 对于其他更多级流水的结构基本与此相似,但相对会有更大的硬件开销。 首先就是需要更短的时钟周期,更多的触发器资源,还要有更好的控制逻辑, 以保证流水线正确的运行。相对而言较多的流水级数会带来速度的提升,比如 对于一个流水级数为n 的时钟周期为t 的流水线来说,每增加一级,周期会缩 短t _ t - 哪! ) 删+ 1 。但是也由此可以看出随着流水级数的增加这种性能 的提升也变得愈加不明显,而随之带来控制逻辑的复杂化,却越来越变得难以 接受。一个很好的例子就是i n t e l 的p e n t i u mi v 系列处理器,流水级数已 经深入到了2 0 多级,但现在看起来速度的提升变得异常的困难,只能转而依靠 工艺的提升或者算法的优化才能满足对速度的提升。 2 1 3 专用的硬件乘法器 乘法速度越快,d s p 处理器的性能越高。由于具有专用的硬件乘法器,乘 法可在一个指令周期内完成。需要说明的一点就是这种硬件乘法器需要有经验 的工程师去自己的设计并进行布线才能有比较好的效果,设计中的难题包括 b o o t he n c o d e ( 即正则编码) ,还有w a l l a c et r e e 结构的设计,这种 设计本身的困难之处是走线的十分不规则,这样给版图设计人员带来很大的挑 第1 3 页 n m 1 2 n m d 乞 0 m 之 o n n 3 - n 匕日 马 一丁 指 码 行 驭 泽 执 音频编解码专用d s p 设计第二章d s p 芯片的基本结构 战,所以m a c 的设计是d s p 设计中的一个难点。但对于本文设计的d s p 中则 不需要这样的单元,这是由应用的领域而决定的。 需要说明的是,几乎在所有的专用或者通用d s p 的体系结构中都不曾有独 立的单周期的硬件除法器,这种设计本身就是不可想象的。但在一些通用d s p 中也包括除法指令,它们的实现方法就是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学招教常考题目及答案
- 初中生春节作文900字8篇
- 观千与千寻有感650字(11篇)
- 家庭农场生产经营与资源利用合同
- 时间日期变更课件
- 企业生产成本控制及管理工具
- 媒体采购推广合作合同
- 早期胃癌课件
- 航空航天技术研发投入统计表
- 农民利用自然资源合同
- 2025年江苏省南京市中考英语试卷
- 2025年政法委网格员考试题库
- 2025年新版期权知识考试题库带答案
- 无锡市公安局梁溪分局招聘警务辅助人员57人笔试模拟试题参考答案详解
- 2025年度养老护理员考试技师培训考试题(含答案)
- 2025年航空职业技能鉴定考试-候机楼服务技能考试历年参考题库含答案解析(5卷100道集合-单选题)
- 云智算中心项目建设方案
- 2025小学生“学宪法、讲宪法”网络知识竞赛题库及答案
- 脊柱内镜手术机器人系统设计与精准位置控制研究
- (2025年)江苏省盐城市辅警协警笔试笔试模拟考试试题含答案
- 2025年重庆物流集团渝地绿能科技有限公司招聘考试试卷
评论
0/150
提交评论