




已阅读5页,还剩114页未读, 继续免费阅读
(通信与信息系统专业论文)riscdsp处理器的结构、微结构设计研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学博上学位论文 摘要 集成电路工艺的发展使得将系统集成在一块芯片中实现成为可能,芯片设计进入片上系 统( s o c ) 时代。为了更好的满足嵌入式系统的蓬勃发展,需要不断的对新处理器体系架构 进行广泛的研究。传统的精简指令集处理器( r i s c ) 和数字信号处理器( d s p ) 各自具有不 同的指令集结构和微结构特点,适合于不同的应用领域。作为r i s c 和d s p 融合体的 r 1 s c d s p 架构,由于既善于执行系统程序,又善于执行信号处理程序,所以能够较好的适 应嵌入式系统的发展。 本文作者参加了浙江大学信息与电子工程学系s o c r & d 小组承担的国家8 6 3 超大规模 集成电路设计重大专项项目,参与开发了具有自主知识产权的r i s c d s p 处理器m d 3 2 , 并从中总结出结构、微结构设计等方面的一些方法和理论。m d 3 2 将r i s c 与d s p 处理器的 指令操作、寻址模式等要素充分融合,设计了并行操作、多媒体分裂模式等指令操作,形成 了兼有r i s c 、d s p 、s i m d 特点的一种新的指令集结构。并在此基础上进行了具有自身特色 的r i s c d s p 微结构组成设计和统一的流水结构划分,使得r 1 s c d s p 体系既能够发挥r i s c 处理器的系统执行能力,又具有d s p 处理器的数据处理能力,从而使m d 3 2 处理器更适合 多媒体信息处理的需要。本文的主要内容及创新点包括: 提出指令构成及其划分模型的概念,论述了各指令构成域的条件正交性和条件空位。确 立了r i s c d s p 指令结构的设计目的与特点,并在此基础上融合r i s c 的面向寄存器指 令特点、d s p 的面向存储器指令特点、以及s i m d 类分裂模式操作,设计实现了具有较 为丰富寻址模式和指令操作的m d 3 2r i s c d s p 指令体系,研究了其指令构成与结构复 杂性、数据通路设计之间的关系,从而确立了m d 3 2 微结构设计的依据和基础。 根据m d 3 2r i s c d s p 指令构成模型。确定m d 3 2 微结构模块组成,并提出r i s c d s p 流水划分原则。通过对比不同的划分方法,合理安排流水线中指令的执行动作,最终确 定出满足系统频率和时序要求的m d 3 2 流水结构,使得r i s c d s p 指令通过统一的流水 安排融合在一起。 在m d 3 2 设计中采用了具有自身特色的设计方法探索出一套面向r i s c d s p 指令结构 的微结构设计原则和方法,如并行设计、内部流水设计、集中控制等。它们将若干复杂 指令操作均匀分配在几个流水节拍内完成,实现了任意窗口寻址等复杂指令操作,将整 个处理器的数据通路与控制通路分离,减小了电路时延。从而满足了r i s c d s p 不同指 令功能和系统时钟频率的要求,构成了统一的、紧密联系的、协调的m d 3 2 系统结构。 对m d 3 2 协同验证平台的设计进行了研究。通过软平台中的单元验证、结构验证、系统 验证等步骤,以及基于f p g a 的硬平台验证,保证了m d 3 2 处理器的正确性和完备性。 关键词:片上系统精简指令集处理器数据信号处理器指令集微结构流水线 ,自e 储、导师同煮 囊垒文公蠢 一塑垩查兰堡主兰垡堡苎 a b s t r a c t r a p i dd e v e l o p m e n to fi n t e g r a t ec h i pt e c h n i c sh a sd r i v e nt h es y s t e mi n t os y s t e m - o n - c h i p ( s o c ) a g e n o v e lp r o c e s s o ra r c h i t e c t u r ei sw i d e l ys t u d i e dt of u l f i l lt h er a p i d l yg r o w i n gd e m a n do f e m b e d d e d s y s t e m t r a d i t i o n a lr e d u c e di n s t r u c t i o ns e tc o m p u t e r ( r i s c ) a n d d i g i t a ls i g n a l p r o c e s s o r ( d s p ) h a v ed i f f e r e n ta p p l i c a t i o na r e a sd u et ot h e i rd i f f e r e n ti n s t r u c t i o ns e ta r c h i t e c t u r e ( 1 s a ) a n dm i c r o - a r c h i t e c t u r e r i s c d s pi sa h y b r i do f t r a d i t i o n a lr i s ca n dd s p p r o c e s s o r ,a n d i s m o r e c a p a b l ei ne m b e d d e da p p l i c a t i o na r e aw i t hb o t hc h a r a c t e r i s t i c so f r i s ca n dd s e t h ea u t h o ro f t h i sp a p e ra r e n d e dt h ep r o j e c to f r i s c d s p p r o c e s s o rd e s i 即广- _ 3 2 , w h i c hi sd e v e l o p m e n t b y t h ed e p a r t m e n to f i n f o r m a t i o ns c i e n c ea n de l e c t r o n i ce n g i n e e r i n gi n z h e j i a n gu n i v e r s i t y , a n ds t u d i e dt h ed e s i g nm e t h o d so f l s aa n dm i c r o a r c h i t e c t u r e m d 3 2i s ai sa n o v e la r c h i t e c t u r e ,w h i c hf e a t u r e sw i t hb o t hr i s ca n dd s e s i n g l ei n s t r u c t i o nm u l t id a t a ( s l m d ) i sa l s os u p p o a e di nm d 3 2 ac h a r a c t e r i z e dr i s c d s pm i c r o - a r c h i t e c t u r ea n d u n i f i e dp i p e l i n ei s d e s i g n e db a s e do nm d 3 2i s a i ti sn o to n l yg o o d a te x e c u t i n g s y s t e mt a s k sl i k er i s cp r o c e s s o r , b u ta l s o e x p e a i nd i g i t a ls i g n a ip r o c e s s i n gl i k ed s et h i sm a k e sm d 3 2m o r e p o w e r f u li n m u l t i - m e d i as i g n a lp r o c e s s i n g t h em a i nc o n t e n t sa n di n n o v a t i v e p o i n t si nt h i sp a p e r i n c l u d e : d e f i n ea l li n s t r u c t i o nc o m p o n e n ta n d p a r t i t i o nm o d e l c o n c e p t i o no f o r t h o g o n a ii n s t r u c t i o n s e ti sp r e s e n t e db a s e do nt h ei n s t r u c t i o nc o m p o n e n tf o r m u l a r e l a t i o n sb e t w e e ni n s t r u c t i o n o r t h o g o n a i i t y , a r c h i t e c t u r ec o m p l e x i t ya n d d a t ap a t hd e s i g na r es t u d i e d i s ai sd i v i d e di n t o t h r e ep a r t sa c c o r d i n gt ot h ed e s i g nc o n s i d e r a t i o no f m d 3 2 r i c h a d d r e s s i n ga n do p e r a t i o n m o d e sa r es u p p o r t e di nm d 3 2i s a r i s c d s p p i p e l i n ep a r t i t i o nr u l e sa r eg i v e n b a s e do nt h er e l a t i o n sb e t w e e ni n s t r u c t i o ns e ta n d d a t ap a t hd e s i g n a f t e ra n a l y z i n ga n d c o m p a r i n g d i f f e r e n tp a r t i t i o nr u l e s ,m d 3 2 p i p e l i n e a r c h i t e c t u r ei sf i n a l l yd e f m e d ,w h i c hm e e t st h er e q u i r e di n s t r u c t i o nf u n c t i o n ,f r e q u e n c ya n d t i m i n gs p e co f m d 3 2 a c o m p l e t es e to f c r e a t i v ed e s i g nm e t h o df o rr i s c d s p m d 3 2m i c r o - a r c h i t e c t u r ei s p r e s e n t e d ,s u c h a sp a r a l l e ld e s i g n , i n t e r n a l p i p e l i n e ,c e n t r a lc o n t r o l ,e t c t h a n k s t ot h e a d o p t i o no f t h e s ed e s i g nm e t h o d o l o g y , c o n t r o lp a t ha n d d a t a p a t ha r es e p a r a t e d ,c i r c u i td e l a y i sr e d u c e d a n dc o m p l e xi n s t r u c t i o no p e r a t i o n sa r eb a l a n c e d a m o n gm u l t i p l ep i p e l i n es t a g e s m d 3 2v e r i f i c a t i o np l a t f o r mi sa l s os t u d i e di nt h i sp a p e r i v i d 3 2v e r i f i c a t i o ni si m p l e m e n t e di n b o t hf p g ah a r d w a r ev e r i f i c a t i o np l a t f o r ma n ds o f t w a r ev e r i f i c a t i o np l a t f o r m ,w h i c ha c h i e v e u n i t ,a r c h i t e c t u r ea n ds y s t e mv e r i f i c a t i o n s m d 3 2p r o c e s s o rc a nb es u f f i c i e n t l yv e r i f i e do n t h e s ep l a t f o r m s k e y w o r d s :s o c r i s cd s p1 s am i c r o - a r c h i t e c t u r e p i p e l i n e 一辫滏 - - t l - 。谚 浙江大学博十学位论文 第一章绪论 嵌入式系统的快速发展不断的对处理器架构与性能指标提出更高的要求。传统r i s c 与 d s p 处理器在各自的发展历程中分别形成了具有不同特点的体系结构和应用领域,并逐步 相互融合,r i s c d s p 处理器架构正是这一发展趋势下的研究方向之一。本章对r i s c d s p 的发展、构成及特点进行了介绍,并提出本文的主要研究内容和创新点。 1 1 嵌入式系统发展史 h e n n e s s y 和p a t t e r s o n 将计算机系统体系结构分为桌面计算、服务器和嵌入式应用三大 类【1 】。桌面计算强调程序执行性能,不注重程序大小和处理器的功耗。服务器主要是指数据 库、文件服务和网络应用的多用户服务系统。与它们不同,嵌入式应用则强调实时、成本和 功耗问题。 一般来讲,嵌入式系统是指开发者可以在其上设计产品,但是终端用户一般不能对其进 行修改的系统。嵌入式系统具有静态结构,大多数应用软件存于终端用户不可见的只读存储 器中,并且终端用户不能访问处理器的可编程接口,不能对嵌入式处理器的行为进行修改或 者重新编程,这一点是嵌入式系统和桌面系统的最大区别。 长久以来,在嵌入式系统领域,8 位机和1 6 位机一直占有垄断地位。由于其结构简单, 所以常常并不被称为微处理器( m i c r o p r o c e s s o r ) ,而是被称作微控制器( m i c r o c o n t r o l l e r ) 。 但是随着应用对嵌入式系统的要求越来越高,处理器结构不断发展,嵌入式系统也越来越复 杂,8 位和1 6 位处理器已经不能胜任复杂应用系统的需求,3 2 位嵌入式系统处理器应运而 生。许多嵌入式处理器结构从过去的主要用于桌面系统的结构( 如m i p s 、s p a r c 等) 中衍 生出来,与桌面处理器之间的不同也不再仅仅局限于寄存器组织、基本指令集、流水线结构, 而扩展到了诸如功耗、成本、外设集成度、中断响应时间、片上r a m 或r o m 的容量等诸 多问题”j 。 九十年代中期,更多的3 2 位处理器推向市场,开始出现多媒体扩展结构1 4 “。同时, r i s c 与d s p 的融合结构将目标瞄准了高端的嵌入式处理器市场。九十年代末期,芯片制造 工艺更加先进,集成度越来越高,不同用途的处理器核可以集成在一块芯片中实现,使得整 个嵌入式系统进入片上系统s o c ( s y s t e m - o n c h i p ) 发展时代”“。 随着s o c 研究的逐步深入,要求嵌入式系统具有更强的整合性、更注重软,硬件的协同 设计,对多媒体处理能力和功耗问题提出更高的要求。嵌入式系统处理器也向着多元化的趋 势发展,不同的体系结构间相互融合,取跃补短,体现为1 2 3 - 2 9 1 : 浙江人学博士学位论文 采用超长指令字结构( v l i w ,v e r yl o n gl n s t r u c t j o nw o r d ) 、超标量结构( s u d e r s c a l a r ) 提高性能: 采用适合于多媒体技术需要的分裂运算模式,即单指令多数据( s i m d ,s i n g l el n s t r u c t i o n m u l t id a m ) 等技术提高性能; 采用更深的流水级结构来提高系统频率; 将r i s c 与d s p 处理器的特点相互融合; 图1 1 概括的表示了嵌入式处理器的发展过程。 m i p s 3 0 0 1 0 0 4 0 2 0 侧重于控制 功能和外设 低端 嵌入式 控制器 嵌入式 控制器 i 括外设、 乘法器 为提高性能 增加了功能单元 嵌入式 控制器 包括d s p 功能单元 嵌入式 处理器 包括 乘法器 具有d s p 、多媒体、 图像的高端处理能力 高性能 嵌入式 处理器 包括d s p 功能单元 高性能 嵌入式 处理器 具有丰富 的多媒体 处理能力 微控制器4 一微处理器 图1 1 ,嵌入式处理器的发展过程 嵌入式系统的快速发展以枚不胜举、繁杂多样应用系统需求为主要动力,比如现在的图 形游戏控制台,其处理能力就相当于不久以前的s i l i c o n 图形工作站。目前,嵌入式系统的 应用领域几乎涵盖了所有的日常生活范围: 需要卓越图形性能的视频游戏控制台; 需要虚拟存储管理和标准外设的掌上系统、掌上电脑、网络p c 、汽车信息系统: 要求低功耗,并提供高性能数字信号处理能力的蜂窝电话和移动个人通讯系统; 耍求低成本组成部件的调制解调器、传真机、打印机; 要求低成本和高可靠度的白动化装置; 需要高集成度和低成本的机顶盒、d v d ( d i g i t a lv e r s a t i l ed i s k ) 、电视电话: - 2 一 浙江大学博士学位论文 需要通用性和图像处理能力的数码相机、数字摄像机、m p 3 播放机。 1 2 嵌入式系统处理器 嵌入式系统处理器不像通用目的处理器一样设计用来执行通用范围内的应用程序,而是 针对特定目标应用系统进行了特定的结构或微结构方面的优化。 选择嵌入式系统处理器有很多标准,其中,成本和性能是两个主要考虑方面。最经济的 实现一个应用是嵌入式系统处理器不断发展的动力来源。市场的需要迫使嵌入式处理器设计 者最大限度的去减少成本和产品面市时间,并同时提高处理器的性能和集成度。 桌面系统处理器的典型代表是i n t e lx 8 6 系列处理器,它独占了桌面系统市场的很大份 额。而在嵌入式系统领域,没有一种处理器可以独霸天下,可供选择的处理器更是枚不胜举, 其中主要包括a r m 系列处理器,m i p s 系列处理器,m o t o r o l a 的6 8 k 系列,h i t a c h i 的s u p e r h 等等。 出于系统综合性价比的考虑,r i s c 结构和d s p 结构在嵌入式处理器应用中占绝大多数。 不同的应用场合决定了所采用的嵌入式处理器的不同结构。比如,在要求大量数据处理的场 合,d s p 结构处理器占有较大份额,它善于进行大量数据的实时处理p 。而在要求对信息 进行控制和操作的应用场合,例如文字处理等,r i s c 结构处理器则有较大优势,可以有效 调度不同的任务进程。r i s c 与d s p 处理器的结构设计不同,着眼点不一样,应用领域也千 差万别【3 l o ”。 1 2 1d s p 处理器 1 2 1 1d s p 处理器发展史 人们对d s p 技术的研究兴趣开始于2 0 世纪7 0 年代,主要是研究诸如调制解调器和集 中转接系统等电讯设备。贝尔实验室的d s p i 和n e c 的7 7 2 0 1 ”】在1 9 7 8 年的问世,宣布了 d s p 处理器的诞生p 5 ,”l 。 , 1 9 8 2 年,美国t e x a si n s t r u m e n t s 推出了采用哈佛结构的t m s 3 2 0 1 0 ,将指令和数据存储 空间分开,各自具有地址和数据总线,奠定了现代d s p 处理器的基础,成为第一代d s p 【3 “。 1 9 8 7 年问世的m o t o r o l a d s p 5 6 0 0 1 t ”1 代表第二代d s p 结构走向成熟。它具有了现代d s p 的 大部分数据处理功能:器件内部采用流水线,有乘累加单元,支持零开销循环,可以进行窗 e l 寻址。同一时期的d s p 还有a t & t 的d s p l 6 a ,a n a l o gd e v i c e s 的a d s p 2 1 0 0 等。 进入2 0 世纪9 0 年代,随着应用领域的不断扩大,d s p 进入了一个快速发展时期。除 了满足实时处理的要求外,处理能力更强大,软件开发环境更成熟,而且更注重低功耗、低 成本、高集成度的要求。第三代d s p 的典型代表是1 9 9 5 年m o t o r o l a 的d s p 5 6 3 0 1 3 8 1 和t l 的t m s 3 2 0 c 5 4 1 1 3 。 浙江大学博士学位论文 1 9 9 7 1 9 9 8 年,d s p 技术发展到了第四代,指令并行性进一步提高,从单指令系统发展 到v l i w 结构、多处理器结构。如t i 的t m s 3 2 0 c 6 2 0 1 4 “,它采用v l i w 结构,将8 条指 令打包成一条长指令,在处理器内部同时执行多个操作。 目前的d s p 处理器不仅多媒体等处理性能有了较大提高。而且结构和开发手段更加成 熟、可靠,其应用领域也涉及到人们日常生活的方方面面。 1 2 1 2d s p 处理器特点 相比于其它嵌入式应用,d s p 应用具有自己独特的特点【1 ”,例如: 对数据错误较为敏感,数据错误会产生音频、视频噪声; 数据以“流”的形式出现,典型的输入数据通过a d 转换为一个无限流,对实时性要 求非常严格: 应用程序中通常以大数据罱计算、小范围循环控制以及基于乘累加的操作占主要部分, 所以乘累加指令、硬件控制循环操作变得非常重要; 数据存放方式较为规律,存储地址和程序流程具有可预测性。 这些应用特点要求d s p 处理器具有较强的数据处理能力,并需要专用硬件电路和指令 的支持,主要包括h 2 。4 】: 基于累加的、可以直接面向数据存储单元进行寻址的指令类型; 一条指令执行多项操作,提高数据并行处理能力; 针对应用程序中以特殊规律访问的地址设计寻址模式,并由专门的地址计算单元产生, 如窗口寻址和比特反转等: 支持辅助地址计算及指令寻址的专门用途寄存器: 专用硬件结构,如乘累加器m a c ,零开销循环等: 片上多端口r a m ,用于支持高效的数据交换方式。 由于d s p 处理器结构较为复杂,所以影响其速度和性能的因素也较多,主要包括:操 作并行度( 一个时钟周期内能执行多少操作) 、指令结构、时钟频率、数据类型、数据宽度、 流水线深度( 决定指令的延迟) 、支持d s p 运算的特征( 寻址模式、零开销跳转) 等m 1 。 具有代表性的d s p 芯片包括t i 公司t m s 3 2 0 系列、a d 公司a d s p 系列、m o t o r o l a 公司m c 系列、s t a r c o r e 公司的s c 系列等d s p 处理器。 随着嵌入式系统的发展,d s p 应用领域已经扩展到诸如m p e g 等一系列标准编解码、 数字移动通讯、伺服控制机械人、电力电子、马达控制、变频器、数据处理、加密解密、 影像语音处理、图像,语音辨识、图像语音压缩等。d s p 处理器必将进入更快速的发展时期。 - 4 - - 浙江大学博士学位论文 1 2 2r i s c 处理器 1 2 2 1r i s c 处理器发展史 r i s c 的概念最初是在p a t t e r s o n 和d i t z e l1 9 8 0 年的论文中提出来的。由于在当时r i s c 在同样的技术条件下可以将计算性能提高2 到5 倍,所以r i s c 概念一提出便引起了业界极 大的兴趣。 最初的商用r i s c 处理器主要有3 个:b e r k e l e y 的r i s c i 和r i s c l l 处理器、i b m 的8 0 1 处理器和s t a n f o r d 的m i p s 处理器。这3 种处理器都采用l o a d s t o r e 结构,固定形式的3 2 比特指令字,并强调有效的流水线结构。 随后,工业界开始广泛使用r i s c 结构设计自己的处理器,r i s c 与c i s c 结构之间也展 开了激烈的较量h ”。相对于c i s c ,r i s c 的最大特点是其精简指令集结构。进入2 0 世纪9 0 年代,随着c a c h e 策略、转移预测、超标量、功耗、整合策略逐渐成为业界研究热点,r i s c 和c i s c 之间的争夺也进入白热化阶段【4 “5 ”。 随着计算机体系结构的不断发展,r i s c 逐渐显示出其结构和软件开发上的优越性。2 0 世纪末期,r i s c 结构已经逐步取得了与c i s c 之间斗争的胜利,成为一个主要的、广泛使 用的设计思想和理念“l 。 1 2 2 2r i s c 处理器特点 r i s c 结构的主要特点是将l o a d s t o r e 指令与其它指令分离开来”,从而实现处理器的 高时钟频率和高性能表现m 1 。其指令结构较为简单一般一条指令只能执行一个操作。 目前许多处理器都采用r i s c 体系架构设计,如i b m 的p o w e rp c 、s u n 的u l t r a - s p a r e “1 、 m i p s 系列、a r m 系列等等。它们中的有些已经成为能够达到g e g a h z 的高时钟频率、高 性能处理器芯片p “。 但是,面对具有大量复杂、高速数据计算的嵌入式系统,虽然一个高性能通用目的处理 器也可以完成任务,但是这些高性能处理器的价格和功耗因素却远远超出了嵌入式系统对成 本和功耗的要求。而且,通用目的处理器在数据处理等嵌入式应用中有两个主要弱点: 许多嵌入式应用的核心功能与通用处理器的基本指令集和寄存器文件之间的匹配性差, 所以核心程序在通用目的处理器上执行需要较多的计算周期: 许多专用嵌入式设备应用不到通用目的处理器的所有功能,造成了处理器资源的浪费。 1 2 2 3r i s c 与d s p 的异同 r i s c 处理器强调通用目的处理,而d s p 处理器则专注于执行大量数据的特定运算,两 者设计原则不同,如表1 1 所示 4 4 1 。 浙江大学博士学位论文 表1 1 ,r i s c 与d s p 处理器的不同设计原则 r i s c 处理器d s p 处理器 寄存器一寄存器类型的简单指令集,一般一复杂的、专用的、面向存储单元的指令集, 条指令只能访问一次存储器一条指令可以访问多个存储单元 复杂的指令寻址模式,具有专用的地址计算 l o a d s t o r e 结构,指令寻址模式简单 单元 通用寄存器文件具有特殊用途的寄存器 片上缓存结构具有片上r a m 转移有延迟槽具有零开销循环指令 不具有乘累加单元具有乘累加单元 需要较少的存储带宽需要更多的存储带宽 有存储管理单元 通常没有存储管理单元 利用编译器产生汇编代码,目前有较好的编 目前没有较好的编译器,为了提高程序执行 译器 效率,关键代码部分采用手工汇编进行优化 具有乘累加( m a c ,m u i t i p l i c a t i o nm a d a c c u m u l a t i o n ) 硬件单元和专用的乘累加指令是 d s p 区别于传统r i s c 的特点之一。d s p 处理器中,程序员知道数据速率、数据访问时间、 循环次数等,他可以明确的控制哪一部分数据和指令存于片上存储空间,所以很容易预测代 码在d s p 中的执行时间。而r i s c 利用存储管理和控制逻辑来决定哪些数据和指令存于片上 缓存,这一过程对程序员来说是不可见的,他不知道那些指令和数据存于缓存中,其直觉中 只有一个统一的数据存储空间【”1 ,所以r i s c 处理器中的动态不定因素较多,不容易估计出 代码的执行时间。 d s p 处理器对少量程序和大量数据进行操作,数据通常以数据流的方式出现,d s p 处 理器利用这些数据执行完计算后便将其丢弃,不再使用。所以许多d s p 处理器根本就不包 含片上高速缓存,它们利用片上分段存储单元和多个总线结构来支持一个指令周期内对数据 存储单元的多次访问。但是,在有些d s p 内包括一个小的、专门的片上指令缓存。这个指 令缓存用于存储小循环块内的指令,来节省处理器的总线带宽。相比之下,r i s c 处理器基 于c a c h e 访问机制,程序员不知道数据的存储位置,不知道程序代码是否存于c a c h e 当中。 所以,一个好的c a c h e 机制对实现一个功能强大的r i s c 处理器来说至关重要。 d s p 应用程序的另一个典型特点是算法中处理时间最长的部分常常集中在执行循环块 内的指令,并且该循环块一般相对较短,循环执行次数相对较多。所以,d s p 程序的转移 指令较普通的应用程序多。有统计显示,转移可以占到整个d s p 执行指令的3 0 。这一 特点既是d s p 处理器中小的指令缓存能够较大的提高系统性能的原因之一,同时也是d s p 处理器设计专门的零开销循环跳转硬件的原因之一。“零开销循环”是指处理器能够在不- i 浙江大学博士学位论文 用时钟周期测试循环次数的情况下执行循环内指令、条件转移和对循环次数累减的操作。大 多数r i s c 处理器不支持零开销硬件循环。 此外,d s p 处理器还具有饱和、最大值、最小值等算术运算功能,而r i s c 处理器通常 不具备这些数据处理能力。d s p 处理器还支持特殊的寻址模式,如窗口寻址( 用于数字滤 波器) 和比特反转( 用于快速傅里叶变换) 等。这些高度专用化的寻址模式在r i s c 中通常 是投有的,必须依靠软件来实现同样的功能”“。 由于d s p 通常具有多个存储区域、多条总线、不规则的指令格式、丰富的寻址模式、 高度专用化的硬件结构,所以针对d s p 设计一个能够产生高效代码的编译器较为困难程 序员不得不自己对代码进行手工优化。而大多数r i s c 处理器则依靠编译系统来产生高效汇 编代码。 d s p 与r i s c 处理器不仅在应用类型上不同,它们的性能要求也不同。在大多数非d s p 应用中,性能要求通常以最大平均响应时间给出并不具体到每一个环节,只是一个平均的 总体概念。而大多数d s p 应用则要求实时性,所有的处理需在规定的时间内完成。这一性 能限制要求程序员决定每个采样到底需要多少处理时间,或者最起码知道在最坏的情况下需 要的执行时间。 1 2 3 混合类型处理器 随着多媒体处理、网络通讯等众多应用领域的快速发展,数字信号处理程序越来越复杂, 系统处理的数据量越来越大,要求也越来越高。类似m p e g 4 、3 g 无线通讯系统中,整帧的 图像数据或者传输流都要求进行实时处理,系统对设计性能、灵活性的要求更加苛刻。所以, 嵌入式系统不再是只需要一个用于系统控制的便宜的微控制器或者集成外设和存储器的嵌 入式控制应用的代名词,而是需要包括显示、图形界面、人机界面、图像处理、远程控制、 实时通讯等功能集成的一个复杂的应用系统。在这个系统里同时强调了较强的数据处理能力 和完备的系统控制能力。而以往的传统嵌入式处理器结构越来越不能满足这类系统的需要。 比如,传统r i s c 处理器虽然控制能力较强,但是其数据处理能力不够。而传统的d s p 结构 虽然数据处理能力较强,但是系统控制能力有限,如果能将两者的特点结合起来,无疑会更 加适应应用领域的需要,并对嵌入式系统处理器结构的设计方法研究产生深远的影响【3 4 4 ”1 。所以,r i s c 处理器和d s p 处理器的融合是计算机体系架构发展的必然趋势。在r i s c 处理器中加入支持d s p 处理的硬件组成,以及扩展d s p 处理器使其更适应于编译器,这两 方面构成了r i s c 处理器和d s p 处理器之间的融合文化。 事实上,目前嵌入式系统的发展趋势正在向着这一方向改变着,越来越多的嵌入式系统 处理器将传统r i s c 和d s p 处理器的结构和性能特点融合在一起,借鉴r i s c 和d s p 的设 计思想和方法,同时考虑系统成本、功耗及应用场合的限制,逐步发展出r 1 s c 与d s p 的混 合类型处理器体系结构”“。 7 浙江大学博士学位论文 3 g 终端、多媒体等应用领域都可从这种r i s c 和d s p 的混合结构( 以下称其为r i s c d s p 架构) 中受益。例如,无线手机的处理器实现包括两个部分:基带处理器和应用处理器。基 带处理器负责将数据发送到网络,而应用处理器则执行用户界面,系统控制程序等功能。由 丁| 空间传输的带宽有限,并且价格昂贵,视频、音频数据在传输之前需要经过压缩,这一压 缩过程是由基带处理器完成的。类似的,视频压缩、音频处理等许多其它包含额外信号处理 的应用场合也需要r i s c 和d s p 共同实现。 r i s c d s p 架构中的r i s c 部分最适于执行控制类代码( 如操作系统,用户接口,文字 处理等) ,而d s p 部分最适合信号处理应用,如m p e g 4 编解码等。这种处理分工表现在应 用中,便是一个移动用户既可以访问自己的操作系统应用程序( 如w o r d ,e x c e l ) ,又可以 同时进行可视会议。而这种情况下,如果只利用一个单独的r i s c 处理器,则其全部计算能 力都被可视会议的应用处理占用,移动用户无法同时运行其它应用程序。可见,r i s c d s p 架构在这种处理场合是相当有用的。 总结r i s c d s p 结构的融合手段,不外乎以下几种: 在r i s c 结构中增加d s p 处理指令:1 9 9 4 年1 月推出的p a - r i s c 是第一个具有多媒体 扩展指令( m a x 1 ) 的处理器5 “”。随后,s u n 在s p a r ei s a 中加入了v i s ( v i s u a l i n s t r u c t i o ns e t ) t t 目h + t 6 0 1 ,1 9 9 7 年1 月,i n t e l 推出了带有m m x 指令的指令集处理器呲6 ”。 接着1 9 9 7 年,s g l 推出了m d m x ( m i p s d i g i t a l m e d i a e x t e n s i o n s ) ,摩托罗拉推出a l t i v e c 用于p o w e r p c 处理器【”l 。目前,几乎大多数处理器在原有指令的基础上都扩展了多媒 体处理指令来增强处理能力。 在r i s c 结构中增加d s p 处理专用硬件电路:如a r m 9 e 增加了m a c 执行单元【6 ”。 在r i s c 结构中 j h x d s p 执行单元:如e 1 3 2 4 4 5 2 ,6 3 。5 增a n t 专用的d s p 指令执行单元。 在r i s c 结构中加入独立的d s p 处理器核:如o m a p 架构包括a r m 和t m s 3 2 0 c 5 x 两 个处理器核 6 6 , 6 7 】。 在r 1 s c 结构中加入d s p 协处理器:如n e u r o m a t r i xr i s c 处理器核( n m r c ) 的d s p 协处理器【矾1 ,s h 系列中的d s p 协处理器吲等。 设计一种全新的、融合结构:将原有的r i s c 和d s p 处理器功能在一个统一的结构中实 现,由程序员决定任务类型( 是控制任务还是d s p 任务) ,每一种任务执行都可以利用 系统的所有硬件资源。 本文把在r i s c 结构中增加d s p 处理指令、d s p 处理专用硬件电路和d s p 执行单元的 结构统称为r i s c 增强结构。r i s c 及其增强结构虽然可以在个别处理性能上与d s p 处理器 相近,但是它的整合性不好,缺乏面向d s p 的设计工具,微结构总体性能不佳,再加上能 量消耗人,价格高,所以并不被d s p 系统设计人员列为首选【6 ”。 本文把在r i s c 结构中加入d s p 处理器核或d s p 协处理器的结构称为r i s c 与d s p 联 合结构。这种做法类似丁二设计一个多处理器系统,所以也相应的继承了多处理器系统设计的 诸多问题。即使是将砸者组成一个a s i c 系统,也不可避免的会遇到在单处理器系统中不会 一8 一 浙江大学博上学位论文 出现的凋试复杂性和困难性。同时,在这样一个复杂的a s i c 系统或多处理器系统中,寄存 器文件等硬件资源都需要准备双份,硬件资源浪费较大,无形中增加了嵌入式系统的成本【 。 而设计一种全新的、融合式结构既避免了r i s c 增强结构的整合性问题,又避免了加入 d s p 处理器核或d s p 协处理器可能带来的协调性、一致性问题,给应用程序的设计注入了 更多的灵活性,具有较好的系统性能。 1 2 3 1 r i s e 增强结构 文献【4 4 ,5 2 ,6 4 ,6 5 】介绍了h y p e r s t o n er i s c 增强结构的e 1 3 2 。e l 一3 2 既可以作为通用处 理器,又同时具有d s p 定点处理能力。 e 1 3 2 坚持了两个r i s c 设计主要原则:严格的将指令区分为l o a d s t o r e 类指令和其它 指令;严格的利用简单指令。它根据d s p 特点改造了r i s c 结构,在r i s c 结构中整合了一 个d s p 单元,该d s p 单元与算术运算单元a l u 、桶形移位器并行工作,并访问同一个寄存 器文件,如图1 2 所示。处理器资源可以由通用目的程序和信号处理程序公用,应用程序工 程师可以利用所有的功能单元和指令来编写应用程序。e 1 3 2 中的d s p 单元针对d s p 算法 进行了优化,并负责数字信号处理应用中的快速循环处理、大量数据进出处理和确定程序流 程的处理。 e l 3 2 采用变长指令字及2 级流水线结构( 指令译码级和执行级) 。大多数的a l u 指令 都可以在一个时钟周期内执行完毕,只有少数d s p 指令需要更多的周期来完成操作( 这些 指令通常为宽数据指令) ,在此期间,其它的a l u 指令或l o a d s t o r e 指令可以并行执行。这 种基于变长指令执行周期的概念使得e l - 3 2 指令能够以类似超标量的方式执行,提高了指令 并行度,但是也对e l 一3 2 的编译环境提出了更高的要求。此外,虽然专用的d s p 处理模块, 相对于其它只进行多媒体指令扩展的处理器来说,可以提供更为完整的、常用的d s p 功能, 但是e l 3 2d s p 处理单元的操作不够丰富,2 级流水结构也限制了处理器时钟频率的提高。 图1 2 ,e l 一3 2 结构框图 浙江大学博士学位论文 文献【7 0 介绍的y s r d s p 结构也是将一个r i s c 核和一个d s p 核在硬件微结构上联合 在一起,既提供了d s p 处理能力,义具有r i s c 处理器的控制能力。y s - r d s p 采用5 级流 水结构,简单的a l u 指令可以在3 级流水内完成,而复杂的d s p 指令需要5 级流水完成。 y s r d s p 利用d s p 指令访问存储单元,a l u 指令只完成算术运算。在y s - r d s p 处理器中 包含两个数据通路:r i s c 数据通路和d s p 数据通路,分别包含自己的寄存器文件、处理单 元和计算单元。这种结构虽然使得部分操作可以并行,在一定程度上提高了指令并行度,但 是却相当于将两个独立的r i s c 和d s p 核,通过一定的总线和通讯方式在硬件实现上结合在 一起。这对于高性能指令代码的开发、r i s c 与d s p 计算结果的交换、以及硬件资源利用率 都较为不利。 1 2 3 2r i s c 与d s p 联合结构 图1 3 ( a ) 说明了r i s c 结构中3 j n x d s p 处理器核或d s p 协处理器的r i s c 与d s p 联 合结构示意图。图中d s p 与r i s c 核通过各自的i o 接口与外界联系,相互之间具有较为复 杂的通讯结构。 r i s c d 卵l l me_oryunifiedo rs e e m t e di ( a ) 图1 3 ,r i s c 与d s p 联合结构( a ) 与全新融合结构( b ) 比较 文献 6 6 “7 介绍的o m a p 架构便属于r i s c 与d s p 联合结构,如图1 4 所示它通过 t i 的t m s 3 2 0 c 5 xd s p 处理器核,以及a r m 9 2 5 tr i s c 处理器核来增强系统性能。两个处 理器都具有各自的存储管理单元,通过各自的接口信号与外设进行通讯。 图1 ,4 ,o m a p 架构 一1 0 - 浙江大学博士学位论文 o m a p 架构中的r 1 s c 核负责执行控制类代码( 如操作系统,用户接口,操作系统应用 等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广西南宁市建筑质量安全管理中心面向社会招聘外聘人员1人备考考试题库附答案解析
- 2025中铁装配式建筑科技有限公司招聘65人备考考试题库附答案解析
- 2025年丽水市中医院引进高层次人才5人(第三批)备考考试题库附答案解析
- 2025重庆大学大数据与软件学院劳务派遣工作人员招聘1人备考考试题库附答案解析
- 2025国家电投集团氢能科技发展有限公司职业经理人选聘4人备考考试题库附答案解析
- 2025浙江绍兴市嵊州市机关事业单位招聘编外人员和国有企业(社会团体)招聘16人备考考试题库附答案解析
- 2025中国能建易普力公司招聘考试参考试题及答案解析
- 2025浙江嘉兴市海宁市应急管理局招聘备考考试题库附答案解析
- 2025西安市高陵区融媒体中心公益岗招聘(2人)考试参考试题及答案解析
- 2025云南迪庆州疾病预防控制中心(迪庆州卫生监督所)选调工作人员6人考试参考试题及答案解析
- 高血压个案护理案例
- 四川省三级综合医院评审标准实施细则(2023年版)
- 心肺复苏术课件2024新版
- Unit 1 Lesson1 Hello!教学设计 2024-2025学年冀教版英语七年级上册
- 2024年省食品生产监管能力大比武理论备赛试题库(含答案)
- 黑布林阅读初一5《大卫和超级神探》中文版
- 2025届高三化学一轮复习策略讲座
- 50000t天污水厂课程设计
- GB/T 44251-2024腿式机器人性能及试验方法
- 人音版 (五线谱)一年级上册音乐-1 《玩具兵进行曲》教案
- 医药产业园区智慧园区系统建设方案
评论
0/150
提交评论