




已阅读5页,还剩57页未读, 继续免费阅读
(通信与信息系统专业论文)md32存储系统软硬件协同设计的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 摘要 随着芯片业的飞速发展,数字信号处理器( d s p ) 无论从制造工艺、体系结构、编译器 和d s p 上的实时操作系统( r t o s ) 几个方面都取得了巨大的发展。作为当今一个应用的热 点,多媒体应用也强劲地推动着芯片业的发展。d s p 以其体系结构上的特殊性,强大的处 理能力和相对较低的功耗水平,特别适合于多媒体领域的应用。正是这样一个背景促成了 3 2 b i t 数字信号处理器m d 3 2 的设计和开发。本文就以m d 3 2 的开发设计为背景,讨论了 m d 3 2 上存储系统的设计。 与通用目的处理器不同,m d 3 2 是主要面向嵌入式多媒体应用的d s p 系统。这样的应用 领域为m d 3 2 片上存储系统的设计提出了新的挑战。首先,要求存储器有一个快的访问速 度,根据需要提出了2 g n s 的访问时间限制。其次,由于m d 3 2 指令集的特殊性,特别是针 对多媒体应用的m m x 和s i m d 指令的加入,因而要求芯片上的存储系统具有很高的带宽, 以发挥出m d 3 2 强大的多媒体处理能力。最后,要求存储系统具有非常低的功耗水平,以 保证m d 3 2 低功耗设计目标的实现。) 2 一 , 本文采用软,硬件协同设计的思想来进行m d 3 2 存储系统的设计。本文从系统的性能指 标出发,根据软顾件划分原则对系统进行了划分。在硬件的设计中参考了软件的需求;同 时在操作系统中根据硬件的功能设置了简单可靠的存储管理系统。最后,利用软,硬件协同 仿真和验证环境i c e s 中对于系统进行了协同模拟和验证,从而保证了设计的正确性和满足 指标要求。 在存储系统的硬件设计中,始终以性能指标作为依据,克服了存储器容量、库单元规格 选择、联合度的选择和c a c h e 在流水线中的位置选择等困难,设计出了符合指标要求的指令 存储系统。同时,针对d s p 中数据访问的特点和m d 3 2 同时兼顾d s p 与r i s c 特性的设计 特点,设计了包含数据r a m 和数据c a c h e 的数据存储系统,并对给出了数据存储系统的访 问规则。另外,本文还给出了两种c a c h e 功耗估计的办法,从而有效地指导了设计工作。 存储管理是m d 3 2 实时操作系统( r t o s ) 的重要内容,本文根据m d 3 2 存储管理单元 ( m m u ) 的特点,设计并实现了一种简单的存储保护和共享机制,并且利用操作系统调度 的应用程序来仿真真实系统的行为并利用仿真的结果来指导存储器的硬件设计。 由于s o c 设计的复杂性日益提高,对全系统进行软,硬件协同模拟验证的必要性越来越 明显。本文给出了基于虚拟原型机的软,硬件协同验证环境i c e s 的设计。i c e s 在保证验证 准确性的同时,通过在系统原型中嵌入虚拟监视控制单元( v m c u ) ,同时结合实时操作系 统、进程间通信和j a v a 实现的外部工具与数据库,i c e s 提供了良好的可观测性和可控制 性并且可以在i c e s 中方便地进行系统地性能评估。另外,r t o s 在i c e s 中的应用使得应 用程序的移植变得容易,加快了开发的速度。1 p 、一 设计 存储系统i 浙江大学硕士学位论文 a b s t r a c t w i mt h eq u i c kd e v e l o p m e n to fi ci n d u s t r y , d i g i t a l s i g n a lp r e e e s s o r ( d s p lh a sg a i n e d a d v a n c ei nb o t h m a n u f a c t u r i n gp r o c e s s ,a r c h i t e c t u r e ,c o m p i l e ra n dr t o s m u l t i m e d i aa p p l i c a t i o n a l s og r e a t l yi m p r o v et h ed e v e l o p m e n to fd s p t h es p e c i a la r c h i t e c t u r e p o w e r f u lp r o c e s s i n g a b f l i t y , a n d r e l a t i v el o wp o w e rc o n s u m p t i o nm a k ed s pt h em o s ts u i t a b l eo n ef o rf u t u r e m u l t i m e d i aa p p l i c a t i o nt h i si st h eb a c k g r o u n di nw h i c hm d 3 2i sd e v e l o p e d a n di nt h i sp a p e r , t h ed e s i g no f m d 3 2m e m o r ys y s t e mi sd i s c u s s e d b e i n gd i f f e r e n tw i t hg e n e r a lp u r p o s ep r o c e s s o lt h em d 3 2i st a r g e t e d i nt h em u l t i m e d i a p r o c e s s i n g ,w h i c hp r o p o s e sm a n yc h a l l e n g e st ot h ed e s i g no f m d 3 2 m e m o r ys y s t e m f i r s to fa l l , t h ea c c e s st i m eo fm e m o r vs y s t e ms h o u l db es h o r te n o u g h a n di ts h o u l dl e s st h a n2 g a s s e c o n d b e c a u s eo ft h et m u s u a lc h a r a e t e f i s t i c so fm d 3 2i n s t r u c t i o ns e t s u c h 鹊m m xa n ds i m d ,t h e b a n d w i t ho ft h em e m o r ys y s t e ms h o u l db ew i d ee n o u g ht op r o v i d ee n o u 翊f ld m at ot h ep o w e r f u l p r o c e s s i n gu n i to fm d 3 2 1 1 l i r d t h ep o w e rc e n s u r e p t i o no fm d 3 2m e m o r ys 3 ,s t e ms h o u l db e s m a l l s ot h a to n eo f t h em e s td e s i g nt e r g e t - l o wp o w e r - c a nb es a i l s f i e d i nt h i sp a p e r , h a r d w a r e s o r w a r ee o d e s i g ni su s e dt os o l v et h ep r o b l e m s i nt h i sp a p e r , w e b e g i nw i t ht h es p e c i f i c a t i o no ft h es y s t e m ,d ot h eh a r d w a l e s o r w a l ep a r t i t i o na c c o r d i n gt ot h e c r i t e r i a i nt h ed e s i g no fh a r d w a r eo fm e m o r ys y s t e m t h er e q u i r e m e n t so fs y s t e ms o f t w a r ei s t a k e ni n t oa c c o u n t ;a n da c c e r d i n gt ot h eh a r d w a l ea m h i t e e t u r e , ae f f i c i e n ta n ds i m p i em e m o r y m a n a g e m e n ts y s t e mi sd e s i g n e di nt h er t o s a n dh a r d w a r e s o f t w a r ee o v e r i f i c a t i o ni sc 删e d o u t t og u a r a n t e et h ec e l t e c t e e s so f d e s i g n i nt h ed e s i g no f h a r d w a r eo f m e m o r y s y s t e m ,a c c o r d i n gt ot h es y s t e ms p e c i f i c a t i o n ,w es e l e c t t h ea p p r o p r i a t em e m o r yc a p a c i t y , s r a mb l o c k ,a s s o c i a t i v i t ya n dt h ep l a c e m e n to fc a c h ei nt h e p i p e l i n e s i m i l a r i l y , a c c o r d i n gt ot h ed s p d a t aa c c e s sp a t t e r na n dd e s i g np h i l o s o p h yo fm d 3 2 ,a d a t am e m o r yc o m b i n e dd a t ac a c h ea n dd a t ar mi sp r o p o s e d i nt h em d 3 2 r t o s ,m e m o r ym a n a g e m e n ts y s t e mi so n et h em o s t , i m p o r t a n tp a r t a c e n r d i n g t ot h ec h a r a c t e r i s t i c so fm d 3 2m m u ,as i m p l em e m o r yp r o t e c t i o na n ds h a r i n gm e r c h a n i c a li s d e s i g n e da n d t h ep r o c e s ss c h e d u l i n gi su s e dt om a n a g et w ot a s k st og e tt h ep e r f o r m a n c ed a t a , a n d t i mr e s u l ti su s e dt od i r e c tt h eh a r d w a r e d e s i g n w i t ht h ec o m p l e x i t yo fs e ed e s i g n ,t h en e c e s s m t yo fh a r d w a r e s o f l w a l ec o v e r i f i c a t i o ni s m o r ea n dm o l ea p p a r e n t i nr i f f st h e s i s ah a r d w a r e s o f t w a r ec o v 碰c a d o ne n v i r o n m e n ti c e si s p r o p o s e db ye m b e d d i n gv i r t u a lm o m i t o ra n dc o n t r o lu n i t ( v m c u ) i n t o t h es y s t e mp r o t o t y p e , r t o s ,i p c ,a n de x t e r n a l t o o l sa n dc o n s o l ei l n p l e m e n t e du s i n gj a v a ,i c e sp r o v i d eg o o d o b s e r v a b i l i t ya n dc o n t r 0 1 a n dt h ea p p l i c a t i o no f r t o s m a k ei c e s h i g h l yp o r t a b l e k e y w o r d s : d i g i t a ls i g n a lp l e c e s s o r ( d s p ) ,h a r d w a r e s o f t w a r ec o d e s i g n ,m e m o r ys y s t e m ,c a c h e ,r e a l t i m e o p e r a t i n gs y s t e m ( r t o s ) ,h a r d w a r e s o f t w a r ec o v e r i f i c a t i o n 2 浙江大学硕士学位论文 第一章绪论 从1 9 8 2 年t i 公司推出第一款商用数字信号处理器( d s p :d i g i t a ls i g n a lp r o c e s s o r ) t m s 3 2 0 1 0 以来,在过去的2 0 年间d s p 的性能得到了巨大的增强。在微电子技术发展的带动 下,现在集成电路的设计已经进入系统集成芯片( s o c :s y s t e m - o n - a c h i p ) 时代。d s p 的发 展也越来越面向特定的应用。而作为当今发展最快,最有前途的应用领域之一的多媒体应 用对d s p 的体系结构、编译技术、实时操作系统及设计方法都提出了新的要求。在这种背 景一r ,我们设计了主要面向多媒体应用的3 2 位数字信号处理器m d 3 2 。 第一节面向多媒体发展的数字信号处理器 一、d s p 的发展概述 数字信号处理( d s p :d i g i t a ls i g n a lp r o c e s s i n g ) 被广泛地应用在很多地领域,如 数字蜂窝电话、马达控制、音频视频解码、数字相机和调制解调等等,而这些对于运算量 要求很高的计算成为许多应用系统的性能瓶颈,因此专门为数字信号处理而设计的数字信 号处理器就成了许多系统的关键部件。1 9 8 2 年,美国德州仪器公司( t i :t e x a si n s t r u m e n t s ) 推出了第款1 6 b i t 定点商用的数字信号处理器t m s 3 2 0 1 0 ,到今天d s p 已经发展了2 0 年, 为了满足数字信号处理的特殊要求,d s p 通常具有以下的结构特点 5 3 : l 、 快速的乘法。因为数字信号处理中大量使用乘法运算。如f i r 算法,其指令的长 度很短,但是需要大量循环的乘法运算,因此d s p 中至少包括一个专用的乘法或 者乘累加单元( m a c :m u l t i p l y - a c c u m u l a t eu n i t ) 。 多个执行单元。数字信号处理运算中通常要求很高的运算量,因为其必须实时地 对大量的数据进行处理。因此,d s p 中通常包含多个独立的运算单元,比如除了保 护m a c 外通常还包括一个算术逻辑单元( a l u :a r i t h m e t i c l o g i cu n i t ) 和一个 移位器。 高效的存储器访问。因为一个m a c 的执行在每个时钟周期内需要取m a c 指令,数 据采样,滤波器系数。因此,对于存储器带宽的要求很高。通常使用单独的指令 和数据存储器,并且经常使用多个存储器单元来扩大存储器带宽。同时,d s p 上通 常包含专用的指令产生单元,该单元并行于主要的执行单元,使得主要的执行单 元不必等待并且计算新的地址。同时,利用数字信号处理中存储器访问很强的可 预测性,d s p 通常提供特殊的寻址模式来加快存储器的访问,如带后增量寄存器间 接寻址( r e g i s t e r i n d i r e c ta d d r e s s i n gw i t hp o s t i n c r e m e n t ) ,又如循环寻址。 数据格式。大多数d s p 采用定点的数据格式,但需要特别注意防止溢出等错误的 出现。而出于功耗和价格的考虑,很少的d s p 采用浮点数据。同时,为了保证计 算的正确性,d s p 通常设置了特殊的硬件。如累加器寄存器的数据宽度通常比其他 寄存器宽来避免数据的溢出。 零开销的循环( z e r o - - o v e r h e a dl o o p i n g ) 。由于数字信号处理中用到大量时间来 循环执行一小段代码。因此,大多数d s p 提供对于循环的特殊支持,如提供一个 特殊的循环指令来执行f o r n e x t 循环,而不需程序来更新和判断循环计数器。 浙江大学硕士学位论文 6 、 特殊的指令集。d s p 指令集具有一定的特殊性,这主要时出于两个方面的考虑。首 先是提供效率,高效地利用硬件;其次是减少用来存储数字信号处理程序的存储 器空间。因此,通常d s p 的指令集通常比较复杂并且不规则,使得编写高效的汇 编程序变得较为复杂,也使得编译器的开发变得更加复杂。 根据以上的特点来纵观d s p 的发展,可以将其分为三代 5 2 j 第一代以t i 的t m s 3 2 0 1 0 5 1 为代表,是采样1 6 b i t 定点d s p ,采用h a r v a r d 体系结构 ( 单独的指令和数据存储器) ,带有一个累加器和专用的指令集,m a c 时延为3 9 0 n s 。 第二代d s p 以m o t o r o l a 的d s p 5 6 0 0 1 为代表。采用2 4 b i t 数据和地址总线,三个存储 器空间( x 、y 、p ) 并支持并行访问,单指令或者多指令的硬件循环支持,7 5 n s 的m a c 。 第三代的d s p 以m o t o r o l a 的d s p 5 6 3 0 1 和t t 的t m s 3 2 0 c 5 4 1 为代表。其采用增强的传 统d s p 体系结构,3 0 v 的核心电压,更大的片上存储空间,数据通道中采样专用的功能单 元或者协处理器,复杂的调试和开发工具,2 0 n s 的m a c 。 随着半导体工艺的进步及计算机体系结构的发展,传统的d s p 性能已经有了很大的进 步。这主要半导体技术发展带来的时钟频率的大幅增长,另外d s p 体系结构的发展也给d s p 性能带来了很大的提高。在体系结构方面首先是多发射体系结构的发展,通常采用的方法 有超标量( s u p e rs c a l a r ) 和超长指令字( v l i w :v e r y1 0 n gi n s t r u c t i o nw o r d ) 等微结 构。指令的多发射方法和多数据通路在于发挥指令级并行度从而提高了程序执行速度。超 标量构造的处理器由于结构复杂度随着指令发射数超过平方关系增长,而且相对于传统d s p 功耗较大。v l i w 结构复杂度随指令发射数约为线性关系,因此受到了更多的关注。其次是 单指令多数据处理( s i m d :s i n g l e i n s t r u c t i o n ,m u l t i p l e d a t a ) 的发展,这是一种可以 广泛使用的体系结构技术。它使得d s p 可以同时执行多个相同的运算,从而提高了系统的 性能。但s i m d 技术的使用需要对于存储器中的数据进行仔细的安排,因而增加了应用的难 度。从另一个方面,越来越多的高性能c p u ,如p e n t i u m 、p o w e r p c 等,包含了支持数字信 号处理应用的特点。这主要采用了基于s i m d 的指令集扩展,如- 嗽和s s e ,从而提供了比 较好的信号处理功能。但由于功耗、性能和价格的综合考虑,其应用范围仍比较有限,专 用的d s p 仍然受到人们的青睐。 在d s p 体系结构发展的同时,作为d s p 产品必须配上基础软件工具,常用的软件工具 包括汇编器、c 编译器、链接器、仿真器和硬件评估板。但现在公认d s p 编译器目前的发展 水平还不能令人满意。 第一,由于传统的编译技术主要是为c i s c 或r i s c 结构的处理器开发的( 也称为常规编 译器) ,并不适用于d s p ,因此必须专门为d s p 开发单独的编译系统。 第二,d s p 在硬件结构上有许多特别之处,应用软件只有充分利用这些特殊的资源或结 构才能满足d s p 的要求。因此,编译器在很大程度上受目标机器( 指最终运行代码的处理器) 结构特征的影响,即根据某一具体d s p 的硬件结构度身定制。这样一来,编译器在不同结 构d s p 之间的快速移植,即编译器的可重定目标性( r e t a r g e t a b i l i t y ) 成为一个很大的问题。 可重定目标编译器( r e t a r g e t a b l ec o m p i l e r ) 是目前的研究热点。 第三,现存d s p 编译器产生的汇编代码( 以下简称为生成代码) 无论从长度还是执行速 度上与最优代码差距很大。这主要因为高级语言( 如c 语言) 不是很适合描述典型的d s p 算法。传统的d s p 体系结构,有多个存储空间、多数据总线、不规则指令集、特殊硬件对 _ r 开发高效的c 编译器比较困难。编译器是同体系结构的指令集密切相关的。某些d s p 采 6 浙江大学硕士学位论文 用非正交的指令集体系结构不利于开发优化的编译器,编程人员为了发挥d s p 的晟大性能, 只得采用汇编语言编写程序,这导致了代码的兼容性、软件的可维护性和软件升级等问题。 因此程序还是从汇编代码编写较多。在某些d s p 应用中,汇编代码要占到9 0 左右,而c 代 码只占1 0 。 但是c 语言己成为工程界约定的程序语言,因此现在对d s p 的发展已公认必须有好的 编译器相配,主要要求有:能和设计的d s p 微构造相配,有高效的代码生成;便于移植到 d s p 发展下一代产品时二进制代码兼容;用户界面友好,便于开发应用程序e 1 5 。 对于高性能应用,用编译控制发射多条指令,为了维护兼容性,采用了正交的指令集, 且采取预测和推测技术来增强指令级并行度,如此增强的v l i w 称为e p i c ,如s c 4 4 0 ( s t a r * c o r e ) ,t 1 s 3 2 0 c 6 2 0 1 ,t i g e r s t i k r c 。c 6 2 0 1 和t i g e r s i i k r c 的指令宽度是3 2 位,这样 指令集是正交的利于开发高效的编译器;而s c 4 4 0 选择1 6 位指令宽度,为了实现高的代码 密度和低功耗,同时编译器经过精心设计来得到高性能汇编代码。 仿真器和评估板对用户编写应用软件十分重要。应用程序开发环境包括良好的用户界 面和帮助说明,可以进行接受高级语言( c 语言的输入) 进行编辑、编译、汇编、链接和软 件仿真。同时可以给出应用程序的一些存储访问、运行节拍数等性能评估倍息,以便用户 奇错和优化应用程序。 除了编译器,软件方面的实时操作系统也得到了很大的发展。因为为了片上主控 s p 所需并行和并发进程调度、中断处理器、i o 以及片上多个部件并行工作,通用的s o c 需要 实时操作系统( r t o s ) 。目前嵌入式操作系统的研究大多基于板级的应用,操作系统所占的 内存一般从几十k 到几兆字节,而且实时性较弱,不适用于系统集成芯片。因此需要针对 s o c 研制合适的r t o s 。操作系统能屏蔽硬件实现的细节,为应用程序提供一个统一的接口, 加快软件的开发,r t o s 是软硬件协同设计平台的重要组成部分。系统中多个并发的任务是 由r t o s 来管理的,进行调度和优化。传统的r t o s 的厂商如w i n dr i v e rs y s t e m ( v x w o r k s ) 、 r a t i o n a ls o f t w a r e 、p a l mc o m p u t i n g ( p a l mo s ) 、m i c r o t e cr e s e a r c h ( v r t x ) 、q n x ( q n x s o f t w a r e ) 等占据了目前市场的很大份额。由于市场需求的扩大,包括m i c r o s o f t 和l i n u x 等操作系统巨头也对嵌入式操作系统的市场产生了兴趣,他们的加入对原有的市场格局形 成的很大挑战。学术界对r t o s 的研究主要集中在调度算法及实时内核的研究,而工业界的 兴趣主要是在系统对存储空间的要求以及上下文切换时间和中断响应时延等指标。 s o c 中的实时操作系统与通常的嵌入式实时操作系统相比又有新的特点:可以采用软硬 件协同设计的方法提高性能。可以将一部分操作系统的功能由软件迁移到硬件来满足实时 性能的要求。s o c 中的实时操作系统要求占用较小的存储空间。根据目前一般的s o c 芯片的 规模,操作系统代码要求最好在l o k b 以内。由于r t o s 要有一部分必须驻留在系统集成芯 片上,而系统集成芯片的存储空间通常都是有限的,增加片上的存储空间,必然要增加芯 片的逻辑门数,同时也导致芯片的面积和功耗的增加。因此系统集成芯片对r t o s 代码容积 要求是很高的。 纵观芯片业的发展,我们发现应用始终是芯片技术发展的最强大的推动力。而当今一 个非常有代表性而且对集成电路要求非常高的应用领域就是多媒体应用。针对多媒体应_ 1 j 中数据量大、要求带宽宽等特点,d s p 在多媒体应用中越来越显示出其优越性。因此,有必 要在这里介绍以下多媒体应用对于d s p 提出的一些新的要求,这种要求恰恰是我们在m d 3 2 的开发中所要达到的技术目标。 7 浙江大学硕士学位论文 面向多媒体处理的d s p 发展 多媒体处理指对多媒体对象如文本,手写体数据,音频对象,静态图像,2 一d 3 - d 图形, 动画以及全动态视频等的捕捉,存储,操作,传输等操作。以前,人们对媒体的需求还仅 仅局限在文本,声音等有限的几个媒体上。如今,人们对媒体的需求已经有了很大的发展。 人们不仅仅需要文本,还希望有高保真的音视频享受,逼真的3 d 虚拟现实体验或者实时的 视频电话等等。而且,随着人们生活水平的提高,人们对媒体的需求还在不断更新,不断 增加,并产生了各种各样的媒体处理技术,如语音分析和综合,字符识别,音频压缩,图 形动画,3 一d 渲染,图像增强和恢复,图像视频分析和编辑,视频传输等等。这些媒体处 理技术,从软件上和硬件上都给处理器带来了新的挑战。要求的计算复杂且数量巨大,数 据也很大。这些都使得传统的处理器难以满足现代多媒体处理的要求。 在多媒体处理条件下,d s p 得到了快速的发展,并且出现了特别为多媒体应用的增强型 d s p ,也叫做媒体处理器( m e d i ap r o c e s s o r ) 1 。本部分就对面向多媒体处理的d s p 发展 作一个介绍。 2 1 多媒体信号 多媒体信号是宽带信号。宽带信号的特点反映在处理要求上的首要特征应该是实时性 限制,因为若无此要求,那么时间的延迟可以弥补系统带宽和速度方面的不足;其次的特 征是:传输时需要大的带宽,交换时要求低的延迟,存储时要求大的空间,计算时算法复 杂需要大的运算量,另外应用系统往往需要多路共存。 多媒体信号是目前最广泛应用的宽带信号类型,其中包括各种其它应用,如医疗图的 档案管理、遥感数据分析、行业监控等。多媒体信号是广播、通信与网络技术服务的主要 对象。为了实现对多媒体信号的实时传输与处理,在每一个技术单元中,如数据采集器、 路由器、调制解调器、压缩解压缩等,都要达到宽带信号的相应要求。 多媒体信号的另一个重要特点是对它的处理算法并行特征和重复性比较明显,这一点 非常有利千信号处理器采用并行结构提高运算速度,如对音频和视频的压缩算法( a a c 、 f p e g 、j p e g 2 0 0 0h 2 6 4 等中使用的压缩变换算法) 等。 2 2 多媒体数字信号处理器的要求 从普通数字信号处理器到多媒体数字信号处理器的实质变迁不只是运算速度的提高, 而是整体上自硬件到软件的结构设计都围绕着多媒体信号的特点,考虑了开发和实现一个 完整应用系统时能够提供最佳的直接途径,面向的是原始的宽带多媒体信号或其它特别的 宽带信号如c t 扫描信号、雷达成像信号、红外遥感信号等。提高运算速度仍旧是最基本的 前提,提高单片c p u 响应的途径有三种途径:第一是降低时钟周期;第二是降低执行单条 指令时所需的时钟周期数;第三是在一个时针周期内执行更多的指令。前两种已经接近了 目前的极限而第三条途径是所有类型计算机为达到更高速度所一致追求的,其实质意义 就是并行运算。并行运算在不同的计算系统、不同的应用中有不同的结构侧重与实施策略。 在厦向多媒体的信号处理器中,并行运算的扩展到了每一个环节,从核心到外围、从指令 级到系统级、从软件开发到硬件实现,突出了信号处理器与微处理器功能重叠的同时在应 j j 上的不同特点。 结合处理对象的特点,多媒体数字信号处理器应该满足以下要求 l 、多媒体信号处理的核心是适应宽带信号特征的高速处理核; 8 浙江大学硕士学位论文 2 、多媒体信号处理的核外围硬件资源必须是充足的、高速的; 3 、多媒体信号处理器的内核与外部的接口也必须也是宽带的,要满足宽带信号的多路、 实时输入输出需求: 4 、硬件结构应该合理、有效、适应不同的算法耍求,又不过分复杂,对不同的应用组 合不会造成浪费或资源紧缺。 5 、多媒体信号处理的算法比较复杂、运算量很大,应该有特别的指令系统支持开发。 6 、指令系统与硬件系统在各个层次上紧密配合,协同开发。 2 2 面向多媒体处理的d s p 发展 面对多媒体处理的要求,除了依赖与半导体技术发展而带来的系统时钟的大幅提高外 d s p 的发展可以概括为如下几个方面。 1 、在d s p 中采用特殊单元来增强多媒体处理能力。如在传统的d s p 体系结构中通过 采用特殊功能单元来提供比特操作性能。这种方法的好处是在保持良好性能功 耗水平的情况下,提高多媒体处理能力。 2 、增强数字信号处理能力的精简指令集处理器( r i s c ) 2 3 儿4 。这种扩展主要 是基于s i m d 指令集的扩展。因为通常的r i s c 具有比较宽的数据宽度,如3 2 b i t , 6 4 b i t 。因此,一个6 4 b i t 的a l u 可以视为4 个1 6 b i t 的a l u ,同时由于通用的 r i s c 具有比较高的时钟频率,因此可以获得很好的多媒体处理的效果。但这一 切都依赖于s i m d 的应用。但同时由于传统d s p 同时具有很好的性能,功耗和价 格,在许多多媒体处理领域传统的d s p 仍然是最好的选择。 3 、并行的d s p 。即在一块芯片中集成多个d s p ,通过这种并行的处理来提供多媒体 处理的能力。此时,通常采用多指令多数据( m i 肋:m u l t i p l e i n s t r u c t i o n m u l t i p l e d a t a ) 的工作模式。 4 、采用v l i w 的d s p ( m e d i ap r o c e s s o r ) 。利用v l i w 技术,可以同时并行发射2 - 5 个指令。相对于超标量技术,v l i w 以较少的控制电路来获得了很好的效果。除 了v l i w 技术,还利用了传统d s p 具有的一些特性,如零开销循环控制等。利用 v l i w 技术,一条指令可以控制多个功能单元,从而达到了很好的媒体处理的效 果。但同时,v l i w 技术给编译器的开发提出了很高的要求,经常需要进行大量 的手工优化来产生v l i w 代码,这个问题阻碍了媒体处理器中v l i w 结构的“泛使 用。 三、m d 3 2 的设计特点及对片上存储器提出的要求 多媒体数字信号处理器m d 3 2 是一个3 2 位的多媒体数字信号处理器,主要应用于音频 视频等多媒体应用中。m d 3 2 多媒体数字信号处理器核的结构如图卜l 所示: 9 浙江大学硕士学位论文 图1 - 1m d 3 2 核结构 其主要特性如下: 3 2 位指令和数据宽度。 指令集兼容m i p s3 2 指令集同时增加了乘累加和多媒体扩展指令。 采用流水线以提高指令执行效率。 其数据通路包括整数执行单元和浮点,媒体执行单元。整数执行单元包括整数算术逻辑 单元,桶形移位寄存器,整数乘法器及整数乘加器。浮点媒体执行单元包括浮点加法 器,浮点乘法器,浮点乘加器及专用的媒体处理器,处理多媒体扩展指令的操作。 采用片上c a c h e 以提高数据吞吐量。c a c h e 结构采用指令和数据分离的哈佛结构,提高 了处理器核心和c a c h e 之间的数据带宽。 采用转移查找表( t l b ) 技术,通过虚拟地址有效的扩展了地址空间。 采用单指令流多数据流s i m d 技术有效的增强了媒体处理能力。 m d 3 2 是面向对媒体处理的3 2 位数字信号处理器,其主要设计目的是满足视频处理所需 大大数据量高带宽的要求。根据肋3 2 的设计居的和预期实现的性能,我们把k l b 3 2 对于 片上存储器的要求概括为以下三个方面。 首先,1 d 3 2 的设计目的是2 0 0 m l f z 的系统时钟,运用0 1 8 u m 的半导体工艺。因此,对 于对于存储器的第一个要求就是非常短的访问周期。根据估算,片上存储器的访问周期应 该小与2 8 n s 。 另外,由于m d 3 2 指令集的特殊性,特别是腓x 和s i m d 指令的加入,这就要求芯片上 的d s p 具有很高的带宽,需要能够同时操作宽度达6 4 b i t 的数据。 1 0 浙江大学硕士学位论文 同时,由于m d 3 2 的一个重要的指标就是低功耗。作为功率消耗主要部分的存储器也要 求菲常低的功耗水平。这对于整个片上存储器的方案选择,设计实现都是比较大的考验。 面对的技术指标和一个非常复杂的系统组成,常用的芯片设计方法是不适用的。因此, 在m d 3 2 片上存储器的设计中,我们采用软硬件协同设计的设计方法,保证了系统满足性能 要求,缩短了研究周期。 浙江大学硕士学位论文 第二节m i ) 3 2 存储系统的软硬件协同设计 一、软硬件协同设计概述 典型的数字系统包括硬件部件,以及在硬件平台上运行的软件程序。随着微电子产业 的发展,器件的工艺越来越先进,随之而来的是越来越小的器件尺寸,越来越高的集成度, 和越来越高的系统性能。但同时,系统的结构也是越来越复杂,一个系统中包含了许许多多 非常复杂的部件。因此整个系统的性能,设计和制造的成本以及可编程性能的好坏,都依 赖于系统的软件和硬件设计的好坏。因此,面临极高的设计和制造成本,以及越来越短的 t i m e t o - m a r k e t 的需要,软硬件协同设计成为人们关注的焦点。软硬件协同设计就是通 过同时设计系统中的软件和硬件部分,来满足系统的性能指标。 4 6 典型的软硬件协同设计流程如图1 2 所示。 图1 2 、典型的软厢更件协同设计流程 从图中我们可以发现,整个软硬件协同设计过程是一个不断迭代的复杂过程。整个设 计流程就是为了达到系统的性能要求。因此,作为整个软硬件协同设计过程的基础,系统 功能的设定是整个软硬件协同设计的第一步。系统功能的设定就是描述系统的功能,并且 清晰地描述抽象的行为。在系统功能的设定阶段,把系统的功能设想为一些小模块的集合, 并且要找到一些规则来把这些小的模块组合起来。这个阶段主要考虑两个方面的问题,即功 能的计算方法。其中,功能是输入,输出这两组变量之间的关系 而计算方法表示了如何从 某个特定的输入演变出相应的输出的方法。 而整个数字系统的设计的核心包括如下几个步骤 系统的建模 有效性检查 1 2 浙江大学硕士学位论文 系统的划分 软件、硬件及接口的综合 建立系统的原型并且验证系统的性能 f 面,将分别讨论这几个步骤。 l 、 系统的建模 所谓的模型就是一种规则或者方法来组合各个子系统,从而达到所需要的系统功能。系 统的建模概念化并且改进系统的性能指标,并且生成各个子模块的计算模型。所谓计算模型 就是一个表达了完成一个计算所需的所有步骤的模型,常见的计算模型包括p e t r i 网络,有 限状态机和数据流。因为计算模型和应用的特点紧密的相关,对于一个子模块,应该根据子 模块的应用特点来选择一个或者多个合适的计算模型来进行表达。对系统的建模大致有两种 方式。而每一个计算模型应该选用合适的语言或者图形语言来进行描述,如对于基于有限状 态机的同步通信应该利用状态图来描述,而寄存器传输级( r t l :r e g i s t e r t r a n s f e r l e v e l ) 级的v h d l 语言则适合于描述离散时间,基于周期的行为。其一是使用一种语言或者图形表达 来建模整个系统的各个部分,在这种方法中,软硬件划分是由设计者来完成的。另外一种方 法是对系统的各个部分用不同的语言或者图形来进行表达。当使用这种方法时,要首先完成 系统的划分,然后根据各个部件的不同性质来选择不同的语言或者图形来进行描述。在系统 建模阶段还要完成的两方面工作是:设计空间的探索,软硬件的划分,综合和优化。 2 、有效性检查 在进行了系统的建模之后,应该进行有效性检查。进行有效性检查的目的就是保证系统 的建模,从而保证最终的产品可以完成所需的功能。常用的验证方法分为,基于软件的协同 模拟( c o s i m u l a t i o n ) 以及基于硬件的仿真( e m u l a t i o n ) 。而根据系统的复杂程度,应 该选用合适的模拟器。比如,对于包含一个或者多个处理器,专用硬件和软件这样的系统, 可以用常用的仿真器或者协同仿真。而对于十分复杂多样的系统,则需要利用( 如p t o l e m y 3 6 ) 专用仿真器来进行有效性检查。 3 、系统的划分 系统的划分是一个非常重要的阶段。因为整个系统的性能好坏取决于系统的划分是否合 理。该阶段的输入是系统的功能要求,而输出包括体系结构和映射函数。体系机构包括硬件 黑盒子,软件黑盒子和联系媒介。而映射函数表示了如何将不同的系统功能映射到不同的硬 件或者软件黑盒子中去。这种映射的过程本身就是一个优化的过程,因为它决定了时序,面 积和功耗等系统的各个因素。 4 、软件、硬件及接口的综合 a 软件综合 软件综合是一个比较新的研究方向,但是计算软件综合是一个非常难的课题。对于嵌入 式计算,由于系统的限制更加严格,如没有交换设备,没有堆栈,软件综合就显得更加困难。 现在有一些很简单的综合算法,如把有限状态机翻译成简单的程序。而对于包含了并行任务 的功能要求,软件综合就比较难以进行。因为如何把这些并发的任务安排到一个线性的执行 过程中去,同时满足系统的时间限制,还是一个比较难以解决的问题。 b 硬件综合 硬件综合是当前一个发展的比较好的领域,而且也有了很多商用的工具。现在综合可以 分为三类,行为级综合即算法综合,寄存器传输级综合和逻辑综合用来生成门级的网表。硬 件综合当前要解决的就是如何达到硬件设计的重用。 3 浙江大学硕士学位论文 c 接口综合 接口的综合主要针对处理器和客户a s i c 之间的接口,自动的总线接口的产生,如p c i 总 线和v 皿总线,第三个就是传感器和与系统之间的接口的综合。 5 、建立系统的原型并且验证系统的性能 在所有前面的步骤都结束了以后,所剩下的任务就是建立系统的原型,并利用系统的原 型进行系统性能的评估,看是否能够满足设计需求。这个阶段需要解决的问题就是系统的如 何快速的原型化整个系统。 通过以上的分析,我们可以对软硬件协同设计作如下总结。软硬件协同设计就是在确 立了一个系统性能的指标后,通过一个合理地系统划分和映射,充分地利用系统中的软、硬 件资源,使得系统的功能得到一个很好的配置。从而能够在保证系统的性能情况下最小化代 价;或者在代价一定的情况下,最大化系统的性能。同时,在开发过程中利用各种仿真和验 证方法对系统的功能进行充分验证,保证每一次变换的正确性,同时对系统的性能指标进行 评估,并以此作为标准来指导开发。 可见,软硬件协同设计中最根本的几个步骤就是:a 、根据性能指标的软硬件划分;b 、 软硬件及接口的开发;c 、根据软件设计对于硬件设计进行修改,反之亦然;d 、软硬件 的协同验证和性能评估。协同设计的思想已经被应用到了一些系统存储器的开发 1 6 1 7 , m d 3 2 系统的开发也是围绕这四个问题展开的。 二、m d 3 2 中存储系统的软硬件协同设计 根据以上的分析,同时结合m d 3 2 设计目的、要求,制定_ m 1 ) 3 2 的软硬件协同设计工作 流程。该流程如图1 3 所示。 在根据软硬件划分原则进行了系统的软硬件划分之后,确定了存储系统主要包括两个 部分,即存储器的硬件部分、操作系统中的存储管理部分。另外,还需要建立软硬件协同 验证环境来进行系统的验证和性能评估。 1 、存储器的硬件设计: 首先需要考虑的是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学检验员岗前实操水平考核试卷含答案
- 灯具卫浴知识培训总结与反思课件
- 灯光元素课件
- 救护员初级考试题及答案
- 街道安全培训考试题及答案
- 滨州洗车知识培训课件
- 港澳工作业务知识培训课件
- 宜昌基金从业考试辅导及答案解析
- 难点解析-人教版八年级上册物理《声现象》专题测评试题
- 大队干部竞选演讲稿集合15篇
- 2025年贵州省贵阳市警(协警)招聘考试题库及答案
- 2025-2030中国啤酒企业海外并购案例及跨文化整合经验总结
- 2025成人高考政治真题及答案
- 2025昭通市盐津县公安局警务辅助人员招聘(14人)备考考试题库附答案解析
- 2.2运动与相互作用(第2课时二力平衡)学案-八年级科学浙教版上册
- 第一单元第二课《表现形式》课件人教版初中美术七年级上册
- 2025年纪检监察业务知识试题库及参考答案
- 国开2025年《行政领导学》形考作业1-4答案
- 盆底(肌)康复理论及技术规范考核考核试题及答案
- 2025年甘肃省辅警考试真题及答案
- 2024-2025年广东省广州市番禺中学附属学校八年级上学期数学期中考试卷(含答案)
评论
0/150
提交评论