(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf_第1页
(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf_第2页
(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf_第3页
(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf_第4页
(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf_第5页
已阅读5页,还剩81页未读 继续免费阅读

(电路与系统专业论文)数字信号处理器低功耗数据通路的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学技术人学颂j 学位论文 摘要 摘要 随着集成电路制造工艺技术和相关设计技术的进步,移动设备( 如p d a , h e a r i n ga i d s ,i m p l a n t a b l ep a c e m a k e r ,p o r t a b l em i l i t a r ye q u i p m e n t ) 和 嵌入式系统需求的增加,加上数据信号( d a t as i g n a l ) 、语音信号( s p e e c h s i g n a l ) 、图象信号( i m a g es i g n a l ) 之间本身界限的模糊( 对用户需求而言) , 具有移动计算功能、带多媒体处理终端的无线通讯设备将成为未来消费类电子 设备的主流。这样,在过去以较低数据吞吐量为特征的移动电子设备中被忽视 的功耗问题将成为未来微电子技术设计中需要考虑的一个关键的问题:随着电 路性能的提升以及电路尺寸的减小,意味着更多的功能单元要集成在芯片内部, 这样,单位面积的能量消耗变大,对电路的降温和冷却成为日益突出的问题; 随着移动多媒体终端需求的增加,移动设备的电池寿命问题日益突出。对电路 的功耗进行有效的控制和优化是比较复杂的问题,它涉及到软件、硬件的各个 方面以及电路设计的各个层次。 本文首先介绍了d s p 算法的特点以及p d s p 的结构特点。紧接着分析了集成 电路芯片中的功耗产生及组成以及影响集成电路功耗的因素。通过上面两个方 面的分析,我们从总体上知道采取什么措施可以对p d s p 进行功耗优化。为了更 有效地对p d s p 进行功耗优化,本文主要针对应用于下一代无线移动多媒体终端 中的p d s p 进行功耗优化,因此详细分析了这类p d s p 需要频繁执行的几个典型 d s p 算法的特点,包括f i r 滤波、v i t e r b i 译码、运动估计和矢量量化压缩解压 算法,提取出其中的基本操作:乘一加操作;加一比较一选择操作以及均方距 离计算操作。通过对这些基本操作的提取,采用专门的硬件单元来直接实现, 同时从算法级来利用d s p 算法本身的数据并行性,从而减少访存的次数,降低 系统的功耗,同时提高系统性能。 降低系统功耗,是一个复杂的过程,它需要在集成电路设计的不同层次不 同阶段来全盘考虑。另外,对系统进行功耗优化的过程是一个同时需要在系统 性能、芯片面积间进行有效折中的过程。因此,要有效地对p d s p 进行功耗优化, 除了进行算法级和结构级的功耗优化之外,还要从电路级来进行功耗优化。所 以,紧接着,文章对p d s p 中m a c 单元进行了功耗优化分析,包括部分积的产生 单元,部分积相加的单元,以及最后结果的获得,另外还讨论了m a c 单元的并 中国科学技术大学硕士学位论文 摘要 行溢出检测及饱和操作的低功耗实现问题。文章最后讨论了a l u 、a a l u 单元中 通过门控时钟来降低功耗的问题,以及诱导噪声、地线反弹的抑制。 文章最后是总结和今后还需要做的工作以及参考文献。 关键词:乘加操作;加一比较一选择操作;均方距离计算;低功耗;p d s p 中国科学技术大学硕士学位论文摘要 a b s t r a c t w i t ht h ed e v e l o p m e n to ft h et e c h n o l o g ya n dt h e d e s i g no ft h ei n t e g r a t e d c i r c u i t ,t h ed e m a n d f o rt h ep o r t a b l ea p p l i c a t i o n sa n de m b e d d e d s y s t e ms u c ha s t h ep e r s o n a ld i g i t a l a s s i s t a n t ,h e a r i n ga i d s ,i m p l a n t a b l ep a c e m a k e r , p o r t a b l e m i l i t a r ye q u i p m e n t ,a n ds oo ni si n c r e a s i n g i na d d i t i o n ,f o ru s e r , t h ed i f f e r e n c e b e t w e e nt h ed a t a s i g n a l ,t h es p e e c hs i g n a la n d t h ei m a g e s i g n a l i sb l u r r e d t h e r e f o r e ,t h em o b i l et e l e p h o n et h a tc a nd e a lw i t ht h ea u d i o ,v i d e oa n d m u l t i m e d i as i g n a lj sg o i n gt ob et h em a i n s t r e a mo ft h ec o n s u m e re l e c t r o n i c s s o t h ec o s to f c o o l i n g a n d p a c k a g i n g i n c r e a s ed r a m a t i c a l l ya sar e s u l tf r o mt h e i n c r e a s eo f p e r f o r m a n c ea n d t h ed e c r e a s eo ft h ef e a t u r es i z eo f t h ei n t e g r a t e d c i r c u i t f i n a l l y , t h eb a t t e r yl i f eo ft h e s ek i n d so fd e v i c e sb e c o m e st h ek e yf o c u so f t h ec o n s u m e r s ot h ec r i t i c a lp r o b l e mi st od e c r e a s et h ep o w e ro ft h ep o r t a b l e d e v i c ed u r i n g d e s i g n i n g t h e s ek i n d so f h i g hp e r f o r m a n c ei n t e g r a t e d c i r c u i t a n d i ti sn e c e s s a r yt od e c r e a s et h ep o w e ra ta l ll e v e l so ft h ea b s t r a c t i o nf r o ms y s t e m l e v e lt oc i r c u i tl e v e l i ti st h em o s te f f e c t i v em e a n st od e c r e a s et h ep o w e ra tt h es y s t e ml e v e lo fa l l m e a n s i no r d e rt od os 0 i ti si m p e r a t i v et of a m i l i a rw i t ht h ec h a r a c t e r i s t i c so f d i g i t a ls i g n a lp r o c e s s i n ga l g o r i t h ma n d t h es t r u c t u r eo ft h ep r o g r a m m a b l e d i g i t a l s i g n a lp r o c e s s o r i na d d i t i o n w e m u s tt e a r na b o u tw h a ti st h ep o w e r , w h e r ei ti s f r o ma n dh o wt od e c r e a s ei t h a v i n gt h ek n o w l e d g e ,w ec a nd e c r e a s et h ep o w e r i np r i n e i p l e i no r d e rt od e c e a s et h ep o w e rm o r ee f f e c t i v e l y ,o u rr e s e a r c hi so n l y f o e u so nt h ep o w e ro f t h en e x tg e n e r a t i o np d s p t h a ti sa p p f i e di nt h ew i r e l e s s m u l t i m e d i at e r m i n a t i o n s o ,w ef i r s ta n a l y z et h ef e a t u r e so fs o m er e p r e s e n t a t i v e d s p s a l g o r i t h mi n c l u d i n gf i r ,v i t e r b id e c o d i n g ,m o t i o ne s t i m a t i o na n d v e c t o r q u a n t i z a t i o n b yd o i n g s o w eo b t a i nt h r e e b a s i c o p e r a t i o n s :m u l t i p l y a c c u m u l a t e o p e r a t i o n ,a d d - c o m p a r e - s e l e c to p e r a t i o n a n dm e a n s q u a r ed i s t a n c ec o m p u t i n g o p e r a t i o n i m p l e m e n t i n g t h e s eb a s i c o p e r a t i o n sd i r e c t l yb yu s i n g t h eh a r d w a r e , w ec a nn o t o n l yd e c r e a s et h ep o w e r b u ta l s oi n c r e a s et h ep e r f o r m a n c eo f t h e s e p d s p d e c r e a s i n g t h ep o w e ro ft h es y s t e mi sac o m p l i c a t e dp r o c e s s a n di ti s i m p e r a t i v et od e c r e a s et h ep o w e r a ta l l l e v e l sd u r i n gt h ec i r c u i td e s i g n w h a t s m o r e i ti sad i l e m m ab e t w e e nt h ep o w e r 。p e r f o r m a n c ea n dt h ed i es i z eo ft h e c i r c u i t t h e r e f o r e w eo p t i m i z et h ep o w e ro ft h em a cu n i ta tt h ec i r c u i tl e v e l t h a ti st h em o s ti m p o r t a n tu n i ti nt h ep d s p d u r i n gt h eo p t i m i z a t i o n ,w em a i n l y f o c u so nt h ep o w e r o p t i m i z a t i o no fp a r t i a lp r o d u c t i o ns t a g e ,t h es t a g eo f t h e d e c r e a s eo f p a r t i a lp r o d u c t a n dt h ef i n a lr e s u l tp r o d u c t i o ns t a g e ,t h ep a r a l l e l o v e r f l o wc h e c k i n g s t a g ea n ds a t u r a t i o nu n i t ss t a g e f i n a l l y , w eo p t i m i z et h e p o w e r o ft h ea l u a a l u ( a d d r e s sa l u ) b y u s i n gt h eg a t e d c l o c kt e c h n i q u e m e a n w h i l e ,w e a l s od e a lw i t ht h ei n d u c t i v en o i s ea n dg r o u n db o u n c ep r o b l e m d u r i n gu s i n gt h eg a t e dc l o c kt e c h n i q u e k e yw o r d s :m a c ,a c s ,m e a n - s q u a r e - d i s t a n c e ,l o w p o w e r ,p d s p 中国科学技术大学硕士学位论文第一章综述 第一章综述 对低功耗的研究最早可以追溯到上世纪6 0 年代中期,当时c m o s 晶体管电 路才刚刚开始取代b i p o r l a r ,n m o s 晶体管用在诸如数字表这样简单的产品上 面,而且工作频率一般都很低的场合( 几十k h z ) 。当时,斯坦福大学的教授m e i n d l 曾经证明:未来的c m o s 电路可以在2 0 0 m y 的供电电压下工作,消耗n w 级的功 耗。不过,人们仅仅把研究人员为达到这一目标所做的各种努力认为纯粹是出 于一种好奇。直到上世纪9 0 年代,随着集成电路工艺的不断进步,集成电路设 计逐渐进入深亚微米范围以内,功耗问题才逐渐成为集成电路研究的热点问题, 也是迫切需要解决的问题。目前,随着集成电路工艺的进步,芯片线宽的减小, 集成度的不断增加,芯片工作频率的增加( 如图1 1 所示) ,使得芯片消耗的功 耗越来越大( 如图1 ,2 所示) ( 大于5 0 w 。3 ) ;如此大的功耗开销带来了一系列的 问题:封装及散热问题,供电问题。特别是消费电子,他们不但要求具有较强 的计算性能( 如音频编解码,视频编解码) ,同时还要求具有较低的功耗开销。 实际上,象移动电话这类消费电子,市场对它的一个衡量标准就是它的待机时 间和通话时间的长短。另一方面,随着嵌入式应用需求的增加,便携式设备会 第一次出现时间 1 9 9 51 9 9 82 0 0 12 0 0 42 0 0 72 0 1 0 d r a m ( b i t s c h i p ) 6 4 m2 5 6 m1 g4 g1 6 g6 4 g d r a m 面n ( m m 2 ) 1 9 02 8 04 2 06 4 09 6 01 4 0 0 “p 中的管子数1 2 m2 8 m6 4 m1 5 0 m3 5 0 m8 0 0 m 芯片面积( m m 2 ) 2 5 03 0 03 6 04 3 05 2 06 2 0 光波长( 2 m ) o3 50 2 5o 1 80 1 30 1o 0 7 沟道长度( m )02 80 201 40 1( 0 1 0 氧化层厚度( m ) 7 1 24 64 - 54 5 4 供电电压( v ) 3 32 51 81 51 21 时钟频率( m h z ) 1 5 0 3 0 02 0 0 4 5 03 0 0 6 0 04 0 0 8 0 05 0 0 1 0 0 06 2 5 11 0 0 图1 1 半导体进展图 越来越多。特别是集高速a d ,d a ,d s p ( d i g i t a ls i g n a lp r o c e s s i n g ) 核, 中国科学技术大学硕士学位论文第一章综述 c p u ( c e n t r a lp r o c e s s i n gu n i t ) 核,r f ( r a d i 0f r e q u e n c y ) 模块于一身的s o c ( s y s t e mo nc h i p ) 芯片的出现,使得电路设计人员和系统设计人员必须尽一 切可能的延长电池寿命,因此,芯片的功耗问题已经成为集成电路设计中亟待 解决的问题。 上世纪8 0 年代,p c 曾经是半导体行业的驱动力,那时候集成电路设计的主 要目标就是提高系统的计算性能,同时尽量增大s r a m ,d r a m 的容量;现在基于 流处理的音频和视频处理使得i n t e r n e t 成为半导体行业的驱动力;未来一段时 间,p d s p 会逐渐成为半导体行业的驱动力。如过去很长一段时间,i n t e l 一直 忽视了p d s p 市场,现在它也加入到p d s p 的竞争阵营当中。p d s p ( p r o g r a m m a b l e d i g i t a ls i g n a lp r o c e s s o r ) 自上世纪8 0 年代出现以来,它的应用领域逐渐扩 大:从多媒体信号处理,通信信号处理到工业控制等等。p d s p 总是以它独有的 两重身份发挥着它独有的两重作用:它本身是个可编程的通用处理器,可以 做一些简单的控制:另外,它又是专门面向信号处理这类计算量要求较大的专 用处理器芯片,因此,为了解决这种大量的计算任务,它总是集成一些专用的 处理单元,采用专用的架构和一些专用的指令。 】不同处理器功耗对比 i 1 9 8 11 9 8 21 9 8 31 9 8 41 9 8 51 9 8 61 9 8 71 9 8 81 9 8 91 9 9 01 9 9 i1 9 9 21 9 9 31 9 9 41 9 9 51 9 9 6 时间( 单位年) 图1 2 不同处理器功耗对比情况。3 p d s p 主要面向嵌入式d s p 应用。因此,除了对它有性能的要求:如较高的 卧拍蚰;穹坫坫如0 0 譬。掣井)耀胃 中国科学技术人学硕士学位论文第一章综述 处理精度,较小的延迟( l a t e n c y ) ( 满足实时性要求) ,较大的数据吞吐量之外, 还对它的功耗提出了要求。而且,随着嵌入式应用的普及,对p d s p 的功耗要求 将变得更加严格更加苛刻。目前为止,大多的p d s p 不论是传统的c i s c ( c o m p l e x i n s t r u c t i o ns e tc o m p u t e r ) 型p d s p 、r i s c ( r e d u c e di n s t r u c t i o ns e tc o m p u t e r ) 型p d s p 、还是为了尽量提高系统指令级并行的v l i w ( v e r yl o n gi n s t r u e t i o n w o r d ) 、s u p e r s c a l a r 型p d s p ,他们的首要目的都是尽量提高系统的性能,以对 p d s p 的实时输入作出实时的响应。因此,在提高p d s p 性能的同时尽量降低它的 功耗是目前迫切需要解决的问题。图1 3 是a n a l o gd e v i c e s 公司一款适合嵌入 式音频,视频和通信应用的p d s p :a d s p b f 5 3 3 ( 适合工作于5 0 0 m h z 6 0 0 m h z ) 的 功耗图。由图可以看出,在正常情况下,该p d s p 消耗的功耗在2 0 0 m w 3 0 0 m w 之间,已远远超出了嵌入式应用对功耗的要求: m ) 位。根据对余下部 分数值的修改规则的不同,通常有两种舍入操作:无偏舍入和有偏舍入。 1 1 无偏舍入( u n b i a s e dr o u n d i n g o r c o n v e r g e n tr o u n d in g ) 采用这种方法进行舍入操作,在舍入操作的时候返回与原数最靠近的数。 当原数正好位于两个数中间的时候,返回与它最接近的偶数。例如,用3 位2 进制补码表示的0 2 5 。( 二进制表示为0 0 1 。) ,通过无偏舍入表示成2 位的2 进 制补码为0 0 。( 而不是0 1 2 ) 。因为按上面的规则,0 2 5 。( 0 0 1 。) 正好位于0 5 - 。 ( 0 ix ) 和0 。( o 0 2 ) 的中间。因此表示成0 0 2 及0 。 1 2 有偏舍入( b ia s e dr o u n d ;n go rr o u n d t o n e a r e s t ) 采用这种规则进行舍入操作的时候,它也是返回与原数最靠近的数。但是 当原数正好位于两个数中间的时候,这种方法返回与它最接近的并且是较大的 那个数。例如,用3 位2 进制补码表示的o 2 5 :。( 二进制表示为0 o l z ) ,当通过 有偏舍入法表示成2 位的2 进制补码的时候为o 12 而不是0 o :,因为按上面的 规则,o 2 5 。正好位于0 5 , o 和0 。的中间。因此表示成o 1z 即o 5 m 2 饱和操作( s a t u r a t in g ) 中国科学技术大学硕士学位论文第二章p d s p 的结构 现有p d s p 主要有两种形式:定点和浮点。生活中,我们习惯于采用浮点数 的形式来表示我们所用到的数据,因此用户在使用浮点p d s p 的时候是不必去实 时关心计算结果的溢出情况的,但是浮点p d s p 有成本较高,运算速度比定点p d s p 慢至少5 0 的缺点 2 。而p d s p 多是应用在对硬件成本、性能、功耗要求都比 较苛刻的场合。因此,实际的应用中,用户多采用定点p d s p ,相应地,在使用 的时候用户就必须实时地去关心计算结果的溢出情况。关于溢出,通常有以下 几种措施: 忽视溢出情况即所谓的模运算: 通过标志位,计算过程中,当发生了至少一次溢出之后就置位该标志位; 执行软件陷阱操作; 对计算的结果进行规格化操作( 放大或者缩小) ; 为避免把乘积结果加到累加器上产生溢出,有的处理器在乘积寄存器后 面加一个移位寄存器,这样,当要把结果加到累加器之前就对上面产生 的乘积进行移位( 放大或者缩小) ,然后再送到a l u 和累加器,如图2 8 所示。 数据总线( 1 6 ) 图2 8t m s 3 2 0 c 2 5 的简化数据通路图“5 中国科学技术大学硕士学位论文第二章p d s p 的结构 采用具有更高运算精度位的处理单元; 现有的p d s p 中,都在a l u 和m a c 功能单元中增加几位保护位,允许用户 连续地执行多次操作,而不会产生溢出。图2 9 是a t & t 的d s p l 6 和d s p l 6 a 的简化数据通路图。它的a l u ,a o ,a 1 累加器都采用3 6 位,也就是说它多 增加了4 位的保护位,这样就允许用户连续的执行2 4 一l = 1 5 次运算而不 会产生溢出。 y 数据总线 图2 9a t t 的d s p l 6 和d s p l 6 a 的简化数据通路“ 始终把计算的结果限制在一定的范围之内,当计算结果超出了这个范围 的时候,就把结果置成某个极限值,通常是正的最大值或者负的最小值, 及采用所谓的饱和算术逻辑。 中国科学技术大学硕士学位论文 第三章低功耗 第三章低功耗 本章首先介绍了深亚微米范围内集成电路设计面临的问题:即集成电路设 计从原来单纯地在面积和速度二维平面中的折中问题转换成了在速度、面积、 功耗组成的三维空间上的折中问题,阐述了对集成电路进行功耗优化的必要性。 然后详细讨论了集成电路芯片中功耗的组成及其影响因素,讲述了这些因素如 何产生,怎么来影响集成电路芯片的功耗,同时也间接地说明了要对芯片进行 功耗优化可以采取的措施。最后简要的比较了各类不同处理器的功耗与性能, 以及同一个处理器执行不同操作所消耗的功耗大小。这些比较和阐述将为后面 根据不同d s p 算法提出高效的低功耗结构提供理论指导,也是本文进行低功耗 结构设计的理论依据和主要思想。 3 1 深亚微米范围内集成电路设计面临的问题 随着嵌入式设备需求的增加,功耗已经越来越成为集成电路设计中需要考 虑的问题。要降低系统功耗具有很大的挑战性,因为功耗往往与系统的性能、 图3 1芯片设计中的折中考虑 中国科学技术火学硕上学位论文第三章低功耗 面积有关,进而与系统的成本有关。通常,降低系统的功耗,要么造成系统性 能的降低,要么使得芯片的面积增加,或者同时使系统性能下降,面积也增加。 要降低系统的功耗需要在设计的不同级别来综合考虑,同时还要在各个限制条 件问进行有效折中。图3 1 描述的是深亚微米范围内芯片设计中如何在速度、 面积、功耗间进行有效折中的问题。 正如上图描述的那样,对系统进行功耗优化,需要同时在速度、面积间进 行有效折中,这本身已经具有很大的挑战性,因此,如果要对数据通路进行功 耗优化则更是一件很困难的事情,因为数据通路里边有各种不同类型的电路单 元,这些电路单元具有各种不规则的结构,各个单元间及单元内部有各种不同 的复杂连线。也正因为如此,探索p d s p 中数据通路单元的低功耗设计方法也就 变得很有必要,也非常有意义。为了弄清楚芯片中的功耗,即芯片中的功耗是 如何产生的,都有哪几部分组成,各个部分的功耗都与什么参数有关,以及通 过什么方法可以降低芯片中的功耗等等,为此,下面先来讨论一下芯片中与功 耗有关的问题。 3 2 集成电路中芯片的功耗 i c ( i n t e g r a t e dc i r c u i t ) 芯片中的功耗通常可以分成两个部分:动态功耗 和静态功耗。这里所谓的静态功耗和动态功耗是说这部分的功耗与i c 芯片的工 作频率是否有关。动态功耗与i c 芯片的工作频率有关,静态功耗与i c 芯片的 工作频率无关。 3 2 1 静态功耗 按平均功耗的定义,静态功耗是供电电压与静态电流的乘积。其中静态电 流又分成两个部分:漏电流,。和静态偏置电流,。漏电流是m o s 管的寄生 电流,它又由两部分组成:二极管电流( d i o d ec u r r e n t ) 和低于电压阈值时流 过m o s 管的电流( s u b t h r e s h o l dc u r r e n t ) 。他们的产生原理分析如下。为讨论 方便,下面以一个反相器为例来介绍,图3 2 ( a ) 是反相器的电路原理图,图 3 2 ( b ) 是理想情况下反相器的传输特性曲线。 中国科学技术人学硕士学位论文第三章低功耗 理想条件下,处于稳态的p m o s 管和n m o s 管是不会同时导通的,因此流过 p m o s 和n m o s 管的电流为零,反相器的静态功耗为零。然而,由于寄生效应,总 会有漏电流流过介于源极和漏极及衬底间反向偏置的p n 结,如图3 2 ( a ) 中虚 线箭头所示。在室温条件下,这个电流约为0 1 n a o 5 h a ,对于1 微米工艺的 器件,功耗约为0 5 m w 。因此,通常情况下,这部分功耗可以忽略。另外,理 想情况下,当输入电平低于阈值电压的时候,m o s 管的源极和漏极问是没有电流 的,但是,实际上,即使输入电压低于阈值电压,在m o s 管的源极和漏极之间 也会有电流流过( 如图3 2 ( a ) 中虚线箭头所示) 。特别的,m o s 管的阈值电压 越接近o v 电压的时候,这种漏电流会越大,这部分功耗可以表示为: p = i l 。t v d d ( 3 - - 1 ) 由于漏电流本身很小,因此,除非在电池供电的系统中需要考虑以外,通常都 把这部分电流消耗的功耗忽略。 对于静态偏置电流,。引起的功耗,通常情况下也很小,因此这部分电流引 起的静态功耗也常常忽略,这部分电流引起的功耗可以表示为: p = i d ( ,v ( 3 2 ) 3 2 2 动态功耗 动态功耗占i c 芯片功耗的绝大部分,它也由两部分组成:p m o s 管和n m o s 管同时导通时短路电流产生的功耗;p m o s 管和n m o s 管驱动后级负载等效电容产 生的功耗。 1 驱动负载电容消耗的功耗 这部分功耗占了c m o s 电路功耗的9 0 。如图3 3 ( a ) 所示,在反相器 工作的过程中,当p m o s 管导通的时候,它会对负载有效等容c 一充电,理想情 况下从o v 一直冲到v 当n m o s 管导通的时候,它又会对负载有效电容c 一放 电,一直放到地电平为止。因此,这部分动态功耗不仅与负载有效电容的大小 有关,还与电路工作的频率有关。由于计算的时候是计算负载的有效电容,因 此所有节点的有效电容可以粗略地按下式计算: 中国科学技术大学硕士学位论文第三章低功耗 c w = 口h c 。( 3 3 ) 江1 其中a ,是每个节点的开关概率,c 。是每个节点的负载等效电容a 由于部 ( a ) 反相嚣电路原理图( b ) 反相器的电压传输特性曲线 图3 2反相器电路原理图及其电压传输特性曲线 分功耗既与负载的等效电容有关,也与电路的工作频率有关。因此这部分的功 耗可以表示成: “ ,= c 。矿帆矿。= 口。g ,矿。矿d d ( 3 4 1 ) i = l 矿。为电压摆幅,通常情况下等于矿。,则有; 尹:c 。矿d d 2 :i v 岔。c i ,矿( 3 4 2 ) 2 。短路电流消耗的功耗 理想情况下,信号的上升时间和下降时间都为零,而实际电路中,上升时 间和下降时间都不为零( 如图3 3 ( b ) 所示) 。因此当反相嚣的p m o s 管和n m o s 管进行切换的时候,会有一段很短的时间,在这段时间内,存在着从电源到地 的通路,因此电流会从电源流向地,消耗功耗,如图3 3 ( a ) 中虚线箭头所示。 这部分动态功耗可以简单表示为: 尸= j 跎f s c 矿。f ( 3 5 ) 其中,。为短路平均电流,a t 。为短路导通时间。 2 r 中国科学技术大学硕士学位论文第三章低功耗 ( a ) 反相器对负载电容的冲放电过程( b ) 反相器的短路电流 图3 3反相器的动态功耗图 综上所述,一颗i c 芯片中的总功耗可以表示为: 尸:( 1 p c + ,。) y d d + ( 羔口c 。矿概+ 瓦f 。) 矿。厂 ( 3 6 ) 静态功耗动态功耗 如前所述,在功耗的表达式中,由于p = ac l 4 y 。,。y8 ,f :皂j c l j v 2 d 项占了总功耗的9 0 ,因此,目前所有的功耗优化基本都围绕它来进行。从上 式可以看出,动态功耗与电路中每个节点的开关概率口,、电路的工作频率,、 负载的等效电容c 。都成线性关系,而与芯片的供电电压成平方关系。因此, 仅仅从降低功耗的角度来看,降低芯片的供电电压对芯片的功耗改善情况最为 明显。 3 3 延迟 目前的工艺条件下,电路中信号的延迟主要是由电路中的各种电容引起的, 要计算由电容引起的延迟就需要计算电容的冲放电时间。根据电路理论,由电 容引起的延迟时间可以计算如下“1 : 中国科学技术大学硕士学位论文 第三章低功耗 扩c 毫高c 。州 其中f ( v ) 为电容的充( 放) 电电流;v 、v :为电容上电压的初始值和终值。由 于电流i ( v ) 是电压v 的非线性函数,因此上式的计算将变得非常复杂。为了简化 计算,我们可以用平均电流来计算,则上式可以简化成: t p = c c 訾( 3 - - 8 ) 需要注意的是,这里所说的延迟是指输出电压从初值到达输出幅值5 0 处所需 要的时间。因此有: 扩三( 。) = 瓦c l 瓦1 + i 1 ) ( 3 - 9 ) 其中k 。,j i 。分别为p m o s 管和n m o s 管的增益系数。 3 4 功耗延迟积 功耗和延迟并不是相互独立的,当然他们之间的这种复杂关系也并不是说 在降低功耗的时候就必然会使电路的延迟增加,尽管如此,有一点是很重要的: 就是我们不能无视电路延迟的增加而努力降低电路的功耗。因此,降低系统功 耗的问题通常都是在功耗和延迟间进行折中的问题。从上面功耗和延迟的两个 表达式可以看出,虽然功耗( 这里主要指动态功耗,而且特指由于对负载电容 n 充放电所产生的动态功耗及p = 口,c 。v 部分) 与电压成平方关系,但是, = l 延迟却与电压成反比关系,因此功耗延迟积p d p ( p o w e rd e l a yp r o d u c t ) 却与 电压成正比关系。所以,在保持性能不变的同时降低功耗,仅仅用降低电压的 方法同减小负载电容、降低负载电容的开关概率效果是等效的。其次,需要特 别注意的是芯片的供电电压不能无限的降低,供电电压的最低值受到m o s 管门 限电压值的限制。另外,从上面p d p 的关系式还可以看出,要保持性能不变, 降低功耗是不能简单地通过降低频率来实现的,因此,当要通过降低系统频率 来降低系统功耗的时候通常是借助于并行执行的机制,通过增加并行执行的功 中国科学技术大学硕卜学位论文第三章低功耗 能单元来提升系统的性能,进而降低系统工作的频率,从而降低系统的功耗, 毫无疑问,通过这样的方式来降低系统功耗,必然使芯片的面积增加。另外, 还可以通过流水线的思想来提高系统的并行性,从而补偿因降低功耗造成的系 统性能下降。 3 5 功耗优化 从上面集成电路芯片中功耗的分析可以看出,影响集成电路功耗的因素是 多方面的,因此要对集成电路芯片的功耗进行优化,可以从不同的方面不同角 度来进行。与此相对应,对芯片中功耗模型的建立与功耗估计也应该在设计的 多个层次来进行。”e 3 4 o 更为重要的是,从不同的方面不同的层次来对电路进行 功耗优化,其效果是不一样的。一般来讲,在较高级别来进行功耗优化,效果 更加明显。考虑到p d s p 主要是执行d s p 算法,因此可以从算法级来仔细分析各 个算法的特点,通过优化选择和安排机器指令,尽量减少访存的次数,进而降低 功耗。因此,可以针对特殊的任务,尽量采用专用的硬件模块,而不是采用软 件执行指令的办法通过p d s p 来实现,因为用执行p d s p 指令来实现的时候存在 取指、译码、执行、取数、存数等步骤,消耗的功耗比用专用的模块来直接实 现的功耗要大。另外,要充分利用系统的资源,增加算法的并行性,这样可以 降低供电电压、降低工作的频率,从而降低系统功耗,同时还能保持性能不受 影响;另外,在减少访存次数方面,还可以对存储器本身的结构进行合理的安 排,使得存储器尽量地靠近处理器核,即尽量用寄存器、片内r a m 、迫不得已的 时候才使用外r a m ;在电路级,要尽量减小负载等效电容,这可以通过使用大量 的门控时钟方法来获得,在使用门控时钟的时候,还有一点是需要特别注意的: 要尽量避免地线反弹效应的出现以及传导噪声的存在。 3 6 各类处理器的功耗对比 从第二章的描述可以知道,执行d s p 算法的处理器可以有多种,显然,完 成同样的功篚,每一种处理器的性能和功耗是不一样的,图3 4 是不同类型的 处理器可编程性与功耗的一个对比图,从图可以看出,尽管p d s p 是专门为执行 中国科学技术大学硕士学位论文 第三章低功耗 图3 4 各类处理器对比图 d s p 算法而设计,但是它的功耗开销也是很大的。因此,如果不是特别的必须, 从功耗的角度来讲,应该多用面向特殊应用或者特殊领域的处理器来实现,或 图3 。5 不同单元操作的功耗对比 者说,应该尽量利用各种d s p 算法的特点,相应地配置一些专用的硬牛单元, 这一点会在后面的讨论中详细叙述。更应该注意的是,就是同一个处理器,执 行不同的指令和操作。所消耗的功耗也是不一样的,圈3 5 就是同一个处理器 中国科学技术大学硕士学位论文第三章低功耗 耗明显比执行一次访问存储器操作的功耗要小得多,这就给我们一个启示:在 执行d s p 算法的时候应该尽量减少访问存储器的次数,或者说尽量采用片内的存 储器。因此,综合上面两点,在执行一个特殊的d s p 算法的时候,要根据不同的 性能要求,选择不同结构、不同指令集的处理器方案来实现。同样,在设计这 类处理器的时候,更是要根据各种不同的性能要求,采用最优的指令集来实现。 中国科学技术大学硕士学位论文第四章d s p 算法的特点及对应的低功耗结构 第四章d s p 算法的特点及对应的低功耗结构 4 1 综述 随着便携式设备需求的增加,例如在第三代移动通信终端、p d a ,m p 3 播放器 等设备中需要处理大量的音频和视频信息;另一方面,由于便携式设备对电池 寿命比较敏感,因此用于这些便携式设备中的p d s p 不但要具有较强的处理能力, 同时还要具有较低的功耗,考虑到这类消费设备对成本的敏感性,所以用于大 型系统上的并行多处理器设计方案就不能用于这类便携式终端上。现有的p d s p 虽然性能已经有了相当的改善,功耗也已经在原有的基础上降了很多,但是它 们的性能与功耗仍然不能满足各类便携式多媒体终端设备的要求。其次,这类 p d s p 都是执行音频、视频、通信领域中的特殊算法,而这些算法是有一些共同 特点的。因此,本章首先详细分析了音频、视频以及通信应用中几类计算量要 求较大的算法特点,通过对这些算法的分析,使我们可以探索出一些数据级、 指令级上的并行性,这些并行性就是我们进行低功耗p d s p 结构设计的依据,也 是我们进行低功耗数据通路设计的理论指导。利用这些并行性,我们提出了一 些高效、低功耗的数据通路结构和数据通路单元的设计,这些结构的提出,一 方面可以提高系统的性能,另一方面又可以减少对中间结果的存取,从而减少 了访存的次数,降低了系统的功耗。 本章首先以f i r 滤波算法为例,详细地讨论了这类算法如f i r 滤波、i i r 滤波、 f f t ( i f f t ) 变换、d c t ( i d c t ) 变换的特点,提取出了这类算法中大量用到的乘 法一累加一溢出检测基本操作。针对这些算法的特点,提出了采用多拍计算并 行进行的结构,采用这种结构,每取一次滤波系数和采样值可以为多拍计算所 共用,不但提高系统的并行性,而且减少了访存的次数,降低了系统的功耗; 紧接着讨论了通信终端中用得最为广泛的v i t e r b i 译码算法,提取出了v i t e r b i 译码中的t r e l l i sb u t t e r f l y 基本单元,并给出了在进行v i t e r b i 译码操作的时 候如果能以这个t r e l l i sb u t t e r f l y 为基本运算单元,即每完成一个t r e l l i s b u t t e r f l y 的所有计算才进行一次数据的访存操作,不但可以提高系统的数据吞 中国科学技术大学硕上学位论文第四章d s p 算法的特点及对应的低功耗结构 吐率,还可以减少访存的次数,降低功耗;其次分析了视频编码中运算量巨大 的运动估计算法,音频及视频编码中应用广泛的矢量量化压缩解压算法,从这 两个算法,提取出了其中共用的基本操作均方距离的计算。最后,从上面 几类算法的分析可以知道,这些算法中共用单元的设计最后可以归结为乘法器、 加法器、溢出检测、饱和操作等子单元的设计,这个总结即为下一章对乘法器、 加法器、溢出检测、饱和操作单元进行功耗优化的必要性总结。 4 2f l r 、i i r 、f f t 、d o t 算法的共同特点 数字信号处理中特别是f i r 滤波、i i r 滤波、f f t 变换、d c t 变换中都会大 量用到先乘后加的操作: z = y + x + h ( 4 1 ) 而且这类操作往往都需要频繁的执行,因此p d s p 中执行先乘后加操作速度的快 慢成了决定p d s p 速度的一个重要因素,同时执行这个操作所产生的功耗的大小 也直接影响着整个p d s p 系统的功耗。事实上,通用处理器和p d s p 执行某项操 作如上面的乘加操作的过程,都可以再细分成:取指令:译码;取数;执行: 存数等子过程。从图3 5 知道,执行一次乘法和加法操作所产生的功耗远远低 于执行一次存储器访问操作所产生的功耗。因此,p d s p 中存储器组织结构的优 劣,内、外部总线配置的合理与否就直接影响着整个p d s p 系统的功耗情况。尽 管在第一代p d s p 如t m s 3 2 0 1 0 中,已经把y 和z 映射到同一个累加器,x 和h 都 来自数据存储器,但是由于内部只有条数据总线,因此在执行的时候仍然要 两次从数据存储器取数,显然,这样的操作不但执行速度很慢,而且功耗开销 也很大;在第二代p d s p 如t m s3 2 0 c 2 5 中,为了提高系统的性能,改善以上操 作需要分两次从数据存储器取数的缺点,把程序存储器也同时映射成数据存储 器,这样就可以把一个数存在数据存储器中,把另一个数存在程序存储器中, 因此执行上面的乘加操作就可以一次同时取出两个操作数,提高了系统的速度。 遗憾的是,通过这样的改进,系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论