




已阅读5页,还剩57页未读, 继续免费阅读
(计算机系统结构专业论文)低功耗嵌入式系统的性能与功耗研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明 并表示了谢意。 作者签名:越 论文使用授权声明 日期:7 ,f 吩 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内 容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名: 商氖 导师签名:日期:w 呵 仁 摘要 近年来,处理器的性能依然遵循摩尔定律不断提高,功耗也随之增加。各类 便携智能终端和移动通讯设备迅速普及,人们对移动计算的要求越来越高。这些 移动计算设备通常采用电池作为重要的电力来源,而电池技术近年来没有重大突 破。如何降低功耗,以便在有限的体积、重量等设计约束下,实现移动计算设备 高性能,长使用时间的设计目标,成为众多系统设计者研究的重点。 本文对嵌入式系统的功耗和性能进行了综合研究,首先对嵌入式系统的功耗 问题进行了介绍;然后介绍了功耗的基本知识,对目前国内外对功耗问题的研究 现状按照逻辑设计级,架构设计级和操作系统级进行分析和概括;进而在体系架 构层次,提出了一种基于高频值的可重构数据c a c h e 设计,一方面对数据局部性 进行优化,一方面对高频值数据进行优化,以实现性能和功耗的平衡,并在模拟 器上进行了实现和验证;在操作系统层次,在x s c a l e 的电源管理系统的基础上, 进行了分析,对其动态电源管理算法提出了内存访问模型,动态采样等改进;最 后总结全文,对嵌入式系统的功耗和性能研究进行总结和展望。 关键字:低功耗、可重构、高频值、数据c a c h e 、动态电源管理、内存访问模型 中图分类号:t p 3 1 6 ;t p 3 6 复q 大学硕上学位论文 a b s t r a c t i nt h er e c e n tp a s t , m i c r op r o c e s s o r ss p e e ds t i l ld o u b l e se v e r yo n ea n dh a l fy e a r , f o l l o w i n gt h em o o rl a w m e a n w h i l e ,t h ep r o c e s s o r sp o w e ro o m s u 【p t i o ne m e r g e s m o r ea n dm o r ep o r t a b l es m a r td e v i c ea n dm o b i l ec o m m u n i c a t i o np r o d u c t sa r r i v ei n m a r k e t t h em o b i l ec o m p u t a t i o ne n t e r sas p r e a d i n gp e r i o d m o b i l ed e v i c eu s u a l l y u s e sb a t t e r ya si t sp o w e rs u p p l i e r b u tb a t t e r yt e c h n o l o g yd o e sn o tb r e a kt h r o u g hs o q u i c kl i k es e m i c o n d u c t o r s op o w e rc o n s u m p t i o nb e c o m e s am a j o rf a c t o rt h a tl i m i t s t h ep e r f o r m a n c eo fc o m p u t e r s ,e s p e c i a l l yt h ee m b e d d e ds y s t e m s t h u s ,h o wt o i m p l e m e n te f f e c t i v el o w e r - p o w e re m b e d d e ds y s t e m sh a sb e c o m eah o ta n dd i f f i c u l t p r o b l e mw h i c hm a n ys y s t e md e s i g n e r sa r et r y i n gt or e s o v l e t h er e s to f t h i st h e s i si so r g a n i z e da sf o l l o w s f i r s t , w eg i v eab r o a do v e r v i e wo f t h e c h a l l e n g e sf r o mp o w e rp r o b l e m s a n dt h el o w e r - p o w e r d e s i g n e v a l u a t i o n t e c h n i q u e s s e c o n d , w ei n 仃o d u c eo fs o m eb a s i ck n o w l e d g e so fp o w e rc o n s u m p t i o n , t h e ns u m m a r i z et h et e c h n o l o g y o fl o w - p o w e rd e s i g ni n t o3l e v e l :c i r c u i ta n dl o g i c l e v e l ,a r c h t e e t u r el e v e l ,a n do p e r a t i n gs y s t e ml e v e l t h i r d ,w ep r o p o s eap o w e r - e f f i c e n t d a t ac a c h ed e s i g ni na r c h t e c t u r el e v e l t h i sc a c h ei sr e - e o n f i g u r a b l e ,a n dm a k e sf u l l u s eo fl o c a l i t ya n df r e q u e n tv a l u el o c a l i t y f o r t h , w ea n a l y s et h ep o w e rm a n a g e m e n t o i lp x ax s c a l ep r o c e s s o r , a n dw ed e s c r i b es e v e r a li n n o v a t i v em e t h o d s :p o l i c y d e c i s i o nb a s e do nh i g hf i d e l i t ym e m o r ya n dc o m p u t a t i o nc h a r a c t e r i z a t i o n , m e m o r y m o d e l i n g , a n da d a p t i v es a m p l i n gp e r i o dt oa d a p tt od y n a m i cc h a n g e si nt h ew o r k l o a d s f i n a l l y , w ec o n c l u d et h ew o r kp r e s e n t e di nt h i st h e s i s ,a n dd i s c u s st h ef u t u r ew o r k k e y w o r d s :l o w - p o w e r , r e c o n f i g u r a b l e ,d - c a c h e ,f r e q u e n tv a l u e ,d y n a m i cp o w e r m a n a g e m e n t ,m e m o r ym o d e l i n g 复旦大学硕l - 学位论文 第一章概述 1 1 功耗在计算机系统中的重要性 近年来,随着计算机技术的不断发展,计算机性能不断提高。在计算机性能 成倍提高的同时,计算机系统的功耗也迅速增大。以i n t e l 的公司的x 8 6 系列处 理器为例,1 9 8 5 推出的2 0 m h z8 0 3 8 6 功耗为i w ,2 0 0 0 年推出的1 4 g h z p e n t i u m 4w i l l a m e t t e 功耗达到8 2 w ,p e n t i u m4 的后续产品功耗最高超过1 0 0 w 。计算机 系统、特别是c p u 子系统的功耗逐渐增大,使得功耗问题成为计算机系统设计 的重要考虑因素。 随着便携智能终端和移动通讯设备的迅速普及,人们对移动计算的要求也越 来越高。目前智能手机通常都使用了1 0 0 m h z 以上的嵌入式处理器,高性能p d a 甚至使用6 0 0 m h z 以上的c p u 。这些移动计算设备通常采用电池作为重要的电 力来源,而电池技术近年来没有重大突破。移动计算设备的功耗随着性能的不断 提高迅速增加,电池的单位容量却增长缓慢,要想保证移动计算设备的使用时间, 只能增加电池的容量,增大移动计算设备的体积和重量。如何降低功耗,以便在 有限的体积、重量等设计约束下,实现移动计算设备高性能,长使用时间的设计 目标,成为众多系统设计者研究的重点。 在降低功耗的过程中,研究人员尝试了许多方法。在计算机系统发展的历史 上,通过单纯在工艺上缩小器件体积和降低操作电压来降低功耗的这一类方法, 已经取得了很大的成效,不过现在已经接近其物理极限。当前在计算机系统设计 过程中,通常需要在系统级、体系结构级、r t l 、门级,到最后的版图级进行协 同设计,才能同时保证提高性能和减少功耗。 1 2 低功耗设计技术简介 在研究低功耗设计技术前,首先要搞清功耗产生的原因与机理。为降低 c m o s 电路的功耗,我们必须从分析功耗的来源入手。笼统地说,芯片功耗由以 下三部分组成【1 1 跳变功耗( s w i t c h i n gp o w e r ) ,又称动态功耗( d y n a m i ep o w e r ) ,是每 个门的输出端形成的电容充放电形成的,就目前的工艺,这部分的功耗 还占主要地位,约占整个芯片总功耗的6 0 以上,随着工艺的提高,这 部分功耗所占比例会大幅度减少; 复旦大学硕士学位论文 短路功耗( s h o r t - c i r c u i tp o w e r ) 是c m o s 晶体管在反转过程中的短暂 时间内,p 管和n 管同时导通而形成电源和地之间短路电流造成的; 漏电功耗( l e a k a g ep o w e r ) ,又称静态功耗( s t a t i cp o w e r ) ,它是由漏 电流引起的。 首先,由于在当前工艺水平下,跳变功耗占主要部分,因此解决低功耗问题 应从这里入手。降低电源供电电压,可以减少功耗,这就是集成电路由原来的 5 v 供电电压降为3 3 v ,又降为今天的1 5 v ,甚至更低的原因。 其次,供电电压降低,能耗虽然降低,但是相应的延迟会增长,导致系统性 能下降。因此用降低电压的方法来降低功耗,必须用其他方法补偿相应的延迟损 失,以保证系统性能没有下降。当前一个可行方法是,可以通过开发系统的并行 性和流水线来实现,虽然这样会引入一些额外的控制电路并增加功耗,但即使这 样,理论上也可以减少功耗9 0 以上;另一个方法,由于用户对电路性能的要求 是变化的,因此可以通过操作系统动态控制时钟频率和电源电压,达到既保证性 能要求,又节约功耗的目的;还有一个折衷方案是,根据性能的要求,实时改变 供电电压,在系统的关键路径上,保持高的供电电压,以保证整个系统的性能, 而在非关键路径上,降低供电电压以减少功耗。但降低供电电压有可能增加新的 关键路径,因而这种方法的使用是有限度的。 第三,采用较高工艺水平可以降低功耗,因为较高的工艺带来特征尺寸的减 小,使电容和电源电压都相应下降,不过使用更高的工艺会增加芯片成本,工艺 的提高也受到技术和成本的限制。 第四,从逻辑电路级实施,由于时钟树的大量分布,而时钟又是不断跳变的, 因此导致它所消耗的功耗过大,一般情况下占整个芯片功耗的3 0 。因为s o c 中包含多个处理部件,多数时刻许多处理部件是不工作的,因此可以在那些时刻 使它的时钟停止,这就是所谓的门控技术。这种技术一般需要一个与门和锁存器 来控制输入时钟,目前的e d a 工具已经对它有较好的支持。 第五,从体系结构级考虑低功耗设计,多个部件都是通过总线互相通信,而 且有很大的通信量。因而总线低功耗技术也是人们关注的焦点,它通常占总功耗 的1 5 2 0 ,甚至占总功耗的5 0 以上。这是因为总线中数据线和地址线过多, 每条线都需要驱动。解决这部分功耗问题可以采用多种技术,减摆幅技术与电荷 再循环总线结构是目前比较成熟的技术。实验表明,这些技术后的总线功耗仅是 传统的1 0 。 最后,在操作系统级别,也有很多降低低功耗的手段。例如,根据系统负载 动态改变芯片、总线和内存的电压和频率,或者关闭暂时空闲的设备,以节省功 耗,延长电池使用时间。 复旦大学硕士学位论文 1 3 评估技术 在嵌入式系统设计中,采用何种技术才可以满足系统性能和功耗设计的双重 需要,是设计者经常面临的额外难题。只有在能够准确估计系统性能和功耗的情 况下,才能确保系统的性能和功耗符合设计的要求。因为低功耗设计需要e d a 流程中各个层次的协同设计,性能和功耗的评估也需要在各个层次的设计过程中 进行。 针对不同的解决问题需要对不同的性能功耗指标进行分析。 性能估计的手段相对比较成熟,利用a m d a h l 定律,通常可以通过各种事件 的延迟和事件发生的概率来进行大致的估算。对于实际的系统,也经常采用运行 b e n c h m a r k 等测试程序的方式来获取性能数据。 功耗估计分为平均功耗( a v e r a g e p o w e r ) 和峰值功耗( p e a k p o w e r o r i v i a x i m u m p o w e r ) 。平均功耗可以决定电池的使用时间,而峰值功耗则涉及到电路的可靠性, 并且在设计过程中影响电源和地线的设计。 目前嵌入式系统的大部分功耗来源于器件的信号跳变( s w i t c h i n gc o m p o n e n t ) 导致的输出电容充放电,因此跳变功耗的估计非常重要。要估计其平均功耗,就 需要精确计算电路内部节点在特定时间内的平均跳变电容,但这在体系结构级和 行为级是很难的,因为很难精确知道电容值,而在门级则相对容易,因为门级已 经可以直接从工艺库中提取出精确的电容信息。然后再通过概率统计的方法,来 估计平均跳变电容和跳变功耗。 对于实际系统,可以通过功率表来测量嵌入式系统的功耗,并且经常会分别 测量嵌入式系统的不同模块各自的功耗,以进一步分析,并可由此推导出系统在 特定应用下的功耗和使用时间。 复旦丈学硕士学位论文 第一:章研究背景和相关t 作6 第二章研究背景和相关工作 2 1 基本的功耗知识 要研究计算机系统特别是c p u 子系统的低功耗设计,首先要从物理层次上 弄清集成电路的功耗组成,其次,才能从物理实现到系统实现上采用各种方法来 节省功耗,达到低功耗设计的目的。 总的来说,芯片功耗由以下三部分组成: 跳变功耗( s w i t c h i n gp o w e r ) ,又称动态功耗( d y n a m i cp o w e r ) ,是每 个门的输出端形成的电容充放电形成的,就目前的工艺,这部分的功耗 还占主要地位,约占整个芯片总功耗的6 0 以上,随着工艺的提高,这 部分功耗所占比例会大幅度减少; 短路功耗( s h o m - c i r c u i tp o w e r ) 是c m o s 晶体管在反转过程中的短暂 时间内,p 管和n 管同时导通而形成电源和地之白j 短路电流造成的: 漏电功耗( l e a k a g ep o w e r ) ,又称静态功耗( , s t a t i cp o w e r ) ,它是由漏 电流引起的。 2 1 1c m o s 电路中的功耗模型 c m o s 逻辑电路中的功耗一性能平衡模型主要可以由以下三个公式来概括 【2 】,大多数关于c m o s 低功耗设计的研究也都基于这三个公式。它们直观的反 映了电路设计、体系结构设计和系统设计所要关注的重点。这三个公式不仅适用 于c p u 和c a c h e ,还适用于d r a m 电路。 公式1 :总功耗 p i a c y 乙f + c a y “i l m ,+ m t 1 、 a c v d d 2 f 第一部分用于计算动念功耗( d y n a m i cp o w e rc o n s u m p t i o n ) ,它主要是由每 次门的输出端电容充放电消耗的。其中,表示系统的工作频率,p 么表示系统的 工作电压,c 代表所有门输出端的电容之和,一代表在平均时间内,一个门节点 在每个时钟周期内所变化的几率。我们可以看到,动态功耗正比于系统的工作频 复口大学颂i 学位论文 第二章研究背景和相关t 作 7 1 率 系统中所有门的活动系数彳、门的输出端所能看到的全部电容c 、以及供 电电压的平方p 彳。 谢。矿 第二部分用于计算短路功耗( s h o r t - c i r c u i tp o w e rc o n s u m p t i o n ) ,它是c m o s 晶体管在反转过程中的短暂时间f 内,如果条件 “ t h r e s h o l d 一: 二:1 :二 c h 表 最低的c p l 图3 - 1 3c c d s 状态机 算法l 针对嵌入式多媒体应用 c a e h e 更新 嵌入式,多媒体应用程序的特点之一是数据量和计算量较小,c a c h e 的失效率 比较低,而功耗要求则比较严格,因此我们针对这类程序设计了相应的c c d s 算法: ( 1 ) 状态机的初始状态是阢l a 的初始大小设为最小配置,在每个死曲a e r i t 。 结束时记录下这个周期内的l a 采用的配置对应的c ; ( 2 ) 由于嵌入式多媒体程序的c a c h e 失效率一般都比较低,因此我们将 t h r e s h o l d 设为固定值( 比如我们采用2 ) ,当c a c h e 失效率 ( m i s sr a t e ) 超过t h r e s h o l d 时,将在下一个死油删内将l a 提升 为更高的配置,从而维持l a 的工作集; ( 3 ) 这种操作持续进行,直到l a 到达最高配置或l a 失效率足够小( 比如 1 ) ,此时,遍历c p i 表,选择最小c p i 对应的配置,然后清空c p i 表,并切换到s 状态。 ( 4 ) 在每个死曲,r i o d 内,如果失效数( 彳n u m _ m i s s = c u rn l l mm i s s 1 a s th u m 脚沁) 和分支数( 彳n u mb r = c u rn u mb r - l a s t _ n u m _ b r ) 变化不会很大的话( z c n u m m i s s , z j n u mb r t h r e s h o l d ) 1 。 ( c a c h e s i z e ,此锄, ,5 , 伽c h e 瓤件 ? - e l s e ; ,。 c d c h e _ 啦;m a t w i t hb e s tc p i 。i : ,- s t a t e = s t a b l e 5 : 扎i f ( c a c h e 嘲一p r e v _ c a c h e _ c o n f i g ) 1 j。 i n c m b b r h | | e n m f。:! e n d f ,: e n a v5 5 我们使用5 3 2 实例中给出的配置来测试算法l 的稳定性和准确性,图3 1 4 ( 幻 给出了m e d i a b e n c h 中的e p i ce n c o d e r 程序的执行期内,l a 的配置更改和c c d s 状态机变化规律,图3 - 1 4 ( b ) 给出了c a c h e 失效率和c c d s 状念机的变化规律, t h r e s h o l d 定为l ,可以看到,当c a c h e 失效率提高时,状态机往往会切换 到u 状态,l a 的配置相应的发生更改,直到失效率重新达到稳定( 大约o 5 9 * , 4 左右) 。从图( a ) 中我们还可以看到,在每次需要l a 调整时,l a 都需要从配置0 开始重新确定。因此,这种方法的优点是能够保证l a 的配置尽量达到最小值, 从而最大限度的降低功耗,但是会使l a 失效率有所提高。 巨煎二鲴 ( a ) l a 配置和c c d s 状态 复旦大学硕士学位论文 第一章一种低功幸e n r 币杠j 数据c a c h e 设计3 2 捌1 0 11 5 12 0 l2 5 l3 0 13 i = = l a _ l l ! 智h ! :! 塑! ! jn a ml i n t ( b ) 失效率和c c d s 状态 图3 1 4 对m e d i a b e n e h 中的e p i ce n e o d e r 程序的观察 算法2 针对商业科学计算应用 一般的商业,科学计算应用程序的特点之一是数据量和计算量比较大,c a c h e 的失效率变化明显,而对功耗的要求没有嵌入式应用中那么严格,因此我们针对 这类程序设计了相应的c c d s 算法,同算法l 的主要区别主要在t h r e s h o l d 的设定和步骤( 5 ) 中: ( 1 ) 状态机的初始状态是u ,l a 的初始大小设为最小配置,在每个死曲p e r j a d 结束时记录下这个周期内的l a 采用的配置对应的c p ,; ( 2 ) 由于商业科学计算程序的c a c h e 失效率变化非常大,因此我们将 ,兄驱肋e d 设定动态变化的( 比如设为之前的l a 平均失效率) ,当 c a c h e 失效率( m i s sr a t e ) 超过t h r e s h o l d 时,将在下一个t :础,r i o d 内将l a 提升为更高的配置,从而维持l a 的工作集; ( 3 ) 这种操作持续进行,直到l a 到达最高配置或l a 失效率足够小 ( ”承醪肋d ) ,此时,遍历c 表,选择最小c p i 对应的配置,然 后清空c p i 表,并切换到s 状念。 ( 4 ) 在每个疋础p e r i o d 内,如果失效数( 彳 n u mm i s s = c u ri , i t l mm i s s - l a s t ? l l l mm i s s )和分支数 (彳 n u mb r f c u rh u mb r - l a s t 删mb r ) 变化不会很大的话( z y n u mm i s s m n o ,z t n u mb r e n d i f ;e n d i f ;,:,;,。:。,: j, - e ,一 f j _ s 4,j5-,。j7 5 我们同样测试了算法2 的性能,图3 一1 5 ( a ) 给出了s p e c 2 0 0 0 中的1 6 4 g z i p 程序的执行期的一部分( 指令2 0 0 - 一5 0 0 ) ,l a 的配置更改和c c d s 状态机变化规 律,图3 1 5 ( b ) 给出了l a 失效率和t h r e s h o l d ( 七取1 0 ) 的变化规律,显然, 由于g z i p 的失效率变化非常频繁,从而导致了u 状态的增加,图( a ) 中可以看到, 算法2 中的改动( 1 ) 已经尽量让l a 的配置变化幅度降低( 7 5 之间) ;而且, 实验结果显示,l a 的平均失效率为1 9 9 0 ,而t h r e s h o l d 平均值为2 1 9 0 , 6 , 基本上c a c h e 失效率低于阳兄啜h 睨d ,从而也减少了c c d s 状态的切换。 ( a ) l a 配置和c c d s 状态 复旦大学顾士学位论文 第市一种低功耗口节耗j 致据c a c h e 设计3 4 j ff fj 7 j n 1 i l “ 蛘 f 舢 。f f , f l _ _ 一1 。 _-_ i 5 11 0 l 1 5 l 2 0 i 巧i3 0 1 e 巫蔓三垂鲴 n n m _ l m t ( b ) 失效率和t h r e s h o l d 图3 1 5 对s p e c 2 0 0 0 中的1 6 4 g z i p 程序的观察 对e r l pd - c h e 的评测主要采用模拟的方法在性能和功耗上进行估算。 s i m p l e s c a l a r 工具集能够提供一个详细的处理器模拟环境,我们通过修改 s i m p l e s c a l a r 3 0 来实现e r l pd - c a c h e ,并在其上运行b e n c h m a r k ,从而获得性能 方面的统计数据:对于功耗的估算,我们通过修改c a c t l 2 0 对c a c h e 进行功耗 建模,以及将s i m p l e p o w e r 嵌入s i m p l e s c a l a r 中来获得功耗方面的统计数据。图 3 1 6 给出了将各工具整合在一起的模拟系统。 召关参数 广二= = 功#o c a c l l e 功耗建模 i : = = 刊r i s c s m p l e p o w e r i r l e n c h m a r k 性自 i r 复旦大学硕学位论文 估算 估算 | | :l | | |imr 1h i 第三章一种低功耗b r 事构数据c a c h e 设计3 5 3 4 1 实验参数 处理器和可重构c a c h e 参数 处理器参数 表3 - 2 处理器参数 参数项 参数值 取指队列( 指令数)8 分支预测 i 2 8 bb i m o d , 1 2 8 s e t s - 1 w a yb t b 取指& 译码宽度1 执行宽度 2 ( i n - o r d e r ) 提交宽度2 r u u 和l s q 项数 r u u :8 ,l s q :8 功能单元 ii n t a l u ,li n tm u l t , 1f p a l u ,i f p m u l t l l 指令c a c h eil a t e n c y , 3 2 k3 2 w a y l l 数据c a c h e1l a t e n c y , 3 2 k3 2 w a y l 2 c a c h e n o n e 指令t l b i t l b :3 2 :4 0 9 6 :3 2 :f , 3 0c y c l e s 数据t l bd t l b :3 2 :4 0 9 6 :3 2 :f 主存读取( 总线宽度,第一个块的延迟) 8 b 1 2c y c l e 1p o r t 可重构配置参数 我们采用的e r l pd c a c h e 的所有配置如t ( l a l b 3 2 k4 w a y ) : 表3 3 可重构配置参数 l a e s u b a r r a y 2 e s u b a r r a y o e s u b a r r a y i e s u b a r r a y 3 n o s i z ea s sw 3 w 2 w lw 0w 3w 2w lw 0w 0w lw 2 w 3w 0w lw 2w 3 o 4 k 1 w a y l bl bl bl bl bl bl b罗t 。l a 4 l bl b l b l bl bl bl b 18 k 2 w a yl b l bl bl b l bl bl al a l a l a l bl bl bl bl bl b 21 2 k 3 w a y l bl bl b l bl bc a l al al al al a l bl bl bl b l b 3 1 6 k 4 w a y l bl bl bl b h l 8l al al al al a l a !l bl b l b l b 48 k 1 w a y l b l bl b寥l a l bl bl bl a l al bl bl bl a 4 l bl b l b 5 1 6 k 2 w a y l bl b、。 l a l bl b扩l al al al a 糍l bl bl al a ” l bl b 62 4 k 3 w a y l bl al al a “l b9 l al al al a l a 。l bl al al a 。l b 7 3 2 k 4 w a y。胁。 hl a l a l a l a l a l al al al al al al al a l a f v f f v d 参数 对于f v f f v d ,我们采用了3 3 1 中的数据交换方法实现,同时,f v f 采用 只寻找一次的策略。 复旦大学硕士学位论文 第_ 三帝一种低功耗b r 节构敏槲c a c h e 设计 - 3 6 - 表3 4 f v f f v d 参数 f t 方法 参数项参数值 计数位2b i t 数据交换方法c a m 人小 3 2 x 3 2b 乜 r a m 火小 1 6 x 4b i t s ( 4 b i ti d 、 寻找一次 f v f 策略 动态变化 功耗相关参数 统计参数 表3 5 功耗相关的参数 参数项参数值 处理器频率 2 0 0 m h z 供电电压 1 8 v 工艺水平 0 1 8 u m 表3 - 6 统计分析参数 ( n e w 一:e r l p - c a e h e 的实验数据,o r i g i n a l 一:传统c a c h e 的实验数据) 参数项参数描述 l a l b 失效率 包括l a 火效率,l b 火效率以及整个可重构c a c h e 的失效率 f v 失效率高频率数据的访问火效率 彬 执行指令数( s i m n u m i n s n ) 所有被执行的指令数( 包括预测执行的指令) 靶 执行周期( s i m _ c y c l e ) 程序执行所_ l 】的时钟周期数 箍 c p i ( 周期指令) 每条指令的执行周期,即s i r e _ c y c l e s i r e n u m i n s n 掣 正规化的执行时间改进后的的执行周期,传统的执行周删 n o r m a l i z e de x e c u t i o nt i m e n e w _ c y c l e s o r i g i n a l _ c y c l e s l e 规化的延迟( 改进后的周期传统的周期) 传统c a c h e 周期 n o r m a l i z e dd e l a y ( n e w _ c y c l e o r l g i n a l _ c y c l e ) o r i g i n a lc y c l e 正规化的功耗肖省( 传统的平均功耗改进厉的平均功耗) ,传统的平 n o r m a l i z e dp o w e rr e d u e t i o n 均功耗 ( o r i g i n a l _ a v g _ p o w e r - n e wa v g _ p o w e r ) o r i g i n a l _ a v g j 9 0 w e r 状 正规化的能耗肖省 ( 传统的能耗- 改进厉的能耗j ,传统的能耗 罂 堪 t o t a ln o r m a l i z e de n e r g y ( o r i g i n a l _ e n e r g y - n e w _ e n e r g y ) o r i g i n a l _ e n e r g v 督 c o n s u m p t i o n 上e 规化的能鼍延迟 ( o r i g i n a l _ e d n e w _ e d ) o r i g i n a le d e n e r g y - d e l a yp r o d u c tr e d u c t i o n 复旦大学顾l 学位论文 第三章一种低功耗可雷构数据c a c h e 设计 3 7 3 4 2b e n c h m a r k 在对e r l pd c a c h e 的模拟评测中,我们使用了三个b e n c h m a r ks u i t e : m e d i a b e n c h 、m i b e n c h 和s p e c 2 0 0 0 中的一部分,其中前两个b e n c h m a r k 主要侧 重于嵌入式多媒体应用方面,s p e c 2 0 0 0 主要侧重于商业科学计算应用方面。 m e d i a b e n c h m e d i a b e n c hb e n c h m a r ks u i t e i l 】包括了许多针对嵌入式通信和多媒体的评测 程序,m e d i a l m m e h1 0 包含了1 1 个来自图像处理、通信和d s p 应用方面的应用 程序,我们选择了其中常用的的6 个进行模拟评估。表5 7 给出了它们的描述。 表3 7m e d i a b e n e h 各评测程序 评测程序全名指令数 l o s s yc o m p r e s s i o nf o rs t i l li m a g e s e n c o d e1 5 9 7 8 7 4 6 j p e g 针对静态| 生| 像的有损耗压缩d c g o d e3 3 2 5 2 7 1 9 l o s s yc o m p r e s s i o nf o rv i d e o e n g o d e1 5 7 4 9 6 2 2 9 m p e g 针对视频的有损耗压缩 d e c o d e1 5 0 0 3 4 4 2 e u r o p e a ns t a n d a r df o rs p e e c ht r a n s e o d i n g e n c o d e 4 7 2 ,1 7 1 ,4 4 6 g s m 欧洲语音转换标准i ) l 矧x l c 5 4 8 ,0 2 3 ,0 9 2 g 7 2 1v o i c ec c i t tv o i c ec o m p r e s s i o ne n c o d e 3 8 4 9 0 8 2 2 4 c o m p r e s s i o n 国际电话与电报顾问委员会话音压缩 i ) e c o d e3 6 8 7 5 3 0 7 7 i d e a r s ap u b l i c k e yc n c r y 嘶o na l g o r i t h m e n c r y p t 8 2 4 9 4 6 ,3 4 4 p g p 美国r s a 实验室公共键密码算法 d e c r y p t 2 5 9 ,2 9 3 ,8 4 5 e l l i p t i c a lc u p ,ep u b l i c k e ye n c r y p t i o na l g o r i t h m e n c r y p t 1 3 7 7 9 2 l p e g w l t 椭圆曲线公共键密码算法 d e c r y p t 1 3 2 4 5 2 p o s t s c d p ti n t e r p r e t e r g h o s l s e r i p t 6 7 3 ,3 9 1 ,1 7 9 脚本解释器 e x p e r i m e n t a li m a g ec o m p r e s s i o n e n c o d e3 5 9 0 9 2 2 6 3 e p l c 实验的i 笙| 像压缩d e e o d e1 0 1 4 6 4 0 0 a d a p t i v ed i f f e r e n t i a lp u l s ec o d em o d u l a t i o na u d i o e n c o d e2 5 5 9 4 3 7 2 a d p c m c o d i n g 白适应音频脉冲编码 d t - , o d e2 1 0 6 8 0 1 2 m i b e n c h m i b e n c h 1 2 是为了评测嵌入式应用的一组评测程序集合,这些应用程序分 为6 个大的分类,分别面向于不同的嵌入式应用场合:汽车和工业控制、家用设 备、办公自动化,网络、安全以及通信。见表5 8 所示。 复旦火学碗 学位论文 第帝种低功耗日节丰句数据c a c h e 设计 - 3 8 表5 - 8m i b e n c h 各评测程序 分类 评测程序指令数 b a s i c m a t h i ,0 0 0 ,0 0 0 ,0 0 0 b i t c o u n t 3 8 4 ,8 0 3 。6 4 4 汽车和工业控制 q s o r t 5 9 5 ,4 0 0 1 2 0 s u s a n s m o o t h i n gl ,0 0 0 ,0 0 0 ,0 0 0 d i j k s 仃a 2 7 2 ,6 5 7 ,5 6 4 网络 p a t r i e i a i ,0 0 0 ,0 0 0 ,0 0 0 b l o w f l s h d e c o d e 7 3 7 ,9 2 0 ,6 2 3 安全s h a 2 0 ,6 5 2 ,9 1 6 r i j n d a e l d e c o d e1 4 0 ,8 8 9 ,7 0 5 w f f 2 b w 6 9 7 , 4 9 3 ,2 6 6 t i f l 2 r g b al , 0 0 0 ,0 0 0 ,0 0 0 耵f f d i t i l e r i , 0 0 0 ,0 0 0 ,0 0 0 家用设备 t i f f m e d i a n 8 1 3 2 9 ,6 6 3 l m e 5 4 4 ,0 5 7 ,7 3 3 m a d 2 7 2 ,6 5 7 ,5 6 4 i y p e s e t 8 4 ,1 7 0 , 2 5 6 s t r i n g s e a r c h3 8 ,9 6 0 ,0 5i 办公自动化 i s p e l l6 4 0 ,4 2 0 ,1 0 6 r s y n t h 8 5 ,0 0 5 ,6 8 7 f f t 1 4 3 2 6 3 4 1 2 通讯 c r c 3 2 6 1 ,6 5 9 ,0 7 3 s p e c :2 0 0 0 s p e c 2 0 0 0 1 3 是面向多种操作系统和环境,包括高性能计算、w e b 服务器以 及图形子系统等应用的评测程序集,我们使用了其中的6 个评测程序,见表3 - 9 。 表5 - 9s p e c 2 0 0 0 中的部分评测程序 s p e c 2 0 0 0 评测程序指令数 1 6 4 g z i p 3 ,2 5 4 ,1 9 3 ,6 9 6 1 7 6 g c c1 ,8 1 0 ,4 2 6 ,1 2 6 s p e c i n t 2 0 0 0 2 5 6 b z i p 2 1 6 ,2 5 0 ,0 9 0 ,0 6 5 3 0 0 t w o l f6 6 ,4 6 7 2 2 6 1 7 9 ,a r t 1 6 4 ,3 4 3 ,2 5 0 ,0 9 0 ,0 6 5 s p e c f p 2 0 0 0 0 9 9 g o 4 7 8 ,0 3 2 ,4 8 7 3 4 3 实验结果及分析 高频值命中率与程序特性及寻找的到高频数据值是否合适有关。当高频 复旦大学硕士学位论文 第幸一种低功耗a r 事构教据c a c h e 设计3 9 值命中率降低时,会使延迟增加,功耗增长。 对于基于高频值的可重构c a c h e ,其高频值命中率如图3 1 7 示,平均命 中率为4 2 4 。除a d p c me n c o d e r 的命中率低于1 0 之外,其他都在2 0 以 上。 幽3 一1 7 高频值命中率 l a 的命中率一方面与程序特性有关,另一方面与重构决策算法也有很大 关系。当选择的l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网格员安全培训
- 人力部长面试题及答案
- 中医内科病案例分析
- 甘肃税法考试题及答案
- 文职智力测试题及答案
- 求教师面试题及答案
- 陶瓷机械试题及答案
- ICU气管切开护理
- 细胞信号通路解析2025年创新药物靶点发现与验证技术报告
- 肿瘤疾病病人护理指南
- GB/T 95-2002平垫圈C级
- GB/T 16823.3-1997螺纹紧固件拧紧试验方法
- 2023年镇江丹阳市民政局系统事业单位招聘笔试模拟试题及答案
- 幼儿园消防安全组织机构图
- 英语社团活动课件
- 第三方检测市场部管理制度提成方案
- 学前儿童发展心理学-情感
- GB∕T 16762-2020 一般用途钢丝绳吊索特性和技术条件
- 电网施工作业票模板
- 安徽省小学学生学籍表
- 精选天津市初中地理会考试卷及答案
评论
0/150
提交评论