(计算机系统结构专业论文)嵌入式系统中低功耗cache的研究与设计.pdf_第1页
(计算机系统结构专业论文)嵌入式系统中低功耗cache的研究与设计.pdf_第2页
(计算机系统结构专业论文)嵌入式系统中低功耗cache的研究与设计.pdf_第3页
(计算机系统结构专业论文)嵌入式系统中低功耗cache的研究与设计.pdf_第4页
(计算机系统结构专业论文)嵌入式系统中低功耗cache的研究与设计.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕i j 学位论文 摘要 能耗问题是近年来人们在嵌入式系统设计中普遍关注的热点,它严重影响着 嵌入式系统的应用与发展。c a c h e 即高速缓冲存储器,作为处理器与主存之间的 关键桥梁,在优化计算机系统的性能中发挥着重要作用,但同时它也是主要的功 耗部件之一。因此,有效地降低c a c h e 的功耗对嵌入式系统的低功耗设计有着重 要的意义。 本文主要研究体系结构级的低功耗c a c h e 设计技术。在详细分析了低功耗 c a c h e 技术的研究现状的基础上,提出了两种新的低功耗c a c h e 模型,分别为基 于有效位预判和分类访问的低功耗混合c a c h e 模型( c a v p uc a c h e ) 和基于容量 联合分配算法的低功耗分离c a c h e 模型( c c a sc a c h e ) 。c a v p uc a c h e 具有低 功耗和动态平衡指令负载和数据负载的优点;而c c a sc a c h e 则兼备低功耗、动 态调节负载和高处理带宽的优点。通过仿真实验证明了上述两种低功耗模型的有 效性。本文的主要创新工作如下: 1 提出基于有效位预判和分类访问的低功耗混合c a c h e 模型( c a v p u c a c h e ) 。在访问传统的组相联混合c a c h e 时,要同时访问一个组中的所有路,这 样极大地增加了访问功耗,因为对于一个n 路的组相联c a c h e ,就有n 1 路的访 问是无谓的。本文通过在分类访问的混合c a c h e 模型中增加有效位的预判,提出 一种基于有效位预判和分类访问的路暂停c a c h e 模型。该低功耗模型既能暂停对 类型不匹配的存储体的访问,又能暂停对无效存储体的访问,从而降低了访问能 耗,同时子块搁置技术的引入,又减少了c a c h e 的失效开销。实验表明,新提出 的路暂停c a c h e 模型在保证高性能的同时,又能有效降低c a c h e 的功耗。 2 提出基于容量联合分配算法的低功耗分离c a c h e 模型( c c a sc a c h e ) 。 可重构c a c h e 具有参数可重新配置的特性,建立在可重构c a c h e 之上的自适应算 法,能够动态地统计c a c h e 的行为和性能信息,并根据这些信息在程序运行时动 态地改变c a c h e 的配置,从而在保证高性能的前提下,有效地降低c a c h e 的功耗。 考虑到不同程序甚至同一程序的不同运行阶段对指令c a c h e 和数据c a c h e 的容量 的实时需求往往不同且不均衡,本文针对可重构分离c a c h e ,提出了种新的容 量联合分配算法,该算法可以综合考虑程序运行时对两类c a c h e 资源的实时需求, 动态地联合调整一级c a c h e 的容量和配置,从而更有效地利用c a c h e 资源。实验 表明,与先前的自适应算法相比,新提出的算法不仅有效地降低了c a c h e 的功耗, 而且降低了程序运行中由于两类c a c h e 容量的分配不均衡带来的性能损失。 关键词:c a c h e :低功耗;可重构;自适应算法:有效位 h a b s t r a c t p o w e rd i s s i p a t i o ni st h eu n i v e r s a lh i g h l i g h to ft h ee m b e d d e ds y s t e m sd e s l g n d u r i n gt h er e c e n ty e a r s , w h i c he f f e c t st h ea p p l i c a t i o n sa n dd e v e l o p m e n to f t h e e m b e d d e ds y s t e m ss e r i o u s l y c a c h ep l a y st h ek e y r o l ei nd e c r e a s i n gt h ep e r t o m a n c e g a pb e t w e e nt h em a i nm e m o r ya n d t h em i c r o p r o c e s s o r ,w h i c hi sa l s oo n eo f 。t h em a l n p a r t so ft h ep o w e re l e m e n t s t h e r e f o r e ,t h e r e s e a r c ho nl o w - p o w e rc a c h et o r t h e l o w p o w e rd e s i g no fe m b e d d e ds y s t e m si so fi m p o f t a n ts l g n l t l c a n c e t h et h e s i ss t u d i e st h el o w p o w e rc a c h ed e s i g nt e c h n o l o g yi na r c h i t e c t u r a ll e v e l f i r s t l v ,w es u m m a r i z ea n da n a l y z et h eu s u a ll o wp o w e rc a c h ed e s l g nt e c h n l q u e s ,a n d t h e np r o p o s et w ol o w p o w e rc a c h em o d e l s ,w h i c ha r et h el o w - p o w e ru n l f l e d c a c h e m o d e lb a s e do nc l a s s i 6 c a t i o na c c e s ss c h e m ew i t hv a l i d b i tp r e - d e c i s i o n ( c a v p u c a c h e )a n dt h el o w p o w e rs p l i t c a c h em o d e lb a s e do nc a p a c l t y c o a 儿o c a t l o n a l g o r i t h m ( c c a sc a c h e ) t h ec a v p uc a 出e o w n st h ea d v a n t a g eo f l o wp o w e r c o n s u m p t i o na n dl o a ds e l f - r e g u l a t i o n ;t h ec c a s c a c h eo w n st h ea d v a n t a g eo tl o w p o w e rc o n s u m p t i o na n dl o a ds e l f - r e g i l l a t i o n a n dh i g hb a n d w i d t h t h es i m u l a t i o n r e s u l t ss h o wt h a tt h e s el o w p o w e rm e t h o d sa r ev a l i d t h em a i n r e s u n so ft h i st h e s i s a r ea sf o n o w s : 1 a1 0 w p o w e ru n i f i e dc a c h em o d e lb a s e do nc l a s s i f i c a t i o na c c e s ss c h e m e w l t h v a l i d - b i t p r e d e c i s i o n i s p r o p o s e d w h e na c c e s s i n g t h et r a d l t l o n a lnw a y s e t a s s o c i a t i v ec a c h ei ts h o u l da c c e s sa l lt h ew a y sa tt h es a m et i m e t h u s i tw i l lr e s u l t i ni n c r e a s i n g t h e e n e r g yc o n s u m p t i o nb a d l y f o rt h a tn - 1w a y sa c c e s s l n g l s u n n e c e s s a r y i nt h i sp a p e r ,al o w p o w e rc l a s s i f i c a t i o n a c c e s ss c h e m ew i t hv a l i d - b i t p r e d e c i s i o nf o ru n i f i e dc a c h ei sp r o p o s e d b a s e do nt h e1 0 w 。p o w c rc i a s s i t l c a t l o n a c c e s ss c h e m e t h el o w - p o w e r c a c h em o d e lc a nn o t0 n l yh a l tt h ec a c h eb l o c k sw h i c h a r en o tm a t c h e db u ta l s oh a l tt h ec a c h eb l o c k st h a t a r en o tv a l i d t h es u b - b l o c k p l a c e m e n tt e c h n o l o g yu s e di n t h i sl o w p o w e r m o d e lc a na l s od e c r e a s et h em l s s d i s s i p a t i o n m i b e n c hs i m u l a t i o nr e s u l t ss h o wt h a tt h e1 0 w p o w e r s c h e m ec a nr e d u c e t h ep o w e rc o n s u m p t i o na n di m p r o v et h ec o m p r e h e n s i v ep e r f o r m a n c ee t t e c t l v e l y c o m p a r e dt ot h eu n m e d c a c h ew i t hc l a s s i f i c a t i o na c c e s ss c h e m e 2 al o w p o w e rs p l i tc a c h em o d e lb a s e do nc a p a c i t yc o - a l l o c a t l o na i g o n t h ml s p r o p o s e d r e c o n f i g u r a b l ec a c h eh a s as e to fa d j u s t a b l ec o n f i g u r a t i o n s , a n dt h e s e l t u n i n ga l g o r i t h m f o rr e c o n n g u r a b l ec a c h e c a nm o n l t o rc a c h eb e h a v l o r 颂i j 学位论丈 p e r f o 咖a n c ea n dm o d i f yi t sc o n 6 9 u r a t i o n sd y n a m i c 8 1 l yb a s e do nt h er e q u i r e m e n to f r u n n i n gp r o g r a m ,w h i c hc a nm i n i m i z et h ep o w e rc o n s u m p t i o na n dp e r f o 仰a n c el o s s an e wc a p a c i t yc o - a l l o c a t i o na l g o r i t h mi sp r o p o s e di nt h i sp a p e rb a s e do nt h ef a c tt h a t d i f f e r e n tp r o g r a m se v e nd i f f e r e n to p e r a t i o n a lp h a s e so fap r o g r a mu s u a l l yn e e d d i f f e r e n ts i z e so ft h ei n s t r u c t i o nc a c h ea n dd a t ac a c h ea n dt h en e e di s u s u a l l y i m b a l a n c e d t h i s a l g o r i t h m c a nc o a d j u s tt h e c o n f i g u r a t i o no fl e v e l 1c a c h e d y n a m i c a l l yb a s e do nt h er e q u i r e m e n to fr u n n i n gp r o g r a m m i b e n c hs i m u l a t i o n r e s u l t si n d i c a t et h a tt h ea l g o r i t h mc a nn o to n l y1 0 w e rt h ec a c h e se n e r g yc o n s u m p t i o n e f 艳c t i v e l yc o m p a r e dt ot h ep r e v i o u sw o r k s ,w h i c ha l s oc a nr e d u c et h ep e r f o m a n c e l o s se f 诧c t i v e l yc a u s e db yi m b a l a n c e da l l o c a t i o no fc a p a c i t yb e t w e e nt h ei n s t r u c t i o n c a c h ea n dt b ed a t ac a c h e k e yw o r d s :c a c h e ;l o w - p o w e r ;c o n f i g u r a b l e ;s e l f t u n i n ga l g o r i t h m ;v a l i d b i t 嵌入式系统中低功耗c a c h e 的研岁j 设计 插图索引 图2 1c a c h e 的工作原理8 图2 2c a c h e 与主存不一致的两种情况9 图2 3 传统c a c h e v i c t i mc a c h e f i l t e rc a c h e h o t s p o tc a c h e 对比图l4 图2 4 基于预测的f i l t e rc a c h e 结构图1 5 图2 5 两级f i l t e rc a c h e 结构图16 图2 6 改进的h o t s p o tc a c h e 17 图3 1 传统四路组相联c a c h e ( 灰色代表被访问的组) 2 l 图3 2 四路组相联分类访问c a c h e 的结构( 灰色代表被访问的组) 2 1 图3 3 带有效位预判的路预测c a c h e 的结构图引2 2 图3 4 四路组相联c a v p uc a c h e 的结构图2 3 图3 5c a c h e 的访问路径2 4 图3 6 小容量c a c h e 的访问延迟2 5 图3 7 大容量c a c h e 的访问延迟2 5 图3 8c a v p uc a c h e 的访问路径2 6 图3 9s i m p l e s c a l a r 的结构图2 8 图3 1 0s i m p l e s c a l a r 的软件架构图2 8 图3 1 ls i m p l e s c a l a r 的工作流程2 9 图3 1 2 各c a c h e 模型的归一化平均访存能耗比较3 3 图3 1 3 各c a c h e 模型的归一化能耗延迟积比较3 4 图4 1 容量可联合配置的c a c h e 结构钉3 6 图4 2 容量联合分配算法状态图3 8 图4 3 容量可联合分配的c a c h e 结构4 0 图4 4t s b 对重构数量的影响4 2 图4 5t s b 对总的缺失数量的影响4 2 图4 6a b 对重构数量的影响4 3 图4 7a b 对总的缺失数量的影响4 3 图4 8c m b 对重构数量的影响4 3 图4 9c m b 对总的缺失数量的影响4 4 图4 1 0l r w h b 对重构数量的影响4 4 图4 1 ll r w h b 对总的缺失数量的影响4 4 图4 12e w h b 对重构数量的影响4 5 v i i 硕一i :学位论文 v i i l 向 影 的 一 一 量 一 一 一 数问耗 失时能积缺存存迟的访访延总均均耗对平平能b 化化化 h 一 一 一 掣卜妒图图图图 嵌入式系统中低功耗c a c h c 的研究j 设计 附表索引 表3 1m i b e n c h 的组成3l 表3 2 处理器和c a c h e 的相关参数3 2 表3 3 各c a c h e 模型的平均访存时间3 3 表4 1 处理器和容量联合分配算法的参数4 1 表4 2 不同初始容量的c a v p uc a c h e 的平均访存时间4 6 i ) ( 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献 的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法 律后果由本人承担。 作者签名:都谚狍日期:二d d 解五月互日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被 查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编 本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 2 、不保密团。 ( 请在以上相应方框内打“ ) 作者签名:却勃籼 导师签名:彭差蔓 日期:二9 0 蛑多月互日 日期:歹口日1 i l 卢f 至月五日 硕i :学位论文 第1 章绪论 随着便携式嵌入式设备的迅速发展与广泛应用,功耗问题已经成为人们关注 的焦点。在体系结构级进行低功耗研究,对设计拥有自主知识产权的面向特定应 用的高性能低功耗处理器或嵌入式系统有着重要的意义。本章将阐述本课题的研 究目的和意义,并引出本文的主要工作和章节安排。 1 1 研究目的和意义 嵌入式系统所涉及的应用领域极其广泛,应用数量上已远远超过了各种通用 计算机。随着手机、p d a 、g p s 、机顶盒等新兴产品的大量应用,嵌入式系统的 市场正在以每年3 0 的速度递增,嵌入式计算机已成为计算机市场中增长速度最 快的部分。在嵌入式系统的设计中,低功耗设计( l o w p o w e rd e s i g n ) 是必须面 对的问题。其原因一方面在于嵌入式系统被广泛应用于便携式和移动性较强的产 品中,而这些产品不是一直都有充足的电源供应,往往靠电池来供电,所以应从 每一个细节来考虑降低功率消耗,尽可能地延长电池的使用时间;另一方面还在 于在嵌入式设备的应用领域中,低功耗带来的不仅仅是减少系统的能耗从而节约 能源,更重要的是更低的功耗意味着更好的系统性能、更小的硬件尺寸,以及更 微弱的辐射干扰信号。例如,电池供电的便携式嵌入式检测设备,随身佩戴的医 疗仪器,工作于野外的自动化仪表控制器,长期连续工作的监控系统等都需要通 过低功耗优化来提高自身的适用性。因此,嵌入式系统的低功耗设计是嵌入式设 计人员必须考虑的问题。 嵌入式产品的飞速发展带来处理器的运算速度与内存容量的飞速增长。然而, 这种快速发展也增大了处理器运算速度与访存速度之间的差距【1 ,2 1 。c a c h e 是为了 填补c p u 和存储器在速度上的巨大差距而设置的高速缓存。在微处理器中增加 c a c h e ,可以大大减少处理器和片外m e m o r y 的数据交换行为,因此不仅可以加快 处理器取指令和取数据的速度,而且可以减少i 0 接口交换和访问外部存储器的 次数,从而降低整个处理器的功耗。c a c h e 的存在虽然显著提高了微处理器的性 能,但却占据了大量的芯片面积,同时也带来了较大的能量消耗。例如在a l p h a 2 1 2 6 4 和s t r o n ga r m 微处理器中,片内c a c h e 的面积分别占用了微处理器面积的 3 0 和6 0 ,功耗分别占整个芯片功耗的1 6 和4 3 【3 】。因此,c a c h e 的低功耗 设计是系统绿色化设计的重要环节之一,研究嵌入式系统中c a c h e 存储器的低功 耗设计具有非常大的现实意义。 数字系统的低功耗设计方法可以分为若干层次,按照抽象层次的不同,可以 嵌入式系统中低功耗c a c h e 的研究j 设计 分为:系统级( s y s t e m ) 、结构级( a r c h i t e c t u r e ) 、寄存器传输级( r e 画s t e rt r a n s f e r ) 、 逻辑门级( g a t e l o g i c ) 、版图级( l a y o u t ) 和电路级( c i r c u i t ) 。每个级别所能 达到的低能耗设计效果也完全不同,层次越高表明在电路系统设计中,进行低能 耗考虑的时机越早,因此所达到的低能耗效果也就越好。门级和寄存器传输级的 低能耗设计方法都是在电路基本结构确定的前提下,添加少量电路的和微调电路 的结构;而体系结构级的低能耗设计方法是在确定电路实现方案时就要考虑电路 的能耗问题,这其中包括采用并行结构和流水线、动态电压缩放( d v s ) 、存储 层次优化、漏电控制、代码压缩等技术。在现代嵌入式系统设计上,体系结构的 选择至关重要,同样,在能耗问题上,体系结构的影响也显而易见,因此,非常 多的研究在本层面展开。本文所研究的嵌入式系统中c a c h e 存储器的低功耗设计技 术也是在这一层面展开的。 1 2 论文的工作 体系结构级低功耗设计技术涉及的面广,建立在此层面上的各种技术依然存 在较多问题需要进一步探索和研究,而如何结合以上技术的特点完成一种多技术 协同工作的低能耗系统,也成为设计者关注的焦点。本课题针对分类访问混合 c a c h e 和动态自适应c a c h e 这两种高性能低功耗设计技术进行了研究,主要工作 概括如下: ( 1 ) 介绍了嵌入式系统的功耗问题及嵌入式系统中c a c h e 的相关知识,最后 详细例举了一些典型的低功耗c a c h e 模型,并对目前国内外高性能低功耗c a c h e 的研究现状进行了分析和总结。 ( 2 ) 由于硬件资源的欠缺,本课题的研究是基于软件模拟实验。本课题使用 的s i m p a n a l y z e r 是基于s i m p l e s c a l a r 的计算机体系结构级的丌源的功耗性能模拟 器集,作为本课题的前期研究,也为了后续研究工作的顺利开展,首先花费了很 多时间用于s i m p l e s c a l a r 和s i m p a n a l y e r 的内核分析。由于篇幅限制,在本文中 只对这两个模拟器集进行简单的介绍。 ( 3 ) 基于尽可能多地减少访问c a c h e 中的无谓的能量消耗的目的,提出一种 基于有效位预判和分类访问的低功耗路暂停c a c h e 模型,该低功耗模型在暂停对 类型不匹配块的访问的同时还能暂停对无效块的访问,同时,c a c h e 的子块搁置 技术的引入,又能够降低c a c h e 的缺失开销。因此,相对于分类访问的混合c a c h e , 路暂停c a c h e 能更有效地降低c a c h e 的功耗。最后,通过修改模拟器上的相关模 块,实现了该低功耗模型,并且对仿真结果进行了分析。 ( 4 ) 从资源自适应的思想出发,考虑到不同程序甚至同一程序的不同运行阶 段对两类c a c h e 的容量的实时需求不同并且往往是不均衡的,针对可重构分离 c a c h e ,提出了种新的容量联合分算法。该算法可均衡考虑程序运行时对指令 2 硕 :学位论文 c a c h e 和数据c a c h e 的实时需求,动态联合调整一级c a c h e 的容量和配置:当指 令c a c h e 和数据c a c h e 的最大容量均能满足程序的需求时,该算法分别动态调整 各c a c h e 的容量;当一种c a c h e 的最大容量不能满足程序的需求时,该算法能够 将另一种c a c h e 中闲置的路用于该c a c h e ;当指令c a c h e 和数据c a c h e 的容量和 达到最大值时,该算法还能够决定是否将一种c a c h e 中的最近最少命中路用于另 一c a c h e 。m i b e n c h 仿真结果表明,该容量联合分配算法既能有效地降低c a c h e 的功耗,又能提高c a c h e 的综合性能。 1 3 论文的结构 全文包括四章,各章主要内容如下: 第一章绪论。首先介绍低功耗c a c h e 的研究目的和意义,然后介绍本文的主 要工作和章节安排。 第二章背景知识及相关研究。首先介绍嵌入式系统的功耗问题;然后介绍嵌 入式系统中c a c h e 的相关知识以及c a c h e 的功耗和性能评价指标;最后根据低功 耗c a c h e 的实现方法的不同,分类介绍了国内外低功耗c a c h e 的研究现状,并进 行了分析和总结。 第三章基于有效位预判和分类访问的低功耗c a c h e 。首先介绍了分类访问的 混合c a c h e 的基本思想;然后分析了将其与有效位预判相结合的可能性,提出一 种基于有效位预判和分类访问的低功耗路暂停c a c h e 模型,研究了该c a c h e 模型 的结构和实现机制,并且分析了该低功耗模型的能耗和性能参数;接着介绍了实 验仿真平台及基准测试程序的比较和选用;最后通过仿真实验证明了所提出的低 功耗模型的有效性。 第四章基于容量联合分配算法的低功耗c a c h e 。从可重构c a c h e 的自适应原 理出发,根据不同程序甚至同一程序的不同运行阶段对指令c a c h e 和数据c a c h e 的容量的实时需求往往不同并且是不均衡的,针对分离c a c h e ,提出了一种新的 容量联合分配算法。这部分内容包括对基于容量联合分配算法的低功耗分离 c a c h e 模型的详细介绍、模拟实验和结果分析。 最后部分对全文工作进行了总结,并对进一步的研究提出了展望。 一3 嵌入式系统中低功耗c a c h e 的研究+ j 设计 2 1 引言 第2 章背景知识及相关研究 近年来,嵌入式技术已经成为新的技术热点。嵌入式系统最典型的特点是它 同人们的日常生活紧密相关,小到m p 3 、p d a 等微型数字化设备,大到信息家电、 车载g p s 、智能电器等形形色色运用了嵌入式技术的电子产品和各种新型嵌入式 设备。嵌入式设备在数量上现已远远超过了通用计算机。在嵌入式设备发展的3 0 多年的历史中,嵌入式技术从来没有像现在这样风靡过,人类也从来没有像现在 这样享受嵌入式技术带来的便利。在嵌入式系统中引入c a c h e 可以充分利用指令 和数据的空间局部性( s p a t i a ll o c a l i t y ) 和时间局部性( t e m p o r a ll o c a l i t y ) ,大 幅度地减少处理器和片外内存之间的数据交换次数,从而大幅度地减少处理器访 问存储器的时间和能耗。但在当前的存储器中,高速缓存( c a c h e ) 的容量需求越 来越大,能量消耗也越来越大。高命中率、高速而低能耗的c a c h e 对于提高整个 微处理器的工作速度,降低微处理器的能耗具有决定性意义。本章首先介绍嵌入 式系统的功耗问题,然后介绍嵌入式系统中c a c h e 的相关知识以及c a c h e 的功耗 和性能评价指标,最后介绍低功耗c a c h e 的研究现状,并进行了理论分析。 2 2 嵌入式系统的功耗问题 近年来,功耗问题已成为人们在嵌入式系统的设计中普遍关注的难点与热点, 特别是对于电池供电系统,具体来讲,低功耗系统设计研究的发展动因主要有以 下四个方面1 4 j : 1 电池供电设备的需求 随着计算机技术的发展,嵌入式系统的市场正在以每年3 0 的速度递增( i d c 预测) ,手机、机顶盒、p d a 、g p s 等新兴电子设备在人们日常生活中得到了广 泛的应用。而这些设备往往靠电池来供电,受重量和体积的限制,电池储能能力 有限,远远达不到人们的期望。为了保证移动电子设备更加持久的续航能力,最 可行的解决途径是尽可能地降低电子设备的功耗和供电电压。 2 系统可靠性的需求 集成电路中的峰值功耗和平均功耗是影响集成电路工作的可靠性和信号完整 性的重要因素。当集成电路整体功耗较大时,芯片运行温度会上升,从而导致电 路的运行参数漂移,影响电路的可靠性,致使电路失效。一般来说,温度每升高 一度,器件的故障率就会提高两倍。 4 硕十学位论文 3 解决集成电路芯片散热问题的需求 , 集成电路系统的能耗的绝大部分都转化为热量散发出来,如果芯片产生的热 量不能及时有效地散发,则会导致芯片温度上升,电路将由于各种热现象导致的 物理原因而失效,不能正常工作,过度的热甚至会损坏芯片。采用低功耗技术一 方面可以减少芯片产生的热量,降低电路失效的可能性;另一方面还可以降低对 芯片封装的要求,节省芯片封装的成本。 4 保护环境的需求 有效降低功耗可以减少噪声等环境污染,减少对人体的辐射。据美国环境保 护组织估计,在办公室电子设备所消耗的电能中,8 0 消耗在计算机设备中,因 此采用低功耗技术降低计算机设备中集成电路芯片的耗电量是降低办公室电能消 耗、节约能源与保护人类生态环境的重要途径之一。 2 2 1 影响系统功耗的因素 现代电子系统往往在追求高性能的同时还追求低功耗,而要降低系统功耗, 必须知道影响系统功耗的因素有哪些。对于c m o s 电路来说,在执行某一任务期 间,一个时钟周期的能量消耗如式( 2 1 ) 所示【5 1 。其中,膨为系统中门电路的个数, 三g 为第七个门电路g 。的负载电容,s 为第后个门电路g 。每个时钟周期的开关 次数,d 为工作电压。 。 旦 艮= 三q s 喘( 2 1 ) k = l 若执行第歹个任务所需的总时钟数为c l ,则执行第个任务所需的能量消耗 如式( 2 2 ) 所示。从式( 2 2 ) 可以看出,降低工作电压是减小系统功耗的有效方式。 但是,降低工作电压一般都会降低工作速度,从而导致工作时间的延长,因为电 路的延迟时间r 与工作电压也有密切的关系,如式( 2 3 ) 所示。 丝 乓= c l q s 喘 ( 2 2 ) k = l 以。1 r 石并斗f ( 2 3 ) ( 一) 4 卜。 其中,f ,夕为输入门电压,为阈值电压,口是一个与载流子饱和速度 有关的参数,对于m o s f e t 电路,其值大约为1 3 左右【6 1 。 系统的负载电容在系统工作期间不断重复充电放电的过程,其容量大小也是 影响系统功耗的重要因素。系统中第,个任务每个时钟周期的平均电容为: 个娑一 其中,m 是门电路总数,l q 是第七个门电路既的负载电容, 5 ( 2 4 ) s 是第露个 嵌入系统中低助耗c a c h e 的研究l j 设计 门电路在第- ,个任务中的第f 个时钟周期的开关次数,x ,是第个任务的时钟数 【5 1 。由式( 2 4 ) 可知,系统在执行不同的任务时,其负载电容是不同的,如执行乘 法运算和执行加法运算时负载电容会有很大差别,从而使得系统功耗的调整变得 更加复杂。从上面的分析可以看出,影响系统功耗的因素主要有工作电压、负载 电容、门电路的开关次数及执行一个任务所需的时间长短,因此,可以通过调节 这些参数来优化系统功耗。 2 2 2 嵌入式系统的低功耗设计 概括起来,嵌入式系统的低功耗优化设计技术主要有3 种:动态电压缩放 ( d y n 锄i cv o l t a g es c a l i n g ,d v s ) 、动态电源管理( d y n a m i cp o w e rm a n a g e m e n t , d p m ) 、低能耗硬件设计和软件设计。 1 动态电压缩放 动态电压缩放就是允许电压调节历程( v o l t a g es c h e d u l e rr o u t i n e ) 在运行时 改变c p u 的操作电压。电压调节历程首先分析系统状态,然后决定最佳的目标电 压。为了精确地控制d v s ,需要一个电压调度部件( v o l t a g es c h e d u l e r ) 来实时改 变电路的工作电压和动作频率,电压调度部件根据当前和过去状态下系统工作情 况的不同来预测电路的工作负荷。在电压调度方面,目前的研究主要分为两类: 一类是基于区间分析( i n t e r v a l - b a s e ) 的方法;另一类是基于线程分析的调度方法。 前者具有简单和易于实现的特点,后者则比前者更能精确地反应系统的任务需求。 2 动态电源管理 动态电源管理技术是有选择地把闲置的系统成分置于低能状态,从而有效地 利用电能。动态电源管理是建立在假设系统及其成分的工作负载各不相同,且工 作负载的变化能较准确地被预测出来的基础上的。一个电源管理系统包含一个电 源管理者( p o w e rm a n a g e r ) ,它能够基于对工作负载的观察来完成控制策略。所采 取的控制策略根据实现的方法不同,可分为三种,分别为预测性策略、适应性策 略和随机性策略。 3 1 氐能耗硬件设计和软件设计 动态电压缩放和动态电源管理着眼于提高系统能源的利用率,即只能改进系 统的使用,我们可以在这个基础上,采用特定的方法来实现系统硬件和软件的节 能设计。对于低能耗硬件设计,主要是通过采用现成的低能耗产品,如采用低能 耗处理器达到降低系统功耗的目的。在基于微处理器、微控制器的系统中,软件 起到了控制硬件活动的主导作用,也就是说,软件对系统的能量消耗有很大的影 响。因此,可以通过对控制硬件活动的软件进行低能耗设计,达到降低系统功耗 的目的。而在嵌入式系统中,主要考虑在存储系统和系统总线方面进行低能耗软 件设计。 6 硕i j 学位论文 2 2 3 嵌入式系统中存储模块的能量消耗 存储单元作为信息的储存地,在数字系统中起着不可替代的作用。嵌入式系 统同样不能缺少存储模块。信息的输入、信息的输出需要存储单元,信息的处理 需要存储单元,信息的传递同样需要存储单元。甚至可以说,没有存储模块的嵌 入式系统就不能成为一个完整的嵌入式系统。 由于嵌入式系统中大部分操作都需要存储模块的参与,因此其能量消耗也就 自然占了很大的比例。一些处理器内仅数据互联线就会消耗高达5 0 的能量。而 信号处理系统需要比普通嵌入式系统更大的内存容量,其内存访问所消耗的能量 占系统总体能量消耗的比例就更大( 甚至8 0 ) 。如果能够有效地降低这部分能量 消耗,对降低系统的总体能量消耗将大有贡献。而本文关注的重点是嵌入式系统 中存储模块子系统c a c h e 存储器的低功耗设计,旨在通过降低c a c h e 存储器的功 耗达到降低嵌入式系统功耗的目的。 2 3 嵌入式系统中c a c h e 概述 随着处理器主频的不断增长,存储器与主存之间的速度差距不断增大,而高 速c a c h e 的引人,大大减少了c p u 和主存之间的速度差距,提高了整个处理器系 统的性能。随着芯片集成度的提高,c a c h e 可以集成到微处理器内部,19 9 3 年i n t e l 首先在其p e n t i u m 微处理器中引入了1 6 k 的c a c h c ,后来马上增加到3 2 k ,并在 随后的处理器中有了更进一步的增加,i t a n i u m 微处理器包含了超过4 m b 的三级 c a c h e 。在通用计算机设计中,c a c h e 的设计已经引起了人们极大的关注,其大部 分的成果也应用到了嵌入式计算机中。 2 3 1 通用系统中c a c h e 的工作原理 由程序访问的局部性原理可知,经过若干次的访存之后,c p u 要访问的内容 大多数情况下已经在c a c h e 中,c p u 的读写操作主要在c p u 和c a c h e 之间进行。 c a c h e 的工作原理如图2 1 所示。c p u 访问存储器时,送出访问单元的地址,由地 址总线传送到c a c h e 控制器中的主存地址寄存器m a ,主存c a c h e 地址转换机构从 m a 获取地址并判断该单元内容是否已在c a c h e 中存有副本,若存在,则为命中; 若不存在,则为缺失。若命中,访问c a c h e ;若不命中,c p u 转去直接访问主存, 并将所需块调入c a c h e 。下面将通过对c a c h e 的放置方法、替换策略和c a c h e 的一致 性问题及其解决方法的介绍来具体阐述c a c h e 的工作原理。 1 c a c h e 放置方法 通常情况下,主存容量远大于c a c h e 的容量。因此,当要把个块从主存调入 c a c h e 时,就会涉及到如何放置的问题,这就是映射技术所要解决的。通常采用三 7 一 嵌入j 系统中低功耗c a c h e 的研究j 设计 种映射技术【7 ,8 】:直接映射( d i r e c t m a p p e d ) 、全相联映射( 如i l y a s s o c i a t i v e ) 和 组相联映射( s e t a s s o c i a t i v e ) 。直接映射方式下,主存的每个数据块只能放在c a c h e 的一个固定位置上;全相联映射方式下,主存的任意一数据块都可以放到c a c h e 的任意一块中;组相联映射方式是前两种映射方式的折中,它将c a c h e 和主存各分 成若干个大小相同的组,组间采用直接映射方式,而组内采用全相联映射方式。 在目前的微处理器中,通常采用组相联c a c h e 作为高速缓存。 地址总线 玉o ,i c a c h e 控 置换控 未命中 一 制部件 。-制部件 - v l 7 主 c p u 主存地 主存 c a c h e 地 c a c h e存 c a c h e命中储 址寄存_ 地址转 址寄存 c 存储器 c = 器 矿 c a c h e 器 换地址器 仑介 u 数据总线 uu 图2 1c a c h e 的工作原理 2 c a c h e 的替换算法 当发生c a c h e 不命中且调入的块与c a c h e 中的块发生冲突时,必须采用一定 的替换方式选择被替换的块。常见的替换算法有【7 8 】:随机替换算法( r a n d ) 、先 进先出替换算法( f i f o ) 、最近最少使用替换算法( l r u ) 。随机替换算法随机地选 择被替换的块;先进先出替换算法选择最早被调入的块作为被替换的块;最近最 少使用替换算法选择最近最少使用的块作为被替换的块。在这三种替换算法中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论