(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf_第1页
(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf_第2页
(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf_第3页
(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf_第4页
(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf_第5页
已阅读5页,还剩92页未读 继续免费阅读

(计算机系统结构专业论文)高性能嵌入式处理器低功耗技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 进入2 1 世纪以来,随着半导体工艺技术的发展,微处理器芯片的发展遇到 了很多机遇和挑战。其中,功耗成为处理器设计的重要限制因素。特别是对于嵌 入式处理器,由于体积、电池容量和便携性等原因,功耗问题尤为突出。并且随 着社会的发展和科技的进步,嵌入式处理器上的应用日益丰富。多媒体、娱乐、 网络浏览等原本桌面上的应用逐渐在嵌入式系统上普及,对嵌入式处理器的性能 提出了更高的要求。也就是说,研究人员需要在功耗受限的情况下进行高性能嵌 入式处理器的设计。 本文围绕高性能嵌入式处理器的功耗问题,开展了深入的研究,主要涉及功 耗评估技术、嵌入式处理器结构级低功耗优化技术和异构处理器的功耗有效性三 个方面。 本文的主要贡献如下: 1 提出了一个快速准确的处理器功耗评估方法。这一方法基于微处理器的 i 盯l 代码,采用e d a 工具和标准单元库获取处理器基本模块的有关功耗 数据,同时在f p g a 平台上获取模块的访问统计信息,通过以上信息可 以计算出处理器运行过程中的功耗。通过和e d a 功耗分析工具得到的功 耗结果进行对比,验证了该方法的准确性。最后采用该方法在f p g a 上 对大量程序的功耗进行了分析。该方法还可以动态记录处理器的功耗变 化情况。本方法的速度比结构级功耗模拟器和门级网表功耗分析方法要 快,并且具有门级网表级的准确度,为处理器的低功耗设计提供了快速、 高效、准确的研究平台。 2 提出了基于延迟写回的嵌入式处理器设计。本文以低功耗嵌入式处理器 为设计目标,在龙芯g s 2 3 2 处理器的基础上实现了寄存器堆延迟写回技 术,降低了处理器中寄存器堆的功耗。为了进一步提高效果,采用了限 制取指技术,使得寄存器堆功耗降低效果更加明显,同时也降低了指令 c a c h e 的功耗,并且采用前面提出的功耗评估方法对功耗进行了量化分 析。 3 提出了异构处理器功耗分析模型。运行同一个程序,小的处理器核相比 大核可以节约能量,这主要是由下面两个原因导致:1 ) 漏电功耗的比例 随着制造工艺的进步越来越高,处理器即使在空闲状态下也会消耗大量 的能量;2 ) 小的处理器核有比大的处理器核更高的性能功耗比。因此采 用异构处理器,使得对性能要求不高的程序运行在小核上可以节省大量 的能量。本文采用泊松过程来模拟程序的运行行为,并且采用实际程序 的功耗记录进行模拟,模拟实验结果表明异构处理器可以有效地节省能 摘要 量。 针对高性能嵌入式处理器的设计,本文在相关的低功耗研究上取得了一系列 有意义的成果,在龙芯g s 2 3 2 处理器的设计中起到了很好的作用,也为将来异 构嵌入式处理器的设计提供了参考和借鉴。 关键词:高性能嵌入式处理器功耗模型 功耗评估延迟写回异构 处理器f p g a 龙芯 i i a b s t r a c t e n t e r i n gt h e21s tc e n t u r y , w i t ht h e d e v e l o p m e n t o f i n t e 伊a t e d c i r c u i t t e c h n o l o g i e s , 也e d e v e l o p m e n to fm i c r o p r o c e s s o rc h i p h a se n c o u n t e r e dm a n y o p p o r t u n i t i e sa i l dc h a m l e n g e s p o 、e rc o n s 啪p t i o ni so n eo ft h em a i nc o n s t r a j n t so f p r o c e s s o rd e s i g n e s p e c i a l l yf o re m b e d d e dp r o c e s s o r s ,p o 、e rc o n s u m p t l o n 1 sm u c n m o r ei m p o r t a n tb e c a u s eo ft h ee m b e d d e ds y s t e m ss i z e ,t l l eb a n e r yc a p a c i t ya n dt h e p o r t a b i l i t yo fm o b i l ed e v i c e s a l o n gw i m m es o c i a ld e v e l o p m e n ta 1 1 da d v a n c e m e n to t s c i e n c ea n dt e c h n o l o g y ,a 】) p l i c a t i o n ss u c ha sm u l t i m e d i aa r e a ,e n t e r t a i 嗽e n ta r e w e b b r o w e r i n 2a 1 1 do t h e r so nt h ed e s k t o ps y s t e ma r e 舒a d u a l l yp o p u l a ri i le 瑚【b e d d e d s y s t e m s 越lt h e s ea p p l i c a t i o n sr e q u h ev e r ) ,h i 曲p e r f o r n l a l l c ee m b e d d e dp r o c e s s o r s - s or e s e a r c h e r sn e e dt od e s i g n1 1 i g h p e r f o 衄a n c ee m b e d d e dp r o c e s s o r s u n d e rl o w p o w e re n v e l o p e t h e 、柏r ki nm i st h e s i sc a r r i e dd e e p l yr e s e a r c h o nt h ep o w e ri s s u e so f h i g l l p e 血彻a j l c ee m b e d d e dp r o c e s s o r sa 1 1 dt h ew o r km a i n l yi n c l u d e st h r e ea s p e c t s : p r o c e s s o rp o 、v e rc o n s u m p t i o n e s t i m a t i o n t e c h n i q u e , s t m c t u r 2 l l 1 e v e l p o w e r o p t i m i z a t i o no fe m b e d d e dp r o c e s s o r s 甜l dt i l ep o w e re 伍c i e n c yo fh e t e r o g e n e o u s p r o c e s s o r s t h ef o l l o w i n ga r em em a i nc o n t r i b u t i o n so f t h i st h e s i s : 1 i m p l e m e n t a t i o no faf 如ta n da c c u r a t ee s t i m a t i o nm e m o d o fp r o c e s s o rp o w e r c o n s 啪p t i o nb a s e do nf p g a t m sm e t h o d u t i l i z e st h er t lc o d eo f m i c r o p r o c e s s o r ,r e t r i e v e se a c hm o d u l e s p o w e rc o n s 啪p n o nd a 协b yu s m g g 咖d a r dc e ul i b r a r i e sa n de d at o o l s m e 叫w h i l e ,m e n 1 0 d u l ea c c e s s i n f o m a t i o ni sa c q u i r e d 舶mf p g ap l a t f o r m b a s e do nt h ea b o v ed a t h c p o w e rc o n s u n l p t i o no ft h ep r o c e s s o rc a nb ec a l c u l a t e d t h ep r e c i s i o no f t h i s m e t h o dh a sb e e nv e r i f i e dw i ml l i 曲a c c u r a t i o nb yc o n l p 撕n g 谢t l lm e r e s u l t s o fe d a p o w e ra n a l y s i st o o l s al a 唱en u m b e r o fp r o g r a m s n m l l i n gp o 、v e ra r e a 1 1 a l y z e db yu s i n gt m sm e t l l o do nt h ef p g ap l a t f o n na r e n v a r d s t 1 1 i sm e m o d c a na l s od y n a m i c l yr e c o r dt h ev a r i t yo fp o w e rc o m s u m p t l o na n dl t l sm u c n f 瓠t e rt h a l ls t m c “l r a ll e v e lp o w e rs i m u l a t o ra 1 1 dg a t e - l e v e lp o 、v e ra n a l y z e r w i t lt 1 1 ep r o p e i r t yo fh i g ha c c 吡a c y ,t l l i sm e t h o dp r o v i d e saf 瓠t ,e 伍c i e n ta n d a c c u r a t ep o w e re s t i m a t i o np l a t f o m lf o rl o 、v p o w e rp r o c e s s o rd e s l g n 2 p r o p o s e de m b e d d e dp r o c e s s o rd e s i g nb a s e do nd e l a y - w d t e b a c kt e c h l l i q u e t h i st h e s i sh p l e m e n t e dr e g i s t e rf i l ed e l a y 一、v r i t e b a c k i ng o d s o ng s 2 3 2 i i i a b s t r a c t p r o c e s s o ra 1 1 dm ep o w e rc o n s u m p t i o no fr e g i s t e rf i l ei sm u c hr e d u c e d t b l o w e rm ep o w e rc o n s u m p t i o no f l ep r o c e s s o r 内呲h e r ,f e t c h - t h r o t t l i n gi s 叩p l i e da n d t l l ei c a c h e sp o w e ri sa l s or e d u c e d 1 1 1 e p r o p o s e dp o 、v e r e s t i m a t i o nm e m o di su s e dt oe v a i u a t em e p r o c e s s o r sp o 、e r - 3 p r o p o s e dh e t e r o g e n e o u sp r o c e s s o r sp o w e rc o n s u m p t i o na n a l y s i sm o d e l 1 1 1 e p o 、v e rc o n s u m p t i o ni sl o 、v e ri fap r o g r a mr u i l so nas m a l lp r o c e s s o rc o r e , r a t h e rt h a no nal a 玛ec o r e t h a t sd u et om ef o l l o w i n gt 、v or e a s o n s :1 ) t h e p r 叩o n i o no fl e a k a g ep o 、v e rt ot h et o t a lp o w e ri sb e c o m i n gm 曲e ra l o n gw i t h t h et e c l u l o l o g y sa d v a i l c e m e n t ,a j l dp r o c e s s o r 、i l lw a u s t ee n e r g yw h e ni t si n i d l es t a t e ;2 ) s m a l lc p uc o r eh a sm u c h1 1 i g h e rp e r f o 瑚a n c e p o w e rr a t i ot h a n l a 鸩ep r o c e s s o rc o r e s ob yl e t t i n gs o m e p r o g r a m s 、v h i c hr e q u i r el o w p e 廊r m a n c em no nt h es m a l lc o r ec a ns a v eal o to fe n e 玛y t h i st h e s i s s i m u l a t e sp r o g r a m sb e h a v i o r b yu s i n gp o i s s o n p r o c e s sa i l da d o p t i n gt h ea c t u a l p o 、v e rc o n s u m p t i o nr e c o r do fp r o 舀锄s t h er e s u l t so fm es i m u l a t i o n e x p e r i m e n t sp r o v e dt h a th e t e r o g e n e o u sp r o c e s s o r sa r ee n e r g y - s a v i n g a i m i n gt od e s i g nm 曲p e r f o 肋a 1 1 c ee m b e d d e dp r o c e s s o r s ,t h j st h e s i sa c h i e v e s s o m es i g n m c a n t 渤o v a t i o l l sw i t he x c e l l e n tp r a c t i c a b i l i t yb yf o c u s i n go nl o w p o 聃,e r r e s e a r c ha n dp a n so ft h ei i l o v a t i o n sc a nb ea p p l i e dd i r e c t l yo nt h ed e s i g no fg s 2 3 2 p r o c e s s o r ,a n da l s op r o v i d e sr e f e r e n c e sf o rt h ed e s i g no fm t u r eh e t e r o g e n e o u s h i 曲- p e r f o 册a n c ee m b e d d e dp r o c e s s o r s k e yw o r d s : h i g h - p e r f ;引r i n a n c e e n l b e d d e d p r o c e s s o r , p o w e r m o d e l , p o 、v e r e s t i m a t i o n ,d e l a yw 订t e b a c k ,h e t e r o g e n e o u sn - o c e s s o r ,f p g a ,g o d s o n i v 图目录 图目录 图1 1 单核处理器的性能提升曲线2 图1 2 现代微处理器的功耗。3 图1 3 手持设备的出货量5 图2 1 反相器电路。9 图2 2 反相器输出端从低变高的过程9 图2 3 短路电流的形成1 0 图2 4 漏电流和亚阈值电流示意图1 0 图2 5 现代刚s c 处理器结构简图12 图2 6o c e a n 运行时处理器定点队列占用率变化图1 5 图2 7 结构级功耗评估方法1 9 图2 8 不同级别的功耗估计误差2 0 图2 9 基于物理反标的功耗评估方法2 4 图2 1 0c p u 和d s p 分离的异构处理器2 5 图2 1lc p u 内部进行d s p 扩展的片上系统2 5 图2 1 2 未使用d v f s 和使用d v f s 前后的能量消耗2 7 图2 一1 3s o c 内部不同区域频率和电压之间的关系2 8 图3 1 基于f p g a 平台的功耗评估方法流程图3 0 图3 2g s 2 3 2 处理器功耗分布图3 0 图3 3a d d r 模块功耗分析脚本3 3 图3 4m m r s 总线有效时a d d r 模块功耗分析脚本( m mr s t c l ) 3 3 图3 5 各个模块的功耗结果( f u n c l ) 3 6 图3 - 6 各个模块的功耗结果( f u n c 2 ) 3 6 图3 7 各个模块的功耗结果( 1 i n u x ) 3 7 图3 8 各个模块的功耗结果( d h r y ) 。3 7 图3 9 操作队列项数为8 时各个模块的功耗结果( f 洫c 1 ) 3 8 v i i i 图目录 图3 - l o 操作队列项数为8 时各个模块的功耗结果( f u n c 2 ) 。3 8 图3 1 l 操作队列项数为8 时各个模块的功耗结果( 1 i n u x ) 3 9 图3 - 1 2 操作队列项数为8 时各个模块的功耗结果( d h d ,) 3 9 图3 - 1 3s m i c o 1 3 啪工艺下各个模块的功耗结果( f i m c l ) 。4 0 图3 1 4s m i c 0 1 3 啪工艺下各个模块的功耗结果( f i m c 2 ) 4 0 图3 一1 5s m i c 0 1 3 u m 工艺下各个模块的功耗结果( 1 i n u x ) 4 1 图3 一1 6s m i c o 1 3 u m 工艺下各个模块的功耗结果( d h d ,) 4 1 图3 - 1 7 采用门控时钟时各个模块的功耗结果( 如n c l ) 4 2 图3 - 1 8 采用门控时钟时各个模块的功耗结果( f u n c 2 ) 4 3 图3 一1 9 测试程序的i p c ( 从低到高) 4 5 图3 2 0 按i p c 从低到高排序的测试程序的功耗( s m i c 0 1 8 u m 工艺) 4 5 图3 2 1 按i p c 从低到高排序的测试程序的功耗( s m i c o 1 8 u m 工艺,采用门控时钟) 4 5 图3 2 2 按i p c 从低到高排序的测试程序的功耗( s m i c 0 1 3 u m 工艺) 4 6 图3 2 3w g e t 运行时的功耗变化图4 7 图4 1g s 2 3 2 处理器结构图5 2 图4 2w h e t s t o n e 的部分代码5 4 图4 3 操作队列的修改5 6 图4 4e e m b c 程序写定点寄存器堆的次数5 7 图4 - 5d h 叮s t o n e 在应用限制取指技术时的实验结果6 0 图4 6w h e t s t o n e 在应用限制取指技术时的实验结果6 0 图4 7e e m b c 程序在为2 ,3 ,4 ,5 时写定点寄存器堆的次数6 2 图4 8e e m b c 程序在为3 时i c a c h e 访问次数和命中次数6 2 图4 。9e d p 的节省百分比6 2 图4 1 0 定点寄存器堆的功耗降低百分比6 3 图4 1 l 浮点寄存器堆的功耗降低百分比6 3 图4 1 2 采取限制取指后指令缓存的能量节省百分比6 3 图5 1 异构处理器的结构6 6 i x 图目录 图5 2 异构处理器切换图6 6 图5 3g s 2 3 2 、g s 4 6 4 、l 2c a c h e 面积大小示意图6 7 图5 - 4g s 4 6 4 和g s 2 3 2 性能之比( s p e c 2 0 0 0 ) 6 7 图5 5g s 4 6 4 和g s 2 3 2 性能之比( e e m b c ) 6 7 图5 6 功耗之比k 和性能之比m 的关系7 0 图5 - 7 漏电比例为1 3 时功耗之比k 和性能之比m 的关系。7 0 图5 8 能量节省随地变化的曲线7 2 图5 9m e s a 的功耗变化曲线7 3 图5 1 0 采用t r a c e 模拟时的功耗节省7 3 图5 1 1 共享二级缓存的异构处理器结构7 4 x 表目录 表目录 表3 1a d d r 模块的输入信号3 2 表3 2a d d r 模块在不同情形下的能量消耗3 3 表3 3 测试程序的i p c 3 5 表3 4 处理器总功耗表4 3 表3 5 功耗评估工具速度对比4 4 表3 - 6 功耗和i p c 等参数之间的相关系数4 6 表4 一l 采用延迟写回前后队列有效队列项数目出现次数变化情况5 7 表4 2g s 2 3 2 处理器中功能部件的延时( 时钟周期数) 5 9 表5 1g s 4 6 4 、g s 2 3 2 、l 2c a c h e 的面积、功耗。6 7 表5 2 能量节省随k 变化的模拟结果7 2 x i 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成 果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写 过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确 的说明。 作者签名:e 缝垂签字日期:垫望i :兰 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥 有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交 论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人 提交的电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 , 留公开口保密(年) 作者签名:导师签名: 签字日期:堡望i :兰签字日期: 埤雏丛 鲨1 2 :笸:兰 第1 章绪论 第l 章绪论 微处理器芯片作为现代各种计算机设备的核心,引领信息技术迅速发展。一 直以来,微处理器基本上遵循着摩尔定律预测的速度向前发展,即集成度保持着 几乎每1 8 个月翻一番。随着集成度的提高,处理器的性能也稳步提高。但是近 年来,单核通用处理器的性能提高缓慢,微结构很难有较大的突破,处理器频率 的提升也成为一个非常困难的问题。在制约性能提升的因素中,功耗是至关重要 的一点。处理器的功耗很大程度上影响着芯片的封装、测试以及系统可靠性,因 此低功耗技术对于处理器的发展有着至关重要的意义。 在通用处理器遭遇性能瓶颈和功耗制约的同时,处理器技术的另一端嵌 入式处理器在功耗受限的情况下对性能的要求越来越高。近年来片上系统、移动 设备、消费电子等嵌入式领域快速发展,嵌入式设备上应用程序更加多样化( 如 视频、图像处理、游戏、文档处理、网络浏览等) ,逐渐向通用处理器靠拢,对 嵌入式处理器的性能提出了更高的要求。但是嵌入式系统对功耗的要求并没有降 低,因此如何在低功耗约束情况下设计高性能嵌入式处理器有着非常重要的意 义,也是本文的主要研究内容。解决好功耗问题,对于进一步提高处理器的性能 和可靠性、节约能源和延长移动设备的电池使用时间有着巨大的作用。 1 1 研究背景 1 1 1 微处理器发展现状 微处理器的性能在短短的四十年问取得了长足的进步,特别是在近年来发展 迅速,这得益于制造工艺的进步和结构的改进。制造工艺的进步带来了丰富的晶 体管资源,处理器的频率也得以进一步提升。目前基于4 5 n m 工艺制造的处理器 已经商业化,3 2 啪工艺的处理器也即将面向市场;处理器结构的不断改进也使 得处理器的i p c ( 每拍执行的指令数目) 不断提高。在经历从c i s c 到s c 的 转变后,研究人员通过对处理器流水线以及各个部件的精雕细琢,逐渐提高了处 理器的性能。 但是由于多方面的原因,目前单核处理器的性能提高放缓,微结构难以有较 大的突破,处理器频率的提升也成为一个非常困难的问题。如图1 1 所示,单核 处理器的性能在经历约十年的高速增长后逐渐放缓( h e 皿e s s ya 1 1 dp a t t e r s o n ,2 0 0 6 , a s a n o v i ce ta l ,2 0 0 6 ) 。在近些年的研究工作中,研究人员尝试了多种方法来提升 单核处理器的性能,如提高超标量处理器的发射宽度或采用超长指令字。这些技 术通常都会使处理器的复杂度和功耗变得难以控制,并且对性能的提升效果有 第l 章绪论 限。其中有些技术甚至会增加编程难度。在这种情形下,学术界和工业界将处理 器的发展带入到了多核时代。最早如s t a l l f o r d 的h y d r a 、m i t 的r a w ,在工业 界,i b m 、s u n 、i n t e l 和a m d 等都相继推出了多核处理器。 1 9 7 81 9 8 01 9 8 21 9 8 41 9 8 61 9 8 8 1 9 9 0 1 9 9 2 1 9 9 41 9 9 61 9 9 8 2 0 0 0 2 0 0 2 2 0 0 42 0 0 6 图1 1 单核处理器的性能提升曲线 类似地,在嵌入式领域,嵌入式处理器不可能像通用处理器那样采用各种方 法来提高指令集并行性,因为这会增加处理器的功耗,使得性能功耗比降低。并 且通用处理器领域的发展历程也表明这条路线行不通,因此嵌入式处理器也开始 采用多核设计方法。 处理器在步入多核时代的同时仍然面临着很多难题,其中功耗和能源的限制 是影响并制约处理器发展的主要因素( m u d g e ,2 0 0 1 ) 。处理器制造工艺的进步使得 每个晶体管的功耗得以降低,但是由于片内集成了越来越多的晶体管资源,因而 整个芯片的总功耗并没有降低。图1 2 给出了一些典型处理器的功耗数据,可以 发现处理器的功耗在不断增长后维持在了一个较高的水平上。如果处理器的功耗 继续升高的话,会使得芯片的封装、散热和使用变得非常困难。因此在封装和散 热技术没有突破的情况下,处理器设计人员只能在功耗受限的情况下进行设计。 正因为如此,处理器功耗的增加并没有前几年那么明显,但是这也使得处理器的 性能也受到了限制,增长速度放缓。随着制造工艺的进步,集成电路的功耗呈现 如下趋势: 2 第l 章绪论 图1 2 现代微处理器的功耗 首先得益于工艺的进步,芯片电压相应地减小,晶体管的动态功耗也相应地 降低,这样即使晶体管总数增加,总功耗的增加也很小。处理器功耗变化趋势的 另一个特点是晶体管栅氧的厚度变薄,这使得漏电流变大,致使漏电功耗在总功 耗中的比重正逐渐加大。漏电功耗与动态功耗在设计优化的方法和策略上存在着 差异,因此也必然增加了芯片设计的难度。由于芯片面积随着工艺进步在逐渐缩 小,纳米级工艺的进步实际上增加了芯片的功耗密度。表1 1 列出了9 0 i i l ,6 5 m 及4 5 n i i l 工艺下不同类型功耗密度的对比( 赵继业等,2 0 0 8 ) 。功耗密度升高带 来的直接影响就是对封装散热能力要求的进一步提高,同时也会使芯片内部的温 度增加,进一步降低器件工作的性能;更为严重的是,温度与漏电功耗之间存在 一个正反馈温度升高会使得漏电功耗大大增加( 一般为指数关系) 。并且无 论晶体管工作与否,漏电功耗总是存在。 表1 1 不同工艺下功耗密度对比 9 0 n r n 6 5 n m 4 5 n m 每平方厘米动态功耗 1 x 1 4 x 2 x 每平方厘米静态功耗 l x 2 5 x 6 5 x 每平方厘米总功耗 l x 2 x4 x 1 1 2 嵌入式处理器发展动态 嵌入式处理器是嵌入式系统的核心部件,是控制、辅助系统运行的硬件单元。 第l 章绪论 嵌入式处理器最早应用于工业控制领域,其目的是对工业设备的智能化控制。随 着嵌入式软硬件技术的发展和需求的高速增长,无所不在的计算使得嵌入式处理 器已经遍及我们能够想象得到的各个角落,在家电、通讯、网络、工业控制、医 疗、汽车电子和消费电子等行业都得到了广泛的应用( s c h l e t t ,1 9 9 8 ) 。v d c 研 究集团公司( v d cr e s e a r c hg r o u pi n c ) 称2 0 0 8 年的嵌入式处理器出货量超过了 1 0 0 亿片( v d c ,2 0 0 9 ) ,数量远远超过通用处理器。 从规格、性能、应用等各个方面来看,嵌入式处理器的范围都非常广泛,包 括最初的4 位微处理器、目前仍在大规模应用的8 位单片机和最近受到广泛青睐 的3 2 位嵌入式处理器。现在世界上具有嵌入式特点的处理器已经超过1 0 0 0 种, 体系结构包括a i t m ,s u p e r h ,m i p s ,p o 、v e r p c ,s p a r c ,8 0 5 1 ,c o l d f i r e 等。 嵌入式处理器通常被分为如下三类:嵌入式微处理器( m i c r o p r o c e s s o ru n i t , m p 、嵌入式微控制器( m i c r o c o n t r 0 1 l e ru n i t ,m c 和嵌入式数字信号处理器 ( d 酶t a ls i g n a lp r o c e s s o r ,d s p ) 。m c u 被广泛应用于各种各样的特殊场合;d s p 用于需要进行密集计算的场合;而m p u 兼具高性能和低成本优势,在手持移动 设备领域应用广泛。 随着科技的发展和社会的进步,嵌入式处理器的发展也出现了一些新的趋 势,主要体现在高性能和低功耗两方面。 1 高性能。与高性能通用处理器不同,嵌入式设计人员主要是根据市场和 应用需求来进行嵌入式系统的设计。现在嵌入式处理器的应用领域不断扩大、应 用程序日益复杂,使得嵌入式处理器的性能必须相应提高。如手机、数码相机、 m p 3 播放机、p d a 、游戏机等手持设备以及各种信息家电等有更高性能要求的 多媒体和通信设备不断涌现;传统的电视机、汽车音响以及电子玩具等传统应用 也具有了更多的数字化功能。这些应用对处理器的性能和存储器的容量提出了很 高的要求,传统的m c u 满足不了这方面的需求。 另一方面由于技术发展的推动,高端3 2 位嵌入式处理器的价格不断下降, 处理器厂商不断提高开发工具的灵活性和智能化程度,开发环境不断改善,嵌入 式开发门槛也随之降低。正是由于这些条件,设计实现高性能嵌入式处理器成为 可能,并且能够满足前面提到的各种应用需求。目前3 2 位的s c 嵌入式处理 器已经成为中高端嵌入式应用和设计的主流。 促使嵌入式系统快速发展的原因还有i p ( i n t e l l e c t u a lp r o p e r t y ) 重用的设计方 法。i p 复用降低了设计和验证成本,缩短了设计时间,提高了生产率。另外, m i c r o b l a z e 和n 1 0 s 等f p g a 厂商提供的嵌入式软核i p 大大地提高了嵌入式处 理器的设计的灵活性。 手机是人们接触非常广泛的一项产品,我们可以清晰地通过其发展历史看到 4 第l 章绪论 性能的提升。早期的手机只能用来进行语音通话,而现在的智能手机已经具有丰 富的多媒体、网络浏览、游戏等功能,这些应用需要性能强大的处理器作为支撑。 图1 3 ( z e l o s g r o u p 2 0 0 4 ) 给出了近年来手持设备的出货数量和增长速度,可以看 到其中智能手机( f i l l l f e a 柚r eh a l l d s e 臼) 所占的百分比在逐年增长,2 0 0 8 年已经达 到4 2 5 ,按照这个趋势到2 们5 年智能手机将会占有所有手持设备市场。 q o h 驯呵瞄蝣刚午e 曲峨岫 妇如 箍i l l 2 mm 醚瓣擞愁戮;巍黧,篓瓣飘爨 1 丽丽i 磊蠢面面百 图l o 手持设备的出货量 目前在3 2 位嵌入式微处理器i p 市场上出现了一家独太的局面,基于a r m 架构的微处理器在市场上处于绝对的领导地位。通用处理器厂商英特尔推出的 a t o m 处理器已经占领了大部分上网本市场,并且计划在2 0 1 1 年推出3 2 蛐 m e d 丘e l d 处理器,进军智能手机、音乐播放器、心率监视器等消费级电子设备市 场,这也从一个侧面说明通用处理器和嵌入式处理器存在融合的趋势,嵌入式处 理器的性能在向通用处理器靠拢。 2 低功耗。嵌入式系统的功耗问题相比桌面通用处理器更为重要。一方面 是由于嵌入式系统体积小,散热条件较差,限制了其功耗设计上限;另一方面, 由于大量的嵌入式设各采用电池供电,较大的功耗会要求更高容量的电池意味 着成本的增加,并且电池容量的增长速度远远落后于微处理器的发展,因此必须 在功耗受限的情况下进行嵌入式系统的设计。在嵌入式处理器的发展历程中,诞 生了各种功耗优化技术,如a r m 处理器具有硬件性能监视嚣、动态时钟控制、 动态电压调节、省电模式等多种用于节约能量的技术。在嵌入式系统设计过程中, 设计人员在系统软件设计、处理器结构、电路设计等层次都会采取相应的低功耗 优化技术。 第l 章绪论 1 1 3 功耗问题的重要性 前文已经提到了通用处理器和嵌入式处理器所遇到的功耗问题:功耗制约了 处理器性能的进一步提高,导致设计人员必须在功耗受限的情况下进行处理器设 计。功耗问题只是在近几年才暴露出来,并且为设计人员所重视。多个因素集中 在一起,使得人们意识到了功耗问题的重要性: 1 高功耗会带来高成本。对于便携式移动设备来说,高功耗意味着更高容 量的电池,也即意味着成本的增加。另外功耗大小也直接决定了芯片的封装形式 和封装成本。不同的芯片封装材料有着不同的热阻,热阻代表了封装材料散热能 力。对于工作温度较低的芯片,我们可以采用成本较低的塑料封装;而对工作温 度较高的芯片,必须采用成本更高的陶瓷封装,以保证芯片不会被烧毁。另外温 度过高的芯片需要良好的散热方式,如散热片、风扇、水冷等,散热方式必须随 着功耗的增加而改进,从而成本也会不可避免地增加。 2 高功耗会影响设备的便携性。移动设备需要有非常高的便携性,过多的 热量会导致温度升高,影响便携式设备的使用舒适度。另外功耗的增加会导致使 用时间缩短,而移动设备的工作时间是用户非常看重的一个参数。 3 低功耗是环保的需要。高功耗的处理器需要风扇来散热,而风扇会带来噪 音污染。电脑同时也是能耗大户,节约电脑的能量消耗是保护环境的必要措施。 节能性也必然会成为评估计算机的一个重要指标。 4 高功耗会影响处理器的可靠性。过高的功耗将会导致器件的工作温度升 高,继而严重降低系统的可靠性,使电路失效,如电气参数的改变,抗噪性能的 下降和电子迁移等。功耗密度的增加会使得芯片部分区域的温度急剧升高,以至 于会烧毁芯片。所以对于高可靠性的芯片设计,功耗是一个十分重要的设计参数, 必须采取有效的低功耗设计方法加以保证。 功耗升高带来的最严重的问题是制约了性能的提升。这是因为人们对计算机 最核心的要求是高性能,并且人们对性能的追求是没有止境的。研究人员为了克 服功耗问题,在处理器设计的各个层次都提出了各种低功耗技术,下一章将会详 细介绍。 1 2 论文目标与研究内容 基于前面提到的嵌入式处理器面临的高性能需求和低功耗约束两个问题考 虑,本文的主要研究对象是高性能嵌入式处理器,这类处理器被广泛地应用于智 能手机、移动互联网设备( m o b i l ei n t e m e td e v i c e ,m i d ) 、上网本等便携式设备。 地设计这类处理器是本文的主要研究目标。龙芯课题组目前拥有g s 2 3 2 和g s 4 6 4 6 第1 章绪论 处理器i p 核,可以作为设计基础。龙芯g s 2 3 2 处理器核是本文中除低功耗外的 另一条主线。 本文的研究工作旨在研究处理器功耗评估方法,探索高性能嵌入式处理器低 功耗设计技术,具体包括以下内容: 第一,在充分调研国内外低功耗技术的基础上,提出了基于f p g a 的功耗评 估方法,以龙芯g s 2 3 2 处理器为对象进行了实验,结果表明该方法具有很快的 评估速度和很高准确性。该方法首先通过r t l 综合生成的门级网表得到处理器 各个模块在不同情况下的能量消耗,然后在处理器中加入统计计数器对各个模块 所处的各种情况进行计数。接下来在f p g a 上运行工作负载,在获取处理器性能 数据的同时,还可以得到统计计数器中的数据,通过以上信息可以计算出处理器 的功耗情况。因为各个模块的功耗数据来源于i 汀l 代码和标准单元库,所以该 方法具有很高的准确性;又由于统计数据是在f p g a 平台上获得的,因此也具有 相当快的速度。本文也对提出的功耗评估方法进行了充分的验证,包括采用不同 制造工艺的情况、采用不同结构参数以及采用门控时钟的情况。本文也应用该方 法在f p g a 平台上对e e m b c 测试程序的功耗进行了评估。这部分工作是本文的 核心工作,其特点主要体现在一下三个方面:1 ) 该工作基于f p g a 平台,在f p g a 上进行实验,使得功耗评估的速度得到了很大的提升。传统的结构级功耗评估工 具和用高级语言编写的结构模拟器结合在一起,模拟器的运行速度缓慢,制约了 研究工作的开展。特别是随着处理器结构日益复杂、众核处理器的出现,模拟器 的速度呈现下降的趋势,运行大量复杂的基准测试程序需要几天甚至一个月。2 ) 处理器基本模块的功耗数据直接来源于逻辑综合后的门级网表仿真和门级功耗 分析,使得功耗评估结果非常准确。本文的工作基于龙芯g s 2 3 2 处理器,拥有 r t l 代码和完善的测试程序,在拥有r t l 代码的情况下,通过综合得到门级网 表是个非常简单的过程,因此可以比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论