(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf_第1页
(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf_第2页
(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf_第3页
(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf_第4页
(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(计算机系统结构专业论文)片内多核微处理器温度可知的布图规划及线程映像研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内蒙古大学硕士学位论文 片内多核微处理器温度可知的布图规划及线程映像研究 摘要 随着半导体制造工艺的不断改进,处理器的功耗迅速上升。功耗 以热能的形式向外散发,使处理器的温度不断上升。处理器的工作温 度超过阈值温度时,就会使处理器的工作变得不稳定,降低处理器的 可靠性,甚至会发生物理损坏。因此温度已经成为处理器设计过程中 的一个重要的考虑因素。为了解决这个问题,研究人员引入动态热管 理技术( d y n a m i ct h e r m a lm a n a g e m e n t ,简称d t m ) ,以保证处理器 的温度不会超过阈值温度。但是d t m 技术会降低处理器的性能。 片内多核处理器( c h i pm u l t i c o r ep r o c e s s o r ,简称c m p ) 已经 成为微处理器设计的主流。c m p 同时运行多线程,消耗的功耗比超标 量处理器的多,因此c m p 中温度问题变得更为严峻。各种不同的降低 处理器温度的方法应运而生:活动迁移、温度可知的0 s 调度、有效 的温度扼杀机制、温度可知的布图规划、温度可知的编译等等。c m p 以更高的性能,可通过线程调度,提高应用程序线程级的并行性、均 匀地分配工作负载、增加了散热空间、降低了设计的复杂度。 本文是从多核处理器芯片布局和线程映像的角度研究降低处理 器温度的方法,以减少触发d t m 的次数来提高处理器的性能,更好地 发挥多核处理器潜在的性能。 本文的主要工作如下: 首先,根据热扩散模型对测试程序的分类方法进行了研究,并用 这种方法对s p e cc p u 2 0 0 0 测试集进行了分类。将2 6 个测试程序按 稳定状态时峰值温度的高低,分为热( h o t ) 、温( w a r m ) 、冷( c 0 0 1 ) 片内多核微处理器温度可知的布图规划及线程映像研究 三类。然后进一步讨论了测试程序的热特征与程序行为之间的关系。 实验结果表明,根据热扩散模型对测程序进行分类能够正确地反映出 各类测试程序的热特征和程序行为。 其次,采用旋转单核芯片布局的方法设计了热可知的多核处理器 的芯片布局,并对芯片布局上运行的工作负载的峰值温度和平均温度 进行了模拟计算,进一步研究了芯片布局与温度之间的关系。实验结 果表明,在由旋转方法生成的四核处理器芯片布局上运行双线程、三 线程、四线程时,峰值温度可分别降低o 3 1 、0 0 9 、0 3 6 。 再次,多核处理器上运行同一个工作负载的不同映像时,温度差 可达3 4o c 。因此,本文提出了一种均匀分布热量的映像生成算法, 由该算法得出的映像与随机方法生成的映像进行比较。实验结果表 明,该算法给出的映像温度接近随机方法生成映像的下界,这说明本 文中提出的线程映像算法是有效的。 关键字:热扩散模型,多核处理器的布图规划,工作负载的映像, 峰值温度,平均温度 内蒙古大学硕士学位论文 r e s e a r c ho nt h e rm a i ,a w a i 之el o o i 心l a n n i n g a n dt h r e a dm a p p i n gi nc m pp r o c e ss o r a bs t r a c t p o w e r c o n s u m p t i o n i n c r e a s e s d r a m a t i c a l l y w i t ht h e i m p r o v e m e n t o f s e m i c o n d u c t o rm a n u f a c t u r i n gt e c h n o l o g y e n e r g yc o n s u m e db yt h em i c r o p r o c e s s o ri s c o n v e r t e di n t oh e a tw h i c hc a u s e st h ep r o c e s s o rt e m p e r a t u r ei n c r e a s i n gc o n f i n u o u s l 弘 w h e nt h ec h i pt e m p e r a t u r es u r p a s s e st h et h r e s h o l d ,p r o c e s s o rb e c o m e si n s t a b l e ,t h e r e l i a b i l i t yi sr e d u c e ds i g n i f i c a n t l y , a n do v e np h y s i c a ld a m a g em i g h to c c u r t h e r e f o r e t h et e m p e r a t u r eb e c o m e sa l li m p o r t a n tc o n s t r a i n tf o rn o w a d a y sp r o c e s s o rd e s i g n r e s e a r c h e r si nl i t e r a t u r ee x p l o i td y n a m i ct h e r m a lm a n a g e m e n t ( d t m ) t e c h n o l o g yt o l e v e r a g et h et e m p e r a t u r ep r o b l e m b u ta tt h es a l i l et i m eo fr e d u c i n gt e m p e r a t u r e , d t mw i l ld e c r e a s et h ep e r f o r m a n c eo f p r o c e s s o ra sa r e s u l t c h i pm u l t i c o r ep r o c e s s o r ( c m p ) h a s b e c o m et h em a i n s t r e a mi nm i c r o p r o c e s s o r m a n u f a c t u r i n gi n d u s t r y i nc m pp r o c e s s o r , m u l t i p l et h r e a d sr u nc o n c u r r e n t l ya n d c o n s u m em o r ep o w e rt h a ni nt r a d i t i o n a ls u p e r s c a l a rp r o c e s s o r t h u st h et h e r m a li s s u e b e c o m e sm o r es e v e r et h e nb e f o r e d i f f e r e n tw a y so fr e d u c i n gc m pp r o c e s s o r t e m p e r a t u r eh a v eb e e np r o p o s e di na c a d e m i ca n di n d u s t r yi n t e r a t u r e s o m eo ft h e m i n c l u d et h r e a d a c t i v i t ym i g r a t i o n ,t e m p e r a t u r ea w a r eo ss c h e d u l i n g ,e f f i c i e n t t e m p e r a t u r et h r o t t l i n gm e c h a n i s m ,t e m p e r a t u r ea w a r ef l o o r p l a n n i n g , t e m p e r a t u r e a w a r ec o m p i l i n g , a n ds oo n c m pi m p r o v e st h et h r e a dl e v e lp a r a l l e l i s mo fa p p l i c a t i o n t ot h r e a ds c h e d u l i n g ,a s s i g nw o r k l o a ds oe v e nt h a tt h e r m a ls p a c ei se n h a n c e d , r e d u c e s t h ec o m p l e x i t yo fd e s i g n ,a n di sa b l et or e u s ed e s i g n i nt h i sp a p e r , at h e r m a la w a r ef l o o r p l a n n i n gs c h e m ef o rc m pp r o c e s s o ra n d t h r e a dm a p p i n gp o l i c i e sa r ei n v e s t i g a t e di no r d e rt ol e v e r a g et h et h e r m a lp r o b l e m 1 1 h e o b j e c t i v ei s t or e d u c et h et i m eo ft r i g g e r i n gd t ms oa st oi m p r o v et h ep r o c e s s o r p e r f o r m a n c ea sa r e s u l t t h em a i nc o n t r i b u t i o n so ft h i sp a p e ra r ea sf o l l o w s f i r s t , ab e n c h m a r ke l a s s i f i n gs c h e m eb a s e d0 1 1h e a ts p r e a d i n gm o d e li sp r o p o s e d i nt h i sp a p e r u s i n g0 1 1 1 s c h e m e ,t w e n t y - s i xp r o g r a m si ns p e cc p u 2 0 0 0s u i t ea r e c l a s s i f i e di n t ot h r e ec a t e g o r i e sa c c o r d i n gt ot h el e v e lo fp e a kt e m p e r a t u r eo fs t e a d y 片内多核微处理器温度可知的布图规划及线程映像研究 s t a t e :h o t ,w a r m ,a n dc 0 0 1 t h e nt h er e l a t i o n s h i pb e t w e e nt h et h e r m a lc h a r a c t e r i s t i c o fb e n c h m a r ka n dt h ep r o g r a mb e h a v i o ri sd i s c u s s e d e x p e r i m e n t a lr e s u l t ss h o wt h a t b e n c h m a r kc l a s s i f i c a t i o nb a s e do nh e a t s p r e a d i n gm o d a lr e f l e c t s t h et h e r m a l c h a r a c t e r i s t i ca n dp r o g r a mb e h a v i o ro f e a c hb e n c h m a r kc o r r e c t l y s e c o n d ,at h e r m a la w a r ef l o o r p l a n n i n gm e t h o df o rc m pp r o c e s s o ri sp r o p o s e d t h r o u g hr o t a t i n gas i n g l ec o r e sf l o o r p l a n a n dt h er e l a t i o n s h i pb e t w e e nf l o o r p l a na n d t e m p e a r a t u r ei ss t u d y e d e x p e r i m e n t a lr e s u l t ss h o w t h a tr e d u c t i o no fp e a kt e m p e r a t u r e c a nb eu pt oo 3 1 、0 0 9 c 、0 3 6 cr e s p e c t i v e l yw h e nt w ot h r e a d so f w o r k l o a d ,t h r e e t h r e a d so fw o r k l o a d ,f o u rt h r e a d so fw o r k l o a dr u no naa l p h a - e v 6l i k eq u a d - c o r e p r o c e s s o r a tl a s t ,t h ed i f f e r e n c eo fp e a kt e m p e r a t u r ec a nb eu pt o3 - - 4 cf o rt h ed i f f e r e n t m a p p m g sw h e na ni d e n t i c a lw o r k l o a dr u n n i n go nc m p at h e m a la w a r et h r e a d m a p p i n ga l g o r i t h m w h i c hc a ne v e n l yd i s t r i b u t eh e a te n e r g ya m o n gt h e c h i p i s p r o p o s e d w ec o m p a r et h ep e a kt e m p e r a t u r eo f t h ep r o p o s e dm a p p i n g 谢t hm o r et h a n h u n d r e dd i f f e r e mr a n d o m l yg e n e r a t e dm a p p i n g sa n df i n dt h a to u rs c h e m ei se f f e c t i v e t oo b t a i nam a p p m gw h i c hi sc l o s et ol o w e rb o u n do ft h er a n g e k e y w o r d s :h e a t s p r e a d i n gm o d e l ,t h ef l o o r p l a n n i n go fm u l t i - c o r ep r o c e s s o r , t h em a p p i n go fw o r k l o a d ,p e a kt e m p e r a t u r e ,a v e r a g et e m p e r a t u r e i v 内蒙古大学硕士学位论文 图表目录 图2 1h o t s p o t 模拟器的模型结构1 5 图2 2 具有两层结构的a t m i 模拟纠2 8 1 17 图2 3a t m i 模拟器物理结构示意图1 9 图2 4 芯片封装1 9 图2 5 详细的芯片封装刚3 3 1 1 9 图2 6a l p h a2 1 2 6 4 芯片布局示意图2 4 图2 7 由预热的功耗密度计算出的稳定状态时的温度分布2 4 图2 8 三个四核处理器的芯片布局;( a ) 由旋转方法生成的芯片布局;( b ) 和( c ) b a s e l i n e 芯片布局2 5 图2 91 6 核处理器的布图规划示意图2 5 图2 1o2 6 个测试程序温度曲线图2 7 图2 1 12 6 个测试程序的温度分布图2 7 图2 1 2 体系结构模型与温度模型分离执行的示意图3 2 图3 1 双核处理器的四种芯片布局示意图3 4 图3 2 ( a ) 双核处理器上运行的工作负载的峰值温度曲线;( b ) 双核处理器上运行 的工作负载的平均温度曲线3 5 图3 3 双核处理器的温度分布;( a ) 为a 芯片布局的温度分布;( b ) 为b 芯片布局 的温度分布;( c ) 为c 芯片布局的温度分布;( d ) 为d 芯片布局的温度分布3 6 图3 4c o r e o ,l 、c o r e o ,2 和c o r e o ,3 上运行2 线程的峰值温度和平均温度的曲 l 目i 图3 8 图3 5c o r e o ,1 ,2 上运行3 线程的峰值温度和平均温度的曲线图3 9 图3 6 四核处理器上运行4 线程的峰值温度和平均温度的曲线图4 0 图3 7 ( a ) b a s e l i n e l 的温度分布,c o ) n e 、) i r 芯片布局的温度分布4 1 图3 8 ( a ) n c w 芯片布局上运行的双线程的温度分布;( b ) b a s e l i n e l 上运行双线程 的温度分布;( c ) b a s e l i n e 2 上运行双线程的温度分布4 1 图3 9 ( a ) n c w 布图规划的温度分布;c o ) b a s e l i n e l 的温度分布;( c ) b a s e l i n e 2 的温 v 片内多核微处理器温度可知的布图规划及线程映像研究 度分布4 2 图3 1 0 ( a ) n e w 布图规划温度分布;( b ) b a s e l i n e l 的温度分布;( c ) b a s e l i n e 2 的温度 分布4 3 图4 1 ( a ) 8 线程映像;c o ) 1 2 线程映像;( c ) 1 6 线程映像;4 9 图4 28 线程映像的不同映像的峰值温度和平均温度4 9 图4 31 2 线程映像的不同映像的峰值温度和平均温度5 0 图4 41 6 线程映像的不同映像的峰值温度和平均温度5 0 表2 1 测试程序快速执行( f a s t f o r w a r d ) 的指令条数1 2 表2 2 模拟的处理器体系结构配置的参数( 单核处理器) 1 3 表2 3a t m i 的边界条件和初始条件【2 引。1 7 表2 4 a t m i 模拟器的参数、单位及意义1 8 表2 5 芯片的物理材料的特性2 0 表2 6 由温度特征来分类测试程序。2 9 表2 7 以峰值温度的高低对测试程序进行分类3 0 表3 1 双核处理器上所运行的工作负载3 5 表3 2 二、三、四线程的工作负载及类型3 8 表3 3 四核处理器上运行双线程的峰值温度和平均温度的平均值4 l 表3 4c o r e 0 ,1 ,2 上运行三线程的峰值温度和平均温度的平均值4 3 表3 5 四核处理器上运行四线程的峰值温度和平均温度的平均值4 4 表4 1 由4 线程工作负载生成的映像。4 6 表4 2 四核处理器上运行不同映像的峰值温度和平均温度4 7 v i 原创性声明 本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得 的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得凼苤直态堂及其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 学位毒文作者签名:垄塑璺苎 e t 期:趋咀:笸 指导教师签名:雄:凰瞄砭弘磊 e t 期:趔2 : 本文提出基于热扩散模型的测试程序分类的方法。通过对s p e cc p u 2 0 0 0 测试集的分类证明了本文中所提出的方法是正确有效的,并给出s p e c 测试集的 热特征的分类。对s p e cc p u2 0 0 0 测试集中的全部测试程序进行温度模拟,画 出瞬间温度的曲线图。以测试程序的峰值温度的高低将2 6 个测试程序分为热 ( h o t ) 、温( w a r m ) 、冷( c 0 0 1 ) 三类。在此基础上,按照访问频率高的块通常 比较热的特征,由测试程序的温度行为反导出测试程序的程序行为。由测试程序 的热特征将测试程序分为计算密集型( c p u i n t e n s i v e ) 和存储密集型 ( m e m o r y - i n t e n s i v e ) 两大类。 提出热可知的布图规划( t h e r m a la w r l ef l o o r p l a n n i n g ) 的方法。利用测试 程序运行时c p u 核的温度相对较高的特点,在多核处理器布图规划的时候应考 虑使热点之间的影响最小。本文中所使用的方法与文献【1 6 1 中的方法有本质的区 别,文献【1 6 】是将核中温度较低的块靠近温度较高的块。而本文中提出的方法是将 处理器中所有热点之间的距离最大化,使热量均匀地分布在芯片上,这种多核处 理器的芯片布局能够在满负荷运行时最大幅度地降低平均温度。 多核处理器布图规划优劣的比较:在负载相同、映像相同的情况下,比较 不同芯片布局之间峰值温度和平均温度的高低,观察哪种芯片布局会对降低峰值 温度或平均温度更有利。实验结果显示,本论文所提出的热可知的布图规划方法 在满负载的情况下能够降低峰值温度,在非满负荷的情况下峰值温度也不会高于 其他的芯片布局的峰值温度。热可知的芯片布局方法所给出的芯片布局的平均温 9 片内多核微处理器温度可知的布图规划及线程映像研究 度低于b a s e l i n e 芯片布局的平均温度。 基于芯片布局可知的静态线程映像的研究。芯片布局已定的前提下,本文 提出一种既能够降低峰值温度,又能够降低平均温度的线程映像算法。由于工作 负载组合的多样性和线程在处理器核上映像的复杂性,使探索空间非常大。因此 采用随机方法生成的映像,与由芯片布局可知的线程映像算法生成的映像相比, 经过模拟之后发现:在8 线程工作负载下,算法给出的映像虽然在起初时平均温 度比较高,但随着测试程序的执行,平均温度有逐渐下降的趋势。在1 2 线程、 1 6 线程的工作负载中,由算法生成的映像的峰值温度低于随机方法生成映像的 温度下界。 1 4 论文组织结构 本论文的组织结构如下t 第一章为前言,主要介绍了本论文的研究背景,片内多核处理器温度问题的 由来,学术界和工业界对温度问题的解决方法,以及本论文的主要思想及主要贡 献。 第二章中主要描述了热模拟器。介绍了目前广泛使用的模拟器,a t m i 模拟 器的模型结构以及生成多核处理器芯片布局的方法、模拟方法等。本文中所采用 的功耗提取与温度模拟相分离的方法是为了权衡模拟精度与计算时间而采用的 方法。 第三章中主要介绍了对不同的多核处理器芯片布局优劣进行比较的实验。在 不同的多核处理器芯片布局上,执行工作负载后以峰值温度的降低的大小作为评 价多核处理器芯片布局优劣的标准。本章的实验是在双核、四核处理器上进行的。 第四章中主要介绍了在芯片布局已定的条件下讨论一种基于芯片布局可知 的静态线程映像算法,峰值温度和平均温度作为评估线程映像优劣的度量标准。 第五章中总结了本文的主要工作,并对今后工作做出展望。 1 0 内蒙古大学硕士学位论文 第二章温度模拟器的介绍 2 1 模拟器的背景与a t m i 模拟器的介绍 2 1 1 相关工作 以测试程序作为研究对象,研究测试程序运行时的程序行为和热特征,提出 有利于降低片内温度的芯片布局是目前芯片设计初期的一项重要工作。 k s a n k a r a n a m y a n a n ,k s k a d r o n 等在文献【l6 】中使用h o t s p o t 中提供的布图规划工 具- h o t f l o o r p l 趾来重新设计芯片布局。他们在热单元周围布置一些通常温度 不会很高的冷单元,增加向侧面扩散的热量,加大了降低峰值温度( p e a k t e m p e r a t u r e ) 的潜在性。这种算法虽然采用模拟退火算法,但是它的计算量会由 于单元数的增加而变得非常大。yh a r t 等在文献【1 7 】中,进行布图规划时不仅考虑 了测试程序的温度,而且考虑了各单元之间连线长度的估计延迟时间,进而评估 处理器性能。d c h a t t e r j e e 等在文献【18 】中布图规划时,以功耗密度作为研究对 象,使功耗密度函数的梯度最大,以此降低峰值温度。而且他们采用多目标进化 算法来改进h o t f l o o r p l a n ,大大提高了计算速度。 以前研究人员所做的工作都是通过对块的位置进行调整的方法来降低峰值 温度。本文生成多核处理器芯片布局的基本思想也是通过布图规划来降低峰值温 度,但是本文中的方法是核级的布图规划( c o r el e v e lf l o o r p l a n n i n g ) 。这种方法的 好处是:( 1 ) 不必考虑核内各个块的放置位置,从而大大减少了布图规划的计算 量;( 2 ) 这样生成的多核处理器的性能与核之间通讯延迟有关系,与块之间的线 延迟无关,因此这样布图规划使多核处理器的性能评估变得容易。( 3 ) 在芯片的 生产过程也变得简单,单核处理器的布局( 1 a y o u t ) 稍作修改便可容易地生成多 核布图规划。 本文中通过旋转单核处理器芯片布局的方法构造出多核处理器的芯片布局, 并比较芯片布局上的峰值温度和平均温度的高低,给出芯片布局的优劣。 对s p e cc p u 2 0 0 0 测试鲥1 9 】中的所有的测试程序进行模拟。这些测试程序 使用c o m p a qa l p h a 编译器的a l p h a 指令集进行静态链接和编译。测试程序首先 在s i m a l p h a 中执行,以获得测试程序运行时的功耗轨迹,然后将功耗轨迹输入 片内多核微处理器温度可知的布图规划及线程映像研究 给a t m i 模拟器,计算出该测试程序的温度轨迹。每个测试程序快速执行 ( f a s t f o r w a r d ) 了不同的指令数来跳过测试程序的初始化部分( i n i t i a l i z a t i o n ) 。 测试程序的初始化有预热芯片和预热c a c h e 的作用,使处理器真正执行测试程序 时不会处在冷c a c h e 和空c a c h e 的状态。每个测试程序快速执行的指令条数和采 样点数见下表: 表2 1 测试程序快速执行( f a s t - f o r w a r d ) 的指令条数 n b l e2 1 ,1 1 地n u m b e ro ff a s t - f o r w a r di n s t r u c t i o nf o rb e n c h m a r k 测试程序f a s t f o r w a r d 指令数采样的点数 a r t3 1 5 0 0 0 0 0 0 08 3 1 2 0 a p p h 2 10 0 0 0 0 0 0 09 9 9 6 8 a m m p 4 9 5 0 0 0 0 0 0 07 2 6 3 1 a p s i l6 5 0 0 0 0 0 0 07 2 0 0 8 b z i p 2 4 2 9 5 0 0 0 ( 0 0 09 3 3 0 1 c m f i y 9 5 0 0 0 0 0 0 09 0 6 1 1 e q u a k e 19 2 5 0 0 0 0 0 0 09 5 1 4 4 e o n2 6 4 0 0 0 0 0 0 0 09 9 9 6 8 f a e e r e e3 6 5 5 0 0 0 0 0 0 09 9 9 6 8 f i n a 3 d 10 2 5 0 0 0 0 0 0 0 9 0 8 2 5 g a l g e l 4 4 5 0 ( ) 0 0 0 0 09 9 9 6 8 g a p 2 0 6 0 0 0 0 0 0 0 08 9 6 3 9 g e e8 4 0 0 0 0 0 0 0 09 9 9 6 8 g z i p 19 4 0 0 0 0 0 0 0 08 6 2 2 5 l u e a s2 6 5 0 0 0 0 0 0 09 9 9 6 8 m c f13 4 0 0 0 0 0 0 0 09 9 9 6 8 m e s a4 5 0 0 0 0 0 0 09 9 9 6 8 m g r i d 1 5 0 0 0 0 0 0 09 9 9 6 8 p a r s e r 1o o 0 0 0 0 0 0 09 9 9 6 8 p e r l b m k 13 8 0 0 0 0 0 0 0 09 4 6 5 5 s i 】【t r a c k8 2 0 ( ) 0 0 0 0 0 09 9 9 6 8 s w i m1 1 5 0 0 0 0 0 0 09 9 9 6 8 t w o l f 7 2 0 0 0 0 0 0 0 09 9 9 6 8 v o r t e x l8 5 5 0 0 0 0 0 0 0 8 1 6 8 0 v p r 2 5 5 5 0 0 0 0 0 0 09 9 1 9 6 8 w u p w l s e 7 9 5 0 0 c i o i d 0 09 9 9 6 8 s i m a l p h a 模拟器每隔l u s 就采样一次功耗数据,由于模拟时间( s i m u l a t e d t i m e ) 的限制采样点数不能过多,这里仅采样大约1 0 0 0 0 0 点。所模拟的处理器 主频为3 0 g h z ,1 0 0 0 0 0 u s 对应实际测试程序的大约o 1 s 的执行时间( s i m u l a t i o n 1 2 内蒙古大学硕士学位论文 t i m e ) 。这里模拟时间与执行时间是两个不同的概念,模拟时间指的是程序段在 模拟器中所执行的时间,执行时间指的是程序段在实际处理器上所执行的时间。 在表2 2 配置下的芯片,由功耗所产生的热量向水平和垂直方向扩散并达到稳定 状态所需要的时间约为0 0 9 s ,因此o 1 s 的执行时间足可以体现测试程序温度扩 散行为。k s k a d r o n 在文献【6 】中指出,每个节拍( c y c l e - b y - c y c l e ) 都精确执行时 计算一次温度是最精确的,但这样的计算温度的方法会使模拟时间非常长,而 且没有必要,因为1 0 0 k 节拍内温度仅上升0 1 。实验结果显示选择1 0 k 节拍 的间隔计算一次温度就能够达到即精确又能节省时间的目的。本论文内的采样 间隔为l u s ,对应3 0 g h z 处理器的3 3 3 3 节拍,这个间隔完全可以满足本文所要 求的计算精度。从s i m a l p h a 提取的功耗是每个时间间隔内的平均功耗。所模拟 的处理器体系结构配置如表2 2 所示: 表2 2 模拟的处理器体系结构配置的参数( 单核处理器) t a b l e2 2p a r a m e t e r so fas i n g l ec o r ei ns i m u l a t e dc m pp r o c e s s o r 处理器的配置参数 a c t i v el i s t 1 2 8e n t r y p h y s i c a lr e g i s t e r s 12 8 ( i n t f p ) ,2c y c l el a t e n c y i s s u ew i d n l4 0i n t ,2 0f l o a t l s q 3 2 3 2e n t r i 铭 f u n c t i o n a lu n i t 4i n t a l u ,4i n t m u l t , lf p a l u ,1f p m u l t c a c h e 及t l b l 1d - c a c h es i z e 6 4 k b 2 w a y , 6 4 bb l o c k , l r u ,1c y c l el a t e n c y l 1i - c a c h es i z e 6 4 k b ,2w a y , 6 4 bb i 毗l r u 3c y c l el a t e n c y l 2 t l bs i z e 2 m b aw a y , 6 4 bb l a c k , l r u ,1 0c y c l el a t e n c y 2 k b ,4w a y , 1c y c l el a t e n c y 分支预测 b r a n c hp r e d i c t o r b i m o d g s h a r ec o m b 16 k b ,6 4 r a s r e t u r n - a d d r e s s - s t a c k 6 4 其他参数 n o m i n a l 呐u e n c y3 0 g h z n o m i n a l 1 3 v a m b i e n ta i rt e m p e r a t u r e 3 0 p a c k a g et h e r m a lr e s i s t a n t 0 2 9 l d i e 0 5 m r at h i c k , 8 m m 8 m m h e a ts p r e a d e r 5 m mt h i c k , 7 c mx7 e r a 2 1 2 微处理器的功耗模型 c m o s 集成电路的功耗由静态功耗和动态功耗组成。静态功耗是指漏电流 功耗,是电路状态稳定时的功耗。静态功耗的大小受电压和温度的影响。w :l i a o 片内多核微处理器温度可知的布图规划及线程映像研究 等人在文献2 0 】中对静态功耗所建立的近似模型为 ,口+ 卢 p ( 丁,) = 彳t 2 e 丁+ 曰p 7 。+ 毋 ( 7 ) 其中彳,b ,口,y 和占是不同电路类型、工艺技术、设计的实验常量。这个公式说 明静态功耗指数级的依赖于温度。随着工艺技术的不断改进,静态功耗在整个功 耗中所占比例也越来越大,已经成为功耗中的一个不可忽略的组成部分。在一定 的温度和工艺技术下静态功耗是一个常量,不会因为程序的执行而变化。动态功 耗是指电容充放电功耗和短路功耗,是由电路的翻转造成的。电容充放电功耗的 模型为 1 尸= i 1 乙l y 谢2 ( 8 ) 二 其中q 为负载电容;为供电电压;a 为电路开关活动因子,表示电路 翻转的平均频度;厂为电路工作频率。上述模型是进行高层功耗建模的基础。开 关活动因子a 的大小直接影响了电路的功耗。电路状态变化越频繁,电路的功耗 也就越大。当不同类型的测试程序在处理器上执行的时候会对各个块产生不同的 访问频率,同时产生测试程序执行的功耗轨迹。动态功耗与程序对部件的访问频 率有直接关系。 处理器内产生的功耗以热能的形式向空气散发。目前芯片集成度越来越高, 处理器的功耗密度迅速上升,使得片内的热点的温度振幅变大,缩短了芯片的使 用寿命并增加了程序执行软错误出现的概率。由于传统降温方法的局限性,目前 已经不能满足控制芯片温度的要求。为了有效地控制片内温度,人们引入了d t m 技术。d t m 技术通过降低电压,降低频率等方法来控制温度,因此它不可避免 地降低处理器的性能。目前人们正在研究如何将由引入d t m 技术而造成的处理 器性能损失最小化,例如活动迁移( a c t i v i t y m i g r a t i o n ) 、温度可知的o s 调度、有 效的温度扼杀机制( e f f i c i e n tt h r o t t l i n gm e c h a n i s m s ) 、温度可知的布图规划、温度 可知的编译等等。这些技术的目标都是在固定的温度限制下提高性能。但是不同 的d t m 具有不同的侧重,对处理器造成性能损失也会不一样。为了在模拟器中 评价d t m 技术对性能损失的大小,人们在模拟器中引入了温度模块来精确计算 片内温度。 下面介绍热模拟器的发展过程。以前人们评价d t m 技术时由于没有热模拟 1 4 内蒙古大学硕士学位论文 器,将平均功耗作为温度的近似值叫但文献睁2 增出功耗与温度之间相关性非 常小,不能使用功耗作为温度的近似值。最初的热模型t e m p e s t 2 3 j 是基于著名 的热传导与电现象的二元性建立的模型刚。热传导方程和电现象方程相同,而且 电量与热量具有相同的特性,因此将功耗视为电流,温度差视为电压,热阻视为 电阻,热容视为电容。这样通过等价的r c 电路模型建立了热模型。但是t e m p e s t 中仅用一个r c 模型来模拟整个芯片的温度,这个模拟器没有考虑处理器不同单 元具有不同的功耗密度的情形,因此它无法计算出芯片的热点,并且计算精度很 低。ks k a d r o n 等人断j s r c 模型来建立热模型h 0 t s p d 产”。h o t s p o t :是- - 个体系 结构级韵热模型,他考虑了体系结构缓的芯片布局,为每个块创建一个r c 电路, 计算出各个块的温度,而且能够计算出芯片上的热点。除此之外h o t s p o t 还考虑 了温度向上和向侧面扩散的效应以及风扇、散热片对散热效果的影响。 闰2 l h o t s p o t 模拟器的模型结构 f i g t e 21t h ea x e h i t e c t u r a l m o d e l o f h o t s p o t “m w 虽然h o t s p o t 的计算精度比以前的热模型的精度有了很大的提高,但是d f 嘶s 在文献中指出h o t s p o t 对于特殊功耗和特殊芯片布局非常敏! 尊,有时会 出现计算结果错误的情况。针对这种情况文献【”l 中提出对芯片布局中的块进一步 细化,以提高计算精度、减少计算结果错误。wh u a n g 等在文献闭中,针对 h o t s p o t 中芯片布局具有长宽比较大的块时,出现计算结果错误的情况,提出将 长宽比较大的块细化来提高计算精度、减少错误。 除h o t s p o t 外,有限元计算方法也可以计算热模型,但由于其计算速度慢, 不宜使用等原因而没有被广泛使用,仪用来验证温度模拟器结果的正确性。 片内多核微处理器温度可知的布图规划及线程映像研究 h o t s p o t 是目前广泛使用的温度模拟器之一,但它本身也存在很多的缺点,如: 虽然热传导和电现象具有相同的微分方程,但它们有本质的区别。首先,两者的 传播介质不一样。热传导将空间物质作为传播热能的介质向外散热,而电流只能 通过导线流通电流。其次,两者的传播方式不一样,热源是在传播介质中以球面 向外扩散,电流是在导线中沿直线流通。其三,传播介质的变化对两者产生的影 响不一样,在r c 模型中很难描述介质的变化对热传导产生的影响。而实际芯片 不断采用新型材料来加快散热,因此不能完全使用电现象解释热传导现象。由于 h o t s p o t ,存在这样的缺点,e m i c h a u d ,ys a z e i d e s 等人基于分析模型开发了a t m i 温度模拟器【2 7 1 。 2 1 3a i t m i 模拟器的模型结构 a t m i ( a n a l y t i c a lm o d e lo f t e r n p e r a t u r ei nm i c r o p r o c e s s o r s ) 模拟器i 2 8 2 9 】是基 于经典的分析模型开发的温度模拟器,它不像有限元方法依赖于空间划分。它是 模块化的温度模拟器,不仅可以计算依赖于时间和功耗函数的温度和稳定状态的 温度,而且还可以模拟新材料对芯片散热的影响。它易于集成到微处理器模拟器 或者其它类型的模拟器中。a t m i 的函数库由c 语言编写,是g n u 通用公共认 证( g n u g e n e r a ll i c e n c e ) 的软件,可在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论