(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf_第1页
(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf_第2页
(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf_第3页
(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf_第4页
(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf_第5页
已阅读5页,还剩107页未读 继续免费阅读

(电路与系统专业论文)嵌入式cpu超深流水线关键技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着嵌入式应用的日益复杂,高性能低功耗嵌入式处理器成为嵌入式系统发 展的主要需求。超深流水线技术通过提升处理器频率,提高处理器综合性能,是 当今高端嵌入式处理器发展的主流趋势。本文重点研究嵌入式处理器的超深流水 线关键技术,分别从提升性能与降低功耗两方面提出了若干创新解决方法。本文 的主要内容与创新点包括: 1 、低功耗指令c a c h e 研究。提出了一种基于t a g 分级访问的指令c a c h e 低 功耗方法,通过将t a g 分离并分别在不同流水线级访问,降低指令c a c h e 的标志 存储器访问功耗。针对短循环指令访问特性,提出基于指令c a c h e 访问轨迹的低 功耗循环分支折合。记忆c a c h e 访问轨迹,直接从指令c a c h e 中访问循环体指令, 避免指令c a c h e 的标志存储器与部分数据存储器的访问功耗。 2 、低功耗与高性能b t b 研究。首先,分析b t b 访问本质,提出了基于预 测访问的b t b 低功耗方法。通过预测b t b 访问的指令类型与分支跳转方向,过 滤非分支跳转指令的冗余b t b 访问。进一步,提出了基于部分t a g 的b t b 设计 方法。b t b 仅记忆部分t a g ,实现对分支目标地址的预测,降低b t b 的访问功 耗与设计成本。最后,提出了一种基于指令c a c h e 复用的b t b 设计方法。复用 指令c a c h e 存储空间缓存分支指令目标地址,消除b t b 的设计成本与访问功耗。 3 、基于页面动态合并的t l b 设计方法。针对内存管理中虚拟页面与物理页 面连续分配的特点,提出了一种支持相邻页面动态合并的t l b 设计方法。通过 对相邻页面的递归合并,动态提升t l b 的地址空间映射范围,降低t l b 访问缺 失率,提升处理器综合性能。 4 、低功耗与高性能片上存储子系统设计。提出了具有硬件堆栈功能的数据 c a c h e 设计方法。复用数据c a c h e 存储空间缓存堆栈数据。函数现场保存与恢复 直接访问硬件堆栈,避免对数据c a c h e 的标志存储器与部分数据存储器的访问。 进一步提出了支持处理器和d m a 任务并行处理的s p m 架构。 5 、重构指令预取机制研究。改进传统的神经网络预测算法,引入历史指令 浙江大学博士学位论文 摘要 信息,与感受器权重构成新型的感受器模型。通过感受器权重与历时指令信息的 协同训练,学习重构指令执行规律,实现对后续重构指令的预测与配置信息的预 取,隐藏配置信息加载开销。进一步,结合重构指令执行特征,提出了改进神经 网络算法的可扩展实现框架。 本文提出的若干方法对于超深流水线嵌入式处理器降低功耗、提升性能具有 积极的意义。 关键词超深流水线嵌入式c p u ;指令c a c h e ;分支目标缓冲器( b t b ) ; 旁路转换缓冲器( t l b ) ;片上存储子系统;重构指令预取 i l a b s t r a c t w i t ht h e d e v e l o p m e n t o fp e r f o r m a n c e - h u n g r ye m b e d d e d a p p l i c a t i o n s , h i g h p e r f o r m a n c e a n dl o w - p o w e re m b e d d e d p r o c e s s o r b e c o m e st h ee s s e n t i a l r e q u i r e m e n t o fe m b e d d e d s y s t e m s u p e r - p i p e l i n e i sa na d v a n c e dc o m p u t e r a r c h i t e c t u r ew h i c hi ss i g n i f i c a n tf o rf r e q u e n c yi n c r e a s i n ga n dp e r f o r m a n c ei m p r o v i n g i th a sb e e nt h em a i nt e c h n i q u et r e n dt h a ts u p e r - p i p e l i n ei s a d o p t e db r o a d l yi n h i g h e n dp r o c e s s o rd e s i g n i nt h i st h e s i sw ew i l la n a l y z es o m el o wp o w e ra n dh i 曲 p e r f o r m a n c et e c h n i q u e sf o rt h ei m p l e m e n t a t i o no fs u p e r - p i p e l i n ee m b e d d e dp r o c e s s o r t h em a i nc o n t e n t sa n dc o n t r i b u t i o n so ft h et h e s i sa r ea sf o l l o w s : 1 l o wp o w e ri n s t r u c t i o nc a c h ed e s i g n at w o l e v e lt a ga c c e s s i n gm e c h a n i s m w a sp r o p o s e di nt h i st h e s i s t a gw a ss e p a r a t e di n t ot w os e g m e n t sa n da c c e s s e d s e r i a l l y , w h i c hw o u l dr e d u c et h ep o w e rc o n s u m p t i o no ft a ga r r a y u t i l i z i n gt h e c h a r a c t e r i s t i co fl o o pi n s t r u c t i o nf e t c h i n g ,ai - c a c h eb a s e dl o wp o w e rb r a n c hf o l d i n g m e c h a n i s mw a si n t r o d u c e di nt h i sc h a p t e r m e m o r y i n gt h ei - c a c h ea c c e s s i n gt r a c e , l o o pi n s t r u c t i o n sw e r ef e t c h e dd i r e c t l yf r o mi n s t r u c t i o nc a c h ew i t h o u tt a ga c c e s s i n g a n dc o m p a r i n g a sar e s u l t ,i tc o u l de l i m i n a t et h et a ga c c e s s i n ga n dt h eo t h e rw a y so f d a t aa c c e s s i n gd u r i n gb r a n c hf o l d i n g 2 l o wp o w e ra n dh i g hp e r f o r m a n c eb r a n c ht a r g e tb u f f e rd e s i g n f i r s t l y , a n a l y z e dt h en a t u r eo fb t ba c c e s s i n ga n dp r o p o s e dap r e d i c t i o nb a s e db t ba c c e s s i n g m e t h o d n o to n l yt h ei n s t r u c t i o nt y p eb u ta l s ot h eb r a n c hd i r e c t i o nw a sp r e d i c t e df o r b t b a c c e s s i n ga r b i t r a t i o n o n l yc u r r e n ta c c e s s i n gw a sp r e d i c t e dt ob eb r a n c ht a k e n i n s t r u c t i o nw o u l da c t i v eb t b ,w h i c hw a ss i g n i f i c a n tf o rf i l t e r i n gr e d u n d a n tb t b a c c e s s i n g t h e n ,an e wb t ba r c h i t e c t u r eo fp a r t i a lt a gw a si n t r o d u c e dt or e d u c eb t b c o s ta n de n e r g yc o n s u m p t i o n o n l yp a r t i a lt a gw a sr e c o r d e di nt h i sn o v e lb t ba n dt h e b r a n c ht a r g e ta d d r e s sp r e d i c t i o nw a sp r o c e s s e db yt h ep a r t i a lt a gc o m p a r i n g t h e m a i n t e n a n c eo fp a r t i a lt a gb t bi si d e n t i c a lt ot r a d i t i o n a lb t b f i n a l l y , w ep r o p o s e d 浙江大学博士学位论文 a b s t r a c t a n o t h e rb t bd e s i g nw h i c hi sb a s e do ni n s t r u c t i o nc a c h er e u s i n g d i f f e r e n t 、析t 1 1 t r a d i t i o n a lb t b ,t h ei n s t r u c t i o nc a c h ep r e s e r v e db r a n c ht a r g e ta d d r e s si n s t e a do f b i n a r yc o d ef o rb r a n c hi n s t r u c t i o n i - c a c h eb a s e db t bd e s i g nm i g r a t e db t bf r o m d e d i c a t e db u f f e rt oi n s t r u c t i o nc a c h e ,e l i m i n a t i n gt h ep o w e rd i s s i p a t i o na n dc o s to f b t b 3 at l bd e s i g nm e t h o ds u p p o r t i n gd y n a m i cp a g ea g g r e g a t i o n v i r t u a l m e m o r yp a g e sa n dp h y s i c a lm e m o r yp a g e sw e r eo f t e na l l o c a t e ds e q u e n t i a l l yi n t r a d i t i o n a lm e m o r ym a n a g e m e n ta l g o r i t h m s u t i l i z i n gt h em e m o r ym a p p i n gl a w , w e p r o p o s e dat l bd e s i g nm e t h o dw h i c hw a su s e dt oa g g r e g a t et w os e q u e n t i a ls m a l l s i z ep a g e si n t oal a r g e ro n e w i lr e c u r s i v em e m o r yp a g ea g g r e g a t i o n ,t h em a p p i n g s i z eo ft l bw o u l db ei m p r o v e da n dt h et l bm i s sr a t ew o u l db er e d u c e d i tw o u l d f i n a l l yi m p r o v et h ep e r f o r m a n c eo fm m u 4 l o wp o w e ra n dh i g hp e r f o r m a n c eo n - c h i pm e m o r ys u b s y s t e md e s i g n t a r g e t i n ga tf r e q u e n tf u n c t i o nc a l l s ,ah a r d w a r es t a c kw a sp r o p o s e db a s e do nd a t a c a c h et oa c h i e v el o wp o w e ra n dh i g hp e r f o r m a n c ec o n t e x ts w i t c h i n g s i n c eh a r d w a r e s t a c kw a sl o c a t e da tat a r g e tw a yo fd a t ac a c h e ,t h es t a c kd a t aw o u l db ep u s h e di n t o a n dp o p p e do f fd i r e c t l yf r o mc a c h ed u r i n gc o n t e x ts w i t c h i n g a sar e s u l t ,i tc o u l d e l i m i n a t et h e t a ga c c e s s i n ga n dt h e o t h e rw a y so fd a t aa c c e s s i n gd u r i n gs t a c k o p e r a t i o n a n o t h e rw o r kw a sd o n ef o rd a t as p m a na d v a n c e ds p m a r c h i t e c t u r ew a s d e s i g n e df o rs u p p o r t i n g t a s kl e v e lp a r a l l e l i s mb e t w e e np r o c e s s o rc o m p u t i n ga n d d m a t r a n s f e r r i n g 5 c o n f i g u r a t i o np r e f e t c h i n gs c h e m es t u d y r e c o n f i g u r a t i o no v e r h e a dd a m a g e s t h ep e r f o r m a n c ei m p r o v e m e n to fr e c o n f i g u r a b l et e c h n i q u es e v e r e l y ac o n f i g u r a t i o n p r e f e t c h i n gs c h e m eb a s e do nn n ( n e u r a ln e t w o r ka l g o r i t h m ) w a sp r e s e n t e di nt h i s c h a p t e rt o r e d u c et h e r e c o n f i g u r a t i o no v e r h e a d t h eh i s t o r yr f u o pi dw a s i n t r o d u c e di n t o r e c e p t o rt oc o n s t r u c ta ni m p r o v e dr e c e p t o rm o d e l t h er e c e p t o r w e i g h ta n dh i s t o r yr f u o pi dw e r et r a i n e dc o l l a b o r a t i v e l yt os t u d yt h er f u o pt r a c e a n dp r e d i c tn e x tr f u o p s w i t ht h ep r e d i c t i o nr e s u l t ,t h ec o n f i g u r a t i o nw o u l db e i v 浙江大学博士学位论文 a b s t r a c t p r e f e t c h e di na d v a n c e ,o v e r l a p p i n gt h ec o n f i g u r a t i o nl o a d i n g 谢t l lt h ec o m p u t a t i o no f t h eh o s tp r o c e s s o r t e c h n i q u e sp r o p o s e di nt h i st h e s i sa r ee f f e c t i v ef o rs u p e r - p i p e l i n ea n ds u p e r s c a l a r e m b e d d e d p r o c e s s o rd e s i g n ,e s p e c i a l l y f o r e n e r g yc o n s u p t i o nr e d u c i n ga n d p e r f o r m a n c ei m p r o v i n g k e y w o r d ss u p e r - p i p e l i n ee m b e d d e dp r o c e s s o r ;i n s t r u c t i o nc a c h e ;b r a n c ht a r g e t b u f f e r ( b t b ) ;t r a n s l a t i o nl o o k a s i d eb u f f e r ( t l b ) ;o n - c h i pm e m o r ys u b s y s t e m ; c o n f i g u r a t i o np r e f e t c h v 致谢 时光荏苒,岁月如梭,不觉间已到博士毕业时。 回首五年学 - - j 生涯,首先最应感谢我的导师严晓浪教授,感谢严老师这么多 年来对我的悉心指导与深切关怀。严老师不仅慷慨的传授专业知识,而且为我们 提供了良好的学 - - j 环境和丰富的科研资源。严老师结合丰富的产业化经验,努力 培养我们解决实际问题的能力,这对于我们的全面发展具有非常积极的意义。严 老师高尚的人格、高瞻远瞩的眼光和严谨的治学态度,都将让我受益终生! 其次感谢葛海通老师多年来在学 - j 工作等方面给予我的关心与指导,葛海通 老师宽广的胸怀和勤奋踏实的工作精神,让我受益匪浅。感谢浙江大学超大规模 设计研究所的沈海斌、史峥、吴晓波、何乐年、潘赞、王维维、竺红卫、罗小华、 张培勇、赵梦恋等老师多年来给予我的指导和帮助。 非常感谢我的师兄孟建熠博士。孟师兄不仅在学 - j 上给予我无微不至的指 导,而且在工作上和生活中也传授给我诸多宝贵的人生经验。与孟师兄学 - - j 和工 作的经历将成为我人生中的宝贵财富。 同时还要感谢曾经一起学 - - j 的实验室同学们:何仙娥、杨军、阳晔、黄凯、 李德贤、彭建英、吕东明、郑丹丹、全励、殷燎、程爱莲、徐鸿明、龚帅帅、张 欣、付可威、沙子岩、陈晨、王荣华、项晓燕、刘磊,武淑丽、刘畅、高金加、 冷冰、梁静,鄢传钦,刘晓东、仇径、赵朝君,沈秀红等。这种融洽的学 - j 氛围 让我一生难忘感谢杭州中天微系统曾经一起工作的员工:李春强、刘兵、丁永 林、莫鹏飞、郭宇波、林琳、谭小虎、王洁、冯炯、刘智力、任金平、卢永江等。 尤其感谢冷冰、刘畅等师弟对我博士研究工作的大力支持。 感谢父母对我近三十年的无私奉献和辛勤培养,他们抚养我长大,教会我做 人。父母对我坚定不移的支持与鼓励是我人生奋斗的不竭动力,我人生的每一个 成绩都与他们密不可分感谢大哥二哥一直以来对我的关心与支持。同时还要感 谢我的女友王秀君,一直默默地支持着我的学 - j 和工作,对我不离不弃。 最后感谢母校浙江大学对我九年的培育,感谢杭州中天微系统有限公司为我 提供良好实践环境,感谢求学途中所有曾经帮助过我的人们 陈志坚 2 0 1 1 年4 月于求是园 1 绪论 随着便携式移动设备的广泛普及,嵌入式处理器得到了前所未有的应用与发 展。一方面,嵌入式应用的多样化与复杂化对嵌入式处理器的性能提出了更高的 需求;另一方面,移动设备的便携性对嵌入式处理器功耗的要求进一步苛刻l l j 。 严格功耗约束下的高性能嵌入式处理器设计研究成为当今嵌入式处理器研究的 热点领域。本文重点就超深流水线嵌入式处理器的低功耗与高性能两个方面展开 深入研究。 本章首先介绍了高性能嵌入式处理器的研究背景与意义,分析了当今国际主 流高性能嵌入式处理器的研究现状与发展趋势,调研了嵌入式处理器的低功耗研 究现状,然后介绍了本文的研究基础自主知识产权嵌入式处理器c k c o r e 的 技术路线,最后给出了论文的研究内容和组织结构。 1 1 研究背景与意义 处理器是集成电路发展历程中最具代表性的产品,象征了集成电路设计的最 高水平。根据应用领域的不同,处理器分为桌面处理器、服务器处理器和嵌入式 处理器 2 1 。桌面处理器强调计算、图形和交互能力,不注重处理器功耗和成本。 桌面处理器以i n t e l 和a m d 的x 8 6 系列处理器为典型。服务器处理器主要是面 向大型数据运算、文件服务和网络应用的处理器系统和集群,计算并行性和数据 吞吐率是服务器处理器设计的关键。服务器处理器以i b m 的p o w e r 系列处理器 为典型。与它们不同,嵌入式处理器则是面向嵌入式控制和计算的微处理器。相 比桌面处理器和服务器处理器,嵌入式处理器对性能的要求相对不高,但是对功 耗、成本的要求却非常苛刻。嵌入式处理器又分为数字信号处理器和通用嵌入式 处理器1 3 1 。数字信号处理器主要面向嵌入式数据处理领域( 音视频编解码、信号 处理等) ,以t i 公司的t m s 系列处理器为典型。嵌入式通用处理器主要面向嵌 入式控制和应用领域,以a r m 的a r m 和c o r t e x 系列处理器为典型。 自从1 9 7 1 年i n t e l 发明第一款商用处理器4 0 0 4 以来,处理器经历了4 0 年持 续的技术革命和工艺创新,桌面处理器和服务器处理器更是严格的遵循摩尔定律 浙江大学博士学位论文 绪论 4 1 发展。桌面处理器和服务器处理器的研究起步较早,技术相对成熟与稳定【5 1 , 并且由于桌面处理器和服务器处理器技术壁垒高,资金投入大,因此相关研究主 要由i b m 、i n t e l 、a m d 等处理器巨头垄断和推动。相比之下,嵌入式处理器的 研究起步较晚,目前还没有形成统一的技术方案,因此对嵌入式处理器的研究尤 其对通用嵌入式处理器的研究还处于百家争鸣的时代。通用嵌入式处理器研究己 成为处理器研究的主要内容。 进入2 l 世纪以来,随着消费类电子需求的急剧增长【6 1 ,高性能低功耗嵌入 式处理器得到了更加广泛的应用。研究嵌入式处理器的高性能和低功耗技术不仅 对中高端嵌入式系统的综合性能提升有着重要意义,而且对整个集成电路产业的 发展和电子信息产业的升级都起到至关重要的作用。 国际上对嵌入式处理器的研究起步于2 0 世纪9 0 年代初期。经过2 0 年的研 究和发展,国际主流嵌入式处理器经历了多次技术革新和产品升级,技术积累相 对深厚。相比之下,国内嵌入式处理器研究始于本世纪初,起步相对较晚。目前 国内嵌入式处理器研究主要以北大众志、北京君正和浙大c k c o r e 为典型代表。 由于研究时间的限制,目前国内对嵌入式处理器的体系结构研究尤其是高性能低 功耗体系架构研究尚处在起步阶段。设计高性能低功耗的嵌入式处理器体系架 构,不仅对提升我国自主知识产权嵌入式处理器的竞争力,打破国外嵌入式处理 器在高端市场的垄断具有十分积极的意义,而且对我国电子信息产业的优化和升 级也有着战略性意义。 基于这样的时代背景,本文以超深流水线嵌入式c p u 为研究对象,以提升 处理器性能的同时降低处理器功耗为主要设计目标,围绕嵌入式处理器的流水线 设计关键技术展开深入研究。 1 2 嵌入式处理器技术的研究现状与发展趋势 进入2 l 世纪,智能手机、平板电脑等便携式消费电子迎来爆炸式增长。嵌 入式系统功能的不断增强,应用程序的不断复杂,对嵌入式处理器的性能提出了 前所未有的要求。高性能已成为当今嵌入式处理器设计的核心问题和发展趋势。 当前国际上对嵌入式处理器的研究和设计以a r m 和m i p s 为典型。此外, 2 浙江大学博士学位论文 绪论 t e n s i l i c a 、a r c 、p o w e r p c 、a n d e s 、s u p e r h 处理器也占有一定的市场份额。这 些处理器均采用3 2 位r i s c 架构,致力于提升处理器整体性能与降低功耗,并 形成了各自的关键技术和技术路线。本节结合国际主流嵌入式处理器的发展现状 分析嵌入式处理器技术的研究现状和发展趋势。 1 2 1 指令集技术 指令集是计算机软硬件通信的接口,是影响处理器性能的关键因素。由于指 令集对数据操作方式、通用寄存器个数、内存寻址方式以及偏移量等进行了约定, 因此指令集设计的好坏直接影响了处理器的性能1 7 。指令集发展至今,指令集技 术日趋稳定和统一,主要表现为:1 ) 采用3 2 位指令系统2 ) 基本指令集功能日 趋相同3 ) 通过扩展指令获得对特定应用的加速。指令集技术的发展趋势表现为 通过对基本指令集的扩展和升级实现对特定应用的加速。基于基本指令集扩展指 令子集的指令集技术,可以在处理器功耗与成本增加有限的前提下,实现对特定 应用的有效加速,是嵌入式处理器的一项关键技术。 a r m 处理器技术路线充分体现了指令集技术的重要性。a r m 系列处理器采 用3 2 位基本指令集,一共发展了三套指令体系,分别是传统的3 2 位a r m 指令 集、1 6 位t h u m b 指令集和新一代3 2 位1 6 位混合编码的t h u m b 2 指令集。伴随 着指令集的更新换代,a r m 体系架构的的升级也比较频繁,迄今为止已经发展 了四代体系架构,分别是a r m v 4 t ,a r m v 5 t e j ,a r m v 6 ,a r m v 7 ( 如图1 1 所示) 。a r m v 4 t 体系架构基于传统的a r m 指令集。在3 2 位a r m 指令集的基 础上,基于降低代码空间的需求,a r m 公司又研发了1 6 位的t h u m b 指令集。 t h u m b 指令集本身并非一套完整的指令体系,仅用于提升代码密度。相当长的 一段时间,a r m 指令集和t h u m b 指令集采用指令集模式切换的方式工作。 a r m v 5 t e j 在a r m v 4 t 体系架构的基础上增加了数字信号处理技术d s p 、浮点 协处理器技术v f p v 2 和j a v e 加速技术j a z e l l e 。a r m v 6 体系架构在a r m v 5 t e j 的基础上又继续增加了面向多媒体运算的s i m d 技术、面向安全应用的t r u s t z o n e 技术以及t h u m b - 2 指令集技术。其中,t h u m b 2 指令集摒弃了原有的3 2 位a r m 指令与1 6 位t h u m b 指令模式切换的工作方式,采用了更为先进的3 2 位1 6 位指 3 浙江大学博上学位论文绪论 令混合编码的技术路线。t h u m b 一2 指令集通过对传统的a r m 指令集进行重新编 码与调整,使之符合与t h u m b 指令集的混合编码需求。t h u m b 一2 指令集技术是 a r m 公司在指令集研究上的重大突破,不仅满足了程序代码密度的要求,又保 证了指令切换和执行的效率。a r m y 7 在a r m v 6 体系架构的基础上,增加了增 强多媒体技术n e o n 、第三代浮点协处理器技术v f p v 3 、动态编译技术t h u m b e e 以及虚拟化技术。a r m v 7 体系架构是a r m 公司迄今为止功能最为强大、种类 最为齐全的处理器架构,涵盖了其现有的全部指令集技术。a r m 公司近年来力 推的c o r t e x a 、c o r t e x m 、c o r t e x - r 三个系列处理器均是基于a r m y 7 架构。 匦堕圃 臣匦固 堕互 匝亟画习匝亟画口 互亘 型堕 垂巫 垂巫 垂巫 亟堕 亟耍 亟堑 巫匣巫堕堕 阿rmv4一t区ar亚mv5t回ej臣巫rmv口6臣a巫rmy口7ik 8 l a illi a iii _ 图1 1a r m 指令架构发展历程 相比a r m 指令系统,m i p s 的指令集比较稳定,其基本指令集包括m i p s 3 2 和m i p s 6 4 ,分别面向3 2 位和6 4 位应用。m i p s 系列嵌入式处理器均采用m i p s 3 2 指令集。在基本指令集稳定的基础上,m i p s 针对不同嵌入式应用分别开发了 m i p s l 6 ea s e 、s m a r t m i p s 、m i p sd s pa s e 、m i p sm i p sm u l t i - t h r e a d i n ga s e 四 套扩展指令子集。其中,m i p s l 6 ea s e 为1 6 位指令集,主要面向对存储空间敏 感的嵌入式应用。m i p s l 6 ea s e 通过模式切换和m i p s 3 2 基本指令集协同工作, 可有效提升m i p s 指令集的代码密度。s m a r t m i p s 是面向以智能卡应用为代表的 信息安全领域,可有效提升安全算法加解密。m i p sd s p a s e 则是面向数字信号 处理和多媒体应用领域,可有效提升m i p s 处理器在信号处理、音视频编解码等 领域的处理性能。m i p sm u t i t h r e a d i n ga s e 用于支持2 个线程并行执行,有效提 升m i p s 处理器对多任务和多线程的处理能力。m i p s 于2 0 1 0 年3 月提出了 m i c r o m i p s 指令集技术,对m i p s 3 2 和m i p s l 6 ea s e 指令集进行了重新编码,使 4 浙江大学博士学位论文绪论 之符合指令混合编码的要求,并将其应用于低端嵌入式处理器m i p sm 1 4 k 中。 整体而言,m i p s 指令系统稳健清晰,但是对不同嵌入式应用的加速能力略显缺 乏。 1 2 2超深流水线技术 超深流水线技术对流水线功能进行重新定义与划分,使得每级流水线的工作 变少,从而提升处理器的工作频率与整体性制引。由于超深流水线技术对软件透 明,并且具有良好的性能功耗比,因此被广泛应用于高性能嵌入式处理器中,是 嵌入式处理器提升性能的首要途径【9 1 。a r m 处理器的发展历程充分佐证了超深 流水线技术。从a r m 7 的3 级流水线到a r m 9 的5 级流水线、a r m l l 的8 级流 水线,再到c o r t e xa 8 的1 3 级流水线,处理器频率依次提升,整体性能不断提 高。此外,m i p s 系列处理器也依次经历了5 级流水线( m i p s4 k ) 、8 级流水线 ( m i p s2 4 k ) 、9 级流水线( m i p s3 4 k ) 到1 5 级流水线( m i p s 7 4 k ) 。 控制冲突与数据冲突是超深流水线技术需要解决的首要问题【1o ,1 1 】。控制冲突 方面,随着流水线加深,分支指令获取延时增加。加快分支处理速度,减少分支 跳转导致的流水线气泡,提高指令预取性能是超深流水线技术需要攻克的关键技 术之一。此外,随着流水线加深,运算指令与加载存储指令的执行周期变长,数 据冲突进一步加剧。减少执行部件运行延时与挖掘指令并行性是超深流水线技术 降低数据冲突的主要方法。超深流水线技术为了减少控制冲突与数据冲突通常引 入分支目标地址预测、乱序投机执行等机制,导致了处理器硬件资源开销的增加 和功耗的上升,如何在提升超深流水线性能的同时保持低功耗具有很大的挑战性 u 2 l o 超深流水线技术在提升处理器频率的同时,以牺牲处理器单位性能为代价。 随着流水线的进一步加深,处理器单位性能急剧下降,处理器综合性能提升变得 有限。因此一旦流水线深度超过1 5 级f 1 3 1 ,超深流水线技术的性能功耗比不再优 越。 5 浙江大学博士学位论文绪论 1 2 3 超标量技术 超标量技术是一个时钟周期允许多条指令在流水线中并行发射、执行和退休 的微体系架构技术,其核心思想是通过挖掘指令之间的并行性来提升处理器执行 效率【1 4 1 。由于超标量技术通过改进处理器硬件实现性能提升,对软件完全透明, 因此是嵌入式处理器提升性能的关键技术之一。a r m 在其高端的c o r t e xa 8 和 c o r t e x a 9 处理器中实现了宽度为2 的超标量技术。m i p s 也在其高端处理器m i p s 7 4 k 中实现了超标量技术。 单周期实现多条指令的并行预取是超标量技术需要解决的首要问题【1 5 1 。此 外,随着流水线中容纳指令数的不断增加,指令之间的数据冲突与控制冲突变得 非常复杂,克服数据冲突与控制冲突对于处理器性能的影响也是超标量处理器迫 切需要解决的问题【16 1 。随着指令发射宽度的进一步增加,指令并行性的挖掘空间 变得非常有限,超标量技术获得的处理器性能提升变得不再明显【1 7 1 。 1 2 4多线程技术 多线程技术是一种通过软件方法或者硬件方法支持多个任务并行执行的处 理器技术【8 】。软件多线程技术通过操作系统调度不同的任务分时占用处理器资 源,是一种对硬件完全透明的方法。硬件多线程技术包括并发多线程技术( c m t ) 和对称多处理器技术( s m p ) 【l 鄹。本文所述的多线程技术特指并发多线程技术。 并发多线程技术由处理器内部的控制逻辑监视线程切换条件,一旦触发条件满 足,则挂起原有线程,同时调度新的线程进入处理器执行。并发多线程技术从硬 件层面实现不同线程分时占用处理器资源【1 9 捌。线程切换条件一般包括缓存缺失 ( c a c h em i s s ) 等导致处理器长周期停顿的情况,其目的是在处理器发生空闲等 待时,调度下一线程执行,充分发挥处理器的执行能力。由于硬件多线程技术需 要为每个线程分配独立的程序计数器( p c ) 、处理器状态寄存器( p s r ) 、通用寄 存器堆( g p r ) 等硬件资源,因此成本开销较大,并且由于其软硬件设计复杂度 大幅度高于超深流水线技术与超标量技术,目前在嵌入式处理器领域应用并不广 泛。m i p s 在其m i p s3 4 k 和m i p s1 0 0 4 k 处理器中实现了并发多线程技术。 6 浙江大学博士学位论文 绪论 1 2 5可配置技术 可配置技术是2 0 世纪9 0 年代末兴起的一项处理器技术。相比传统的嵌入式 处理器为了满足不同应用场合的需要而集成和实现所有功能不同,可配置技术的 核心理念是针对不同嵌入式应用裁剪定制出高效专用的处理器架构,舍弃冗余的 处理器功能,实现性能、功耗与成本的完美折衷【2 1 1 。可配置技术包括面向应用的 指令集可扩展技术与处理器功能可配置技术【2 2 】。指令集可扩展技术主要表现为用 户可以根据特定应用定制指令集,真正实现指令集的“按需分配 。功能可配置 技术指对处理器功能进行特征提取,使得处理器拥有多个配置选项。用户可从处 理器的最小功能集合开始,根据应用特征从可配置选项中选择合适的功能单,元 实现处理器快速定制。其中,可配置选项包括高速缓存、乘法单元,浮点运算单 元,内存管理单元等。t e n s i l i c a 、a r c 是当今世界领先的专注于提供可配置技术 的处理器厂商。以t e n s i l i c a 为例,其主流的x t e n s a l 2 3 】系列处理器支持高达3 0 0 多个配置选项,用户除了可以定制专用指令集外,还可以配置硬件乘法器、加载 存储单元、d s p 引擎、浮点执行单元、通用总线接口等。 1 2 6可重构技术 相比静态可配置技术,可重构技术是一种动态的处理器定制技术。可重构技 术允许处理器在设计完成之后,依据实际嵌入式应用动态调整与扩展指令集,具 有面向不同应用的动态定制和扩展特性f 2 4 1 。可重构技术是一种软硬件协同配合的 更为先进的处理器技术瞵2 6 1 。软件方面,可重构技术需要软件工具链分析应用热 点,提取专用指令并生成指令配置信息;硬件方面,可重构技术需要在处理器内 部集成可重构功能单元。处理器运行时,通过实时加载指令配置信息,动态重构 可重构功能单元并完成重构指令执行 2 7 1 。由于可重构技术对目标应用进行特征分 析和指令提取,因此对特定嵌入式应用尤其是运算密集型应用的提升效果显著 2 2 1 o 可重构技术的研究时间较短,并且该技术对计算机软件和硬件方面均提出了 较高要求,目前世界上还没有可供商用的可重构处理器。研究型可重构处理器包 7 浙江大学博士学位论文绪论 括o n e c h i p 2 8 1 ,g a r p 2 9 1 ,c h i m a e r a 3 0 】等。 1 3 嵌入式处理器低功耗技术 随着嵌入式处理器设计不断复杂,功能日益强大,处理器的功耗问题凸显。 提升性能的同时降低处理器功耗已成为当今嵌入式处理器设计的重大挑战。 嵌入式处理器的功耗包括动态功耗与静态功耗1 3 1 1 。静态功耗通常与逻辑器件 本身相关,动态功耗则与处理器架构与实时运行状态有关。图1 2 为嵌入式处理 器动态功耗分布。由图1 2 ( a ) 发现,处理器动态功耗包含处理器内核功耗与片 上s r a m 功耗,分别占处理器总功耗的5 8 和4 2 。其中,片上s r a m 功耗主 要来源于高速缓存( c a c h e ) 、分支目标缓冲器( b t b ) 等处理器缓存资源。处理 器内核功耗主要包含时钟树功耗与数据通路功耗,分别占处理器内核功耗的3 6 左右( 图1 2 ( b ) ) 。片上高速缓存、分支目标缓冲器、时钟树与数据通路是 嵌入式处理器动态功耗优化的主要目标。 图1 2 嵌入式处理器动态功耗分析 从低功耗优化层次划分,嵌入式处理器低功耗技术包括:架构级优化,寄存 器传输级级优化以及物理设计优化 3 2 3 3 ,3 4 1 。架构级优化属于系统级低功耗优化方 法,其核心思想是通过改进处理器架构,减少冗余硬件资源的开启与访问功耗。 寄存器传输级优化,从处理器的逻辑设计层面,减少冗余信号充放电与电路翻转。 物理设计优化方法则从电路级或者门级层面,通过优化标准单元、电压调节、电 源管理等方式,降低系统的动态功耗和静态功耗。 囝 浙江大学博士学位论文绪论 1 3 1 架构级低功耗技术 为了平衡处理器与片外存储器的速度失配,嵌入式处理器普遍实现了片上高 速缓存( c a c h e ) 。c a c h e 对于处理器性能提升起到了十分关键的作用,但是以 c a c h e 为代表的片上存储系统同时消耗了3 3 的处理器功耗。降低c a c h e 动态功 耗对于降低处理器整体功耗具有重大意义。c a c h e 低功耗方法主要通过创新 c a c h e 访问方式,减少c a c h e 访问次数实现。依据优化途径不同,c a c h e 优化方 法主要包括基于访问策略优化和基于缓冲两种。基于访问策略优化方法通过创新 c a c h e 访问方法或改变c a c h e 访问顺序减少s r a m 的开启次数与访问带宽。基于 缓冲的c a c h e 低功耗方法,其核心思想是通过缓冲频繁使用的c a c h el i n e ,实现 对大多数存储器访问的捕获,减少存储器操作对c a c h e 的访问次数。 随着嵌入式处理器流水线的加深,分支指令造成的控制冲突对流水线性能的 影响愈加明显。高性能嵌入式处理器普遍实现分支目标缓冲器,加速分支指令跳 转,降低控制冲突造成的流水线性能损失。由于分支目标缓冲器每个周期都要开 启,因此成为高性能嵌入式处理器的重要能耗部件。传统的分支目标缓冲器低功 耗方法主要通过创新b t b 访问策略避免对b t b 的无效访问。此外,基于缓冲的 分支目标缓冲器低功耗方法通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论