




已阅读5页,还剩118页未读, 继续免费阅读
(计算机系统结构专业论文)微处理器双发射的技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北工业大学硕t : 论文摘要 摘要 本论文的 研究内 容是 “ 十 五” 预 研课题 “ 高性能微处理器 ( 龙腾 r 2 ) ”的 一部分, 课 题编号4 1 3 0 8 0 1 0 1 0 , 目 的是 研究r i s c微处理器的体系结构和方法, 设计兼容于p o w e r p c指令集的3 2 位嵌入式微处理器。 本课题组设计的3 2位嵌入式 r i s c微处理器 “ 龙腾 r 2 ” 芯片,指令系统 和接口时 序m o t o r o l a 公 司的p o w e r p c 7 5 0 微处理器兼容. 微体系结构采用自 主 设计的技术路线。 采用t o p - d o w n 设计 方法, 采用s m i c 0 . 1 8 u m工艺库, 综 合结果小于4 n s e 整个微处理器 选用a l t e r a e p i s 8 0 f p g a器件,实现了 整个微 处理器的f p g a原型芯片, 在此原型系 统上已 成功运行了用户提供的应用程序。 本论文主要 进行了 如下研究工作: i . 通过对高性能 r i s c微处理器流水线的系统研究,完成 “ 龙腾 r 2 ,. 微处理 器的定点流水线设计方案, 指令集与p o w e r p c兼容。 大部分指令单拍完成, 其它指令在3 - - 3 8个周期完成。 基于 对微处理器时钟、面积和性能综合考 虑,采用取指、译码、操作数准备、执行、数据读取和写回 6 级流水结构。 2 .完成微处理器的译码单元设计实 现,根据指令集的 层次模型,设计了 基于 指令类型的层次式译码的方案。 该方案便于对各类指令分别进行设计调试, 提高设计进程的并行性和模块功能的可扩展性,并具低功耗的特点。 3 微处理器定点流水线控制器的设计实现,为提高 流水线的 运行速度,设计 了 基 于 指 令 执 行 周 期 的 流 水 线 控 制 器 。 夕 方 案 将 微 处 理 器 的 控 制 通 路 和 流 水线有 机结合 起来, 实现流水线的 分布式控制, 较大减少控制逻辑的延时。 4 .分析双发射超标量处理器“ 龙腾r 2 - d i ” 的模型, 从微处理器的微体系结构 方面,进行仿 真分析,考察微处理器在不同参数配置下的相应性能。 5 . 以 “ 龙腾 r 2 微处理器的流水线为基础,为进一步提高微处理器的定点执 行性能,特别针对与 p o w e r p c指令系统,分析适合双发射嵌入式微处理器 的译码逻辑和发射逻辑。提出基于指令类型动态分配的译码器设计方案和 基于指令执行周期的动态逻辑发射方案。该方案减小了电路实现的面积并 获得较高的时钟频率。 本论文紧密结合国防十 汀 0 ; 1 i0 ( 课题, 进行了 嵌入 式双发射微处理器的研究, l y交的研究成果对进 一 步研究ili佰 级微处理器提供了勺 法和思路 关键 ; 之 : 超构 、 吊,双发9 l .嵌入式发时逻州 西北工业大学硕 1 : 论文摘要 ab s t r a c t d u e t o r e q u i r e me n t f o r h i g h s p e e d i n f o r m a t i o n p r o c e s s i n g a n d c o m p l e x i n t e l l i g e n t c o n t r o l . t h e c i r c u i t s wi t h m i c r o p r o c e s s o r a s c o r e a r e u s e d w i d e r a n d w i d e r . r e s e a r c h a n d d e s i g n i n m ic r o p r o c e s s o r a r c h i t e c t u r e c a n p r o m o t e t h e d e v e l o p m e n t o f o u r n a t i o n a l i c i n d u s t ry a n d s a t i s f y m a r k e t d e ma n d . t h e w o r k i n t h i s t h e s i s i s p a r t o f n a t i o n a l 0 5 p r o j e c t e n t i t l e d a p p l i c a t i o n s p e c i f i e d h i g h p e r f o r m a n c e m i c r o p r o c e s s o r ( l o n g t e n g r 2 ) , n o . 4 1 3 0 8 0 1 0 1 0 8 . b y s t u d y i n g r i s c a r c h i t e c t u r e a n d e x p l o r i n g d e s i g n m e t h o d o l o g y , a i m a t d e s i g n e m b e d d e d 3 2 b i t s m i c r o p r o c e s s o r c o m p a t i b l e o f p o w e r p c i n s t r u c t i o n . t h e e m b e d d e d 3 2 - b i t m i c r o p r o c e s s o r l o n g t e n g r 2 i s c o m p a t i b l e w i t h i n s t r u c t i o n s e t a n d i n t e r f a c e t i m i n g o f p o w e r p c 7 5 0 mi c r o p r o c e s s o r . t h e a r c h i t e c t u re i s f u l l c o p y r i g h t s . u s i n g t h e t o p - d o w n me t h o d o l o g y , s y n t h e s i s w i t h s mi c 0 . 1 8 u m l i b r a ry , t h e c l o c k c y c l e i s l e s s t h a n 4 n s . i t a l s o i m p l e m e n t e d o n a l t e r a e p i s 8 0 f p g a a n d t h e t h i r d p a r t a p p l i c a t i o n s h a v e b e e n s u c c e s s f u l l y r u n o n t h i s p r o t o t y p e p r o c e s s o r . t h e r e s e a r c h w o r k o f t h i s d i s s e r t a t i o n ma i n l y i n c l u d e s : 1 . s y s t e m a t i c a l l y a n a l y z e a n d r e s e a r c h t h e h i g h p e r f o r m a n c e r i s c m i c r o p r o c e s s o r p i p e l i n e , d e s i g n t h e l o n g t e n g 11 2 f i x p o i n t p i p e l i n e , w h i c h i s a 6 s t a g e s p i p e l i n e mi c r o p r o c e s s o r . 2 . d e s i g n t h e m i c r o p r o c e s s o r d e c o d e u n i t , p r o p o s e t h e s t e p p e d d e c o d e r b a s e d o n t h e i n s t r u c t i o n t y p e . t h i s m e t h o d d e c r e a s e t h e c o m p l e x i t y o f t h e i n s t r u c t i o n d e c o d e r d e b u g , p r o m o t e t h e d e s i g n p a r a l l e l i s m a n d e a s y f o r e x t e n d t h e f u n c t i o n u n i t 3 . d e s i g n t h e f i x p o i n t p i p e l i n e c o n t r o l l e r . t o i n c r e a s e t h e c l o c k f r e q u e n c y , t o r e d u c e a r e a a n d p o w e r , d e s i g n t h e p i p e l i n e c o n t r o l l e d b a s e d o n t h e i n s t r u c t i o n e x e c u t i o n c y c l e , w h i c h h i g h l y r e d u c e t h e c o n t r o l 节 a t h d e l a y 4 . r e s e a r c h t h e d u a l i s s u e p r o c e s s o r m o d e l p e r f o r m a n c e a t v a r i a b l e p r o c e s s o r c o n f i g r a t i o n . 5 . b a s e d o n l o n g t e n g r 2 mi c r o p r o c e s s o r p i p e l i n e , a n a l y z e t h e i n s t r u c t i o n d e c o d e a n d i s s u e l o g i c f o r d u a l i s s u e e mb e d d e d m i c r o p r o c e s s o r . p r o p o s e t h e r u n t i m e d i s p a t c h e d i n s t r u c t i o n d e c o d e r a n d i s s u e l o g i c b a s e d o n i n s t r u c t i o n e x e c u t i o n c y c l e . t h e d i s s e r t a t i o n w o r k p l a y s a g r e a t s i g n i f i c a n c e f o r s t u d y i n g t h e h i g h p e r f o r m a n c e mi c r o p r o c e s s o r s . t h e r e s e a r c h w o r k o ff e r s d e s i g n c o n s i d e r a t i o n s a n d t e c h n o l o g i c a l r e s e r v e s f o r f u r t h e r a d v a n c e d m i c r o p r o c e s s o r d e s i g n s . k c y w o r d : s a p e r s c a l a r , d u a l i s s u e . c n u h c d 设 计方法趋向于专 用化、 定制化和自 动化的 道路。 通过 裁剪和优化通用微处理器的各个方面来达到理想的性能。 虽然在嵌入式微处理器的设计领域,强调了芯片的面积、 功耗和速度等诸 多因素的 折中,多 数嵌入式 微处 理器采 用了单 发射的 结构, 但随 着嵌入式 微处 理器应用的 领域的 扩展. 仍然不能 忽视 对其 性能的改 进。由于单发射的流 水线 存在着很大的局限 性,极 大限 制了 微处 理器可以 获得i l p的 能力, 如何克 服单 发射流水线的局限 性就 成为迫切需要解决的问 题。 采用多发 射技术可以 打破这 一局限性 a g c o 8 7 j o u p 8 9 f i s h 8 3 。 其本 质特点 是可以同时发 射多 条指令, 从 而克服单发射流水线每周期只能发射一条指令的限制,增强并行执行程序的能 力 s h l i h e p a 9 6 o 双发射技术是最易实现的多发射技术,是山单发射到多发射的本质改变, 使微处理器的 体系结构产生了根 本性变化,从 双发射向 更高发 射度的改 进只是 增加设计的复杂度。 从实际 要求 来看, 用有限 的芯片面积和可以 接受的功耗代 价, 获得适当 性能的 嵌入式 微处 理器是 本课题的目 标。 采用过高 发射度的 微处 理器设计将导致芯片的面积、功耗增加,影响微处理器的时钟频率,背离原设 计目 标。 本文在研究 超标量 技术的基础 上, 通过采用双发射超标量技术, 实现 嵌入式微处理器的性能提高。 本课题 “ 微处理器双发射技术的研究 ”是西北工业大学航空微电子中心所 承担的 一 部 分国防 “ 十五” 预研 项日 ( 专 题编号: 4 1 3 0 8 0 1 0 1 0 8 ) , 研究高 性能 微处理器体系结构。作者主要参加了 3 2位 r i s c微处理器 “ 龙腾 r 2 ”的设计 研究,该微处理器指令集兼容p o w e r p c 并以此为基础针对高性能微处理器系 统结构中提高 指令 发射带宽的问 题。 进行基于 嵌入式微处理器的指令双发射的 技术的研究。 2国内外研究现状 -n l. 期的4 发射技术 1 -: 要足采川超流水结构 j o u p 8 9 1 和超标准结 l 西北工业大学硕 七 论文第一章 绪论 mi p s , a r m. 3 8 6 e x系列等。 嵌入式应用需求的 广泛性, 大部分应用具有功能 单一 性质确定的 特点, 决定了 嵌入式微处理器实 现高 性能的 途径与通用微处 理器有 所不同,目 前大多 是针对专门的应用领域进行专门设计来满足高性能、低成本和低功耗的要求 a a d m + 9 3 c h k k + 9 6 k a f l 9 7 b r o w n 9 7 a n u n 9 8 。 目前 嵌入式 微处 理器 的高性能和低成本技术发 展趋势是:体 系结构需要在新技术与 产品、市 场和应 用需求之间取得平衡;设 计方法趋向于专 用化、 定制化和自 动化的 道路。 通过 裁剪和优化通用微处理器的各个方面来达到理想的性能。 虽然在嵌入式微处理器的设计领域,强调了芯片的面积、 功耗和速度等诸 多因素的 折中,多 数嵌入式 微处 理器采 用了单 发射的 结构, 但随 着嵌入式 微处 理器应用的 领域的 扩展. 仍然不能 忽视 对其 性能的改 进。由于单发射的流 水线 存在着很大的局限 性,极 大限 制了 微处 理器可以 获得i l p的 能力, 如何克 服单 发射流水线的局限 性就 成为迫切需要解决的问 题。 采用多发 射技术可以 打破这 一局限性 a g c o 8 7 j o u p 8 9 f i s h 8 3 。 其本 质特点 是可以同时发 射多 条指令, 从 而克服单发射流水线每周期只能发射一条指令的限制,增强并行执行程序的能 力 s h l i h e p a 9 6 o 双发射技术是最易实现的多发射技术,是山单发射到多发射的本质改变, 使微处理器的 体系结构产生了根 本性变化,从 双发射向 更高发 射度的改 进只是 增加设计的复杂度。 从实际 要求 来看, 用有限 的芯片面积和可以 接受的功耗代 价, 获得适当 性能的 嵌入式 微处 理器是 本课题的目 标。 采用过高 发射度的 微处 理器设计将导致芯片的面积、功耗增加,影响微处理器的时钟频率,背离原设 计目 标。 本文在研究 超标量 技术的基础 上, 通过采用双发射超标量技术, 实现 嵌入式微处理器的性能提高。 本课题 “ 微处理器双发射技术的研究 ”是西北工业大学航空微电子中心所 承担的 一 部 分国防 “ 十五” 预研 项日 ( 专 题编号: 4 1 3 0 8 0 1 0 1 0 8 ) , 研究高 性能 微处理器体系结构。作者主要参加了 3 2位 r i s c微处理器 “ 龙腾 r 2 ”的设计 研究,该微处理器指令集兼容p o w e r p c 并以此为基础针对高性能微处理器系 统结构中提高 指令 发射带宽的问 题。 进行基于 嵌入式微处理器的指令双发射的 技术的研究。 2国内外研究现状 -n l. 期的4 发射技术 1 -: 要足采川超流水结构 j o u p 8 9 1 和超标准结 l 西北工业大学硕士论文 第 一章绪论 a g c o 8 7 o j o u p 8 9 中最早提出了超流水处理器的思想。超流水处理器利用如下事 实:多数流水阶段所完成的任务只需要比时钟周期一半还少的时间。将每一个 流水级分成多个子流水级,在每个子流水级中执行 1 条指令,从整体来看,在 一 个周期内取出 多条指令。 采用超流水技术的 微处 理器有m i p s r 4 0 0 0 微处理 器 mi w v 9 2 a 在双发射的微处理器结构中,采 用超标量结构的 微处理器是最多 的一 支。 它 们的体系结构由 简到繁逐步 变化。 在早期 双发 射超标量处理器中,由 于定 点 和浮 点指令的相关处理相对简单,主要是实现定点和浮点指令的双发射 m i p s r 5 a a d m + 9 3 k a b k + 9 3 。随 后, 双发 射超标量微处理器开始支持定 点 和定点指令的双发射【 a i a v 9 3 mc l e 9 3 b u r k 9 4 c h k k + 9 6 。 这类微处理器 中的典范是i n t e l 的p e n t i u m微处 理器。 p e n t i u m微处 理器围绕两条定点流水线 u流水线和 v流水线进行设计,可以近似认为是两条 4 8 6定点流水线的复制, 这两条流水线以锁步的形式进行工作。这些双发射超标量微处理器都不支持乱 序执行,是顺序发射、顺序执行的微处理器。 为了克服顺序发射、顺序执行的微处理器执行效率不高的问题,研究者开 始开发具有乱序执行能力的微处理器 t h o r 6 7 a d s t 6 7 d i a 1 9 2 a ) d i a 1 9 2 b u l h o 9 3 m o o r 9 3 s m w e 9 4 o m c 8 8 1 1 0 微处理器则是这些微处理器的一个代 表。 mc 8 8 1 1 0微处理器每周期可以发 射 2条 指令,并允许乱序执行。它包含 1 0个功能部 件, 采用寄存器记 分 牌 t h o r 6 7 实 现乱 序发射、乱序执行的 控制。 该微处理器采用对称型结构,几乎所有的执行部件均有两套,减少了资源相关 引起的停顿。 现在的双发射微处理器采用了更复杂的体系结构,与早期的通用微处理器 强调指令集的并行能力不同,这类微处理器在保证一定的面积和功耗约束 下, 进行指令集 并行的挖掘 以提 高其指令执行能 力 b p 0 0 9 4 b r o w n 9 7 k a f l 9 7 a n u n 9 8 d b g k 0 0 。例如, p o w e r p c 7 5 0 微处 理器采用了“ 适度的 发射带宽、 短流水线、 大容量c a c h e 以 及高效的分支部件” , 其微处 理器 面积和 功耗要比其它其有更宽发射带宽的微处理器和更深流水线的设计小的多,而性 能确可与之相比。 困内对超,j 、 量技术 研究的 起步 较晚,多 发射超标! l 处 理器的没计和 研究弓 - 开始陆续出现 卜 科【, 花 计兮 7 l 沂没i l l钧) 匕 芯2号微处t q !. 器,( t 于 i 令集兼齐 n 川 i s 采f- 1 4发 射 超标址方案, 设胃了两个定点部件、 两个浮点以及 个访存部件 采 川。 l b u rn 两北工业大学硕 l 论文第一章 绪论 工艺实现, 7 -1 0 级的动态流水 线,时钟 频率 5 0 0 m h z 。分离的一级指令数据 c a c h e ,指令 3 2 k b +数据 3 2 k b ,无二级 c a c h e , 浙江大学信息与通信工程研究所,设计开发了一个超标量、超流水的定点 r i s c核【 w j z h 0 1 , 其指令集与m i p s 兼容。 采 用双发 射3 路 超标量方案, 设置 了两个定点部件和一个访存部件。采用 0 . 1 8 u m工艺实现, 6 级流水结构。分离 的一级指令数据c a c h e , 指令 1 6 k b + 1 6 k b数 据,1 2 8 k b指令数 据混合的二级 c a c h e .该 处理器的 取指译码部 件采用超流水结构, 执行部件采用 超标量结构。 国 防科学技术大学为前瞻执行超标量处理器的 性能分 析模型 x i z h 9 9 。对 前瞻执行的超标量处理器进行了量化的分析研究。 西北工 业大学航空微 电子 中心为 “ 1 9 6 0微 处理器性能模型 设计” l g f z + o 1 . “ 线程级并行的 硬件技术研究” z h u 0 3 f n “ 同时多线程结构指令 流特性及取指技术研究” l i 0 4 中也 涉及到了 超标量处 理器的 研究。 1 . 3论文的内容 论文作者在攻读硕士学位期间,参加了 “ 一 卜 五”预研课题 “ 高性能微处理 备 ( 龙腾r 2 ”的研究工作,课题编号4 1 3 0 8 0 1 0 1 0 。在课题研究过程中,通过 广泛收集资 料,深入了 解目 前微处理器双发射技术, 采用理论与实际 相结 合的 原则, 基于 p o w e r p c指令集, 对超标量处理器的双发射技术进行了详尽的研究。 本文的主要工作及贡献概述如下: 1 . 参加了3 2 位嵌入式 r i s c微处理器 “ 龙腾 r 2 ” 的总体设计, 通过对高性能 r i s c微处理器流水线的系统研究,完成微处理器的定点流水线设计方案。 在指令集上与 p o w e r p c兼容,大部分指令单拍完成,其它指令在 3 3 8 个 周期完成。 基于对微处理器时钟频率、面积和性能的综合考虑,采用取指、 译 码、 操作数准备、 执行、数 据读 取和写回6 级单 发射顺序流水结 构。 2 完成微处理器的译码单元设计实现,根据指令集的层次模型,设计了基于 指令类型的层次 式译 码的方案。 该 方案便于对各类指令分别 进行设计 调试, 提高设计进程的并行性和模块功能的可扩展性,并具有低功耗的特点。 3 . 微处理器定点流水线控制器的设训实现,为了提高流水线的运行速度、i) 成 少而积和功耗,设计了从 j - 指令执行周期的流水线拧制器该方案将微处 f 1 ? 器的控制通路和流水线有 j l 的结合起来,实f u l 流水线的分布式招 制,较 人j ,k 少书 ; 制逻辑的延i ii 扛 d . 分析了双发射超标鼠处理器“ 龙腾 r :. - 1 1 ” 的模i t,) , 从微处理器的微体系结 两北工业大学硕 l 论文第一章 绪论 工艺实现, 7 -1 0 级的动态流水 线,时钟 频率 5 0 0 m h z 。分离的一级指令数据 c a c h e ,指令 3 2 k b +数据 3 2 k b ,无二级 c a c h e , 浙江大学信息与通信工程研究所,设计开发了一个超标量、超流水的定点 r i s c核【 w j z h 0 1 , 其指令集与m i p s 兼容。 采 用双发 射3 路 超标量方案, 设置 了两个定点部件和一个访存部件。采用 0 . 1 8 u m工艺实现, 6 级流水结构。分离 的一级指令数据c a c h e , 指令 1 6 k b + 1 6 k b数 据,1 2 8 k b指令数 据混合的二级 c a c h e .该 处理器的 取指译码部 件采用超流水结构, 执行部件采用 超标量结构。 国 防科学技术大学为前瞻执行超标量处理器的 性能分 析模型 x i z h 9 9 。对 前瞻执行的超标量处理器进行了量化的分析研究。 西北工 业大学航空微 电子 中心为 “ 1 9 6 0微 处理器性能模型 设计” l g f z + o 1 . “ 线程级并行的 硬件技术研究” z h u 0 3 f n “ 同时多线程结构指令 流特性及取指技术研究” l i 0 4 中也 涉及到了 超标量处 理器的 研究。 1 . 3论文的内容 论文作者在攻读硕士学位期间,参加了 “ 一 卜 五”预研课题 “ 高性能微处理 备 ( 龙腾r 2 ”的研究工作,课题编号4 1 3 0 8 0 1 0 1 0 。在课题研究过程中,通过 广泛收集资 料,深入了 解目 前微处理器双发射技术, 采用理论与实际 相结 合的 原则, 基于 p o w e r p c指令集, 对超标量处理器的双发射技术进行了详尽的研究。 本文的主要工作及贡献概述如下: 1 . 参加了3 2 位嵌入式 r i s c微处理器 “ 龙腾 r 2 ” 的总体设计, 通过对高性能 r i s c微处理器流水线的系统研究,完成微处理器的定点流水线设计方案。 在指令集上与 p o w e r p c兼容,大部分指令单拍完成,其它指令在 3 3 8 个 周期完成。 基于对微处理器时钟频率、面积和性能的综合考虑,采用取指、 译 码、 操作数准备、 执行、数 据读 取和写回6 级单 发射顺序流水结 构。 2 完成微处理器的译码单元设计实现,根据指令集的层次模型,设计了基于 指令类型的层次 式译 码的方案。 该 方案便于对各类指令分别 进行设计 调试, 提高设计进程的并行性和模块功能的可扩展性,并具有低功耗的特点。 3 . 微处理器定点流水线控制器的设训实现,为了提高流水线的运行速度、i) 成 少而积和功耗,设计了从 j - 指令执行周期的流水线拧制器该方案将微处 f 1 ? 器的控制通路和流水线有 j l 的结合起来,实f u l 流水线的分布式招 制,较 人j ,k 少书 ; 制逻辑的延i ii 扛 d . 分析了双发射超标鼠处理器“ 龙腾 r :. - 1 1 ” 的模i t,) , 从微处理器的微体系结 西北工业大学硕 卜论文 第 一 章 绪论 构 方 面 , 进 行 相 应的 仿真 分 析, 考 察 微 处 理器 在 不同 参 数 配置 下 的 性 能。 以 “ 龙腾 r 2 微处理器的流水线为基础,为进一步提高微处理器的定点执 行性能,特别针对 p o w e r p c指令系统,分析适合双发射嵌入式微处理器的 译码逻辑和发射逻辑。提出基于指令类型动态分配译码器的设计方案和基 于指令执行周期的动态逻辑发射方案。该方案减小了电 路实 现的面积并获 得较高的时钟频率。 1 . 4论文结构安排 本论文是作者结合这一年多时im在 “ 龙腾 r 2 ” 项 目 组的工作,并在此基础 上进行扩展研究而完成的,下面对本论文的结构进行简要的介绍: 第一章 为绪论, 综合介绍课题的选题背景, 国内外发展现状和论文的内容。 第二章 描述了整个 “ 龙腾 r 2 ”的体系结构,并结合 “ 龙腾 r1 ” 的流水 线设计,完成整个 “ 龙腾 r 2 ”定点流水线的设计和实现,为双发射的研究完成 实现的基础。重点解决了预取指令队列的设计方案和流水线相关的处理。 第三章 描述了整个 “ 龙腾 r 2 ”的流水线控制器的设计,介绍了针对速度 和功耗进行 优化的层次式译码器和分布式的流水线控制逻辑设计。 第四章 描述了双发射超标量处理器 “ 龙腾 r 2 - d i ”的功能模型,从微处理 器的微体系结构方面,进行相应的仿真分析。 第五章 结合嵌入式微处理器的特点, 深入讨论了适应于嵌入式微处理器的 译码器和发射逻辑设计。 第六章 论文的总结 西北工业大学硕 卜论文 第 一 章 绪论 构 方 面 , 进 行 相 应的 仿真 分 析, 考 察 微 处 理器 在 不同 参 数 配置 下 的 性 能。 以 “ 龙腾 r 2 微处理器的流水线为基础,为进一步提高微处理器的定点执 行性能,特别针对 p o w e r p c指令系统,分析适合双发射嵌入式微处理器的 译码逻辑和发射逻辑。提出基于指令类型动态分配译码器的设计方案和基 于指令执行周期的动态逻辑发射方案。该方案减小了电 路实 现的面积并获 得较高的时钟频率。 1 . 4论文结构安排 本论文是作者结合这一年多时im在 “ 龙腾 r 2 ” 项 目 组的工作,并在此基础 上进行扩展研究而完成的,下面对本论文的结构进行简要的介绍: 第一章 为绪论, 综合介绍课题的选题背景, 国内外发展现状和论文的内容。 第二章 描述了整个 “ 龙腾 r 2 ”的体系结构,并结合 “ 龙腾 r1 ” 的流水 线设计,完成整个 “ 龙腾 r 2 ”定点流水线的设计和实现,为双发射的研究完成 实现的基础。重点解决了预取指令队列的设计方案和流水线相关的处理。 第三章 描述了整个 “ 龙腾 r 2 ”的流水线控制器的设计,介绍了针对速度 和功耗进行 优化的层次式译码器和分布式的流水线控制逻辑设计。 第四章 描述了双发射超标量处理器 “ 龙腾 r 2 - d i ”的功能模型,从微处理 器的微体系结构方面,进行相应的仿真分析。 第五章 结合嵌入式微处理器的特点, 深入讨论了适应于嵌入式微处理器的 译码器和发射逻辑设计。 第六章 论文的总结 西北工业大学硕 上论文第二章 “ 龙腾” 微处理器的流水线 第二章“ 龙腾”微处理器的流水线 开发具有独立版权、与国外广泛应用的微处理器指令集兼容的微处理器是 目 前 提高国内微处理器设计 和开发能力的一种有效途径 h u t a 0 3 z h u 0 3 . “ 龙 腾” 系列微处理器是西北工业大学航空微电子中心面向航空应用领域研制的 3 2 位嵌入式微处理器。 本章对高性能微处理器中的流水线 技术进 行系统 研究,在研究的基础上, 设计并实现了 适应p o w e r p c 7 5 0 指令集体系结构的高性能流水线。 本章首先简 要介绍“ 龙腾r 2 ” 微处理器的体 系结构设计, 然后 着重讨论定点流水线的设计。 重点 实现了 流水线的划分和预取指令队列的设计方案。为进一步研究双发射流 水线打下基础。 2 . 1 2 . 1 . 1 “ 龙腾 ”微处理器体系结构 “ 龙腾”微处理器的指令集 “ 龙腾”微处理器是面向嵌入式航空应用领域设计的嵌入式微处理器。在 设计 “ 龙腾” 微处理器指令集系统结构的问 题上,有两种选择方案。其一 是根 据专 用的航空 机载应用程序, 进行统计,自 行设计一个高效的适用于航空 机载 应用 领域的指令集,但随之面临的问 题是大量系统程序、工具及应用程序的开 发; 其二是根据专 用航空机载应用程序的统计结果, 寻求适合具有大量软 件系 统支撑的指令系统作为指令集, 这样, 减少了 大量系统程序和应用程序的开发 时间和开发费用,缩短了开发周期,同时也保证所开发的微处理器在航空机载 应用领域具有高性能的特征。 第二种方案更具有现实意义。日前航空装备的 mp u仍然是 mi p s r 3 0 0 0 , 1 9 6 0 , 8 0 4 8 6 , p o w e r p c等系列3 2 位微处 理器。 根据 r e n 9 6 的 工作, 考察多 种 嵌入 式微处 理器如: p o w e r p c , mi p s 3 2 r m , a r m 1 0 系列等的指令集后, 认为: 今 p w . e r p c指令集指令格式、译码简单, 同时考虑实现速度优化和空问优化. p o w e r p c折令集 i i - 常适川 1 几 嵌入j 吃 应i r1 : 令 i i i i - 采川 r i s c p i 超标i d : . p o w e r p c 系列只川 p e n t i u m 系夕 1 又 、j 一 j 价 , 微处! i !. 器 6 0 %- 7 0 / . t 1勺 集成度,就获得j j 近的处1 !i ! 能) : 西北工业大学硕 上论文第二章 “ 龙腾” 微处理器的流水线 第二章“ 龙腾”微处理器的流水线 开发具有独立版权、与国外广泛应用的微处理器指令集兼容的微处理器是 目 前 提高国内微处理器设计 和开发能力的一种有效途径 h u t a 0 3 z h u 0 3 . “ 龙 腾” 系列微处理器是西北工业大学航空微电子中心面向航空应用领域研制的 3 2 位嵌入式微处理器。 本章对高性能微处理器中的流水线 技术进 行系统 研究,在研究的基础上, 设计并实现了 适应p o w e r p c 7 5 0 指令集体系结构的高性能流水线。 本章首先简 要介绍“ 龙腾r 2 ” 微处理器的体 系结构设计, 然后 着重讨论定点流水线的设计。 重点 实现了 流水线的划分和预取指令队列的设计方案。为进一步研究双发射流 水线打下基础。 2 . 1 2 . 1 . 1 “ 龙腾 ”微处理器体系结构 “ 龙腾”微处理器的指令集 “ 龙腾”微处理器是面向嵌入式航空应用领域设计的嵌入式微处理器。在 设计 “ 龙腾” 微处理器指令集系统结构的问 题上,有两种选择方案。其一 是根 据专 用的航空 机载应用程序, 进行统计,自 行设计一个高效的适用于航空 机载 应用 领域的指令集,但随之面临的问 题是大量系统程序、工具及应用程序的开 发; 其二是根据专 用航空机载应用程序的统计结果, 寻求适合具有大量软 件系 统支撑的指令系统作为指令集, 这样, 减少了 大量系统程序和应用程序的开发 时间和开发费用,缩短了开发周期,同时也保证所开发的微处理器在航空机载 应用领域具有高性能的特征。 第二种方案更具有现实意义。日前航空装备的 mp u仍然是 mi p s r 3 0 0 0 , 1 9 6 0 , 8 0 4 8 6 , p o w e r p c等系列3 2 位微处 理器。 根据 r e n 9 6 的 工作, 考察多 种 嵌入 式微处 理器如: p o w e r p c , mi p s 3 2 r m , a r m 1 0 系列等的指令集后, 认为: 今 p w . e r p c指令集指令格式、译码简单, 同时考虑实现速度优化和空问优化. p o w e r p c折令集 i i - 常适川 1 几 嵌入j 吃 应i r1 : 令 i i i i - 采川 r i s c p i 超标i d : . p o w e r p c 系列只川 p e n t i u m 系夕 1 又 、j 一 j 价 , 微处! i !. 器 6 0 %- 7 0 / . t 1勺 集成度,就获得j j 近的处1 !i ! 能) : 西北工业大学硕 卜 论文第_章 “ 龙腾” 微处理器的流水线 今 p o w e r p c 系列低功耗是业界公认的,p o w e r p c 7 0微处理器的功耗约 6 .5 w 2 6 6 m h z , 有利 于 航空 产品 的 应 用; . p o w e r p c允许程序显 式干 预 c a c h e , 有利于多 任务实时切换。在机载环境 下会出 现实时 多任务频繁切换, 对系统性能影响 很大。 而p o w e r p c允许用 户程序显式干预 c a c h e ,使系统开发人员拥有了消除这一不利因素的手段; 今 p o w e r p c 采用超标量技术提高性能,在处理相关时性能损失小于 p e n t i u m 等微处理器,并且设计了有利于 精确异常的结构设计。 精确异常对实时控 制、容错控制等的计算有重要意义。 鉴于上述分析结果, 决定 选用p o w e r p c系列的核心指令集作为“ 龙腾” 微 处理器的指令集。一方面满足指令集的高效、可扩充性、嵌入式应用的要求; 另一方面可保证在二进制级别上与 p o w e r p c指令系统兼容。 2 . 1 .2 “ 龙腾”微处理器的结构 “ 龙腾r 2 微处 理器在 指令集r _ 与p o w e r p c 7 5 0 微处理器 m o t o 9 7 i b m 9 9 完全兼容。 3 2 位微处理器p o w e r p c 7 5 0 是美国i b m公司 和摩托罗拉公司在九 十年代联合研制的高性能嵌入式微处理器产品,其研究与分析,设计了适合于 航空应用的 3 2 位嵌入式微处理器 “ 龙腾 r 2 ”体系结构。 “ 龙腾 r 2 ”微处理器定义了面向寄存器的指令集、寄存器模型以及异常、 故障的基本结构, 支持突发式传送技术。 “ 龙腾r 2 ” 属于标准的l o a d / s t o r e 结 构,采用 6级流水:取指 ( i f ) 、译码 ( i d) 、读操作数 ( r d) 、执行 ( e x) , 数据获取 ( m e m) , 写回 ( wb ) 。 采用基于优先级的异常处理方 式,支 持嵌套 式异常处理、支持异步不可屏蔽异常、异步可屏蔽异常和同步精确异常三种类 型异常的处理。支持多种微处理器模式,在相应的模式 卜 ,可以降低功耗或者 提高总线接口效率,从而可以更好的适用于不同的应用场合。 “ 龙腾 r 2 微处理器的结构如图 2 - 1 所示,主要包含七个功能部件:取指 译码单元、 定点执行单元、 浮点执行 单元、 l o a d / s t o r e单元、 存储管理单7 g . 一级指令/ 数据 c a c h e 单元和总线接日单元等。 西北工业大学硕 卜 论文第_章 “ 龙腾” 微处理器的流水线 今 p o w e r p c 系列低功耗是业界公认的,p o w e r p c 7 0微处理器的功耗约 6 .5 w 2 6 6 m h z , 有利 于 航空 产品 的 应 用; . p o w e r p c允许程序显 式干 预 c a c h e , 有利于多 任务实时切换。在机载环境 下会出 现实时 多任务频繁切换, 对系统性能影响 很大。 而p o w e r p c允许用 户程序显式干预 c a c h e ,使系统开发人员拥有了消除这一不利因素的手段; 今 p o w e r p c 采用超标量技术提高性能,在处理相关时性能损失小于 p e n t i u m 等微处理器,并且设计了有利于 精确异常的结构设计。 精确异常对实时控 制、容错控制等的计算有重要意义。 鉴于上述分析结果, 决定 选用p o w e r p c系列的核心指令集作为“ 龙腾” 微 处理器的指令集。一方面满足指令集的高效、可扩充性、嵌入式应用的要求; 另一方面可保证在二进制级别上与 p o w e r p c指令系统兼容。 2 . 1 .2 “ 龙腾”微处理器的结构 “ 龙腾r 2 微处 理器在 指令集r _ 与p o w e r p c 7 5 0 微处理器 m o t o 9 7 i b m 9 9 完全兼容。 3 2 位微处理器p o w e r p c 7 5 0 是美国i b m公司 和摩托罗拉公司在九 十年代联合研制的高性能嵌入式微处理器产品,其研究与分析,设计了适合于 航空应用的 3 2 位嵌入式微处理器 “ 龙腾 r 2 ”体系结构。 “ 龙腾 r 2 ”微处理器定义了面向寄存器的指令集、寄存器模型以及异常、 故障的基本结构, 支持突发式传送技术。 “ 龙腾r 2 ” 属于标准的l o a d / s t o r e 结 构,采用 6级流水:取指 ( i f ) 、译码 ( i d) 、读操作数 ( r d) 、执行 ( e x) , 数据获取 ( m e m) , 写回 ( wb ) 。 采用基于优先级的异常处理方 式,支 持嵌套 式异常处理、支持异步不可屏蔽异常、异步可屏蔽异常和同步精确异常三种类 型异常的处理。支持多种微处理器模式,在相应的模式 卜 ,可以降低功耗或者 提高总线接口效率,从而可以更好的适用于不同的应用场合。 “ 龙腾 r 2 微处理器的结构如图 2 - 1 所示,主要包含七个功能部件:取指 译码单元、 定点执行单元、 浮点执行 单元、 l o a d / s t o r e单元、 存储管理单7 g . 一级指令/ 数据 c a c h e 单元和总线接日单元等。 西北工业大学硕 l 论文第二章 “ 龙腾”微处理a的流水线 de d o d e uint 一 bran chprocesslint i n t e ge r uni t 1 / * +】 g p r f i l e l oa d s tore uni t f pr f i le f l o at i ng - p oi nt un i t d m m i id cachei cache srdb
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 升职转正述职汇报大纲
- 汽车平衡力讲解
- 小学体育项目讲解
- 新概念车祸讲解
- 我的名字深度讲解
- 如何讲好技术交流
- 网络安全机制讲解
- 细胞小学教育体系介绍
- 腰椎间盘突出症的针灸治疗
- 现代植物生产技术
- (2025年标准)分次支付协议书
- 2025年保税区面试题目及答案
- 乡镇网络安全知识培训课件
- 驾驶员安全培训考试试题及答案
- 《礼仪规范教程》 课件 概述篇 以礼相待 第一课 礼仪的概述
- 2025年新疆焊工理论考试题库
- 国际压力性损伤-溃疡预防和治疗临床指南(2025年版)解读
- GB/T 5184-1996叉车挂钩型货叉和货叉架安装尺寸
- GB/T 19355.2-2016锌覆盖层钢铁结构防腐蚀的指南和建议第2部分:热浸镀锌
- 机械制造技术基础(课程精完整版)课件
- 护士注册健康体检表下载【可直接打印版本】
评论
0/150
提交评论