




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019/7/31,第五章 标量处理机,1,5.3 超标量与超流水处理机,指令级并行度ILP:每个时钟周期执行的指令条数。 一、超标量处理机 1普通标量处理机-只有一条流水线,每个时钟周期只有一条指令流入流水线。 分为两种类型。 (1) 单操作部件流水线处理机 ILP1,2019/7/31,第五章 标量处理机,2,5.3 超标量与超流水处理机,(2) 多操作部件流水线处理机 ILP1,2019/7/31,第五章 标量处理机,3,5.3 超标量与超流水处理机,2单发射与多发射处理机 (1) 单发射处理机只有一套指令部件(取指部件和译码部件),并且每个时钟周期只取一条指令,只对一条指令进行译码。,2019/7/31,第五章 标量处理机,4,5.3 超标量与超流水处理机,单发射处理机,ILP1,2019/7/31,第五章 标量处理机,5,5.3 超标量与超流水处理机,(2) 多发射处理机有多套(m)指令部件(取指部件和译码部件),能在每个时钟周期同时取出多条指令,并同时对多条指令进行译码。,2019/7/31,第五章 标量处理机,6,5.3 超标量与超流水处理机,mILP1,2019/7/31,第五章 标量处理机,7,5.3 超标量与超流水处理机,超标量处理机: 通常,把一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机。超标量处理机最基本的要求是必须有两套或两条以上完整的指令执行部件。上图是典型超标量处理机的指令流水线,为了能够在一个时钟周期内同时发射多条指令,超标量处理机必须有两条或两条以上能够同时工作的指令流水线。 目前,在多数超标量处理机中,每个时钟周期发射两条指令,通常不超过4条。由于存在有数据相关和条件转移等问题,采用一般的指令调度技术,理论上的最佳情况是每个时钟周期发射3条指令。对大量程序的模拟统计结果也表明,每个时钟周期发射2至4条指令比较合理。例如,Intel公司的i860、i960、Pentium处理机,,2019/7/31,第五章 标量处理机,8,5.3 超标量与超流水处理机,Motolora公司的MC88110处理机,IBM公司的Power 6000处理机等每个时钟周期都发射两条指令;美国德州仪器公司(TI)为SUN公司生产SuperSPARC处理机每个时钟周期发射三条指令。 (3) 超标量处理机指令调度要解决的问题 数据相关 控制相关 功能部件冲突 3多发射流水线的调度问题(例子说明) 先看例子:,2019/7/31,第五章 标量处理机,9,5.3 超标量与超流水处理机,p327,2019/7/31,第五章 标量处理机,10,5.3 超标量与超流水处理机,共需10个周期。有8个空闲周期,其中4个是为了保证指令的顺序发射顺序完成。,(1)顺序发射顺序完成 p.327,2019/7/31,第五章 标量处理机,11,5.3 超标量与超流水处理机,(2) 顺序发射乱序完成,共需9个周期。仅有3个空闲周期。,2019/7/31,第五章 标量处理机,12,5.3 超标量与超流水处理机,(3) 乱序发射乱序完成 (采用p326先行指令窗口),共需8个周期。无空闲周期。,2019/7/31,第五章 标量处理机,13,5.3 超标量与超流水处理机,4资源冲突 (1) 什么是资源冲突? (2) 如何减少资源冲突 操作部件采用流水线结构,2019/7/31,第五章 标量处理机,14,5.3 超标量与超流水处理机,二、超流水线处理机 1什么是超流水线处理机 在前面介绍的一般标量流水线处理机中,通常把一条指令的执行过程分解为“取指令”、“译码”、“执行”和“写回结果”4级流水线。如果把其中的每级流水线再细分,例如,再分解为两级延迟时间更短的流水线,则一条指令的执行过程就要经过8级流水线。这样,在一个基本时钟周期内就能够“取指令”两条,“译码”、“执行”和“写回结果各两条指令。这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机。在有些资料上把指令流水线的级数为8级或超过8级的流水线处理机称为超流水线处理机。,2019/7/31,第五章 标量处理机,15,超流水线处理机的工作方式与上一节中介绍的超标量处理机不同,超标量处理机是通过重复设置多个“取指令”部件,设置多个“译码”、“执行”和“写回结果”部件,并且让这些功能部件同时工作来提高指令的执行速度,实际上是以增加硬件资源为代价来换取处理机性能的;而超流水线处理机则不同,它只需要增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机性能的。从流水线的时空图上看,超标量处理机采用的是空间并行性,而超流水线处理机采用的是时间并行性。,2019/7/31,第五章 标量处理机,16,5.3 超标量与超流水处理机,2指令执行时序 一台并行度ILP为n的超流水线处理机,它在一个时钟周期内能够分时发射n条指令。但这n条指令不是同时发射的,而是每隔1/n个时钟周期发射一条指令。因此,实际上超流水线处理机的流水线周期为1/n个时钟周期。一台每个时钟周期分时发射2条指令的超流水线处理机的指令执行时空图如下图所示。,2019/7/31,第五章 标量处理机,17,5.3 超标量与超流水处理机,3典型结构 在早期生产的计算机中,巨型计算机CRAY-1和大型计算机CDC7600属于超流水线处理机,其指令级并行度n=3。在目前大量使用的微处理器中,只有SGI公司的MIPS(microprocessor without Interlocked piped stages)系列处理机属于超流水线处理机。MIPS是除Intel公司的X86系列微处理器之外,生产量最大的一种微处理器。MIPS系列的微处理器主要有R2000、R3000、R4000、R5000和最近刚投放市场的R10000等几种。 R4000的指令流水线有8级,流水线操作如下图所示。R4000采用超流水线结构,取指令和访问数据都要跨越两个流水级;实际上,每个时钟周期包含两个流水级,处理器取第一条指令(IF)和取第二条指令(IS),2019/7/31,第五章 标量处理机,18,两个流水级都要访问指令Cache,这两个流水级为一个时钟周期。,2019/7/31,第五章 标量处理机,19,5.3 超标量与超流水处理机,三、超标量超流水线处理机 1. 超标量超流水线处理机 超标量超流水线处理机在一个时钟周期内要发射指令n次,每次发射指令m条,因此,超标量超流水线处理机每个时钟周期总共要发射指令mn条。 在下图中,每一个时钟周期分为3个流水线周期,每一个流水线周期发射3条指令。从图中可以看出,每个时钟周期能够发射并执行完成9条指令。因此,在理想情况下,超标量超流水线处理机执行程序的速度应该是超标量处理机和超流水线处理机执行程序速度的乘积。,2019/7/31,第五章 标量处理机,20,m,n,2019/7/31,第五章 标量处理机,21,5.3 超标量与超流水处理机,2. 超标量超流水线处理机的性能 (1)性能 在一台指令级并行度为(m,n)的超标量超流水线处理机上,连续执行N条没有资源冲突、没有数据相关和控制相关的指令所需要的时间为: 其中,k是指令流水线的时钟周期数,而不是流水线级数。t是一个时钟周期的时间长度。上式中的第一项是开始m条指令通过指令流水线所需要的时间,第二项是执行其余Nm条指令所需要的时间,这时,每一个时钟周期平均执行完成mn条指令,也就是每一个流水线周期平均执行完成n条指令。,2019/7/31,第五章 标量处理机,22,5.3 超标量与超流水处理机,(2)性能比较,2019/7/31,第五章 标量处理机,23,5.3 超标量与超流水处理机,结论: 第一,超标量处理机的相对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低,主要原因如下: 1超标量处理机在每个时钟周期的一开始就同时发射多条指令,而超流水线处理机则要把一个时钟周期平均分成多个流水线周期,每个流水线周期发射一条指令。因此,超流水线处理机的启动延迟比超标量处理机大。 2条件转移造成的损失,超流水线处理机要比超标量处理机大。 3在指令执行过程中的每一个功能段,超标量处理机都重复设置有多个相同的指令执行部件,而超流水线处理机只是把同一个指令执行部件分解为多个流水级。,2019/7/31,第五章 标量处理机,24,5.3 超标量与超流水处理机,因此,超标量处理机指令执行部件的冲突要比超流水线处理机小。 第二,当横坐标给出的设计指令级并行度比较低时,处理机实际指令级并行度的提高比较快。但是,当设计指令级并行度进一步增加时,处理机实际指令级并行度提高的速度越来越慢。因此,在实际设计超标量、超流水线、超标量超流水线处理机的指令级并行度时要适当,否则,有可能造成花费了大量的硬件,但实际上处理机所能达到的指令级并行度并不高。目前,一般认为m和n都不要超过4。 第三,一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的。这个最大值主要由程序自身的语义来决定,与这个程序,2019/7/31,第五章 标量处理机,25,5.3 超标量与超流水处理机,运行在那一种处理机上无关。因此,上图中的三条曲线,对于某一个特定的程序,最终都要收拢到同一个点上。当然,对于各个不同程序,这个收拢点的位置也是不同的。 一个程序能够达到的实际指令级并行度还与所采用的调度算法有关。目前,国际上已经提出了多种开发指令级并行性的优化调度算法。对于没有条件转移操作,没有输入输出,没有程序调用和程序中断,单入口单出口的基本块程序,实现最优调度并不十分困难。但是,对于一般程序,要充分开发程序中的指令级并行性,实现最优调度非常复杂,已经证明,这是一个NP完全问题。另外,实现最优调度所需要的代价很大,包括硬件代价和软件代价,通常需要编译器和硬件的结合才能,2019/7/31,第五章 标量处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中语文群文阅读教学与学生批判性思维培养的关联性分析论文
- 小学语文阅读教学与写作能力培养研究论文
- 芯片烧录房管理制度
- 苹果流程化管理制度
- 草根宣讲员管理制度
- 《一年级下册语文园地四》课件
- 莱钢海绵铁水再循环装配计划
- 超市连锁-连锁店的原理及其在零售业发展中的作用培训教材 102
- 解析几何基础综合-教师版教案
- 湖北省云学名校联盟2024-2025学年高二下学期期中联考生物试卷(有答案)
- 2025-2030中国伊利石行业运营效益及竞争策略展望分析报告
- 2025春季学期国开电大本科《管理英语3》一平台机考真题及答案(第十套)
- 2024-2025学年八年级下册道德与法治期末测试模拟卷(统编版)(含答案)
- 2025年社区工作者考试题目及答案
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2023年贵州贵州贵安发展集团有限公司招聘笔试真题
- 2024年山东铁投集团招聘笔试参考题库含答案解析
- 供应商绿色环保环境管理体系评估表
- GB∕T 11344-2021 无损检测 超声测厚
- 外科无菌操作技术PPT学习教案
- 宝兴县中药材生产现状及发展思路
评论
0/150
提交评论