已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 1 9 第五章标量处理机 1 5 3超标量与超流水处理机 指令级并行度ILP 每个时钟周期执行的指令条数 一 超标量处理机1 普通标量处理机 只有一条流水线 每个时钟周期只有一条指令流入流水线 分为两种类型 1 单操作部件流水线处理机ILP 1 2020 1 9 第五章标量处理机 2 5 3超标量与超流水处理机 2 多操作部件流水线处理机ILP 1 2020 1 9 第五章标量处理机 3 5 3超标量与超流水处理机 2 单发射与多发射处理机 1 单发射处理机 只有一套指令部件 取指部件和译码部件 并且每个时钟周期只取一条指令 只对一条指令进行译码 2020 1 9 第五章标量处理机 4 5 3超标量与超流水处理机 单发射处理机 ILP 1 2020 1 9 第五章标量处理机 5 5 3超标量与超流水处理机 2 多发射处理机 有多套 m 指令部件 取指部件和译码部件 能在每个时钟周期同时取出多条指令 并同时对多条指令进行译码 2020 1 9 第五章标量处理机 6 5 3超标量与超流水处理机 m ILP 1 2020 1 9 第五章标量处理机 7 5 3超标量与超流水处理机 超标量处理机 通常 把一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机 超标量处理机最基本的要求是必须有两套或两条以上完整的指令执行部件 上图是典型超标量处理机的指令流水线 为了能够在一个时钟周期内同时发射多条指令 超标量处理机必须有两条或两条以上能够同时工作的指令流水线 目前 在多数超标量处理机中 每个时钟周期发射两条指令 通常不超过4条 由于存在有数据相关和条件转移等问题 采用一般的指令调度技术 理论上的最佳情况是每个时钟周期发射3条指令 对大量程序的模拟统计结果也表明 每个时钟周期发射2至4条指令比较合理 例如 Intel公司的i860 i960 Pentium处理机 2020 1 9 第五章标量处理机 8 5 3超标量与超流水处理机 Motolora公司的MC88110处理机 IBM公司的Power6000处理机等每个时钟周期都发射两条指令 美国德州仪器公司 TI 为SUN公司生产SuperSPARC处理机每个时钟周期发射三条指令 3 超标量处理机指令调度要解决的问题 数据相关 控制相关 功能部件冲突3 多发射流水线的调度问题 例子说明 先看例子 2020 1 9 第五章标量处理机 9 5 3超标量与超流水处理机 p327 2020 1 9 第五章标量处理机 10 5 3超标量与超流水处理机 共需10个周期 有8个空闲周期 其中4个是为了保证指令的顺序发射顺序完成 1 顺序发射顺序完成p 327 2020 1 9 第五章标量处理机 11 5 3超标量与超流水处理机 2 顺序发射乱序完成 共需9个周期 仅有3个空闲周期 2020 1 9 第五章标量处理机 12 5 3超标量与超流水处理机 3 乱序发射乱序完成 采用p326先行指令窗口 共需8个周期 无空闲周期 2020 1 9 第五章标量处理机 13 5 3超标量与超流水处理机 4 资源冲突 1 什么是资源冲突 2 如何减少资源冲突操作部件采用流水线结构 2020 1 9 第五章标量处理机 14 5 3超标量与超流水处理机 二 超流水线处理机1 什么是超流水线处理机在前面介绍的一般标量流水线处理机中 通常把一条指令的执行过程分解为 取指令 译码 执行 和 写回结果 4级流水线 如果把其中的每级流水线再细分 例如 再分解为两级延迟时间更短的流水线 则一条指令的执行过程就要经过8级流水线 这样 在一个基本时钟周期内就能够 取指令 两条 译码 执行 和 写回结果 各两条指令 这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机 在有些资料上把指令流水线的级数为8级或超过8级的流水线处理机称为超流水线处理机 2020 1 9 第五章标量处理机 15 超流水线处理机的工作方式与上一节中介绍的超标量处理机不同 超标量处理机是通过重复设置多个 取指令 部件 设置多个 译码 执行 和 写回结果 部件 并且让这些功能部件同时工作来提高指令的执行速度 实际上是以增加硬件资源为代价来换取处理机性能的 而超流水线处理机则不同 它只需要增加少量硬件 是通过各部分硬件的充分重叠工作来提高处理机性能的 从流水线的时空图上看 超标量处理机采用的是空间并行性 而超流水线处理机采用的是时间并行性 2020 1 9 第五章标量处理机 16 5 3超标量与超流水处理机 2 指令执行时序一台并行度ILP为n的超流水线处理机 它在一个时钟周期内能够分时发射n条指令 但这n条指令不是同时发射的 而是每隔1 n个时钟周期发射一条指令 因此 实际上超流水线处理机的流水线周期为1 n个时钟周期 一台每个时钟周期分时发射2条指令的超流水线处理机的指令执行时空图如下图所示 2020 1 9 第五章标量处理机 17 5 3超标量与超流水处理机 3 典型结构在早期生产的计算机中 巨型计算机CRAY 1和大型计算机CDC 7600属于超流水线处理机 其指令级并行度n 3 在目前大量使用的微处理器中 只有SGI公司的MIPS microprocessorwithoutInterlockedpipedstages 系列处理机属于超流水线处理机 MIPS是除Intel公司的X86系列微处理器之外 生产量最大的一种微处理器 MIPS系列的微处理器主要有R2000 R3000 R4000 R5000和最近刚投放市场的R10000等几种 R4000的指令流水线有8级 流水线操作如下图所示 R4000采用超流水线结构 取指令和访问数据都要跨越两个流水级 实际上 每个时钟周期包含两个流水级 处理器取第一条指令 IF 和取第二条指令 IS 2020 1 9 第五章标量处理机 18 两个流水级都要访问指令Cache 这两个流水级为一个时钟周期 2020 1 9 第五章标量处理机 19 5 3超标量与超流水处理机 三 超标量超流水线处理机1 超标量超流水线处理机超标量超流水线处理机在一个时钟周期内要发射指令n次 每次发射指令m条 因此 超标量超流水线处理机每个时钟周期总共要发射指令mn条 在下图中 每一个时钟周期分为3个流水线周期 每一个流水线周期发射3条指令 从图中可以看出 每个时钟周期能够发射并执行完成9条指令 因此 在理想情况下 超标量超流水线处理机执行程序的速度应该是超标量处理机和超流水线处理机执行程序速度的乘积 2020 1 9 第五章标量处理机 20 m n 2020 1 9 第五章标量处理机 21 5 3超标量与超流水处理机 2 超标量超流水线处理机的性能 1 性能在一台指令级并行度为 m n 的超标量超流水线处理机上 连续执行N条没有资源冲突 没有数据相关和控制相关的指令所需要的时间为 其中 k是指令流水线的时钟周期数 而不是流水线级数 t是一个时钟周期的时间长度 上式中的第一项是开始m条指令通过指令流水线所需要的时间 第二项是执行其余N m条指令所需要的时间 这时 每一个时钟周期平均执行完成mn条指令 也就是每一个流水线周期平均执行完成n条指令 2020 1 9 第五章标量处理机 22 5 3超标量与超流水处理机 2 性能比较 2020 1 9 第五章标量处理机 23 5 3超标量与超流水处理机 结论 第一 超标量处理机的相对性能最高 其次是超标量超流水线处理机 超流水线处理机的相对性能最低 主要原因如下 1 超标量处理机在每个时钟周期的一开始就同时发射多条指令 而超流水线处理机则要把一个时钟周期平均分成多个流水线周期 每个流水线周期发射一条指令 因此 超流水线处理机的启动延迟比超标量处理机大 2 条件转移造成的损失 超流水线处理机要比超标量处理机大 3 在指令执行过程中的每一个功能段 超标量处理机都重复设置有多个相同的指令执行部件 而超流水线处理机只是把同一个指令执行部件分解为多个流水级 2020 1 9 第五章标量处理机 24 5 3超标量与超流水处理机 因此 超标量处理机指令执行部件的冲突要比超流水线处理机小 第二 当横坐标给出的设计指令级并行度比较低时 处理机实际指令级并行度的提高比较快 但是 当设计指令级并行度进一步增加时 处理机实际指令级并行度提高的速度越来越慢 因此 在实际设计超标量 超流水线 超标量超流水线处理机的指令级并行度时要适当 否则 有可能造成花费了大量的硬件 但实际上处理机所能达到的指令级并行度并不高 目前 一般认为m和n都不要超过4 第三 一个特定程序由于受到本身的数据相关和控制相关的限制 它的指令级并行度的最大值是确定的 这个最大值主要由程序自身的语义来决定 与这个程序 2020 1 9 第五章标量处理机 25 5 3超标量与超流水处理机 运行在那一种处理机上无关 因此 上图中的三条曲线 对于某一个特定的程序 最终都要收拢到同一个点上 当然 对于各个不同程序 这个收拢点的位置也是不同的 一个程序能够达到的实际指令级并行度还与所采用的调度算法有关 目前 国际上已经提出了多种开发指令级并行性的优化调度算法 对于没有条件转移操作 没有输入输出 没有程序调用和程序中断 单入口单出口的基本块程序 实现最优调度并不十分困难 但是 对于一般程序 要充分开发程序中的指令级并行性 实现最优调度非常复杂 已经证明 这是一个NP完全问题 另外 实现最优调度所需要的代价很大 包括硬件代价和软件代价 通常需要编译器和硬件的结合才能 20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国调压阀弹簧项目投资可行性研究报告
- 中国通话系统项目投资可行性研究报告
- 承重粉煤灰多孔砖行业深度研究报告
- 掩门矮柜行业深度研究报告
- 奔驰涨紧轮行业深度研究报告
- 团队沟通与协作高效工具指南
- 卧式自粘机行业深度研究报告
- 黄松木木纹软片行业深度研究报告
- 中国标准电感组项目投资可行性研究报告
- 警察攻楼考试题目及答案
- 2025届绵阳一诊 生物试卷
- 《晴隆县红寨煤业有限责任公司晴隆县中营镇红寨煤矿(变更)矿产资源绿色开发利用方案(三合一)》评审意见
- 电子公司塑料电镀件IQC作业指导书
- 食堂送餐合同
- 《新能源乘用车二手车鉴定评估技术规范 第1部分:纯电动》
- 2025年东莞望牛墩镇事业单位招考(10人)高频重点提升(共500题)附带答案详解
- 学校网络安全工作领导小组及职责
- 电力设备交接和预防性试验规程
- 浙江省杭州地区(含周边)重点中学2024-2025学年高一上学期11月期中考试英语试题 含解析
- 安徽省卓越县中联盟2024-2025学年高三上学期11月期中考试语文试卷(含答案)
- GB/T 12996-2024电动轮椅车
评论
0/150
提交评论