




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
流水CPU 5 6流水CPU 人们追求计算机有很高的处理速率促使计算机性能提高的因素除了提高器件性能外还有哪些方式呢 回顾存储器性能提升方法 解决途径硬件工艺上的提升并行工作双端口访问和多模块交叉空间并行和时间并行采用分层的存储系统Cache 第6节 虚拟存储系统 第9章 5 6流水CPU 5 6 1并行处理技术5 6 2流水CPU的结构5 6 3流水线中的主要问题5 6 4PentiumCPU 5 6 1并行处理技术 并行性 Parrelism 概念问题中具有可以同时进行运算或操作的特性例 在相同时延的条件下 用n位运算器进行n位并行运算速度几乎是一位运算器进行n位串行运算的n倍 狭义 广义含义只要在同一时刻 同时性 或在同一时间间隔内 并发性 完成两种或两种以上性质相同或不同的工作 他们在时间上相互重叠 都体现了并行性 5 6 1并行处理技术 三种形式时间并行 重叠 让多个处理过程在时间上相互错开 轮流使用同一套硬件设备的各个部件 以加快硬件周转而赢得速度 实现方式就是采用流水处理部件空间并行 资源重复 以数量取胜它能真正的体现同时性LSI和VLSI为其提供了技术保证时间 空间并行Pentium中采用了超标量流水技术 5 6 2流水CPU的结构 流水计算机的系统组成存储器体系 主存采用多体交叉存储器 Cache流水方式CPU 指令部件 指令队列 执行部件指令流水线指令队列 FIFO执行部件 可以由多个采用流水线方式构成的算术逻辑部件构成 可以将定点运算部件和浮点运算部件分开 第一个流水 多体交叉存储 第二个流水 CPU流水 第三个流水 运算器流水 5 6 2流水CPU的结构 流水线CPU时空图IF InstructionFetch取指 ID InstructionDecode指令译码 EX Execution执行 WB WriteBack写回 5 6 2流水CPU的结构 非流水线时空图 5 6 2流水CPU的结构 标量流水线时空图 5 6 2流水CPU的结构 超标量流水线时空图 5 6 2流水CPU的结构 超标量流水具有两条以上的指令流水线上图中流水线满载时 每一个时钟周期可以执行2条指令采用时间和空间并行技术PS 此时钟周期不同于彼 时钟周期 一个是流水理论中的概念一个是指令周期 CPU周期中的概念 5 6 2流水CPU的结构 流水线 Pipelining 的分类按种类分为指令流水线 指令步骤并行算术流水线 运算步骤并行存储流水线 多体交叉并行访存处理机流水线 宏流水线 处理机级联 5 6 3流水线中的主要问题 流水瓶颈问题 流水线中有速度慢的段 再分成几个段用资源重复的方法也可以解决断流问题因为出现了相关冲突 5 6 3流水线中的主要问题 1 资源相关 多条指令进入流水线后在同一时钟周期内争用同一功能部件 解决办法 后边指令拖一拍再推进 或增设一个存储部件 指令数据分存 取指译码执行访存写回 5 6 3流水线中的主要问题 2 数据相关 看例子例 两条指令发生数据相关冲突RAW ReadAfterWrite 写后读ADDR1 R2 R3R2 R3 R1SUBR4 R1 R5R1 R5 R4ANDR6 R1 R7R1 R7 R6 5 6 3流水线中的主要问题 数据相关RAW ReadAfterWrite 写后读后面指令用到前面指令所写的数据WAR WriteAfterRead 读后写后面指令覆盖前面指令所读的单元WAW WriteAfterWrite 写后写两条指令写同一个单元解决办法 可以推后后继指令对相关单元的读操作设置相关的直接通路 Forwarding 5 6 3流水线中的主要问题 3 控制相关引起原因 转移指令当前指令有跳转 但流水已经开启后续指令处理过程 解决办法1 延迟转移法 让跳转的指令接在最后流水入口解决方法2 转移预测法 用硬件预测将来的行为 提前让转移指令进流水 例4 流水线中有三类数据相关冲突 写后读 RAW 相关 读后写 WAR 相关 写后写 WAW 相关 判断以下三组指令各存在哪种类型的数据相关 1 I1ADDR1 R2 R3 R2 R3 R1I2SUBR4 R1 R5 R1 R5 R42 I3STOM x R3 R3 M x M x 是存储器单元I4ADDR3 R4 R5 R4 R5 R33 I5MULR3 R1 R2 R1 R2 R3I6ADDR3 R4 R5 R4 R5 R3 写后读 读后写 写后写 解 第1 组指令中 I1指令运算结果应先写入R1 然后在I2指令中读出R1内容 由于I2指令进入流水线 变成I2指令在I1指令写入R1前就读出R1内容 发生RAW相关 第2 组指令中 I3指令应先读出R3内容并存入存储单元M x 然后在I4指令中将运算结果写入R3 但由于I4指令进入流水线 变成I4指令在I3指令读出R3内容前就写入R3 发生WAR相关 第3 组指令中 如果I6指令的加法运算完成时间早于I5指令的乘法运算时间 变成指令I6在指令I5写入R3前就写入R3 导致R3的内容错误 发生WAW相关 5 6 4PentiumCPU PentiumCPU 第一代 1989年初0 8um工艺 310万晶体管有60M和66MHz外频两种版本5V电压 功耗20W超标量流水线结构486有一条流水线Pentium有U和V两条指令流水线U流水线可以执行所有的整数和浮点指令V流水线可以执行简单的整数和FXCH浮点指令双重分离式Cache 减少了等待和搬移数据时间32位CPU 外部数据总线宽度为64位 外部地址总线宽度为36位 5 6 4PentiumCPU 非固定长度指令格式 9种寻址方式 191条指令 兼具有RISC和CISC特性 不过我们还是将其看成CISCSL电源管理技术提供了更加灵活的存储器寻址结构 可以支持传统的4k大小的页面 也可以支持4M大小的页面动态转移预测技术Pen
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 输液给药后的观察与护理
- 航空航天复合材料 课件 第3章 轻金属基复合材料
- 旅游景区停车场车位租赁及旅游合作协议
- 餐饮客户家庭聚餐签单服务合同
- 征收搬迁拆迁合同汇编宝典
- 采购人员廉洁自律与责任追究协议
- 教育机构分公司成立及人才培养合作合同
- 纸板品质管理培训
- 成都房地产项目股权质押购房合同
- 离婚协议及子女抚养权、赡养费协议
- 日语水平考试试题及答案
- 广东省东莞市2025届九年级下学期中考二模物理试卷(含答案)
- 安徽省2023~2024学年新高一数学自主招生考试试题含答案
- 冠心病患者非心脏手术麻醉管理专家共识
- 高中生安全教育
- 嘉兴市重点中学2025年初三冲刺押题(最后一卷)英语试题试卷含答案
- 婴幼儿护理的重要知识点试题及答案
- 智能化综合农贸市场建设方案与可行性分析
- 餐饮门店打样管理制度
- 人防车位使用权转让协议一次性终
- 中医养生茶饮文化分享
评论
0/150
提交评论