已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,流水CPU,.,5.6流水CPU,人们追求计算机有很高的处理速率促使计算机性能提高的因素除了提高器件性能外还有哪些方式呢?,.,回顾存储器性能提升方法,解决途径硬件工艺上的提升并行工作双端口访问和多模块交叉空间并行和时间并行采用分层的存储系统Cache(第6节)虚拟存储系统(第9章),.,5.6流水CPU,5.6.1并行处理技术5.6.2流水CPU的结构5.6.3流水线中的主要问题5.6.4PentiumCPU,.,5.6.1并行处理技术,并行性(Parrelism)概念问题中具有可以同时进行运算或操作的特性例:在相同时延的条件下,用n位运算器进行n位并行运算速度几乎是一位运算器进行n位串行运算的n倍(狭义)广义含义只要在同一时刻(同时性)或在同一时间间隔内(并发性)完成两种或两种以上性质相同或不同的工作,他们在时间上相互重叠,都体现了并行性。,.,5.6.1并行处理技术,三种形式时间并行(重叠):让多个处理过程在时间上相互错开,轮流使用同一套硬件设备的各个部件,以加快硬件周转而赢得速度,实现方式就是采用流水处理部件空间并行(资源重复):以数量取胜它能真正的体现同时性LSI和VLSI为其提供了技术保证时间+空间并行Pentium中采用了超标量流水技术,.,5.6.2流水CPU的结构,流水计算机的系统组成存储器体系:主存采用多体交叉存储器;Cache流水方式CPU:指令部件、指令队列、执行部件指令流水线指令队列:FIFO执行部件:可以由多个采用流水线方式构成的算术逻辑部件构成,可以将定点运算部件和浮点运算部件分开。,第一个流水:多体交叉存储,第二个流水:CPU流水,第三个流水:运算器流水,.,5.6.2流水CPU的结构,流水线CPU时空图IF(InstructionFetch取指)ID(InstructionDecode指令译码)EX(Execution执行)WB(WriteBack写回),.,5.6.2流水CPU的结构,非流水线时空图,.,5.6.2流水CPU的结构,标量流水线时空图,.,5.6.2流水CPU的结构,超标量流水线时空图,.,5.6.2流水CPU的结构,超标量流水具有两条以上的指令流水线上图中流水线满载时,每一个时钟周期可以执行2条指令采用时间和空间并行技术PS.此时钟周期不同于彼“时钟周期”一个是流水理论中的概念一个是指令周期、CPU周期中的概念,.,5.6.2流水CPU的结构,流水线(Pipelining)的分类按种类分为指令流水线:指令步骤并行算术流水线:运算步骤并行存储流水线:多体交叉并行访存处理机流水线(宏流水线):处理机级联,.,5.6.3流水线中的主要问题,流水瓶颈问题(流水线中有速度慢的段)再分成几个段用资源重复的方法也可以解决断流问题因为出现了相关冲突,.,5.6.3流水线中的主要问题,1.资源相关:多条指令进入流水线后在同一时钟周期内争用同一功能部件。解决办法:后边指令拖一拍再推进;或增设一个存储部件,指令数据分存。,取指译码执行访存写回,.,5.6.3流水线中的主要问题,2.数据相关,看例子例:两条指令发生数据相关冲突RAW(ReadAfterWrite)写后读ADDR1,R2,R3R2+R3-R1SUBR4,R1,R5R1-R5-R4ANDR6,R1,R7R1R7-R6,.,5.6.3流水线中的主要问题,数据相关RAW(ReadAfterWrite)写后读后面指令用到前面指令所写的数据WAR(WriteAfterRead)读后写后面指令覆盖前面指令所读的单元WAW(WriteAfterWrite)写后写两条指令写同一个单元解决办法:可以推后后继指令对相关单元的读操作设置相关的直接通路(Forwarding),.,5.6.3流水线中的主要问题,3.控制相关引起原因:转移指令当前指令有跳转,但流水已经开启后续指令处理过程。解决办法1:延迟转移法,让跳转的指令接在最后流水入口解决方法2:转移预测法,用硬件预测将来的行为,提前让转移指令进流水。,.,【例4】流水线中有三类数据相关冲突:写后读(RAW)相关;读后写(WAR)相关;写后写(WAW)相关。判断以下三组指令各存在哪种类型的数据相关。1)I1ADDR1,R2,R3;(R2)+(R3)-R1I2SUBR4,R1,R5;(R1)-(R5)-R42)I3STOM(x),R3;(R3)-M(x)M(x)是存储器单元I4ADDR3,R4,R5;(R4)+(R5)-R33)I5MULR3,R1,R2;(R1)(R2)-R3I6ADDR3,R4,R5;(R4)+(R5)-R3,写后读,读后写,写后写,.,解:第1)组指令中,I1指令运算结果应先写入R1,然后在I2指令中读出R1内容。由于I2指令进入流水线,变成I2指令在I1指令写入R1前就读出R1内容,发生RAW相关。第2)组指令中,I3指令应先读出R3内容并存入存储单元M(x),然后在I4指令中将运算结果写入R3。但由于I4指令进入流水线,变成I4指令在I3指令读出R3内容前就写入R3,发生WAR相关。第3)组指令中,如果I6指令的加法运算完成时间早于I5指令的乘法运算时间,变成指令I6在指令I5写入R3前就写入R3,导致R3的内容错误,发生WAW相关。,.,5.6.4PentiumCPU,PentiumCPU(第一代)1989年初0.8um工艺,310万晶体管有60M和66MHz外频两种版本5V电压,功耗20W超标量流水线结构486有一条流水线Pentium有U和V两条指令流水线U流水线可以执行所有的整数和浮点指令V流水线可以执行简单的整数和FXCH浮点指令双重分离式Cache,减少了等待和搬移数据时间32位CPU,外部数据总线宽度为64位,外部地址总线宽度为36位,.,5.6.4PentiumCPU,非固定长度指令格式,9种寻址方式,191条指令,兼具有RISC和CISC特性,不过我们还是将其看成CISCSL电源管理技术提供了更加灵活的存储器寻址结构,可以支持传统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 分布式数据库锁协议-洞察及研究
- 2025年电商平台数据保密协议
- 2025年养老机构入住服务合同协议
- 企业员工综合报酬体系及其定量研究-以JLTF制药厂为例的开题报告
- 运营月度奖励方案模板
- 2025年中国多功能手推车行业市场占有率及投资前景预测分析报告
- 2025年中国封尾机行业市场专项调研及投资前景可行性预测报告
- 2025年中国岩白菜素行业市场前景分析预测报告
- 2025年中国工程机械市场动态监测及竞争战略研究报告
- 2025年中国建筑防水条行业市场前景预测及投资价值评估分析报告
- 2025年广东省继续教育公需课《人工智能赋能制造业高质量发展》满分答案
- 2026届浙江杭州市高三一模英语读后续写解析课件(含范文)
- 2025年考研英语二真题及答案解析(完整版)
- 2025-2026新版人教版8八年级数学上册(全册)教案设计
- Unit1HappyHolidaySectionB1a1d教学课件-人教版八年级英语上册
- 细菌性支气管肺炎的护理个案
- 地暖施工方案
- 车位过户网签合同范本
- 2025年医疗健康保健品营销策略
- 2025独家代理商合同协议书范本
- DB32T 5180-2025装配式钢筋骨架卡模体系应用技术标准
评论
0/150
提交评论