第7周大课处理器(5).ppt_第1页
第7周大课处理器(5).ppt_第2页
第7周大课处理器(5).ppt_第3页
第7周大课处理器(5).ppt_第4页
第7周大课处理器(5).ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回顾,采用流水线技术的处理器RISC处理器,教学内容,指令级并行技术,教学要求,熟悉流水线阻塞的主要原因掌握解决流水线阻塞解决的主要方法,采用流水线技术的处理器,流水线技术应具有如下特点:流水过程由若干有联系的子过程组成;每个子过程用专用的功能段实现;各个功能段所需的时间应尽量相等,这个时间一般作为时钟周期。如果流水线各个功能段所需时间不相等,则时间长的功能段将成为流水线的瓶颈,会造成流水的“堵塞/断流”,第3章处理器,3.3从CISC到RISC,3.3.1RISC产生的背景3.3.2RISC的定义3.3.3指令级并行技术,1.概述指令级并行:若程序中相邻的一组指令是相互独立的,即不竞争同一个功能部件、不相互等待对方的运算结果、不访问同一个存储单元,那么它们就可以在处理器内部并行执行。,第3章处理器,3.3.3指令级并行技术,2.指令流水阻塞的原因,结构相关:数据相关:控制相关:,流水线中重叠执行的两条或多条指令同时要使用同一硬件设备,而这一设备无法同时被这些指令使用。这样,控制逻辑就要暂停后进入流水线的指令执行。结构相关也称结构险象/结构冒险(StructureHazard),或硬件资源相关/硬件资源冲突。,第3章处理器,3.3.3指令级并行技术,2.指令流水阻塞的原因,结构相关:数据相关:控制相关:,同时处于流水线中的两条指令,若后面指令的源操作数或者基址/变址值是前面指令的目的操作数,则前面指令的写操作完成后,后面的指令才能读到正确的结果,即指令之间存在对同一主存单元或寄存器的“先写后读RAW(ReadAfterWrite)”要求。数据相关也称数据险象/数据冒险(DataHazard)。,第3章处理器,3.3.3指令级并行技术,2.指令流水阻塞的原因,结构相关:数据相关:控制相关:,已进入流水线的转移指令(尤其是条件转移指令)和其后续指令之间的相关。控制相关也称控制险象/控制冒险(ControlHazard)。,第3章处理器,3.3.3指令级并行技术,3.结构相关的解决办法,结构相关主要表现在访问主存冲突。解决方法有:(1)采用交叉访问主存储器/Cache。(2)采用哈佛结构的主存储器/Cache。(3)在处理器内部设置“先行指令预取缓冲队列”。(4)采用定长指令格式,指令字长等于机器字长。(5)将指令集设计成“Load/Store”风格。(6)指令和数据在存储器中要“对齐”存放。(7)采用多端口存储器。,第3章处理器,3.3.3指令级并行技术,4.数据相关的解决办法,基于软件的解决方法是由编译器来调整指令顺序或插入“NOP”指令。基于硬件的解决方法有:(1)阻塞流水线。(2)在处理器内部设置“相关专用通路”。,数据旁路法或内部转发法。,第3章处理器,3.3.3指令级并行技术,5.控制相关的解决办法,(1)猜测法(2)“冻结(Freeze)取指”/插入NOP指令(3)加快/提前形成条件码(4)延迟转移,第3章处理器,3.3.3指令级并行技术,6.延迟转移,修改控制逻辑,不保存指令4的执行结果或者在指令3后插入NOP指令这两种方法都会浪费一个时钟周期,可惜!,1ADDR1,R22SD(R3),R13JZNEXT24NEXT1SUBR2,R3nNEXT2MOVER4,A,第3章处理器,3.3.3指令级并行技术,6.延迟转移,这就是“延迟转移技术”(DelayedBranch)!延迟转移是由编译器完成,对应用程序员透明,但是对系统程序员不透明。,调整指令顺序:1ADDR1,R22JZNEXT23SD(R3),R14NEXT1SUBR2,R3nNEXT2MOVER4,A,第3章处理器,3.3.3指令级并行技术,7.超标量和超长指令字技术,超标量技术超长指令字技术,在处理机内部,设置m条独立的指令流水线。理想情况下,每个时刻、每个流水线段可同时执行m条不同的标量指令,称m为超标量处理机的度数。称这样的处理机为:超标量处理机(SuperscaleProcessor),超标量处理机,度数m=3的超标量处理机时空图,第3章处理器,3.3.3指令级并行技术,7.超标量和超长指令字技术,超标量技术超长指令字技术,由编译程序找出指令间潜在的并行性,将多个能并行执行的不相关的操作压缩组合在一起,形成一条有多个操作段的超长指令;这条超长字指令控制机器中多个相互独立的功能部件并行操作。每个操作码段控制其中的一个功能部件,相当于同时执行多条指令,第3章处理器,3.3.3指令级并行技术,超长指令字处理机时空图,第3章处理器,3.3.3指令级并行技术,8.超流水线技术,例3-14下列选项中,不会引起指令流水阻塞的是。A.数据旁路(转发)B.数据相关C.条件转移D.资源冲突,A,3.2.3采用流水线技术的处理器,例3-15下列选项中,能缩短程序执行时间的措施是。I.提高CPU时钟频率II.优化数据通路结构III.对程序进行编译优化A.仅I和IIB.仅I和IIIC.仅II和IIID.I、II和III,D,3.2.3采用流水线技术的处理器,例3-16下列给出的指令系统的特点中,有利于实现指令流水线的是。I.指令格式规整且长度一致II.指令和数据按边界对齐存放III.只有Load/Store指令才能对操作数进行存储访问A.仅I、IIB.仅II、IIIC.仅I、IIID.I、II和III,D,小结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论