《流水线CPU技术》PPT课件.ppt_第1页
《流水线CPU技术》PPT课件.ppt_第2页
《流水线CPU技术》PPT课件.ppt_第3页
《流水线CPU技术》PPT课件.ppt_第4页
《流水线CPU技术》PPT课件.ppt_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、5.7管道CPU、5.7.1并行概念、1并行处理的含义、并行性意味着两个或多个事件同时发生。并发性意味着两个或多个事件在同一时间间隔内发生。5.7水CPU,5.5.2并行处理概念,2并行处理技术的主要形式,(1)由于时间并行时间重叠,多个处理过程在时间上徐璐交错,并且可以通过交替重叠同一硬件集的各个部分来实现高速度。实现方法:使用流动的水处理零件。(2)空间并行资源重复,如奔腾CPU使用的过量水技术。使用多个相同的部件处理多个事件。实现方法:多处理器系统和多电脑系统或单处理器系统,(3)时间并行空间并行处理,时间并行处理和空间并行处理。管道计算机的系统构成了现代管道电脑系统的构成原理,如左图所

2、示。其中CPU由流水线组成,通常包括三个部分:命令部件、命令队列和可执行部件。牙齿三茄子功能部件可以配置三级管道。图3.33管道电脑系统配置原理图表,管道CPU的结构,命令行原理,问题毽子,串行执行方式部件利用率不高的问题(有空闲时间)。每个工艺段使用的零件不同。在一个进程段中,另一进程段中的零件处于空闲状态。(2)管道工作原理,命令周期的三个茄子主要过程:输入、输出、命令执行过程的时空图、A非管道时空图、B标量管道时空图、c .过剩数量管道时空图、标量管线从满载开始,每一周期完成一个指示。提高吞吐量、超量装配线,但需要两套(或两套以上)装配线硬件和其他电路。(见图)、典型的超额管道结构、(3

3、)管道工作方式的特点、时间的并行性、装配线分工越精细,同时执行的指令越多,处理速度就越高。但是硬件增加,需要更复杂的控制;管道各阶段的运行时间应尽可能一致。管道满后(满载),达到最大吞吐量。管道相关问题,管道相关:是指由于相邻命令之间的关系,不能同时通过流水作业的现象。管道的相关会导致管道断裂,影响整个管道的效率。管道相关原因、资源相关数据相关地址移动中断、全局相关、本地相关、本地相关:资源相关、同一系统时钟周期内同一功能部件的争用冲突。时钟3上发生内存争用的问题资源相关。解决方法:推迟手指操作以进行时钟。添加单独保存指令和数据的内存。使用双通信端口存储。本地相关:数据相关,在程序中执行命令必

4、须等待上一个命令执行完成。数据相关。示例:解决方法:延迟ADD命令导入操作。使用数据旁路(内部前向)技术将结果直接发送到下一个指令。全局相关:条件转移命令或中断导致的控制相关。解决方法:延迟传输方法:添加空操作,并等待形成切换条件。猜测:为指令预取选择概率高的分支。示例4管道具有三种茄子类型的数据相关冲突。写后读相关,读后写相关,写,相关写。确定以下三组茄子准则中的每一组都有哪些类型的数据相关:(1)I 13360 ADD R1、R2、R3;(R2) (R3)-R1 i23360 sub R4,R1,r5;(R1)-(r5)-R4 (2) i: sta m (x),R3;R3)-M(x),M(

5、x)是存储单元i43360 addr3、R4、r5;(R4) (r5)-R3 (3) i53360 mulr3,R1,R2;(R1) (R2)-R3 i63360 add R3,R4,r5;(R4) (R5)-R3,(1)I 13360 ADD R1,R2,R3;(R2) (R3)-R1 i23360 sub R4,R1,r5;(R1)-(R5)-R4组(1)命令中,I1命令的计算结果必须首先写入R1,然后从I2命令读取R1的内容。I2命令进入装配线,因此成为I2命令,在I1命令写入R1之前读取R1内容,导致RAW(写后读取)相关。本地相关:数据相关,(2) i: sta m (x),R3;(

6、R3)-M(x),M(x)是存储单元i43360 addr3,R4,r5;(R4) (R5)-R3组(2)命令中,I3命令必须首先读取R3的内容,将其存储在存储设备M(x)中,然后在I4命令中将结果写入R3。但是,由于I4命令进入装配线,因此成为I4命令,I3命令在读取R3内容之前写入R3,然后发生读后写(WAR)相关。本地相关:数据相关,(3) i53360 mulr3,R1,R2;(R1) (R2)-R3 i63360 add R3,R4,r5;(R4)(R5)-R3(3)在组命令中,如果I6命令的加法完成时间早于I5命令的乘法时间,则在I6命令I5写入R3之前写入R3会导致R3的内容错误

7、,并导致WAW(写入后写入)相关。本地相关:数据相关、本地相关处理方法、命令调度方法多个功能组件内部数据方向设置、静态调度动态调度、(1)命令调度方法、命令调度更改命令执行顺序,以解决因依存关系引起的问题。静态命令计划更改节目中命令的位置。编译器不会更改动态命令调度以更改命令的实际执行顺序。不更改命令和命令解码的顺序。控制器硬件,记分卡保留站方法,静态调度:管道延迟,X=Y Z A=BC,命令发射:启动命令以执行处理器功能单元的过程,静态调度:编译检测,编译器最优化后所需时间为17个时钟周期,动态调度-记分卡方法,分数为位矢量指令发射时,目标在记分板上寄存器保持其位置1。重写后,目标在记分牌上

8、相应地寄存器清除0。判断命令是否可以发射的条件是该命令的所有目的寄存器和源寄存器得分为零的情况。否则,请等待清除上面的位。数据相关解决方向传输技术:直接将上一命令的执行结果与下一命令所需的牙齿源操作数的功能组件、动态调度-计分卡方法、动态调度-计分卡方法、动态调度-计分卡方法、依赖流水线停止来解决相关性消除数据相关集中调度计分卡组件渡边杏性能瓶颈、计分卡缺点、动态调度-计分卡方法如果没有空的存储工作站或缓存部件,请等待命令临时执行命令发射。存储操作对象的寄存器名称将替换为与该寄存器(重命名寄存器)相对应的存储工作站名称(重命名),在重写结果时,将通过数据总线直接发送到所有等待结果的存储工作站。

9、动态时间表-;数据写入后写入和读取后消除相关写入的阻塞,存储工作站方法的优点(相对记分卡方法),动态调度-存储工作站方法,存储工作站方法(也称为Tomasulo调度方法),(2)设置多个功能组件,管道的瓶颈发生在管道段上。牙齿瓶颈段应与保留表中符号最多的行相对应。您可以设定多个相同的区段,以解决该区段的瓶颈。例如,(2)设置多个功能组件,(3)内部数据方向,内部数据方向原则数据方向分为写入读取方向、读取方向、写入方向。(3)内部数据方向data forwarding,if,id,ex,m,w,如果命令流足够长,传输引起的管道性能将下降约46。解决方法:延迟转移方法转移预测方法,1)延迟转移方法

10、,延迟转移方法,I0 LD R4,B I1 LD R1,A I2 DEC R3,1 I3 JZ R3,I50 I4 ADD R2,R4 I5 SUB R5,R6 I50 R6 i6 LD b转移延迟槽:在管道上提前执行转移命令;1)延迟转移方法;2)转移预测方法;转移预测方法:在程序运行之前,根据转移代码类型或转移历史表静态预测下一次转移是否成功。 得到的预测值都是探索性的值,不能把结果作为最终结果。根据执行结果,如果预测正确,就减去导航结果的导航标记,成为正式结果。如果不正确,就要清除临时结果。在传输预测中使用预取缓冲区。预取缓冲区有三种茄子类型:按顺序流入管道的命令。目标缓冲区:开始从传输

11、目标弹出的命令。循环缓冲区:存储小循环的顺序命令。顺序缓冲区和目标缓冲区在条件传输命令到达之前根据预测策略填充相应的命令。检测到切换条件后,选择两个缓冲区之一的命令流将进入管道,另一个缓冲区的命令流将失效。按照原始节目顺序,将命令流放在顺序缓冲区侧的装配线上。如果预测正确,则取消测试标志并将结果保存在用户寄存器或内存中,从而销毁目标缓冲区中的命令。如果预测错误,则将命令从目标缓冲区重新加载到装配线。移转预测战略,执行季别预测失败与重新执行处理,移转预测战略,季别预测branch prediction,静态绝对移转绝对移转动态1位元2位元(层次1,层次2),最后一个t,t,t,n,t,n,t,t

12、,n,n,t,n,n,n,n,n,n,n,分析每个命令的预测状态和预测成功率。假设:1)使用1位动态预测,预测器的初始状态为T。2)使用2位动态预测,预测器的初始状态为11。回答,(1)每次预测命令的状态和结果如下6次,成功率为0.46。回答,(2)每次预测命令的状态和结果如下8次,成功率为0.62。3 .全球相关:中断、中断也可能引起转移。中断一般是不可预测的;中断处理的目的不是缩短短流时间,而是处理断点现场和中断后恢复问题的方法。中断处理(1),不正确的断点方法:无论哪个命令发生中断申请,都不再允许当时尚未进入装配线的后续命令,但是已经在装配线上的指示可以流至执行完毕,也可以传回到中断处理

13、程序。例如,输入输出设备请求中断、中断处理(2)、准确的断点方法:是指使用备份寄存器存储进入管道的每个命令的现场状态。因此,无论在进入管道的指令的任何段发生中断申请,断点都是正确的。示例:运行错误的中断,4 .超出数量管道,超出数量4.2.1的管道标量管道:每个时钟周期仅发出一条命令,要求每个时钟周期仅从管道流出一条说明。超出数量的管道:在每个时钟周期中,可以向管道发出多个命令,并从管道泄漏多个结果。,例如,由于数据相关、资源冲突、传输指令、周期和中断等原因导致管道中断的三个额外发射线路阻塞延迟时间与额外生产线的调度方法有关。调度方法包括:顺序发射、顺序发射、无序发射完成、过多数量的流水线调度方法、有序执行与无序执行、无序后续命令执行在之前的命令之前开始执行后续命令之前完成、真相关命令停止继续读取任务数更改渡边杏盒手指和解码顺序更改开始顺序执行开始顺序执行完成、EX、EX、 i1 r1m(a)I2 R2(R1)(R2)i3 R3(R3)(R4)i4 R4(R4)(r5)i5 R6 i6 R6(R6)(r7),超生产线超量处理技术、超生产线和超量数量技术。超量的度为3,超线的度为3,超线的超量为9。动态多指令启动、性能分析、具有N个无相关指令的流水线、流水线的基本分段为S、超流水线的程度为N、超流水线的程度为M。基准标量机、超线机和超额数量机所需的处理时间(基本时钟周期)分别为、1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论