流水线工作原理.ppt_第1页
流水线工作原理.ppt_第2页
流水线工作原理.ppt_第3页
流水线工作原理.ppt_第4页
流水线工作原理.ppt_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、指令流水原理,2. 指令的二级流水,1. 指令的串行执行,取指令 取指令部件 完成,总有一个部件 空闲,指令预取,若 取指 和 执行 阶段时间上 完全重叠,指令周期 减半 速度提高 1 倍,执行指令 执行指令部件 完成,必须等 上条 指令执行结束,才能确定 下条 指令的地址, 造成时间损失,3. 影响指令流水效率加倍的因素,(1) 执行时间 取指时间,(2) 条件转移指令 对指令流水的影响,解决办法 ?,猜测法,4. 指令的六级流水,六级流水,14 个时间单位,串行执行,6 9 54个时间单位,完成 一条指令,6 个时间单位,注释,二、流水线性能,1. 吞吐率,单位时间内 流水线所完成指令

2、 或 输出结果 的 数量,最大吞吐率,实际吞吐率,连续处理 n 条指令的吞吐率为,2. 加速比 Sp,m 段的 流水线的速度 与等功能的 非流水线的速度 之比,由于流水线有 建立时间 和 排空时间 因此各功能段的 设备不可能 一直 处于 工作 状态,流水线中各功能段的 利用率,3. 效率,3. 效率,流水线中各功能段的 利用率,举例 用一条5个功能段的浮点加法器流水线计算,分析首先需要考虑的是,10个数的的和最少需要做几次加法。,每个功能段的延迟时间均相等,流水线的输出端和输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算,画出流水线时空图,并计算流水线的实际吞

3、吐率、加速比和效率。,我们可以发现,加法的次数是不能减少的:9次;,于是我们要尽可能快的完成任务,就只有考虑如何让流水线尽可能充满,这需要消除前后指令之间的相关。,由于加法满足交换率和结合率,我们可以调整运算次序如以下的指令序列,我们把中间结果寄存器称为R,源操作数寄存器称为A,最后结果寄存器称为F,并假设源操作数已经在寄存器中,则指令如下:,I1:R1A1+A2 I2:R2A3+A4 I3:R3A5+A6 I4:R4A7+A8 I5:R5A9+A10 I6:R6R1+R2 I7:R7R3+R4 I8:R8R5+R6 I9:FR7+R8,这并不是唯一可能的计算方法。假设功能段的延迟为t。时-空

4、图如下,图中的数字是指令号。,3,2,1,4,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,7,7,7,7,7,8,8,8,8,8,9,9,9,9,9,21t,部件m,1,5,4,3,2,R1=A1+A2,R2=A3+A4,R3=A5+A6,R4=A7+A8,R5=A9+A10,R6=R1+R2,R7=R3+R4,R8=R5+R6,F=R7+R8,R1,R3,R5,R6,R7,R8,F,R2,R4,时间,整个计算过程需要21t,所以吞吐率为:,加速比为:,效率为:,课后思考,本课到此结束 谢谢大家,取指(FI):从存储器取出一条指令并暂时存入指令部件的缓冲区。 指令译码(DI):确定操作性质和操作数地址的形成方式。 计算操作数地址(CO):计算操作数的有效地址,涉及到寄存器间址、间址、变址、基址、相对寻址等各种地址计算方式。 取操作数(FO): 从存储器中取操作数(若操作数在寄存器中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论