计算机系统结构计算题_第1页
计算机系统结构计算题_第2页
计算机系统结构计算题_第3页
计算机系统结构计算题_第4页
计算机系统结构计算题_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算题 用一条4段浮点加法器流水线求8个浮点数的和:ZABCDEFGH解: Z(AB)(CD)(EF)(GH) 例 设在下图所示的静态流水线上计算: 流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,试计算其吞吐率、加速比和效率。 (3)计算性能在18个t时间中,给出了7个结果。吞吐率为: 不用流水线,由于一次求和需6t,一次求积需4t, 则产生上述7个结果共需(46+34)t = 36t 加速比为 流水线的效率 例 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2t,其余各段时间均为t,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法应先计算A1B1、A2B2、A3B3和A4B4;再计算(A1B1)(A2B2) (A3B3)(A4B4);然后求总的累加结果。(2) 画出时空图(3) 计算性能 非线性流水线例5.3:一条4功能段的非线性流水线,每个功能段的延迟时间都相等,它的预约表如下: (1)写出流水线的禁止向量和初始冲突向量。 (2)画出调度流水线的状态图。 (3)求最小启动循环和最小平均启动距离。 (4)求平均启动距离最小的恒定循环。 解:(1)禁止向量为:(2,4,6) 初始冲突向量:S = 101010(2)构造状态图 S逻辑右移2、4、6位时,不作任何处理, 逻辑右移1、3、5和大于等于7时: S右移1位之后:010101101010111111, S右移3位之后:000101101010101111, S右移5位之后:000001101010101011, S右移7位或大于7位后:还原到它本身。101111右移5位之后:000001101010101011,101011右移3位之后:000101101010101111,101011右移5位之后:000001101010101011。 简单循环:状态图中各种冲突向量只经过一次的启动循环。(3)最小的启动循环为(1,7)和(3,5), 平均启动距离为 4。(4)启动距离最小的恒定循环为(5) 向量链接练习题加法需6拍,相乘需7拍,从存储器读数需6拍,求倒数近似值需14拍,打入寄存器及启动功能部件(包括寄存器)各需1拍。解:(1) V0存储器V1V2+V3V4V5*V6 三条指令可并行执行,所需时间为执行时间最长的指令的执行时间:(1+7+1) + (32-1) = 402) V2V0+V1V3存储器V4V2*V3 指令1、指令2并行执行并与指令3链接,所需时间为(1+6+1) + (1+7+1) + (32-1) = 48(3) V0存储器V3V1+V2V4V0*V3V6V4+V5 指令1、指令2并行执行并与指令3链接,指令4与指令2存在功能部件冲突,需等待前一流水链完成之后执行,所需时间为(1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(4) V0存储器V11/V0V3V1+V2V5V3*V44条指令相链接,所需时间为(1+6+1) + (1+14+1) + (1+6+1) + (1+7+1) + (32-1) = 72(5) V0存储器V1V2+V3V4V5*V6s0s1+s2 前3条指令并行执行,最后一条与指令2存在功能部件冲突,所需时间为(1+7+1) + (32-1) + (1+6+1) = 48(6) V3存储器V2V0+V1s0s2+s3V3V1*V4 前2条指令并行执行,后2条指令并行执行,所需时间为(1+6+1) + (32-1) + (1+7+1) +(32-1) = 79(7) V3存储器V2V0+V1V4V2*V3存储器V4 前2条指令执行,再与第3条相链接,此流水链与第4条指令存在功能部件冲突,所需时间为(1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(8) V0存储器V2V0+V1V3V2*V1V5V3*V4前2条指令相链接,此流水链与第3条指令存在寄存器冲突,第3条指令与第4条指令存在功能部件冲突,所需时间为(1+6+1) + (1+6+1) + (32-1) + (1+7+1) + (32-1) + (1+7+1) + (32-1) = 127在Cray 1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。 V0存储器 (存储器取数:7拍)V2V0+V1 (向量加:3拍)V3V2A3 (按照A3左移:4拍)V5V

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论