




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算题用一条4段浮点加法器流水线求 8个浮点数的和:Z= A+ B+ C+计E+ F+ G+ H解:Z= (A + B) + (C+ D) + (E +F) + (G+ H)结果A+B C+D E+F g+H A+B+C+D ZE+F+G+H用一条4段浮点加法器流水线求8个数之和的流水线时空图1 0 47 - t7个浮点加法共用了流水线的吞吐率为:15个时钟周期。TP 口Tk 15 t一 一c T047 t流水线的加速比为: S 1 87Tk 15 tT 04 7 t流水线的效率为: E 0 47k Tk 4 15 t例设在下图所示的静态流水线上计算:流水线的输出可以直接返回输入端或暂存于相应
2、的流水寄存器中,试计算其吞吐率、加 速比和效率。力口减法0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 时间输 AiA2A3A4A CAXB入 Bi B2 B3 B4B DC XD(3)计算性能在18个At时间中,给出了 7个结果。吞吐率为: Tp 7187则产生上述 加速比为不用流水线,由于一次求和需6A t, 一次求积需4At ,,36:27 个结果共需(4X 6+3X4) At = 36 At流水线的效率4 6 3 4E 0.258 18例 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为241 ,
3、其余各段时间均为 t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算:试计算其吞吐率、加速比和效率。加法(1)选择适合于流水线工作的算法应先计算 A1XB1、A2XB2、A3XB3 和 A4XB4;再计算(A1X B1) +(A2X B2)(A3XB3)+(A4X B4);然后求总的累加结果。(2) 画出时空图计算性能段54321输入D A + B C+D A + B + C+ DA=A 1 * biB=A2>< B2C=A3* B3D=A4*B40 123 45 678 9 1011 12 13 14 1516 17 18AiA2 A3 A4A
4、CA+BBi B2B3B4 BDC+DS 284 1564 4 3 4 E0.315 18非线性流水线例:一条4功能段的非线性流水线,每个功能段的延迟时间都相等,它的预约表如下:(1)写出流水线的禁止向量和初始冲突向量。(2)画出调度流水线的状态图。(3)求最小启动循环和最小平均启动距离。解:(1)禁止向量为:(2, 4, 6)初始冲突向量:S = 101010(2)构造状态图S 逻辑右移2、4、6位时,不作任何处理,逻辑右移1、3、5和大于等于7时:S 右移 1 位之后:010101V101010 = 111111 ,S 右移 3 位之后:000101 V101010 = 101111 ,S
5、 右移 5 位之后:000001 V101010 = 101011 ,S右移7位或大于7位后:还原到它本身。101111 右移 5 位之后:000001 V 101010= 101011,101011 右移 3 位之后:000101 V 101010 =101111,101011 右移 5 位之后:000001 V 101010= 101011o/ 7*非线性流水线的状态图简单循环:状态图中各种冲突向量只经过一次的启动循环。(3)最小的启动循环为 (1, 7)和(3, 5),平均启动距离为4。(4)启动距离最小的恒定循环为(5)简单循环平均启动距离(1 , 7)4(3,7)5(5,7)6(3,
6、5,7)5(5, 3, 7)5(3 , 5 )4(5)5(7)7向量链接练习题加法需6拍,相乘需7拍,从存储器读数需 6拍,求倒数近似值需14拍,打入寄存器及启动功能部件(包括寄存器)各需 1拍。解:(1) V0 -存储器V1V2+V3V4- V5*V6三条指令可并行执行,所需时间为执行时间最长的指令的执行时间:(1+7+1) + (32-1) = 40(2) V2 - V0+V1V3-存储器V4- V2*V3指令1、指令2并行执行并与指令 3链接,所需时间为(1+6+1) + (1+7+1) + (32-1) = 48(3) V0 -存储器V 3 V1+V2V 4- V0*V3V 6 V4+
7、V5指令1、指令2并行执行并与指令3链接,指令4与指令2存在功能部件冲突,需等待前一流水链完成之后执行,所需时间为(1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(4) V0 -存储器V 11/V0V 3 V1+V2V 5- V3*V44 条指令相链接,所需时间为(1+6+1) + (1+14+1) + (1+6+1) + (1+7+1) + (32-1) = 72(5) V0 -存储器V1V2+V3V4- V5*V6s0s1+s2前3条指令并行执行,最后一条与指令2存在功能部件冲突,所需时间为 (1+7+1) + (32-1)+ (1+6+
8、1) = 48(6) V3 -存储器V2 V0+V1s0s2+s3V3- V1*V4前 2 条指令并行执行,后 2 条指令并行执行,所需时间为(1+6+1) + (32-1) + (1+7+1) +(32-1)= 79(7) V3 -存储器V2 V0+V1V4- V2*V3存储器- V4前 2 条指令执行,再与第3 条相链接,此流水链与第4 条指令存在功能部件冲突,所需时间为 (1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(8) V0 -存储器V 2 V0+V1V 3- V2*V1V 5- V3*V4前 2 条指令相链接,此流水链与第3 条指令存在寄存器冲突,第 3 条指令与第4 条指令存在功能部件冲突,所需时间为(1+6+1) + (1+6+1) + (32-1) + (1+7+1) + (32-1) + (1+7+1) +(32-1) = 127在 Cray 1 机上,按链接方式执行下面4 条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1 拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。Vk存储器(存储器取数:7拍)NX V0+V1 (向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能信息聚合平台创新创业项目商业计划书
- 汽车车载充电器快充电子创新创业项目商业计划书
- 量子安防监测系统创新创业项目商业计划书
- 短信自动回复规则设置工具创新创业项目商业计划书
- 输卵管造影影像课件
- 2025年教育信息化基础设施建设:现状与未来规划研究报告
- 河南省夏邑一高2026届高一化学第一学期期末考试试题含解析
- 民法典物权编培训课件
- 《ISO 37001-2025 反贿赂管理体系要求及使用指南》专业深度解读和应用培训指导材料之1:2范围+3术语和定义(2025A1)(可编辑!)
- 现代物流知识培训课程课件
- 初中七年级下册语文阅读理解十篇(含答案)
- 高考必背72篇古诗词
- 高分子材料专业英语最终稿省公开课一等奖全国示范课微课金奖课件
- 《数据库应用基础(Access 2010)》中职全套教学课件
- ISO 55013-2024 资产管理-数据资产管理指南(中文版-雷泽佳翻译-2024)
- 耳穴贴压技术操作评分标准
- 大学生安全教育课件(共41张)
- 幼儿园爱卫领导小组责任分工方案
- 假的体检报告单模板
- Facebook广告操作流程和广告效果数据
- 投资意向协议书2篇
评论
0/150
提交评论