《计算机组织结构》课后作业参考答案-2013介绍.pdf

上传人：简*** IP属地：湖北上传时间：2020-03-16 格式：PDF 页数：12 大小：325.65KB 积分：9.6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

计算机组织结构课后作业习题参考答案计算机组织结构课后作业习题参考答案第一章第一章 1 6 某台主频为 400MHz 的计算机执行标准测试程序程序中指令类型执行数量和平均时钟周期数如下指令类型指令执行数量平均时钟周期数整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2 求该计算机的有效 CPI MIPS 和程序执行时间解 1 CPI 45000 1 75000 2 8000 4 1500 2 129500 1 776 2 MIPS 速率 f CPI 400 1 776 225 225MIPS 3 程序执行时间 45000 1 75000 2 8000 4 1500 2 400 575s 1 7 将计算机系统中某一功能的处理速度加快 10 倍但该功能的处理时间仅为整个系统运行时间的 40 则采用此增强功能方法后能使整个系统的性能提高多少解解由题可知可改进比例 40 0 4 部件加速比 10 根据 Amdahl 定律可知 5625 1 10 4 0 4 01 1 系统加速比采用此增强功能方法后能使整个系统的性能提高到原来的 1 5625 倍 1 8 计算机系统中有三个部件可以改进这三个部件的部件加速比为部件加速比1 30 部件加速比2 20 部件加速比3 10 1 如果部件 1 和部件 2 的可改进比例均为 30 那么当部件 3 的可改进比例为多少时系统加速比才可以达到 10 2 如果三个部件的可改进比例分别为 30 30 和 20 三个部件同时改进那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少解 1 在多个部件可改进情况下 Amdahl 定理的扩展 i i i n S F F S 1 1 已知 S1 30 S2 20 S3 10 Sn 10 F1 0 3 F2 0 3 得 10 20 0 330 0 30 30 3 1 1 10 33 FF 得 F3 0 36 即部件 3 的可改进比例为 36 2 设系统改进前的执行时间为 T 则 3 个部件改进前的执行时间为 0 3 0 3 0 2 T 0 8T 不可改进部分的执行时间为 0 2T 已知 3 个部件改进后的加速比分别为 S1 30 S2 20 S3 10 因此 3 个部件改进后的执行时间为 T TTT Tn045 0 10 2 0 20 3 0 30 3 0 改进后整个系统的执行时间为 Tn 0 045T 0 2T 0 245T 那么系统中不可改进部分的执行时间在总执行时间中占的比例是 82 0 245 0 2 0 T T 第三章第三章 3 9 列举出下面循环中的所有相关包括输出相关反相关真相关 for i 2 i 100 i i 1 a i b i a i s1 c i 1 a i d i s2 a i 1 2 b i s3 b i 1 2 b i s4 解展开循环两次 a i b i a i s1 c i 1 a i d i s2 a i 1 2 b i s3 b i 1 2 b i s4 a i 1 b i 1 a i 1 s1 c i 2 a i 1 d i 1 s2 a i 2 b i 1 s3 b i 2 2 b i 1 s4 第一次循环引入的相关输出相关无反相关无真相关 S1 S2 由于第二次循环引入的相关 S4 S4 真相关 S1 S4 真相关 S3 S4 真相关 S1 S3 输出相关反相关 S2 S3 反相关 3 12 有一指令流水线如下所示入 1 2 3 4 出 50ns 50ns 100ns 200ns 1 求连续输入10条指令该流水线的实际吞吐率和效率 2 该流水线的瓶颈在哪一段请采取两种不同的措施消除此瓶颈对于你所给出的两种新的流水线连续输入10条指令时其实际吞吐率和效率各是多少解 1 2200 ns 2009200 10050 50 t 1n tTmax m 1i ipipeline ns 220 1 T n TP 1 pipeline 45 45 11 5 4 400 TP m t TPE m 1i i 2 瓶颈在3 4段变成八级流水线细分 850 ns 509850 t1 ntTmax m 1i ipipeline ns 85 1 T n TP 1 pipeline 58 82 17 10 8 400 TP m ti TPE m 1i 重复设置部件 ns 85 1 T n TP 1 pipeline 58 82 17 10 8850 10400 E 1 2 3 1 3 2 4 1 4 2 4 3 4 4 123 13 24 14 4 入出 50ns50ns50ns 50ns 50ns50ns 1 2 3 1 3 2 4 1 4 2 4 3 4 4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 9 9 10 10 8 9 10 8 9 10 850ns850ns 时间段 3 14 有一条静态多功能流水线由5段组成加法用1 3 4 5段乘法用1 2 5段第 3段的时间为2 t 其余各段的时间均为 t 而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中现要在该流水线上计算画出其时空图并计算其吞吐率加速比和效率解首先应选择适合于流水线工作的算法对于本题应先计算A1 B1 A2 B2 A3 B3 和A4 B4 再计算 A1 B1 A2 B2 和 A3 B3 A4 B4 然后求总的结果其次画出完成该计算的时空图如图所示图中阴影部分表示该段在工作由图可见它在18个 t时间中给出了7个结果所以吞吐率为 t TP 81 7 如果不用流水线由于一次求积需3 t 一次求和需5 t 则产生上述7个结果共需 4 5 3 3 t 29 t 所以加速比为该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得 3 15 动态多功能流水线由6个功能段组成如下图 1 2345 乘法加法 t t 2 t t t 4 1 i i i BA S1 S2 S3 S4 S5 乘法加法 S6 时间段 1 2 3 4 5 0 1 2 3 4 5 6 7891011 12131415 16 输入 A1 B1 A2 B2 A3 B3 A4 B4 A BCD A B C D A B A BC DA B C D A A1 B1 B A2 B2 C A3 B3 D A4 B4 C D 17 18 61 1 81 92 t t S 223 0 185 3354 E 其中 S1 S4 S5 S6组成乘法流水线 S1 S2 S3 S6组成加法流水线各个功能段时间均为50ns 假设该流水线的输出结果可以直接返回输入端而且设置有足够的缓冲寄存器若以最快的方式用该流水计算 5 1i iii zyx 1 画出时空图 2 计算实际的吞吐率加速比和效率解机器一共要做10次乘法 4次加法 3 17 假设各种分支指令数占所有指令数的百分比如下条件分支 20 其中的60 是分支成功的跳转和调用 5 现有一条段数为4的流水线无条件分支在第二个时钟周期结束时就被解析出来而条件分支要到第三个时钟周期结束时才能够被解析出来第一个流水段是完全独立于指令类型的即所有类型的指令都必须经过第一个流水段的处理请问在没有任何控制相关的情况下该流水线相对于存在上述控制相关情况下的加速比是多少解没有控制相关时流水线的平均CPI 1 存在控制相关时由于无条件分支在第二个时钟周期结束时就被解析出来而条件分支要到第3个时钟周期结束时才能被解析出来所以 1 若使用排空流水线的策略则对于条件分支有两个额外的stall 对无条件分支有一个额外的stall CPI 1 20 2 5 1 1 45 加速比S CPI 1 1 45 2 若使用预测分支成功策略则对于不成功的条件分支有两个额外的stall 对无条件分支和成功的条件分支有一个额外的stall 1 CPI 1 20 60 1 40 2 5 1 1 33 加速比S CPI 1 1 33 3 若使用预测分支失败策略则对于成功的条件分支有两个额外的stall 对无条件分支有一个额外的stall 对不成功的条件分支其目标地址已经由PC 值给出不必等待所以无延迟 CPI 1 20 60 2 40 0 5 1 1 29 加速比 S CPI 1 1 29 第五章第五章 5 10 假设对指令Cache的访问占全部访问的75 而对数据Cache的访问占全部访问的25 Cache的命中时间为1个时钟周期失效开销为50 个时钟周期在混合Cache中一次load 或store操作访问Cache的命中时间都要增加一个时钟周期 32KB的指令Cache的失效率为 0 39 32KB的数据Cache的失效率为4 82 64KB的混合Cache的失效率为1 35 又假设采用写直达策略且有一个写缓冲器并且忽略写缓冲器引起的等待试问指令Cache 和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比哪种Cache 的失效率更低两种情况下平均访存时间各是多少解 1 根据题意约75 的访存为取指令因此分离Cache的总体失效率为 75 0 39 25 4 82 1 50 根据题意容量为128KB的混合Cache的失效率为1 35 也就是说混合Cache的失效率比分离Cache的低一些 2 平均访存时间公式可以分为指令访问和数据访问两部分平均访存时间指令所占的百分比读命中时间读失效率失效开销数据所占的百分比数据命中时间数据失效率失效开销根据这个公式可求得两种结构的平均访存时间分别为分离Cache的平均访存时间 75 1 0 39 50 25 1 4 82 50 1 7488 时钟周期混合Cache的平均访存时间 75 1 1 35 50 25 1 1 1 35 50 1 9250 时钟周期因此尽管分离Cache的实际失效率比混合Cache的高但其平均访存时间反而较低分离 Cache提供了两个端口消除了结构相关 5 11 给定以下的假设试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU 的性能由计算结果能得出什么结论 1 理想Cache情况下的CPI为2 0 时钟周期为2ns 平均每条指令访存1 2次 2 两者Cache容量均为64KB 块大小都是32字节 3 组相联Cache中的多路选择器使CPU的时钟周期增加了10 4 这两种Cache的失效开销都是80ns 5 命中时间为1个时钟周期 6 64KB直接映象Cache的失效率为1 4 64KB两路组相联Cache的失效率为1 0 解根据公式平均访问时间命中时间失效率失效开销可计算直接映像即1 路和两路组相联即2 路 Cache的平均访存时间具体如下平均访问时间1 路 1 2 0 1 4 80 3 12 ns 平均访问时间2 路 2 0 1 10 1 0 80 3 0 ns 可见两路组相联的平均访问时间比较低为评估CPU的性能需计算CPU时间其公式为 CPUtime CPU执行存储等待周期时钟周期 CPU time IC CPI执行总失效次数指令总数失效开销时钟周期 IC CPI执行时钟周期每条指令的访存次数失效率失效开销时钟周期根据上述CPU时间公式可得 CPU 1 路 IC 2 0 2 1 2 1 4 80 5 344 IC CPU 2 路 IC 2 2 2 1 2 1 0 80 5 360 IC 这两种结构的CPU相对性能比为 2 1 CPU CPU 路路 5 36 5 344 1 003 因此直接映象cache的访问速度比两路组相联cache要快1 04倍而两路组相联Cache的平均性能比直接映象cache要高1 003倍所以这里选择两路组相联 5 12 假设一台计算机具有以下特性 1 95 的访存在Cache中命中 2 块大小为两个字且失效时整个块被调入 3 CPU发出访存请求的速率为109字 s 4 25 的访存为写访问 5 存储器的最大流量为109字 s 包括读和写 6 主存每次只能读或写一个字 7 在任何时候 Cache中有30 的块被修改过 8 写失效时 Cache采用按写分配法现欲给该计算机增添一台外设为此首先想知道主存的频带已用了多少试对于以下两种情况计算主存频带的平均使用比例 1 写直达Cache 2 写回法Cache 解采用按写分配 1 若用写直达法每次CPU改变后的字都要写到Cache和主存中根据题意访存的情况如图1所示访存 25 写 75 读 5 访主存 95 访Cache95 访Cache5 访主存读2字写1字写1字 0字读2字根据上图的分析可知 A 写直达cache访问命中有两种情况读命中不访问主存写命中更新cache和主存访问主存一次 B 访问失效有两种情况读失效将主存中的块调入cache中访问主存两次写失效将要写的块调入cache 访问主存两次再将修改的数据写入cache和主存访问主存一次共三次上述分析如下表所示访问命中访问类型频率访存次数 Y 读 95 75 71 3 0 Y 写 95 25 23 8 1 N 读 5 75 3 8 2 N 写 5 25 1 3 3 一次访存请求最后真正的平均访存次数 71 3 0 23 8 1 3 8 2 1 3 3 0 35 已用带宽 0 35 109 109 35 0 2 若用写回法每次CPU改变后的字都要写到Cache中但只有在该块被替换出去的时候才需要将整块都写到主存中根据题意访存的情况如图2所示访存 25 写 75 读 5 访主存 95 访Cache 95 访Cache5 访主存 30 需写回 70 无需写回 30 需写回 70 无需写回 30 需写回 70 无需写回 30 需写回 70 无需写回读2字写2字读2字写0字读写 0字读写0 字读写0 字读写0 字读2字写2字读2字写0字根据上图的分析可知 A 写回法cache访问命中有两种情况读命中不访问主存写命中不访问主存采用写回法只有当修改的cache块被换出时才写入主存 B 访问失效有一个块将被换出这也有两种情况如果被替换的块没有修改过将主存中的块调入cache块中访问主存两次如果被替换的块修改过则首先将修改的块写入主存需要访问主存两次然后将主存中的块调入cache块中需要访问主存两次共四次访问主存因此可以生成下表访问命中块为脏频率访存次数 Y N 95 70 66 5 0 Y Y 95 30 28 5 0 N N 5 70 3 5 2 N Y 5 30 1 5 4 其中读写命中Cache 且块是非脏即没有被修改过的概率按下列方式计算得到参考图2 25 95 70 75 95 70 95 70 其它情况亦可根据图2来得到详见上表所以有一次访存请求最后真正的平均访存次数 66 5 0 28 5 0 3 5 2 1 5 4 0 13 已用带宽 0 13 10 9 109 13 5 13 在伪相联中假设在直接映象位置没有发现匹配而在另一个位置才找到数据伪命中时不对这两个位置的数据进行交换这时只需要1个额外的周期假设失效开销为 50个时钟周期 2KB直接映象Cache的失效率为9 8 2路组相联的失效率为7 6 128KB 直接映象Cache的失效率为1 0 2路组相联的失效率为0 7 1 推导出平均访存时间的公式 2 利用 1 中得到的公式对于2KBCache和128KBCache 计算伪相联的平均访存时间解不管作了何种改进失效开

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《计算机组织结构》课后作业参考答案-2013介绍.pdf

文档简介

温馨提示

最新文档

评论

《计算机组织结构》课后作业参考答案-2013介绍.pdf

文档简介

温馨提示

最新文档

评论

相关文档