版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 计算机组织结构课后作业习题参考答案计算机组织结构课后作业习题参考答案 第一章第一章 1.6 某台主频为 400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时 钟周期数如下: 指令类型指令执行数量平均时钟周期数 整数450001 数据传送750002 浮点80004 分支15002 求该计算机的有效 CPI、MIPS 和程序执行时间。 解: (1)CPI (4500017500028000415002)/1295001.776 (2)MIPS 速率f/CPI 400/1.776 225.225MIPS (3)程序执行时间=(4500017500028000415002)40
2、0=575s 1.7 将计算机系统中某一功能的处理速度加快 10 倍,但该功能的处理时间仅为整个系统运 行时间的 40%,则采用此增强功能方法后,能使整个系统的性能提高多少? 解解 由题可知: 可改进比例 = 40% = 0.4 部件加速比 = 10 根据 Amdahl 定律可知: 5625. 1 10 4 . 0 4 . 01 1 系统加速比 采用此增强功能方法后,能使整个系统的性能提高到原来的 1.5625 倍。 1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10 (1) 如果部件 1 和部件 2 的可改进比例
3、均为 30%, 那么当部件 3 的可改进比例为多少 时,系统加速比才可以达到 10? (2) 如果三个部件的可改进比例分别为 30%、30%和 20%,三个部件同时改进,那么 系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解: (1)在多个部件可改进情况下,Amdahl 定理的扩展: i i i n S F F S )1 ( 1 已知 S130,S220,S310,Sn10,F10.3,F20.3,得: )()(10/20/0.330/0.30.30.3-1 1 10 33 FF 得 F30.36,即部件 3 的可改进比例为 36%。 (2) 设系统改进前的执行时间为 T, 则
4、3 个部件改进前的执行时间为:(0.3+0.3+0.2) T=0.8T, 不可改进部分的执行时间为 0.2T。 已知 3 个部件改进后的加速比分别为 S130,S220,S310,因此 3 个部件改进后的 执行时间为: T TTT Tn045. 0 10 2 . 0 20 3 . 0 30 3 . 0 改进后整个系统的执行时间为:Tn=0.045T+0.2T=0.245T 那么系统中不可改进部分的执行时间在总执行时间中占的比例是: 82. 0 245. 0 2 . 0 T T 第三章第三章 3.9 列举出下面循环中的所有相关,包括输出相关、反相关、真相关。 for(i=2;i100;i=i+1
5、) ai=bi+ai;/*s1*/ ci+1=ai+di;/*s2*/ ai1=2*bi;/*s3*/ bi+1=2*bi;/*s4*/ 解:展开循环两次: ai=bi+ai;/*s1*/ ci+1=ai+di;/*s2*/ ai1=2*bi;/*s3*/ bi+1=2*bi;/*s4*/ ai+1=bi+1+ai+1;/*s1*/ ci+2=ai+1+di+1;/*s2*/ ai=2*bi+1;/*s3*/ bi+2=2*bi+1;/*s4*/ 第一次循环引入的相关: 输出相关:无 反相关:无 真相关:S1&S2 由于第二次循环引入的相关:S4&S4 (真相关) 、S1&S4(真相关) 、S
6、3&S4(真相关) 、 S1&S3 (输出相关、反相关) 、S2&S3 (反相关) 。 3.12 有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的 两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解: (1) 2200(ns) 2009200)10050(50 t) 1n(tTmax m 1i ipipeline )(ns 220 1 T n TP 1 pipeline 45.45% 1
7、1 5 4 400 TP m t TPE m 1i i (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850 t1)(ntTmax m 1i ipipeline )(ns 85 1 T n TP 1 pipeline 58.82% 17 10 8 400 TP m ti TPE m 1i 重复设置部件 )(ns 85 1 T n TP 1 pipeline 58.82% 17 10 8850 10400 E 1 2 31 32 41 42 43 44 123_13_24_14_4 入出 50ns50ns50ns 50ns 50ns50ns 1 2 3_1 3_2 4_1
8、 4_2 4_3 4_4 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 9 9 10 10 8 9 10 8 9 10 850ns850ns 时间 段 3.14有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第 3段的时间为2t,其余各段的时间均为t,而且流水线的输出可以直接返回输入端或暂 存于相应的流水寄存器中。现要在该流水线上计算 ,画出其时空图,并计算 其吞吐率、加速比和效率。 解:首先,应选择适合于流水线工作的算法。对于本题,应先计算A1B1、A2B2、A3B3 和A4B4;再计算(
9、A1B1)(A2B2)和(A3B3)(A4B4);然后求总的结果。 其次,画出完成该计算的时空图,如图所示,图中阴影部分表示该段在工作。 由图可见,它在18个t时间中,给出了7个结果。所以吞吐率为: t TP 81 7 如果不用流水线,由于一次求积需3t,一次求和需5t,则产生上述7个结果共需 (45+33)t=29t。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.15动态多功能流水线由6个功能段组成,如下图: 1 2345 乘法 加法 t t 2ttt )( 4 1 i i i BA S1 S2 S3 S4 S5 乘法 加法 S6 时间 段 1 2 3
10、 4 5 0 1 2 3 4 5 6 7891011 12131415 16 输 入 A1 B1 A2 B2 A3 B3 A4 B4 A BCD A B C D AB ABCDABCD A=A1B1 B=A2B2 C=A3B3 D=A4B4 CD 17 18 61. 1 81 92 t t S 223 . 0 185 3354 E 其中,S1、S4、S5、S6组成乘法流水线,S1、S2、S3、S6组成加法流水线,各个功能段时 间均为50ns,假设该流水线的输出结果可以直接返回输入端,而且设置有足够的缓冲寄存 器,若以最快的方式用该流水计算: 5 1i iii zyx (1) 画出时空图; (2
11、) 计算实际的吞吐率、加速比和效率。 解:机器一共要做10次乘法,4次加法。 3.17假设各种分支指令数占所有指令数的百分比如下: 条件分支20%(其中的60%是分支成功的) 跳转和调用5% 现有一条段数为4的流水线, 无条件分支在第二个时钟周期结束时就被解析出来, 而条 件分支要到第三个时钟周期结束时才能够被解析出来。 第一个流水段是完全独立于指令类型 的, 即所有类型的指令都必须经过第一个流水段的处理。 请问在没有任何控制相关的情况下, 该流水线相对于存在上述控制相关情况下的加速比是多少? 解:没有控制相关时流水线的平均CPI1 存在控制相关时: 由于无条件分支在第二个时钟周期结束时就被解
12、析出来, 而条件分支 要到第3个时钟周期结束时才能被解析出来。所以: (1)若使用排空流水线的策略,则对于条件分支,有两个额外的stall,对无条件分支,有 一个额外的stall: CPI=1+20%*2+5%*1=1.45 加速比S=CPI/1=1.45 (2)若使用预测分支成功策略,则对于不成功的条件分支,有两个额外的stall,对无条件 分支和成功的条件分支,有一个额外的stall1: CPI=1+20%*(60%*1+40%*2)+5%*1=1.33 加速比S=CPI/1=1.33 (3)若使用预测分支失败策略,则对于成功的条件分支,有两个额外的stall;对无条件分 支,有一个额外的
13、stall;对不成功的条件分支,其目标地址已经由PC值给出,不必等待, 所以无延迟: CPI=1+20%*(60%*2+40%*0)+5%*1=1.29 加速比 S=CPI/1=1.29 第五章第五章 5.10假设对指令Cache的访问占全部访问的75%; 而对数据Cache的访问占全部访问的25%。 Cache的命中时间为1个时钟周期,失效开销为50个时钟周期,在混合Cache中一次load 或store操作访问Cache的命中时间都要增加一个时钟周期,32KB的指令Cache的失效率为 0.39%,32KB的数据Cache的失效率为4.82%,64KB的混合Cache的失效率为1.35%。
14、又假 设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。试问指令Cache 和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比,哪种Cache 的失效率更低?两种情况下平均访存时间各是多少? 解: (1)根据题意,约75%的访存为取指令。因此,分离Cache的总体失效率为: (75%0.39%)(25%4.82%)1.50% 根据题意,容量为128KB的混合Cache的失效率为1.35%。也就是说,混合Cache的失效率 比分离Cache的低一些。 (2)平均访存时间公式可以分为指令访问和数据访问两部分: 平均访存时间指令所占的百分比 (读命中时
15、间读失效率失效开销) 数据所 占的百分比(数据命中时间数据失效率失效开销) 根据这个公式,可求得两种结构的平均访存时间,分别为: 分离Cache的平均访存时间: 75%(10.39%50)25%(14.82%50)=1.7488(时钟周期) 混合Cache的平均访存时间: 75%(11.35%50)25%(111.35%50)=1.9250(时钟周期) 因此,尽管分离Cache的实际失效率比混合Cache的高,但其平均访存时间反而较低。分离 Cache提供了两个端口,消除了结构相关。 5.11给定以下的假设, 试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU 的性能。由计
16、算结果能得出什么结论? (1) 理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次; (2) 两者Cache容量均为64KB,块大小都是32字节; (3) 组相联Cache中的多路选择器使CPU的时钟周期增加了10; (4) 这两种Cache的失效开销都是80ns; (5) 命中时间为1个时钟周期; (6) 64KB直接映象Cache的失效率为1.4,64KB两路组相联Cache的失效率为1.0。 解:根据公式 平均访问时间命中时间失效率失效开销 可计算直接映像(即1路)和两路组相联(即2路)Cache的平均访存时间。具体如下: 平均访问时间1路=12.0+1.4
17、%80=3.12(ns) 平均访问时间2路=2.0(1+10%)+1.0%80=3.0(ns) 可见,两路组相联的平均访问时间比较低。 为评估CPU的性能,需计算CPU时间,其公式为: CPUtime=(CPU执行+存储等待周期)时钟周期 CPUtime=IC(CPI执行+总失效次数/指令总数*失效开销)时钟周期 =IC( (CPI执行时钟周期)+(每条指令的访存次数失效率失效开销时钟周期) ) 根据上述CPU时间公式,可得: CPU1路=IC(2.02+1.21.4%80)5.344IC CPU2路=IC(2.22+1.21.0%80)5.360IC 这两种结构的CPU相对性能比为: 2-
18、1- CPU CPU 路 路 5.36/5.344=1.003 因此,直接映象cache的访问速度比两路组相联cache要快1.04倍,而两路组相联Cache的 平均性能比直接映象cache要高1.003倍。所以,这里选择两路组相联。 5.12假设一台计算机具有以下特性: (1) 95的访存在Cache中命中; (2) 块大小为两个字,且失效时整个块被调入; (3) CPU发出访存请求的速率为109字/s; (4) 25的访存为写访问; (5) 存储器的最大流量为109字/s(包括读和写) ; (6) 主存每次只能读或写一个字; (7) 在任何时候,Cache中有30的块被修改过; (8) 写
19、失效时,Cache采用按写分配法。 现欲给该计算机增添一台外设, 为此首先想知道主存的频带已用了多少。 试对于以下两 种情况计算主存频带的平均使用比例。 (1) 写直达Cache; (2) 写回法Cache。 解:采用按写分配 (1)若用写直达法,每次CPU改变后的字,都要写到Cache和主存中。根据题意,访存的 情况如图1所示: 访存 25%写75%读 5%访主存95%访Cache95%访Cache5%访主存 读2字,写1字写1字0字读2字 根据上图的分析可知: A.写直达cache访问命中,有两种情况: 读命中,不访问主存; 写命中,更新cache和主存,访问主存一次。 B.访问失效,有两
20、种情况: 读失效,将主存中的块调入cache中,访问主存两次; 写失效,将要写的块调入cache,访问主存两次,再将修改的数据写入cache和主存, 访问主存一次,共三次。上述分析如下表所示。 访问命中访问类型频率访存次数 Y读95%*75%=71.3%0 Y写95%*25%=23.8%1 N读5%*75%=3.8%2 N写5%*25%=1.3%3 一次访存请求最后真正的平均访存次数=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)0.35 已用带宽=0.35109/109=35.0% (2)若用写回法,每次CPU改变后的字,都要写到Cache中,但只有在该块被替换出
21、去的 时候,才需要将整块都写到主存中。根据题意,访存的情况如图2所示: 访存 25%写75%读 5%访主存95%访Cache95%访Cache5%访主存 30%需 写回 70%无 需写回 30%需 写回 70%无 需写回 30%需 写回 70%无 需写回 30%需 写回 70%无 需写回 读2字 写2字 读2字 写0字 读/写 0字 读/写0 字 读/写0 字 读/写0 字 读2字 写2字 读2字 写0字 根据上图的分析可知: A.写回法cache访问命中,有两种情况: 读命中,不访问主存; 写命中,不访问主存。采用写回法,只有当修改的cache块被换出时,才写入主存; B.访问失效,有一个块
22、将被换出,这也有两种情况: 如果被替换的块没有修改过,将主存中的块调入cache块中,访问主存两次; 如果被替换的块修改过,则首先将修改的块写入主存,需要访问主存两次;然后将 主存中的块调入cache块中,需要访问主存两次,共四次访问主存。 因此,可以生成下表: 访问命中块为脏频率访存次数 YN95%*70%=66.5%0 YY95%*30%=28.5%0 NN5%*70%=3.5%2 NY5%*30%=1.5%4 其中,读/写命中Cache,且块是非脏(即没有被修改过)的概率按下列方式计算得到(参 考图2) : 25%95%70%+75%95%70% =95%70% 其它情况亦可根据图2来得
23、到,详见上表。 所以有: 一次访存请求最后真正的平均访存次数=66.5*028.5%*0+3.5%*2+1.5%*4=0.13 已用带宽=0.13109/109=13% 5.13在伪相联中,假设在直接映象位置没有发现匹配,而在另一个位置才找到数据(伪命 中)时,不对这两个位置的数据进行交换。这时只需要1个额外的周期。假设失效开销为 50个时钟周期,2KB直接映象Cache的失效率为9.8%,2路组相联的失效率为7.6%;128KB 直接映象Cache的失效率为1.0%,2路组相联的失效率为0.7%。 (1) 推导出平均访存时间的公式。 (2) 利用 (1) 中得到的公式, 对于2KBCache和128KBCache, 计算伪相联的平均访存时间。 解:不管作了何种改进,失效开销
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东广州生物院联合生科院张笑人教授课题组科研助理招聘参考考试试题及答案解析
- 广安市前锋区就业保障中心2025年12月公开招聘公益性岗位备考笔试题库及答案解析
- 2026辽宁本溪市教育系统冬季名校优生引进急需紧缺人才4人(本溪市第一中学)参考笔试题库附答案解析
- 2025云南丽江市华坪县择优招聘云南省职业教育省级公费师范毕业生4人备考考试试题及答案解析
- 2025贵州黔南州面向社会招聘国有企业工作人员考察(第三批)参考考试题库及答案解析
- 2026甘肃甘南州夏河县兵役登记暨征兵参考笔试题库附答案解析
- 2026年玉溪澄江市教育体育系统招聘毕业生(20人)参考考试试题及答案解析
- 四川省大英中学2025年临聘教师招聘备考笔试试题及答案解析
- 2026年莆田市荔城区公开考核新任教师招聘53人备考笔试题库及答案解析
- 网址注册合同范本
- 浙江省台州市海山教育联盟2024-2025学年七年级上学期期末语文试题(含答案)
- 2021《超星尔雅》舞蹈鉴赏章节测试答案
- 绘本故事《逃家小兔》讲故事课件
- 事业单位考试职业能力倾向测验(综合管理类A类)试题与参考答案(2024年)
- (质量认证)中药饮片GMP检查指南
- 《大学计算机基础》试题库(附答案)
- 利港标段二-技术投标文件-承包人实施计划
- 部编版五年级上册《25 古人谈读书》课件
- DL-T-1928-2018火力发电厂氢气系统安全运行技术导则
- 第五单元:幼儿行为规范与道德教育活动
- 塑料成型工艺与模具设计课程说课内容课件市公开课一等奖省赛课微课金奖课件
评论
0/150
提交评论