计算机组织与体系结构课后习题答案_第1页
计算机组织与体系结构课后习题答案_第2页
计算机组织与体系结构课后习题答案_第3页
计算机组织与体系结构课后习题答案_第4页
计算机组织与体系结构课后习题答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、体系结构课后习题答案第二章1,设A,B,C的内存地址分别是 Ai,Bi,Ci,i 从1到1000LOAD M (Ai)ADD M (Bi)STOR M(Ci)2, a LOAD M (2)00000001|000000000010b 一次3,在IAS机上读取一个值的过程如下:IR中操作码控制总线,存储器地址 X MAR,MAR中值地址总线X中数据 数据总线,数总线地址MBR写入一个值:IR中操作码控制总线,存储器地址 X MAR,MAR值地址总线MBR值数据总线,数据总线值X4,程序代码:LOAD M(0FA)ADD M(0FB)LOAD M(0FA)JUMP +M(08D,0:19)LOAD

2、 4M(0FA)ADD M(0FB)程序代码意图:首先装入0FA值,然后与0FB相加,再装入0FA值,若AC中值非负,取0FA左指令再装入一(0FA)将0FB的值相加后装入 AC中5,如图所示8储器M控制 电路6,便于同时存取两个连续地址序号的存储单元,提高访问速度7,(1)存储器数据传输率快了 32倍(2)数据通道最大数目增大了一倍(3)单通道最大数据传输速率提升了5倍。各种技术的使用,提升了整机的性能。8,回答正确,但是不适合用户理解。MAC机的时钟速率是 1.2ghz, P4为2.4ghz,而时钟速率在一定程度上反映了计算机的执行速度,所以P4的机器可能是目前最符合用户要求的机型。9,在

3、这种表示方法中,10个管表示了十个数字,而使用二进制可以表示错误!未找到引用源。个数字10,(画图)略11, MIPS=错误!未找到引用源。*错误!未找到引用源。12MIPS=错误!未找到引用源。*错误!未找到引用源。 . CPI(VAX)=5,CPI(IBM)=1.39IC错误!未找到引用源。13,CPI=(1+2+2+2)/错误!未找到引用源。=7*错误!未找到引用源。MIPS=错误!未找到引用源。*错误!未找到引用源。=错误!未找到引用源。*错误!未找到引用源。=5.71*错误!未找到引用源。T=7*错误!未找到引用源。*错误!未找到引用源。=1.75*错误!未找到引用源。14a算术平均

4、法适用于较多程序,抖动较大调和平均发适用于较少程序,抖动较小b:计算机 A Ra=1/4 X (100+0.1+0.2+1)弋25 MIPSRb=4/(1/100+10+5+1)=0.25 MIPS计算机 B Ra=1/4X (10+0.1+1 + 1/8)=3.06Rb=4/(0.1 +1+ 10+8) =0.21计算机 C Ra=1/4X (5+5+2+1)=3.25Rb=4/(0.2+0.2+0.5+1)=2.1故 C>A>B第三章1步骤一存储器CPU而器100111pc25940ac3260011ir5 00036步骤二存储器CPU而器100112pc259400003ac

5、3260011ir5 00036步骤三存储器 CPU寄存器100112pc259400003ac3265940ir5 00036940 0003步骤四存储器 CPU寄存器100113pc259400006ac3265940ir5 00033+3=66940 0003步骤五存储器 CPU寄存器100113pc259400006ac32626ir5 00036940 0003步骤六存储器CPU而器100114pc259400006ac32626ir5 00036 00063.2 步骤一中详细解释:Pc中内容为300,将PC MAR ,然后将第一条指令装入数据总线,数据总线MBR ,MBR IR3.

6、3 (a)最大可直接寻址的容量是 错误!未找到引用源。b(b),1,取一次指令要两次访问存储器2,将降低存储器容量(c)程序计数器和指令寄存器各需要24位和8位。3.4(a)0M错误!未找到引用源。)(b) 0M错误!未找到引用源。)(c)I/O模块与CPU互连的特点(d)错误!未找到引用源。个,1个。因为总共只有16位cpu地址,故处理器只能支持(16 I/O端口位数)的位数3.5T=1/2*错误!未找到引用源。,外部数据总线 L1=16, L=32(1)f=1/t=2*错误!未找到引用源。,v=错误!未找到引用源。*f弋错误!未找到引用源。b/s(2)能提高性能,由公式 v=1/T* 错误

7、!未找到引用源。可知f与L变大都可以提高传输 速率3.6(1)电传输入INPRINPR CPU (经 I/O 模块)CPU OUTR (经 I/O 模块)OUTR电传输出(2)设置优先级,cpu处理为1, cpu通过I/O模块向外输出或者输入为 2,电传输入/输出 为3.设置中断允许位,当优先级较低的操作遇到高优先级操作的中断请求时,置IEN =1,允许中断,从而实高速 cpu处理与低速I/O处理的协调。3.7(1)错误!未找到引用源。(2)传指令时,为相同的传输速率传数据时,仍然为 错误!未找到引用源。倍差3.8 这段时间一定比时钟周期小。因为链式反应在一个时钟周期开始的时候应判断各主控方的

8、优先级,只有该时间周期小于时钟周期才能即调整优先级又实现各主控方各自的操作。3.9 减小工作量,提高效率。因为不用判断优先级为16的设备的TR线,任一高优先级设备可抢占该设备时间片,只有TR0TR15都无效时,TR16自然使用时间片。3.10 (1)因为中断就是为了提高高速设备的使用效率,平衡高低速设备。故优先级越低,其速率就越低,其余高优先级操作耗时都比其少,所以 TR16的平均等待时间就最低。(在该特定设备中)(2)若其余操作一直请求使用时间片,这种条件下不成立。3.11(a)时钟周期 T = 1 / f = 100 ns读总线周期 =2.5T = 250 ns(b) 250 -20 =

9、230 ns处理器至少应在230ns时将数据放到总线上3.13(a)总线时钟周期=1 / f * 10 9 ns =200 nsWrite 信号宽度 =50 * 200 = 1000(b)(c)3.14(a)原周期=4 + 4 * 3 =16时钟周期4 * 2 /16 = 50%(b)原周期=4 + 3 * 3 + 13 = 26时钟周期4 * 2 / 26 = 30.8%3.15(a) Intel8088的总线宽度为 8位时钟周期 T = 1 / f = 1 / 8M =125 ns4 * 8 / 4T = 64M 位/s(b) 2 * 8 / 4T = 32M 位/s3.16若使用偶对齐的

10、字,取操作数需要4个存储器周期(包括取指令)4 *4 / 4M = 4 ms8个存储器周期(包括取指令)1.6倍若使用偶对齐的字,取操作数需要8 *4 / 4M = 8 ms3.171 * 20% + 2 * 40% + 4 * 40% = 2.6处理速率相对16位微处理器提高了3.18处理器处理完一条指令后才会进入中断处理周期9 * T = 9 / f = 9 / 10M = 900 ns第四章4.1m=64, k=4组数 v=m / k=64 / 4=16=2 d, d=4块数 4k=2s, s=12标记=s-d=8位块大小=2w=128*8=2 10, w=10主存地址= 标记 组841

11、04.2 k = 2块大小=行大小=2w = 16, w = 4 寻址单元数=2s+w = 64M= 64*2 20s + w = 26 , s = 22cache的行数d = 8标记大小=s=k*v = k*2 d = 8K / 16d = 14标记主存地址=144.3(a)直接映射地址标记=8行=14字=211111111044416666666619992BBBBBBBB2EEE3(b)全关联映射地址标记=22字=211111104444416666661999992BBBBBB2EEEEE3(c)两路组关联映射地址标记=9组=13字=2111111022044416666660CC19

12、992BBBBBB1770EEE34.4(a)地址长度=s+w=24 寻址单元数=2s+w=224 块大小=2w=4 主存的块数=2s=222Cache 行数=m=2r=214 标记大小=s-r=8 (b)地址长度=s+w=24寻址单元数=2s+w=224块大小=2w=4主存的块数=2s=222标记大小=s=22(c)地址长度=s+w=24 寻址单元数=2s+w=224 块大小=2w=4主存的块数=2s=222每组的行数=k=2组数 v=2d=213Cache 行数=k*v=2*2 13=214标记大小=s-d=94.5每组的行数=k=4块大小=行大小=2w=4*4=2 4, w=4行数=16

13、k / 24 = 210=k*v组数 v=210 / 22 = 28 = 2d, d=8标记s - d = 20主存地址=标记组2084对于地址 ABCDE8F8 ,转化为二进制为:1010 1011 1100 1101 1110 1000 1111 1000块号 j=1010 1011 1100 1101 1110 1000 1111 1000 / 2w组号 i=j mod v= (1010 1011 1100 1101 1110 1000 1111 1000 / 24) mod 28=27+23 + 22 + 2 + 1=143故地址ABCDE8F8映射到cache的第143组中四行中的任

14、意一行4.8(a)块大小=2w= 8, w=3行数 m=2r=32, r=5s + w = 16 , s = 13主存地址=标记行字853(b)0001 0001 0001 1011块号 j = 0001 0001 0001 1011 / 8 = 2 9 + 25+ 21 + 20行号 i = j mod m =(29 + 25+ 21 + 20) mod 25 = 3以此类推,1100 0011 0011 0100 的行号为 6;1101 0000 0001 1101 的行号为 3; 1010 1010 1010 1010的行号为21。另解:0001 0001 0001 1011 (0001

15、1=3)1100 0011 0011 0100 (00110=6)1101 0000 0001 1101 (00011=3)1010 1010 1010 1010 (10101=21)(c)0001 1010 0001 10000001 1010 0001 10010001 1010 0001 10110001 1010 0001 11000001 1010 0001 11010001 1010 0001 11100001 1010 0001 1111(d) 32*8=256(e)标记用来将能装入同一行的不同块区分开来。4.11(a) 1 j大小=2 = 64, w = 6地址长度=s + w

16、 =32 , s=26标记大小=s - r = 20, r :=6主存地址=标记行字2066寻址单元数=2s+w=232主存的块数=2s=226Cache 行数=m=2r=26(b)行大小=2w = 64, w = 6地址长度=s + w =32 , s = 26主存地址=标记266寻址单元数=2s+w=232主存的块数=2s=226Cache行数不确定标记大小=s=26(c)每组的行数=k=4行大小=2w = 64, w = 6地址长度=s + w =32 , s = 26标记大小=s - d = 9, d = 17主存地址= 标记组9176寻址单元数=2s+w=232主存的块数=2s=22

17、6Cache 组数=v=2 d=217Cache 的行数=k*2 d =4*2 17 = 219标记大小=s - d =94.12(a)块大小=行大小=2w = 16, w = 4寻址单元数=2s+w= 1M = 2 20, s + w = 20, s =16Cache 行数=m=2r=64K / 16 = 2 12, r = 12标记大小=s r = 4主存地址=标记行地址标记=4行二12字二4F0010F00100123401234CABBECABBE41244124(b) F0010 E0011(c)块大小=行大小=2w = 16, w = 4寻址单元数=2s+w= 1M = 2 20,

18、 s + w = 20, s =16主存地址=标记164地址标记=16字=4F0010F0010CABBECABBE(d)块大小=行大小=2w = 16, w = 4寻址单元数=2s+w= 1M = 2 2°, s + w = 20, s =16每组的行数=k = 2Cache行数=k*2d = 64K / 16 = 2 12, d = 11标记大小=s d = 5主存地址= 标记组5114地址标记=5组=11字=4F00101E001001234001234CABBE192BBE4.13每行用两位来做标记。最开始装入四行中的每一行分别标记为0、1、2、3。当0行被引用时,标记不变;

19、当1行被引用时,1行标记改为0, 0行标记加1; 2行被引用时,2行标记 改为0, 0、1行标记分别加1; 3行被引用时,3行标记改为0, 0、1、2行标记分别加1; 当把一块读入到这组中时,标记就为 0,原0、1、2行标记分别加1, 3行被替换出去。4.14对于回写式 Cache,换出一行用 30 + 7 * 5=65ns时间。对于写直达式 Cache,行的每次 更新都要用30ns将字写到主存。故,若行换出之前写入平均超过3次的话,回写式更有效。4.15(a)对于外层循环,程序停留在对数组a的元素的不断存取。(b)对于内层循环,在一小段时间内,程序停留在在数组a中某一元素的不断存取。4.18

20、(a)未命中次数=24命中率=1 - 24 / 8 + (18 + 16) *10 = 93.1%(b)未命中次数=6命中率=1 6 / 8 + (18 + 16) *10 = 98.3%4.19(a) 106 *8 *0.001 = 8000 美分 =80 美元(b) 106 *8 *0.01 = 80000 美分 =800 美元(c) 100 * H + 1200 * (1 - H) = 100 * 1.1H = 99.1%4.21(a) 50 + 15 * 5 +2.5 = 127.5 ns(b)原平均存取时间 =2.5 * 0.95 + 127.5 *0.05 = 8.75 ns 行增

21、加到128字节后:Cache 丢失时存取时间=50 + 31 *5 + 2.5 = 207.5 ns平均存取时间=2.5 * 0.97 + 207.5 *0.03 = 8.65 ns因此降低了平均存取时间。4.22字在Cache的概率 =0.9,存取时间 =20 ns字在主存的概率=0.1 *0.6 = 0.06 ,存取时间 =60 + 20 = 80 ns字在磁盘的概率=0.1 * 0.4 = 0.04 ,存取时间 =12 + 60 +20 = 92 ns平均存取时间=20 * 0.9 + 80 * 0.06 + 92 * 0.04 = 26.48 ns4.24(a)时钟周期 T = 1 /

22、 f = 1 / 16.67M =60 ns存储器周期 =2T*0.9 + 3T * 0.1 = 126 ns(b) 2T*0.9 + 5T * 0.1 = 138 ns4.25(a) 1M * 2 * 300 / 10 9 = 60%(b)假设Cache的存取时间为x ns总线利用率 =(0.5 *2 *x + 0.5 * 2 *300) *1M /109 =(x + 300) /1000知x<300 ,故总线利用率< 60%若x<<300 ,则总线利用率30%4.26(a) Ta = W * (T c + Tb) + (1 - W) * T c + ( 1 - H ) * T m (b) Ta =Wb * ( Tc + Tm )4.27Ta = H1 * Tc1 + (H2 H1) * T c2 + (1 -H2) * (T m + Tc1)4.28(a) 1 + 4 =5时钟周期(b)(c) 1 +

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论