计算机组成原理课后习题讲解.ppt_第1页
计算机组成原理课后习题讲解.ppt_第2页
计算机组成原理课后习题讲解.ppt_第3页
计算机组成原理课后习题讲解.ppt_第4页
计算机组成原理课后习题讲解.ppt_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,课后习题解答,2011-2012-2,计算机组成与结构,第一章 计算机系统概论,Chp1 计算机系统概论,【1.2】计算机硬件由哪几部分组成?各部分的作用是什么?各部分之间怎样联系的?,解答:,计算机硬件包括运算器、控制器、存储器、输入输出设备五个部分。运算器对数据进行算术和逻辑运算;控制器发布控制信号,指挥各部件协同工作,实现计算机本身运行过程的自动化;存储器保存程序和数据;输入输出设备完成系统和外界设备的信息交换。各部分通过总线联系。,P22,Chp1 计算机系统概论,【1.9】冯诺依曼结构的特点是什么?,解答:,冯诺依曼结构特点如下: 1、计算机由运算器、控制器、存储器、输入设备和输出

2、设备五部分组成。 2、采用存储程序的方式,程序和数据放在同一存储器中。 3、数据以二进制码表示。 4、指令由操作码和地址码组成。 5、指令在存储器中按执行顺序存放。 6、机器以运算器为中心,数据传送都经过运算器。,P23,第三章 运算方法和运算部件,Chp3 运算方法和运算部件,【3.8】十进制数X=(+128.75)2-10,P112,(1) 若(Y)2 = (X)10,用定点数表示Y的值。 (2) 设用21个二进制位表示浮点数,阶码用5位,其中阶符1位;尾数用16位,其中符号用1位,阶码的基数为2,写出阶码和尾数均用原码表示的Y的机器数。 (3) 写出阶码和尾数均用反码表示Y的机器数。 (

3、4) 写出阶码和尾数均用补码表示Y的机器数。,Chp3 运算方法和运算部件,解答:,(1) X= (+128.75)2-10转二进制: 整数部分:128 = 27即(10000000)2; 小数部分:0.75乘2取整得(0.11)2; 最终,Y= (10000000.11)22-10 = (0.0010000000.11)2,(2),原码表示:0 10010 100000001100000,(3) 反码表示:0 11101 100000001100000,(4) 补码表示:0 11110 100000001100000,Chp3 运算方法和运算部件,【3.18】用原码一位乘计算X= 0.110

4、1,Y= - 0.1011 的积X*Y。,P113,解答:X原= 0.1101;Y原= 0.1011,XY = 1.10001111,Chp3 运算方法和运算部件,【3.24】用原码两位乘法求X*Y。已知X= 0.1011,Y= 0.1101 。,P113,解答:X原= 0.1011;Y原= 0.1101; -X补= 1.0101,XY = 0.10001111,Chp3 运算方法和运算部件,【3.30】设有16个信息位,如果采用海明校验,至少需要设置多少个校验位?应放在哪些位置上?若校验结果为 S6S5S4S3S2S1 = 110010,分析出错情况,并说明如何纠错?,P114,解答:,2r

5、-1 k + r r = 6,数据 16位:D16 D1;,校验 6位:P6 P1;,海明码 22位:H22 H1.,Chp3 运算方法和运算部件,校验位位置: Pi 2 i-1,海明码排序:,Chp3 运算方法和运算部件,校验位对应:,Chp3 运算方法和运算部件,分组偶校验:,Chp3 运算方法和运算部件,S6 S5 S4 S3 S2 S1 = 1 1 0 0 1 0,P5 D12 D13 D14 D15 D16,P2 D1 D3 D4 D6 D7 D10 D11 D13 D14,出错数据位: D13,Chp3 运算方法和运算部件,校验纠错电路:,Chp3 运算方法和运算部件,【3.35】

6、(补充题)对4位有效信息(1100)求循环校验码,选择生成多项式G(x)=x3+x2+1。若接收到的有效数据为1101,说明CRC是如何查错和纠错的?,P114,解答:,M(x)=1100 M(x)x3=1100000,G(x) =1101 M(x)x3/G(x) =1001+101/1101, 循环校验码:M(x)x3 + R(x) =1100101,Chp3 运算方法和运算部件,出错模式(G(x)=1101):,Chp3 运算方法和运算部件,查错与纠错:,(1) 假设只有一位出错,则错误的CRC码为1101101,系统做如下处理:,1101101/1101=101,查到为A4位出错;,CR

7、C码循环左移,同时余数做如下变化:101111011110,共移3次;,A1位与1异或;,CRC码继续循环左移,同时余数做如下变化:110001010100101,共移4次,得到正确码。,Chp3 运算方法和运算部件,(2) 不限出错位数,则4位的G(X)只能实现差错,但无法纠错。,若余数为000,则CRC码正确。,若余数不为000,则CRC码错误。,3位余数只剩7个不同组合,而出错情况多达98种。无法区分出错的情况,也即无法纠错。,第四章 主存储器,Chp4 主存储器,【4.5】有一个512K16的存储器,由64K1的RAM芯片组成(芯片内是4个128128结构),问:,P136,(1) 总

8、共需要多少个RAM芯片? (2) 采用分散刷新方式,如单元刷新间隔不超过2ms,则刷新信号的周期是多少? (3) 如果采用集中式刷新方式,设读/写周期T=0.1us,储存器刷新一遍最少用多少时间?,Chp4 主存储器,解:(1) 总共需要512K16/ 64K1 = 128片。,(2) 刷新中的几个时间概念:刷新周期、集中式刷新的刷新时间、刷新信号周期、读写周期。,分散(非集中)刷新包括分散式刷新和分布式刷新两种情况。,Chp4 主存储器,分散式刷新:,刷新信号周期 = 等于读写周期;,刷新周期 = 阵列行数 读写周期=128读写周期;,Chp4 主存储器,分布式刷新:,刷新信号周期=刷新周期

9、/阵列行数=2ms/12815.6us,阵列128行即128段,每段末尾占用一个读写周期对该行进行刷新。,综合分散与分布得到信号周期15.6us,Chp4 主存储器,集中式刷新:,刷新信号周期=读写周期;,刷新时间=阵列行数读写周期= 1280.1us=12.8us;,刷新周期=读写时间+刷新时间。,Chp4 主存储器,【4.6】机器有一个地址空间为0000H1FFFH的ROM区域,现在再用RAM芯片(8K4)形成一个16K8的RAM区域,起始地址为2000H,假设RAM芯片有CS和WE信号控制端,CPU地址总线为A15A0,数据总线为D7D0,控制信号为R/W,MREQ。要求画出逻辑图。,P

10、136,Chp4 主存储器,解:数据总线D7D0 储存区域数据宽度为8; ROM:0000H1FFFH 单元数:213 = 8K 容量:8K8; RAM:容量:16K8 需要4片8K4芯片进行综合扩展; 地址分配:片内A12A0,片选A15A13 ROM:地址范围: 0000H1FFFH RAM(12#) :地址范围: 2000H3FFFH RAM(34#) :地址范围: 4000H5FFFH,Chp4 主存储器,片选方式: 方式一: A15A13接3:8译码器输入。 方式二: A14、A13接2:4译码器输入,A15接地。 方式三: A15A13分别接每组芯片的CS端,此种方式会造成地址不连

11、续。,作图:参见 P440 (方式一)。,Chp4 主存储器,Chp4 主存储器,【4.12】设某主存储器访问一次存储器的时间如下:传送地址1个时钟周期,读/写4个时钟周期,数据传送1个时钟周期,采用下述3种主存结构读取16个字的数据块,各需多少时钟周期?,P137,(1)单自宽主存,一次只能读/写1个字。,(2)4字宽主存,一次可读写4个字,但CPU与主存的数据传送宽度为1个字。,(3)4体交叉存储器,每个存储器为单自宽。,【4.7】SRAM和DRAM的主要差别是什么?(略),Chp4 主存储器,解:,即本题中,一个存储周期为1+4+1=6T。即连续两次读写间隔至少保持6个T。,存储周期:连

12、续启动两次独立的存储器操作所需间隔的最小时间。,存储器在读/写操作时,不允许改变数据地址。,Chp4 主存储器,(1)操作方式为:,T,T,T,T,T,T,传送地址 读写操作 传送数据,1,2,T,T,T,T,T,T,5T,正确操作方式为:,T,T,T,T,T,T,1,2,T,T,T,T,T,T,6T,需要周期:166T=96T,Chp4 主存储器,(2)操作方式为:,T,T,T,T,T,T,传送地址 读写操作 传送数据,14,5T,T,T,T,58,T,T,T,T,T,T,T,T,T,正确操作方式为:,需要周期:36T + 9T = 27 T,Chp4 主存储器,(3)单自宽4体交叉存储:,

13、需要周期 = T+(m-1) = (m+3)t/4 = ( 16+3) 6T/4 = 28.5T,原因:= t/4 =1.5T 不是一个整周期。而题中将一个存储周期分为了6个整周期T。,Chp4 主存储器,正确方法:,多体交叉存储器特征:,每个模块都有独立的读写控制电路、地址寄存器和数据寄存器,各自以等同方式与CPU传送信息。,1、CPU将地址送达1个模块,即被该模块的AR读取,此后可以继续送出第二个地址到下一个模块。,注意:,2、每个模块单独的存储周期仍是6T,即每个模块中两个字的存储间隔至少保持6T。,Chp4 主存储器,T,T,T,T,T,T,1,T,T,T,T,T,T,2,T,T,T,

14、T,T,T,3,T,T,T,T,T,T,4,T,T,T,T,T,T,5,T,T,T,T,T,T,6,T,T,T,T,T,T,7,T,T,T,T,T,T,8,T,T,T,T,T,T,9,T,T,T,T,T,T,10,T,T,T,T,T,T,11,T,T,T,T,T,T,12,T,T,T,T,T,T,13,T,T,T,T,T,T,14,T,T,T,T,T,T,15,T,T,T,T,T,T,16,M0,M1,M3,M4,M0,M1,M3,M4,M0,M1,M3,M4,M0,M1,M3,M4,需要周期: 36T + 9T = 27 T,Chp4 主存储器,【4.14】补充作业:,CPU有16根地址线、

15、16根数据线,MREQ为访存信号,W/R为读写控制信号。现有ROM芯片两种(2K8、8K4)、RAM芯片三种(1K4、2K8、8K8) 。请选择合适的芯片设计主存,要求000H7FFH为系统区,800H 17FFH 为用户区,画出逻辑图。,Chp4 主存储器,解:,CPU16根数据线字长16位; 系统区:000H7FFH 空间大小21116 = 2K16。 选用2K8芯片,需2片。 用户区: 800H 17FFH 区间容量:17FFH-800H = FFFH。空间大小21216 = 4K16。 选用2K8芯片,需4片。,Chp4 主存储器,第五章 指令系统,Chp5 指令系统,【5.1】某指令

16、系统指令长16位,每个操作数的地址码长6位,指令分为无操作数、单操作数和双操作数三类。若双操作数指令有K条,无操作数指令有L条,问单操作数指令最多可能有多少条?,P169,解:要使单操作数指令最多,则除K条和L条已有指令外,剩余指令全用作单操作数指令。,Chp5 指令系统,指令字长16bit,地址码长6bit,则操作码长4bit。,若全用作双操作数指令,则最多容纳24条。,已知双操作数指令有K条,则操作码剩余24 K个信息可用。,24 K个操作码信息加一个地址码最多可寻址 ( 24 K)26条单操作数指令。,设单操作数指令有X条,则剩余( 24 K)26-X个信息可用。,( 24 K)26-X

17、个信息再加一个地址码则最多可寻址( 24 K)26-X)26条无操作数指令。,Chp5 指令系统,即有方程:,( 24 K)26-X)26 = L,求解得:,X = ( 24 K)26- L/ 26,Chp5 指令系统,【5.2】基址寄存器的内容为2000H,变址寄存器内容为3A0H,指令的地址码部分是3FH,当前PC的值为2B00H,写出变址编址(考虑基址)和相对编址两种情况的访存有效地址。,P169,解:变址编址:3A0H+3FH=3DFH,变址编址(考虑基址):2000H+3DFH=23DFH,相对编址:2B00H+3FH=2B3FH,Chp5 指令系统,【5.3】接上题(1)设变址编址

18、用于取数指令,相对编址用于转移指令,存储器内容如下:,P169,地址内容 003FH2300H 2000H2400H 203FH2500H 233FH2600H 23A0H2700H 23DFH2800H 2B00H063FH,写出从存储器中所取的数据以及转移地址。,(2)若采取直接编址,写出从存储器取出的数据。,Chp5 指令系统,解:(1)接上题,变址编址(考虑基址)23DFH; 相对编址:2B3FH。,地址内容 003FH2300H 2000H2400H 203FH2500H 233FH2600H 23A0H2700H 23DFH2800H 2B00H063FH,取数:2800H; 转移

19、:2B3FH。,(2)直接编址取数: (3FH)=2300H; 考虑基址则为: (203FH)=2500H。,Chp5 指令系统,【5.9】在下面有关寻址方式的叙述中,选择正确答案填入。,P170,根据操作数所在位置,指出其寻址方式:操作数在寄存器中,为 _ 寻址方式;操作数地址在寄存器中,为_寻址方式;操作数在指令中,为_寻址方式;操作数地址(主存)在指令中,为_寻址方式;操作数的地址,为某一寄存器中的内容与位移量之和则可以是_、_、_ 寻址方式。,寄存器,寄存器间接,立即数,直接,基址,变址,相对,Chp5 指令系统,【5.11】讨论RISC和CISC在指令系统方面的主要区别。 (略),P

20、170,【5.14】(补充作业)某16位机所使用指令格式和寻址方式如下所示:该机有两个20位基值寄存器,四个16位变址寄存器,十六个16位通用寄存器。 有三种指令的操作码分别是: MOV (OP)(A)H, MOV是传送指令; STA (OP)(1B)H, STA为写数指令; LDA (OP)(3C)H,LDA为读数指令。,Chp5 指令系统,指令格式如下,其中的 S(源),D(目标)都是通用寄存器,M是主存中的一个单元。,Chp5 指令系统,要求: 1、分析三种指令格式与寻址方式特点。 2、CPU完成哪一条指令所花时间最短?哪一条指令花时间最长?第二条指令的执行时间有时会等于第三条指令的执行

21、时间吗? 3、下列情况下每个十六进制指令字分别代表什么操作?若其中有的编码不正确,如何改正才能成为合法指令?, (F0F1)H (3CD2)H ; (2856)H ; (6FD6)H ; (1C2)H,Chp5 指令系统,解:1、第一种指令是单字长二地址指令,RR型;,第二种指令是双字长二地址指令,RS型其中一个采用基址寻址或变址寻址,另一个由源寄存器决定;,Chp5 指令系统,第三种也是双字长二地址指令,RS型,其中一个由目标寄存器决定,另一个由20位地址(直接寻址)决定。,2、第一种指令所花时间最短,因为是寄存器寄存器型指令,不需要访问存储器。,Chp5 指令系统,第二种指令所花时间最长,

22、因为需要访问存储器,还要进行寻址方式的变换运算(基值或变址),这也需要时间。,第三种指令虽然也访问存储器,但节省了求有效地址运算的时间开销。第二种指令的执行时间不会等于第三种指令的执行时间。,Chp5 指令系统,3、已知:MOV(OP)001010,STA(OP)011011,LDA(OP)111100, (F0F1)H (3CD2)H = 1111000011110001 (3CD2)H 该指令代表LDA指令,编码正确,其含义是把主存 (13CD2)H (20位)地址单元的内容取至15寄存器。,通用寄存器有16个,因此需要4bit区分,Chp5 指令系统,已知:MOV(OP)001010,S

23、TA(OP)011011,LDA(OP)111100。, (2856)H = 0010100001010110 代表MOV指令,编码正确,含义是把6号源寄存器的内容传送至5号目标寄器。,Chp5 指令系统,已知:MOV(OP)001010,STA(OP)011011,LDA(OP)111100。,(6FD6)H = 0110111111010110 该指令是单字长指令,一定是MOV指令,但编码错误。 可改正为 0010100011010110 = (28D6)H,Chp5 指令系统,已知:MOV(OP)001010,STA(OP)011011,LDA(OP)111100。,(1C2)H = 0

24、000000111000010 该指令是单字长指令,代表MOV指令,但编码错误。 可改正为 0010100011000010 = (28C2)H,第六章 中央处理器,Chp6 中央处理器,【6.1】CPU结构如下图所示,其中有一个累加器AC,一个状态条件寄存器和其他4个寄存器,各部分之间的连线表示数据通路,箭头表示信息传送方向。要求:,P234,(1)标明图中a, b, c, d 4个寄存器的名称。 (2)简述指令从主存取出到产生控制信号的数据通路。 (3)简述数据在运算器和主存之间进行存/取访问的数据通路。,Chp6 中央处理器,PC,AR,DR,IR,Chp6 中央处理器,【6.5】选出正

25、确答案填空:,P235,微指令分水平型微指令和_微指令两类。_可同时执行若干个微操作,所以执行指令的速度比_的快。,在实现微程序时,取下一条微指令和执行本条微指令一般是_进行的,而微指令之间是_执行的。,实现机器指令的微程序一般是存放在_中的,而用户可写的控制存储器则由_组成。,垂直型,水平型微指令,垂直型微指令,重叠,顺序,ROM,RAM,Chp6 中央处理器,【6.6】某机有8条微指令I1-I8,每条微指令所包含的微命令控制信号如下表所示。,P235,a- j对应10种不同性质的微命令信号。假设一条微指令的控制字段为8位,请安排微指令的控制字段格式。,Chp6 中央处理器,解:3种微指令编

26、译法:,直接控制法、直接编译法、间接编译法。,方法选择: 尽量使用直接控制法; 若此时微指令控制字段无法包含全部微命令,则引入直接编译法,和直接控制法结合; 若仍然无法包含全部微命令,则单独用直接控制法实现; 若还是无法包含全部微命令,则引入间接编译法。,Chp6 中央处理器,全用直接控制法控制字段表示命令个数为810; 使用直接控制法6b+直接编译法2b控制字段表示命令个数6+310;,使用直接控制法5b+直接编译法3b控制字段表示命令个数5+710,可行。,但任选5个命令直接控制,其余5个无法保持互斥。,Chp6 中央处理器,使用直接控制法4b+直接编译法2b控制字段表示命令个数4+3+3

27、=10,可行。,Chp6 中央处理器,相容性低(互斥性高)的命令采用直接编译法分组;相容性高的命令采用直接控制法并行。,Chp6 中央处理器,分析表格,a, c, d的相容性最高(分别为9、8、8),所以用直接控制法表示。e和g的相容性一样(都为7)所以任意选一个用直接控制法表示(比如选g)。 剩下b,e,f,h,i,j可通过相斥性分段,用直接编译法表示。这里选(e ,f ,h)和(b, i, j)可分别组成两组。结果如下:,Chp6 中央处理器,【6.7】已知某机采用微程序控制方式,其存储器容量为51248(位),微程序可在整个控制存储器中实现转移,可控制微程序的条件共4个(直接控制),微指

28、令采用水平型格式,如图所示:,P236,(1)微指令中的三个字段分别应多少位? (2)画出围绕这种微指令格式的微程序控制器逻辑框图。,Chp6 中央处理器,解: (1)可控制微程序的条件共4个(直接控制)判别测试字段中每一位为一个判别标志,该字段长4位; 微程序可在整个控制存储器中实现转移,其存储器容量为2948b 下地址字段长9位; 微指令字段长:48 4 9 = 35位。,Chp6 中央处理器,(2)微地址寄存器对应下地址字段;,P字段即为判别测试字段;,控制字段即为微指令字段,与P字段一起组成微指令寄存器。,地址转移逻辑即AG,输入是指令寄存器OP译码,各状态条件以及P字段,其输出适当修

29、改微地址寄存器,实现微程序的分支转移。,Chp6 中央处理器,【6.8】在微程序计算机中,下一条要执行的微指令地址都有哪些可能的来源?各发生在什么场合?(略),P237,【6.16】选择填空:,微机A和B是采用不同主频的CPU芯片,片内逻辑电路完全相同。若A机的CPU主频为8MHz,B机为12MHz。则A机的CPU主振周期为_s。如A机的平均指令执行速度为0.4MIPS,那么A机的平均指令周期为_s,B机的平均指令执行为_MIPS。,Chp6 中央处理器,解: 主振周期 = CPU周期 = 1/主频 。 A机的CPU主振周期为:1/8MHz = 0.125s。 MIPS:每秒钟执行百万条指令。

30、 A机的平均指令执行速度为0.4MIPS A机的平均指令周期为:1/0.4M = 2.5 s。 指令执行速度和主频成正比。 B机指令速度/ A机指令速度=B机主频/A机主频 B机的平均指令执行为: 0.4MIPS12/8=0.6MIPS,Chp6 中央处理器,【6.22】某机的微指令格式中有10个独立的控制字段C0C9,每个控制字段有Ni个互斥控制信号,Ni的值如下:,P237,请回答:(1)这10个控制字段,采用编码表示法,需要多少控制位? (2)如果采用完全水平型编码方式,需要多少控制位?,Chp6 中央处理器,解:3种微指令编译法:直接控制法、直接编译法、间接编译法。,(1)编码方式默认

31、为直接编译法。,控制位数:3+3+2+4+4+3+3+1+4+4 = 31位。,Chp6 中央处理器,解:(2)采用水平型编码方式即直接控制法。每个控制位对应一个控制信号。,控制位数:4+6+3+11+9+5+7+1+8+15 = 69位。,第七章 存储系统,Chp7 存储系统,【7.1】计算机存储系统分哪几个层次?每一层次主要采用什么存储介质?其存储容量和存取速度的相对值如何变化?,P259,答:存储系统分为cache、主存、辅存三个层次。,其中,cache采用SRAM、主存采用DRAM、辅存大多用磁表面存储介质构成。,从cache到辅存,三个层次的容量增加、速度降低。,Chp7 存储系统,

32、【7.3】设某流水线计算机有一个指令和数据合一的cache,已知cache的读写时间为10ns,主存的读写时间为100ns,取指的命中率为98%,数据的命中率为95%,在执行程序时,约有1/5指令需要存取一个操作数,为简化起见,假设指令流水线在任何时候都不阻塞。问设置cache后,与无cache比较,计算机的运算速度可提高多少倍?,P259,Chp7 存储系统,解:无cache的计算机,平均访存时间为:,1001 + 1001/5 = 120ns,有cache的计算机中,,访指令:10ns0.98 + (100ns+10ns)0.02 = 12ns,访数据:10ns0.95 + (100ns+

33、10ns)0.05 = 15ns,平均访存时间:12ns + 15ns/5 = 15ns,有cache后,速度可提高120/15 = 8倍。,Chp7 存储系统,【7.4】接上题,如果采用哈佛结构(分开的指令cache和数据cache),运算速度可提高多少倍?,P260,解:与上题的区别在于,采用哈佛结构,从cache中取数据与取指令同时进行。,访存的平均时间为:Max(访指令平均时间,访数据平均时间)= Max(12ns,3ns)=12ns,速度可提高120/12 = 10倍。,Chp7 存储系统,【7.5】设某计算机的cache采用4路组相联映像,已知cache容量为16KB,主存容量为2

34、MB,每个字块有8个字,每个字有32位。请回答:,P260,(1)主存地址多少位(按字节编址),各字段如何划分(各需多少位)? (2)设cache起始为空,CPU从主存单元0,1,100依次读出101个字(主存一次读出一个字),并重复按此次序读11次,问命中率为多少?若cache速度是主存的5倍,问采用cache与无cache比较速度提高多少倍?,Chp7 存储系统,解:(1)组相联映像主存地址格式:,Cache 共 2c 块,被分成 2c组,每组 2r 个块,t位为区地址。c = c+ r,4路组相联r = 2; cache容量16KB,字块为8个字,每个字32位 cache中的块数:16K

35、B / (84B) = 512; 2c = 512 c = 9; c= c - r c= 7;,Chp7 存储系统,每个字块有8个字 b = 3; 每个字有32位,按字节编址 字节地址为2bit 主存容量2MB,按字节编址 主存地址共21bit。 主存区地址:t = 21 r c b 2 = 7bit,主存地址格式:,t=7,r=2,c,=7,b=3,2,Chp7 存储系统,(2)每块含8个字,主存字单元0100共分成13个块。,第一遍取数时,因cache为空,命中率为0; 从第二遍开始取数,无需替换,cache命中率为1; 读取11遍,总体命中率为10/11 91%,设cache读写时间为t

36、,则主存为5t。 采用cache的平均访存时间=10t + 16t = 16t; 无cache的访存时间=115t; 速度快55t/16t3.43倍。,j = i mod 2c,Cache共有128 组13,根据组相联映像,主存中13个块与cache中前13个组依次对应。,Chp7 存储系统,【7.6】设某计算机采用直接映像cache,已知容量为4096B。,P260,(1)若CPU依次从主存单元0, 1, , 99 和 4096, 4097, , 4195 交换取指令,循环执行10次,问命中率为多少? (2)如cache存取时间为10ns,主存存取时间为100ns,cache命中率为95%,

37、求平均存取时间。,Chp7 存储系统,解:(1)直接映像的映像函数:,Cache 容量为4096B,假设每块含1个单元(块数最多的情况) cache中块数2c = 4096 = 212 0(或4096) mod 2c = 0 主存4096与0单元对应cache中同一位置。 同理1与4097、2与4098、99与4195都分别对应cache中同一位置。依次交换访问则命中率为0。,j = i mod 2c,Chp7 存储系统,j = i mod 2c,如果每块包含2b (b0)个单元,则cache中块数2c = cache单元总数/2b = 4096/2b。 主存4096单元位于 i = 4096

38、/2b 块中, j = 4096/2b mod 2c = 2c mod 2c = 0。又0 mod 2c = 0 因此主存4096单元和0单元对应cache中的0号快。 同理1与4097、2与4098、99与4195都分别对应cache中同一块。依次交换访问命中率为0。,(2)平均存取时间:,10ns0.95 + (100ns+10ns)0.05 = 15ns,Chp7 存储系统,【7.7】一个组相联cache由64个存储块组成,每组包含4个存储块,主存由8192个存储块组成,每块由32个字组成,访存地址为字地址。问:,P260,(1)主存和cache地址各多少位?地址映像是几路组相联? (2)在主存地址格式中,区号、组号、块号、块内地址

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论