12系统结构答案.ppt_第1页
12系统结构答案.ppt_第2页
12系统结构答案.ppt_第3页
12系统结构答案.ppt_第4页
12系统结构答案.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,1.模拟a.用软件方法在一台现有的计算机上实现另一台计算机的指令系统b.指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器 2.仿真a.用微程序直接解释另一种机器指令系统的方法b.每条指令的平均时钟周期数 3.MIPSa.它表示每秒百万指令条数b.每秒百万次浮点操作次数 4.MFLOPSa.每秒百万次浮点操作次数b.计算机组成是计算机系统结构的逻辑实现 (请计算机四班的同学,将本题答案写在纸条上,下课后交到讲台上,并写好班级、学号、姓名,) 2005.4.25,课 堂 作 业(一)单选题,2,1.想在系列机中发展一种新型号机器,你认为将CPU与主存之间的数据

2、通路宽度由16位扩到32位,以加快主机内部信息的传送。可以考虑的,还是不行的?为什么? 可以。只是提高了数据传输的速度。 (请计算机六班的同学,将本题答案写在纸条上,下课后交到讲台上,并写好班级、学号、姓名,) 2005年4月10日,课 堂 作 业(二),3,1.假定我们将某一执行部件改进后速度提高10倍。改进后被改进部件执行时间占系统总运行时间的50%。则改进后,获得的加速比Sp是多少? (请计算机六班的同学,将本题答案写在纸条上,下课后交到讲台上,并写好班级、学号、姓名,),课 堂 作 业(三),4,在尾数采用补码、小数表示且p=6,阶码采用移码、整数表示且q=6,尾数基rm为16,阶码基

3、re为2的情况下:(1) 最大尾数为:1rm-p116-6,0.FFFFFF(2) 最小正尾数为:1/rm1/16,0.100000(3) 最小尾数为: -1, 1.000000(4) 最大负尾数为:-(rm-1 + rm-p)(16-1 + 16-6),1.EFFFFF(5) 最大阶码为:req126163,7F,包括符号位共7个1(6) 最小阶码为:-req-26-64,00,包括符号位共7个0(7) 最大正数为:(116-6)1663,7FFFFFFF(8) 最小正数为:16-65,00100000(9) 最大负数为:-(16-1 + 16-6) 16-64,80EFFFFF(10) 最

4、小负数为:-1663,FF000000(11) 浮点零为:00000000(12) 表数精度为:16-5/22-21(13) 表数效率为:15/1693.75(14) 能表示的规格化浮点数个数为:21516527+1,课 堂 作 业(四、五、六),5,证明:在浮点数的字长和表数范围一定时,尾数基值rm 取2或4具有最高的表精度。(见教案) 假设有两种表示方式F1和F2,它们二进制字长相同,尾数都用原码或补码、小数表示,阶码都移码、整数表示,阶码的基值均为2,尾数基值不同。 浮点数表示方式F1:rm1=2,p1,q1, 二进制字长:L1= p1+q1+2 浮点数表示方式F2: rm1=2k ,p

5、2,q2, 二进制字长:L2= kp2+q2+2 由于F1和F2二进制字长相同,即L1= L2,得 p1+q1 =kp2+q2 (1) F1的表数范围是: F2的表数范围是:,课 堂 作 业(六*),6,课 堂 作 业(六*),两边取以2为底的对数得: q1 =q2 +log2k (2) (2.2)代入(2.1)得: p1+ q2 +log2k =kp2+q2 化简得到:p1=kp2 -log2k (2.3) F1的表示数精度是: (2.4) 把(2.3)代入(2.4)得到: F2的表示数精度是: 取F2与F1表示数精度的比值: (2.5) 只有k=1(rm=2)或k=2(rm=4)时,比值T

6、=1 结论1:在字长和表数范围一定时,尾数基值rm取2或4,浮点数具有最高的表精度。,7,操作码:00,01,10,110,1110,11110,11111平均长度:H = 2.35,0.35,0.25,0.20,0.10,0.05,0.02,0.03,0.05,0.10,0.20,0.40,1.00,0,0,0,0,0,0,1,1,1,1,1,1,0.60,课 堂 作 业(七),8,寄存器-寄存器:每个R为3位,共8位 00 R R; 01 R R10 R R寄存器-存储器: R为3位,X为1位,A变址量为8(127),共16位。 1100 R X A(变址寄存器两个只要1位) 1101 R

7、 X A(变址量127需要8位) 1110 R X A 1111 R X A,课 堂 作 业(八),9,1、请回答下列问题:在许多早期处理机中,为什么采用微程序设计方法?为什么现代处理机较少采用该方法? 答:早期主要是微程序设计方法允许少量硬件实现较复杂指令。现代可用硬件增多,CISC指令减少,这样在硬件中直接实现指令。 2、按Cache地址映像的块冲突概率从高到低的顺序是( ). A、全相联映像 、直接映像、组相联映像 B、组相联映像、直接映像、全相联映像 C、直接映像、组相联映像、全相联映像(OK) D、全相联映像、组相联映像、直接映像,课 堂 作 业(十),10,一、对于一个采用组相联映

8、象方式和FIFO替换算法的Cache,发现它的等效访问时间太长;为此,提出如下改进建议: (1)增大主存的容量。 基本无关 (2)提高主存的速度。 能够减小等效访问时间,T = TC H+TM (1-H),通过减小TM能够减小T。 (3)增大Cache的容量。 当Cache比较小时,增大Cache对减小等效访问时间效果明显;当Cache容量达到一定程度时,效果逐渐不明显。 (4) Cache的总容量和块大小不变,增大组的大小。 有一个极大值,在这个极大值点,等效访问时间最小。,课 堂 作 业(十一),11,1、不属于堆栈算法的是( ) A、FIFO算法 B、LFU 算法 C、OPT算法 D、L

9、RU算法 2、与虚拟存储器的等效访问速度无关的是( ) A、访存页地址流 B、页面替换算法 C、主存的容量 D、辅存的容量 答案:1、A;2、D (请计算机四班的同学,将本题答案写在纸条上,下课后交到讲台上,并写好班级、学号、姓名,) 2005.4.15,课 堂 作 业(十二),12,一、对于一个采用组相联映象方式和FIFO替换算法的Cache,发现它的等效访问时间太长;为此,提出如下改进建议: (1)Cache的总容量和组大小不变,增大块的大小。 有一个极大值,在这个极大值点,等效访问时间最小。 (2)提高Cache的速度。 能够减小等效访问时间,T = TC H+TM (1-H),效果明

10、(3)Cache的总容量和块大小不变,增加组数。 当组数不是很多时,等效访问时间的变化不大,当组数超过某一值时,等效访问时间将明显增加。 (4)替换算法由FIFO改为LFU。 能够提高命中率,因此,能够减小等效访问时间。,课 堂 作 业(十三),13,课 堂 作 业(十六),解:禁止表F=3、冲突向量C=(100) 状态图如右图所示: 简单循环:(4), (2), (2,4), (1,4), (1,1,4);迫切循环:(1,1,4), (2);最佳恒定等待时间循环: (2);最小平均等待延迟 MAL=2;因为MAL=2,所以该流水线的吞吐率,14,课 堂 作 业(十七),乘法操作用到的流水段有

11、:S1、S4、S5、S6;加法操作用到的流水段有:S1、S2、S3、S6。以最快的方式处理的流水线时空图如图所示: (2) A部分所处理的是 B部分所处理的是 C部分所处理的是,15,整个处理过程共需22个时钟周期。而进行了14次不同的运算,所以其实际吞吐率为: 这些运算串行处理所需要的时钟周期为56个时钟周期,所以其加速比和效率分别为:,课 堂 作 业(十七续),16,试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。 计算机系统结构作为一门学科,主要是研究软件,硬件功能分配和对软件、硬件界面的确定,即哪些功能由软件完成,哪些功能由硬件完成。计算机系统结构,计算机组成和计算机

12、实现是三个不同的概念。计算机系统结构是计算机系统的软硬件的界面;计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。,17,课 堂 作 业(四),一台模型机共有7条指令,有8个通用数据寄存器,2个变址寄存器。设计8位字长的寄存器-寄存器型指令3条,16位字长的寄存器-存储器型变址寻址方式指令4条,变址范围不小于正、负127。请设计指令格式,并给出各字段的长度和操作码的编码。 (请计算机1班的同学,将本题答案写在纸条上,下课后交到讲台上,并写好班级、学号、姓名) 2007.4.4,用几bit来表示?,用几bit来表示?,用几bit来表示?,要符合扩展编码规则,18,有5个中断

13、源,其中断优先级、正常情况下的中断屏蔽码和 改变后的中断屏蔽码如下表所示,每个中断源的有5位中断屏蔽码,其中“1” 表示该中断源被屏蔽,“0”表示该中断源开放。 (1) 5个中断源同时申请,分别写出使用正常的中断屏蔽码和改变后中断屏蔽码时,处理机响应各中断源的中断服务请求的先后次序和实际中断次序。 (2)假设处理机从响应中断源的中断服务请求开始,到运行中断服务程序中第一次开中断所用时间为1个单位时间,运行中断服务程序的其它部分所使用的时间为4个单位时间,那么在执行主程序时,有D3、D4和D5同时发出中断服务请求,过了3个单位时间,又有中断源D1和D2同时发出中断服务请求,如果使用改变后中断屏蔽

14、码,请画出处理机响应中断源的中断服务请求和实际运行中断服务程序过程示意图。,课 堂 作 业(二十一),19,(1)D1D2D3D4D5 D5D4D3D2D1,题目中没有说明是1级最高,还是5级最高,有的同学认为中断优先级D5最高!对吗?,我们可以从正常中断屏蔽码得到结论:应该是1级最高,如果是5级最高就没有意义,因为响应D5 中断,其他中断源无法中断D5执行 。,20,用户程序 1 2 3 4 5,12345,(2)D1D2D3D4D5 D1D2D3D5D4,此时D1、 D2、D3执行完,还有D4、 D5没有执行,那么选择D4执行,这时屏蔽码对D5是开放的,所以D5中断D4执行,执行D5,执行

15、D5完毕就执行D4 ,然后返回主程序。,21,12,345,用户程序 1 2 3 4 5,错!,错的原因:执行D3 后要返回到用户程序!,开始345中断源同时然后过3单位时间,又有D1、D2申请中断。,22,12,345,用户程序 1 2 3 4 5,OK!,345中断源同时申请,选择最高的D3执行,由于一个中断程序执行需要5个单位时间,其中一个关门时间.当中断D3执行3单位时间,又有D1、D2申请中断。,这时屏蔽码对D1是开放的,所以执行D1级中断!然后返回执行D3完!再返回用户程序,此时D1、 D3执行完,那么在D2D4D5中选择D2级别高,且这时屏蔽码对本身是开放的,执行完,返回用户程序

16、,此时D1、 D2、D3执行完,还有D4、 D5没有执行,那么选择D4执行,这时屏蔽码对D5是开放的,所以D5中断D4执行,执行D5,执行D5完毕就执行D4 ,然后返回主程序。,23,解:t=10ns=10-8秒 (1)F=1,2,5,C=(10011) (2)状态转移图如下图所示。100113,4,*6 (3)最小启动循环=(3),最小平均启动距离=3t。 (4)插入2个延迟,最小启动循环=(2),最小平均启动距离=2t。,24,计算峰值,1、10台NF190D服务器理论值:10(节点个数)*2(2个CPU/服务器)*2(双核/CPU)*2(一个时钟周期2个浮点运算)*1.6(主频)=128Gflops 2、2台SP2200服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论