组成原理习题总结.doc_第1页
组成原理习题总结.doc_第2页
组成原理习题总结.doc_第3页
组成原理习题总结.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1(8分)一台模型机共有7条指令,各指令的使用频度分别为35%,25%,20%,10%,5%,3%,2%,有8个通用数据寄存器,2个变址寄存器。 (1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。 (2) 设计8位字长的寄存器-寄存器型指令3条,16位字长的寄存器-存储器型变址寻址方式 指令4条,变址范围不小于正、负127。请设计指令格式,并给出各字段的长度和操作码的编码。 (1) 操作码:0,10,110,1110,11110,111110,111111 平均长度:H = 2.4 (2) 00 R R,每个R为3位,共8位 01 R R 10 R R 1100 R X A,R为3位,X为1位,变址量8为,共16位 1101 R X A 1110 R X A 1111 R X A 2(10分)某工作站采用时钟频率f为15MHZ,处理速率为10MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为 1周期延迟,试问: (1)(4分)此计算机的有效CPI是多少 (2)(6分)假定将处理机的时钟频率f提高到30MHZ,但存储器子系统速率不变。 这样,每次存储器存取需要两个时钟周期,如果30%指令每条只需要一次存储存取, 而另外5%每条需要两次存储存取,还假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。 (1) CPIold = fold /(MIPS * 106)= 15106 /(10 * 106 )= 1.5 (2) 如题所述,30的指令需要一次存储存取,则这些指令在处理器提高时钟频率之后需要增加一个时钟 同样,另外5的指令需要增加两个时钟周期。 CPInew= (改进前执行混合程序的所需时钟周期数 + 30%1指令数 + 5%2指令数) / 指令数 = 改进前有效CPI + 30%1 + 5%2= 1.5 + 0.3 + 0.1= 1.9 处理速率MIPS= fnew / (CPInew106) = 30106/(1.9106) = 15.79 MIPS,假设混合程序的指令数为IC, 则有 3(10分)在下列不同结构的处理机上执行66的矩阵乘法C=AB,计算所需要的最短时间。只计算乘法指令和加法指令的执行 时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期, 另外,加法指令和乘法指令还要经过取指令和指令译码的时钟周期,每个时钟周期为20ns,C的初始值为0。 各操作部件的输出端有直接数据通路连接到有关操作部件的输入端,在操作部件的输出端设置有足够容量的缓冲寄存器。 (1) (4分)处理机内只有一个通用操作部件,采用顺序方式执行指令。 (2) (6分)单流水线标量处理机,有一条两个功能的静态流水线,流水线每个功能段的延迟时间均为一个时钟周期, 加法操作和乘法操作各经过3个功能段。要完成上面的矩阵乘法,需要完成的各种操作的数量: 需要完成的乘法次数为666=216次; 需要完成的加法次数为665=180次; 下面我们分析处理机的结构会给性能带来什么样的影响。 (1) 顺序执行时,每个乘法和加法指令都需要5个时钟周期(取指令、指令分析、指令执行);所以所需要的时间为: (2) 单流水线标量处理机,采用两功能静态流水线时;因为有足够的缓冲寄存器,所以我们可以首先把所有的乘法计算完,并通过调度使加法流水线不出现停顿,所以所需要的时间为:4.(10分)假设一条指令的执行过程分为取指令、分析和执行三段,每一段的时间分别为t、2t和3t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 (1)(3分)顺序执行方式。 (2)(7分)取指令、分析和执行重叠。顺序执行时每条指令用时=t+2t+3t=6t, 因此n条指令所需要的时间=6n*t (2)第一条指令完成需要时间=t+2t+3Dt=6t,由于一条指令的取指令和分析阶段和下一条指令的执行阶段重叠,因此,此后每3t 完成一条指令,余下的n-1条指令用时(n-1)*3t. 所以因此n条指令所需要的时间=6t+(n-1)*3t=3(n+1)t5.(10分)已知一个Cache共有4个块,每个块大小为4个字。采用直接映像方式,假设该Cache的缺失代价为8个时钟周期。初始时Cache为空,当程序执行过程中访存的字地址序列为0,7,12,9,16,8,17,0,12,2时 (1)(7分)试计算Cache的命中率 (2)(3分)计算Cache缺失(不命中)代价(1) 字地址流进入cache时工作情况: 时间12345678910字地址流07129168170122块00000161617002块1777777777块29988888块31212121212121212 装入装入装入装入替换替换替换替换命中替换在上表中,共有10个时刻,只有时刻9命中,所以命中率1/10=10% (2) 缺失代价9872个时钟周期6.(10分)假设一个网络的频宽为10兆位/秒,发送方开销和接收方开销分别等于230微秒和270微秒。如果两台机器相距100米,现在要发送一个1000字节的消息给另一台机器,试计算总时延。如果两台机器相距1000公里,那么总时延为多大?光的速度为299792.5公里/秒,信号在导体中传递速度大约是光速的50,所以“飞行”时间可以计算出来了。那么相距100米时总时延为:相距1000公里时的总时延为:7.(10分)设有下列流水线预约表: 1234S1X XS2 X S3 X 分别写出禁止表F、冲突向量C、画出状态转换图,求出最小平均延迟及流水线的最大吞吐率(假设流水线的时钟周期为=20ns)。 禁止表F=3、冲突向量C=(100)状态图如下: 简单循环:(4), (2), (2,4), (1,4), (1,1,4);迫切循环:(1,1,4), (2);最佳恒定等待时间循环: (2);最小平均等待延迟 MAL=2;因为MAL=2,所以该流水线的吞吐率 :8.(10分)一台单处理机可以以标量方式运行,也可以以向量方式运行。在向量方式情况下,计算可比标量方式快9倍。设某基准程序在此计算机上运行的时间为T。另外,已知T的25%用于向量方式,其余的时间则以标量方式运行。 (1) 计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的比例 。 (2) 假设我们改进硬件使向量方式与标量方式之间的速度比加倍,试计算可达到的加速比。 (3) 如果要达到与(2)相同的加速比,用的方法是改进编译器,而不是改进硬件,那么,用向量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论