




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精品Question4Asingle-issueprocessorusestomasulo'salgorithminitsfloating-pointunit,whichhasoneadderandonemultiplier,eachwithitsownsetofreservationstation,thereisonlyoneCDB,andbroadcastonthisCDBtakesanentirecycle.theprocessorisexecutingthefollowingsequenceofinstructionand,foreachinstruction,weshowth
2、ecycleinwhichtheinstructionisfetched,decoded,issued,beginstoexecute,andwritesresult.单发射处理器在其浮点单元中使用托马斯算法,其具有一个加法器和一个乘法器,每个具有其自己的一组保留站,只有一个CDB并且在该CDBt广播需要整个周期。处理器正在执行以下指令序列,并且对于每个指令,我们示出指令被取出,解码,发出,开始执行和写入结果的周期。instructionfetchdecodeissueexecuteWriteresultI1MULR1,R2,R212348I2ADDR1,R1,R2234910I3MULR2,
3、R2,R3345813I4ADDR3,R1,R14561112I5MULR1,R1,R15671216I6ADDR2,R3,R46711?I7ADDR1,R5,?781317181、whatisthelatencyofthemultiplier?42、Isthemultiplierpipelined?N3、Howmanyreservationstationaretherefortheadder?24、InwhichcycledoesI6begintoexecute?135、Whichregisterdoes?RepresentinI7R16、IftheprioryforusingCDBdepe
4、ndsonthetypeofinstruction,betweenADDandMULthepriorityforusingtheCDBgoesto?ADDQuestion8(书本92页)感谢下载载;load R1 from address 0+R2 ;R1=R1+1.Loop:LDR1,0(R2)DADDIR1,R1,#1SDR1,0,(R2)DADDIR2,R2,#4DSUBR4,R3,R2BNEZR4,Loop;storeR1ataddress0+R2;R2=R2+4;R4=R3-R2;branchtoLoopifR4!=0AssumethattheinitialvalueofR3isR2
5、+396.答案:(1)依题意可得,指令序列执行的流水线时空图如下:1234567891011121314151617181920211IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIFIDEXME时钟周期为:17*98+18=1684(2)依题意可得,指令序列执行的流水线时空图如下:1234567891011121314151IFIDEXMEWB2IFIDSEXMEWB3IFSIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB7IFMissMissIFIDEXMEWB时钟周
6、期为:10*98+11=991(3)依题意可得,指令序列执行的流水线时空图如下:12345678910111IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIDEXMEWB时钟周期为:6*98+10=598Question99a)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisa2-waysetassociativecache,havingthefollowingparameters:Parameter:Value:numberof
7、sets1024setslinesize16wordscacheaccesstime15ns/linemainmemoryaccesstime70ns/wordmainmemoryaddressspacesize256Mwordscachehitrate95%Labelthefieldsofthememoryaddressbelowusedtoaccessthecacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:_14_bitsIndex:_10_bitsOffset:_
8、4_bits9b)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisadirectmappedlevel1(L1)cacheandafullyassociativelevel2(L2)cache,havingthefollowingparameters:Parameter:Value:L1numberofsets128setsL1linesize4wordsL1cacheaccesstime10ns/lineL2linesize8wordsL2cacheaccesstime20ns/linemainmemoryacces
9、stime70ns/wordmainmemorysize256MwordsL1cachehitrate95%L2cachehitrate89%LabelthefieldsofthememoryaddressbelowusedtoaccesstheL1cacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:19bitsIndex:7bitsOffset:2bitsLabelthefieldsofthememoryaddressbelowusedtoaccesstheL2cach
10、eandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:25bitsIndex:0bitsOffset:3bitsQuestion11一个简单的共享内存cache-coherent机有四个处理器,没有"虚拟到物理"的翻译和16位(物理)地址。每个处理器有一个L1数据缓存,没有L2高速缓存。每个L1缓存是有四个64字节的块(每个缓存的大小是256字节)的直接变换,他们使用MESI一致性协议来保持一致的。每个缓存的初始状态(十六进制符号标记所示):P0P1P2P3st
11、atagstattagstattagstattagteIeee如0FS0FS01S01果按顺序M01E02M03E04执行下面I0FI0FE0FI0F的内存访M00E02S04I06问,将会发生什么?特别是,指定每个其他的缓存发生在由于总线广播、数据从哪里来(如果在缓存中没有准备好),和新状态块的请求者的缓存。P0写一个字到地址00fcP1读一个字到地址0f8cP2读一个字到地址0f8cP3写一个字到地址0444答案:P0P1P2P3statetagstatetagstatetagstatetagIOFSOFSOFSOFM01E02M03M04IOFIOFEOFIOFM00E02S04I06Q
12、uestion13statelagdataB0II100WIDM1ZB,0068B2|110,001DB3S001S山住dataB0120oo20B1£10ftco091110oo1Q明)1180010理由1修9II1000010B1IS1080003M1100030B311180010POP1<-P2>Memory答案:A:P0B0( S,120,00,20)B:P0 B0 (M,120,00, 80)C:P2B0 (M,120,00,80)D: P1B2 (S,110,00,30)E: P0B1 (M,108,00,48)F: P0 B2 (M,130,00 , 78
13、)P1 B0 (I,120,00, 20)P0 B0 (I,120,00, 80)P2 B2 (S,110,00 , 30)P1 B1 (I , 108, ,0,08P1 B0 (I,120,00, 80)P2 B1 (I , 108,00,08 )40%先将该功能部件改进(加速1 .处理器中某功能部件占总应用程序执行时间的比例为10倍),则整个应用程序的加速比为多少?(D)A.1.4B.2.5C.2.18D.1.562 .在计算机系统设计中,比较好的方法是:(D)A. 从上向下设计 B.C. 从两头向中间设计D.3 .对系统程序员不透明的是:(A. Cache存储器C.指令缓冲寄存器4 .系
14、列机软件应做到:( BA.向前兼容,并向上兼容C. 向前兼容,并向下兼容5.属计算机系统结构考虑的应是A.主存采用CMOSE是TTLC.主存容量和编址方式D从下向上设计从中间开始向上、向下设计D )B.系列机各档不同的数据通路宽度D. 虚拟存储器)B.向后兼容,力争向上兼容D.向后兼容,力争向下兼容:C )。B .主存采用多体交叉还是单体.主存频宽的确定6. 最能确保提高虚拟存储器访问主存的命中率的改进途径是(D)。A.增大辅存容量.采用FIFO替换算法并增大页面C.改用LRU替换算法并增大页面D.改用LRU替换算法并增大页面数7. 静态流水线是指(C)。A.只有一种功能的流水线B.功能不能改
15、变的流水线C.同时只能完成一种功能的多功能流水线D.可同时执行多种功能的流水线8. 假设用软件方法在A计算机上实现B计算机的指令系统,则B称为(C)。A.仿真机B.宿主机C.虚拟机D.目标机9. 计算机中优化使用的操作码编码方法是(D)。A.哈夫曼编码B.ASCII码C.BCD码D.扩展操作码10. 在采用基准测试程序来测试评价机器的性能时,下列方法按照评价准确性递增的顺序排列是(B)。A: 1)实际的应用程序方法B: 2)核心程序方法C: 3)玩具基准测试程序(小测试程序)D: 4)综合基准测试程序E: (1)(2)(3)(4)F: (2)(3)(4)(1)G: (3)(4)(1)(2)H:
16、 (4)(3)(2)(1)11. 10.在系统结构设计中,提高软件功能实现的比例会(C)。A、提高解题速度B、减少需要的存贮容量C提高系统的灵活性D、提高系统的性能价格比12. CPI是量化计算机性能的一个重要指标,关于CPI说法正确的是(C)A.CPI由计算机的结构决定B. CPI由运行在计算机系统上的应用程序决定C. CPI由计算机的结构和应用程序共同决定D.CPI由计算机的时钟周期决定13. 以下不属于计算机性能公式的变量是(D)A.ICB.时钟周期C.CPID.MIPS14. 未曾实现的商业计算机结构类型是(C)A.SISDB.SIMDC.MISDD.MIMD15. 关于近10年CPU
17、从单核转向多核处理器的解释正确的是(D)A. 指令级并行技术已经发展到极限B. CPU的工作电压很难再下降C.提高时钟频率会带来CPU的散热极限问题D.上述理由全部正确16. 图像处理器GPU属于哪种结构(B)A.SISDB.SIMDC.MISDD.MIMD17. 以下不属于Flynn体系结构类型的是(C)A.SISDB.SIMDC.SIMTD.MISD18. CPI是量化计算机性能的一个重要指标,关于CPI说法正确的是(B)A.CPI由计算机的结构决定B. CPI由运行在计算机系统上的应用程序决定C. CPI由计算机的结构和应用程序共同决定D.CPI由计存储器系统决定分析:CPI=TC/IC
18、19. 与存储器-存储器结构指令集结构相比,寄存器-寄存器结构(D).A.CPI大B.完成同一个算法需要的指令数更少C.指令的功能更复杂D.固定长度的指令编码方式20. 计算机系统的执行时间的通用公式为:CPUtime=yx时钟周期xCPI,此处y是(B)A. 程序执行的周期数B. 被执行的指令总数C. 包括访问存缺失在内的指令平均执行时间D. 每个周期内执行的指令数21. RISC与CISC不同处有(C)A.RISC指令复杂B.CISC指令效率高C.RISC指令数量少D.以上说法均错误22. 关于MIPS的指令集结构类型说法正确的是(A)A. 寄存器-寄存器B. 寄存器-存储器C. 存储器-
19、存储器D. 以上说法均错23. 流水线技术可以(A)A.提高吞吐率B.降低吞吐率C.降低响应时间D.增加响应时间24. 流水线通过哪种方式提高系统的性能(C)A.减少指令的响应时间B.消除指令相关C.开发指令级的并行D.降低CACHE勺缺失率25. 恶化流水线的处理器性能的原因是(D)A.流水线每级处理时间不同B. 连续的指令间的相关C. 流水线的结构相关D.以上全部正确26. 流水线技术可以(D)A. 提高吞吐率和不改变响应时间B. 提高吞吐率和降低响应时间C. 降低吞吐率和降低响应时间D. 提高吞吐率和增加响应时间27. 在k级单流水线中执行n个任务,所消耗的时钟周期数(A)A.k+n-1
20、B.nk+1C.kD.以上说法全部错误28. 关于静态指令调度和指令动态调度说法错误的是(C)A. 编译器相比于硬件有更多的时间处理复杂的调度算法B. 编译器静态调度的前提是假设指令间存在比时间更复杂的冲突C. 编译器静态调度需要比动态调度更多的关于冲突的精确历史数据D. 以上说法都错误29. 保留站项在流水线的哪一级释放(A)A. 写结果B.发射C.执行D.确认30.使用独立的指令CACH医口数据CACHE勺理由是(D)A.数据和指令存在在不同的存储器。B. 每个核的指令不同但数据共享C. 存储器的方法模式不同D. 减少指令和数据访存的冲突31. 关于全相联CACH脱法正确的是(C)A. 等
21、价于一个1组1路组相联CACHEB. 等价于一个多组1路组相联CACHEC. 等价于一个1组多路直接映像CACHED. 等价于一个多组1路组直接映像CACHE32. 关于强制性不命中说法正确的是(A)A.块第一次被访存所以不在CACHED.B. 程序执行过程中由于cache容量有限不能保存所有块C. 因为采用组相联和直接映像所以发生冲突被替换掉D. 以上说法全错33. 在采用单流水线、顺序执行和顺序提交结果的处理器中,那种情况会导致数据冒险(C)A.写后写B.读后写C.写后读D.读后读34. 为什么乱序执行的处理器采用顺序方式提交指令执行结果?(D)A.确保精确异常B.确保多CACHE勺一致性
22、C.纠正和恢复分支预测错误的现场D.A和C都正确35. 在块替换策略中,采用替换最近很少使用方法的理由是(A)A. 充分利用了程序的时间和空间局部性原理B. 充分利用了程序的局部性原理C. 充分利用了程序的空间局部性原理D. 没用充分利用了程序的时间和空间局部性原理36. 在4路组相联缓存中,一个新的块的位置被映像到(C)A. 任何位置B. 块地址与组数取余运算的结果选组号,然后固定在组中的固定位置C. 块地址与组数取余运算的结果选组号,然后存放在组中的任何位置D. 以上说法都不对37. 关于最近20年内发生的事情说法正确的是(A)A. 处理器和存储器性能都提高了,但是处理器提高更多。B. 存
23、储器性能提高但处理器没有。C. 处理器和存储器性能都提高了,但是存储器提高更多。D. 处理器性能提高但存储器没有。38. 相比于写直达发,写回法的优势在于?(A)A.减少存储器访存次数B.减少不命中的开销C.减少命中时间D.降低缺失率39. 假设指令的处理必须使用五个功能部件,这五个部件的执行时间分别为:10ns,8ns,10ns,10nsand7ns.如果使用流水线技术,流水线寄存器的时间开销为1ns采用流水线与非流水线的加速比为(A)A.4.1B.5C.4.5D.340. 下列说法错误是:(B)A. 分支预测转移比预测分支不转移困难,因为需要提前指导分支转移目标指令的地址。B. 预测分支转
24、移和不转移的准确率都为50%。C.根据BTB可以在取指令前判断该指令是否为分支指令。D.流水线的深度会增加分支预测错误的开销时间。41. 寄存器换名技术可以消除(D)A. 写后写冒险B. 读后写冒险C. 写后读冒险D. A和C全部正确42. 以下说法错误的是(D)A. 第一级缓存的容量小于第二级缓存的容量B. 第一级缓存的响应时间小于第二级缓存的响应时间C. 第一级缓存的被访问次数小于第二级缓存的访问次数D. 第一级缓存和第二级缓存都采用相同的地址映像方法: 10 ns, 81 ns43. 假设指令的处理必须使用五个功能部件,这五个部件的执行时间分别为ns,10ns,10nsand7ns.如果
25、使用流水线技术,流水线寄存器的时间开销为采用流水线与非流水线的加速比为(A)A.4.1B.5C.4.5D.344. 为什么乱序执行的处理器采用顺序方式提交指令执行结果?(D)A.确保精确异常B.确保多CACHE勺一致性C. 纠正和恢复分支预测错误的现场D. A和C都正确45. 在前瞻执行中,ROB的项释放处在那一级(C)A.译码B.发射C.执行D.确认46. 以下说法正确的是?(D)A.直接映像cache与只有1个组多路组相联CACH萼价B.直接映像cache与只有1个组的全相联CACH若价C.直接映像cache与只有1个组1路组相联CACH萼价D.以上说法都错47. 下列哪种地址映像方式不适
26、合使用位预测技术(D)A. 全相联B. 4路组全相联C. 8路组全相联D. 直接映像48. 在监听协议中,那种情况下主存的信息不是最新的(C)A. 对共享状态数据进行写操作后的写直达cachesB. 写回caches有数据被标记为独享状态C. 写回caches有数据被标记为修改状态D. 写回caches有数据被标记为共享状态49. 下列哪种技术并没用通过采用开发并行度方法提高系统的性能(B)A. 增加流水线深度提高工作频率B. 采用小缓存减少访存响应时间C.增加功能部件提高吞吐率D.采用多核处理器50. 假设有一单级非流水线处理器其机器周期为5ns,如果采用4级流水线实现该处理器,其机器周期为
27、2ns,后者与前者的加速比是(D)A.3B.2.5C.2D.0.551. 流水线寄存器发射出一条加法指令,同时也没收到气泡和停顿信息停顿信号,此时在指令队列的尾部存在一条XOR!算指令,则等待发射的是(A)AaddBxorC气泡D停顿52. 对于以下代码:Intsum=0;for(intj=0;j<1000;j+)sum=sum+arri下列那个变量利用了程序的空间局部性原理()和时间局部性原理(B)A.jB.sumC.elementsofarrD.以上都不正确53. 在使用虚拟存储系统中,应用程序所使用的地址是(D)A. 主存空间B. 物理地址C. 地址空间D. 虚拟地址54. 某计算
28、机的Cache-主存层次采用组相联映象方式,块大小为128字节,Cache容量为64块,按4块分组,主存容量为4096块。那么主存地址共需(A)位。A.19B.18C.20D.以上都不对55. 基本的MIPS整数流水线中,访存地址的计算发生在流水线的第(C)段。A1B2C3D456. RISC执行程序的速度比CISC要快的原因是(C)。A.RISC的指令系统中指令条数较少B.程序在RISC上编译生成的目标程序较短。C.RISC的指令平均执行周期数较少。D.RISC只允许load和store指令访存。57.通过编译器重新安排指令的执行顺序以减少流水的停顿方法,称之为(D)。A.线性流水线B.非线
29、性流水线C.动态调度D.静态调度判断题1. ADistributedMemoryMultiprocessorisalsocalledaSymmetricMultiprocessor(SMP).分布式内存的多处理器也称为对称多处理器(SMP)。(T)2. Supposeweexpectatleastan80Xparallelspeedupfrom100processors.Atmost0.25%oftheexecutionoftheoriginalprogrammaybesequential(i.e.,non-parallelizable).假设我们希望至少一个从80年80x并行加速处理器。最多
30、0.25%的原始程序的执行顺序(即。non-parallelizable)。(T)3. Supposeaconditionalbranchalternatesbetweentakenandnottakeneverytimeitisexecuted.Aone-bitBHTpredictorislikelytohaveamispredictionrateof100%onthisbranch.假设一个条件分支之间的交替而不是采取每次执行时。一个一比特的二叔丁基对甲酚预测可能会对这个分支的错误预测率为100%(T)4. Supposeaconditionalbranchistakenthefirst1
31、000timesitisexecuted,andnottakenthesecond1000times.Aone-bitBHTpredictorislikelytohaveperformancesimilartoacorrelatingbranchpredictoronthisbranch.假设条件分支被执行第一的1000倍,而不是采取第二个1000次。一比特的二叔丁基对甲酚预测可能是性能类似于相关分支预测在这个分支。(F)5. InTomasulo'salgorithmwithspeculation,whenabranchismispredicted,thedatawrittentom
32、emoryandtheregisterfileasaresultofthatbrancharerolledbacktotheirpreviousvalues.与投机Tomasulo的算法,当一个分支预测错误,数据写入内存和寄存器文件的分支被回滚到之前的值。(T)6. ASingle-Instruction-Multiple-Data(SIMD)modelofcomputationischaracterizedbyindependentthreadscomputingonprivatememories.单指令多数据(SIMD)计算模型计算的特点是独立的线程在私人记忆。(T)7. Areturna
33、ddresspredictorislikelytomispredictwhenthereisdeeprecursion.(F)深度递归的时候,返回地址预测相当于误预测。8. Computerarchitecturedesignneedstoprovidesupporttocompiler.计算机体系结构设计需要为编译器提供支持。(T)9. IntheMIPSPipeling,'UpdatingthePC'iscompletedinEXstage.在MIPSPipeling,更新电脑”是在前阶段完成。(F)10. Forforwardingyouneedonlylookatthe
34、dataavailableintheMEMstage.转发你只需要看数据在ME版段。(F)11. IntheMIPSpipeline,bothreadingandwritingtheregisterfilecanbedoneduringhalfaclockcycleperiod.Inparticularreadingisdoneinthefirsthalfwhilewritingisdoneinthesecondhalf.在MIPS管道,读写寄存器文件可以半个时钟周期期间完成。在上半年完成特定的阅读写作是在下半年完成。(F)12. InTomasulo'salgorithmwithsp
35、eculation,instructionsmaycompleteoutoforder.与投机Tomasulo的算法,说明可能完成的订单。(F)13. Thereorderbufferenablespreciseexceptionsandinterrupts.重新排序缓冲区支持精确的异常和中断。(T)14. Criticalwordfirstreducethecachemisspenalty.关键字首先减少缓存错过点球。(T)15. TheLRU(least-recentlyused)replacementpolicyworksbecauseprogramsexhibittemporalloc
36、ality.LRU(最近最少使用)替代政策工作,因为项目展览时间局部性。(T)16. Adistributedsharedmemory(DSM)multiprocessorusuallyhasnon-uniformmemoryaccess.分布式共享内存(DSM)多处理器通常有非一致内存访问。(T)17. Computerarchitectureisintendtocoverthreeaffectsofhardware,organizationandISA.计算机体系结构是打算覆盖硬件的三个影响,组织和ISA。(T)18. Comparedwithmemory-memoryarchitectu
37、re,register-registerarchitecturehashigherCPI.与memory-memory架构相比,注册登记体系结构具有较高的CPI。(F)19. ForforwardingyouneedonlylookatthedataavailableintheWBStage.转发你只需要看数据在白平衡阶段。(F)20. Datahazardrisewhenaninstructiondependsontheresultsofapreviousinstructioninawaythatisexposedbytheoverlappingofinstructionsinthepipe
38、line.数据风险上升,当一个指令的结果依赖于前一个指令的方式公开的重叠在管道的指令。(T)21. Doublingtheassociativityofacachewithoutchangingitsoverallcapacityorblocksizewillincreasethetagsizebyonebit.翻倍的结合性缓存不改变其整体能力或块大小将增加标签的大小。(T)22. TheMIPSCPUhasaRISCISA.(T)23. CPIisalwaysanumbergreaterthanorequalto1,becauseaninstructioncan'tbeexecute
39、dinlessthanonecycle.CPI总是大于或等于1,因为一个指令不能被执行在不到一个周期。(F)24. Splittingtheshorteststageofafive-stagepipelinewillresultinahigherclockrate.分裂的最短阶段五级管道将导致更高的时钟频率。(F)25. Thereare3typesofpipelinehazards:structure,data,andcontrolhazards.有3种管道危险:结构、数据和控制危害。(T)26. InTomasulo'salgorithmwithspeculation,whenab
40、ranchismispredicted,thedatawrittentomemoryandtheregisterfileasaresultofthatbrancharerolledbacktotheirpreviousvalues.与投机Tomasulo的算法,当一个分支预测错误,数据写入内存和寄存器文件的分支被回滚到之前的值。(T)27. Atwo-bitpredictorperformsbetterthanasinglebitpredictoreveniftheconditionalbranchisexecutedexactlyonce.低廉的预测性能优于单一位预测即使条件分支完全执行一次
41、。(F)28. Adirect-mappedcacheofsizeNhasthesamemissrateasa2-wayset-associativecacheofsizeN/2.direct-mapped缓存大小为N的缺页率具有相同的双向set-associative缓存的大小为N/2。(T)29. ACISCarchitecturehasafixedinstructionlength.CISC体系结构有一个固定白指令长度。(F)30. Splittingtheshorteststageofafive-stagepipelinewillresultinahigherclockrate.分裂的
42、最短阶段五级管道将导致更高的时钟频率。(F)31. Datahazardsarecausedbyhardwareconflict.数据危害是由硬件引起的冲突。(F)32. MergingwriteBufferreducethecachemisspenalty.合并写缓冲减少缓存错过点球。(T)33. CPIisalwaysanumbergreaterthanorequalto1,becauseaninstructioncan'tbeexecutedinlessthanonecycle.CPI总是大于或等于1,因为一个指令不能被执行在不到一个周期。()34. Supposeacondit
43、ionalbranchalternatesbetweentakenandnottakeneverytimeitisexecuted.Aone-bitBHTpredictorislikelytohaveamispredictionrateof100%onthisbranch.假设一个条件分支之间的交替而不是采取每次执行时。一个一比特的二叔丁基对甲酚预测可能会对这个分支的错误预测率为100%(T)35. Registerrenamingeliminatesstallsduetoflow(WAR)dependencesonregisters.寄存器重命名消除摊位由于流(战争)依赖性寄存器。(T)36
44、. Adynamicbranchpredictorisalwaysbetterthanastaticone.一个动态分支预测总是比静态的好。(F)37. Translationlook-asidebuffers(TLBs)arecachesthatholdvirtualaddresstophysicaladdresstranslations.转换后援缓冲区(tlb)缓存,虚拟地址到物理地址的翻译。(T)简答题(红色为A卷试题)1、RISC机器的设计原则答:指令条数少、指令功能简单。确定指令系统时,只选取使用频度很高的指令,在此基础上补充一些最有用的指令(如支持操作系统和高级语言实现的指令);采
45、用简单而又统一的指令格式,并减少寻址方式,指令字长都为32位或64位;指令的执行在单周期内完成(采用流水线技术后);采用load-store结构,即只有load和store指令才能访问存储器,其他指令的操作都是在寄存器之间完成的;大多数指令都采用硬连接逻辑来实现;强调优化编译器的作用,为高级语言程序生成优化的代码;充分利用流水技术来提高性2、MIPS机器五级流水线(哪五级,每级的功能)答:包括:取指令(IF),指令译码/读寄存器(ID),执行/有效地址计算(EX0,存储器访问/分支完成(MEM,写回(WB。取指令(IF):以PC中的值作为地址从存储器中取出一条指令,放入指令寄存器(IR);同时
46、PC值加4,然后放入NPC指令译码/读寄存器(ID):对指令进行译码,并以指令中的rs和rt字段作为地址访问通用寄存器组,把读出的操作数分别放入A和B中。同时IR的低16位进行符号扩展,然后存入Immio在这一级,ALU对在前一级准备好的操作数进行计算。存储器访问/分支完成(MEM:所有指令都要在该级进行更新。除了分支指令,其他指令都是做:PONPC在该级处理的指令只有load、store和分支三种指令;写回(WB:把在前面4级中得到的结果写入通用寄存器组。3、降低Cache命中时间的方法。(任意列出三种,并给出解释)答:降低Cache的命中时间:采用容量小、结构简单的Cache:硬件越简单,
47、速度就越快。应使Cache容量足够小,以便可以与处理器做在同一芯片上,避免因片外访问而增加时间开销。还要保持Cache结构的简单性,例如采用直接映像Cache,优点是可以让标识检测和数据传送同时进行,从而有效减少命中时间;采用虚拟Cache:是指直接用虚拟地址进行访问的Cache,其标识存储器中存放的是虚拟地址,进行地址检测用的也是虚拟地址。虚拟Cache的优点:在命中时不需要地址转换,因而也就省去了地址转换的时间。另外,即使不命中,地址转换和访问Cache也是并行进行的,其速度比物理Cache快很多。采用踪迹Cache:踪迹Cache中存放的是CPU所执行过的动态指令序列,其中包含了由分支预测展开了的指令。该分支预测是否正确需要在取到该指令时进行确认。能够提高指令Cache的空间利用率,避免因分支成功发生跳转处于该块之后的指令用不到,跳转到的块的位置之前的指令用不到浪费空间。4、什么是Cache的一致性,怎样维护Cache的一致性。(MS太MES太监听式协议)答:Cache的一致性:如果允许共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储块的副本的情况,当其中某个处理器对其Cache中的数据进行修改后,就会使得其Cache中的数据与其他Cache
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年核燃料元件及组件合作协议书
- 2025年月桂醇聚醚磷酸钾合作协议书
- 线上线下智慧购物商城合作框架协议
- 供应链金融服务协议及相关风险控制条款说明
- 员工薪资及奖金详细收入证明(6篇)
- 保险服务协议书
- 行政管理本科试题及答案指南
- 个人电脑硬件维修维护服务协议
- 餐厅卫生与服务协议书
- 社区农村环境综合治理合同书
- 2024届小学高届级科学知识科普知识竞赛及答案(题库1)
- 2024官方兽医考试更新题库及答案
- 《义务教育数学课程标准(2022年版)》初中内容解读
- 2024葡萄酒代理合同样本
- 佛吉亚卓越体系知识手册
- 区块链技术与应用学习通超星期末考试答案章节答案2024年
- 《资本论》(德)卡尔·马克思-文字版
- 篮球大单元教学计划
- GB/T 3487-2024乘用车轮辋规格系列
- 大学计算机基础(第6版)(微课版) 课件 第6章 算法与数据结构
- 关于农村人居环境整治考核验收的迎检工作方案-人居环境验收方案
评论
0/150
提交评论