北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器_第1页
北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器_第2页
北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器_第3页
北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器_第4页
北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)目录实验一 WINDLX模拟器安装及使用 错误!未定义书签,实验准备错误!未定义书签,实验环境错误!未定义书签,实验步骤错误!未定义书签c实验内容及要求 错误!未定义书签c.实验过程错误!未定义书签, 实验总结错误!未定义书签c实验二 指令流水线相关性分析错误.!未定义书签。.实验目的错误!未定义书签,实验环境错误!未定义书签,实验步骤错误!未定义书签c.实验过程错误!未定义书签, 实验总结错误!未定义书签c实验三 DLX处理器程序设计 错误!未定义书签,.实验目的错误!未定义书签,实验环境错误!未定义书签,实验步骤错误!未

2、定义书签c.实验过程错误!未定义书签,A. 向量加法代码及性能分析 错误 !未定义书签。B.双精度浮点加法求和代码及结果分析 错误!未定义书签。 实验总结错误!未定义书签c实验四代码优化 错误.!未定义书签。.实验目的错误!未定义书签,实验环境错误!未定义书签,实验原理错误!未定义书签,实验步骤错误!未定义书签c.实验过程错误!未定义书签, 实验总结+实习体会错误!未定义书签c实验五循环展开 错误.!未定义书签。.实验目的错误!未定义书签,实验环境错误!未定义书签,实验原理错误!未定义书签,实验步骤错误!未定义书签c.实验过程错误!未定义书签,矩阵乘程序代码清单及注释说明 错误!未定义书签。相

3、关性分析结果 错误!未定义书签。增加浮点运算部件对性能的影响 错误!未定义书签。增加 forward 部件对性能的影响 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销. 错误!未定义书签。 实验总结+实习体会+课程建议错误!未定义书签,实验一 WINDLX模拟器安装及使用WinDLX模拟器的结构和功能说明1.点击运行之后,会看到一个如下图所示的窗口它包括 Register, Code, Pipeline, Clock Cycle Diagram, Statistics, Breakpo访胺下来 详细介模拟器的结构及各个部件的功能。窗口介绍Rigister窗口中显示的是各个寄存

4、器的名称及内容。如下图:RIe 典na力 皂华mWcr > 虫nfgu111atir堂gs 沧可以看到寄存器中以十六进制标识,从上图可以看出各个寄存器中的内容。=RjcpHlTrFC='owcacic:000000000F0-0F24 =DZMAE =OzoocodoodH9 =OhOOOOC 000Fl-0r 7S-DIR=tlEUULUCJO.£1.口UbOODODODO叱0L'(IxnnUQQQQQKU-nwnnmnnnnciF3*mFZ7-Q占HUdxdoooddddR12-UxUUUQODUUFd-uF2B-DB-0x00000000RL3-0x000

5、00000F”0DEHL =ooooaoaoRigOkOOOOOOOO0F30=DETA=OkOOCOOOOO£15-OsOOOOOOdO打=0F3;l=0oicooaaoaaaRIB-0x00000000E打0DKnTHT-nxrinnQoaniiKI"IIXIIIHIIIUIIIIIIF3-nQfFbk-0x00000000Rl -UrIIIJOIJOOQUFH.*II0(IkUULOl jliuRM-UmUUUUO(JD(JFil->uDSDR-OKOoaaoaaaR2D-0x00000000Fl 2=0DErEBI-OxOOC JZJCZ玄”二00000000

6、0Ell-0DIO-DIX温工OaOOCOC 30:R22=-0x00000000F14 =0D12=DWRHi-nKfinnooQooH?3-nwnninnnnnoF15-noi*-QEO-OKCiooaaaooOnOOOOOOOOF16-0rife-0Rl-UkUUIQL jqoR25-UmUUUUO(JD£iFl?->u111 HaDS?=OKQoaaaaaaR晔nxnnnnnnnnFia=nmn=nS3-cxoocaoooaR2?-000000000F14-0产"'一DR4=oxooaaoaaaR20-0x00000000F20 =0D24 =DR5-

7、OKOQDacaaaR23-QbDDUOUUUUF订*QDN 白1DRfc-oxciooaaoooR3D-OOOIOOOOOOF22-0D2B-DR?-UkUUIQL JQOR31-UxUUUUUULjCF23->uUJU-D窗口介绍在没有进行任何执行的时候,初次打开 code窗口,即为下图所示WINDLXFile Window EjCMJte Memory C&n-figuration C&deCodenST EXT0x00000000nop$te<t与泗OkOOO00000nop$TE<r+%B0x00000000nop$T EXT Ox c0x00000

8、000nop用口J舟d。0x00000000nopSTEXT4a14OwOaOCKOODnop&TEXT*(h18o>oaoooooonop鼾口J短很OmOOOOCOOOnop灯EXT短n200x00000000nop$TEXT+*240x00000000nop窗口现实的信息是各个存储器内同。 第一列标识存储器的地址;第二列是机 器代码,用16进制表示:第三列是汇编指令。当我们点击上方的£券川恒,可以选择单步或多步执行(也可以使用快捷键F7或F8)。若选择单步执行,每按一次 F7,指令执行一次,可以看到,一次执 行的为IF->ID->intEX->ME

9、M->WB没执行一次还有颜色的变化。颜色是用来标识 指令处于哪个流水段的,如下图。阿 Code 一 口打EXTQmOOOOOOOOmop$TEXT+0k4OwOOOOOOOOnapJTEXTtOxfi0x00000000 WBnop$TEXTM归OmOOOQOOOO memnop|$TEXT+OxlOOmOOOOOOOO intEXnap$TEXT*0d40x00000000 ICnop$TEXT*M3OkOOOQOOOQ ifnopSTEXT+OkIcOmOODOOOOO忤叩$TEXT*0x2Ci口刈口口口 m工1nop$TEXT+。立 4OmOOOOOOK口叩当然,我们也可以使用多步

10、执行,按快捷键 F8,选择5步流水,即可。窗口介绍通过I阅读WinDLX模拟器说明书可以知道,Pipeline窗口显示的是DLX处理 器的内部结构。窗口用下图标识 DLX五段流水。当然,如同Code窗口介绍讲述 的那样,不同的颜色显示了指令处于哪段流水线。使用快捷键 F7单步执行,可 以明显的看出,不同时候流水段执行的不同指令。如下图。IFIDi心MEMWBlnlSUgp;laddEMIE 乂fdivEX图片反映的正式与Code中所处的时刻相同的指令流水。可以清晰看到不同 流水段执行的是哪条指令。Cycle Diagram® 口实验准备中我们已经知道,该窗口显示的是流水线的时空图。

11、时空图反映的 是不同时隙内的运行情况。如下图。I ristinjctions / Cyctesnopnopnopnopnopnopnop右 I,5口在我看来,时空图是最好理解的。因为它反映的就是流水段的并行程度。 在 这个DLX模拟器中,并不存在一些数据或者控制上的冲突问题。 所以可以依靠上 图很清晰的看到指令所处的不同流水段, 及指令执行情况。该时空图同样也是和 前面的Code等相对应。也可以通过快捷键F7来进一步执行指令,可以看到流水 线时空图的扩展情况。任意双击指令的一行,可以详细看到不同流水段的情况。如下图所示。Information about nopnopIFIDAdr - $TE

12、XT Code- OmOOOOODOOT ernnaled successfiJIyFirst Cycle;Lst 3G底 2T otal Cycles: 5Cycle5; -6(1Ternninated successfullyIMAflx-PC -tTEXT)IR<-M&mIMAR =0x00000000) 尸口 后匚M (=1TEXT*0x4)No Stalk lecfuired.Sde 矶-51 jT erminated fiuccessfiujA<R0 =0nO)Mo S tails requiiedintEXMEMWBChicles: 4(1 T ermriaU

13、d $uccES?fuWALU<<0 -Orf) No Stails required. No Forwarding.Cvclec: -3(1)T ernninated successfullyNothing to do.No St alb lecfuiredS* 次 2(1)Terminated $ucces4u"R0<4LU (-0s0No Stm临 required.窗口介绍该窗口是对运行程序中的数据进行分析。主要包括模拟器中硬件配置情况, 在该窗口中,我们可以比较不同配置对于该模拟器的不同影响。如下图所示。 1)整体指令执行情况Total:ID eraxte

14、d bp 6 ln£truction(5.51 nil ruction(s) current y in Pipeline.2) 硬件配置情况Hardware: i5uraLt.LBii :Memory size: 32768 EytesfaddEX*Siages: 1, required 匚如Ie< 2fmulE乂-,加口££: 1eciu住d 匚ycler 5fdvE-Stages:. 1, required Cycles: 19Forv«rding enabled.3) 暂停次数和百分比及原因分析Stalls:RAW sials: 0 U.OO

15、Si of all Cycles), thereat LD stalls:: 0 (QOO of RAW stalls) Branch/Juinp stalls: 0 (O.OQ of RAW Floating point stalls; 0 (0100% of RAW wtdsjWAV/ 就ak: 0 (0.00 W dl Cycles tructital stalls:叫Ol(K嵬 tA all CjJdes Control stalls: 0。口喷出 all Cycles Trap slak 0 (0l00 of all CajcIcs) Total: 0 Std(f)(0.D0 of

16、dl Cycles)4)分支次数和百分比CandLlional Branches :Totafc 0 0,00 Mal iHttiucfom), tlwMh taker: Li (I. UL ; uh all ccid Ercke; not Uken: 0(0,DO': of al oond Branchs5) Load/Store指令执行情况Load-/Store-Instrueticns:Total: 0 (0.00: of 411 Irtebuctions, thereof Loads: QOLOO ol Load /Stoie-lnswuctioriijStores: 0(0

17、00% o(Load-/5tore-Iristructions;6)浮点指令执行次数和百分比Floating point stage instructions.lotil: 01005; ol al Instrucuohs, thereaf:Addibon: 0 (0.005S M Floating point stage irsl)Multiplications: 0 (OL OOSS of Floating point 守irt&t.JDivisions: 0 (J, 0(J>c of Flo白ling point 总加第 insL7) trap发生的次数和百分比Traps:

18、T raps: 0 (O.OOX of all Instruct ions)窗口介绍该窗口使用来观察代码运行情况。先打开Breakpoints窗口,点击窗口上方的配乐向他1来设置breakpoint,也就是设置指令运行到流水线的哪个阶段程勋 停止执行。如上图,如果选择EX阶段,在Code窗口中相应的行会出现BEX即指令执行到译码结束执行开始的时候,程序将中止。实验总结通过本次试验,由于是第一次接触DLX模拟器,该试验能够帮助我对这个模 拟器大致的功能及使用做个大致的了解。对于日后的实验打下好的基础。我觉得 WinDLX 模拟器小而精悍,它有不同颜色的标记, 不同寄存器及存储器的反映。 通过使用

19、它, 可以对 5 步流水的过程及不同阶段很清楚明白的看到。也可以看到不同指令分析走到了哪一步,到了哪一步流水段。实验二指令流水线相关性分析实验目的通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。实验环境Windows XP操作系统WinDLX模拟器实验步骤1 .观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令 组合。2 .考察增加浮点运算部件对性能的影响。3 .考察增加forward部件对性能的影响。4 .观察转移指令在转移成功和转移不成功时候的流水线开销。1.观察

20、程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组八 口。1)数据相关如下图所示,在Clock Cycle Diagram® 口所想是的时空图中和 Pipeline窗口中 的流图中,第一次出现了 R-Stalb接下来可以点击上图中的橘色窗口,则屏幕显示lbu r3,0X0(r2)要在WB周期写回r3中的数据;而下一条指令seqi r5,r3,0x a要在intEX周期中读取r3中的数据。上述过程发生了 WR冲突,即写读相关。为了避免此类冲突,seq r5,r4,0x a的intEX指令延迟了一个周期进行。由此,相关指令为:input L&op0x90430000

21、Erl吧国.0x00000179OxEaGSOOOa MEM$eqi(5/32)控制相关CkxlcCycle Diagram;第二条命令处于intEX段;第三条指令出于aborted状态;第四条命令处于IF段。原因分析:jal InputUnsigned是无条件分支指令,但当第三个周期开始的时候, 也就是jal这条指令被译码后才知道。此时,movi2fp已经执行,且将要执行的下 一条命令在另外一个地址处,所以这条指令不会执行,这个时候就会发生控制相 关。由此,发生控制相关的指令为:BBItTEXr0x20011000 intEXaddirl MOkIOOOmoin+CMOhOcOOOOSc I

22、Dial InputlUnsignedmain+0x8000205035 IFmowi2fp f1 Ojl000001440xacQ21094 IF" SdveFl2(rO)j23)结构相关首先,我们先来看一下执行过控制相关的时空图和Pipeline,如下图。如下图:当我们点击Pipeline中IF所对应的框框可以看到详细的该指令执行情况,pelIFCycles: -2(3)In PipelineIMARPC (=riput.Loop+0Kl3)IRMenflMAA (-Om2042QOD1 )PC<-FC+4 (=ir-ifnjt.Loop-»Clx1c)2 Sta

23、lls because 2 stiuotural Hazard!上图表明了 addi r2,r2,0xi的详细信息。该指令与它前一条指令add Uj1,r3发生 了结构相关。并且由于此处的冲突,需要暂停 2个周期。在ID段暂停后,则开 始进图intEX段。所以这条指令(addi r2,r2,0x1)你不能进入ID流水段,译码 部分占用,发生了结构相关。该部分的指令为:0x000001 周0x00230830addiUTrlOmODOOO! 8c0w20120001addi(2j2J0m12.考察增加浮点运算部件对性能的影响。该实验取N=6首先通过-onfigurotiori,点击 Floati

24、ng Point Stage Configuration 来设置浮点运算部件的配置。由于实验手册上面要求Delay=4,所以我们将Delay这一栏改成4,而Count可以任意,为了对比,我们第一次浮点运算部件取全部为2,第二次浮点运算部件取全部为3。如下图所示:1 Floating Point StaQC ConhqurationFloating Point Stg 史 Configur3tnnaCount:De国Lount:Delay:Addition Units:Mdtiplication Un<£Division Urih:24Addition Urih;Multipli

25、cation Uriih:Division Unils:342432r j+N umber of Ur<s in each 流吸 1 <= M <= 8, Delay (Dock C/cl&s: 1 <= N <= 50WARNIN G: 1 fyou charige the values, the p1口ce/ will be (sset 3utcnn日tic帆Numtef of Units in each ass: 1 <= M <> 8,Dely (Dock Cyclesl: 1 <= N <= 50WARNING: I

26、f you chanoe the values, the processor will be reset autumaticalp!| _ "Cancel"lCancel运行50个cycles之后,可以看到他们数据的对比:StatKtksTotal:50 Cpcleh) ewecuted.ID eneci*E(i bv 32 Inslructicri(s).4 In£huctiort) Current in Pipeline.Hardware con f i gtir己 t i on:Merrioty size: 327GS BytesfaddEX-Stages:

27、 3, required Cycles: 4fmulEM-Stages:二,required Cydes; 4FdivEX-Stages: 9, required Cities: 4Forwarding enabledStalls:RAW stals: 9 (13.00 of all C/cles, thereof:LD stalls: 2 (22.22加 of FLAW stals)Bianch/Jimnp stalls: 1 (22.2丝 d 山M 城北Floabng point stalls: 5 (55.5B. :. of RAW stallsWAW stalls: 0 (OlOO o

28、f all Cycles)Structural 0 (0.00 of all Cycles:)Control stalls; 4 (8.0D 口f all Cycles)Trap stalls: G 0 2.00% of all CyclesTdtai; 19 Stall*38l口口影 oFall Cycles)Cor»di tional Branches ):Total: 2 6.25翼 of al InstBuctionsjL thereof:takeri: 1 5D.OQ qF all co nd, Br*ch 州)not t-aken: 1 (50.00 of al comd

29、 BlanchesLoad-5 tore - L ns t rue t i ons:Total: 11 (34.3S?; 口f al Instructions, tliereof:Loads: 6154 5唳 of Load /Store-lnstiudionsS tores; 5 (45,45 of Laad-/Store-lnstmetions)Fl口确ting point stsge instruct ions:Tefal: 1 912, of al InitrucriansjL thereof-OdKom: 0 (0.00 of FloatinQ point stage rist.)M

30、 曲曲atio 幅 1 tIOQ(舲 of Hoa$g pant 辛 tag hst)Divisions: 0 (V,00篇 of Floabng point skg Traps;Traps: 2 (,25 of alllnsliuctions)ElTotal:50 Ci*cle(s) executed.ID executed 助 32 Instruction(s).4 lnstiuclioris| currently in Pipeline.HardvacTB con f igura t i on:Memory size: 327G8 RylesfaddEX-Stages: 2t lequi

31、red Chicles: 4fmjIE-S tages: required Cycles: 4Fdr.'E<-& tages:: 2. required Cycles: 4Foiwcirdrig enabled.Gtail Ls :RAW stalls: 9 (18,00% of8口clesL thereof- LD 虱#2(22.22 与。f RAW 港均 BisnchZJunnD stals: 2 (22 22" of RAW 盘mlk Floating point stalls; 555.56芯 of RAW stalls)WAV stalls 0(0.0

32、0 of ll Cycles)Gtudural stalf 叫口 圜胃 of al Cclei)Control stab: 4 (U00落 of all CjFclesJTrgp 箱Ik; 6(12-00 q1 M CgI&sTotatl 9 Sia* (38,00,of al CyclesCcnditional Eranches);Total 2 (6.253; of al In&budionsL thereof- taker; 1 皿口叫 of all cond. Benches not kkan: 1 50.00 oF dl cond BranchesLoaid-/i t

33、n ore- Inst rue t i oqs :Total; 11 (34.39 of al InsliucHon礼 thereof: Loads: E55WX oF Loack/Slore lnsbuctiari Stores 5(45 45落 of Load'/Stoie-lnsiructionsFloating point stgs instractions:Taiak 1 (3.12% of al HbuctionsL theraaf:4ddstion黎 0 (0.00S» of Roahng point stage instjMulti pl cations: 1

34、 (100.00 of Flowing point stage m$L division5: 0 (O.CO of Fb成 iryg point stage ins I)由此可见,浮点运算部件的增减对效率无影响。 比较各个数据,发现没有变化。无论怎么增加浮点运算部件,统计结果都一样原因在于此程序中浮点计算指令没有重叠,所以并行度没有增加,性能没有提高Corifigurabon中勾选 enable3.考察增加forward部件对性能的影响。为了对比有无 forward部件的性能。需要在forwarding,以及不勾选enable configuration来看性能数据的对比。不使用forward

35、部件:5tatKtic&可Total:50 匚必出eneeuted.ID execiMed 加 27 In由uction闺.4 Instrucliort(s) current in Pipeline.Hardware configuration:Meffioiy siift: 22760 BytesKaddEX-Stage X requir&d Celei! 4fmulEX-Slages: 3_ required Cycles: 4FdivEX-Slages: 3, requued Cycles: 4Forwaiding disabledStalls:RAW stalls: 1

36、3(2S.OO of all 匚gleNWAW stalls 0 (0.00 of all 口desStructural stalls: Q 0,00 0f HI CyclesControl stab: 3 (6.00% of 1alsdiesTrap sials: 6(12.00 of all CycledTold: 22 Sld(> 4400 of all Cycles使用forward部件:statKtksTotal;50匚州他阂eMUtedID fiKecited 皿骁 lmtnjdtionx.41rl苕truGli口n(宇j current in P pdire.Hardwar

37、e con£iguration:Memory dze:颦7战 GytesFaddEX-Stages:工 reqiirecl Cycles: 4fmul EX-Stag esc 3, requred Cletes: 4 fdivEX-Stages: 3, reqiied Cj»cIesc 4 Forwarding enabled.Stalls:RAW s:tals: 9 (IS CO笈 of all Cycles, thereof: LD 羽怆 2 22.22% of FLAW 咐 rl=irrh ' Ii.f干,引卜 . . . c F :'ah| Floa

38、ting point stalls: 5|55,5G笈 of FEAW 整wlkWAWstJs: 0(0.00 of al CyclesStructural 00.00 of all 加les)CoMid 节后隔 4 (8QQ% d Nl CaIs)Trap Walk: £ 12Q口室 of all Cj)des|Total; ISStallkl 阳 口咦 甘刮 Cycles从上面的数据我们可以看出增加forwardi部件后RAW由原来占总时钟周期 的26%减少至18%, RAW个数由原来的13减少至9。增加forward部件使得控 制相关比例增加了。即,使用forward部件后,总

39、的时钟周期减少,数据相关减 少,流水线的性能得到一定的改善。3.观察转移指令在转移成功和转移不成功时候的流水线开销。我们假设,浮点部件设置Count=3, Delay=4;N=6执行完毕后,查看条件转移分支,如下图所示:Ccndttional Branches):T 晅I: El 12.12Z of all InstrLJctions),. frieieof:taken: 2 (25.00 of all ccnd. Brarches not token: G 冯0咤 of dcond BrandvM由上图可知,转移指令一共8条,成功转移2条(占25%),不成功为6条c 所以,静态指令调度算法只

40、能解决数据相关,条件转移结果与原来相比没有变化。 即,若转移不成功,对流水线的执行无影响,流水线的吞吐率和效率没有降低; 若转移成功,则要废弃预先读入的指令,重新从转移成功处读入指令,执行效率 会下降。 实验总结本次试验中,主要遇见一个问题,就是在当初文件加载时没有成功, 后来通 过查询资料和自己的尝试,发现,在选择文件的顺序很关键,它决定了文件在存 储器中出现的顺序。本次实验,主要通过对于三中相关的观察,分析出现相关时的指令,分析浮 点运算部件和forward部件对性能的影响,观察转移指令在转移成功和不成功时 的流水线开销,这些实验一步一步,通过 WinDLX形象生动的表示,使我在实践 中更

41、加深入的认识了流水线。实验三DLX处理器程序设计 实验目的学习使用DLX汇编语言编程,进一步分析相关现象 实验过程A.向量加法代码及性能分析首先给据题目要求,需要熟练掌握DLX编程语言,然后根据规范格式编写向量的 代码。1)向量声明VectorLength: .word 16 ord 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 ord 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16Result: .space 4DLXStandardl/OL 一郎,二Vector - 2.000000 4.000000 6.000000 8 00

42、0000 107000000 12.000000 14.009000 16.0( 0000 18.000000 20.000000 22.000000 24 000000 26.000000 28.000000 3O.OO9OOO 32.0( 0000StatisticsTotal:283 Cycle($) executed.ID executed by 181 ln$Uuc»ion(s).2 Instiuction(s) currendy in Pipeline.Hardwaire conf iguration:Memory size: 32768 BytesfaddEX-Stag

43、es: 1z required Cycles: 2fmulEX-Stages: 1, required Cpcl&§: 5fdivEX-Stages: 1z required Cycles: 19Forwarding enabled.Stalls:RAW stalls: 32(11.31 oF all Cycles), thereof:LD stalls: 0 (0.00% of RAW stalls)Branch/Jump stalls: 16 (50.00% of RAW stals)Floating point stalls: 16 (50.00X of RAW sta

44、ls)WAW stalls: 0 (0.00% of al Cycles)Structural stalls: 0 (0.00 of all Cycles)Control $UII5; 15(5.30 of all Cycles)Trap stalls: 54 (19.08% of all Cycles)Totat 101 Stall(s) (35 70/ of all Cycles)Conditiona1 Branches):Totat 16 (884% of al InstructionsL thereof: taken: 15 (9375Z of all cond. Branches)

45、not taken: 1 (6.25% of all cond B ranches)Load-S t- ore- Inst rue t ions:Toa 49 (270笈 of all I nstructionsL thereof: Loads: 33 (67 35力 of Load-/Store-lnstructions) Stores: 16(32 G5 of Load-/S lore-1 n struc lions JFloating point stage instructions:Totat 16 (8.84 of all InstructionsK Ihereof:Addition

46、s: 16 (100.00 of Floating point stage inst) Multiplications: 0 (0 00 of Floating point stage instJ Divisions: 0 (0 0(K of Floating point stage inst JTraps:Trap5: 18 (9.94 of all Instructions:)RAW stalls: 32 (11.31 % of all Cpc Ie sb thereof:addi(14j0,0x1098trap 0x5IF IT-StallI ID I ntEX 1 MEM I WB I

47、Information about trap 0x5trap 0x5IFIDAdr: Fini$h*0x8Code: 0x44000005T erminaled successfullyFirst Cycle: -12Last Cycle; -5T otal Cycles: 8Cycles: 12Iernninated successfullyIMARuPC 卜Finish十。xS) IR<-MemIMAR (=0x44000005)PC<-PC*4 (=Finish*0xc)3 Slalljs) because ofT rap-Pipeline-Clearing!Cycles:

48、-8(1 Terminated successfullySystem cal executedNo Stalls EXMEMWBCjictes: -7(1)T erminated successfully Nothing to do.No Stalls requiredNo Forwarding.Cycles: -6(1)I ernninated successfullyNothing to do.No Stalls required.Cycles: -5(1) Terminated successfullyNothing to do.No Stalls require

49、d.rok il口1 ITot R 1. :283 Cyclc(s) executed.ID executed by 181 ln$ULcdon(s).2 Instruction(s) eurrentlp in Pipeline.Hardware conf iqurat ion:Mmcry si7pRytifoddEX-Stoges: 1Z required Cycles: 2fmulEX-Stages: 1 z required Cycles: 5 fdivEX-SfagM! 1, rquird 19 roewording ctioblcd.StalIs:RAW stolk: 32 (11.

50、31% o: all Cycl«)z thereof: LU stalls: U.UUN of HAW stalls!RrAnrh/Jump dk,1R (SU (ID幺 of RAW ctMc) riooting point otolls: 16 (50.00 of RAW “口 1$)WAW stalk: 0 1U.UU% of all Cycles)Structural talh: 0 0 CIO幺 erf all Cycles)Cui itr ul slolls 1 5 (5.3OS5 c/ all CyczleJ Trap scans: 34(13.06 or an cyc

51、les) TotAb 101 Stall(t) C35 70X of all 加“)Conditional Branches):Total: 1 (9.94?J of al Iwlructions) therTOf: taken. 15 (33.75% ul oil gnd. Diancl ieJ not taken: 1 (5.25zJ Ct all cond. BranchesLootd-toreIns txue t ions :I otal: 48 (2/. U/N of all ln$t(uction5|z thereof: Load: 23 (67.35 of Load-/Stor&

52、#169;-Inchaction®) S(o<cs. 1C (32.G5力 of Luad-/Stoio-I nstruclion)FLoait i.ng point 三tage in©t ruot xonu : ToloL 1G (8.04 of al InlrucGons) Ihcicof.Additions: lb(lUU.UUN ol hloatma point stage msl) MultipScdtion: 0 0.00% of Floating point Mag inctj Divisions: 010.00% of Floating point s

53、lcg。in* JTrap©:Trops. 1。(9.94zi o( oil In5Uuction5JControl stalls: 15(5.30 of all Cycles)Statistics-HlTotal:381 Cycle(s) executed.ID executed by 181 Insbuctionfsl2 Instiuction(s) current in Pipeline.Hardware conf iguration;M emery size: 32768 BytesfaddE><-Stages: 1 z required Cycles: 2fmu

54、IEX-Stages; 1, required Cycles; 5 fd iv EX-S tag e§: 1 requir ed Cycles: 19 Forwading disabled.Stalls:RAW stalls: 130 (34.12% of all Cycles)WAW stalls: 0 (0.00 of all Cycles)Structural stalls: 0 (0.00 of all Cycles)Control stalls; 15 ©.94% of all Cycles)Trap rfalk: 54(14.17 of all Cycle*)Total: 199 Stall(S) (52,23Z of al Cycles)Conditiona1 Branches):Total: 16(8 84 of all InstructionsL thereof: taken: 15 (93.75务 of all cond. Branches) not taken: 1 (6.25X of all cond. Branches)Load-/S t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论