基于windlx模拟器的流水线分析实验报告_第1页
基于windlx模拟器的流水线分析实验报告_第2页
基于windlx模拟器的流水线分析实验报告_第3页
基于windlx模拟器的流水线分析实验报告_第4页
基于windlx模拟器的流水线分析实验报告_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于windlx模拟器的流水线分析(做实验前请先认真阅读WinDLX教程)1 .用WinDLX模拟器执行下列三个程序(按照10位学号除3的余数选择):求阶乘程序fact.s(余数为0)求最大公约数程序gcm.s(余数为1)求素数程序prim.s(余数为2)我的学号为2010011147所以我用的函数是:gcm.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察CPU中寄存器和存储器的内容。步进: tod>XXCEl 正ftttnhc:igariLMp'"-IMtiiUllZ-JbwLi-M.i)lJ(ii *eLm*HwJ HkiL-Mitw

2、i.ni KtYTlLl工田用 Hrtft'#jH-tlLrlRHii-h=:hap MRpdhXCM 4am0iKpCwluOUOIS 44出d021 :» IFVXOHI4Eacni “tM E&击如中3Mxanib三时湖1山国 CbckCipgrmFC-axooaoDi4:=M-OxDOaODDQORl-dEDQOODDOOF01HA5-UxDUO:D144R1-UxDOQODOO:K17-OxDOOODOO:iFl-1R-UiacOflU9CHi-IJIUIJU:-UU(1Ofrl3-UiUUUDUUUO时-A-odooutioocn:j-Oxtio4cDoa

3、affl加1000 )000F:JAHE-ifnifl-firiiirRi-nxnnfljrtfim:科。'.xiiftiiJfum:F4E-M1 口口口口口口口EE-i.sriflii: a fi fi:R2L-Lstllflu : 口口。:FE-EHI-口离。口口口口口十二Eh-acMUMU 口。E22-QxDaaoDQaoF6-ETA.-口工口。口口E7-KlxDOaODDaO即KaDaacDoaoF7-ALlf000000108E3 =axOnQODOQQcjeDaaDDoaa"Airai-ijxooaciDnocE?'QlDnQODDQGR2S-QlDnQO

4、DOQF?-FFE-QlDOOODUQQfilQ-QxDOQODOO:axDQQODOO:no-L:MA-UlUlJiJCitilJiJCHll-UIUIJIIJUIJII.由UIUUU3UUU0FIL-i:ii:ii:ii:i i:ii:ii:i'R12-i:ihi:ii:ii:i i:ii:ii:iR2S-igmu 'i:ii:n:iFR-sr:fi!HT-QKonnoooncRU-iixnnfljftfiiii:瞪加'iiiHiJfiinrFl”LLfi-I:x000:000:Et.4-Cxoonzoon:R30-Cxooczaon:F1.4-LreHi-OxDo

5、aobnaoE5dxDOdODOa«R3L-axOCiaoQoaoF.LS-展mgkbvrInrkLBdmx.'1 由&工MUilJOAdOdOKflnp/jUnMgrKd 4#r2njfl m 型金连续:IWKKOJ144 tMD0nJ14S MENn MMMOi 处 MUYn 力 ildJXQMBE LbdXDOWISc (unou>ia> Q49OHT164 MKOJie-iMEna=c i= DWD71 旧 Dta.KdAIlM X国Ofc U3晖 :h2C(WI 脸Dk2ataia»MDDZ1 值PiwrfMjtVI JWiHbWpR占

6、 加跣 WQn3 MdnZAMIimi陨 Owfc Cycle DiAgrjmePtH03中1Mi耀jDAI除也 tMtlHI-W工I iF | BtcrWI IF 曲III f I I。1 ID -|FT3M,1U mzllHI- FT心 .LWC- QsiO 口 QW1M HAG- 090000144l:IXflCl:l2L(ir10 nnflflDnnn 口髯口口口山二口口 口 OKODDflCDDO DxODDOODaa DHODDOODnO QsODD口口口口口.LUHJFzODMODQQFfcl?" OxOOOQDOOOED-OlODUOODDQE16-niDDQQODO

7、nin-QflG01no-El-0»?yuuouu7El'.'-UlDOUUDUUiJFlUFl?"Q02-Ri'-。莒川叩叩4RlU-口工山口口 3如F2-i:iF19-aH-S3-1 1:R"口Z 加T3-ilF11-口Dh-口货二 口 口口 加口口门口0x3D0a:iD0QT4-Fja-cDfi-BE-OxODQOODaaE21-axDouaoDoaTE-fJL-aDIO-3!的axDDaaoDDoEZJbOxDODODDOiF幻Q122-aEi2»即与CIs3UOaODDtlK23«oxDoaocDoaT7-口F

8、ZJ-aD14»止OKDDOaODOOEZ4-ClKDDOaDDOaF0»FE4aDlh-呀OxOUUOODClUeSS-gDMCi 口叫门.n125aUIS-filO-oxoaoQooooA26-OxDOOOOOOOflD-0f26-0D2Q»-IEii , ia, q . *T , 1 M 1,一,设置断点: Code(Mn»:44 IMO1MTE iMlWlr MUJlt- EO (Mn»'N cwmutw而幽,式 百即勺 MoonrifflOaWJIOW 口也网旧 iWMIfl*QOIHK MWI败E)D bdiUmji 晨MI

9、O» IF thUTOKG 巾EJZIED S-irfiZITuEpaNUlMg m JivfRq 也再加iJ Fir4 P占 I 灯Lil .如,攸IJCl段±J _l.sdttrZjOJMDOTrKOonaoiti p hsoooaeitoQkSOQhIDBDDJiOOdOODDO -RhDOQOODOOhUim " Mi。 -M由也仙好 ,口上口口也。口口 口 旧口口口打口的 IHhMMMQQ fi- M口口口口 :>口口口DjfQnoaoDon3J1F- KkQQQI。口 M SDRHQM”QQQ LDE- :>KDDflaODDO LDRfl

10、I-DJtDQaaODDO-ipi 1EO-UEODDDnQBDR16'DhOQODDOQOFD-0F16-0B0-0PL-i)m-JOOOOO':iiHl”(ixim 110000KJ-llfl J-.Di-0R2-axODDOODMEOxOOZDDDOQF2-DFL3-口D4-aR2 =nDDQOoatiE19-OmOQ4DDODOCiFL9-:1即aPi-nxCDDDOQODR20-DiQQDunnn74-°F2O-DDR-0Xi)M:jOOOOO.:ri(!;'!"(unn nooooF5-llFHDio-0E22-OxOOZDDOaOFt,

11、-ClF22-DaR7 =a:>DDoaaoDE2 3b0M0d4DD000ClF2 3«:1114«aR="rUDDOnoqcpRZ4-DiaQODDDOnFP-0F2H-3Dlt-a小0:)0 oriiiiiM!H?5-(iMi'iii.riOOiiiiF虹HFK-D16-oRLD-口 工:口口口口口口口E26-0xOa:DDOOOFnfi-F2£-口上0aBL1*ai:iDDoaooDE27bDMOdOiDDOOOCiF2 ”:lD22«aRLE-Qm 口 MQQMHE8QMQQ 口 MQQF3E-口F25-:口“,aKU-

12、iixjrifnwflcn都牛fixnii-nrinftfiFl 3-IIF».iiKU-axODDOiatEE3Q-Dxaa:DDoaaFM-DF3O-D口於aELE>QxDDDDDQODfill!DNOOODD114F15»0FJS'0口加.LJQJClMfcCydd Di 妁 iIZ用 IHOEH £eA力。V2IF I IDdw ErvRlinLrtMMwi mpU FmlPviarlI IF | iD曲门*10阳网atpiltSImtou'dwdid gasID Wrz即碉MJID iOiinftI MOMJIfc2 FrahJ f

13、MOUnH注意:gcm.s中调用了input.s中的输入子程序。load程序时,要两个程序一起装入(都select后再点击load)。fact.s也是如此。在报告中:1.1 简单阐述程序的作用和运行原理作用:用WinDLX模拟器执行求最大公约数程序运行原理:这个程序说明浮点指令的使用。该程序从标准输入读入两个个整数,求其最大公约数,然后将结果存放在R2寄存器中。该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。1.2 跟踪CPU中寄存器和存储器内容,把造成其内容发生变化的指令、操作涵义、变化情况(以截图体现)体现出来口 Cod.岫皿i侬 liGWii3Oi2M82iMX0H

14、I13D:M(blh>h«jgem烟“心Ml必如班仁40£&«P»KlnLWD aii ri.jij2际师 FrrtV*H 叩 IMttrU.rf:l.l>1(Hl?c- ftxQQQOQKe IHAR-ir-匚际口 EimA-ftlMMQQMn fi n fi fiB-藤> 口口口口口口口Rg,*Ci,率前IMOMHUm:O2l啊:Fiu S5-S3H 12面口赖"10切iwulUhmi:踪四Y毋帆Hy|EH J CsDDDDDOCia ETA- azDDDOOOOO AUJ ,QQMQQQ0 ALUH-:z>

15、DDQOOOa FPER C£DDDDDOaO CHAR' aiDDOOOOOQ 5Dfr- gQQQQQQQQ ELRHI-:xDDDDOOOa IB?* CDDDDDDaO IDRHE-tiDDDUDUnO口e口口口口口口口n血&-北口口口口口仲口。PC-DEDDoaaao?337-n»fldaac:DD>Fl-0100010000 43&»OMnaaaaoDDF2*DnQQQQQQQLE?"口则叫叫二口口F3-nicnnnoooac史冲mm的mF<-口疝口的口口口口3?1-3 口口口口二 MFE-DjfDOODQ

16、Oaa融2slOMoaaaaoDDF6-dKOOOOOOQQSZ3-OMUonac:DDF7-iiKftnnnnnnc口.4仙间的一:山FHDKDDoaoaaa3侬也肌二二MF9-DjiDoonaaaaOMQQaaQZ'DDF10-DkOOOOUOQOS27-UHonaaiioDDFil-iiKiniiiiniriii':史Mll«lHlll«!.:"l!n;-DKoooQoaaa3?Ei-Oxoaac:DF13-DJtD000ia29330*oaaaaQDDDFJ4-口仙口口皿皿口E31-UuMMUF15-Hrl 日?fl 12 3 1-5 6

17、769 Q 1I i T- 132177-上12221F F F F F E F F F E E F F F F F OD D QQ0口 D-o-Q D DOD D n-J!。工,* 尊 QIB-J4EW。 .J J 4 .4> L IL IL lb L J 24 J J 1- 口口口|>万 D D DDD D 口&口 口 D! o o Q -Qfl-Q Q Q 口- o Q Q Q 小巾。IpflgETD CjHlE "PvtiV&MlQLH 呵1*1嵬 tdfifrSlRwiJ xpl l3,jI 怙 FW&rfWImpM y M *5(fla

18、orfZ2SJWBl-JnITdL«L5gx则p tf 3B h;hx>x+L IrairjchxEla-iiiHnlv11 Fpetoi!Haxdwu-a 81rlEigwma w«e普kh K一 町t«1. iMMd Cichi- ;!ME?:£Iaii i iwt- khEX巧图4kLi匚加 J?F owning- ini <.=1BluLLx映UW II咫中后LPU曲12口双小阳间由善1h-jncti'nc: l:n /1ftVAr4Wr. .: - n=方 / J * m-_ 壮八 r 士.E.l2、用WinDLX运行程序s

19、tructure_d.s,通过模拟:找出存在结构相关的指令对以及导致结构相关的部件;记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的百分比;论述结构相关对CPU性能的影响,讨论解决结构相关的方法。在报告中:2.1 分析并找出全部结构相关的指令、原因、流水线停顿截图、停顿时钟周期数(循环的只写一轮)adddI2J0724ddir2.i2.Qx8addic31130Kstelb乱叫2Addir2,r2,0x8;addir3,r3,0x8;subr5,r4,r2这三条指令和adddf2,f0,f2存在结构相关,其中addir2,r2,0x8这条指令停顿2个时钟周期,其余都停顿1

20、个时钟周期。2.2 分析并找出导致结构相关的部件答:存储数据和指令的存储部件。2.3 记录由结构相关引起的暂停时钟周期数、总执行周期数、计算暂停时钟周期数占总执行周期数的百分比Statistics|口|X|Total:139Cycle$)CKecuted.IDexecutedby06Instruction,).2Instfuctiori(s)curteritlinPipeline.Hardwareconfiguration:Memorysize:32768Bybe喜(addEX-SUges:1.requiredCycles:2ffmulEXStages:1,requiredCjcle工5tdi

21、vEX-Stages:1,requiredCycles:13Forttardingenabled.StalIs:RAWstalls:30(21.59ofallCycles),thereof:LD31。(33酰ofRAWstalsBranch/Jumpstols:10(3133ofRAWMils)Floatingpointstalls:10(3333ofRAWstalls)WAWstalls口口0防cfall日刊Structuralsials:0«.00®IofallCyclesControl9(6.47ofallCycles)Trapstalls:3(216NofellCy

22、clesTotal.42SlB<s)(3a22£ofallCyclesConditionalBranches):Total:10(11.63ofallInstruction£Lthereoftaken:9(9d口口望ofallcond.Branches)nottaken:1(10.00ofallcondFranchesLoad-ZStore-Instructions:Totd:202126常ofalInstiuclionsLthereohLoads:20100.00ofLoad-/Store-1nstructions)Ti由结构相关引起的暂停周期数为:30总执行周期数

23、为:139暂停周期数占总执行周期数的百分比:21.58%2.4论述结构相关对CPU性能的影响,讨论解决结构相关的方法答:结构相关使相关指令在流水线上停滞,降低了执行效率。解决方法:在合理的指令调度范围内,尽量避免执行重复的指令。尽量避免同一寄存器的频繁使用,若无法避免,则使用寄存器的换名方法。3在不采用定向技术的情况下(去掉Configuration菜单中EnableForwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。在报告中:3.1分析并写出全部数据相关的指令、原因

24、、流水线停顿截图、停顿时钟周期数(循环的只写一轮)加1,0刈oddr1j113先读后写r1,addr1,r1,r3停顿2个时钟周期。RSM|Wl:掌一一:IF|RSM|IDrMEM|WE先写后读r1,停顿2个时钟周期。addi151100K3先读后写r5,停顿2个时钟周期。addiiZjZMd$ubi4.r3r12先写后读r2,停顿2个时钟周期。subr413j2:bn&zr4JoDp先写后读r4,停顿2个时钟周期。|MEM|V/BIFIIDImER|MEM|WE|IFR-5|ID西|MEH|WBIFR,£EI|巾”-EMI3.2数据相关引起的暂停时钟周期总数、数占总执行周期

25、数的百分比程序执行的总时钟周期数、计算暂停时钟周期Statistics|口xTotal:202Cycle$)eMeoutedIDexecute>dby85Instrudionls).2Insfructianfs)currentlyinPipeline.Hardwarecontiguration:Memorysize:32768BytesfaddEX-Stages:LrequiredCycles:2JmulEX-Stages:1,requiredCycles:5fdivEX-St*gesi1,requiredCycles:19Forwardingdisabled.StalIs:RAW就自依

26、:104(5148S:ofallCycles)WAWMils:0(0.00ofallCycles)Structural$tals:0(0.00ofallCycles)Controlstells:9(4.4B5SofallCyclesTr叩幅Ik:3148笈ofallCycles)Totd:116SlaK>)(57.42%titallCycles)ConditionalBranches):Total:10(11762ofallInstructions,thereoftaken:9(90.00ofallcondEranchesrottaken:1(10.00ofallcond.Branche

27、s)Load-/Store-1nstruetions:T匕I:30(3529ofallInstructions),thereof:Loads:20(66dLoadZStoreInstructions)Stores:10(33.33-ofLoad/StoreIn(stiuctions)Floatingpointstageinstructions:Total:0(0.00XofallInstructions),thereof:Additions:0(0.005;ofFloatingpointstagehstjhlulhplicatioriE:0(0.00ofFloatingpointstagein

28、承一)Divisions:C0.00%ofFloatingpointinst.)Traps;Traps:1(1.18%ofallInstructions)由结构相关引起的暂停周期数为:104总执行周期数为:202暂停周期数占总执行周期数的百分比:51.48%4 在采用定向技术的情况下(勾选EnableForwarding),用WinDLX再次运行程序data_d.s。重复上述2中的工作,并计算采用定向技术后性能提高的倍数。在报告中:4.1 分析并写出此时全部数据相关的指令、原因、流水线停顿截图、暂停时钟周期数(循环的只写一轮lwr10r2)IF IDMEMWBadd ri jl j3F | I

29、DMEM MEM WR先读后写r1,停顿r5,0x0(ii| I个时钟周期。IF I 口 I 田 MEM I WEaddi r5j5,0n4.q 0 -二| IdI MEMWB先读后写r5,停顿个时钟周期。bnezr4.loop:|IF珀图日ll|I口|HEX|MEM|朋|先写后读4,停顿1个时钟周期。4.2 数据相关引起的暂停时钟周期数、程序执行的总时钟周期数、计算采用定向技术后性能提高的倍数Statistic|口I*Total:128Cycle($)executedIDexecutedby85Instiuclion(乱2InstructioncurrentlyinPipeline.Hard

30、wareconfiguration:Memorysize:32766BytafddEX-Stages:1,requiredCycles:2ffnulEX-Stages:1,requiredCycles:5fdivEX-Stapes:1,requiredCpcles:19Forwardingenabled.Stalls:RAWstdlh:3Q(23.44ofallCyclesLtheieof:LDstalls:20(65.67ofRAW军归国Branch/Jumpitalk1033.33ofRAWstalls)Floatingpointstalls:0(0.00ofRAWstalls)WAWstals:0(000ofallCycle?)Structuralstalls:口(口.口口应ofallCycles)Controlstalls:9(703XofallCyclesTrapstalls:3(2.34ofallCycles)To

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论