windlx系统结构实验报告.doc_第1页
windlx系统结构实验报告.doc_第2页
windlx系统结构实验报告.doc_第3页
windlx系统结构实验报告.doc_第4页
windlx系统结构实验报告.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机系统结构课程实验湖北经济学院 实验报告书课程名称: 计算机系统结构 题 目: windlx模拟器实验 学生姓名: 魏丽敏 专 业: 计算机科学与技术 班 级: 信管计科q0941 学 号: 091501007 指导老师: 叶雪军 日 期: 2012 年 5 月 4 日实验一 熟悉windlx的使用一、实验目的: 熟悉windlx的的基本概念和使用,了解各种不同指令在流水线的实际流动情况,对流水线做性能分析,加深对流水线及risc处理器的理解二、实验平台:windlx模拟器可以装入dlx汇编语言程序,然后单步、设置断点或者连续执行该程序。cpu的寄存器、流水线、i/o和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和risc处理器的特点很有帮助。 windlx要求的硬件平台是ibm pc兼容机,windlx是一个windows应用程序,运行于windows 3.0以上的操作系统。3、 实验内容1. 用windlx模拟器执行求阶乘程序fact.s 。执行步骤详见“windlx教程”。 这个程序说明浮点指令的使用。该程序从标准输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。2. 用windlx模拟器执行程序gcm.s 。 该程序从标准输入读入两个整数,求他们的greatest common measure,然后将结果写到标准输出。 该程序中调用了input.s中的输入子程序。3. 用windlx模拟器执行求素数程序prim.s。 这个程序计算若干个整数的素数。4. 通过上述使用windlx,总结windlx的特点。四、实验步骤和结果分析:使用windlx模拟器,对fact.s做如下分析:开始模拟之前的准备工作: (1) 通过双击 windlx 图标启动windlx,将出现一个带有六个图标的主窗口: (2)进行初始化模拟器, 点击file 菜单中的 reset all 菜单项,弹出一个“reset dlx”对话框。然后点击窗口中的“确认”按钮即可。(3)在开始模拟之前,至少应装入一个程序到主存。为此,选择file / load code or data,窗口中会列出目录中所有汇编程序。fact.s 计算一个整型值的阶乘; input.s中包含一个子程序,它读标准输入(键盘)并将值存入dlx处理器的通用寄存器r1中。按如下步骤操作,把fact.s和input.s加载入主存。点击 fact.s点击 select 按钮点击 input.s点击 select按钮点击 load按钮得到如下图:弹出一下询问对话框,点击“是”。1. 观察增加浮点运算部件对性能的影响。(1)点击configuration打开菜单,然后点击floating point stages菜单项,选择如下标准配置: (2)再点击executerun,输入15点,回车,在弹出的对话框出现消息trap #0 occurred 表明最后一条指令 trap 0 已经执行, trap指令中编号“0”没有定义,只是用来终止程序。点击确定。按f5进行查看:关闭上面的对话框,在statistisc中得到结果如下所示: (4) 修改浮点数一次,参数如下图:修改浮点数后,单击ok,再点击executerun,输入15点,回车,在弹出的对话框中点击确定。然后在statistisc中得到结果如下所示:(5) 修改浮点数二次,参数如下图:执行程序,输入点数15,然后在statistisc中得到结果如下所示:用windlx模拟器执行求最大公倍数程序gcm.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察cpu中寄存器和存储器的内容。熟练掌握windlx的操作和使用。注意:gcm.s中调用了input.s中的输入子程序。load程序时,要两个程序一起装入(都select后再点击load)。如:给出两组数6、3和6、1,分别在main+0x8(add r2, r1, r0)、gcm.loop(seg r3,r1,r2)和result+0xc(trap 0x0)设置断点,采用单步和连续混合执行的方法完成程序,注意中间过程和寄存器的变化情况,然后单击主菜单execute/display dlx-i/o,观察结果。3 2 1 实验源程序见文件gcm.s和input.s结果截图如下:同理,用windlx模拟器执行求素数程序prim.s。这个程序计算若干个整数的素数。熟悉windlx的运行环境。5、 实验总结:1、 通过本实验我掌握了windlx模拟器的基本操作和使用,了解dlx指令集结构及其 特点,更加深入的了解计算机系统流水线的工作过程。2、在这次的实验中,开始时候发觉自己对windlx模拟器的很多知识都不理解,对系统结构的理解太少,在做实验过程中才渐渐有了个大概的了解和深入,程序如何进行运行,数据的如何查看,如何计算上让自己反复弄好好几次,不过在反复试验之后最后终于弄明白了,还有观察转移指令在转移成功和转移不成功时候的流水线开销上,也不明白程序是如何模拟转移的,但最后在同学的帮助下,才得以解决,在这让我明白自己对计算机系统结构的认识有待更好的加强。实验二 结构相关一、实验目的:通过本实验,加深对结构相关的理解,了解结构相关对cpu性能的影响。2、 实验平台:windlx模拟器可以装入dlx汇编语言程序,然后单步、设置断点或者连续执行该程序。cpu的寄存器、流水线、i/o和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和risc处理器的特点很有帮助。 windlx要求的硬件平台是ibm pc兼容机,windlx是一个windows应用程序,运行于windows 3.0以上的操作系统。三、实验内容:1. 用windlx模拟器运行程序structure_d.s 。2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比。4. 论述结构相关对cpu性能的影响,讨论解决结构相关的方法。四、实验步骤和结果分析:1. 用windlx模拟器运行程序structure_d.s 。2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。存在结构相关的程序如下:1. ld f0, 0(r2) addd f2, f0, f2 ; - a stall is found (an example of how to answer your questions) 2. addi r2, r2, #8 addi r3, r3, #83. addi r3, r3, #8 sub r5, r4, r24. sub r5, r4, r2 bnez r5,3. 记录由结构相关引起的暂停时钟周期数 9 ,计算暂停时钟周期数占总执行周期数的百分比。9/139=6.475% 4. 论述结构相关对cpu性能的影响,讨论解决结构相关的方法。 5.执行之后得到的结果截图如下6.程序分析如下:在执行指令addi r2, r2, #8 , addi r3, r3, #8 , sub r5, r4, r2 ,bnez r5, loop 时,实际上是1addi r2, r2, #8 addi r3, r3, #8 2. addi r3, r3, #8 sub r5, r4, r2 3. sub r5, r4, r2 bnez r5,在这3个步骤中会发生同时访问同一寄存器的现象,必然会导致结构相关的问题。为了避免结构相关,可以考虑采用资源重复的方法,即在流水线机器中设置相互独立的指令存储器和数据存储器,也可以考虑将cache分为指令cache和数据cache。实验三 数据相关一、实验目的:通过本实验,加深对数据相关的理解,掌握如何使用定向技术来减少数据相关带来的暂停。2、 实验平台:windlx模拟器可以装入dlx汇编语言程序,然后单步、设置断点或者连续执行该程序。cpu的寄存器、流水线、i/o和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和risc处理器的特点很有帮助。 windlx要求的硬件平台是ibm pc兼容机,windlx是一个windows应用程序,运行于windows 3.0以上的操作系统。三、实验内容:1. 在不采用定向技术的情况下(通过configuration菜单中的enable forwarding选 项设置),用windlx模拟器运行程序data_d.s 。2. 记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比。3. 在采用定向技术的情况下,用windlx模拟器再次运行程序data_d.s。4. 记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时 钟周期数占总执行周期数的百分比。5. 根据上面记录的数据,计算采用定向技术后性能提高的倍数。四、实验步骤和结果分析:1. 在不采用定向技术的情况下(去掉configuration菜单中enable forwarding选项前的勾选符),用windlx运行程序data_d.s。记录数据相关引起的暂停时钟周期数104以及程序执行的总时钟周期数202,计算暂停时钟周期数占总执行周期数的百分比51.48%。2. 在采用定向技术的情况下(勾选enable forwarding),用windlx再次运行程序data_d.s。重复上述3中的工作,128 30 23.44%并计算采用定向技术后性能提高的倍数220/128=1.723. 采用定向技术时运行该程序:从数据中可知程序执行的总时钟周期数202,暂停时钟周期数104,暂停时钟周期数占总执行周期数的百分比51.48%。4. 采用定向技术时运行该程序:从数据中可知,执行的总时钟周期数128,暂停时钟周期数30,暂停时钟周期数占总执行周期数的百分比23.44%。由此可知,运用定向技术,减少了数据相关,缩短了程序的执行周期,性能提高了1.57倍。5. 运行结果截图如下:实验四 指令调度一、实验目的:通过本实验,加深对指令调度的理解,了解指令调度技术对cpu性能改进的好处。2、 实验平台:windlx模拟器可以装入dlx汇编语言程序,然后单步、设置断点或者连续执行该程序。cpu的寄存器、流水线、i/o和存储器都可以使用图形的方式表示出来。模拟器还提供了对流水线操作的统计功能。该模拟器对理解流水线和risc处理器的特点很有帮助。 windlx要求的硬件平台是ibm pc兼容机,windlx是一个windows应用程序,运行于windows 3.0以上的操作系统。三、实验内容:1. 通过configuration菜单中的“floating point stages”选项,把除法单元数设 置为3,把加法乘法除法的延迟设置为3个时钟周期。2. 用windlx模拟器运行调度前的程序sch-before.s 。记录程序执行过程中各种相 关发生的次数以及程序执行的总时钟周期数。3. 用windlx模拟器运行调度后的程序sch-after.s ,记录程序执行过程中各种相关 发生的次数以及程序执行的总时钟周期数。4. 根据记录结果,比较调度前和调度后的性能。5. 论述指令调度对于提高cpu性能的意义。四、实验步骤和结果分析:1、双击windlx图标运行windlx。装入测试程序之前,先初始化windlx模拟器:点击file 菜单中的 reset all 菜单项,弹出一个“reset dlx”对话框。然后点击窗口中的“确认”按钮即可。2、选择file / load code or data,按如下步骤操作,可将sch-before.s和input.s这两个程序装入主存:点击sch-before.s点击select按钮点击input.s点击select按钮点击load按钮3、按f7键程序顺序执行观察6个子窗口的情况。4、再选择file / load code or data,按如下步骤操作,可将sch-after.s和input.s这两个程序装入主存:点击sch-after.s点击select按钮点击input.s点击select按钮点击load按钮5、 按f7键程序顺序执行观察6个子窗口的情况。6.指令调度前运行结果图:程序执行的总时钟周期数:250数据相关次数:75结构相关次数:32总相关次数:14

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论