版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验四 指令调度一、 实验目的通过本实验,加深对指令调度的理解,了解指令调度技术对cpu性能改进的好处。二、 实验内容1. 通过configuration菜单中的“floating point stages”选项,把除法单元数设置为3,把加法乘法除法的延迟设置为3个时钟周期。2. 用windlx模拟器运行调度前的程序sch-before.s 。记录程序执行过程中各种相关发生的次数以及程序执行的总时钟周期数。3. 用windlx模拟器运行调度后的程序sch-after.s ,记录程序执行过程中各种相关发生的次数以及程序执行的总时钟周期数。4. 根据记录结果,比较调度前和调度后的性能。5. 论述指
2、令调度对于提高cpu性能的意义。三、 实验环境win7 旗舰版 + windlxwindlx流水线描述:dlx 执行指令的流水线是一个5 段流水线,包括取指段(if)、译码段(id)、执行段(ex)、访存段(mem)和写回段(wb)。其中,执行段分为4个单元,分别是:intex 单元(整数操作),faddex 单元(浮点加减),fmulex(浮点乘法),fdivex(浮点除法)。每个单元的个数和延迟时间,可以通过菜单进行设定。四、 实验步骤1. 通过通过configuration菜单中的“floating point stages”选项,把除法单元数设置为3,把加法乘法除法的延迟设置为3个时钟
3、周期;图 1 设置执行单元数量、延迟2. 取消定向技术;图 2 取消定向技术3. 装载程序选择file / load code or data,按如下步骤操作,可将sch_before.s程序装入主存;点击sch_before.s点击select按钮点击load按钮4. 点击f7,但不运行,观察情况并总结;5. 将程序换成sch_after.s,重复步骤3,4,并对两次情况惊醒对比总结。五、 截图分析1、 指令调度前【分析1】if f1, $data(r0)cvti2f f7, f1nop数据相关(写后读) 截图的第2条指令中寄存器f1等待前一条指令的计算结果,故延迟了2个周期。【分析2】cv
4、ti2f f7, f1nopdivf f1, f8, f7divf f2, f9, f7数据相关(写后读) 截图第3条指令的寄存器f7等待第1条指令的计算结果,故延迟了1个周期。【分析3】divf f2, f9, f7addf f3, f1, f2数据相关(写后读) 截图第2条指令的寄存器f2等待第一条指令的计算结果,且浮点计算执行时间需要3个时钟周期,故总共延迟4个周期。【分析4】addf f3, f1, f2divf f10, f3, f7数据相关(写后读) 截图第2条指令的寄存器f3等待第一条指令的计算结果,且浮点计算执行时间需要3个时钟周期,故总共延迟4个周期。【分析5】divf f5
5、, f12, f7multf f6, f4, f5数据相关(写后读) 截图第2条指令的寄存器f5等待第一条指令的计算结果,且浮点计算执行时间需要3个时钟周期,故总共延迟4个周期。【分析6】multf f6, f4, f5divf f13, f6, f7数据相关(写后读) 截图第2条指令的寄存器f6等待第一条指令的计算结果,且浮点计算执行时间需要3个时钟周期,故总共延迟4个周期。【小结】程序执行共37个时钟周期,总共发生了6次数据相关(写后读),无其他相关发生。由于数据相关(写后读),延迟了19个周期,占51.35%;因1次trap stalls,延迟了5个周期,占13.51%;无其他延迟。2、
6、 指令调度后【分析1】if f1, $data(r0)cvti2f f7, f1nop数据相关(写后读) 截图的第2条指令中寄存器f1等待前一条指令的计算结果,故延迟了2个周期。【分析2】cvti2f f7, f1nopdivf f1, f8, f7divf f2, f9, f7数据相关(写后读) 截图第3条指令的寄存器f7等待第1条指令的计算结果,故延迟了1个周期。【分析3】divf f2, f9, f7divf f4, f11, f7divf f5, f12, f7addf f3, f1, f2数据相关(写后读) 截图第4条指令的寄存器f2等待第1条指令的计算结果,故延迟了2个周期。【分析
7、4】divf f5, f12, f7addf f3, f1, f2multf f6, f4, f5数据相关(写后读) 截图第3条指令的寄存器f5等待第1条指令的计算结果,故延迟了1个周期。【分析5】addf f3, f1, f2multf f6, f4, f5divf f10, f3, f7数据相关(写后读) 截图第3条指令的寄存器f3等待第1条指令的计算结果,故延迟了2个周期。【分析6】multf f6, f4, f5divf f10, f3, f7divf f13, f6, f7数据相关(写后读) 截图第3条指令的寄存器f6等待第1条指令的计算结果,故延迟了1个周期。【小结】指令调度后,程
8、序共执行了27个时钟周期,总共发生了6次数据相关(写后读),无其他相关发生。由于数据相关(写后读),延迟了9个周期,占33.33%;因1次trap stalls,延迟了5个周期,占18.62%;无其他延迟。3、 总结根据指令调度前、调度后的截图分析和小结,作出如下总结:a. 指令调度后,数据相关(写后读)次数并没减少,但数据相关(写后读)引起的延迟减少了10个周期;b. 整个程序的加速比达到1.37。六、 实验总结通过本次实验,我有如下收获:1. 明白了指令调度可以消除部分数据相关(本程序中没体现出来),但不能避免所有的数据相关;2. 指令调度可以减少因数据相关引起的延迟周期数,从而提高加速比
9、,这对提高cpu性能有重要意义;3. 加深对指令调度的理解,了解指令调度技术对cpu性能改进的好处。七、 附录1、 指令调度前程序 sch_before.s.data.global oneone: .word 1.text.global mainmain:lf f1,one ;turn divf into a movecvti2f f7,f1 ;by storing in f7 1 innop ;floating-point formatdivf f1,f8,f7 ;move y=(f8) into f1divf f2,f9,f7 ;move z=(f9) into f2addf f3,f1,
10、f2divf f10,f3,f7 ;move f3 into x=(f10)divf f4,f11,f7 ;move b=(f11) into f4divf f5,f12,f7 ;move c=(f12) into f5multf f6,f4,f5divf f13,f6,f7 ;move f6 into a=(f13)finish: trap 02、 指令调度后程序 sch_after.s.data.global oneone: .word 1.text.global mainmain:lf f1,one ;turn divf into a movecvti2f f7,f1 ;by storing in f7 1 innop ;floating-point formatdivf f1,f8,f7 ;move y=(f8) into f1divf f2,f9,f7 ;move z=(f9) into f2divf f4,f11,f7 ;move
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 系统性能测试案例与方法
- 2025年农产品电商品牌五年培育策略与市场影响力报告
- 2026年食品行业冷链物流报告
- 2025年城市流动摊贩管理优化行业报告
- 《逻辑代数的初步知识:大学数学教材教案》
- 2026年旅游科技行业报告
- 2026年虚拟现实产业创新报告及沉浸式体验趋势报告
- 供应商信息收集与评估工具供应链管理参考手册
- 情境化教学与生成式AI结合的初中化学实验课堂创新探讨教学研究课题报告
- 初中物理杠杆原理在垃圾分类分离装置设计中的应用教学研究课题报告
- 2026年福建莆田市涵江区区属一级国有企业高级管理人员招聘2人笔试备考题库及答案解析
- 2026福建莆田市涵江区选聘区属一级国有企业高级管理人员2人笔试备考题库及答案解析
- 2026春季开学教职工大会校长精彩发言:大格局!3个变局、3个确定性、3个转变
- 2026 昆明市高三市统测 三诊一模 英语试卷
- 2025年专升本化学专业无机化学测试试卷(含答案)
- 市场调研报告撰写指南
- 湖北省腾云联盟2026届高三8月联考历史(含答案)
- 知道智慧树大学生马克思主义素养满分测试答案
- 2025中国纺织行业产品数字护照(DPP)白皮书
- 星星之火可以燎原读后感课件
- JG/T 502-2016环氧树脂涂层钢筋
评论
0/150
提交评论