版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、循环展开及指令调度实验项目名称实验目的及要求实验内容循环展开及指令调度加深对循环级并行性、指令调度技术、循环展开技术以及寄存器换名技术的理解;熟悉用指令调度技术来解决流水线中的数据相关的方法;了解循环展开、指令调度等技术对 CPU性能的改进。1用指令调度技术解决流水线中的结构相关与数据相关1) 用 MIPS 汇编语言编写代码文件 *.s,程序中应包括数据相关与结构相关 (假设:加法乘法除法部件各有 2 个,延迟时间都是 3 个时钟周期)2) 通过 Configuration 菜单中的“Floating point stages” 选项,把加法乘法除法部件的个数设置为 2 个,把延迟都设置为 3
2、 个时钟周期;3) 用 winMIPS64 运行程序。记录程序执行过程中各种相关发生的次数、发生相关的指令组合,以及程序执行的总时钟周期数;4) 采用指令调度技术对程序进行指令调度,消除相关;5) 用 winMIPS64 运行调度后的程序, 观察程序在流水线中的执行情况,记录程序执行的总时钟周期数;6) 根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高 CPU 性能的意义。用循环展开、寄存器换名以及指令调度提高性能1) 用 MIPS 汇编语言编写代码文件 *.s,程序中包含一个循环次数为 4 的整数倍的简单循环;2) 用 winMIPS64 运行该程序。记录执行过程中各种相关发生的
3、次数以及程序执行的总时钟周期数;3) 将循环展开 3 次,将 4 个循环体组成的代码代替原来的循环体,并对程序做相应的修改。然后对新的循环体进行寄存器换名和指令调度;4) 用 winMIPS64 运行修改后的程序, 记录执行过程中各种相关发生的次数以及程序执行的总时钟周期数;5) 根据记录结果,比较循环展开、指令调度前后的性能。1用指令调度技术解决流水线中的结构相关与数据相关代 码:divff2,f5,f6divff1,f2,f6实验步divff3,f1,f5骤divff0,f4,f7addff14,f0,f6addff15,f5,f7multff20,f4,f6multff21,f5,f72
4、)设置运算部件个数以及运算时钟周期数图 1图2.Pipeline 图以下为出现的数据相关图 3先写后读相关图 4由于只有两个除法部件,所以出现了功能部件的冲突。 总的执行周期是 38 指令调度后代码:将无关指令放在一起执行,相关指令分开尽量避免数据相关divf f2,f5,f6multf f20,f4,f6multf f21,f5,f7divf f1,f2,f6addf f15,f5,f7divf f3,f1,f5divf f0,f4,f7addf f14,f0,f6图 5.Pipeline 图图 6.Statistics 图总执行时钟周期为 35 个。6)指令调度后,数据相关减少了,总时钟周
5、期数减少了,效能提高了。调度前的时钟周期数为 38,调度后的时钟周期数减少为 35,加速比 = 38/35= 1.08用循环展开、寄存器换名以及指令调度提高性能带循环指令代码:求四个1 相加的和,结果存在r2 中.text.global mainmain:addi r1,r0,#4addi r2,r0,#0Loop: sgt r3,r1,r0bnez r3,Sub1trap 0 Sub1:addi r2,r2,#1subi r1,r1,#1j Loop结果:总时钟周期是 42 个, 5 raw stalls, 循环了 4 次,结果 r2 =4图 7循环展开:代码:.text.global ma
6、inmain:addi r1,r0,#4addi r2,r0,#0addi r2,r2,#1subi r1,r1,#1addi r2,r2,#1subi r1,r1,#1addi r2,r2,#1subi r1,r1,#1addi r2,r2,#1subi r1,r1,#1trap 0结果:总时钟周期是 15 个,0 raw stalls, 执行了 4 次,结果 r2 = 4图8原因的对比:是因为 LOOP 指令执行完后会有一个 nop 指令的延迟。图 9多 Cache 一致性:实验目的1、加深对多 CACHE 一致性的理解。2、进一步掌握解决多CACHE 一致性的目录协议和监听协议的基本思想
7、。3、掌握在各种情况下,目录协议和监听协议是如何工作的。给出进行操作的类型以及 CACHE 块状态的变化情况模拟器使用方法简介(目录式)该模拟器模拟 4 个 CPU(A 、B、C、D)访存的工作过程。每个 CPU 中都有一个 Cache,该 Cache 包含有 4 个块,其块地址为 0-3。分布式存储器中有 32 个块,其块地址为 0-31。每个块状态用色块表示,其中灰色为“无效”状态,淡青色为“共享”状态,橘红色为“独占” 。主存中块的状态由其右边的目录项的颜色来表示,未缓冲状态由黄色来表示,其他两种状态同 Cache 块。对于每一个 CPU 都可以指定所要进行的访问是读还是写(从列表中选)
8、 ,并在输入框中输入所要访问的主存块号,然后用鼠标单击在其右边的标有“”的按钮,模拟器就将开始演示该访问的工作过程。图 10模拟器简介(监听协议)该模拟器模拟 4 个 CPU(A 、B、C、D)访存的工作过程。每个 CPU 中都有一个 Cache,该 Cache 包含有 4 个块,其块地址为 0-3。集中共享存储器中有 32 个块,其块地址为 0-31。每个块状态用色块表示,其中灰色为“无效”状态,淡青色为“共享”状态,橘红色为“独占” 。对于每一个 CPU 都可以指定所要进行的访问是读还是写(从列表中选) ,并在输入框中输入所要访问的主存块号,然后用鼠标单击在其右边的标有“”的按钮,模拟器就
9、将开始演示该访问的工作过程。图 11实验步骤(目录协议)对于以下访问序列,写出目录协议所进行的操作。所进行目录协议所进行的操作CPUA 1读 ;2.不命中 ;3 本地 :向宿主结点读第 6 块 发读不命中 (A ,6)消息; 4.宿主:把数据块送给本地结点; 5.共享集 CPU B 1 读;2.不命中;3. 本地 :向宿主读第 6块结点发读不命中 (B,6)消息;CPUD 1读; 2.不命中; 3. 本地 :向宿主读第 6块 结点发读不命中 (D,6)消息;CPUB 1写; 2.命中; 3. 本地 :向宿主结写第 6块 点发写命中 (,6)消息,宿主:向远程结点 A 发CPUC1 读;2.不命
10、中; 3. 本地 :向宿主结读第 6块点发读不命中 (C ,6)消息;CPUD1写; 2.不命中; 3. 本地 :向宿主写第 20结点发写不命中 (D,20)消息;4宿CPUA1写; 2.不命中; 3. 本地 :向宿主写第 20结点发写不命中 (A ,20)消息;4宿CPUD1写; 2.不命中; 3. 本地 :向宿主写第 6块结点发写不命中 (D, 6)消息; 4.宿CPUA1写; 2.不命中; 3.本地:向被替读第 12换块的宿主结点发写回并修改共实验步骤(监听协议)对于以下访问序列,写出监听协议所进行的操作。所进行是否是否发的访问发生生写回CPUA 否否CPUB 否否CPUC 否否CPUB 否发生CPUD 发生否CPUB 发生发生CPUA 否发生CPUC 发生发生写第 23否否CPUBCPUB替换发生写第 5块监听协议所进行的操作读;不命中 ;读不命读;不命中 ;读不命读;不命中 ;读不命写,命中 ;作废 A,C 读;不命中 ;读不命写;不命中 ;写不命写;不命中 ;写不命写;不命中 ;写不命中;替换 ;写回 ;数读;不命中 ;读不命写;不命中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年清明节假期出行安全指南
- 停车场智能管理系统设计方案
- 施工现场交通管理信息系统方案
- 汽车零部件试生产流程验证方案
- 开挖作业现场健康监测方案
- 2026山西忻州市岢岚县民政和人力资源社会保障局招聘公益性岗位人员备考题库及答案详解(名师系列)
- 建筑拆除废弃物处理计划
- 基坑施工监测技术应用方案
- 基础工程施工进度计划方案
- 2026湖北鄂州市商保公司社会招聘工作人员4人备考题库含答案详解ab卷
- 2026河南新乡南太行旅游有限公司招聘16岗49人考试参考试题及答案解析
- 2026年春季西师大版(2024)小学数学三年级下册教学计划含进度表
- T-GFIA 004-2026 特色(呼吸系统调养)森林康养服务规范
- 2026年春季湘少版(三起)四年级下册英语教学计划(含进度表)
- 新东方《中国学生出国留学发展报告》
- 门诊护理职业发展与规划
- 2026年3月15日九江市五类人员面试真题及答案解析
- 2026国家开放大学出版传媒集团招聘5人笔试备考题库及答案解析
- 2024版2026春新版三年级下册道德与法治全册教案教学设计
- 2026年西安电力高等专科学校单招职业技能考试模拟测试卷附答案
- (2025年)上海专升本普通心理学模拟试题真题试卷及答案
评论
0/150
提交评论