版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机系统结构实验报告 一. 流水线中的相关 实验目的: 1. 熟练掌握WinDLX莫拟器的操作和使用,熟悉 DLX旨令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPI性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: Win DLX模 拟器 实验内容和步骤: 1. 用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运
2、行程序,观察程序在流水线中的执行情况,观察 CPI中寄存器和存储器的内容。熟练掌握Win DLX勺操作和使用。 2. 用WinDLX!行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对 CPI性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉 Configuration 菜单中Enable Forwarding 选项前的勾 选符),用WinDLX!行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算
3、暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding ),用WinDLX再次运行程序data_d. 54 Total) 在定向技术不存在时候,控制暂停和Trap暂停仍然是同样的值,而RAW 暂停从17 变成了 53,总的模拟周期数增加到236。所以定向技术带来的加速比: 236 / 215 = 1.098 DLX forwarded 比 DLX not forwarded 快 9.8%。 2. 数据相关 先给出一个存在数据相关的程序: LHI R2, (A16) turn divf into a move cvti2f f7,f1 ;by st
4、ori ng in f7 1 in nop ;float in g-po int format divf f1,f8,f7 ;move Y=(f8) into f1 divf f2,f9,f7 ;move Z=(f9) into f2 addf f3,f1,f2 divf f10,f3,f7 ;move f3 into X=(f10) divf f4,f11,f7 ;move B=(f11) into f4 divf f5,f12,f7 ;move C=(f12) into f5 multf f6,f4,f5 divf f13,f6,f7 ;move f6 into A=(f13) Fi ni
5、sh: trap 0 运行之后可以得到结果: Total: 27 Cicle(s) executed. ID executed by 12 lnshuction($. _ lnstfuction|x currently in Pipeline. Stalls : RAW stalls: 9 (33.33鬼 of all Cycles thereof: LD 治陆 1 (11 1Uof RAW stalls) Branch Al ump stalls: 0 0.00 龛 of RAW stals) Floatirg point stalls: 8 1 QQlOOSf of RAW stals)
6、WAW stalls: 0 (0.003: of all CvcIeJ Structural 如Ils: 0 (0.00 of all Cycled Conlrd stalls: 0 (0.00X of dl Cydes) Trap dale 1 (25L92% of dl 匚yck制 Total: l6Stall(s) (59.26 of all Cycles 调度之后的程序sch_aft: .data .global ONE ONE: .word 1 .text .global mai n main: lf f1,ONE ;turn divf into a move cvti2f f7,f
7、1 ;by stori ng in f7 1 in nop ;float in g-po int format divf f1,f8,f7 ;move Y=(f8) into f1 divf f2,f9,f7 ;move Z=(f9) into f2 divf f4,f11,f7 ;move B=(f11) into f4 divf f5,f12,f7 ;move C=(f12) into f5 addf f3,f1,f2 multf f6,f4,f5 divf f10,f3,f7 ;move f3 into X=(f10) divf f13,f6,f7 ;move f6 into A=(f1
8、3) Fi nish: trap 0 运行之后得到: lota 丄 21 CvcIb(s) executed. ID executed by 12 Instruction($). 2 Instruction(s) currently in Pipeline. StalIs: RAW 献alb: 3 (14.2QK of al Cycles), lhereaf: LD stalk 1 (33 33 of RAW stalk Branch/Jump stak: 0 (0.00% of RAW sials Floating point sldk 2 旧6.67W of RAW stalls) WAW
9、 stalls: 0 (0 00 nF all Cycles Stiuctural stalls: 0 (0.30S of all Cycles Control stalls: Cl (0.00 of all Cycles Trap stab: E (29157X of dl Cycled Total: 9 Stdb) (42.BG% of all Cycles) 可以看出经过调度之后 运行周期从27减少到21,而且减少了相关。 2.循环展开: 循环展开前的程序: LHIR2, (A16 ) 3 (1O OOX of all Cycles) Total: 10 Stall(s) (33.33
10、of all Cycles) 循环展开后的程序: LHIR2, (A16 )& OxFFFF ADDUIR2, R2, A&OxFFFF LHIR3, (B16) &0 xFFFF ADDUIR3, R3, B&0 xFFFF ADDUR4, R0, R3 SUBI R4, R4, #8 SUBI R4, R4, #8 SUBI R4, R4, #8 SUBI R4, R4, #8 TRAP #0 A: .double 1,2, 3, 4 B: .double 1,2, 3, 4 运行结果: H Statistics_ | 匸 Total: 14 Cycle($) executed. ID e
11、xecutecl by 10 lnstructior(s) ? Inbuctiont currently in Pipeline. Hardware con igurat i on: hdemofy size: 32768 Btes hddEX-Stoges: 1, required Cycles: 2 fmulEX-Stages: required Cycles: 5 fdivEX-Stages: 1, required Cycles: 13 Fofwading erabled. Stells : RAW 鈕Ik: 0 (0.0u?i of all Cycles), thereof: LD stalls: 0 (0.00S; of RAW stalls) Branch/Jump stalk: 0 (0 00 of RAW slls) Floating point stalls: 0 (O.OOi of RAW stalls) WAW 血k: 0 (0.00S; of all Cycles Structural stalk 0 (0 00 of dl Cycles Control stalls: 0 (0,00站 of all Cycles) Ttap stalk 3 21.43 of all Cycles)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GA/Z 2328-2025法庭科学资金数据分析标准体系表
- GA 2180-2024警用服饰移民管理警察丝织帽徽
- 2026年陕西省西安交大附中初三下学期质量调研考试(一模)物理试题含解析
- 江苏省无锡市刘潭中学2025-2026学年开学摸底考试初三数学试题含解析
- 2026年大学大一(建筑材料)砂浆强度检测综合测试题及答案
- 防洪预案编制指南
- 2025年前台服务保险箱考核练习卷
- 警惕六大决策“陷阱”
- 护理操作技能
- 护理学基础:病区环境的心理支持作用
- 物业小区控烟监督制度
- 2026年郑州市检验检测有限公司公开招聘19人笔试备考题库及答案解析
- 2026年春季安全教育班会记录表(19周):开学安全第一课-启航安全守护新学期
- 多模式镇痛临床实践与应用
- 2025年黄山职业技术学院单招职业技能测试题库附答案解析
- 2026吉林农业大学三江实验室办公室招聘工作人员笔试备考试题及答案解析
- 脑中风科普知识讲座
- 大坝安全监测仪器检验测试规程
- 绿色数据中心 暨对算力行业的一点思考 行业洞察 2026
- 历史试题-汕头市2025-2026学年度普通高中毕业班教学质量监测(含解析)
- 部队食堂制度规范标准
评论
0/150
提交评论