




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.6CPU新技术(下),5.6.1动态执行技术5.6.2多重指令启动技术5.6.3低功耗管理技术,5.6.1动态执行技术,1指令调度2乱序执行技术3分支预测,1指令调度,为了减少指令相关性对执行速度的影响,可以在保证程序正确性的前提下,调整指令的顺序,即进行指令调度静态指令调度,由编译程序进行编译程序通过调整指令的顺序来减少流水线的停顿,提高程序的执行速度动态指令调度,由硬件在执行的时候进行用硬件方法调度指令的执行以减少流水线停顿,流水线中一直采用的有序(in-order)指令启动是限制流水线性能的主要因素之一如一条指令停顿了,则其后的指令就都不能向前流动了如果相邻的两条指令存在相关性,流水线就将发生停顿如果有多个功能部件,这些部件就可能被闲置消除这种限制因素从而提高指令执行速度,其基本思想就是允许指令的执行是无序的(out-of-order,也称乱序)在保持指令间、数据间的依赖关系的前提下,允许不相关的指令的执行顺序与程序的原有顺序不同这一思想是实行动态指令调度的前提,动态指令调度有几方面的优点:使得某些在编译时不能确定的情况得以有效处理可以简化编译程序使得目标代码能够在不同流水线中有效运行,从而可以更好地保持系统的兼容性动态指令调度的代价提高了硬件的复杂性,2乱序执行技术,乱序执行(Out-of-orderExecution)CPU允许将多条指令不按程序规定的顺序,而是分开发送给各相应电路单元进行处理根据各个电路单元的状态和各指令能否提前执行的具体情况分析,将能够提前执行的指令立即发送给相应电路单元予以执行,在这期间不按规定顺序执行指令;然后由重新排列单元将各执行单元结果按指令顺序重新排列,乱序执行的目的使CPU内部电路满负荷运转,相应提高CPU运行程序速度实现乱序执行的关键取消传统的“取指”和“执行”两个阶段之间指令需要线性排列的限制使用一个指令缓冲池来开辟一个较长的指令窗口允许执行单元在一个较大的范围内调遣和执行已译码的程序指令流,3分支预测,分支预测(BranchPrediction)对程序的流程进行预测然后读取其中一个分支的指令采用分支预测的主要目的提高CPU的运算速度,分支预测的方法有两类静态预测方法比较简单,如预测永远不转移、预测永远转移、预测后向转移等等并不根据执行时的条件和历史信息来进行预测,因此预测的准确性不可能很高动态预测方法根据同一条转移指令过去的转移情况来预测未来的转移情况,由于程序中的条件分支是根据程序指令在流水线处理后的结果来执行的,当CPU等待指令结果时,流水线的前级电路也处于等待分支指令的空闲状态必然出现时钟周期的浪费如果CPU能在前条指令结果出来之前就预测到分支是否转移,就可以提前执行相应的指令避免流水线的空闲等待,也相应提高CPU的运算速度,一旦前条指令结果出来后证明分支预测是错误的,就必须将已经装入流水线执行的指令和结果全部清除,然后再装入正确的指令重新处理这样就比不进行分支预测而是等待结果再执行新指令还要慢了因此,分支预测的错误并不会导致结果的错误,而只是导致流水线的停顿如果能够保持较高的预测准确率,分支预测就能提高流水线的性能,5.6.2多重指令启动技术,多重指令启动(Multi-Launch,也称多发射)的流水方式设法在一个时钟周期内启动多条指令,使得每个周期平均能完成多条指令进一步提高指令流水线的性能多重指令启动的方法有两种:1.动态多重指令启动2.静态多重指令启动,1.动态多重指令启动,动态多重指令启动由硬件在每个时钟周期内启动可变数量的指令指令可以采用静态指令调度,也可以采用动态指令调度常见的技术有超标量技术、超流水线技术,1)超标量技术,超标量(Superscalar)技术在每个时钟周期内同时并发多条独立指令,将两条或两条以上的指令并行编译、执行超标量处理器支持指令级并行,每个时钟周期可发射多条指令(2-4条居多),可使CPU的IPC(InstructionPerClock,每时钟指令数)1,从而提高CPU处理速度,超标量流水计算机具有两条或两条以上指令流水线当流水线满载时,每一个时钟周期可以执行2条以上指令采用超标量流水线工作方式机器速度更高但硬件也更为复杂,2)超流水线技术,超流水线(Superpipeline)技术使指令周期的各个子过程内部的流水线进一步细化,使其工作速度加倍从而在一个时钟周期中执行两条或更多条指令超流水线技术通过将一些流水线寄存器插入到流水线各个过程段中,对流水线再分,使每段的长度近似相等以便现有的硬件在每个周期内使用多次,即每个超流水线段都以数倍于基本时钟频率的速度运行,在超流水结构中,由于时钟频率提高,而功能部件的速度不变,实际上使得流水线的周期数更多这样会使得指令相关性对流水线性能的影响更大,从而对分支预测等部件提出更高的要求而且由于并行执行的指令数量更多,要求具有更多的功能部件或者功能部件的流水速度更高,标量流水每个时钟周期启动1条指令超标量流水每个时钟周期启动2条指令标量超流水每个时钟周期启动2条指令(启动2次,每次1条指令)超标量超流水每个时钟周期启动4条指令(启动2次,每次2条指令),2.静态多重指令启动,静态多重指令启动每次启动固定数量的指令,这些指令由编译程序组合成一条超长指令(或指令包)常见的技术有超长指令字技术超长指令字(VeryLongInstructionWord,VLIW)技术将多条指令放入一个指令字可以有效提高CPU各个功能部件的使用效率,提高程序性能,超长指令字工作流程首先由编译程序在编译时挖掘出指令间潜在的并行性然后把多条能并行执行的指令组合成一条具有多个操作段的超长指令再由这条超长指令的超长指令字来控制机器中多个独立工作的部件每个操作段控制一个部件,相当于同时执行多条指令,VLIW计算机使用多个独立的功能部件,所有功能部件由同一个机器时钟来驱动特点单一控制流:机器中只有一个程序计数器、一个控制单元,每个时钟周期启动一条VLIW指令指令被划分为许多字段:每段控制一个特定的功能部件机器中设置大量的数据通路和功能部件:功能部件操作可用流水技术进一步提高性能;每个操作的执行周期数已知;编译器在对操作进行调度时已考虑可能出现的数据相关和资源冲突;控制硬件比较简单,在动态多重指令启动方式下,随着启动数量的增加,确定多个指令是否可同时启动的硬件的复杂性越来越大而VLIW则可以减少实现多重启动处理所需要的硬件数量VLIW使用多个独立的功能部件完成多个操作,并将多个操作命令包装在一个很长的指令中,将选择同时启动的多个操作的工作交给了编译程序因此,提高VLIW计算机性能的关键在于其编译器,5.6.3低功耗管理技术,对于高性能通用处理器而言,低功耗研究主要解决处理器局部过热和功率过高的问题局部过热(Hotspot)会导致芯片不能正常工作功率过高使得散热设备日趋昂贵节省散热设备成本和能量损耗可提高产品竞争力对于移动计算(嵌入式处理器)来说,最重要的是提高能量的效率,即计算相同的问题,使用更少的能量主要目的在于延长电池的寿命,提高产品竞争力,1制程提升,解决CPU的高功耗,制程的提升是最直接的改善方法一条粗的电阻丝比一条细的电阻丝的功耗更大在CPU中使用了电路与各个细小元件的连接,虽然这些电路极其细微,但如果全部连接起来的话,CPU这类超大规模集成电路的线路长度将达到可观的数量级,其功耗会在这些线路中被转换成热量制程的提升就是把这些线路变得更细,功耗可因此而大幅下降,2降低电压,高电压是造成功耗提升的另一个重要因素电压与功耗总是成正比关系最大功耗可由核心电压最大电流简单计算而估得CPU内部电流较大,且不易减小,虽然供给CPU的电压不高,但与大电流相乘后,带来的功耗也不容忽视降低电压,即使降低的幅度不大,所带来的功耗下降也相当明显但是如果电压降得过低,CPU内部的CMOS管就会不稳定,工作可靠性也随之大大降低,3减少晶体管数量,微处理器领域总是使用晶体管数量来衡量集成技术的高低随着多核和大缓存技术的流行,晶体管数量也成几何速度直线增长,数以亿计的晶体管本身就是能源消耗大户在相同制程下,越少的晶体管数量可以拥有越低的功耗通过优化设计,减少晶体管数量是行之有效的降低功耗手段之一,4降低频率,过于注重频率的提升也是导致CPU功耗日益加大的重要因素人们一直认为频率是衡量CPU性能的最重要标志提高频率有很多方法,如采用全新设计、提升电压、制程提升等,但更为简单直接的却是采用超长流水线设计流水线被划分得相当细密,频率提升空间也相应增大但是问题在于,流水线过多,其延时和错误率也会增加,最终导致CPU效率直线下降,性能反而不佳降低流水线等级在近几年中得到大量应用Intel启用了短流水线设计的酷睿2(Core2),高级分支预测(AdvancedBranchPrediction):采用多分支预测机制,大幅提高预测准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025汉中市南郑区审计局公益性岗位招聘(5人)模拟试卷及答案详解(易错题)
- 2025年芜湖市国有资本投资运营有限公司招聘10人模拟试卷及一套参考答案详解
- 2025江苏盐城市东台市卫生健康委员会招聘事业单位工作人员130人考前自测高频考点模拟试题有答案详解
- 2025安徽合肥师范学院辅导员招聘32人模拟试卷及答案详解(必刷)
- 2025杭州市钱塘区教育局所属事业单位在职教师直接考核招聘37人模拟试卷及参考答案详解一套
- 2025年河北唐山幼儿师范高等专科学校选聘工作人员35人模拟试卷及答案详解(网校专用)
- 2025福建厦门启航培训服务有限公司招聘1人考前自测高频考点模拟试题及1套完整答案详解
- 2025甘肃定西郑州麦克莱恩心理医院后勤人员招聘27人考前自测高频考点模拟试题及完整答案详解
- 2025年金华义乌市中医医院面向毕业生校园招聘3人(长春中医药大学)考前自测高频考点模拟试题及答案详解(夺冠)
- 土地合作协议书
- 银行理财推广营销方案
- 医院培训课件:《中医护理技术质量与安全管理》
- 历史课程中的跨学科教学与学科整合
- 移情训练法移情训练法
- 《大卫 科波菲尔(节选)》《复活》《老人与海》《百年孤独》 统编版高中语文选择性必修上册
- 展厅施工方案表
- 空调维保投标方案(技术方案)
- 深圳南山风险投资基金
- 食品安全风险“日管控、周排查、月调度”记录表
- 监护仪使用及报警设置
- 通过模拟实验探究膜的透性 说课课件
评论
0/150
提交评论