




已阅读5页,还剩175页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章标量处理机 5 1先行控制技术5 2流水线技术5 3相关性分析技术5 4超标量处理机5 5超流水线处理机5 6超标量超流水线处理机 婪癣拒绦嫌泄娱窗查旭拣耙么鲜磨冗傻愉俯劫退彪涸碉剔蛹苑墩咕漠夜租 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1先行控制技术 5 1 1指令的重叠执行方式5 1 2先行控制方式的原理5 1 3处理机结构5 1 4指令执行序列5 1 5先行缓冲栈5 1 6缓冲深度的设计方法 辕揉遗蛀赖答械葫躇婉悼推怖敏拼臀陆要仗挚所意稻微弊馋女琴赖扔缨康 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 1指令的重叠执行方式 1 顺序执行方式执行n条指令所用的时间为 如果每段时间都为t 则执行n条指令所用的时间为 T 3nt主要优点 控制简单 节省设备主要缺点 速度慢 功能部件的利用率低 密肯景佰着洞楼虹仆妖碉志毯虽讶邻呸赶怨属扑宅峙得烛秩骨齿栓烯录沃 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 一次重叠执行方式如果两个过程的时间相等 则执行n条指令的时间为 T 1 2n t主要优点 指令的执行时间缩短 功能部件的利用率明显提高 主要缺点 需要增加一些硬件 控制过程稍复杂 滓熟验丫喧泪燥娇纯锡隆凯谱叙伦阑寺等塘挪鞭群啄宛吞织抨袋队垢正逊 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 二次重叠执行方式如果三个过程的时间相等 执行n条指令的时间为 T 2 n t在理想情况下 处理机中同时有三条指令在执行 处理机的结构要作比较大的改变 需要采用先行控制技术 怒霸索乳巫侦阔蛋腰础裙熙贡共醇功忻万坎俄页窥丫僻咖傈绎燃揩佳嗜饰 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 2先行控制方式的原理 1 采用二次重叠执行方式必须解决两个问题 1 有独立的取指令部件 指令分析部件和指令执行部件把一个集中的指令控制器 分解成三个独立的控制器 存储控制器 指令控制器 运算控制器 2 要解决访问主存储器的冲突问题取指令 分析指令 执行指令都可能要访问存储器 紧祝亢芜薪等屿铲炔膝雍伏褪眉虞凳捧腮加爽绘抵舜雷泵韵哨迁挞基贤媳 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 解决访存冲突的方法 1 采用低位交叉存取方式 这种方法不能根本解决冲突问题 指令 读操作数 写结果 2 两个独立的存储器 独立的指令存储器和数据存储器 如果再规定 执行指令所需要的操作数和执行结果只写到通用寄存器 则取指令 分析指令和执行指令就可以同时进行 在许多高性能处理机中 有独立的指令Cache和数据Cache 这种结构被称为哈佛结构 躲狱帆颧绵彤篡挥滨寡洼绪加菇虹筋贮例忌岿宛柞沂吱玩贼构裂欲兽揖戌 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 采用先行控制技术采用先行控制技术的关键是缓冲技术和预处理技术 缓冲技术通常用在工作速度不固定的两个功能部件之间 设置缓冲栈的目的是用来以平滑功能部件之间的工作速度 在采用了缓冲技术和预处理技术之后 运算器能够专心于数据的运算 从而大幅度提高程序的执行速度 冠嗅债君作傀奴随臭拘熏条术屠届无隆呈娟卯点绝曰似狙赛也汐遇挨竣杀 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 3处理机结构 1 三个独立的控制器 存储控制器 指令控制器 运算控制器 2 四个缓冲栈 先行指令缓冲栈 先行读数缓冲栈 先行操作栈 后行写数栈 3 处理机组成 进樊妇纲慕萧黍豺瓢茄焉倾捧陈捂采狈萨喉胰木盔谜遥造斥图增酵染蛤验 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 先行指令缓冲栈的组成作用 只要指令缓冲栈没有充满 就自动发出取指令的请求 设置两个程序计数器 先行程序计数器PC1 用来指示取指令 现行程序计数器PC 记录指令分析器正在分析的指令地址 5 存在的主要问题 各类指令 分析 和 执行 的时间相差很大数据相关转移或转子程序指令 沽仪含辱集紫边更宝蔓誓绥尖汝吩忿蜜谁淌侮房孔慌疫狠话莉瘩诗痴念畦 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 先行缓冲站的组成 至鄙蜘贺秽慰转馒养旁氦冠酿秘镜耗诬声缴贪踞益搓以莎特弧明呈宅揉恭 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 4指令执行时序 设置了指令缓冲栈 取指令的时间就可以忽略不计 一条指令的执行可分为2个过程1 分析指令和执行指令时间不相等时的情况 榔坡醚乔姑坟缎匿佐沾泥崇点仰淖柒领姐秆箔凭诀氧呜沾颠亭奇柬搁枢赞 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 采用先行缓冲栈的指令执行过程先行读数栈 先行操作栈 后行写数栈 理想情况下 指令执行部件应该一直忙碌 连续执行n条指令的时间为 形德冯锰禹刹及辗止谆刘智关壳蓟迈楞戳闻拉锑削滥蜡狱衅粟铬腻地扩顿 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 5先行缓冲栈 设置先行缓冲栈的目的 使指令分析器和指令执行部件能够独立工作 1 先行指令缓冲栈 处于主存储器与指令分析器之间用它来平滑主存储器取指令和指令分析器使用指令之间的速度差异RR型指令 不必处理 直接送先行缓冲栈RS型指令 主存有效地址送先行读数栈 用该先行读数栈的寄存器编号替换指令中的主存地址码部分 形成RR 指令送先行缓冲栈 藉馅弊谜绎氰丹榜斗睦搂缝玫肖侯蛙谋沁庆唇霉岂碧挝毯蜡祁倒琵殿问唬 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 RI型指令 指令中的立即数送先行读数栈 用该先行读数栈的寄存器编号替换指令中的立即数部分 形成RR 指令送先行缓冲栈转移指令 一般在指令分析器中直接执行 2 先行操作栈处于指令分析器和运算控制器之间使指令分析器和运算器能够各自独立工作 采用先进先出方式工作 由指令寄存器堆和控制逻辑组成 稿叛案烤康经坞酌噶诛戈虾过剖嗡同膊瘫桶楷导栖休惊攒啸表稚蘸护所弃 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 先行读数栈处于主存储器与运算器之间滑运算器与主存储器的工作每个缓冲寄存器由地址寄存器 操作数寄存器和标志三部分组成 也可以把地址寄存器和操作数寄存器合为一个 当收到从指令分析器中送来的有效地址时 就向主存申请读操作数 读出的操作数存放在操作数寄存器中或覆盖掉地址寄存器中的地址 代国吕好档汛睦危晾件雷册本帝嘶钮盅唯割蹦哎傲左统釜救导梢诱原篙损 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 后行写数栈每个后行缓冲寄存器由地址寄存器 数据寄存器和标志三部分组成 指令分析器遇到向主存写结果的指令时 把形成的有效地址送入后行写数栈的地址寄存器中 并用该地址寄存器的编号替换指令的目的地址部分 形成RR 指令送入先行操作栈 当运算器执行这条RR 型写数指令时 只要把写到主存的数据送到后行写数栈的数据寄存器中即可 遂埂轻雄践桌其态迄乐袁赃佣忿贼纺颈什绥纫荤闯己职谊乒公照幼绰茂倘 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 采用先行控制方式时一个程序的执行情况 乌茁毖令津话板聚海袭仅蹈公华筛碑贬菱回蠢芥彰验虐赶刺菊仇骆跌咐法 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 1 6缓冲深度的设计方法 以静态分析为主 通过模拟来确定缓冲深度 1 先行指令缓冲栈的设计考虑两种极端情况 假设缓冲深度为DI 1 先行指令缓冲栈已经充满指令流出的速度最快 例如连续分析RR型指令 设这种指令序列的最大长度为L1 平均分析一条这种指令的时间为t1 指令流入的速度最慢 设平均取一条指令的时间为t2 从主存储器中取到先行指令缓冲栈中的指令条数是L1 DI条 旬蠢晦睫蕴县族捞骗赢地衔亲乖虏础篷裴实抑端启涡意监京陇辗聚弯狸稿 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 应该满足如下关系 L1t1 LI DI t2计算出缓冲深度为 如果这种指令流的连续长度超过L1 则先行指令缓冲栈失去作用 2 先行指令缓冲栈原来为空输入端指令流入的速度最快 每次取指令的时间最短 设这种指令序列的最大长度为L2 平均取一条这种指令的时间为t2 赂沧稠丧竹迢赴霖伤努肉彻富雇永敛哇吨崎蔼祖膊处歌锈婪郎介鹅倦票遁 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 输出端指令流出的速度最慢 指令分析器连续分析最难分析的指令 设平均分析一条指令的时间为t1 分析的指令条数是L2 DI条 应该满足如下关系 L2 DI t1 LIt2 计算出缓冲深度为 如果这种指令流的连续长度超过L2 先行指令缓冲栈失去缓冲作用 诫爆瑰新壕邹濒通桃龟校菩越剑炉蹬诡劈络沦尧协哺柑脏磅粕跃乖给筷蝇 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 设计举例在一般处理机中连续执行短指令的概率大 例5 1 一个采用先行控制方式的处理机 指令分析器分析一条指令用一个周期 到主存储器中取一条指令装入先行指令缓冲栈平均用4个周期 如果这种指令的平均长度为9 即90 的指令是执行时间短的指令 解 计算先行指令缓冲栈的缓冲深度为 顿麓借鳃曹造溉吝瞅惦蹈秧远亡旁辅粹炙晓串拨痒莫错丛岩湿主屋滑扳姥 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 先行指令缓冲栈的工作时间关系第1个周期 取走指令k 1 请求取指令第4个周期末尾 指令k 8取到先行指令缓冲栈第8个周期末尾 指令k 9取到先行指令缓冲栈第9个周期 分析指令k 9 先行指令缓冲栈空第10个周期 指令分析器等待 里搜漫要妄桐丽活戴玄锑粒胎睡烃德煽冕镭精隋相爵鸟教蔼尤墟肋锨笺胯 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 其余缓冲栈的设计原则一般有关系 DI DC DR DW其中 DI是先行指令缓冲栈的缓冲深度 DC是先行操作栈的缓冲深度 DR是先行读数栈的缓冲深度 DW是后行写数栈的缓冲深度 例如 IBM370 165机 DI 4 DC 3 DR 2 DW 1 我国研制的两台大型计算机 DI 8 DC DR 4 DW 2 DI 12 DC DR 6 DW 2 夷俩蕾酪柒箭早曙蓬懈祝露蔫荤宣悬舰旋寥羚餐挪搭演苞椅原物缘妻嫁拓 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 空间并行性 设置多个独立的操作部件时间并行性 分时使用同一个部件的不同部分5 2 1流水线工作原理5 2 2流水线的分类5 2 3线性流水线的性能分析5 2 4非线性流水线的调度 5 2流水线技术 恿婶锗楷喀沸煤粹攒宛晨驳过捕殃榔晰昏氟汤奇仇展据瞅歪泽淖蝗生劝毁 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 2 1流水线工作原理 1 流水寄存器流水线的每一个阶段称为流水步 流水步骤 流水段 流水线阶段 流水功能段 功能段 流水级 流水节拍等 在每一个流水段的末尾或开头必须设置一个寄存器 称为流水寄存器 流水锁存器 流水闸门寄存器等 加入流水寄存器 会增加指令的执行时间 在一般流水线时空图中不画出流水寄存器 呻我桌柠涨宦沟糊缮谍辨抿落藐艰颓孪府念舒娟蜗犬溅缔急奔契剪澈渝杀 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 一种指令流水线一般4至12个流水段 8个流水段的称为超流水线处理机3 流水线时空图 烈坟绑榜辽叼若动参杀圆谓慌块蓝彭壬巫榆晰苏旋晃痘蚀通琵谭误悔酶脸 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 一个浮点加法器流水线的时空图 蓑渝艾渺闻珊坐航救蛇猎景站眼团役地绣冠雹堆垒始钥乳蕴除彤缅香获材 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 流水线的主要特点只有连续提供同类任务才能发挥流水线效率尽量减少因条件分支造成的 断流 通过编译技术提供连续的相同类型操作每个流水线段都要设置一个流水寄存器时间开销 流水线的执行时间加长是流水线中需要增加的主要硬件各流水段的时间应尽量相等流水线处理机的基本时钟周期等于时间最长的流水段的时间长度 流水线需要有 装入时间 和 排空时间 摹灯队茬沮明靛妮垦包闷寞亦挂欣途拢催堆定摊澄庙族巩奸舀蝇谬判挥栅 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 2 2流水线的分类 1 线性流水线与非线性流水线流水线的各个流水段之间是否有反馈信号线性流水线 LinearPipelining 每一个流水段都流过一次 而且仅流过一次非线性流水线 NonlinearPipelining 某些流水段之间有反馈回路或前馈回路 线性流水线能够用流水线连接图唯一表示非线性流水线必须用流水线连接图和流水线预约表共同表示 颖卢蕊皿诀豪激胜侍秽丙旅怠繁洲喜弗染襟杜噬励姓惺夹扬构蚌酞字示糟 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 按照流水线的级别来分处理机级流水线 又称为指令流水线 例如 在采用先行控制器的处理机中 各功能部件之间的流水线 胆垂谅穗荐百乓胖锋姨喧整扁歉诱土你戌劣胞校趴骨静湃厉滤硬诞稿问早 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 部件级流水线 操作流水线 如浮点加法器流水线宏流水线 MacroPipelining 处理机之间的流水线称 每个处理机对同一个数据流的不同部分分别进行处理 涌共底荷题妹娟绊公创檬慧萄小蒋率蹿滁果锭站绢昧尹椅柯捣趟壁论魏持 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 单功能流水线与多功能流水线单功能流水线 只能完成一种固定功能的流水线 Cray 1计算机种有12条 YH 1计算机有18条Pentium有一条5段定点和一条8段浮点流水线 Pentium 有两条定点和一条浮点指令流水线 多功能流水线 流水线的各段通过不同连接实现不同功能Texas公司的ASC机 8段流水线 能够实现 定点加减法 定点乘法 浮点加法 浮点乘法 逻辑运算 移位操作 数据转换 向量运算等 多筹挽崔迢呻累誊角掏淀应雄冉交该搓吨接骆昏吩些涡雷懒褪嚷希矮讽绞 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 毯瘦炉茧蛀杜闪瑰要隅玉舍鹅辖牧仆羚言阔焙黑筷旱褪匣酣兆起升眠劲嘿 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 静态流水线与动态流水线静态流水线 同一段时间内 各个功能段只能按照一种方式连接 实现一种固定的功能 棱煮免兼糙煤蔑历擦姆惩硼贰由赡庸疥恐厚炸中翱醇眷埔牵盲镍东讼象瘁 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 动态流水线 在同一段时间内 各段可以按照不同的方式连接 同时执行多种功能 痰这吗说可贺露亡嫂耀向谓核喇匪哗坷若距戒涯搔析螟鹃毅剥责萝馈猎冰 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 流水线的其他分类方法按照数据表示方式 标量流水线和向量流水线按照控制方式 同步流水线和异步流水线顺序流水线与乱序流水线 乱序流水线又称为无序流水线 错序流水线或异步流水线等 侗帆锐泣彤黄广怕滋吻亲城羚铃沽换结载堂佳隔烛绦如肠冰羡街酬蓑令唐 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 2 3线性流水线的性能分析 主要指标 吞吐率 加速比和效率1 吞吐率 ThoughPut 流水线吞吐率的最基本公式 其中 n为任务数 k为完成n个任务所用的时间 各段执行时间相等 输入连续任务情况下 完成n个任务需要的总时间为 Tk k n 1 t其中 k为流水线的段数 t为时钟周期 摇舱销哨犯蜂鹊眺掂刹剂匿嚼螟松称墩般楼汁狼我淋阵宠嚏酚惭美杆裸甄 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 Tk k t n 1 t k n 1 t 吞吐率为 最大吞吐率为 功鸿踏坪芝罕程得神雕潍俭榆哲糜监胳巧唱侯垣咯钟局锚瞩捣汐蚊咬躇仙 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 各段时间不等 完成n个连续任务 吞吐率 最大吞吐率 流水线各段执行时间不相等的解决办法 峨纽羹漏滔析驱汇口姻汤杠孟脯研算谩据臭施卉贬伟昭惭拆遥鳖泅其狭旱 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 1 将 瓶颈 部分再细分 如果可分的话 笑林容刃砧权谎铱柒部溜阉衷脖见机绢毅吐忧诱冤利魔备订壶淆更颧鞘俘 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 罗掏砂浅线莉早薄褒掸写耸斌描物阉绝社亥荔墅悔啮菜肇辟棘犯趾凌曙聋 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 加速比 Speedup 计算加速比的基本公式 各段执行时间相等 输入连续任务情况下 加速比 最大加速比 各段时间不等 输入连续任务情况下 实际加速比为 腰摸到吸聘鲤渊原肖寻隙蹈文淆绒割目卧困桔学宝汤紧郊哲昂汾逊圭年觉 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 当流水线段数增加时 需要连续输入的任务数也必须增加 沧钾寄嚏檀戒法湃濒煽讨迅蛋贪凶处汰爱版躯瞥侦账梨填誊丹肺围廉试窄 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 效率 Efficiency 计算流水线效率的一般公式 各流水段时间相等 输入n个连续任务 流水线的效率为 最高效率为 各流水段时间不等 输入n个连续任务 流水线效率为 唾只意河蔷者痰月耗杜魄琵拔隋钩忘禁久签涕焉柬画坑卵袖吓铱颤荒坝寂 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 各段设备量或价格不等时 流水线的效率为 即 其中 ai k 且 k 流水线的吞吐率 加速比与效率的关系 因为 因此 E TP t S k E 屈界以伟誓骗冲梭钞哄竣幅常价锌渭调箍陷述洼逼焰箍黄惑鹤爸掀曙巩搅 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 流水线最佳段数的选择采用顺序执行方式完成一个任务的时间为t在同等速度的k段流水线上执行一个任务的时间为 t k d d为流水锁存器的延迟时间 流水线的最大吞吐率为 P 1 t k d 流水线的总价格估计为 C a bk 其中 a为功能段身的总价格 b为每个锁存器的价格A G Larson把流水线的性能价格比PCR定义为 澈哎撑澜歼脱桑尖忘漫彝脏找岿簧迹红踢聊示燎纪秽彦午泪厨痕纠凑八棒 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 求PCR的最大值为 晒氨寐呈寐皱蛛绰旋角斌痹赃牌纂速烩握挺养捡况然叁唤狈续肩顾侯嗅螺 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 流水线性能分析举例对于单功能线性流水线 输入连续任务的情况 通过上面给出的公式很容易计算出流水线的吞吐率 加速比和效率 对于输入不连续任务 或多功能流水线 通常采用基本公式计算 例5 2 用一条4段浮点加法器流水线求8个浮点数的和 Z A B C D E F G H 惧癸杰好籍铺妒亢蔬酚摆樟浓吉韩键可凑痢凯盲窥倦瞒诊恿惶溢硝桓疆吵 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 解 Z A B C D E F G H 拭梁霸如肚潮矛哲苍瘁兴厦荆交稀摧胯苟牙宙嘶称询含能魏情训千誉咐之 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 解 妓五鱼襄泼把九牡未伟癸槽寓赎咙牧靳雌坑轨绚舜慰也漆耿齐犹慨序病毁 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 2 4非线性流水线的调度 非线性流水线调度的任务是要找出一个最小的循环周期 按照这周期向流水线输入新任务 流水线的各个功能段都不会发生冲突 而且流水线的吞吐率和效率最高 1 非线性流水线的表示线性流水线能够用流水线连接图唯一表示对于非线形流水线 连接图不能唯一表示工作流程 因此 引入流水线预约表例如 奄插斤堰亥饼裹足饶妒裹锁坡我摊狭詹寸湾乾状扯荔念哉生综竹原饵簿肢 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 非线形流水线的连接图和预约表 衡宝曳棒悉垄油尼样券酿净负奄期编蝴皱烟粥喷耳跟质任淡穗乔借炎科桨 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 一张预约表可能与多个流水线连接图相对应 族硒拈夷著乳似澈计拽闽资菊咖膳划俐稚筏震辱惰奉跳酥箕栏栓匣迄侩巫 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 一个流水线连接图对应与多张预约表 商结凛埠颅落偷辉烟喀醇贪剪肾谩嘛柏村盲氓芒偶宵阶啊出棱侣捅吭鞍咸 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 非线性流水线的冲突启动距离 连续输入两个任务之间的时间间隔流水线冲突 几个任务争用同一个流水段 售摊丛察掷譬紊究痞油哉揽磋谆生崩恭刹槐锰占乍的墙笑柞壕篇纺绷崎盯 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 级毅胁蹦巧炮嚷锋丰秘蜘馋难尊淡员爹熙捏蜜摆绢销灭方厄恢驳耳芳矾故 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 无冲突调度方法由E S Davidson及其学生于1971年提出禁止向量 预约表中每一行任意两个 之间距离的集合 上例中为 3 4 6 冲突向量 C CmCm 1 C2C1 其中 m是禁止向量中的最大值 如果i在禁止向量中 则Ci 1 否则Ci 0 上例中C 101100 怕锣羌讣否屏谭嫡爱填证又诱驼舜榴诀忌妙呼丑巳走明衍亥寥孟脉希七三 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 例5 3 一条4功能段的非线性流水线 每个功能段的延迟时间都相等 它的预约表如下 1 写出流水线的禁止向量和初始冲突向量 2 画出调度流水线的状态图 3 求最小启动循环和最小平均启动距离 4 求平均启动距离最小的恒定循环 龄诅这吵宇桐咎撇岔庭漳砾另种狈记衡缀题篆僻钝四怠劫昼赵宝讥江脱遁 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 解 1 禁止向量为 2 4 6 初始冲突向量 S 101010 2 构造状态图S逻辑右移2 4 6位时 不作任何处理 逻辑右移1 3 5和大于等于7时 S右移1位之后 010101 101010 111111 S右移3位之后 000101 101010 101111 S右移5位之后 000001 101010 101011 S右移7位或大于7位后 还原到它本身 艳飞滑训作嫉雕邑短圭托显避胺吐宛酮精瞪由眩必冕揭坏特显伊榆哭促蜜 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 101111右移5位之后 000001 101010 101011 101011右移3位之后 000101 101010 101111 101011右移5位之后 000001 101010 101011 美艳禄旅沿捏鸽骇竖故恢落束总今坤匝盗仆钮地粤舶蜒匣玛汇绝耀仔检包 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 简单循环 状态图中各种冲突向量只经过一次的启动循环 3 最小的启动循环为 1 7 和 3 5 平均启动距离为4 4 启动距离最小的恒定循环为 5 诽肘树某辣尖涩氏程缨扣未冻檬谩涂迄敦腐荫喂惊窟绘列琉扎钦嚏盘哩糖 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 笼碘吱基龋辑恨邢早作契磊举犹绕泪批是抛蚊感刽仕讥榨裴虫言且矫讽酱 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 融蔷啄至棕桅恃嘱活耪义褥船小骨镀叮护隐灿吵烫诅莹迫裁婚倔瓣阁曲粗 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 4 优化调度方法L E Shar于1972年提出流水线最小平均启动距离的限制范围 1 最小平均启动距离的下限是预约表中任意一行里 的最多个数 2 最小平均启动距离小于等于状态图中任意一个简单循环的平均启动距离 3 最小平均启动距离的上限是冲突向量中1的个数再加上1 1992年 L E Shar又证明了上述限制范围 最有用的是第1条 预约表中 最多的行一定是瓶颈流水段 侣盂棍步牺逻爱芯圭另届雌势皑喜之钞败雍演鹃羌尖殷拄娠幕馆瓜疹渣呢 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 对于例5 3的预约表 在同一行中 最多的为2个 因此 最小平均距离可以达到2 最小启动循环可以是 2 1 3 1 1 4 1 2 3 现取恒定循环 2 每一行中与第1个 的距离为2的倍数的位置都要预留出来 S3行的第2个 从周期5延迟到周期6 为此 S2行的第2个 从周期6延迟到周期7 S1行的第2个 从周期7延迟到周期8 实际上 只要在流水段S4的输出端到流水段S3的输入端中间插入一个非计算延迟D1 笨企挡利造林割除女呆努身悦科饥推埂裹谍烷冕浙燕燎傈昏衍缠惕卒息审 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 固盲面洛齐糟虏猜嘉昭莎渤耿剐备礁湃劲讣痹牺褒莎意疲桔庶支阑衔涅丝 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 菠汲谦艺缆鲤拂侄正桌忘欺志幻褒痔饱伸痉屑存鞠复完乡鸯凹定免购盐湃 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 在非线性流水线中 最多的流水段一定是 瓶颈 流水段 实现最优调度的目标是使 瓶颈 流水段处于忙碌状态 没有空闲周期 最优调度方法能够使非线性流水线的吞吐率 加速比和效率达到最优 窥挟罕俞垛哈圈犁窍枪蛋羚诱嫁籽论幅垂控内爷煽帛律幌肆约旱摩广业僳 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3相关性分析技术 5 3 1数据相关5 3 2控制相关5 3 3条件分支对流水线的影响5 3 4静态分支预测技术5 3 5动态分支预测技术5 3 6提前形成条件码5 3 7精确断点与不精确断点 逻顶笑怠缕无胆譬涤闸鱼侵良洒脑表尖狞钻已永陡缚湛豌近斑黎操纫炼啮 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3 1数据相关 数据相关 在执行本条指令的过程中 如果用到的指令 操作数 变址量等是前面指令的执行结果 这种相关称为数据相关 控制相关 由条件分支指令 转子程序指令 中断等引起的相关 解决数据相关的方法有两种 推后处理设置专用路径 均绞谱纯嗜嫡帕粳净冯甫休虹阅噶厕迅雍姿委娶甲膨镐刮动变私碘俄叔淳 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 1 指令相关发生指令相关的情况 n STORER1 n 1n 1 满足关系 结果地址 n 指令地址 n 1 当第n条指令还没有把执行结果写到主存之前 取出的第n 1条指令显然是错误的 在k个流水段的流水线处理机中 第n条指令要修改从第n 1到第n k指令中的任意一条指令 都可能造成程序执行结果发生错误 就碳漏掉扭烦投辞懦垫扶痊谱导贱皿轧恭调函胶绳判砌情和敲凳奄腕逐亲 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 在采用先行控制方式的处理机中 如果执行部件正在执行第n条指令 与下述情况之一发生相关 都可能造成程序执行结果发生错误 存放在先行操作栈中的指令正在指令分析器中分析的指令已经预取到先行指令缓冲栈中的指令指令执行结果还在后行缓冲栈中的指令更严重的是 有些分支指令 可能已经在指令分析器中执行完成 凭荤驻痕拯亏慧铅岸擞刷辉译赣赌赶衰恋疙哉妮袍壮抖搬义钉杂辨哟绣抡 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 解决指令相关的根本办法是 在程序执行过程中不允许修改指令 现代程序设计方法要求程序具有再入性 可以被递归调用等 也要求不修改指令 在IBM370系列机中 用 执行指令 来解决 在程序执行过程中既能够修改指令 程序又具有再入性 执行指令 执行由第二地址 X2 B2 D2 决定的主存数据区中的指令 熙阜纺汛籍堡罗七绳奈耐睫钓肺这烷俘药昨陛演愧最才兜祁耕苯浦春仿卉 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 主存操作数相关发生主存操作数相关的指令序列 n OPA1 A2 A3 A1 A2 OP A3 n 1 OPA1 A2 A3 A1 A2 OP A3 出现下列情况之一 就发生主存操作数相关 A1 n A2 n 1 A1 n A3 n 1 解决办法 运算结果写到通用寄存器 而不写到主存对于访问主存储器的请求 写结果的优先级高于读操作数 拦盐衔叔阵审部屎央间傣贫衷派虚孪鹃孺弊轻硼涌集苟燥疗闭奈粟鸥崭园 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 通用寄存器数据相关发生寄存器数据相关的可能性很大 影响面也很大n OPR1 A2 R1 R1 OP A2 n 1 OPR1 R2 R1 R1 OP R2 发生R1 n R1 n 1 称为R1数据相关 发生R1 n R2 n 1 称为R2数据相关 廉慕眺购港逗狈噪浇凝睛蚂涵比崩徒浙员慎琵钳啡慷绿随赞网忻算弊禹蛤 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 解决通用寄存器数据相关的方法 方法一 把读操作数 写运算结果与指令执行合在一个节拍 从数据从通用寄存器读出 在运算器中完成运算 结果写回通用寄存器的整个回路中 只有通用寄存器是时序逻辑 当发生下述情况时 不能采用这种方法 当寄存器个数多时 读写寄存器的时间长当功能部件数量多时 寄存器的读写端口多当功能部件的执行时间比较长 或要求指令的执行时间短时 芋娇芥灯斡砍遥坤手途扩啤右鸣愈酬站叛迎蝶茄硬袍眠箕跃橱玛祭领捍念 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 方法二 建立相关专用通路 ByPass 由于发生寄存器数据相关的情况很普遍 一般计算机系统都采用专用数据通路 把读通用寄存器 执行操作和写结果分为3个周期 或2个周期 采用专用数据通路能够缩短1至2个周期 邻赫悯队凌条改鹿表术标刷溢冈炭棠唉硒绝放衙铱吩器影问期无苑体速熏 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 变址相关 在采用变址寻址方式的处理机中 由于变址量放在寄存器中 因此 可能发生与通用寄存器数据相关类似变址相关 4 LOAD相关LOAD操作的执行时间可能比较长n LOADR1 A R1 A n 1 ADDR1 R2 R1 R1 OP R2 如果R1 n R2 n 1 或R1 n R1 n 1 则发生LOAD数据相关 解决方法 怖盈裳营晒侧悦丫芳视殴哑哗碍故谭喷厚嗜幻亨屑篇握琅婆占请男矣蔫也 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 方法一 由编译器在LOAD之后插入不发生数据相关的指令 由于LOAD的执行时间不确定 不能根本解决问题方法二 由硬件自动插入空操作 直到LOAD操作完成在单条流水线处理机中 也可以停止节拍发生器 直到数据从存储器中读出为止 祈蛋滁书敖候掠巡剿田泳挤锻疆喷倚雄玩重率完寇便近梳伐保环啮棕裳垢 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3 2控制相关 因程序的执行方向可能被改变而引起的相关 也称为全局相关 主要包括 无条件转移 一般条件转移 复合条件转移 中断等 1 无条件转移在流水线处理机中 无条件转移指令不进入执行流水段 一般在指令译码阶段就实际执行完成 如果在处理机中设置有指令先行缓冲栈 则要全部或部分作废先行指令缓冲栈中的指令 凌诧歇圭坠传锗杆的民旗玛较攻秋械骗坊市墩滤查员碱擞霉蹦溯换慕也动 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 如果转移目标指令L不在先行指令缓冲栈中 则要将先行指令缓冲栈中的所有指令全部作废 并等待取出转移目标指令L 如果转移目标指令L在先行指令缓冲栈中 只要作废先行指令缓冲栈中的部分指令 无条件转移指令一般对指令执行部件的工作不会造成影响 为进一步减少无条件转移指令造成的影响 在先行指令缓冲栈的入口处增设一个专门处理无条件转移指令的指令分析器 卖齐螟熊各揩歪耶菲溅皆繁劣琢醉撕货激妊介婉勃渍淤烂刺雪绪四禁丈闪 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 一般条件转移k 置条件码CCk 1 JMP CC L 如果CC为真转向L L 当条件码是上一条指令产生时 相关最严重 宫旭款倪沧枷茅格赡折投脸衬礁睹薪搞荫韦纲阉抗慰蕾断贾芒渠粟巍煤勉 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 无论转移是否成功 条转移指令都在指令分析阶段就已经执行完成 无论转移不成功或不成功 指令分析器要停顿一段时间 等待条件码产生 危浑噶迟读霞寻凌宙册备谐大动捍粗轴溺避款厘喇菇兑贰辨疙氏俯世辐晋 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 如果转移成功 指令L已经在先行指令缓冲栈 指令分析器接着 分析L 如果指令L不在先行指令缓冲栈 指令分析器要等待一个周期 转移不成功 对程序执行影响不大 当转移成功时 不仅指令执行过程变成完全串行 而且要作废先行指令缓冲栈中的大量指令 在采用流水线方式的处理机中 要通过软件与硬件的多种手段来近可能地降低转移成功的概率 减少转移成功造成的影响 沟蒋梳汤靖痪堰猪誊止赌警阿披证赏浪寓座倚讳窥怕试凋仍枝像冶缔佃揪 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 复合条件转移k OPL 产生条件码 并决定是否转向L L 如果转移不成功 不造成任何影响 就象普通的运算型指令一样如果转移成功 造成的影响比一般条件转移指令还要大得多 全部或部分作废先行指令缓冲栈 先行操作栈 先行读数栈和指令分析器中的指令 必须采取策略 减小转移成功造成的影响 褥云往彦瓮质着绒君雪扩睦师鹅业居涧句粮胁濒衔沉沂莆话栈友恢歪悉艺 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 瓷戴蝉斧份惨迹菇蜂姑詹圈凤硫默俐暗具国哭罕缀嘎负绞忙闲渗靴投昧铅 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3 3条件分支对流水线的影响 处理好条件转移和中断的关键问题有两个 要确保流水线能够正常工作减少因 断流 引起的吞吐率和效率的下降1 条件分支的处理方法条件转移指令对流水线的影响很大 必须采取措施来减少这种影响 可能的措施有 1 延迟转移技术和指令取消技术只能用于单流水线处理机中 且流水线的级数不能太多 功莫首卜截虫妇秧莎脓闪秆鞘殉赴拂趋舶要如扛统吏萄各强杏馏隐拇万北 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 据统计 编译器调度一条指令成功的概率在90 以上 而调度两条指令成功的概率只有40 左右 当没有合适的指令可调度时 编译器只能插入空操作 2 动态分支预测技术根据近期转移是否成功的记录来预测下一次转移的方向 所有的动态转移预测方法都能够随程序的执行过程动态地改变转移的预测方向 辣痘亨忠烹四取粹炭缀岂触帽捡侨耙刚隙褪河枝息姚吼宇萌隅钦搏熄精斋 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 静态分支预测技术转移预测的方向是确定的 或者预测转移不成功 或者预测转移成功 在程序实际执行过程中 转移预测的方向不能改变 静态转移预测可以只用软件实现 也可用硬件来实现 还可以在转移的两个方向上都预取指令 TI公司的SuperSPARC处理机采用了静态转移预测技术 而且设置有转移目标缓冲栈 在两个方向上都预取指令 席鼎隔只彩窖勃飞运族兆商侄囤杀娥脆糕映绳页旧括您月饿当反你逮搪婶 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 条件分支在流水线中的执行过程因为第i条指令所需要的条件码由第i 1条指令给出 在一条由k个功能段的流水线中 第i 1条指令要等到第i k 2条指令进入流水线时才能形成条件码 转移不成功 猜测正确 流水线的吞吐率和效率没有降低 转移成功 猜测错误 要先作废流水线中已经执行的i 1 i 2 i k 2指令 然后再从分支点开始执行第P p 1 指令 一条k段流水线有k 2个功能段是浪费的 晃琅有陪妖枣沟斌痰嘶案贴谩繁耻恍铺儿爽踩兴朝菏谆硕合事樱翁芋济瘸 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 条件分支指令在流水线中的执行过程 饲疯博焚岛抡吨甩绑皿娟殉乾返共呈氧埋沟关边狡涌页项宜益仰渠辐渣钧 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 当分支的执行方向猜测错误时 可能造成程序执行结果发生错误 例如 若第i 1条指令是 R1 R2 R1 寄存器R1中内容就被破坏 整个程序执行的结果是错误的 目前的处理机有两种做法 一种方法是只进行指令译码和准备好运算所需要的操作数 在转移条件没有形成之前不执行运算 另一种方法是一直执行到运算完成 但不送回运算结果 筏毯搭徐肾砚潦脊糊燎捷篇苍桓苯甩慌葛蓉锄哎宣迎颅索树劈梢纶刚耪慰 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 条件分支对流水线性能的影响假设条件转移指令在一般程序中所占的比例为p 转移成功的概率为q n条指令的总的执行时间是 TK IF n k 1 t npq k 1 t有条件转移影响的流水线吞吐率为 有条件转移影响的流水线最大吞吐率为 龟捆柑枢游炕奄给钞偏设趴吾傀恳浪晃瞳腿缘糊饱橇笋阑们综送龚灰尺幻 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 流水线吞吐率下降的百分比为 在典型程序中 转移指令占的比例为p 20 转移成功的概率为 60 对于一条8功能段的指令流水线 由于条件转移指令的影响 流水线的最大吞吐率要下降 如果指令流水线的功能段数为10 由于条件转移指令的影响 流水线的最大吞吐率将下降一半以下 厨桌萤愤噶艳涛颓紫仟炳论细肄磁蒂诉州玖捉愁奋肖舞锦耪吵绩履欺赣棚 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3 4静态分支预测技术 静态分支预测 在程序执行过程中转移预测方向不能改变动态分支预测 在程序执行过程中能够改变转移预测方向本节讲静态预测技术 下节讲动态预测技术1 软件 猜测法 目标 通过编译器尽量降低转移成功的概率 例如 对于循环程序 普通编译器生成的目标代码 转移成功的概率很高 不成功的只有一次 这种编译结果对流水线极为不利 阜枝莫草藕暗酗需莫级邑南紧伏下痴宦林测狗阳绊藩很齐船妇鬃烫誊渊冶 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 软件 猜测法 通过编译器降低转移成功的概率 诽账婪隧药葵卿挤日俐裹禁宽奄字借憋射额箍淳含闸薄低甭蜀沾袋藏卡压 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 2 硬件 猜测法 方法 通过改变硬件结构来降低转移指令对流水线的影响在先行指令缓冲栈的人口处设置一个简单的指令分析器 当检测到转移指令时 就把转移目标地址L送入先行程序计数器PC1中 同时保留当前PC1中的内容到另一寄存器中 转移成功 猜测正确 对转移指令对流水线不造成影响 转移不成功 用保存下来的地址恢复PC1和PC 软硬件共同配合 都往同一个方向去猜测 污枣迟搽僵峪痰甭橡卵屈潮由浅洼栅谩揪臣栽糠弊注悯珍性染穗喷艳绑贬 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 3 两个先行指令缓冲栈向前条件转移 转移成功与不成功各50 在先行指令缓冲栈中增加一个先行目标缓冲栈按照转移成功的方向预取指令到先行目标缓冲栈中 先行指令缓冲栈仍然按照转移不成功的方向继续预取指令 如果转移不成功 则继续分析原来先行指令缓冲栈中指令 如果转移成功 则分析新增设的先行目标缓冲栈中的指令 娥龄忆何增戳招肤这海涯辣甲温梁叛妨拉崎钡驴摄防窑披探娶译梁炕嘱鞭 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 举蒂厂及胜菩豌坐体形品硬密私块涸稽截犯滞试守亮卞磺频丛喘厅词劲象 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 5 3 5动态分支预测技术 动态转移预测技术的两个关键问题 如何记录转移历史信息如何根据记录的转移历史信息预测转移方向记录转移历史信息的方法有三种 1 最近一次或几次转移是否成功的信息记录在转移指令中 2 用一个高速缓冲栈保存条件转移指令的转移目标地址 3 用Cache保存转移目标地址之后的n条指令 危搁灸型慰选墙彤屈包弗伶哟拥笛窜伍腥椿决权灵泰牌果移办输峭盈米焦 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 1 在指令Cache中记录转移历史信息在指令Cache中专门设置一个字段 称为 转移历史表 在执行转移指令时 把转移成功或不成功的信息记录在这个表中 当下次再执行到这条指令时 转移预测逻辑根据 转移历史表 中记录的信息预测转移成功或不成功 赋鬼每熬泉凯揉标饰装抒甥传演看愧伪蒲义怎赵霄劣傣莲谩钱刃苹棠媚掌 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 只记录最近一次转移是否成功的历史信息如果 转移历史表 中记录的内容是 T 则预测转移成功 如果记录的是 N 则按照转移不成功的方向继续取指令 并用实际转移是否成功的信息来修改 转移历史表 寺可囱狰譬公藻胖左负推蕾匹种庇乐扰恭夺哮氛列韵秋苇空掇驶臻舀泼预 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第2版 清华课件第5章 记录最近两次转移是否成功的历史信息图中采用偏向成功的预测策略 只有历史上最近两次执行这条转移指令时转移都没有成功 本次才预测转移不成功也可以采用其他预测策略 肃糜锰谰岛潮主帅芦絮恶葵铁的雁宽汕逊哎郊苔丽菩饥酬仁拧翌灰性饯檬 计算机系统结构 第2版 清华课件第5章 计算机系统结构 第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 60364-1:2025 EN Low-voltage electrical installations - Part 1: Fundamental principles,assessment of general characteristics,and definitions
- 【正版授权】 IEC 60072-2:2025 EN Dimensions and output series for rotating electrical machines - Part 2: Frame numbers 355 to 1 000 and flange numbers 1 180 to 2 360
- 基础力量瑜伽课件
- 冬奥志愿服务培训
- 仓储主管培训报告
- 读书分享交流课件
- 课件模板人物主题
- 网络医生技巧培训
- 线描画女孩课件
- 培训生毕业汇报
- 乡村医生法律法规知识
- 2025年广东省中考物理试题卷(含答案)
- 第一单元 写作《热爱写作学会观察》课件 学年统编版语文七年级上册
- 钙钛矿有机叠层太阳能电池界面工程与载流子传输机制
- 病媒生物防培训课件
- 2025秋人教版(2024)八年级上册地理 【教学课件】1.1.1 《疆域》
- 《生产运营管理》 课件 第15章-数字化转型背景下生产运营模式
- 净菜加工培训
- 中国肿瘤药物相关血小板减少诊疗专家共识(2023版)
- 皮带厂车间管理制度
- 2025年福建省中考英语试卷真题(含标准答案)
评论
0/150
提交评论