计算机系统结构(第八讲).ppt_第1页
计算机系统结构(第八讲).ppt_第2页
计算机系统结构(第八讲).ppt_第3页
计算机系统结构(第八讲).ppt_第4页
计算机系统结构(第八讲).ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机系统结构 (第八讲),厦门大学计算机科学系 陆达 2004年12月13日,第五章 标量处理机,5.3.2 超流水线处理机,什么是超流水线处理机? 这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机 超流水线处理机:流水线的级数8 超标量处理机:是以增加硬件资源为代价来换取处理机的性能;空间并行性 超流水线处理机:只需增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机的性能;时间并行性,5.3.2.1 指令执行时序,在一个时钟周期内能够发射n条指令,每隔1/n个时钟周期发射一条指令 图5.79:超流水线处理机的指令执行时空图 (每个时钟周期分时发射2条指令) 功能段可以进一步细分: “译码(ID)功能段”=“译码”流水级+“取第一个操作数”流水级+“取第二个操作数”流水级,5.3.2.2 典型处理机结构,CRAY-1、CDC-7600:n=3 SGI公司的MIPS(microprocessor without interlocked piped stages):R2000、R3000、R4000、R5000、R10000 图5.80:MIPS R4000超流水线处理机结构 两个Cache:指令Cache、数据Cache 整数部件:通用寄存器堆、ALU、装入对准器/存入驱动器、整数乘法/除法部件 浮点部件:浮点通用寄存器堆、浮点乘法部件、浮点除法部件、浮点加法/转换/求平方根部件、浮点控制器、浮点流水线专用通路,图5.81:MIPS R4000处理机的流水线操作 8级流水线、每个时钟周期包含两个流水线,图5.82:MIPS R4000正常指令流水线工作时序 一个时钟周期内,流水线执行完成了两条指令,图5.83:LOAD指令引起的流水线暂停 暂停一个时钟周期(两个流水线周期),5.3.2.3 超流水线处理机性能,在一台指令级并行度为(1,n)的超流水线处理机上,执行N条没有数据相关和控制相关的指令所需要的时间为: T(1,n)=k+(N-1)/n*t n:每个时钟周期分时发射的指令的条数 N:需要执行的指令条数 k:指令流水线的功能段数 k*n:指令流水线的级数 加速比: S(1,n)=T(1,1)/T(1,n)=n*(k+N-1)/(n*k+N-1) S(1,n)max=n,5.3.3 超标量超流水线处理机,超标量处理机:在一个时钟周期内发射多条指令;主要开发空间并行性,依靠多个操作在重复设置的操作部件上同时执行来提高程序的执行速度 超流水线处理机:把一个时钟周期细分为多个流水线周期,每一个时钟周期能够发射并执行完成多条指令;主要开发时间并行性,在同一操作部件上重叠多个操作,通过使用较快时钟周期的深度流水线来加快程序的执行速度 超标量超流水线处理机:超标量处理机+超流水线处理机,5.3.3.1 指令执行时序,图5.84:超标量超流水线处理机的指令执行时空图 在一个时钟周期内要发射指令n次,每次发射指令m条,每个时钟周期共要发射指令m*n条,5.3.3.2 典型处理机结构,DEC公司的Alpha 21064处理机结构(图5.85) 四个部件: (1)、整数执行部件(EBOX) (2)、浮点执行部件(FBOX) (3)、地址部件(ABOX) (4)、中央控制部件(IBOX) 两个Cache: (1)、指令Cache (2)、数据Cache 采用顺序发射乱序完成的方式控制指令流水线,图5.86:Alpha 21064处理机的指令流水线结构 三条指令流水线: (1)、整数操作流水线(7级) (2)、访问存储器流水线(7级) (3)、浮点操作流水线(10级) 每个指令流水线的前四个流水级(IF、SWAP、I0、I1)采用静态流水线 每个指令流水线的后36个流水级采用动态流水线 Alpha 21064处理机:每个时钟周期能够发射两条指令;三条指令流水线的平均级数为8级;属于超标量超流水线处理机,5.3.3.3 超标量超流水线处理机性能,在一台指令级并行度为(m,n)的超标量超流水线处理机上,连续执行N条没有资源冲突,没有数据相关和控制相关的指令所需要的时间为: T(m,n)=k+(N-m)/(m*n)*t m:每个时钟周期同时发射指令的条数 n:每个时钟周期分时发射的指令的条数 k:指令流水线的时钟周期 N:需要连续执行的指令的条数 加速比:S(m,n)=T(1,1)/T(m,n)=m*n*(k+N-1)/m*n*k+N-m S(m,n)max=m*n,图5.87:三种指令级并行处理机的相对性能 横坐标:处理机的设计指令级并行度(m*n) 纵坐标:处理机能够达到的实际指令级并行度 结论: (1)、超标量处理机相对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低; (2)、一般认为m和n都不要超过4; (3)、一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的,这个最大值主要由程序自身的语义来决定,与这个程序运行在那一种处理机上无关。,本章总结,先行控制技术 流水线处理机 超标量处理机、超流水线处理机、超标量超流水线处理机,先行控制技术,缓冲技术:在工作速度不固定的两个功能部件之间设置缓冲栈,用以平滑它们的工作(设置四个缓冲栈) 预处理技术:把进入运算器的指令都处理成寄存器-寄存器型(R-R型)指令,它与缓冲技术相结合,为进入运算器的指令准备好所需要的全部操作数,先行控制技术 -缓冲技术,图5.3(p256) 先行缓冲栈(先行控制器) (1)、先行指令缓冲栈 (2)、先行读数栈 (3)、先行操作栈 (4)、后行写数栈 缓冲深度(静态分析方法),先行控制技术 -数据相关,包括指令相关、主存操作数相关、通用寄存器相关、变址相关 解决数据相关的方法: (1)、推后分析法 (2)、设置专用路径,先行控制技术 -控制相关(1),无条件转移指令、一般条件转移指令、复合条件转移指令、子程序调用指令、中断指令 “吸收型”指令(无条件转移指令、一般条件转移指令):在指令分析器就执行完成,不需要送入先行操作栈和指令执行部件,先行控制技术 -控制相关(2) 转移预测技术,在采用先行控制方式的处理机中,采用的技术: (1)、软件“猜测法” (2)、硬件“猜测法” (3)、两个先行指令缓冲栈,先行控制技术 -控制相关(3) 短循环程序的处理,两种方法: (1)、在指令系统中设置专门的短循环程序的开门指令和关门指令 短循环标志触发器TL (2)、用专门的硬件来识别短循环程序,目的是使短循环程序的处理对程序员透明,流水线处理机,空间并行性: 在一个处理机内设置多个独立的操作部件,并让这些操作部件并行工作 多操作部件处理机和超标量处理机 时间并行性: 采用流水线技术,流水线处理机 -时空图,流水线处理机 -流水线的分类,线性流水线与非线性流水线 流水线的级别 单功能与多功能流水线 静态流水线与动态流水线,流水线处理机 -线性流水线的性能分析,衡量流水线性能的主要指标有: (1)、吞吐率 (2)、加速比 (3)、效率 (4)、流水线的最佳段数,流水线处理机 -非线性流水线的调度技术,非线性流水线调度的任务:要找出一个最小的循环周期,按照这个周期向流水线输入新任务,流水线的各个功能段都不会发生冲突,而且流水线的吞吐率和效率最高,流水线处理机 -局部相关,局部相关有三种: (1)、“先写后读”数据相关, “写读”相关,“WR”或“RAW” (2)、“先读后写”数据相关, “读写”相关,“RW”或“WAR” (3)、“写-写”相关,“WW”或“WAW”,流水线处理机 -全部相关,什么是全局相关? 由条件转移或程序中断引起的相关称为全局相关,也称控制相关 关键问题: 一是要确保流水线能够正常工作;二是要减少因“断流”引起的吞吐率和效率的下降,超标量处理机与超流水线处理机,基准标量处理机(scalar processor):一台普通的单流水线处理机 超标量处理机(superscalar processor):同时发射m条指令 超流水线处理机(superpipelining processor):机器流水线周期=1/n 超标量超流水线处理机(superpipelining superscalar processor):同时发射m条指令,机器流水线周期=1/n ILP(instruction level parallelism):指令级并行度,第六章 向量处理机,向量处理机已成为解决数值计算问题的一种最重要的高性能结构 绝大多数向量处理机都采用流水线结构 向量处理机与串行处理机相比,向量运算吞吐率要高出12个数量级 本章的目的:描述向量处理机的一般结构;讨论算法和结构如何配合才能高效地处理多类计算机的问题,6.1 向量处理的基本概念,6.1.1 什么是向量处理,例子: FORTRAN语言程序 在一般计算机上的实现(指令序列) 在向量计算机上的实现(向量指令) 一条标量指令只能处理一个或一对操作数 一条向量指令可以处理N个或N对操作数,6.1.2 向量处理方式,三种类型: (1)、横向处理方式 适用于一般的处理机(标量处理机),不适用于向量处理机的并行处理 (2)、纵向处理方式 适用于向量处理机,对存储器的信息流量要求较高 (3)、纵横处理方式 可以降低对存储器信息流量的要求,也减少访问存储器发生冲突所引起的等待时间,提高了处理速度,6.2 向量处理机的结构,图6.1:一种能实现两个向量相加的流水结构的加法器,向量处理机对存储器的带宽要求高(至少3倍于一般的存储器系统) 流水线运算器是向量计算机的核心部件 两种方法: (1)、存储器-存储器结构 如N个独立的存储模块 (2)、寄存器-寄存器结构 中间存储器的容量较小,所以存取速度比较快,从而获得较高的带宽,6.2.1 存储器-存储器结构,图6.2:一个具有由8个三端口存储器模块组成的存储器系统的向量处理机 主存储器:8个模块,图6.3:向量A,B,C在存储器系统中存放的情况,一个存储周期占两个处理机周期 图6.4:两个向量在流水线方式下分量相加的时序图,图6.5:流水结构运算器的输入和输出端增加可变延迟器 目的是为了消除争用存储器的现象,向量A的输入缓冲器延迟两个时钟周期,输出缓冲器延迟四个时钟周期 图6.6:存储器发生冲突时两个向量相加的时序图 整个向量运算过程比图6.4所示的时序延长了6个时钟周期,图6.7:一种与CDC STAR相似的系统结构 延迟时间可根据输入向量和结果向量的第一个元素的位置来设置,图6.8:一个由多抽头延迟线构成的可变延迟器,图6.9:实现可变延迟的另一种方法 用一个两端口存储器实现可变延迟器,6.2.2 寄存器-寄存器结构,使主存有较高带宽的另一种方法是由一级或多级中间存储器形成一个层次结构的存储器系统,其中带宽最高的这一级存储器安排在距处理机最近的位置,图6.10:一种基于分级存储系统的系统结构(简化的Cray 1) V寄存器:中间存储器、向量寄存器 S寄存器:中间存储器 T寄存器:中间存储器 A寄存器、B寄存器 指令缓冲寄存器,存储器和流水线之间的密切配合: (1)、第一种结构是依靠主存来保证流水线所需要的操 作数; (2)、第二种结构是通过容量比主存小得多的中间存储 器即寄存器来保证很高的带宽。,Cache存储器对向量运算的影响: (1)、如果Cray 1中的V寄存器采用Cache结构, 那么命中率会提高吗? (2)、向量计算机中的Cache容量应该多大? (3)、Cache的容量是否应足以容纳几个完整的向量? (4)、Cache的容量是否应小一些,不是容纳几个完整 的向量,而是只须容纳多个不同向量的部分分量?,旅游审美文化,7,陆游;沈园 城上斜阳画角哀, 沈园非复旧池台。 伤心桥下春波绿, 曾是惊鸿照影来。 柴埠溪;情人岩, 如笛卡儿所说 :“同一件事情可以使这批人高兴的要跳舞 ,却使另一批人伤心的要流泪。” 如菊花 中国与西方山水审美观的差异是十分明显的。在人与自然的关系方面,中国哲学主张“天人合一”,“物我一体”,而西方哲学则主张天人对立,物我对立。这种哲学观念的差异,必然导致山水审美观的分岐。 一)、中国人特别关注山水景观所附载的人文美 ;而西方则关注山水景观本身的自然美 滕王阁序 “落霞与孤鹜齐飞 ,秋水共长天一色。” “ 关关睢鸠,在河之洲,窈窕淑女,君子好逑”, 车尔尼雪夫斯基这样来描写水 :“水由于它的形状而显现出美 ,辽阔的、一平如镜的宁静的水在我们的心理产生宏伟的形象。奔腾的瀑布 ,它的气势是令人震惊的 ,它的奇怪特殊的形象也是令人神往的。水 ,由于它的灿烂透明 ,它的淡青色光辉而令人迷恋 ,水把四周的一切如画地反映出来 ,把这一切屈曲地摇曳着 ,我们看到的水是第一流的写生画家。”,二)、中国人的旅游审美集中于抒情的印象重现 ;西方人的旅游审美则集中于风景的对象描写 艺术家林风眠先生提出 :东西风景画表现方法的不同 ,实则是东西风景审美不同。1,中国的风景画“尺幅之间见深远” ,不讲究比例尺寸 ,更接近于概括与含蓄的真实。 “图外有画 ,咫尺千里 ,余味无穷”、“只见片断 ,不逞全形” ,以表现情绪为主 ,各家皆饱览山色而在情绪浓厚时一发其胸中之所积 ,所画皆系一种印象 ,从来很少对着画的。而西方的风景画是对象的描写 ,以模仿自然为能事。 2,中国国画采取非科学的“散点透视”方法 , 不重阴影明暗 ,不讲层次。立体感不强 ,虚实也不明晰 ,但却气韵生动 ,其内在精神与韵致得到充分表达 ,是谓神似。西画借助焦点透视法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论