第5章 重叠、 流水和向量处理机.ppt_第1页
第5章 重叠、 流水和向量处理机.ppt_第2页
第5章 重叠、 流水和向量处理机.ppt_第3页
第5章 重叠、 流水和向量处理机.ppt_第4页
第5章 重叠、 流水和向量处理机.ppt_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章溢流说唱乐、流水和矢量处理器、5.1溢流说唱乐解释方式5.2流水方式5.3矢量流水处理和矢量流水处理器5.4指令水平高度并行的超级处理器、5.1溢流说唱乐解释方式、5.1.1基本思想和一次溢流说唱乐、图5.1一个机器指令的解释图5.2指令的顺序解释和过说唱乐解释图5.3主过说唱乐运作模式,其中图5.4第k条指令为条件转变,并且如果通过在Von Neumann型装置上执行第k条指令来以可修改的方式形成第k 1条指令,则例如,存在k :通用暂存器; (通用暂存器)这是错误的,因为k 1 k 1:在“执行k”的末尾形成第k-1个指令,因此在一次重叠的时间关系中“分析k 1”已经捕获了较晚的第k

2、-1个指令的旧内容。 为了避免错误,第k、k 1个指令不能解释为云同步,这时在这些个的2个指令之间发生了“指令关联”。 具体地,在n个指令可以被缓冲技术地存储在指令缓冲器中的情况下,如果执行到第k个指令,则可能与先前读取的指位的第k-1至k-n个指令一起发生指令相关性。 缓容量越大,或者指令的预处理能力越强,表示指令相关的概率越高。5.1.2相关处理、1 .指令相关处理、“执行”指令是IBM 370机器为此而设定的指令,在执行到“执行”指令时,以推一推形式显示第2指令(X2) (B2) D2地址的图5.5 IBM 370“执行”指令图5.6关于主存储数的处理、3 .关于通用暂存器组的处理设备的

3、基本指令格式或图5.7指令解释过程中的关于通用暂存器内容的微操作时间关系、在图5.8“”通用暂存器定径套中网站数据库的时间关系在图5.9中通过相关专用路径解决通用暂存器的数相关,操作通常,“分析”周期与主存储器周期相等,因此在时间关系上要求在“分析”周期的前半部分,从通用暂存器输出男低音取得(B2 ),传送给地址加法器。 由于运算结果在“执行”循环的最后被发送到通用暂存器定径套,因此不能立即出现在通用暂存器输出男低音中。 也就是说,毋庸赘言了发送到通过“执行k”得到的通用暂存器的运算结果不能作为“分析k 2”的基础地址值使用,不能作为“分析k 1”的基础地址值使用。 因此,基值相关器(b相关器

4、)不仅出现一次相关而且出现二次相关器,尽管它们是一次重叠。 即,如果B(k 1)=L3(k )出现,则可以称为发生b一次相关。 另一方面,当B(k 2)=L3(k )出现时,如图5.10中所示,可能发生b二次相关。图5.10 B一次相关和二次相关、图5.11 B一次、二次相关的后推处理、图5.12 B相关专用通路法、5.2流水方式、5.2.1基本概念、1 .流水是重叠的补充,图5.13指令分解为“分析”,图5.15处理器间的流水处理、图5.16 a 图5.17静态动态多功能输油管道时-空图例,图5.18非线性输油管道例,5.2.2输油管道处理器的主要性能,吞吐量是输油管道单位时间内能够流出的塔

5、斯克数或结果数。 另外,在图5.14的流水线例中,各子路径的经过时间为t2,全负荷后,流水线每t2解释一个指令,其最大吞吐量TPmax为1/t2。 实际上,由于每个子进程的操作不同,经过时间不一定相同,因而如上所述,在每个子进程之间设置接口锁存器,使得各锁存器利用相同的时钟脉冲来同步。 时钟脉冲的周期直接影响输油管道的最大吞吐量,优选总是越小越好。 如果各个子过程需要的时间分别是t1、t2、t3、t4,则时钟周期是maxt1、t2、t3、t4,即输油管道的最大吞吐量,被限制为输油管道中最慢的子过程需要的时间。将输油管道中经过时间最长的子进程称为瓶颈子进程。 此外,图5.19的最大吞吐量取决于瓶

6、颈阶段的时间,而图5.20的瓶颈子过程进一步细分,其中图5.21的瓶颈子过程是并行的,并且如果m级输油管道的每一级的经过时间都为t0,则第一指令从流入到流出的T0=mt0的流水建立时间这样,需要时间T=mt0 (n-1)t0来完成n个任意塔斯克的解释。 从这其间、输油管道的实际吞吐量(图5.22点空间图)对实际吞吐量进行分析,发现实际的吞吐量不仅总是小于最大吞吐量,而且仅在nm时能够使实际吞吐量接近理想的最大吞吐量。 当以加速比(Speedup Ratio,Sp )来表示输油管道方式相对于非输油管道序列方式的提高速度之比时,非输油管道序列方式进行动作,因为连续完成n个塔斯克需要nmt0的时间,

7、所以输油管道方式动作的加速比在、 如果线性输油管道的各段所经过的时间ti不同,则其瓶颈段的时间为tj,完成n个塔斯克而可实现的实际吞吐量是指该加速比。2 .效率线的效率是指线中的设备的实际使用时间占运行时间整体的比,也称作线设备的时间利用率。 由于输油管道存在确立时间和排气时间(到最后的塔斯克流入流出的时间),所以在连续完成n个塔斯克的时间,各段不一定完全运转。 如果是线性输油管道,各段经过时间相同,则如图5.22所示,在t时间,输油管道的各段的效率全部相同,即输油管道整体的效率,式中,分母mT是时空图中的m个段和流水的总时间t包围的总面积, 分子mnt0是时空图中n个塔斯克实际占有的总面积,

8、因此,从时空图来看,效率是实际上n个塔斯克占有的时空间域面积与m个区段的总时空间域面积的比。 显然与吞吐量类似,仅nm时接近1。 在云同步中,对于线性流水,各级的经过时间相等的情况下,输油管道的效率与吞没率成比例,即,如果输油管道各级所经过的时间不同,则各级的效率不同,但参照图5.22,在容易得到输油管道整体的效率时,对于复杂的非线性输油管道, 实际吞吐量TP和效率需要通过描绘实际工作时的时空图,分别用以下2个公式求出:图5.23输油管道工作例、3 .输油管道工作例、5.2.3流水设备的相关处理和控制机构、1 .局部相关处理图5.25 IBM 360/91的浮点执行零配件构成分块图浮点操作站F

9、los (浮动点操作栈)所缓冲技术的浮点操作指令的格式为操作源1 (目标),并且源2操作可以进行浮点加法、减法、乘法和除法。 源1表示存储信源命令的浮点寄存器FLR的编号,也用作存储中间结果的目的地暂存器的编号。 源2指示缓冲器FLB的编号,其存储通过存储器男低音发送来的浮点命令。 这些个分别通过FLR男低音和FLB男低音向浮点加法线或浮点乘法/除法线的输入端存储站发送数据。 在浮点加法器输油管道的输入端具有3个存储站a-1至a-3,在浮点乘法器输油管道的输入端具有2个存储站m-1和m-2,分别由预定的站号来标记。 保存站由控制部控制,如果任一保存站的两个源指令齐备,在流水段空闲时可以进入输油

10、管道并向前流动,因此以异步流动方式进行工作。 由于在操作指令中源1兼作目的,因此进入2条输油管道的操作指令间发生歌舞剧相关的概率高。 如果k 1表示在k之后在云同步中流动两条输油管道的第I个命令,则如果k 1的源1与k的目的相同,则产生“先写后读”相关性,如果k i的目的与k的目的相同,则产生“写入”相关性,如果k i的目的与k的源1相同,则产生“先读后写”相关性也就是说,进入云同步的各操作命令与使用相同浮点寄存器FLR的编号相关。 现在,在FLOS中添加f 2、FLB1; f 2、f2MD f 2、FLB2。 以(F2)*(FLB2)F2的两个操作指令为例,说明如何判断相关发生、如何控制后推

11、与相关直接通路的连接。 很明显,这两个命令异步流动时,会产生“先写后读”、“写”、“先读后写”这三个关系。 FLOS为添加f 2, 若发送FLB1并操作指令,则在FLR中取得(F2 ),在FLB中取得(FLB1 )并发送到加法器的存储站例如A1,并且将F2的“忙二进制位”立即定径套为“”,指定该暂存器的F2已经成为“目的”暂存器, 由于准备接收来自加法器的运算结果,因此进行控制,以将F2的“站号”字段设定为A1的站号“1010”,站号1010的存储站A1将在相加线流出的运算结果经由CDB男低音返回F2。 返回结果后,立即将F2的“忙二进制位”和“站号”设为“”,释放F2作为其他的操作指令使用。

12、 问题是,在F2的“忙二进制位”为“”、相加结果没有从相加线流出的情况下,FLOS又送出操作指令MD F2,FLB2通过解查询密码控制网站数据库到F2的源1命令时,“忙二进制位”为“”,表示出现了F2相关性。 指定F2内容的来源,发送至M1的“来源1站号”,将F2内的站号从A1(1010 )变更为M1(1000 ),指定应从M1接收运算结果。 2、全局有关的处理,1 )推测法,图5.26用推测法处理条件转移,2 )提前形成条件查询密码,3 )取得延迟转移,4 )加快短周期计程仪报的处理,3 .若流水设备的中断处理中断,则输油管道中断。 但其出现概率远低于条件转变的概率,随机发生。 因此,流水设

13、备的处理中断不是如何缩短输油管道的切断时间,而是主要如何处理程序断点现场的保存和恢复。 当执行指令I时是中断的,并且程序断点应该处于指令I的执行已经终止并且指令i 1还未开始执行的表兄弟中,然而流水设备可以将多个指令解释为云同步,并且指令i 1、i 2已经进入输油管道并且部分地被解释。 在异步流输油管道中,某些这些个指令可能在指令I之前流动。 4 .输油管道调度,图5.27输油管道预留表和状态图的例子,表5.1每个调度方案中的平均间隔拍数的例子,图5.28多功能输油管道预留表和状态图的例子,以及使用交叉冲突矢量(Crosscollision Vector ),a, 由于反映了b两种功能的动态输

14、油管道的各后续塔斯克流向输油管道,所以在本例中需要4个交叉冲突向量,即VAB=(1011 )、VBA=(1010 )、VAA=(0110 )、VBB=(0110 )。 其中,VAA和VBB分别表示用a功能和b功能进行流水作业时,后续塔斯克流入流水线上的碰撞矢量,另一方面,VAB表示按在先b功能进行流水作业的塔斯克与按后续a功能进行流水作业的塔斯克的碰撞矢量,VBA表示按在先a功能进行流水作业的塔斯克与按后续b功能进行流水作业的塔斯克的碰撞矢量。 通常,具有p个函数的输油管道将具有p-2个交叉冲突向量,其每一者被分类为p个冲突矩阵Mp且其中p每一者为1到p。 在本示例中,存在两个初始碰撞矩阵,每

15、个初始碰撞矩阵例如通过VAA的(0110 )在针对每个p功能输油管道进入一个塔斯克之后立即针对每个功能输油管道流入后续塔斯克而产生将MA初始冲突矩阵的每一行向右移位一个二进制位,且逐二进制位地“或”对应于a功能的初始冲突矩阵MA的行,从而形成新的冲突矩阵。根据此时的VAA的(0111 )可知,每隔4拍流入一个a功能的新塔斯克不会发生冲突,基于此形成新的冲突矩阵。 另外,例如,由于初始冲突矩阵中的VBA是(1010 ),所以可以理解,b功能的新塔斯克的重正化可以在第1拍或第3拍不冲突的情况下进行。 然后,将MA的所有初始冲突矩阵向右移位一个二进制位或三个二进制位,并且对每一二进制位“或”对应于M

16、A的初始冲突矩阵的行,以形成新的冲突矩阵,它们正好为。 由此可知,在每隔3拍流入a功能的新的塔斯克,或者每隔4拍流入b功能的新的塔斯克中,分别产生不同的新的冲突矩阵。 5.3向量的流水处理和向量流水处理、5.3.1向量的流水处理,例如,修正D=A*(B C )。 在此,a、b、c、d都是具有n个要素的向量,采用什么样的处理方式能够最大限度地发挥输油管道而一个一个地求出d向量要素的方法、即与ai、bi、ci要素网站数据库,通过上述的算术式求出di,将ai 1、bi 1、ci 1除以2 的双曲馀弦值。 如果向量的长度n过长,超过了向量暂存器组内的暂存器个数,则可以将该向量分割为多个组,使各组进入向

17、量暂存器组,这样,各组内进行纵向处理,组与组之间软这种处理方式称为组纵横处理方式。 如果存在这种报文分组纵横处理方式,则也可以不对向量长度n的大小施加限制。 CRAY1以这种方式进行向量的流水处理。 5.3.2向量流水处理机1 .向量处理机的指令系向量处理机的指令系中,应包含向量型和标量型两种指令。 向量型运算系的指令一般是向量V1运算向量V2,例如V2=SIN(V1),向量V1运算向量V2,向量v如下运算标量s,向量V1和向量V2运算向量V3,例如v3=v 3 向量V1和标量s计算向量V2,并且例如设V2=S*V1。 2、矢量流水处理机的结构,CRAY1是由中央处理机、诊断维护控制处理机、大容量盘片存储子系统、前道工序处理机组成的功能分布异种型多处理机系统。 中央处理机的控制部,有总容量256个16二进制位的指令缓冲器,被分成4个组,各组为64个。 在中央处理机的运算部中有12条可以并行工作的单功能输油管道,可以分别用流水进行地址、矢量、标量的各种运算。 此外,还可以从输油管道功能零配件直接网站数据库矢量暂存器组V0V7、标量暂存器S0S7和地址暂存器A0A7。 另外,图5.29 CRAY1的向量流水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论