




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
18.1计算机系统概述
1)提高计算机系统运算速度的方法改进工艺,减少芯片线宽,提高集成度与工作频率;改进计算机系统结构,并使各部件之间的速度匹配。SISD的改进方法:采用多个通用R采用Cache、多体交叉存储器采用中断、DMA、通道、IOP技术采用流水线工作方式RISC2超标量结构超级流水线超长指令字SIMD、MIMD32)系统结构中的并行性并行性是在同一时间或同一时间段内完成两种或两种以上的运算和操作。并行性有三种含义:同时性---同一时刻,多个资源并发性---同一间隔,多个资源流水线---可能重叠的时间段提高并行性的措施:时间重叠资源重叠(空间并行)资源共享48.2超标量处理机、超级流水线处理机、
超长指令字处理机1)超标量处理机超标量处理机有两条或两条以上能够同时工作的指令流水线,使得在一个时钟周期内能同时发射多条指令。超标量处理机是以增加硬件资源为代价换取处理机性能,以空间换取时间。5取指n0译码n0执行n0写回n0取指n1译码n1执行n1写回n1取指n2译码n2执行n2写回n2取指n3译码n3执行n3写回n3取指n4译码n4执行n4写回n4取指n5译码n5执行n5写回n5取指n6译码n6执行n6写回n6取指n7译码n7执行n7写回n762)超级流水线处理机在一个时钟周期能够分时流出多条指令的处理机称为超级流水线处理机。双倍的内部时钟频率允许在一个外部时钟周期内完成两个任务。超级流水线处理机是通过各部分硬件的充分重叠工作提高处理机性能,以时间换取空间。取指n0译码n0执行n0写回n0取指n1译码n1执行n1写回n1取指n2译码n2执行n2写回n2取指n3译码n3执行n3写回n373)超长指令字处理机(VLIW)VLIW处理机的指令字非常长,由多个字段组成,每个字段对应一个执行部件,指定一种操作。编译时,把多个能并行执行的操作组合在一起成为超长指令,即VLIW完全靠软件进行静态调度,使得多个执行部件并行工作。取指IF译码ID执行EX写回W执行EX执行EX取指IF译码ID执行EX写回W执行EX执行EX取指IF译码ID执行EX写回W执行EX执行EX88.3向量处理机向量处理机是一种具有向量数据表示,并设置相应的硬件能对向量的各个元素进行并行处理的处理机。向量处理机一般采用流水线处理技术。9向量处理机对存储器要求:及时提供元素和存入运算结果。一般配有大容量的、分成多模块交叉工作的主存。向量处理机中具有向量处理指令:向量运算、向量传送等。例如:计算D=A*(B+C)
A、B、C是含有长度为n的向量
A=(a1,a2,……,an)B=(b1,b2,……,bn)
C=(c1,c2,……,cn)
B+C→E,A*E→D利用两条向量运算指令完成,指令内无数据相关,指令间有一次数据相关。108.4阵列处理机和多处理机系统1)阵列处理机(SIMD)(1)组成阵列处理机是以大量相同的处理单元按规则排列成阵列形式而得名。阵列处理机由在同一控制器CU控制下的多个处理单元PE组成,PE是不带控制部件的运算单元。在CU控制下,各PE对各自的数据并行地执行同一条指令所规定的操作。11在PE之间设置互连网络ICN,规定了各PE之间的连接方式,即规定任意两个PE间的传送数据的路径。系统中还设置SC起管理职能,完成系统控制和I/O操作。例如:在传统机上计算A=B+CA(1)=B(1)+C(1)A(2)=B(2)+C(2)……A(n)=B(n)+C(n)在阵列处理机上,用一条加法指令控制n个处理单元同时执行加法完成12(2)特点采用资源重复并行完成计算ICN的特性极大影响系统的性能,是并行研究的重点必须配备SC起管理职能(3)分类根据存储器的不同组成形式,有两种结构:分布存储器系统共享存储器系统132)多处理机系统(MIMD)MIMD可分为两种类型:多处理机系统多计算机系统多处理机系统使用共享存储器,处理机之间的通信通过存储器进行。多计算机系统只访问自己的私有存储器,且私有存储器不能被其它计算机访问,计算机之间的通信靠消息传递。14(1)多处理机结构15P0---Pn(包含CU和PE)通过互连网络共享主存;I/O和外存(SM)经过多路通道CH和互连网络相连,与P共享主存;处理器P之间也可以通过互连网络交换信息。16(2)减少访问主存冲突常采用的方法主存分为M个模块交叉工作,且M﹥n;每个处理器都配备单独使用的小容量的局部存储器(LM);每个处理器都配备高速缓存Cache,亦有COMA结构。17(3)紧耦合和松耦合在紧耦合多处理机中,主存储器为每个处理器提供相同的访问机制。该主存储器称为集中共享存储器。紧耦合多处理机具有均匀存储器访问结构(UMA)亦称对称型多处理机(SMP)在松耦合多处理机中,存储器被分割成多个模块,每个模块直接与单个处理器相连。与单个处理器相连的模块称为该处理器的本地存储器。当一个处理器访问自己的本地存储器时,不必通过互连网络,直接访问即可。18当一个处理器访问其它处理器的存储器时,通过互连网络访问。在松耦合多处理机中的存储器称为分布共享存储器(DSM)。松耦合多处理机具有非均匀存储器访问结构(NUMA)。19(4)同构型和异构型同构型多处理机建立在资源重复的基础上,由大量同类型或功能相同的处理机组成。一道程序被分解为若干相互独立的程序段或称任务,分别指定给各个处理机并行执行。异构型多处理机----功能分布计算机系统建立在时间重叠的基础上,由多个不同类型或承担不同功能的处理机组成一道程序被分解成能够串行执行的程序段,分给各处理机按顺序完成,各处理机相对独立的并行工作,在处理机级实施流水。20(5)多处理机的互连结构多处理机的互连结构是多处理机系统的关键技术,互连网络应能使每个处理机都能访问到所有的存储器,且当两个或两个以上的处理机同时访问存储器时,这些处理机都能收到要访问的数据。①总线结构缺点:总线带宽限制了系统的性能总线出现故障时,所有处理机无法访问存储器21为解决总线竞争问题,需要设计带有总线仲裁逻辑的总线控制器。优先权指定方法:
固定优先级、轮转优先级、排队22为了提高总线结构的带宽,使用多总线结构例如:总线有b条、处理机数量为n、存储器模块数量为m。
若m≥b,同时请求使用不同存储器模块的处理机的数量不大于b时,所有的请求将能同时访问存储器。23②交叉开关在总线结构的基础上增加总线数目,当总线数目增加到极端的情况,即模块的数目等于总线的数目时,构成交叉开关的结构,各模块间由一组开关阵列连接起来。各处理机可以同时访问不同的存储模块。每个交叉点是一个多路选1的开关及仲裁部件。缺点:价格高,与n*m成正比。24③多端口存储器每个处理器都有一条直接的路径连接到存储器块。多端口存储器是逻辑意义上的多端口,物理设计一般为双端口。25本章知识点并行性的三种含义、提高并行性的措施。超标量处理机以空间换取时间、超级流水线处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论