MIMD计算机ppt课件_第1页
MIMD计算机ppt课件_第2页
MIMD计算机ppt课件_第3页
MIMD计算机ppt课件_第4页
MIMD计算机ppt课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2003 3 1 计算机系统结构 1 第九章MIMDP499 MIMDSIMD计算机的主要区别 在于SIMD只能在同一时刻做多件相同的事情 而MIMD却可以在同一时刻做多件相同或不同的事情 多指令流所致 所以求解同一个问题时采用MIMD将能实现更大比例的并行操作 即处理效率更高 从并行处理的级别看 SIMD是数据级并行处理 流水线是指令级并行处理 MIMD是任务级并行处理 由于技术上的原因 目前实现的MIMD计算机都是多处理机系统 包括多计算机系统 多处理机系统由多台处理机连接而成 它们能够并行执行独立的程序模块 并且相互通信和同步 以实现作业 任务级的并行 2003 3 1 计算机系统结构 2 CU2 CU1 CUn PUn PU2 PU1 MMn MM2 MM1 IS1 IS1 IS2 IS2 ISn DS1 ISn DS2 DSn 多指令流多数据流MIMD 2003 3 1 计算机系统结构 3 9 1MIMD的典型结构 P500 多处理机系统通常包含多个处理机模块 多个存储器模块 多个I O通道 这些设备与单处理机系统中的设备没有本质不同 最大的差别是互连网络和多机操作系统 由于多处理机系统是在作业 任务级并行 处理机之间的通信不像SIMD系统那样频繁和急迫 所以互连网络可以采用通用网实现 以便在满足流量需要的前提下降低成本 1 共享存储器方案 紧耦合型 P500图9 1 a 存储器和I O设备是独立的子系统 通过互连网络为所有的处理机共享 2 分布存储器方案 松耦合型 P500图9 1 b 每台处理机有自己的存储器和I O设备 处理机之间的信息交换通过互连网络 2003 3 1 计算机系统结构 4 2003 3 1 计算机系统结构 5 它有多个控制器 至少有多个指令部件 用以对各个PE实现单独的控制 而又相互协调配合 多处理机的外围设备要能够被多个PE分别调用 因而要通过互连网络转接 而不像并行处理机的外围设备那样统一访问主存储器 并行处理机由于主要完成数组向量运算 它的PE和MM之间的数据交往比较有规则 互连网络的作用主要放在数据对准上 功能简单 多处理机的互连网络必须满足各个PE随机地访问主存储器的要求 连接模式 频带和路径选择等问题都要复杂 多处理机属任务级并行 SIMD属于数据级并行 多处理机与并行处理机 SIMD 的主要区别 2003 3 1 计算机系统结构 6 结构灵活性并行处理机是针对数组 向量处理而设计的 而多处理机不限于数组向量的处理 力图把能并行处理的任务 数组 以至标量都进行并行处理 程序并行性的识别并行处理机实现操作一级的并行 其并行性存在于指令内部 多处理机中 因为不限于解决数组向量处理问题 并行性存在于指令外部 即表现在多个任务之间 再加上系统通用性的要求 就使程序并行性的识别难度较大 因此 它必须利用多种途径 如算法 程序语言 编译 操作系统 以至指令 硬件等 尽量挖掘各种潜在的并行性 多处理机的特点 2003 3 1 计算机系统结构 7 并行任务的派生并行处理机依靠单指令流对多数据流实现并行操作 这种并行操作是通过各条单独的指令加以反映和控制的 指令本身就可以启动多个处理部件并行 多处理机是处于多指令流操作方式 一个程序当中就存在多个并发的程序段 需要专门的指令来表示它们的并发关系以控制它们的并发执行 以便一个任务开始被执行时就能派生出可与它并行执行的另一些任务 该过程称为并行任务派生 可能达到较高的效率 9 2MIMD的并行程序控制 P608 2003 3 1 计算机系统结构 8 进程同步并行处理机是操作级的并行 所有处于活动状态的处理单元同时执行共同的指令 受同一个控制器控制 工作自然同步 多处理机所实现的是指令 任务 程序级的并行 在同一时刻 不同的处理机执行着不同的指令 要区分进程之间的多种不同的依赖关系 要求多处理机采取特殊的同步措施 使并发进程之间保持程序所要求的正确顺序 资源分配和进程调度处理机执行并发任务 需用处理机的数目没有固定要求 各个处理机进入或退出任务的时刻互不相同 所需共享资源的品种 数量又随时变化 情况十分复杂 需要好的资源分配和进程调度策略 9 2MIMD的并行程序控制 P608 2003 3 1 计算机系统结构 9 1 任务派生语句 当前运行的进程向操作系统申请创建一个新进程 并试图用一个空闲处理机来运行它 如果操作系统没有找到空闲处理机资源 则让新进程排队等待 格式 FORX 2 任务汇合语句 检查包括当前进程在内的各先期并发进程是否完成 如未完成则停止当前进程 释放其处理机资源 如已完成则让当前进程继续执行 通常是转入后继进程 汇合语句的每次执行会对一个计数器加1 该计数器初值为0 直至达到语句所要求的汇合进程数 格式 JOIN 9 2MIMD的并行程序控制 P608 2003 3 1 计算机系统结构 10 实例 x a b a c 我们设想用3个进程来完成上式中3个运算 则它们之间的相关关系可用数据相关图来描述 右图 并行程序可用Fork Join语句写成如下形式 k Forkk 3k 1 AddA B T1k 2 Gotok 4k 3 SubA C T2k 4 Join2 1k 5 MulT1 T2 X该程序在2台处理机的MIMD系统上运行的时空关系可用资源时间图表示 假设进程k执行时间大于进程k 3 2003 3 1 计算机系统结构 11 9 4MIMD的加速性能模型 P502 P512 1 两个处理机的并行模型 P504 总处理时间 R max M K K C M K K其中 M 任务总数 K 分配给处理机1的任务数 R 执行1个任务所需时间 C 进行1次通信所需时间 最优解 P505第1 3行 2 N个处理机的并行模型 P505 总处理时间 R max Ki C 2 Ki M Ki R max Ki C 2 M2 Ki2 2003 3 1 计算机系统结构 12 2003 3 1 计算机系统结构 13 9 5多处理机实例 P521 9 5 1MPP P521 大规模并行处理系统MPP 几百台以上处理机通过专用互连网络构成的高性能MIMD系统 造价高 性能也高 9 5 2SMP P528 共享存储型多处理机系统SMP 所有处理机共享统一编址的内存空间 由硬件协调访存冲突 并行程序设计者感觉特别方便 9 5 3CLUSTER 机群系统 P541 机群系统CLUSTER 几台至十几台微机或工作站通过通用网络构成的低成本并行处理MIMD系统 与MPP特点相反 2003 3 1 计算机系统结构 14 机群系统的具体知识 9 5 3 1什么是机群系统利用高速通用网络将一组高性能工作站或高档PC机 按某种结构连接起来 并在并行程序设计以及可视化人机交互集成开发环境支持下 统一调度胁调处理 实现高效并行处理的系统 从结构和结点间的通信方式来看 它属于分布存储系统 主要利用消息传递方式实现各主机之间的通信 由建立在一般操作系统之上的并行编程环境完成系统的资源管理及相互协作 同时也屏蔽工作站及网络的异构性 对程序员和用户来说 机群系统是一个整体的并行系统 机群系统中的主机和网络可以是同构的 也可以是异构的 目前已实现和正研究中的机群系统大多采用现有商用工作站和通用LAN网络 既可缩短开发周期又可利用最新微处理器技术 大多机群系统的并行编程环境是建立在Unix操作系统之上 尽量利用商用系统的研究成果 减少系统开发与维护费用 2003 3 1 计算机系统结构 15 机群系统出现的原因 有利条件 1 微处理器性能机价格比迅速提高 可充当机群系统的运算节点 2 网络技术进步使得松散耦合系统的通信瓶颈得到缓解 例 ATM155M 620M 以太网1000M 甚至有的产品已接近了多处理机专用互联网 如交叉开关网络 多机网络 性能 例如MyriCom公司的Myrinet1 28G 开关延迟只有1us 3 并行编程环境的开发使得编制并行程序或改写串行程序更加容易 2003 3 1 计算机系统结构 16 ComputerFoodChain 2003 3 1 计算机系统结构 17 与传统的并行处理机相比 机群系统有下列特点 1 开发周期短 结点 商用工作站 网络 通用网络 例如ATM 操作系统 Unix LINUX 并行程序设计语言 在C Fortran上扩充 2 用户投资风险小购置巨型机或多处理机系统 投资大 但很可能用不起来 9 5 3 2机群系统的特点 P541 P542 1 6 2003 3 1 计算机系统结构 18 3 系统价格低 4 充分利用系统资源某计算机系100多台工作站 一般单机系统的使用率不到10 而组成机群系统后 可达到80 左右 机群系统可分批更新 5 系统扩展性好 6 用户编程方便并行程序设计语言一般是在C C 或Fortran中加入 通信原语 扩展出来的 2003 3 1 计算机系统结构 19 机群系统的关键技术主要包括 1 高效通信系统机群系统一般采用通用局域网 目前局域网技术大体分两类 共享介质网络 例 Ethernet 开关网络 例 ATMMyrinet和100M交换式Ethernet 三 机群系统的关键技术人们希望机群系统具有以下特点 较高的节点运算速度 系统加速比性能接近线性增长 并行应用程序的开发要高效 方便 2003 3 1 计算机系统结构 20 网络性能的性能描述 带宽速度 10 100 1000Mbps往返延迟 1字节的数据包的往返传输时间 新网络技术大幅提高了传输速度 但延迟时间还没多大变化 如下表 所以机群系统中局域网研究方向主要是 减少往返延迟和提高带宽利用率 目前网络带宽利用率较低 例如640Mbps的Myrinet 应用程序可见带宽才38Mpbs 提高带宽利用率途径之一 精减协议 例TCP IP层次太多 2003 3 1 计算机系统结构 21 2 并行程序设计语言和环境一般都是基于消息传递 MessagePassing 现在的实现方法一般是 使用原有顺序编译器连接并行程序库 研究方向 1 扩展原有顺序语言2 开发全新的并行语言3 研究自动化并行编译器 直接将顺序程序编译成并行代码 并行程序设计环境 P551 是介于分布式操作系统与并行应用程序之间的支撑软件组 提供并行运算所需的各种软件模块和管理功能 以此提升操作系统功能来全面支持并行计算 最著名的并行程序设计环境是PVM 2003 3 1 计算机系统结构 22 3 全局资源管理及利用有效的利用资源是机群系统的重要目标 当前的方法 在一般的操作系统 Unix NT等 上建立一个全局Unix 共享资源 例如各节点的内存 在155M的ATM网络上 读取其它节点内存的时间仅为读取本地硬盘的五分之一 据统计 对需经常访问硬盘的的应用程序 使用这种方法可以比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论