




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七讲 第七章 啥叫粒度 非并行计算版 打个比方 100个学生要进行管理 细粒度 4个学生一个班25个班 粗粒度 50个学生一个班2个班 大学寝室八个人中午吃饭细粒度 每个人都要出寝室 去食堂打份饭回来 粗粒度 派个代表 或者找个别的寝室的 把所有饭带回来 程序也是一样 事情定下来的功能就那么多细粒度 定义了100个类 粗粒度 定义了2个类 啥叫粒度 并行计算版 粒度 granularity 各个多处理机可独立并行执行的任务大小的度量 粗粒度所含计算任务有较大计算量和较复杂计算程序 任务级并行的粒度大于语句级的并行 细粒度所含计算任务有较小的计算量和较短的计算程序 向量机主要是对内层Do循环语句作向量化 所以向量化是一种小粒度 细粒度 并行 指令级并行等则是小粒度并行 亦称为细粒度 中粒度所含计算任务的大小和计算程序的长短在粗粒度和细粒度两种类型的算法之间 粒度 细粒度的并行1 通信处理时只能完成很少量的可计算工作 2 低的计算通信率3 促进负载平衡意味着高通信开销 降低了性能提升的可能性 如果粒度太小很可能任务间的通信和同步所须要的花费时间比用在计算上的还长 粗粒度并行1 在每次通信同步之间完成相当多的计算任务 2 高计算通信率意味着更加可能执行性能提升 更难执行有效的负载平衡调度 哪个更好 最高效的粒度是由算法和当前硬件平台决定的 通常情况下 通信和同步的开销很大程度上取决于执行速度 这样运用粗粒度较好 细粒度并行机制可以减少负载不平衡所带来的开销 粒度 2 并行编程涉及不同的层次 指令层 非常细的粒度 数据层 细粒度 控制层 中粒度 任务层 大粒度 前两层大都由硬件和编译器负责处理 程序员通常处理后两层的并行 第七章并行算法的一般设计过程 7 1PCAM设计方法学7 2划分7 3通信7 4组合7 5映射7 6小结 设计目标 从给定问题的描述出发 通过一系列步骤 最终设计出一个能展示并发性可扩放性局部性和模块性的并行算法 设计原则 PCAM设计方法学首先尽量开拓算法的并发性和满足算法的可扩放性 与算法相关的特性 然后着重优化算法的通信成本和全局执行时间 与机器相关的特性 同时通过必要的整个过程的反复回溯 以期望达到一个满意的设计选择 PCAM设计方法学 设计并行算法 PCAM 的四个阶段划分 Partitioning 通信 Communication 组合 Agglomeration 映射 Mapping 设计的前期 第1 2步 考虑与机器特性无关的特性 并行性和可扩放性 寻求具有这些特性的算法 设计的后期 第3 4步 考虑与机器特性相关的特性 局部性等与性能有关的问题 PCAM设计过程 划分 通信 组合 映射 划分 分解成小的任务 开拓并发性 通信 确定诸任务间的数据交换 监测划分的合理性 组合 依据任务的局部性 组合成更大的任务 映射 将每个任务分配到处理器上 提高算法的性能 第七章并行算法的一般设计过程 7 1PCAM设计方法学7 2划分7 3通信7 4组合7 5映射7 6小结 划分方法描述 充分开拓算法的并发性和可扩放性 先进行数据分解 称域分解 再进行计算功能的分解 称功能分解 先集中数据的分解 域分解 然后是计算功能的分解 功能分解 两者互为补充使数据集和计算集互补相交 以避免数据和计算的复制 划分方法描述 划分阶段忽略处理器数目和目标机器的体系结构 能分为两类划分 域分解 domaindecomposition 功能分解 functionaldecomposition 域分解 划分的对象是数据 可以是算法的输入数据 中间处理数据和输出数据 将数据分解成大致相等的小数据片 划分时考虑数据上的相应操作 如果一个任务需要别的任务中的数据 则会产生任务间的通信 域分解 示例 三维网格的域分解 各格点上计算都是重复的 下图是三种分解方法 域分解 不规则区域的分解示例 功能分解 划分的对象是计算 将计算划分为不同的任务 其出发点不同于域分解 划分后 研究不同任务所需的数据 如果这些数据不相交的 则划分是成功的 如果数据有相当的重叠 意味着要重新进行域分解和功能分解 功能分解是一种更深层次的分解 示例1 搜索树示例2 气候模型 功能分解 划分判据 划分是否具有灵活性 划分是否避免了冗余计算和存储 划分任务尺寸是否大致相当 任务数与问题尺寸是否成比例 功能分解是一种更深层次的分解 是否合理 划分的标准 划分的任务数 是否至少高于目标机上处理器数的一个量级 灵活性 若否 则后继的设计步骤缺少灵活性是否避免冗于的计算和存储要求 可扩放性 若否 则产生的算法对大型问题可能是不可扩放的划分的任务尺寸是否大致相当 均衡 若否 分配处理器时很难做到工作量均衡任务数是否与问题尺寸成比例 理想情况下 问题尺寸的增加应引起任务数的增加而不是任务尺寸的增加是否采用了几种不同的划分法 多考虑几种选择可提高灵活性 同时既考虑域分解 又要考虑功能分解 第七章并行算法的一般设计过程 7 1PCAM设计方法学7 2划分7 3通信7 4组合7 5映射7 6小结 通信方法描述 通信是PCAM设计过程的重要阶段 划分产生的诸任务 一般不能完全独立执行 需要在任务间进行数据交流 从而产生了通信 功能分解确定了诸任务之间的数据流 诸任务是并发执行的 通信则限制了这种并发性 四种通信模式 局部 全局通信结构化 非结构化通信静态 动态通信同步 异步通信 局部通信 通信限制在一个邻域内 只与较少的几个近邻的通信 全局通信 通信非局部的 与很多任务通信例如 AlltoAllMaster Worker 结构化通信 每个任务的通信模式是相同的 下面是否存在一个相同通信模式 非结构化通信 没有一个统一的通信模式例如 无结构化网格 静态通信vs 动态通信 静态通信伙伴的身份不随时间改变动态通信伙伴的身份可能由运行时所计算的数据决定且是可变的 同步通信vs 异步通信 同步双方知道何时进行通信 发送方显示的发给接收方异步不确定 接收的方明确地从发送者请求数据 通信判据 所有任务是否执行大致相当的通信 是否尽可能的局部通信 通信操作是否能并行执行 同步任务的计算能否并行执行 通信标准 所有任务是否执行大致同样多的通信 可扩放性 若否 则可扩放性可能不好每个任务是否只与少许近邻通信若否 则可能导致全局通信 应设法将全局通信结构化为局部通信结构诸通信操作是否能并行执行若否 则可能是低效的和不可扩放的不同任务的计算能否并行执行若否 则可能是低效的和不可扩放的可重新安排通信 计算次序 第七章并行算法的一般设计过程 7 1PCAM设计方法学7 2划分7 3通信7 4组合7 5映射7 6小结 方法描述 组合是由抽象到具体的过程 是将组合的任务能在一类并行机上有效的执行 合并小尺寸任务 减少任务数 如果任务数恰好等于处理器数 则也完成了映射过程 通过增加任务的粒度和重复计算 可以减少通信成本 保持映射和扩展的灵活性 降低软件工程成本 方法描述 2 增加粒度 在划分阶段 致力于尽可能多的任务以增大并行执行的机会 但定义大量的细粒度任务不一定产生一个有效的算法 因为这有可能增加通信的代价和任务创建的代价表面 容积效应 通信量比例于子域的表面积 而计算比例于容积 通信 计算之比随任务的尺寸的增加而减少 增加粒度重复计算 ReplicationComputation 也叫冗余计算 有时可用冗余计算来减少通信 同时也要保持灵活性和减少软件成本 降低软件工程代价 表面 容积效应 通信量与任务子集的表面成正比 计算量与任务子集的体积成正比 增加重复计算有可能减少通讯量 重复计算 重复计算减少通讯量 但增加了计算量 应保持恰当的平衡 重复计算的目标应减少算法的总运算时间 示例 二叉树上N个处理器求N个数的全和 要求每个处理器均保持全和 二叉树上求和 共需2logN步 重复计算 重复计算 示例 二叉树上N个处理器求N个数的全和 要求每个处理器均保持全和 蝶式结构求和 使用了重复计算 共需logN步 组合判据 增加粒度是否减少了通信成本 重复计算是否已权衡了其得益 是否保持了灵活性和可扩放性 组合的任务数是否与问题尺寸成比例 是否保持了类似的计算和通信 有没有减少并行执行的机会 组合的标准 组合造成的重复计算 是否平衡了其收益 造成重复数据 是否已证实不会因限制问题尺寸和处理机数目而影响可扩放性 组合产生的任务是否具有类似的计算 通信代价 任务数目是否仍与问题尺寸成比例 第七章并行算法的一般设计过程 7 1PCAM设计方法学7 2划分7 3通信7 4组合7 5映射7 6小结 方法描述 每个任务要映射到具体的处理器 定位到运行机器上 任务数大于处理器数时 存在负载平衡和任务调度问题 映射的目标 减少算法的执行时间并发的任务 不同的处理器任务之间存在高通讯的 同一处理器映射实际是一种权衡 属于NP完全问题 负载平衡算法 静态的 事先确定 概率的 随机确定 动态的 执行期间动态负载 基于域分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客车给水员设备调试考核试卷及答案
- 2025年幼儿教育专业证书考试题及答案
- 2025年计算机应用专业考试复习卷及答案
- 2025年公共关系管理专业知识考试试卷及答案
- 卫生专业技术资格考试专业实践能力试卷与参考答案(2025年)
- 2025年首诊医师负责制试题考核附答案
- 广西对口招生模拟试题及答案
- 辽宁高一模拟试题及答案
- 二建市政模拟试题及答案
- 夏季防中暑考试题及答案
- 《建筑消防设施检测技术规程》
- 2024年农商银行担保合同样本
- 英才计划面试问题
- 七十岁老人三力测试题
- 小儿结核病教案
- 【高二 拓展阅读-科技】Wind Energy
- 我的家乡滕州市宣传简介
- 法院起诉收款账户确认书范本
- 15ZJ001 建筑构造用料做法
- 初中历史小论文现状分析与写作探讨
- 燕山石化聚丙烯工艺综述最好实习报告内容
评论
0/150
提交评论