版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、并行计算Parallel Computing根本概念2022-5-82如何满足不断增长的计算力需求? 用速度更快的硬件,也就是减少每一条指令所需时间 优化算法或者优化编译 用多个处理机用多个处理机器器同时解决一个问题同时解决一个问题 并行计算并行计算2022-5-83串行计算与并行计算2022-5-84并行的层次 程序级并行程序级并行 子程序级并行子程序级并行 语句级并行 操作级并行 微操作级并行并行粒度粗细2022-5-85FLOPS Floating point number Operations Per Second -每个时钟周期执行浮点运算的次数 理论峰值CPU主频每时钟周期执行浮点
2、运算数CPU数目 部分处理器每时钟周期执行浮点运算数:2022-5-86 2022-5-87Top5002007年11月 高居榜首的仍然是来自高居榜首的仍然是来自IBM的的“蓝色基因蓝色基因/L。自从2004年11月以来,该系统已经连续三年遥遥领先连续三年遥遥领先,而且计算才能不断提升,Linpack基准测试性能基准测试性能478.2 TFlop/s每秒478.2万亿次运算,而半年前还是280.6 TFlop/s 拿下亚军位置的还是IBM,不过换成了一台落成不久的“蓝色基因蓝色基因/P。位于德国尤里希研究中心的这套新系统运算才能167.3 TFlop/s,不过按照IBM的设
3、计规划,蓝色基因/P的性能将有望打破1 TFlop/s大关,即每秒一千万亿次运算。 2022-5-88Top5002007年11月 第三名也是个新面孔,同时也是新墨西哥墨西哥计算应用中心NMCAC的第一套超级计算机,由SGI基于Altix ICE 8200打造,计算才能126.9 TFlop/s。 同时印度史上首次杀入了印度史上首次杀入了TOP10行列行列,印度计算研究实验室的HP Cluster Platform 3000 BL460c以117.9 TFlop/s的性能拿到了第四位 2022-5-89供给商系统数量2022-5-810供给商计算才能2022-5-811国家分布系统数量2022
4、-5-812国家分布计算才能2022-5-813体系构造系统数量2022-5-814体系构造计算才能2022-5-815应用领域系统数量2022-5-816应用领域计算才能2022-5-817操作系统系统数量2022-5-818操作系统计算才能2022-5-819处理器家族系统数量2022-5-820处理器家族计算才能2022-5-821系统数量2022-5-822计算才能2022-5-8232007年中国高性能计算机性能年中国高性能计算机性能TOP100 2022-5-824并行化方法 域分解Domain decomposition 任务分解Task decomposition 流水线Pip
5、elining2022-5-825域分解 First, decide how data elements should be divided among processors Second, decide which tasks each processor should be doing Example: Vector addition2022-5-826域分解Find the largest element of an array2022-5-827域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-828域分
6、解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-829域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-830域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-831域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-832域分解Find the largest elemen
7、t of an arrayCPU 0CPU 1CPU 2CPU 32022-5-833域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-834域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-835域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-836域分解Find the largest element of an arrayCPU 0CPU 1C
8、PU 2CPU 32022-5-837域分解Find the largest element of an arrayCPU 0CPU 1CPU 2CPU 32022-5-838任务功能分解 First, divide tasks among processors Second, decide which data elements are going to be accessed read and/or written by which processors Example: Event-handler for GUI2022-5-839任务分解fsrqhg2022-5-840任务分解fsrq
9、hgCPU 0CPU 2CPU 12022-5-841任务分解fsrqhgCPU 0CPU 2CPU 12022-5-842任务分解fsrqhgCPU 0CPU 2CPU 12022-5-843任务分解fsrqhgCPU 0CPU 2CPU 12022-5-844任务分解fsrqhgCPU 0CPU 2CPU 12022-5-845流水线nSpecial kind of task decompositionn“Assembly line parallelismnExample: 3D rendering in computer graphicsRasterizeClipProjectModel
10、InputOutput2022-5-846Processing One Data Set Step 1RasterizeClipProjectModel2022-5-847Processing One Data Set Step 2RasterizeClipProjectModel2022-5-848Processing One Data Set Step 3RasterizeClipProjectModel2022-5-849Processing One Data Set Step 4RasterizeClipProjectModelThe pipeline processes 1 data
11、 set in 4 steps2022-5-850Processing Two Data Sets Step 1RasterizeClipProjectModel2022-5-851Processing Two Data Sets Time 2RasterizeClipProjectModel2022-5-852Processing Two Data Sets Step 3RasterizeClipProjectModel2022-5-853Processing Two Data Sets Step 4RasterizeClipProjectModel2022-5-854Processing
12、Two Data Sets Step 5RasterizeClipProjectModelThe pipeline processes 2 data sets in 5 steps2022-5-855Pipelining Five Data Sets Step 1Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0CPU 1CPU 2CPU 32022-5-856Pipelining Five Data Sets Step 2Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0C
13、PU 1CPU 2CPU 32022-5-857Pipelining Five Data Sets Step 3Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0CPU 1CPU 2CPU 32022-5-858Pipelining Five Data Sets Step 4Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0CPU 1CPU 2CPU 32022-5-859Pipelining Five Data Sets Step 5Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0CPU 1CPU 2CPU 32022-5-860Pipelining Five Data Sets Step 6Data set 0Data set 1Data set 2Data set 3Data set 4CPU 0CPU 1CPU 2CPU 32022-5-861
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年超声弹性成像:给组织“摸硬度”的新技术
- 2026年非职权影响力:如何赢得他人配合
- 2026年多媒体课件视觉传达设计原则
- 2026年医保电子凭证(医保码)全流程应用与成效分析
- 2026年建筑起重机械定期检查与维护保养指南
- 2026吉林延边州和龙市面向委培生招聘员额管理工作人员5人备考题库含答案详解
- 2026浙江中外运有限公司温州分公司招聘2人备考题库及答案详解(真题汇编)
- 2026福建福州市鼓楼区环境卫生中心招聘1人备考题库及答案详解(典优)
- 招聘1人!青海高等职业技术学院面向社会公开招聘外聘教辅人员备考题库含答案详解(考试直接用)
- 2026浙江金华市武义县市场监督管理局招聘2人备考题库有完整答案详解
- 肠道微生态与健康课件
- 小升初语文文言文阅读历年真题50题(含答案解析)
- 应急演练的组织与实施
- 头晕教学讲解课件
- 电气化铁路有关人员电气安全规则2023年新版
- GB/T 23853-2022卤水碳酸锂
- GB/T 16823.3-2010紧固件扭矩-夹紧力试验
- 2023年深圳市南山区事业单位招聘笔试题库及答案解析
- 小型四辊冷轧机设计(全套图纸)
- 第六届全国生化学实验竞赛操作试题
- 天津市滨海新区中医医院污水处理站维护保养服务项目需求书
评论
0/150
提交评论