版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、并行算法及其应用,计算机学院 卢光辉 Email:* Tel:* 主楼B1-*,教学安排:20学时 教材: 孙世新,卢光辉等,并行算法及其应用 参考书: 黄铠、徐志伟著,陆鑫达等译.可扩展并行计算技术、结构与编程.机器工业出版社,2000. 李晓梅、蒋增荣等著.并行算法,湖南科学技术出版社,1992. 陈国良.并行算法的设计与分析.高等教育出版社,2002.11.,序言,1.什么叫并行算法? 一些可同时执行的诸进程的集合,这些进程相互作用和相互协调。,2.并行算法与串行算法的关系:,P1,P2,P3,3. 并行与并发的关系:并行并发 并发是指两个或者多个事件在同一时间间隔内发生。在单处理机系统
2、中,每一时刻仅能有一道程序执行,宏观上多道程序在同时运行,微观上这些程序是分时交替执行。 4. 并行与分布式的关系: 网络;并行更注重性能,而分布式更注重透明共享。,5.并行与网格计算(普适计算)的关系: 网格通过网络连接地理上分布的各类计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等,形成对用户相对透明的虚拟的高性能计算环境,让人们透明地使用这些资源和功能。它们与并行计算存在规模上的差异。 6 .并行与云计算的关系: 云计算以开放的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云”上的各种计算机共同组成数个庞大的数据中心及计算中心。
3、云计算把计算及存储以服务的形式提供给互联网用户,用户所使用的数据、服务器、应用软件、开发平台等资源都来自互联网上的虚拟化计算中心,该数据中心负责对分布在互联网上的各种资源进行分配、负载的均衡、软件的部署、安全的控制等。,7. 为什么要研究并行算法? (1)CPU的发展速度:Moore Law。 (2)深蓝与国际象棋大师:1996年2月,国际象棋世界冠军卡斯帕罗夫与IBM开发的“深蓝”计算机对奕,卡斯帕罗夫最终四比二战胜 “深蓝”(IBM,它带有256个处理器 )。 1997年5月, “深蓝”计算机以3.5:2.5战胜卡斯帕罗夫。 (3)需求:快速(天气预报),提高计算精度,与理论、实验并重的科
4、学方法(代替核武器实验),8.国内外发展现状 (1)国内发展情况:2010年11月中国国防科学技术大学研制的“天河1A” 运算速度达每秒2570万亿次,有186,368个核,在第三十六期全球超级计算机TOP500中曾排名第一,2012年6月排名第5。 “863”计划、“973”计划、国家自然科学基金都对并行计算十分重视。 (2)国外发展情况 2012年6月, Rank 1: 美国IBM的“BlueGene/Q”,1,572,864个核,运算速度已达16,324万亿次。 最新见附表(附表中计算速度单位为Gflops/s)。,美国HPCC、ASCI计划; 早在20世纪80年代末期,美国政府就制定了
5、一项高性能计算计划(Federal High Performance Computing Program)。旨在发展美国的的高性能计算机并将其用于解决一些有关国民经济与国家安全的重大问题,后来,随着通信技术的发展,这个计划被修改为高性能计算与通信计划(HPCC)。 后来,美国政府为了把HPCC计划向更高、更深入的层次发展,又提出了三个计划:,推动战略计算计划(Accelerated Strategic Computing Initiative, ASCI) 其目的是为模拟核试验和核武器储备管理提供足够的计算能力。 高性能计算现代化计划(HPC Modernization Program)。 其
6、目的是为了改善国防研究的计算,降低武器设计、测试费用,保持美国在军事上的优势。其任务是建立16个由高速网络连接的高性能计算中心。 每秒千万亿次浮点计算计划(Petaflops Computing) 这是美国的前瞻性研究计划。,日本真实世界计算计划: 日本早在20世纪90年代初就制定了这一项雄心勃勃的计划。这项计划的目的在于超越信息处理的原有框架,研制超并行、超分布的光计算机系统,并在神经科学和认知科学等方面取得重大进展。真实世界内的信息包括图像、声音、触觉、符号型知识数据等,种类极为繁杂、信息量非常庞大。 另外,日本1997年计划开发的“地球模拟器”已于2002年研发成功,成为一度领先的世界最
7、快的超级计算机。 (3)并行算法的发展状况:,(4)并行计算模型发展状况:LogP,LogGP,BSP (5)并行开发环境发展状况:PVM、MPI、HPF、OpenMP(利用超线程技术,针对共享内存多处理器体系结构并行计算机)、OpenCL(支持多核、GPU、DSP等硬件平台,【目前主要建立在CUDA架构上】 ),全书共分为三个部分: 1.基础理论:主要介绍并行计算平台、并行算法概述、并行程序开发环境等; 2.基础应用:主要包含矩阵运算、快速傅立叶变换、卷积运算、数字滤波、离散余弦变换、哈达玛变换、2D离散小波变换、数字图像处理等方面的并行算法设计、分析与测试; 3.实际应用:主要介绍并行算法
8、在电磁散射中的应用和无线电波参数联合估计中的应用。,第一章 并行计算平台,并行计算机分类,1. SISD,Single Instruction Stream |82| | MPYU .M2 m1_6,qp_tab,m2_6$1 ; |101| | SHR .S2 m1_4,0 x13,m1_4 ; |94| | SHR .S1 m1_3,0 x13,m1_3 ; |95| ADD .D2 qp_constb,m2_7,m2_7 ; |109| | SHR .S2 m2_6,0 xf,m3_6 ; |119| | ADD .L1 qp_consta,m2_3,m2_3 ; |113| | SHR
9、 .S1 m1_2,0 x13,m1_2 ; |96| | MPYU .M1X m1_1,qp_tab,m2_1 ; |106| | OR .L2 val_1,sign5,sign5 ; |144| | MPY2 .M2 x2_54,val_2B1b,x5:x4 ; |69| | LDDW .D1T1 *-scaleM(8),sm3:sm2 ; |61| PACK2 .L2 m4_7,m4_6,m76 ; |170| | PACK2 .L1 m4_3,m4_2,m32 ; |172| | OR .D1X val_1,sign2,sign2 ; |147| | MPYU .M2X x6,sm2,
10、m0_6 ; |74| | SHL .S2 x76,0 x10,sign6 ; |132| | SHL .S1 x10,0 x10,sign0 ; |135| | MPY2 .M1 x2_10,val_2B1a,x1:x0 ; |71| ,执行时的最小单位是 thread;数个 thread 可以组成一个 block;一个 block 中的 thread 能存取同一块共享的内存,而且可以快速进行同步的动作;不同 block 中的 thread 无法存取同一个共享的内存,因此无法直接互通或进行同步;执行相同程序的 block,可以组成 grid。,GPU并行:CUDA(Compute Unifi
11、ed Device Architecture ),SIMD/SMP,nVIDIA GTX200核心,Tesla GPGPU可以看作之前的Nvidia Quadro专业卡的通用计算版本 GTX200的240个流处理器被分为10组并行的材质处理簇TPC( Texture Processing Cluster ) 每个TPC由3个流处理器单元SM( Streaming Multiprocessors )组成 每个SM由8个流处理器SP(Stream Processor);每个TPC内的24个流处理器共享L1缓存(TPC的核内内存) 每个SM可以支持1024个并行线程 整个GTX200核心可以支持30720个线程,定义: network diameter: bisection width:,并行计算机的处理器连接方式,一.总线结构,二.一维阵列结构,三. 网格结构,四.超立方体结构,五.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业遥感与精准农业应用手册
- 2026年聚类能力测试题及答案
- 2026年影视鉴赏测试题及答案
- 智能机器人算法优化实战手册
- 食品安全与质量管理指南
- 武汉市武珞路中学九年级英语期末真题试卷含答案及解析
- 企业信息化管理软件系统开发与应用推广研究报告
- 标准符合产品承诺书7篇
- 环境品质提升措施承诺函3篇
- 2026届海南省琼中学黎族苗族自治县中考语文考试模拟冲刺卷含解析
- 2026年天津市高三高考二模英语模拟试卷试题(含答案详解)
- 2026中国卵巢上皮性癌维持治疗专家共识解读
- 2026年炊事专业考核真题(培优B卷)附答案详解
- SYT 0452-2021 石油天然气金属管道焊接工艺评定-PDF解密
- 重卡结构爆炸图-中英文对照教学课件
- EVE国服历史汇编
- GB/T 4798.3-2023环境条件分类环境参数组分类及其严酷程度分级第3部分:有气候防护场所固定使用
- 电缆线路巡视
- SH/T 0642-1997液体石油和石油化工产品自燃点测定法
- GB/T 3799-2021汽车发动机大修竣工出厂技术条件
- GB/T 14699.1-2005饲料采样
评论
0/150
提交评论