




免费预览已结束,剩余29页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
并行算法及其应用,计算机学院卢光辉Email:*Tel:*主楼B1-*,教学安排:20学时教材:孙世新,卢光辉等,并行算法及其应用参考书:黄铠、徐志伟著,陆鑫达等译.可扩展并行计算技术、结构与编程.机器工业出版社,2000.李晓梅、蒋增荣等著.并行算法,湖南科学技术出版社,1992.陈国良.并行算法的设计与分析.高等教育出版社,2002.11.,序言,1.什么叫并行算法?一些可同时执行的诸进程的集合,这些进程相互作用和相互协调。,2.并行算法与串行算法的关系:,P1,P2,P3,3.并行与并发的关系:并行并发并发是指两个或者多个事件在同一时间间隔内发生。在单处理机系统中,每一时刻仅能有一道程序执行,宏观上多道程序在同时运行,微观上这些程序是分时交替执行。4.并行与分布式的关系:网络;并行更注重性能,而分布式更注重透明共享。,5.并行与网格计算(普适计算)的关系:网格通过网络连接地理上分布的各类计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等,形成对用户相对透明的虚拟的高性能计算环境,让人们透明地使用这些资源和功能。它们与并行计算存在规模上的差异。6.并行与云计算的关系:云计算以开放的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片“云”上的各种计算机共同组成数个庞大的数据中心及计算中心。云计算把计算及存储以服务的形式提供给互联网用户,用户所使用的数据、服务器、应用软件、开发平台等资源都来自互联网上的虚拟化计算中心,该数据中心负责对分布在互联网上的各种资源进行分配、负载的均衡、软件的部署、安全的控制等。,7.为什么要研究并行算法?(1)CPU的发展速度:MooreLaw。(2)深蓝与国际象棋大师:1996年2月,国际象棋世界冠军卡斯帕罗夫与IBM开发的“深蓝”计算机对奕,卡斯帕罗夫最终四比二战胜“深蓝”(IBM,它带有256个处理器)。1997年5月,“深蓝”计算机以3.5:2.5战胜卡斯帕罗夫。(3)需求:快速(天气预报),提高计算精度,与理论、实验并重的科学方法(代替核武器实验),8.国内外发展现状(1)国内发展情况:2010年11月中国国防科学技术大学研制的“天河1A”运算速度达每秒2570万亿次,有186,368个核,在第三十六期全球超级计算机TOP500中曾排名第一,2012年6月排名第5。“863”计划、“973”计划、国家自然科学基金都对并行计算十分重视。(2)国外发展情况2012年6月,Rank1:美国IBM的“BlueGene/Q”,1,572,864个核,运算速度已达16,324万亿次。最新见附表(附表中计算速度单位为Gflops/s)。,美国HPCC、ASCI计划;早在20世纪80年代末期,美国政府就制定了一项高性能计算计划(FederalHighPerformanceComputingProgram)。旨在发展美国的的高性能计算机并将其用于解决一些有关国民经济与国家安全的重大问题,后来,随着通信技术的发展,这个计划被修改为高性能计算与通信计划(HPCC)。后来,美国政府为了把HPCC计划向更高、更深入的层次发展,又提出了三个计划:,推动战略计算计划(AcceleratedStrategicComputingInitiative,ASCI)其目的是为模拟核试验和核武器储备管理提供足够的计算能力。高性能计算现代化计划(HPCModernizationProgram)。其目的是为了改善国防研究的计算,降低武器设计、测试费用,保持美国在军事上的优势。其任务是建立16个由高速网络连接的高性能计算中心。每秒千万亿次浮点计算计划(PetaflopsComputing)这是美国的前瞻性研究计划。,日本真实世界计算计划:日本早在20世纪90年代初就制定了这一项雄心勃勃的计划。这项计划的目的在于超越信息处理的原有框架,研制超并行、超分布的光计算机系统,并在神经科学和认知科学等方面取得重大进展。真实世界内的信息包括图像、声音、触觉、符号型知识数据等,种类极为繁杂、信息量非常庞大。另外,日本1997年计划开发的“地球模拟器”已于2002年研发成功,成为一度领先的世界最快的超级计算机。(3)并行算法的发展状况:,(4)并行计算模型发展状况:LogP,LogGP,BSP(5)并行开发环境发展状况:PVM、MPI、HPF、OpenMP(利用超线程技术,针对共享内存多处理器体系结构并行计算机)、OpenCL(支持多核、GPU、DSP等硬件平台,【目前主要建立在CUDA架构上】),全书共分为三个部分:1.基础理论:主要介绍并行计算平台、并行算法概述、并行程序开发环境等;2.基础应用:主要包含矩阵运算、快速傅立叶变换、卷积运算、数字滤波、离散余弦变换、哈达玛变换、2D离散小波变换、数字图像处理等方面的并行算法设计、分析与测试;3.实际应用:主要介绍并行算法在电磁散射中的应用和无线电波参数联合估计中的应用。,第一章并行计算平台,并行计算机分类,1.SISD,SingleInstructionStream|82|MPYU.M2m1_6,qp_tab,m2_6$1;|101|SHR.S2m1_4,0 x13,m1_4;|94|SHR.S1m1_3,0 x13,m1_3;|95|ADD.D2qp_constb,m2_7,m2_7;|109|SHR.S2m2_6,0 xf,m3_6;|119|ADD.L1qp_consta,m2_3,m2_3;|113|SHR.S1m1_2,0 x13,m1_2;|96|MPYU.M1Xm1_1,qp_tab,m2_1;|106|OR.L2val_1,sign5,sign5;|144|MPY2.M2x2_54,val_2B1b,x5:x4;|69|LDDW.D1T1*-scaleM(8),sm3:sm2;|61|PACK2.L2m4_7,m4_6,m76;|170|PACK2.L1m4_3,m4_2,m32;|172|OR.D1Xval_1,sign2,sign2;|147|MPYU.M2Xx6,sm2,m0_6;|74|SHL.S2x76,0 x10,sign6;|132|SHL.S1x10,0 x10,sign0;|135|MPY2.M1x2_10,val_2B1a,x1:x0;|71|,执行时的最小单位是thread;数个thread可以组成一个block;一个block中的thread能存取同一块共享的内存,而且可以快速进行同步的动作;不同block中的thread无法存取同一个共享的内存,因此无法直接互通或进行同步;执行相同程序的block,可以组成grid。,GPU并行:CUDA(ComputeUnifiedDeviceArchitecture),SIMD/SMP,nVIDIAGTX200核心,TeslaGPGPU可以看作之前的NvidiaQuadro专业卡的通用计算版本GTX200的240个流处理器被分为10组并行的材质处理簇TPC(TextureProcessingCluster)每个TPC由3个流处理器单元SM(StreamingMultiprocessors)组成每个SM由8个流处理器SP(StreamProcessor);每个TPC内的24个流处理器共享L1缓存(TPC的核内内存)每个SM可以支持1024个并行线程整个GTX200核心可以支持30720个线程,定义:networkdiameter:bisectionwidth:,并行计算机的处理器连接方式,一.总线结构,二.一维阵列结构,三.网格结构,四.超立方体结构,五.蝶网,几个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第一节 核酸是遗传物质的证据说课稿-2025-2026学年高中生物浙科版必修2遗传与进化-浙科版
- 第3課 自分にできるボランティア活動说课稿-2025-2026学年高中日语人教版第一册-人教版
- 江苏省镇江市八年级政治下册 第五单元 与法同行 第16课 消费者的合法权益受法律保护 第2框 依法维护消费权益说课稿 苏教版
- 中医试题及答案国医通
- 武汉市公立中学公开招聘初中教师2名笔试含答案
- 互联网医疗合作出资方合作协议样本
- 矿业企业员工试用期安全生产与职业健康协议
- 四城区住房保障家庭租赁补贴资金使用与监管协议
- 高端商业广场商铺租赁合同包含装修及使用权
- 2025合同范本:销售人员绩效考核制度示例
- 石油行业安全培训课件
- 国开电大组织行为学任务四调查报告
- 事业单位医学基础知识名词解释
- 施工现场安全监理危险源清单一览表
- GB/T 233-2000金属材料顶锻试验方法
- FZ/T 74003-2014击剑服
- 颈椎DR摄影技术-
- 功能材料概论-课件
- 一点儿有点儿课件
- 眼视光技术专业技能考核题库-眼镜定配技术模块
- 体育测量与评价-第二章-体育测量与评价的基础理论课件
评论
0/150
提交评论