第一章加速比.ppt

上传人：s*** IP属地：河南上传时间：2020-02-26 格式：PPT 页数：58 大小：667KB 积分：20 举报 版权申诉

已阅读5页，还剩53页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

高等计算机系统结构总学时 32理论学时 28讨论 4平时课堂发言讨论等等 10 作业 5次占总分数30 期末考试 60 上课地点工一508 1 16周周二1 2节高等计算机系统结构课程介绍教材1 KaiHuang著王鼎兴郑纬民沈美明译高等计算机系统结构并行性可扩展性可编程性清华大学出版社 2 PattersonD A HennesyJ L ComputerArchitecture AQuantitativeApproach MorganKanfmannPublishers 1995 3 PattersonD A HennesyJ L ComputerOrganization Design TheHardware SoftwareInterface 高等计算机系统结构第一章加速比性能模型与可扩展性分析第二章高等计算机的核心技术并行处理第三章互连与通信第四章划分与调度第五章并行存储器系统第六章CacheCoherence第七章MemoryConsistency第八章指令级并行处理第九章多处理机实例第十章高性能微处理器第十一章网格计算与云计算课程概述系统结构研究的范围指令集设计功能组织逻辑设计与实现HPC的性能分析评价方法标准并行处理各个功能部件各个级别指令集软件的作用程序员眼中的结构系统集成部件之间的配合平衡发展趋势制造技术进步设计的创新上个世纪90年代后后者带来的性能提高几乎是前者的5倍高性能计算机简介 TOP500 HTC 第一章加速比性能模型与可扩展性分析 1 1计算机的发展变化及影响体系结构的因素1 1 1计算机发展历程1 1 2影响体系结构的因素1 1 3计算机性能评价1 2加速比性能分析1 2 1一般概念1 2 2加速比1 2 3三种加速比性能模型1 3可扩展性分析 1 1计算机的发展变化及影响体系结构的因素 1 1 1计算机发展历程1 第一代真空管 1946 1957 2 第二代电子管 1957 1964 3 集成电路 1965 1971 4 以后几代 LSIVLSI 1972 至今 1 1 1计算机发展历程 1 第一代电子真空管代表 ENIAC 1946年特点体积庞大占地1500平方英尺功率 200KW 必须手动编程性能读卡速度120张分钟加法运算5000 秒除法150 秒不太可靠机器的正确率仅为20 目标机器有18000真空管在炮弹到达目标之前 ENIAC能够计算出大口径海军炮弹轨道 2 晶体管代表 IBM7094特点磁芯存储技术容量32K 周期2微秒十几万个晶体管目标科学计算商业应用 3 集成电路代表特点存储容量512k 处理器周期0 2微秒第一次提出兼容性概念模块化设计目标科学计算商业应用影响奠定大型机体系结构 4 LSIVLSI代表微处理器的变化从4004到PentiumII时钟 108K 300MHZ晶体管数 2300 750万晶体管尺寸 10微米 0 3微米可寻址存储器 640bit 64GB 1 1 2影响影响体系结构的因素 1 硬件技术进步改变软硬件界面 2 软件兼容性高级语言模拟与仿真 3 应用应用的规模精度等增长对计算机速度的要求提高 4 价格性能与价格的平衡 1 1 3计评价算机性能 1 执行时间是衡量计算机性能的标准 2 主要标准 1 MIPS millioninstructionspersecond 2 MFLOPS millionfloatingpointoperationspersecond 3 基准测试程序a 实际应用程序b 核心程序c 基准测试程序d 综合基准测试程序 3 性能的比较和总结评价一台计算机的性能既是简单又是复杂的 1 不同程序对机器的性能的不确定性 2 不同输入的不确定性 1 1加速比性能模型 1 1 1一般概念1 处理机时间积处理机数目与处理时间的乘积用以度量这些处理机运行时的资源利用率若一程序在 P台处理机上运行的时间为Tp 则此P台处理机在Tp时间间隔内完成的工作最大数量为Tp P 可将处理机实际工作曲线对时间的积分看成是这些处理机完成的有效工作量效率为有效工作量与最大工作量之比 2 并行度 DegreeOfParallelism DOP 并行度 DOP 是在一定时间间隔内执行一个程序所用的处理机的数目 3 并行性分布图执行一个给定的程序时DOP对时间的分布图 DOP与对应时间的间隔之积即为处理机要完成的工作或工作负载下图所示为一个并行性分布图 DOP t1 t t2 并行性分布图 1 1 2加速比1 绝对加速比将最好的串行算法与并行算法相比较定义一与具体机器有关将最好的串行算法在一台上的运行时间与并行算法在N台运行的时间相比定义二与具体机器无关将最好的串行算法在最快的顺序机上的执行时间与并行算法在并行机上的运行时间相比 2 相对加速比同一并行算法在单节点上运行时间与在多个相同节点构成的处理机系统上的运行时间之比这种定义侧重于描述算法和并行计算机本身的可扩展性线性加速比中间开销小通信少弱耦合计算超线性加速比当应用需要大内存时可能出现病态加速比加速比递减可能是计算量太小 1 1 3三种加速比性能模型 1 固定负载加速比性能模型 Amdahl定律在许多实时应用领域计算负载的大小常固定在并行机中此负载可分布至多台并行执行获得的加速比称为fixed loadspeedup 一个问题的负载可表示如下 W Ws Wp其中 Ws代表问题中不可并行化的串行部分负载 Wp表示可并行化的部分负载则n个节点情况下加速比可以表示如下设串行因子为串行部分所占的比例即代入即得Amdahl law 不管采用多少处理机可望达到的最好加速比效率En可以表示为处理机数目n越大效率En越低 Amdahl定律告诉我们系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关加速比的两个决定因素 1 计算机执行某个任务的总时间中可被改进部分的时间所占的百分比即可被改进部分占用时间改进前整个任务的执行时间记为Fe 它总小于1 2 改进部分采用改进措施后比没有采用改进措施前性能提高的倍数即改进前改进部分执行时间改进后改进部分执行时间记为Se 例1 假设将某系统的某一部件的处理速度加快到10倍但该部件的原处理时间仅为整个运行时间的40 则整个系统的性能提高了多少解 Fe 0 4 Se 10 例2 采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大假设FPSQR操作占整个测试程序执行时间的20 一种实现方法是采用FPSQR硬件使FPSQR操作的速度加快到10倍另一种方法是使所有浮点数据指令的速度加快使FP指令的速度加快到2倍还假设FP指令占整个执行时间的50 请比较这两种设计方案解 Fe FPSQR 0 2 Se FPSQR 10 Fe FP 0 5 Se FP 2 Amdahl law又称为固定规模加速比模型问题规模不随处理机变化而变化固定问题规模看用并行技术能达到的最短时间是多少在固定规模加速比模型下负载和执行时间随系统中处理机数目n变化的情况如下图 Ws Wp Ws Wp Ws Wp Ws Wp Workload N 1 2 3 4 固定负载执行时间随N增加而减少固定负载加速比模型下的负载和执行时间情况当处理器数目n 1024 加速比Sn随变化的情况如下得出曲线如下图 91 Sn 1024 48 31 24 10 可以比较不同的对加速比带来的不同影响 0时得到理想加速比当值增加时加速比性能急剧下降结论加速比曲线随的上升急剧下降原因是存在顺序部分Ws 无法用增加系统的处理机数目来解决这一性质在过去二十年间给人们造成了对并行处理非常悲观的印象影响两种意见 1 劝阻制造商生产大规模并行计算机 2 研究并行编译器以降低的值从而提高系统的性能固定负载加速比模型的可能应用范围对时间要求严格的应用问题 2 固定时间加速比性能模型 Gustafsun定律有许多应用领域强调精度而不是运行时间 1988年 Gustafsun提出了固定时间加速比模型当机器的规模扩大时解题的规模也随着扩大从而得到更加精确的解而使运行时间保持不变比如有限元方法做结构分析流体动力学做天气预报解PDE 偏微分方程组就需要提高精度粗格要求的计算量较少而细格的计算量多得到的精确度也较高天气预报模拟求解四维PDE 如果使每个实际方向 X Y Z 的格点距离减少10倍并以同一幅度增加时间步那么可以说格点增加了104倍因而工作负载也至少增大了10000倍模型提出的背景固定负载模型有缺陷因为Amdahl law中取决于问题及并行编译器的效率无法描述系统固有的特性加速比的公式其中 Wp nWp和Ws Wp Ws Wp n作为固定时间的条件 Ws Wp n表示在扩大负载后在增加处理机台数的情况下的平均负载执行时间它应当和负载没有扩大情况下的平均负载执行时间 Ws Wp相等即有Ws Wp Ws Wp n 同时负载的串行部分并没有改变即有Ws Ws 在固定时间加速比模型下负载和执行时间随系统中处理机数目n变化的情况如下图 Ws Wp Ws Wp Ws Wp Ws Wp Workload N 1 2 3 4 Ts Tp 2 Ts Tp 3 Ts Tp 4 并行负载不断增加执行时间固定固定时间加速比模型下的负载和执行时间情况增大问题规模的办法使所有处理机保持忙碌状态在问题扩大到与可用的计算能力匹配时程序中的顺序部分就不再是瓶颈了当处理器数目n 1024 加速比Sn随变化的情况如下 Sn 1024 1014 1004 993 983 3 受限于存储器的加速比模型1993年由Sun和Ni提出大型科学计算和工程设计需要较大的存储空间许多应用问题是存储器受限而不是CPU受限或者I O受限比如在分布存储系统中常遇到总存储容量随节点数线性增加许多节点集合起来解一个大题基本思想要在存储空间有限条件下解尽可能大的问题这同样需要扩展工作负载才能提供较高的加速比较高的精度和较好的资源利用率加速比可以表示如下其中在单个处理机上顺序执行的工作负载与问题的规模或系统的规模无关即而G n 反映的是存储容量增加n倍时并行工作负载增加的倍数讨论 1 G n 1 即为固定负载的情况 2 G n n 即存储器增加n倍负载也增加n倍为固定时间的情形 3 G n n 计算负载的增加情况比存储器增加快会有较高的加速比比较三种加速比对于相同的处理机数量有在受限于存储器的加速比模型下负载和执行时间随系统中处理机数目n变化的情况如下图 Ws Wp Ws Wp Ws Wp Ws Wp Workload N 1 2 3 4 Ts Tp 1 Ts Tp 2 Ts Tp 3 Ts Tp 4 规模扩展的工作负载执行时间稍有增加受限于存储器的加速比模型下的负载和执行时间情况例 n维矩阵乘法 A B C 其中A B C都是n n的方阵为得到C的每一个元素需要进行n次乘法 n次加法所以总的计算量为 n n n2 2n3 需要的存储量为3n2 两个源矩阵一个结果矩阵如果n台计算机组成多计算机系统则存储容量扩大n倍那么矩阵的维数原来为n 也可以增加了设为N倍那么加速比为多少解存储容量变为 nM n 3n2 3n3 而N维需要的存储量为3N2 计算量变为2N3 则有 4 并行计算的应用模型随机器规模的增大工作负载增长的模式如下图工作负载问题规模 n 指数线性亚线性常数上图中采用受限于存储器的加速比模型中给出的公式曲线对应的G n n1 5 曲线对应的G n n 曲线对应的G n 0 5n 曲线对应的G n 1则有加速比公式给定一个程序假设Ws Wp 0 4 那么效率为并行计算机的应用模型如下图通信界限存储器界限受限于存储器模型工作负载问题规模机器规模固定负载模型固定时间模型第一章加速比性能模型与可扩展性分析 1 3可扩展性分析1 3 1可扩展性1 3 2可扩展性分析 1 3可扩展性分析 1 3 1可扩展性1 可扩展性与可编程性增加可扩展性增加可编程性分布存储的消息传递型多计算机共享存储型多处理机理想并行计算机 2 可扩展性指标机器规模 n 时钟频率 f 问题规模 s CPU时间 T I O需求 d 存储容量 m 通信开销 h 计算机价格 c 程序设计开销 p 3 可扩展性的直观定义对任意数量 n 的处理机和任意规模 s 的问题若所有算法的系统效率E 1 则系统是可扩展的 4 规模可扩展性系统性能随处理机数量线性增长包括处理速度和效率存储速度和容量互连带宽和时延I O速度和容量软件开销规模可扩展性与空间局部性时间局部性以及部件瓶颈都有关系例子 CrayY MP 16台处理机范围可伸缩CM 2 8K 64K台处理机范围可伸缩CM 5 1024 16K台处理机范围可伸缩KSR 1 8 1088台处理机范围可伸缩 5 换代时间可扩展性对系统各部分更换成新技术后性能随之易扩展要求算法 S W均能兼容运行 6 问题可扩展性问题规模扩大时系统仍能很好的运行或说问题规模扩展到很大时系统能在给定粒度下高效运行 1 3 2可扩展性1 恒等效率概念 Isoefficiency 恒等效率定义为一个并行算法在并行计算机上实现时为保持效率E固定所需的工作负载与机器规模n的相对关系设 W W s 为工作负载 h h s n 为通信开销它随s n增加而增大其中 s为问题规模 n为机器规模则效率可以表示为问题的关键在于W s 与h s n 之间的相对增长速度机器规模一定开销h的增长比工作负载W要慢因而对一定规模的机器来说效率会随问题规模增大而提高所以假若工作负载W随机器规模适当增加那么就有希望保持效率不变对于已知的算法来说为了保持恒定的效率工作负载W可能需要对n以多项式或指数规律增长不同的算法可能需要不同的工作负载增长速率以便在n增加时保持效率不致下降一般并行算法的恒定效率函数是n的多项式函数即它们为O nk k 1 n的幂越小并行系统的可扩展性越大系统包括算法和结构的组合 2 恒等效率函数并行程序执行时间Tp T1 T0 p 其中 T1为总工作负载串行执行时间 T0为多节点总通信延时 p为节点数那么加速比为而T1 Wtc W为以操作次数计算的总工作负载 tc为每个

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第一章加速比.ppt

文档简介

温馨提示

最新文档

评论

第一章 加速比.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第一章加速比.ppt