




已阅读5页,还剩141页未读, 继续免费阅读
(计算机科学与技术专业论文)面向高性能计算的性能评价模型技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国防科学技术大学研究生院博士学位论文 摘要 作为解决大规模计算问题的重要手段,高性能计算被越来越广泛地应用到科 学与工程的各个领域。随着高性能计算的发展,高性能计算机规模的不断扩大, 系统峰值性能得到迅速的提高。但是,应用程序获得的持续性能并未与峰值性能 保持相同的增长速度,它们之间的差距越来越大。如何发现系统瓶颈,优化系统 设计,提高系统持续性能是高性能计算研究领域中亟待解决的重点和难点问题。 高性能计算中的性能评价技术是解决此类问题的一个有效途径和方法。 由于机器体系结构和程序结构日益复杂,影响程序性能的因素越来越多,同 时各种因素之间还存在着复杂的、非线性的交互作用,使面向高性能计算的性能 评价面临着巨大的挑战。传统的性能评价方法由于自身特点已经不能满足这些复 杂的大规模并行系统性能评价的需要,一种结合应用负载特征和机器体系结构特 点的性能模型方法得到学术界和工业界的高度关注。这种方法独立分析应用的负 载特征和机器的性能轮廓,并通过数学方法结合这两类参数评价系统的性能。本 文围绕着“准确评价并行系统性能”这一根本目标,对高性能计算中的性能评价 模型结构框架及其关键实现技术展开深入的研究。 论文首先深入分析了国际上并行系统性能评价技术的研究现状和热点方法, 重点研究了对并行系统性能评价有重要影响的研究项目,总结了它们的特点和不 足。 综合分析影响并行系统性能的众多复杂因素,针对一维空间性能度量尺度的 不足,论文在多维空间上提出了并行系统性能度量体系,定义了基本性能指标 a i m 、s p f 和s p m a o ,给出了这些基本指标之间的距离和相似性关系,阐述了度 量体系在并行系统性能分析中的作用。多维空间上的性能度量体系奠定了并行系 统性能评价的基础,建立了实际并行系统到抽象数学空间的映射。 论文分析了目前大部分并行系统性能评价模型特点,提出了一个并行系统性 能模型框架p m p s ( p e r f o r m a n c em o d e lo f p a r a l l e ls y s t e m s ) 。该模型采用局部与整 体相结合的层次式褶合方法,具有良好的可扩展性和开放性。 为降低性能指标的维数,减少p m p s 模型分析的复杂度。论文研究了处理器 节点关键性能因素的提取技术,提出了一个有效的d o u b l e p 方法。该方法将众多 复杂的性能因素聚焦到几个性能主成份上,明确了分析的对象。通过d o u b l e p 方 法的分析,提取了1 4 个影响处理器节点性能的关键因素和4 个性能主成份。 程序性能特征分析方法是p m p s 模型中实现应用负载特征分析的主要手段, 也是并行系统性能模型研究的难点问题之一。为实现程序性能特征的快速分析, 论文提出了基于抽样的程序性能特征分析方法。与其它方法相比较,该方法在相 第i 页 国防科学技术大学研究生院博士学位论文 同误差条件下有效减少了分析的指令数量,仅需抽样分析l o o - - 3 的程序指令就能 实现小于3 的分析误差。论文基于抽样方法实现了的程序性能特征分析器 s a m p l e p r o 。 处理器节点性能模型是p m p s 模型的重要组成。论文提出了一种基于多元线 性回归的处理器节点性能求解方法和表示模型。该方法将性能因素和它们间的相 关性转变成相互独立的一次预报变量,通过求解回归系数确定了程序中复杂的重 叠操作时间和不同操作类型的权重。使用该方法构建的性能模型更加准确,误差 分布均匀,不受处理器类型和负载特征的影响。 通过本文的研究,实现了具有良好可扩展性和开放性的p m p s 性能模型。该 模型能准确评价各种并行应用在并行机器上的性能,可以有效发现并行系统的性 能瓶颈,指导并行系统的设计、优化与升级。 主题词:性能模型,性能度量体系,褶合方法,p b 设计,主成份分析,系统 抽样,回归模型。 第i i 页 国防科学技术大学研究生院博士学位论文 4b s t r a c t h i 曲p e r f o r m a n c ec o m p u t i n g ( h p c ) i sw i d e l yu s e di ns c i e n c ea n de n g i n e e r i n gt o s o l v el a r g ec o m p u t a t i o np r o b l e m s w i mt h ed e v e l o p m e n to fh p c t h es c a l eo ft h eh i g h p e r f o r m a n c ec o m p u t e r si se x p a n d e dr a p i d l y m a n yn e wt e c h n o l o g i e sa n dm e t h o d sa r e i n t r o d u c e dt oi m p r o v et h ep e r f o r m a n c ei nt h ed e s i g n i n go ft h ep r o c e s s o rn o d e s t h e p e a kp e r f o r m a n c eo fc o m p u t e r si n c r e a s e si nac o n t i n u o u sa n dr a p i dw a y b u tt h e s u s t a i n e dp e r f o r m a n c ea c h i e v e db yt h er e a la p p l i c a t i o n sd o e sn o ti n c r e a s ei nt h es a m e s c a l ea st h ep e a kp e r f c i r m a n c ed o e sa n dt h eg a pb e t w e e nt h e mi sw i d e n i n g p e r f o r m a n c e e v a l u a t i o no f p a r a l l e ls y s t e m s ,w h i c hi so n eo f e f f e c t i v ew a y st os o l v et h i sp r o b l e m ,c a n f i n dt h eb o t t l e n e c ko ft h es y s t e ma n dg u i d et h eo p t i m i z a t i o no ft h es y s t e md e s i g n a st h ec o m p u t e ra r c h i t e c t u r e sa n dp r o g r a ms t r u c t u r e sa r eb e c o m i n gm u c hm o r e c o m p l e x ,m o r ea n dm o r ef a c t o r sm a ya f f e c tt h ep e r f o r m a n c eo ft h ep r o g r a m s f u r t h e r m o r e ,t h e s ef a c t o r si n t e r p l a yw i t he a c ho t h e ri nac o m p l e xa n dn o n l i n e a rw a y , w h i c hm a k e st h ep e r f o r m a n c ee v a l u a t i o no fp a r a l l e l s y s t e m sag r e a tc h a l l e n g e t r a d i t i o n a lp e r f o r m a n c ee v a l u a t i o nm e t h o d sc a n n o ts a t i s f yt h en e e df o rp e r f o r m a n c e e v a l u a t i o no ft h e s em a s s i v ep a r a l l e ls y s t e m s p e r f o r m a n c em o d e lw h i c hc o m b i n e st h e a p p l i c a t i o ns i g n a t u r e sa n dt h em a c h i n ep r o f i l e sd r a w st h ea t t e n t i o n so ft h er e s e a r c h c o m m u n i t ya sw e l la st h ei n d u s t r yc o m m u n i t y t l l i sm e t h o da n a l y z e sa p p l i c a t i o n s i g n a t u r e sa n dm a c h i n ep r o f i l e si n d e p e n d e n t l y ,a n du s e sc o n v o l u t i o nm e t h o d st om a pa n a p p l i c a t i o n ss i g n a t u r eo n t oam a c h i n ep r o f i l et oa r r i v ea tt h ep e r f o r m a n c ep r e d i c t i o n a i m i n ga tp r e d i c t i n gt h ep e r f o r m a n c eo ft h ep a r a l l e la p p l i c a t i o n se x a c t l y ,w er e s e a r c h o nt h ep e r f o r m a n c em o d e lo fp a r a l l e ls y s t e m sa n dk e yt e c h n o l o g i e s n l ed i s s e r t a t i o nt h o r o u g h l yi n v e s t i g a t e st h ep r e s e n ts t a t u sa n dh o tp o i n t so f r e s e a r c h e so np e r f o r m a n c ee v a l u a t i o no f p a r a l l e ls y s t e m s s e v e r a li m p o r t a n tp r o j e c t sa r e a n a l y z e d ,a n dt h e i rc h a r a c t e r i s t i ca n ds h o r tp o i n ta r es u m m a r i z e d t h ed i s s e r t a t i o nc o n s i d e r sa l lt h ef a c t o r st h a tc a ni n f l u e n c et h ep e r f o r m a n c eo ft h e p a r a l l e ls y s t e m ,a n dp r o p o s e s ap e r f o r m a n c em e t r i co ft h e p a r a l l e ls y s t e m so n m u l t i d i m e n s i o n a l s p a c e t h em e t r i cs y s t e md e f i n e sb a s i cp e r f o r m a n c em e t r i c s : a p p l i c a t i o ni n t r i n s i cm e t r i c s ( a i m ) ,s y s t e mp e r f o r m a n c ef u n c t i o n s ( s p f ) a n ds y s t e m p e r f o r m a n c em e t r i c sa p p l i c a t i o no r i e n t e d ( s p m a o ) a n dp r o p o s e st h ed i s t a n c e b e t w e e nt h e s em e t r i c sa n dt h es i m i l a rr e l a t i o n sa m o n gt h e m t h ep e r f o r m a n c em e t r i co n m u l t i d i m e n s i o n a ls p a c eb u i l d st h et h e o r e t i c a lb a s i so ft h i sd i s s e r t a t i o n i ts e tu pam a p f r o mp a r a l l e ls y s t e m st oa b s t r a c tm a t h e m a t i c ss p a c e c o n s i d e r i n ga 1 1t h ec h a r a c t e r i s t i co fm o s tp e r f o r m a n c em o d e l so ft h em o s to ft h e p a r a l l e ls y s t e m s ,an o v e lp e r f o r m a n c em o d e lf r a m e w o r kp m p s ( p e r f o r m a n c em o d e lo f p a r a l l e l s y s t e m s ) b a s e do nt h ec o n v o l u t i o nm e t h o di sp r o p o s e d t h i sp e r f o r m a n c e 第i i i 页 国防科学技术大学研究生院博+ 学位论文 m o d e lh a sg o o d s c a l a b i l i t ya n de x t e n s i b i l i t y w h i c hc o m e sf r o mt h eh i e r a r c h y c o n v o l u t i o nm e t h o d st h a tc o m b i n i n gt h ep a r t sa n dt h ei n t e g e ro ft h es y s t e m t od e c r e a s et h ed i m e n s i o n so ft h ep e r f o r m a n c em e t r i c sa n dr e d u c et h ec o m p l e x i t y o ft h ep m p sa n a l y s i sm o d e l ,am e t h o dn a m e dd o u b l e pi sp r o p o s e dt od i s c o v e rt h ek e y p e r f o r m a n c ef a c t o r so ft h ep r o c e s s o rn o d e s d o u b l e pc a nf o c u sc o m p l e xp e r f o r m a n c e f a c t o r so ns e v e r a lm a i nc o m p o n e n t s s ot h ea n a l y s i so b j e c t sc a nb es e e nc l e a r l y u s i n g d o u b l e p ,14k e yf a c t o r sw h i c hc a ni n f l u e n c et h ep e r f o r m a n c eo fp r o c e s s o rn o d e sa n d4 m a i nc o m p o n e n t so fs y s t e m sp e r f o r m a n c ea r ef o u n d n em e t h o dt o a n a l y z ep r o g r a m sp r o f i l e si st h em a i nm e a n st os t u d yt h e a p p l i c a t i o n ss i g n a t u r e si np m p s ,w h i c hi sa l s oad i f f i c u l t yi nt h er e s e a r c ho fp a r a l l e l s y s t e m sp e r f o r m a n c e f o ra n a l y z i n gt h ep r o g r a mp r o f i l e sq u i c k l y ,w ep r o p o s e da m e t h o db a s e do ns a m p l i n g c o m p a r e dw i t ho t h e rm e t h o d s ,t h i st e c h n i q u ec a l lr e d u c et h e n e e d e di n s t r u c t i o nn u m b e r sa n ds h o r t e nt h ea n a l y z et i m eo fp r o g r a m sp r o f i l e so nt h e s a m ec o n d i t i o n st h a tac e r t a i ns a m p l ee r r o rc a nb ee n s u r e d ,w h i c hm e a n so n l yl 3 i n s t r u c t i o n sw i l lb eu s e dw h e nt h ee r r o ri s1 e s st h a n3 f u r t h e rm o r e ap r o f i l e rn a m e d s a m p l e p r ob a s eo ns a m p l et h e o r yi sp u tf o r w a r da n di m p l e m e n t e di nt h ed i s s e r t a t i o n t h ep e r f o r m a n c em o d e lo fp r o c e s s o rn o d e si st h em a i np a r to ft h ep m p s t h e d i s s e r t a t i o np r e s e n t sap e r f o r m a n c em o d e lo fp r o c e s s o rn o d e sa n di t ss o l v i n gm e t h o d b a s e do nr e g r e s s i o n t h i sm e t h o dc o n v e r t st h ep e r f o r m a n c ef a c t o r sa n dt h er e l a t i o n s b e t w e e ni n d e p e n d e n tp r e d i c t i n gv a r i a b l e s ,a n do b t a i n st h ew e i g h t so ft h ec o m p l e xa n d o v e r l a p p e do p e r a t i o n sb yd e t e r m i n i n gt h er e g r e s s i o nc o e f f i c i e n t s t h ee x p e r i m e n t r e s u l t ss h o wt h ee f f i c i e n c yo fr e g r e s s i o nm e t h o da n dt h ea c c u r a c yo ft h er e g r e s s i o n m o d e l ,a n dc a n n o tb ei n f l u e n c e db yt h ep r o c e s s o rt y p e sa n da p p l i c a t i o ns i g n a t u r e s t h ee x p e r i m e n tr e s u l t si n d i c a t e dt h a tt h ep m p sp e r f o r m a n c em o d e lw i t hg o o d s c a l a b i l i t yc a np r e c i s e l yp r e d i c tt h er u n n i n gt i m eo fa l lk i n d so fp a r a l l e la p p l i c a t i o n si n t h ep a r a l l e lc o m p u t e r s i tc a na l s od i s c o v e rt h ep e r f o r m a n c eb o r l e n e c k so ft h ep a r a l l e l s y s t e m s t h ep m p sm o d e lc a np r o v i d ep l e n t yo fp e r f o r m a n c ep a r a m e t e r sa n dg u i d i n g i n f o r m a t i o nf o rd e s i g n i n g ,o p t i m i z i n ga n du p g r a d i n gt h ep a r a l l e lc o m p u t i n g s y s t e m s k e yw o r d s :p e r f o r m a n c em o d e l 。p e r f o r m a n c em e t r i c s ,c o n v o l u t i o nm e t h o d , p bd e s i g n ,p r i n c i p a lc o m p o n e n t sa n a l y s i s s y s t e ms a m p l e ,r e g r e s s i o nm o d e l 第i v 页 国防科学技术大学研究生院博士学位论文 表1 1 表1 2 表2 1 表2 2 表2 3 表2 4 表2 5 表2 6 表3 1 表3 2 表3 3 表4 1 表4 2 表4 3 表4 4 表4 5 表4 6 表4 7 表4 8 表5 1 表5 2 表5 3 表5 4 表5 5 表6 1 表6 2 表6 3 表6 4 表6 5 表6 6 表6 7 表6 8 表目录 常用的性能评价方法5 n p b 需要测试的数据7 典型的性能模型16 数组大小和访问步长与c a c h e 失效情况分析表。2 0 无用户输入参数下的m e t a s i m 分析n p bc g b 的输出结果。3 4 基于i b mb l u eh o r i z o n 存储系统性能参数的n p bc g b 分析结果3 4 i m b 组成情况及输出形式。3 6 m p i d t r a c e 日志文件不同类型记录内容3 7 多维空间上并行系统性能度量体系组成与功能4 2 b h 和t c s 面向应用p o p 的性能对照表5 1 性能模型框架与度量体系对应关系5 5 n 个水平组合p b 设计的行生成向量6 l 几个主要统计方法的比较一6 2 处理器内核参数及其p b 值6 6 功能单元参数及其p b 值6 6 存储系统参数及其p b 值6 7 试验中使用的整型s p e c 2 0 0 0 程序6 8 试验中使用的浮点型s p e c 2 0 0 0 程序6 8 影响处理器性能的1 4 个关键因素7 6 几个主要变量及其描述。8 4 实验使用的部分s p e c 2 0 0 0 程序8 8 总体容量n 的验证程序9 6 n p b 程序描述。9 7 不同i n s t r u m e n t a t i o n 操作下的n p b 程序运行时间9 7 模拟器参数及其取值水平10 9 实验中的b e n c h m a r k s 及其输入1 0 9 不同类型应用程序的回归系数1 1l 回归模型中的预报变量及其回归系数1 1 2 n p b 程序及其输入1 13 应用程序的运行时间和预测时间l1 4 4 种不同的处理器节点配置1 15 n p b 程序及其输入1 18 第v 页 国防科学技术大学研究生院博士学位论文 图目录 图1 1 峰值性能与实际性能2 图1 2i b mb u l e g e n e 系列并行机性能与处理器个数关系3 图1 3 峰值性能与实际性能4 图1 4i b mb u l e o e n e 系列的l i n p a c k 性能与最大实际性能7 图1 5 性能模型的构建过程9 图1 6 本文的组织结构1 5 图2 1f o r t r a n 抽象机模型结构图1 8 图2 2 基本f o r t r a n 抽象模型的预测误差1 9 图2 3 计算事件引起的程序轨迹变换2 2 图2 4 通信事件引起的程序轨迹变换2 3 图2 5 循环简化过程2 5 图2 6 最长路径和简单路径简化过程2 5 图2 7 处理器与存储系统的抽象模型。2 6 图2 8s m p 节点的访存队列模型2 7 图2 9p p 的运行和输出2 8 图2 1 0l c a 分析l i 开销过程2 9 图2 1 12 维空间上规则m e s h 结构的s n 变换过程3 0 图2 1 2p e r c 性能模型结构图3 3 图2 1 3 两种不同访问模式下p s ct c s i n i 的m a p s 分析结果3 3 图2 1 4 面向应用的存储系统性能褶合过程3 5 图2 15d i m e m a s 模拟器分析过程及其输出3 8 图3 1c o b a l t 6 0 在不同系统配置上的性能4 l 图3 2p o p 在不同系统上的性能。4 1 图3 3 i n t e lp 4 处理器节点在不同模式下的读带宽4 4 图3 4 i n t e lp 4 处理器节点在不同模式下的写带宽4 4 图3 5 在多维空间性能度量体系上求解应用运行时间的一般方法5 0 图3 6 应用c o b a l t 6 0 与不同配置h a b u 系统的相似系数5 2 图3 7 基于褶合方法性能模型的基本思想5 3 图3 8p m p s 框架图5 4 图3 9 不同节点配置下的模型预测误差一5 6 图4 1 关键因素分析的过程一6 0 图4 2s i m p l e s c a l a r 模拟器软件框架6 9 第v i 页 国防科学技术大学研究生院博士学位论文 图4 3 图4 图4 图4 图4 图4 8 图4 9 图4 1 0 图4 1 1 图4 1 2 图4 1 3 图5 1 图5 2 图5 3 图5 4 图5 5 图5 6 图5 7 图5 8 图5 9 图5 1 0 图5 1 1 图5 1 2 图5 1 3 图6 1 图6 2 图6 3 图6 4 图6 5 图6 6 图6 7 图6 8 图6 9 图6 1 0 性能因素对s p e c 2 0 0 0 i n t 运行时间的影响因子7 0 不同功能部件对处理器性能的影响7 1 功能部件中1 1 个因素的比例关系7 2 存储系统2 2 个因素的比例关系7 2 性能因素对s p e c 2 0 0 0 f p 运行时间的影响因子7 3 不同功能部件对处理器性能的影响7 3 处理器内核1 0 个因素的比例关系7 4 功能部件对整型和浮点程序性能影响比较7 4 影响处理器性能各种因素的影响因子7 6 主成份的贡献率和累计贡献率7 7 主成份组成因子7 8 添加i n s t r u m e n t a t i o n 操作的程序运行时间8 1 s a m p l e p r o 中的系统抽样示意图8 6 基于p i n 2 0 存储操作指令计数代码8 7 v m o 与u 的关系图8 9 v b p 与u 的关系图8 9 v f o 与u 的关系图9 0 p i n 2 0 软件体系结构9l 一个p i n t o o l 例子9 2 s a m p l e p r o 软件结构图9 3 程序指令计数器p r o f i l e r ( o ) 源码9 4 s a m p l e p r o 的输出结果9 5 总体容量n 与样本容量n 9 6 一定样本容量下3 种性能特征分析器的误差9 9 y 关于x 的回归1 0 3 一个r a n k i t 图例子。1 0 7 响应变量形式对剩余平方和的影响1 1 0 预报变量个数与决定系数的关系1 1 2 回归模型的残差图11 3 各种应用的误差1 15 不同类型处理器节点的预测误差1 1 6 p e r c 框架与p m p s 框架下的节点模型比较1 17 并行文件系统1 18 不同节点配置下的p m p s 模型预测误差一11 9 第v i i 页 国防科学技术大学研究生院博士学位论文 图6 1 1 图6 1 2 图6 1 3 图6 1 4 3 种模型对c g b 在机群系统上的性能预测误差与比较1 2 0 3 种模型对m g b 在机群系统上的性能预测误差与比较12 0 3 种模型对s p a 在机群系统上的性能预测误差与比较1 2 1 3 种模型对b t a 在机群系统上的性能预测误差与比较1 2 1 第v i i i 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意 学位论文题目:亘自直性能盐差煎蝗能叠俭搓型技苤丑究 学位论文作者签名:酗2 筮丝日期:j 7 年步月多日 学位论文版权使用授权书 本入完全了解国防科学技术大学有关保留,使用学位论文的规定本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印,缩印或扫描等复制手段保存、汇编学位论文 ( 保密学位论文在解密后适用本授权书) 学位论文题目:亘自直性毖i 土差鲍:陛能翌盆搓型拉盎珏究 学位论文作者签名:匮垂丝 作者指导教师签名: 日期:们年垆月2 日 日期:文呻年年月? 日 国防科学技术大学研究生院博十学位论文 第一章绪论 并行系统的性能评价是目前正在研究的热点课题,它与并行计算机体系结构、 并行计算机软件和并行算法共同构成了新兴计算科学( c o m p u t a t i o n a ls c i e n c e s ) 的 四大支柱。并行系统的性能评价在算法和系统设计与实现中发挥了重要的作用, 建立一个科学的评价标准有助于更好地发挥并行计算系统的性能,提高系统使用 效率,促进软硬件研制水平的提高。 并行系统性能评价模型为并行系统的性能评价提供了一条新的技术途径,在 并行系统的设计、实现、采购、安装调试和优化的整个生命周期中发挥着重要的 作用。性能评价模型通过分析系统与应用的性能特征可以发现系统瓶颈、指导系 统和应用的设计与优化。同时,还可以利用它准确预测未来系统的性能,估计应 用在假想系统上的运行时间。 本课题在广泛、深入了解当前并行系统性能评价方法和性能模型构建技术研 究现状的基础上,研究了影响并行系统性能的各方面主要因素,提出了并行系统 性能评价度量体系和性能评价模型。针对模型中的关键组成部分和基于模型的并 行系统性能评价技术中的关键问题提出了新的方法,并分别对其进行了模拟验证。 课题实现了模型中多个关键功能部件的原型系统及其模拟环境,验证了模型的正 确性与准确性。 1 1 1 高性能科学计算 1 1 研究背景及目标 科学计算以计算机为手段,通过对问题的数学建模与数值求解,解决科学研 究与工程设计中的问题。通过数值模拟计算,不仅大大节约了人力、物力开销, 还能解决很多实际方法不能解决的问题。目前,科学计算同理论研究与科学实验 一样,已经成为人类认识与改造世界的重要手段,在基础科学研究、国防与国民 经济建设中起了不可替代的作用,是计算机的关键研究领域之一。 科学计算中很重要的一类是高性能科学计算( h i g hp e r f o r m a n c es c i e n t i f i c c o m p u t i n g ) 。这类应用主要包括核爆模拟、气象预报、天体物理、量子化学、计 算流体动力学、油藏模拟、遥感图像处理、生物信息处理、密码破译等。这些领 域的应用通常是计算密集型( c o m p u t a t i o ni n t e n s i v e ) 应用,它们对计算性能的需 求几乎是无止境的,是推动高性能计算不断向前发展的源动力。例如,蛋白质折 叠的计算量达到1 0 2 1 量级,需要1 0 ”量级( p e t a f l o p s ) 的计算能力。n a s aa m e s 研究中心的专家分析,要在1 5 分钟能完成对飞机机翼大涡流模拟,需要1 0 1 5 量级 第1 页 国防科学技术大学研究生院博士学位论文 的计算能力;要在1 5 分钟内完成对整架飞机大涡流模拟,需要1 0 恺量级( e x a f l o p s ) 的计算能力。 科学计算对计算性能的无止境需求推动了高性能计算机规模的不断扩大。为 了满足科学计算的需要,提高系统性能是基础,对并行系统的硬件性能轮廓和应 用的性能特征进行正确的分析,为应用选择合适的机器,充分发挥并行计算机的 性能,发现系统瓶颈所在,优化系统的设计是提高系统性能的一个有效技术途径。 1 1 2 科学计算面临的性能问题 在单处理器节点的峰值性能按照摩尔定律迅速提高的同时,组成并行计算机 系统的处理器节点的数量也越来越多,系统规模不断扩大,机器理论峰值性能也 迅速提高。例如,2 0 0 5 年安装在l l n l 实验室的i b mb u l e g e n e l ( 位居2 0 0 6 年6 月份t o p 5 0 0 ( 1 】第一名) 其处理器个数已达到了1 31 ,0 7 2 个,峰值性能为3 6 7 t f l o p s 。 据p e r c 研究中心的专家预测,在未来五年内,并行机的处理器节点数目有可能 突破百万个u j 。 窗 旨 正 q 8 岳 乏 宅 正 r i m e 图1 1 峰值性能与实际性能 图1 1 统计了自1 9 9 3 年以来位居t o p 5 0 0 第一位并行机的处理器数目、r m a x ( l i n p a c k 测试性能) 和r p e r f ( 理论峰值性能) 。从图中可以看出,自2 0 0 2 年 开始,处理器数量增加速度明显加快。2 0 0 2 年6 月t o p l 的n e ce a r t h s i m u l a t o r 由5 1 2 0 个处理器组成,到2 0 0 6 年6 月,组成i b mb u l e g e n e l 的处理器数量已经 超过了1 3 万个,增加了近2 4 倍。而从1 9 9 3 年到2 0 0 2 ,处理器节点数仅增加1 0 倍。l i n p a c k 测试性能和机器的理论峰值性能虽然都随处理器数量的增长而增 第2 页 飞ooo们oi- 国防科学技术大学研究生院博士学位论文 长,但从2 0 0 2 年开始,由于处理器节点数量增加迅速,l i n p a c k 测试性能与机 器的理论峰值性能的差距也日益增大。 图1 2 分析了i b mb u l e g e n e 系列并行机近几年来的处理器组成情况和它们的 性能差异。自2 0 0 4 年6 月到2 0 0 6 年6 月的两年时间内,处理器节点数从4 0 9 6 个 ( b l u e g e n e ld d 2p r o t o t y p e ) 增加到了131 ,0 7 2 ( e s e r v e rb l u e g n e ns o l m i o n ) 个。 从图1 2 知道,理论峰值性能的增长速度明显快于l i n p a c k 测试性能的增长速度。 4 0 0 0 0 0 3 5 0 0 0 0 5 0 0 0 0 0 02 0 0 0 04 0 0 0 05 0 0 0 08 0 0 0 01 0 0 0 0 01 2 0 0 0 01 4 0 0 0 0 p r o c e s s o r s 图1 2i b mb u l e g e n e 系列并行机性能与处理器个数关系 这种无限制的系统规模增长,给并行系统的实际性能发挥带来了前所未有的 挑战。在实际应用中,应用所获得的持续性能( 也称实际性能) 增长缓慢,高性 能计算领域面临的实际性能与峰值性能差距不断变大的问题日益突出。美国国家 能源研究科学计算中心( n e r s c ) 主任h o r s td s i m o n l 3 】指出,上世纪9 0 年代, 并行机的峰值性能增加了近
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年辽宁省中考语文试卷(含答案与解析)
- 2025年高考江苏物理试题+答案
- 香雪作业题目及答案
- 草坪学考试题及答案mooc
- 现代史题目及答案解析
- 葡萄培训知识文案简短课件
- 2025年艾灸知识考试试题及答案
- 萨摩耶宠物知识培训班课件
- 2025钢筋买卖合同范本
- 2024译林版八年级英语上册Unit 1 单元测试卷及答案(含三套题)
- 公司对公司走账合同范本
- 核电站主要材料质量保证措施
- (2025年标准)挖桩孔协议书
- 消化内科课件模板
- 拍摄与剪辑基础知识培训课件
- 项目实施进程汇报
- 2025年时事政治考试100题(附答案)
- 医学检验质量安全管理培训
- 2025仓库保管员试题及答案
- 保险执业登记管理制度
- 2025-2030中国电子墨水屏幕行业市场发展趋势与前景展望战略分析研究报告
评论
0/150
提交评论