高性能计算.doc_第1页
高性能计算.doc_第2页
高性能计算.doc_第3页
高性能计算.doc_第4页
高性能计算.doc_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高性能计算综述摘要:目前,高性能计算技术主要有两个发展方向:在深度上致力于研制具有快速运算能力的高性能计算机;在广度上注重于开发具有广泛应用前景的高性能服务器。高性能计算机的发展水平已经成为衡量一个国家高新科技水平和综合实力的重要标志.高性能计算机可以对所研究的对象进行数值模拟和动态显示,从而获得实验很难甚至无法得到的结果。例如,可应用在预测气候变化,预报恶劣天气,理解基因功能,以及模拟核爆炸过程,甚至模拟宇宙演化过程等领域中。高性能计算机的发展使得计算科学成为人类认识和改造世界的新的方法和途径。本文主要介绍高性能计算的意义,发展现状及未来展望,高性能计算的应用以及高性能计算的主流解决方案介绍。关键字:高性能计算;应用软件;解决方案 AbstractAt present, the high performance computing technology has two main directions: working in the development of high performance computer has fast computing ability in depth; pay attention to the development of high performance server has a wide application prospect in breadth. The level of development of high performance computer has become an important symbol to measure a national high technology level and comprehensive strength. High performance computer can be the research object of the numerical simulation and dynamic display, so as to obtain the experimental results it is difficult or even impossible to. For example, it can be used to predict climate change, predict bad weather, understand gene function, and simulate the process of nuclear explosion, and even simulate the evolution of the universe. With the development of high performance computer, computer science has become a new way to understand and transform the world. This paper mainly introduces the significance, current situation and future prospect of high performance computing, the application of high performance computing and the introduction of high performance computing.Keyword: HPC; high performance computing;application software; Solution1. 高性能计算的意义1.1. 高性能计算的含义高性能计算是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机。随着信息化社会的飞速发展,高性能计算已成为继理论科学和实验科学之后科学研究的第三大支柱。在一些新兴的学科,如新材料技术和生物技术领域,高性能计算机已成为科学研究的必备工具。同时,高性能计算也越来越多地渗透到石油工业等一些传统产业,以提高生产效率、降低生产成本。金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高性能计算的需求也迅猛增长。1.2. 高性能计算的应用需求在近代科学研究中,单靠理论和实验解决问题的难度逐渐增大,数值运算的方法被用来模拟物理世界,以求解复杂的问题,计算科学成为自然科学研究的必备工具。随着求解问题规模的越来越大,对计算能力的需求成为驱动高性能计算发展最直接的动力。第二次世界大战时期,靠人力计算火炮的弹道非常困难,战争对计算能力的需要促进了第一台电子计算机的诞生;早期的高性能计算机主要应用于解决军事领域的计算问题,如美国在1960年代使用CDC超级计算机进行弹道计算、火箭设计等工作1。20世纪90年代中期以后,随着机群技术构建的高性能计算机的普及,高性能计算的成本和编程的复杂度大幅度下降,为高性能计算的广泛使用创造了条件。如图12所示,现在高性能计算已经渗透到各个学科领域,不仅在气候模拟、石油勘探、天体物理这些传统应用领域保持强劲的生命力,在生命科学、人工智能、大数据处理这些新兴领域也有广泛的应用。 图1 2014年全球高新能应用领域分布在传统应用领域,如天气预报、石油勘探、核爆模拟等,计算问题一般采用划分网格的方式来解决,随着应用的物理建模不断精细,数值模拟分辨率越来越高,对计算能力的要求也越来越高。在非传统的新兴应用领域,如生命科学、人工智能、大数据处理,这些应用的负载很多都是基于图模型和图算法来处理数据,而复杂的图结构的规模非常庞大。例如,在娃娃鱼基因组测序中,对应De Brujin图有超过1013个顶点,测序技术的发展对计算能力的需求不断提高。深度学习是新兴领域中另一个典型代表。深度学习技术试图通过大规模的神经网络和大数据提供的海量训练集合,将大脑学习识别的过程加以抽象,从而获得极高的识别准确度,这些都带来了极大的计算需求和吞吐需求。以上所列举的各个学科对计算能力的需求有一些相似的特点:它们需要强大的计算能力来模拟更大规模的应用,并同时增加应用的分辨率,因此需要的计算能力要有几个数量级的提升。按照推测,满足这些应用的未来计算机系统峰值性能在2020年至少应该达到1 Eflop/s。1.3. 高性能计算的战略地位从战略高度上讲,高性能计算技术是一个国家综合国力的体现,高性能高计算是支撑国家实力持续发展的关键技术之一 。高性能计算国防安全、高科技发展和国民经济建设中占有重要的战略地位。 美国有关发展高性能计算的建议报告指出,从1982年到2005年,美国国防部、能源部、国家科学院、国家科学基金委以及美国总统信息技术顾问委员会、美国信息技术咨询委员会、美国国家竞争力委员会等提出的有关信息技术和计算机的建议报告中,大都涉及到了高性能超级计算机的内容。2006年2月,国务院发布国家中长期科学和技术发展规划纲要(20062020年)指出加速发展高性能计算对提高我国国防建设与国家安全、国家经济建设、国家重大工程和基础科学研究等尖端科技领域的核心支撑能力,具有十分重要的战略意义。提出要全面提升我国的自主创新能力,以期将我国在2020年前建设成为一个创新型国家。 2. 高性能计算的发展现状及未来展望2.1. 高性能计算的历史20世纪70年代出现的向量计算机可看作是第一代HPC,通过在计算机中加入向量流水部件,大大提高了科学计算中向量运算的速度。其中较著名的有CDC系列、CRAY系列、NEC的SX系列和中国的银河一号及中科院计算所的757计算机。80年代初期,随着VLSI技术和微处理器技术的发展,向量机一统天下的格局逐渐被打破,“性/价比”而非单一性能成为衡量HPC系统的重要指标。90年代初期,大规模并行处理(MPP)系统已开始成为HPC发展的主流,MPP系统由多个微处理器通过高速互联网络构成,每个处理器之间通过消息传递的方式进行通讯和协调。代表性系统有TMC的CM-5、Intel Paragon、中科院计算所的曙光1000等。较MPP早几年问世的对称多处理(SMP)系统由数目相对较少的微处理器共享物理内存和I/O总线形成,早期的SMP和MPP相比扩展能力有限,不具有很强的计算能力,但单机系统兼容性好,所以90年代中后期的一种趋势是将SMP的优点和MPP的扩展能力结合,发展成后来的CC-NUMA结构,即分布式共享内存。其代表为Sequent NUMA-Q、SGI-Cray Origin、国内的神威与银河系列等。在发展CC-NUMA同时,机群系统(Cluster)也迅速发展起来。机群系统是由多个微处理器构成的计算机节点通过高速网络互连而成,节点一般是可以单独运行的商品化计算机。机群系统比MPP具有更高的性价比,其代表是IBM SP2,国内有曙光3000、4000,联想深腾1800、6800等。2.2. 高性能计算的国内外现状在2016年6月的TOP500排行榜上,由中国国家并行计算机工程技术研究中心研制的“神威太湖之光”横空出世,以每秒9.3亿亿次的浮点运算速度出人意料地夺冠。这个速度是原冠军中国“天河二号”的近三倍,更重要的是“神威太湖之光”实现了包括处理器在内的所有核心部件全部国产化。此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄。在最新榜单中,“天河二号”依然以每秒33.86千万亿次的浮点运算速度排名第二。除“双星闪耀”外,中国超算总体表现也很出色。2016年6月,中国首次把上榜总数长期独占鳌头的美国“拉下马”。而12月,中美打了个平手,以171台上榜数量并列第一,两国上榜超算约占榜单总数的三分之二。国际TOP500组织在一份声明中写道,一年前美国以199台上榜超算保持明显优势,而中国只有109台。但现在,最新公布的榜单“见证了中国和美国并驾齐驱的超算优势”。从榜单前10名看,中国“双星”之下,第三至第十名依次是美国的“泰坦”、“红杉”、“科里(Cori)”,日本的“Oakforest-PACS”、“京”,瑞士的“代恩特峰”以及美国的“米拉”和“三一”。其中,“科里(Cori)”和“Oakforest-PACS”都是“新面孔”。“代恩特峰”原来排名在“三一”之后,经升级后反而排到“米拉”之前,但仍待在第八的位置上没有变动。总体而言,计算能力超过每秒千万亿次的上榜系统已从2008年6月的一台增至如今的117台。 并且,北京时间2017年1月22日的最新消息称据PCMagazine网络版报道,全球最快超算“神威太湖之光”的地位可能遭遇威胁,原因是中国即将研制出新一代百亿亿次超级计算机。2.3. 高性能计算平台2.3.1. 高性能计算平台内容由于资源限制,目前只有一些重点高校和一些大型企业拥有自己的高性能计算平台,主要的功能都是用来进行大规模数据计算。这里以高校高性能计算平台为例。高校主要用来运行科研计算任务,并且能够根据应用任务对硬件资源的不同需求,动态分配和调整平台资源,管理计算作业。用户通过校园网和VPN远程提交计算作业、获取计算结果,并能够根据权限调整,实现权限控制,硬件细节对用户透明。用户界面实现图形化交互窗口和SSH登录相结合方式。 平台的主要硬件设备有:管理节点、计算节点、存储IO节点、Infiniband交换机、高速存储、千兆以太网交换机;软件方面有:64位Linux操作系统、并行开发环境、并行文件系统、作业调度管理系统、硬件集群管理系统等,利用高速infiniband网络互联构成计算环境,通过并行计算支撑软件和作业调度系统使它们协同工作。平台的主要硬件设备有:管理节点、计算节点、存储IO节点、Infiniband交换机、高速存储、千兆以太网交换机;软件方面有:64位Linux操作系统、并行开发环境、并行文件系统、作业调度管理系统、硬件集群管理系统等,利用高速infiniband网络互联构成计算环境,通过并行计算支撑软件和作业调度系统使它们协同工作。2.3.2. 设计原则高性能计算平台应具有处理大规模的复杂运算,尤其是浮点运算的能力。它将为全校提供优化设计、分析、验证的手段,最终实现提高科研质量、缩短科研周期、降低科研成本。因此,方案设计以用户现场测试结果为基础,根据用户对未来应用模式及业务量需求预测为前提,强调高性能以及可行、合理和低风险。架构设计和系统选型遵循以下原则:先进性高性能计算平台设计所采用的技术既要符合业界的发展方向,又要在未来几年内仍具有很高的技术先进性,保持在同类系统中的领先地位。这样有利于提高整个系统的计算与处理能力,保证系统的使用周期。有限投资获取最大计算性能在有限的投资前提下,高性能计算平台应具有优秀的处理能力,它不仅具有符合要求的峰值性能(PeakPerformance),更重要的是应具有稳定的应用性能(sustainedperformance)。各种复杂的研究课题在本系统中能够得到准确、快速的计算结果。可扩展性随着对计算机系统性能的要求不断提高,高性能计算平台应具有较强的扩展能力,可以方便地实现节点增加、系统扩充和升级,以有效保护前期投入。建议采用第三方集群管理和作业调度专业软件,集成安装与硬件设备无关,计算节点的扩展不受硬件品牌限制。 开放性和兼容性系统应符合公认的工业标准,包括体系结构,硬件,I/O,网络,操作系统,开发环境和开发工具等。便于和其他平台上的系统互操作。应用开发软件丰富本系统的平台上应具有丰富的软件资源,能够提供研究课题的解决方案和相应的软件系统。例如高性能计算方面的开发环境和应用开发软件,linux、专业平台软件商,不仅提供处理节点间的协调和通信的中间件,使整个系统节点能够真正实现合作,负载均衡,还能针对不同应用需求,提供一系列并行计算应用。性价比优越本系统在性价比方面在同类系统中应具有明显的优势,能满足用户应用的同时,充分考虑后期运维费用,尽量采用绿色节能型设备,降低运维功耗,比如采用刀片式服务器。管理简单,用户易用尽量减少数据中心的设备管理难度,简化架构,底层硬件对用户透明,本着不改变设计师原有使用原则的基础上选择合适的软件架构,突破集中式资源部署应用难的屏障,实现应用简单易用的目的。综上所述,高性能计算平台的设计与建设,在遵循统一领导、统一规划、统一标准、统一组织的建设原则之下,最大程度上保证系统按照预期的目标顺利实施。2.4. 高性能计算所面临的问题和挑战2.4.1. Memory wall:存储器访问能力与处理部件计算能力的不平衡(1)处理器速度每年提高59%,高性能计算速度提高更快。(2)存储器速度每年提高7%。(3)处理器性能与数据访问带宽和延迟之间的差距越来越大。(4)必须从系统存储体系结构上创新,改进时延机制,以提供更高的带宽和更低的延迟。(5)目前对三类超级计算机(定制、混合与商业)的主要区别在于针对不同的存储访问模式所能提供的有效本地和全局存储访问带宽。2.4.2. Programming wall: 系统规模增大到10万个以上处理器,系统结构复杂(数据共享与消息通信模式交织),为超级计算机编写高效健壮程序越来越复杂,越来越困难。(1)高性能机器上的程序设计语言、库和应用开发环境的进展比广泛应用的工业软件差很多。(2)没有广泛应用的并行程序设计模型。(3).软件的研制周期大于硬件的研制周期。 2.4.3. Power wall:单个芯片的功耗急剧升高,导致整个系统的总功耗越来越高。 (1)占地均在数百数千平方米,功耗在数兆瓦。 (2)综合成本急剧增加,高达数亿美元。2.5. 高性能计算的新突破不久前在美国盐湖城举行的2016年全球超级计算大会上,由中国科学院软件研究所研究员杨超等人领衔的应用成果“千万核可扩展全球大气动力学全隐式模拟”获得国际高性能计算应用领域最高奖“戈登贝尔奖”,实现了我国高性能计算应用在此奖项上零的突破,成为我国高性能计算应用发展新的里程碑。超级计算机是计算机中功能最强、运算速度最快、存储容量最大的一类计算机,多用于国家高科技领域和尖端技术研究,对国家安全、经济和社会发展具有举足轻重的意义。超算应用水平是一国超算软实力的象征,被喻为“国之重器”,属于战略高科技领域,是世界各国竞相角逐的科技制高点,也是一个国家科技实力的重要标志之一。戈登贝尔奖创建于1987年,由美国计算机协会于每年11月份在美国召开的超算领域顶级会议(SC)颁发,旨在奖励时代前沿的并行计算研究成果,特别是高性能计算创新应用的杰出成就,是全球超算应用领域最高奖。1987年至2015年,戈登贝尔奖一直是美日专利,如今杨超研究员领衔的“千万核可扩展全球大气动力学全隐式模拟”研究实现了多项“核心突破”,并成功地使“神威太湖之光”全机1000多万计算核心协同完成。未来,该研究不仅可以用于高分辨率气候模拟和高精细数值天气预报,在航空、地学、能源等科学计算领域也有广阔的应用前景。“千万核可扩展全球大气动力学全隐式模拟”研究首次实现了千万个计算核心的扩展,可以同时使用1000多万个计算核心协同工作,并且随着计算核心的增加和软件性能持续增强。这项研究首次将大气模拟分辨率提升到500米以内,使得重点区域的精细化数值天气预报成为可能。研究将模拟能力也提升了一个数量级,在相同分辨率下,其大气动力过程可以在一天内模拟一年后的情况,全面提升了我国应对极端气候事件和自然灾害时的减灾防灾能力。此外,研究引领了全隐求解的新时代。隐式求解和显式求解是解决大型科学与工程问题的两类主要方法。显式研究快捷但不稳定,时间步很小;隐式则稳定但不快捷。相对于显式方法,全隐式求解方法虽然每个时间步计算较慢,但整体却更快更稳定。在神威太湖之光超级计算机上,全隐式模拟能力是显式的89.5倍,成功攻克了全隐式方法在超大规模众核平台的难关。2.6. 高性能计算的未来方向1) 以应用为导向发展高性能计算机当前的通用系统架构以一种结构应对多种计算需求,越来越无法实现应用需求与硬件性能的最优适配,导致计算的低效和功耗的浪费。协同设计(co-design)正在被越来越多的专家认为是解决这一问题的主要技术途径和顶层方法论。所谓协同设计是指通过领域科学与计算机科学间的跨学科紧密协作,抽象出面向领域应用的负载特征,根据应用的特征对计算、访存、通信等能力进行优化配置,实现自硬件到应用软件的一体化定制设计。应用与系统的协同设计理念使得E级系统的设计更加具有针对性,E级计算应用协同设计方法,需要覆盖气候模拟、核聚变、天体物理、材料科学、生物信息和人工智能等计算相关学科,从应用物理模型、计算方法、并行软件实现等多个层面寻求应用共性、区分特性,将系统研制与多领域应用软件能力提升拧成一体,最大限度发挥未来计算系统的通用计算效能。随着系统效能问题的日益严峻,领域定制系统将带动面向典型负载的新型加速器和处理器的发展,面向领域定制的高性能计算机有望成为未来高端HPC市场的主流。此外,领域定制系统将带动面向典型负载的新型处理器市场,成为国产处理器获得发展的机会。另外,中国的并行应用软件起步较晚,遗产代码量相对较少,反而成为中国发展自硬件到应用的全定制HPC系统的优势。2)面向新兴应用发展新型高性能计算机随着互联网的普及和技术的发展,许多与传统高性能计算应用完全不同的应用模式竞相出现,如Web服务应用、物联网服务应用、云计算应用等,在Google、百度、阿里等互联网企业使用数十万的服务器向数以亿计的用户提供各种服务。这些新型应用很多是基于海量数据提供吞吐密集型服务,这与传统计算密集型的高性能应用有很大的差别,这从另一个方面赋予了高性能计算新的含义,即面向服务的高通量计算(high-volume throughput computing,HTC)。高通量计算一般是基于海量的数据向大量的用户提供交互式、高并发的服务,在用户和负载动态变化时能够动态的扩展以满足对系统处理能力的需要,同时这样的计算对成本非常的敏感。但是现在运行这些应用的计算机系统体系结构本质上与用于科学和工程计算的系统是相同的,完全是通用处理器加通用系统技术,成本高、效能低。例如,现在面向Web服务的应用计算量很少,对处理器的浮点部件要求较低,而对I/O系统的要求较高,如果使用通用部件会造成成本的极大浪费。现在国际上对于这种面向特定领域的高通量计算的研究还处于起步状态,对于技术路线和标准的制定还处于碰撞期。随着互联网的进一步发展,这必然会发展成为另一个战略高地,因此中国应该及时加大这个方向的投资力度,解决高通量专用芯片以及高通量计算机的若干技术问题,使中国在未来互联网领域的技术竞争中占据主导地位。3) HPC in CloudHPC Cloud可能给未来高性能计算市场带来的影响最大。这种基于云计算理念构建的HPC服务,主要面向对计算规模和性能要求较低的中低端HPC用户,在平摊了设备购置和运维成本的同时,向用户屏蔽了复杂的高性能计算机技术细节,降低了高性能计算机的使用门槛。公有云提供商是这一趋势的主要推动者,亚马逊AWS首先推出HPC服务,用户可以创建数千处理器规模的虚拟高性能计算机系统,2011年亚马逊的一台虚拟HPC系统获得了世界Top 500排名的第42位,Linpack效率接近70%。2015年底,阿里云也发布了中国首个云上高性能计算平台。HPC in Cloud可能成为未来超算中心的重要运营模式之一,若越来越多的HPC用户形成购买HPC服务而非自建系统的习惯,势必形成计算资源的聚集,未来的中低端HPC计算机市场可能被云计算中心所主导。4)新兴使能技术带来新机遇日益涌现的新兴使能技术,如3D堆叠技术、光子学、忆阻器、磁基半导体技术等,对目前仍占主导地位的CMOS、DRAM和磁盘等成熟技术提出了挑战。若量子计算、光计算或DNA计算等新型计算理论和技术发展成熟,更将从根基上颠覆整个现代计算机体系。每一个新兴使能技术孕育着颠覆性创新的机会,这迫切需要体系结构的创新,以挖掘新技术的全部潜力。随着3D堆叠等新技术的成熟,很可能会出现面向高性能计算的“大芯片”产品,在单芯片内集成众核CPU、高速互连以及加速器等,这将带来处理器体系结构上的重大革新。基于磁基的半导体新工艺速度比传统硅基可提升1000倍以上。基于光子学的全光通信技术,可极大降低通信成本。此外,非易失性内存技术(如忆阻器和相变存储器)也驱动着系统设计人员对内存和外部存储系统之间关系的重新思考。因此,新兴使能技术是“弯道超车”的机会,也应该是中国高性能计算领域基础研究的重点。3. 高性能计算的应用3.1. 高性能计算的应用领域1. 石油勘探地震勘探是确定地质构造的重要方法,在石油地质勘探中占据十分重要的位置。石油钻井井位的确定很关键,定错一个井位,达不到勘探目的,损失将十分惨重。一般而言,100平方公里的三维地震资料数据多达30GB-60GB,这些海量数据的分析计算、深度偏移技术和成像技术,需要使用每秒10亿次运算速度的计算机运算60天。因此,开展针对石油勘探的高性能计算机硬件和功能强大的并行计算软件的研制具有巨大的经济效益和现实意义。2. 卫星图象处理微波成像数据十分庞大,而且微波成像处理有比较高的实时性要求,研究微波遥感图像并行处理方法和实用化技术,特别面向先进系统结构算法和友好的用户界面的技术研究和开发,是遥感技术在农林、地质、水文、考古和全球环境探测中等国民经济建设各领域以及国防建设中发挥作用的关键。3. 环保与气象本世纪二十年代初,天气预报方程已基本建立,但只能在计算机出现以后,数值天气预报才成为可能。而在使用并行计算机系统之前,由于受处理能力的限制,只能做到24小时天气预报。高性能计算是解决数值预报中大规模科学计算必要手段。采用高性能计算技术,可以从提高分辨率来提高预报精度。近几年北京市气象局运用水平分辨率为5公里及15公里的中尺度模式的预报结果加上预报员的订正,在北京市一些极端天气事件的气象保障服务中(如盛夏高温天气、春季沙尘天气出现时间等),都取得到很好的预报效果。4. 汽车制造高性能计算是制造业信息化的基础。企业信息化包括三个方面:一是把电子电器部件融入产品中,丰富产品功能,提高产品质量,即所谓电子化;二是以信息管理、资源管理、流程管理等信息化为主要内容,强调的是管理,如ERP、MIS等;三是以CAD/CAE/CAM等为核心,强调的是技术和产品。制造业信息化主要指后者。运用高性能计算机,开展数字仿真和数值模拟研究,在更短的时间内设计开发出性能更佳的汽车,并进行虚拟汽车碰撞实验,实现汽车人性化设计,提高安全可靠性、环保舒适度、提升汽车工业整体设计水平。缩短设计周期、提高设计水平、降低设计成本。 5. 航空航天。航空航天工业中,高性能计算主要应用在科学计算、实时仿真、图象处理、人工智能、数据库建立和计算机辅助设计等方面。在当代飞行器的设计中,高性能计算和风洞试验、自由飞行一起构成了获得飞行器气动力数据的三种手段。采用计算流体力学和计算气动力学方法可缩短周期、降低费用,还可以改变参数、重复计算。对那些目前不能在特定的飞行状态下进行实验的未来飞行器来说,数值模拟方法可以减少其设计风险,并在风洞实验前迅速确定出有希望的设计方案。美国等技术先进国家,总是将性能最好的并行计算机装备在国家宇航局。6. 国防工业装甲防护性能研究、子母弹抛洒模拟、战斗部侵彻模拟、装药安全性评估、国防工事抗损性等都大量用到计算机仿真与数值模拟方法。这些研究工作,通过实验手段往往不能获得全面的结果,运用数值模拟技术,所有的实验都是虚拟的,在计算机系统上完成。而且这些实验可以考虑各种可能状态,包括极限状态。目前数值模拟技术已经在武器装备研制中发挥着重要作用。7. 体系对抗高性能计算技术在高技术战争作战计划的制定、情报信息处理、兵力指挥部署、作战行动协调等方面同样发挥着重要作用。海湾战争中,驻海湾美军司令部里,安装着一组大型计算机,建立了强大的C3I系统。从四面八方传来的军事情报、战场进展、攻击目标、兵员调动等各种信息随时显示在主控台的荧屏上,庞大的后勤供应全部由两台大型计算机控制 。8. 水利水电 水利大坝设计、构筑工艺、安全性与延寿等问题都是水利水电部门需要解决的大问题,这些问题的计算规模主要由计算域决定,往往比较大,高性能计算机系统是解决这一类问题的必要工具。9. 船舶设计船舶设计包括:船舶总体设计与优化、船舶载荷环境数值模拟研究、船舶结构与强度设计等。大型船舶研制往往是设计一套、制造一套,一般不可能开展1:1试验,因此,有限元、有限差分等数值模拟技术在船舶设计分析、设计优化等方面发挥着不可替代的作用。10. 建筑桥梁城市现代化建设日新月异,高楼大厦、桥梁隧道等正在改变城市地貌。建筑/桥梁/隧道的安全性包括抗震性能、抗破坏性能、抗火灾性能等等就成为迫切需要回答的问题。国家颁布了大量的法规条例,只有在大量分析计算的基础上,才能对这类问题作出回答。这也是高性能计算的重要应用领域。11. 药物设计随着计算机技术的飞速发展,药物的设计和发现也开始从主要靠运气和大量合成工作随机发现药物向利用计算机有目的的、合理的设计药物的方向发展。CADD的主要目的是利用统计学和分子模型化技术来指导新的先导结构的设计或发现,减少把药物推向市场前所耗费的大量时间和资源。12. 生物信息学生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,找到代表蛋白质和RNA基因的编码区,特别是阐明非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;然后依据特定蛋白质的功能进行必要的药物设计。因此在基因组研究时代,生物信息学包含三个重要内容,它们是基因组信息学,蛋白质的结构模拟以及药物设计。无论是对于计算机科学理论,快速算法设计与分析,还是对于高性能计算机的开发,生物信息学都提出了很多挑战性的问题。13. 计算化学 计算技术已经使传统化学发生深刻了变化。化学已由只实验不计算,演变为先实验再计算,也必将逐步演变为先计算再实验。在计算机辅助结构解析、分子设计和合成路线设计等研究成果的基础上,通过高性能计算机才有可能对浩如烟海的化学知识进行有效地处理,对结构变化引起的属性变化进行系统地搜索,并进行某种推理,确定分子的正确结构、预测具备某种性质的化合物分子结构和确定合成路线等。14. 计算地理城市地理计算是典型的数据密集型应用。只有以高性能计算机为工具,才能开展解决城市地理计算中的整体性、大容量资料所表征的地理学问题的工作,回答城市建设中的一些重要问题。如在城市内核、边缘区通勤职工起讫点之间人流等的预测;跨区域人口普查、人口预测、人口规划问题;城市内部作为城市基础的生命单元的家庭、社区的类型、结构、功能、组织等的重构问题;城市产业、经济发展规律、机制、扩散等的模拟;城市不同时间、空间尺度上的形态演变等等。15. 计算物理 内容涉及到统计物理、量子力学、流体力学、核粒子运动、核物理、天体物理、固体物理、等离子体物理、原子与分子散射、地表波、地球物理、射电天文、受控热核反应和大气环流等方面的物理问题的数值计算。在基础科学中物理学是利用高性能计算最为广泛的领域。16.商务计算与数理统计概率论与数理统计是研究各种随机现象的本质与内在规律性以及自然科学、社会科学等各个学科中各种类型数据的科学的综合处理及统计推断方法。随着人类社会各种体系的日益庞大、复杂、精密,概率统计的重要性将越来越大。如随机过程分析、时间序列分析、多元统计分析、回归分析、统计计算、抽样调查、保险统计、决策分析等广泛应用于科学研究与商务计算。17.科学与工程计算科学与工程计算以计算数学与计算力学为基础,解决各类科学与工程问题,研究各类数值软件的开发技术。如数值代数、偏微分方程数值解、最优化方法、理论力学、流体力学、控制系统CAD、模拟与Monte-Carlo方法、数学物理中的反问题、计算机图形学等在计算物理、计算化学、计算材料学、地球物理学、天文学等许多领域具有广泛应用。3.2. 高性能计算的应用现状高性能计算机的峰值性能不等同于应用软件运行时的实际性能,它们之间往往存在巨大的鸿沟。以稀疏矩阵类应用为例,SpMV(稀疏矩阵乘法)的浮点性能通常不超过峰值性能的10%,在GPU众核处理器上的浮点效率甚至低于2%。要发挥高性能计算机的高速硬件优势,必须要有适用的算法和调优的应用程序来实现数百万核之间的并行。因此,大规模并行软件和高性能算法的发展水平象征着各个国家高性能计算的软实力。现在大规模并行软件在各个领域发挥着重要作用,知名的有:大气领域的WRF、计算化学的Gaussian、流体力学的Fluent、LS-Dyna等。美国和日本是高性能并行软件强国,高性能计算领域最高奖项“戈登贝尔奖”20多年来一直被美国和日本垄断;欧洲同样非常注重应用软件的研发,计算化学的ADF、MOLPRO、分子模拟的GROMACS、材料计算的VASP在世界范围广泛使用。大规模并行应用软件的发展都与国家巨额投入息息相关,美国能源部(DOE)在硬件上的花费不到总投资的1/6,大部分预算都花在了物理建模、算法研究和软件研制方面。国内则更重视有显示度的高性能计算机硬件的研制,对应用软件的投入欠缺,且缺乏整体计划,虽然也开发了数个几十万核、乃至百万核的大规模应用,但多局限于对于计算数据的测试、算法程序的并行优化等基本的辅助性操作。大规模并行应用程序的核心是基础算法模块,许多科学问题的解决高度依赖于基础算法与可计算建模的发展水平。高效的基础算法和满足实际精度要求的可计算模型可以显著降低计算复杂度和计算量,提高利用计算机解决科学与工程问题的能力。例如,著名的高性能数学库BLAS、ScaLAPACK和FFTW等在提高大量应用性能上发挥了关键性作用。2012年3月美国能源部发布了题为“Report on the extreme-scale solvers: Transition to future architectures”的报告,指出在CPU核数为10万量级的计算机上,稀疏线性解法器在很多复杂应用数值模拟中占了90%的时间;在核爆模拟和激光聚变等很多数值模拟应用中,稀疏线性解法器也同样消耗了绝大部分运行时间。美国能源部“先进计算促进科学发现(SciDAC)”项目在最新发布的第3期计划中,成立了FASTMath(Frameworks,Algorithms, and Scalable Technologies for Mathematics)研究小组作为第一批启动的重点内容,其目标是面向实际复杂应用的大规模数值模拟,发展可扩展的共性算法和使能技术,最终形成高性能数学工具箱,包括了13个具有共性的软件包。北京应用物理与计算数学研究所和中国科学院数学与系统科学研究院分别研制了JASMIN框架和PHG平台,面向科学计算领域中的自适应结构网格和非结构网格数值模拟应用,它们将科学计算中现有的很多共性算法集成,并封装形成共性层模块,支撑数值模拟应用(如激光聚变、油藏和电磁场)在国产高性能计算机上的发展。在互联网领域,大数据处理应用也存在共性基础模块。例如,数据挖掘中大量采用的线性代数解法器、网页排序算法PageRank属于典型的稀疏线性迭代方法。在社交网络分析、系统生物学和基因测序中,基于图的建模是基本的处理方式,图算法已经成为事实上的基础模块。这些实际问题中的图多数用稀疏矩阵来描述,数学模型可抽象为线性代数的表示,其算法与稀疏线性代数存在数学上的等价性。这类数据处理应用具有更严重的不规则计算与通信模式,以及更低的计算访存(通信)比,如何并行优化成为高性能计算研究的热点和难点。2010年6月,美国Sandia实验室牵头联合美国几大国家实验室和科研机构,发布了以图遍历算法为核心的Graph500基准测试程序12,在用于高性能计算机系统排名的同时,也促进了面向E级数据处理的并行算法设计和优化技术的研究。3.3. 高性能计算的应用发展根据IDC 2015年的统计,全球高性能计算市场规模在250亿美元,其中高性能计算机系统(包括服务器、存储和网络)约占60%,软件和服务约占35%;据预测在20152020年间高性能计算市场规模将以8.3%的复合增长率而增长,在2020年达到440亿美元。自2012年的4年间,世界高性能计算机Top 500排行榜的入门性能和性能总和分别提高了4倍和3.7倍。美国公司仍然占据整机市场的领先地位,2014年全球Top 500高性能计算机市场份额的80%被惠普、IBM和Cray三家公司占据(图2)。但受系统升级以及2014年联想收购IBM的x86服务器部门的影响,2015年IBM的份额大幅下降,国产的曙光高性能计算机异军突起,以9.8%的份额取代IBM位列第三,这证明了中国高性能计算机整机技术和产业化能力都达到了世界领先水平。在国家高技术研究发展计划(863计划)的持续支持下,中国已经掌握了包括高密度服务器、机群操作系统、高性能存储系统、冷却技术在内的各项整机系统技术。国产高性能计算机系统已经连续两年占据中国Top 100系统90%以上的份额,曙光信息产业股份有限公司更是连续7年蝉联中国Top 100份额第一。随着联想对IBMx86服务器并购的完成,曙光、联想和浪潮三强争霸的局面已经形成。 图2 全球Top 500 高性能计算机市场份额在国家自主可控和保障信息安全的宏观政策引导下,中国启动了基于自主可控处理器构建国产高性能计算机的计划,“核高基”重大科技专项支持了3个高性能处理器系列的研制,即飞腾(国防科大,ARM指令集)、申威(江南计算所,基于Alpha的自定义指令集)和龙芯(中科龙芯,MIPS指令集)。国家高技术研究发展计划(863计划)项目中1Flops神威蓝光计算机全部采用了申威16核CPU,曙光星云计算机部分部署了龙芯8核CPU,国防科技大学天河系统部分部署了飞腾多核CPU。但由于采用非x86指令集,商用并行软件都不能运行,还没有能力构建自己的软件生态系统,这些因素使其应用领域受到很大限制,市场容量过于狭小。到目前为止,基于自主可控处理器的高性能计算机还局限在国家科技项目范畴,尚没有开始产业化进程,在国家战略应用中进行推广是一条可行的发展道路。国产HPC应用软件是中国高性能计算的短板,与国际上的差距最大。在工业界应用极为广泛的CAE软件,仍然被以ANSYS等为代表的国外软件垄断,几百并行度的软件就需要数百万人民币的License费用,高端的开源HPC软件也主要来自美国、日本以及欧洲国家。具有代表性的国产商用应用软件仅有GeoEast(石油勘探领域)和Grape(大气科学领域),由于投入不足,近年来没有再涌现类似商用软件。大多的国产私有应用软件也是以大学和科研院所自用为主,少有成规模的推广使用,特别是国产HPC应用软件在开源和中间件上基本刚起步,而它们早已成为应用软件规模化发展的主流模式。4. 高性能计算的主流解决方案介绍 图3 高性能计算系统架构 通过建立高性能计算仿真系统,提高X研究所的综合仿真设计能力,实现资源共享,创建集约型科研生产环境,为今后5年的科研发展提供强有力的技术环境保障。应用软件有:结构有限元分析软件NX Naxtran、电磁分析软件CST、流体仿真软件CFDesign等。4.1. 计算系统主流解决方案SMP节点+刀片集群采用先进的刀片集群+SMP胖节点混合架构,共配置128台刀片服务器、4台SMP服务器、8台存储I/O服务器,4台管理/登陆服务器。配置相关软件及集群管理系统。用户可以利用WEB、应用集成GUI以及Scripts三种方式连接到集群登陆节点,向计算资源池提交作业,并通过全局共享的并行存储资源池存储应用程序的输入文件和输出结果。4.2. 功能节点主流解决方案普通标准服务器(1) 管理节点:用于运行系统级的管理软件、性能要求不高、但可靠性要求高、数量少(2) 登录节点:用于用户登录集群、在集群上实行作业提交、文件上传、编辑、程序编译等操作。可靠性要求高、数量少。(3) IO节点:用于连接存储设备、提供共享存储空间。小型项目,使用单一IO节点提供NFS解决。大中型,使用并行文件系统,多个IO节点和存储空间解决IO瓶颈。4.3. 网络系统主流解决方案千兆管理网+Infiniband高速网(1) 计算网络 对性能有较高问题,具有高带宽,低延时的Infiniband网络可用很好解决这一问题。对于部分对网络性能要求不高的领域,比如石油、渲染等领域,配置线速互联的千兆以太网。(2) 管理网络 对性能要求较低,只要用于系统管理,用户登录等操作,一般配置千兆以太网交换机与刀片交换模块互联。4.4. 操作系统主流解决方案linux企业版基本思想Linux的基本思想有两点:第一,一切都是文件;第二,每个软件都有确定的用途。其中第一条详细来讲就是系统中的所有都归结为一个文件,包括命令、硬件和软件设备、操作系统、进程等等对于操作系统内核而言,都被视为拥有各自特性或类型的文件。至于说Linux是基于Unix的,很大程度上也是因为这两者的基本思想十分相近。完全免费Linux是一款免费的操作系统,用户可以通过网络或其他途径免费获得,并可以任意修改其源代码。这是其他的操作系统所做不到的。正是由于这一点,来自全世界的无数程序员参与了Linux的修改、编写工作,程序员可以根据自己的兴趣和灵感对其进行改变,这让Linux吸收了无数程序员的精华,不断壮大。完全兼容POSIX1.0标准这使得可以在Linux下通过相应的模拟器运行常见的DOS、Windows的程序。这为用户从Windows转到Linux奠定了基础。许多用户在考虑使用Linux时,就想到以前在Windows下常见的程序是否能正常运行,这一点就消除了他们的疑虑。多用户、多任务Linux支持多用户,各个用户对于自己的文件设备有自己特殊的权利,保证了各用户之间互不影响。多任务则是现在电脑最主要的一个特点,Linux可以使多个程序同时并独立地运行。 良好的界面Linux同时具有字符界面和图形界面。在字符界面用户可以通过键盘输入相应的指令来进行操作。它同时也提供了类似Windows图形界面的X-Window系统,用户可以使用鼠标对其进行操作。在X-Window环境中就和在Windows中相似,可以说是一个Linux版的Windows。 支持多种平台Linux可以运行在多种硬件平台上,如具有x86、680x0、SPARC、Alpha等处理器的平台。此外Linux还是一种嵌入式操作系统,可以运行在掌上电脑、机顶盒或游戏机上。2001年1月份发布的Linux 2.4版内核已经能够完全支持Intel64位芯片架构。同时Linux也支持多处理器技术。多个处理器同时工作,使系统性能大大提高。 4.5. 作业调度及系统管理解决方案4.5.1. 系统管理解决方案(1) 单一系统映像:集群松散结构的整合(2) 系统资源整合:软硬件资源的整合,异构资源整合(3) 多用户的管理:用户提交的任务的统一安排,避免冲突(4) 用户权限的管理:对用户进行各种权限控制4.5.2. 作业调度系统解决方案(1) PBS(Portable Batch System) 便携式批处理系统(Portable Batch System,PBS)是一个资源管理和调度系统,它接受批处理作业(具有控制属性的shell脚本),保留和保护作业直到它开始运行。因为一个批处理作业是一个无需用户干预的,在计算机系统后台运行的程序,在批处理作业运行过程中,用户无法实时地得到作业运行结果,所以PBS只能在作业执行后,将作业结果返回给提交者。目前,PBS包含开源免费的OpenPBS、商业付费的PBS Pro、Torque三种分支。(2) LSF(Load Sharing Facility )负载共享设施(Load Sharing Fac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论