




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高性能并行计算平台及并行计算环境概述,中国水利水电科学研究院信息网络中心2005年8月11日,内容提要,1、前言2、高性能并行计算平台建设3、水利水电高性能计算实践4、结语,1、前言,什么是高性能并行计算?,科学家和工程师可以用它来解决一些程序规模庞大、运算时间长以及数据量大的科研课题。并行计算是提高服务器计算速度和处理能力的一种有效手段。计算机按照编好的程序对计算问题进行分解,并把分解的任务块通过一定的方式交给不同的处理器去求解。,国际发展动态,2005年6月22日公布的全球高性能计算机top500,第一名是IBM的BlueGene/L,Linpack测试值为每秒136.8万亿次,第二名是IBM的BlueGene/W,Linpack测试值为每秒91万亿次。日本第一的高性能计算机,EarthSimulator(地球模拟器),Linpack测试值为35.6万亿次。,国内发展动态,中国的第一名,中国气象局的高性能计算机,Linpack值为每秒10.3万亿次。曙光系列、神威系列、银河系列、深腾系列中科院计算所、曙光公司和上海超级计算中心三方共同研制的曙光4000A,Linpack测试值为每秒8.061万亿次。联想公司为中科院网络信息中心生产的深腾6800,共有1060颗1.3Ghz的安腾2处理器,Linpack测试值为每秒4.183万亿次。,院内需求分析,随着工程规模的逐渐扩大、复杂问题求解分析的日益深入,其科学计算的“瓶颈”日趋严重,即使对模型和算法进行简化,一次计算仍需要几个小时、几天甚至数十天的时间,这一现状严重制约了我院水利水电学科的发展,许多工程师、教授提出的理论和设想都因为计算能力受到限制而无法实施。,课题1:小湾坝踵应力诱导缝研究,小湾拱坝坝底缝计算采用网格有20万个单元,总共24万多个节点。单机上运行模拟计算程序时,一个计算步需要将近45个小时,一个工况一般有3040个计算步,总共有几十种工况。,课题2:混凝土三维细观力学模型的研究,模型1:湿筛试件静动态弯拉强度细观力学分析研究中对试件进行划分,用4面体单元将细网格6面体单元过渡到两边粗网格6面体单元,共有24257节点,29952个单元,其中骨料2160个单元,固化水泥砂浆体3805单元,粘结界面14515单元以及宏观均匀混凝土9472个单元。以上三维计算是在内存1G,CPU为2.8G的PC机上进行的。静力计算耗时163小时39分,约7天时间;动力计算耗时196小时25分钟,约8天时间。,模型2:全级配试件静动态弯拉强度三维细观力学分析剖分后的单元有骨料单元、融入小骨料后的固化水泥砂浆单元和两者之间的界面单元,共有24257个节点,113920个单元。计算时间:在以上配置相同的PC机上,三维静力计算耗时209小时50分钟,约9天时间;动力计算耗时291小时57分钟,约12天时间。,问题,要实现三维细观力学数值计算,计算速度这一难题必须克服,通常,针对一个模型研究人员需要反复调整参数进行数值计算,一个算例耗时数天甚至数周简直无法忍受。,上述种种计算和数据的处理对计算环境提出了新的要求,如果以传统的个人PC机作为计算平台,计算的时间和效率远远满足不了科研的需求,甚至会由于内存、CPU等硬件的限制而无法进行计算。因此我院急需建设一个高性能并行计算平台,更好的为科研项目服务。,二、高性能并行计算平台建设,硬件平台建设,初步构想采用Sun公司提供的SunFireSupercluster解决方案。24台高性能的SunFire6800服务器作为集群节点。每台服务器达到满配置,即24个1.2GhzUltraSPARCIIICPU,192GB内存。节点之间采用SunFireLinkInterconnect技术通过光纤互联。,IWHR高性能并行计算平台硬件体系结构,SunFire6800技术指标,硬件完全冗余,可以从任何硬件故障中恢复。最多24个CPU,最大192GB内存,32PCI或者16cPCI插槽。每台SunFire6800机器最多分为4个域,每个域相当于一台独立的服务器。具有很好的线性扩充能力,24个CPU运行时的Linpack值是1个CPU运行时的23.3倍。,SunFireLinkInterconnect,SunFireLink为一套高带宽、低延迟的互联系统,可以扩展SunFire6800系统的可用性。一个SunFireLink系统最多可以由8个SunFire6800服务器节点组成,每个节点由SunFireLink光纤网络连接在一起,一整套软件支持。SunManagementCenter可以为SunFireLink网络资源的配置、监视与管理提供最佳可用性。,我院SunFire6800现有配置,CPU数量4*1200Mhz内存容量8GB(16X512MBDIMMs)I/O板4个,PCI扩展槽共32个SunStorage3510SCSI磁盘阵列可提供539GB的存储空间,目前,本院的高性能并行计算平台建设处于初步试验阶段,待并行计算技术在我院应用成熟以后,可以很方便的对该平台进行硬件升级,以获得更高的性能和计算能力。,现状,软件平台建设,操作系统开发环境编译器数学函数库高性能并行计算软件作业管理接口并行程序运行环境并行数学函数库并行程序调试分析工具资源管理系统,IWHR高性能并行计算平台软件体系结构,操作系统:Solaris9,64位的Unix操作系统具有杰出的稳定性和可维护性单一服务器上最多可支持106个CPU支持多线程,最多100万个进程。支持多种应用软件,如SunCluster软件、Sun管理中心软件、SunStudio编译环境SunGridEngine等等。,开发环境:SunStudio9,主要组件包含如下:CCompilerC+CompilerFortranCompilerSunPerformanceLibraryDistributedmakeutility,dmakedbxCommand-LineDebuggerPerformanceAnalysisToolsIntegratedDevelopmentEnvironment(IDE),编译器,对于科研课题的计算程序而言,编译器的优劣对生成的程序的执行效率有着非常明显的影响,现在在Unix下的免费编译器软件主要是GNU计划提供的GCC,该编译器可以编译C、C+、F77等语言编写的程序。SunFire6800服务器配套的编译器是Sun公司开发的商业编译软件-SunStudio9,该编译器在Solaris上编译运行的效率比GNU的免费软件要高30%40%。,数学函数库:SunPerformanceLibrary,它是Sun公司基于以下标准的线性代数库而生成的,具有相同的函数名和接口,但是在Sun的服务器上运行得更快更精确。LAPACK:用来解决线性代数问题BLAS1:用来解决向量-向量运算问题BLAS2:用来解决矩阵-向量运算问题BLAS3:用来解决矩阵-矩阵运算问题FFTPACK和VFFTPACK:快速傅立叶转换,高性能并行计算软件SunHPCClusterTools5.0,作业管理接口SunClusterToolsRuntimeEnvironment(CRE)并行计算运行环境SunMPIandMPII/O并行数学函数库SunS3L(ScalableScientificSubroutineLibrary)并行程序调试分析工具SunPrismSunMPProf,作业管理接口:SunCRE,执行程序(mprun)杀死程序(mpkill)显示作业信息显示节点信息,并行计算运行环境SunMPIandMPII/O,SunMPI是一个高度优化的MPI版本。它支持MPI1.2标准和MPI2.0标准。支持多线程编程。与SunCRE集成。完全支持Fortran77、C和C+,支持一些基本的Fortran90语法。通过共享内存通信会获得更好的性能。,并行数学函数库:SunS3L,它是建立在SunMPI之上的,给用户提供了一系列广泛应用的并行函数库。如LU分解、最小二乘法运算、矩阵转置等等。支持Fortran77、Fortran90、C和C+SunS3L子程序调用SunPerformanceLibrary来在节点上进行运算。,并行程序调试分析工具Prism和MPProf,Prism是一个图形编程环境,使用户能够对并行程序进行调试和性能监控。MPProf是一个用来查看SunMPI程序的分析工具。运行它可以获得程序的一些时间信息:在所有进程里MPI函数库调用所花费的时间占程序运行时间的百分比;每个进程在MPI函数库调用上花费的时间百分比;MPI函数库调用的次数、程序花费的时间;,资源管理系统(ResourceManagement),SunHPCClusterTools5software可以和下面三种分布式资源管理系统集成,用来管理资源的分配、并行作业的控制和监视,以及作业信息的统计。SunGridEngine:Codine5.2LoadSharingFacility:LSF4.xPortableBatchSystem:PBS2.3.15andPBSPro5.0,集成方法,IWHR高性能并行计算平台软件体系结构,三、高性能并行计算实践,课题一,在结构材料所使用服务器计算的工程项目“小湾坝踵应力诱导峰分析”中,服务器发挥了内存、硬盘空间大,计算稳定的特点,为该工程项目的计算提供了有力的支持。,课题二,在抗震中心的有关“混凝土三维细观力学模型的研究”中,信息网络中心联系太极公司、国防科大等单位对原有串行程序进行并行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第八课 我的QQ账号说课稿-2025-2026学年小学信息技术陕教版四年级下册-陕教版
- 2024年四年级英语上册 Unit 2 My schoolbag The fourth period(第四课时)说课稿 人教PEP
- Unit 6 Playing a game说课稿-2025-2026学年小学英语一年级上册深港朗文版
- A Reading and interaction教学设计-2025-2026学年高中英语沪教版2020必修第三册-沪教版2020
- 1.1鸦片战争说课稿2024-2025学年统编版八年级历史上册
- 第四单元 物体的形体 单元教学设计-2023-2024学年科学三年级上册青岛版
- 个性化音乐生成-洞察及研究
- 江西高校课题申报书课题
- 部编版语文课程教学说课稿范本
- 4.4 数学归纳法(单元教学设计)高二数学同步备课系列(人教A版2019选择性必修第二册)
- 小学英语词汇量小学英语词汇大全(约1000词)(按字母顺序)修改版
- 2024年道路交通(驾驶员交通法规及安全)知识考试题库与答案
- 2024年全国职业院校技能大赛中职(数字产品检测与维护赛项)考试题库(含答案)
- 【乡村旅游探究的文献综述4200字】
- 2025年上半年教师资格考试高中历史学科知识与教学能力试卷与参考答案
- 城市供热管网抢修与维护工程技术规程
- DB2104∕T 0011-2022 地理标志产品 清原龙胆
- 《电动汽车双向无线电能传输系统技术规范》
- 医院护理培训课件:《安全注射》
- JBT 7361-2023 滚动轴承 零件硬度试验方法 (正式版)
- 读懂诗家语省公开课金奖全国赛课一等奖微课获奖课件
评论
0/150
提交评论