版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-.z×××高性能计算系统技术方案建议书中国惠普**2005.6目录第一章概述31.1高性能计算环境开展的趋势31.1.1更高、更全面的性能要求31.1.2向通用化方向开展41.1.3更加严格的预算约束41.1.4使用商品化部件51.2高性能计算应用的特点51.3高性能计算主机性能评价体系6第二章设计方案92.1系统设计原则92.2总体方案构造102.3SMP计算效劳器方案122.3.1CPU内存配置数量计算122.3.2SMP计算效劳器型号及配置132.3.3基于EPIC的安腾芯片技术152.3.4高性能计算环境HP-U*11iTCOE182.3.5计算任务提交及管理192.3.6HPr*8620计算效劳器的特点和优势202.4Cluster计算集群方案212.4.1HPCluster计算集群构造212.4.2Cluster节点系统配置24节点互连、管理和用户网络262.4.4Cluster计算集群节点管理272.4.5Cluster计算集群作业管理282.4.6HPCluster计算集群的特点和优势292.5高性能计算外接存储需求分析302.6HP方案的优势31HP的HPC应用及成功案例331HP的根底研究和国防研究HPC解决方案352HP面向计算机辅助工程(CAE)的HPC解决方案382.1HP基于网络的一体化和虚拟化CAE解决方案382.2HP全面和丰富的CAE应用软件402.3HP面向CAE的HPC解决方案在中国国内的应用422.4HP面向CAE的HPC解决方案的成功应用实例43第一章概述HP公司非常荣幸能为×××高性能计算中心系统建立提出建议。作为全球最大的计算机厂商之一,HP公司具有一流的产品、技术和效劳。在本方案建议书中,HP公司推荐了先进的系统建立方案,考虑了系统的实用性、高可用性、平安性、可管理性以及灵活扩展能力。HP公司凭借先进的技术和出色的支持效劳,相信通过双方的合作,可使×××高性能计算中心系统工程顺利实施,从而为用户提供一个强健、平安、高可用的运行环境,并进一步建立长期的友好合作关系。高性能计算系统是提高一个科研机构研究水平的重要根底设施,也是一个国家科技与经济实力的标志。它不仅是一个高速处理的计算机系统、更重要的是在其之上运行的各种应用对科学领域产生非常深远的影响。20世纪90年代中后期以来,许多高性能计算应用领域越来越多地希望利用半导体和计算机技术开展的新成果通过更大规模、更准确的数值模拟和数字计算来进展新产品设计和科学研究,提高科学研究水平、厂商市场竞争力以至国家的综合国力。另一方面,人们也要求利用工业标准芯片等开放性的技术降低投资、加速开发,在规定经费预算和时间框架内完成规模越来越大的计算任务。高性能和高经济效益相结合已经成为高性能计算领域最引人注目的开展趋势。1.1高性能计算环境开展的趋势1.1.1更高、更全面的性能要求高性能技术计算是利用数值模拟和数字技术方法探索和预测未知世界的技术。这一技术广泛应用于核武器研究和核材料储存仿真、生物信息技术、医疗和新药研究、计算化学、GIS、CAE、全球性长期气象、天气和灾害预报、工艺过程改良和环境保护等许多领域。近年来,随着研究的深入和竞争的加剧,各个领域越来越多地使用模拟的方法来解决科研和生产中的实际问题。模拟的模型越来越大、计算的精度越来越高、对超级计算机性能要求也越来越高。例如,在一个3维模型中,如果把从每个方向取100个分点增加取到1000个分点,对计算机资源的需求将增加1000倍以上。高性能计算应用不仅规模越来越大,而且往往必须在规定的时间内完成任务否则就失去了计算的价值〔如天气预报、传染病防治〕。这就对计算机系统的计算能力、系统带宽、内存容量、存储设备和I/O吞吐能力以及应用软件的开发技术都提出了更高、更全面的要求。1.1.2向通用化方向开展过去人们一般把计算机应用分为科学计算、信息处理和自动控制等类型。其中,以信息处理为主的应用统称企业应用,是市场容量最大的应用领域。早期的企业应用与高性能计算应用有很大的差异,涉及的计算比拟简单、使用的数据量也不大,对计算机系统的主要要求是能够支持大量用户〔包括网上用户〕进展事务处理如信息输入、查询和统计等,而对于计算能力、存储容量要求也不高。因此,高性能计算应用往往使用与企业应用不同的系统,影响了产品批量的扩大。当前,人类正在从工业化社会进入信息社会,技术的持续创新、市场需求的瞬息万变、竞争空间的迅速扩大,要求企业采用Internet、电子商务、电子商务企业等现代化手段,来适应时代的开展。许多新型的企业应用对计算能力、存储容量和系统带宽的要求都越来越高、越来越迫切,高性能计算应用和其他类型应用的界限也日益淡化。当前,几乎所有应用领域都需要使用能够提供高计算能力、系统带宽和存储容量的计算机系统,促使用户选择一样的系统满足各种类型的需求,为利用大批量、低本钱的通用产品满足高性能计算应用需求创造了有利的条件。1.1.3更加严格的预算约束随着竞争的加剧和应用的普及,高性能计算不再是一个不惜工本的应用领域,许多工程的预算约束越来越严格。这就要求厂商生产全系列的产品满足不同规模应用的需求、更加可靠地保护用户原有投资、加速IT投资回报,而且也要**现资源按需供给和更大*围的资源共享,推动了网格和公用效劳等新的计算模式的开展。1.1.4使用商品化部件为了促进高性能计算广泛应用必须降低本钱,否则很难为更多的用户所承受。由于高端的高性能计算系统〔特别是超级计算机〕需要使用许多计算节点和互联设备等部件,因此必须保持每个部件的低本钱。早期的超级计算机系统使用专门定制的处理器和互联设备等部件价格非常昂贵。以后,CrayResearch公司的T3D和CRAYT3E开场使用商品化的Alpha处理器。当前商品化处理器和效劳器性能日益提高、价格也日趋下降,为利用它们建立高端和超级计算机系统提供了良好的根底。为此,美国政府还推出了ASCI方案,力图降低超级计算机系统的本钱,其主要途径是尽可能采用商品化市售(COTS)硬件和软件部件,把力量集中在开展主流计算机工业不能有效地提供的专门技术。目前已经很少再有厂商使用专门的部件如向量处理器来建立超级计算机系统。今后的开展趋势是在高端和超级计算机系统中尽可能普遍地采用商品化和大批量的工业标准部件,包括处理器、互联设备、I/O、存储、操作系统、语言、编译程序、编程工具和应用软件。人们注意到,基于开放性IA-32体系构造的*eon和Pentium4处理器的超级计算机已经在TOP500占有重要地位。新兴的Itanium处理器系列〔IPF〕必将以其开放性、大批量和64位寻址和处理能力,对超级计算机水平的提高产生划时代的影响,以远比32位体系构造时代高的性能和性价比来满足日益增长的需求。我们深信,通过采用HP的高性能计算系统,必将加速×××在高性能计算领域取得更加丰硕的科研成果。1.2高性能计算应用的特点在传统意义上高性能计算应用是属于CPU和内存密集型的应用,它对所运行的计算机体系构造(超级计算机体系构造)提出了几个主要的要求:浮点计算能力(尤其是64位双精度浮点运算),内存带宽和内存容量及体系框架。所有这些因素都是相互关联的。高性能计算通常利用各种数学方程式来建立模型和模拟物理现象。随着各种模型越来越大,越来越复杂,数据集的规模也急剧增长。例如,一个100*100*100的栅格包含100万个元素,该模型仅占用32MB内存,如果此栅格的分辨率提高10倍,这一模型就变为1000*1000*1000,包含10亿个元素,此模型的原始数据将占用32GB的内存!因此不管是分布式内存还是共享式内存,要将此数据传输至内存中,由CPU处理,就需要高带宽,高容量,低延迟的体系构造,当然还需要强大的CPU进展计算。而超级计算机主要用来处理这样庞大的工作负载。这样的负载所要求的超级计算机一定是采用快速的CPU,高性能的内存和I/O子系统,旨在实现最高的运算速度。同样这样的负载所要求的超级计算机还必须采用多级别并行处理技术,能够利用几十个甚至几千个处理器来处理一项任务;这样的并行处理技术也需要超级计算机要采用高性能的互连设备和系统设计,以较高的本钱去换取最高的性能。1.3高性能计算主机性能评价体系衡量主机系统或处理器计算处理能力的测试体系(BenchMark)也有多种,如SPEC、Linpack等,尤其是通过Linpack值更可以衡量一个主机系统或一个处理器芯片的实际运算能力,而不仅仅是虚的理论峰值能力。过去,人们使用系统能够到达的执行指令最大速率如每秒执行百万指令数/浮点操作数(MIPS/MFLOPS)来量度计算机硬件性能。但是,这些量度指标的实用价值十分有限,它们只能给出理论上最大的性能,并没有全面反映计算机系统的实际性能如内存带宽、内存延迟和I/O性能等。此外,硬件性能量度和系统体系构造都是非标准的,使得人们很难使用它们作为效劳器选型的性能指标。因此,出现了计算机系统性能基准测试的概念,即由*些中立的非盈利机构开发出一组经过精心统筹设计和组合的程序,来量度计算机系统运行这组程序的性能指标。此类程序一般称为基准测试程序。不同的计算机系统都运行同一组基准测试程序,就可以相对客观地比拟计算机系统的性能。目前有许多专门设计基准测试程序和管理各种计算机系统基准测试指标的机构,其中最著名的是SPEC和TPC。基准测试可以分为三类:系统基准测试指标:用于测试计算机各子系统的性能,其中主要有:SPECCPU2000用于处理器子系统的指标;McCaplinStream用于测试内存带宽指标;TPC-C用于测试在线事务处理指标性能指标;标准应用基准测试指标:用于测试计算机系统执行*种标准的应用的性能指标,其中主要有:SPECWEB99用于测量计算机执行Web应用的性能指标;SPECMAIL2000用于测量计算机执行电子应用的性能指标;SPECB2000,SPECJVM98用于测量计算机执行JAVA应用性能指标;Linpack用于测量计算机进展线性代数计算的性能指标〔也常作为测量计算机浮点计算速度的基准测试指标〕;SPECHPC96用于测量计算机执行高性能计算应用的性能指标;SPECSFS97用于测量计算机执行网络文件系统应用的性能指标;TPC-D专门用于测量计算机执行数据仓库应用的性能指标;SPECglperf和SPECviewperf专门用于测量计算机执行图形和图象显示方面应用的性能指标;实际应用基准测试指标:许多重要的独立软件开发商(ISV)都制订了计算机系统运行本公司开发的软件产品的基准测试指标。例如,在数据库应用方面Oracle、Informi*、Sybase公司的基准测试指标;在企业应用方面SAP、SAS、PeopleSoft、Baan等公司的基准测试指标;在高性能计算方面运行Amber、CHARMm、Fluent、LS-DYNA、MARC、ANSYS等著名应用软件的指标等;一般地说,系统基准测试指标测试的计算机子系统的性能,而其他两类基准测试指标则主要测试计算机执行*种或*个特殊应用的性能。基准测试指标在用户效劳器选型工作中具有重要的作用,许多用户都根据它们来决定设备选型。但是“全信书不如无书〞。对基准测试必须持一分为二的观点。一方面,虽然基准测试的环境和用户的实际应用环境不完全一样,但是它们毕竟比拟客观地反映了计算机系统*一方面的性能,对性能评估和搞好效劳器选型工作都有相当大的参考价值;另一方面,任何基准测试指标都是在人为设定的特殊条件下得到的。虽然,设计基准测试的机构尽了很大的努力使得基准测试条件尽可能符合实际、具有代表性,但真实的应用环境规模大、软件类型多其组合更是千变万化。基准测试的条件不可能完全反映实际应用的复杂性,基准测试指标不可防止地具有*种片面性。因此,在进展设备选型时必须尽可能了解所使用的各项基准测试指标的实际含义,包含产生它们的环境和测试方法等。为了防止片面性,对效劳器系统的性能指标、特性和厂商进展全面考察,将是搞好效劳器选型工作比拟科学和可靠的方法。第二章设计方案2.1系统设计原则帮助用户建立一套既能最大限度地满足用户实际需要且技术又处于领先地位的高性能计算环境是HP公司为高性能计算用户设计方案的根本出发点。HP认为,×××高性能计算系统应具有处理大规模的复杂运算,尤其是浮点运算的能力。它将为×××提供优化工程设计、分析、验证的手段,最终实现提高设计质量、缩短开发周期、降低开发本钱。方案设计以用户现场测试结果为根底,根据用户对未来应用模式及业务量需求预测为前提,强调高性能以及可行、合理和低风险。架构设计和系统选型遵循以下原则:1.先进性本系统方案所采用的技术既要符合业界的开展方向,又要在未来几年内仍具有很高的技术先进性,保持在同类系统中的领先地位。这样有利于提高整个系统的计算与处理能力。2.有限投资获取最大计算性能在有限的投资前提下,高性能计算系统应具有优秀的处理能力,它不仅具有符合要求的峰值性能(PeakPerformance),更重要的是应具有稳定的应用性能〔sustainedperformance〕。各种复杂的研究课题在本系统中能够得到准确,快速的计算结果。3.可扩展性系统应具有很强的扩展能力。随着对计算机系统性能的要求不断提高,该计算机系统应具有扩展能力,并且容易实现。4.开放性和兼容性本计算机系统应符合公认的工业标准,包括体系构造,硬件,I/O,网络,操作系统,开发环境和开发工具等。这样,便于和其他平台上的系统互操作。5.应用软件丰富本系统的平台上应具有丰富的软件资源,能够提供研究课题的解决方案和相应的软件系统。HP公司与高性能计算方面的独立软件开发商严密合作,例如:Fluent,ANSYS等专业工程软件商,RedHat,Etnus,Pallas,Platform等专业平台软件商,不仅提供处理节点间的协调和通信的中间件,使整个系统节点能够真正实现合作,负载均衡,还能针对不同应用需求,提供一系列并行计算应用。6.良好的技术支持由于本系统是比拟复杂的计算机环境,在使用过程中不可防止的会遇到一些技术问题。当遇到这些问题时能够得到有效的支持,使问题得以圆满的解决。7.性能价格比优越由于本系统比拟庞大,价格因素也比拟重要。本系统在性能价格比方面在同类系统中应具有明显的优势,对于三院三部来说在采购大型系统中应该考虑的重要因素。8.管理简单尽量减少数据中心的设备管理难度。2.2总体方案构造针对×××系统高性能计算应用的特点,结合与相关业务处室的沟通。从满足应用需求的角度出发,我们建议建立一个高可扩展、易管理的混合SMP与Cluster构造的高性能计算环境,整体方案架构如下:我们推荐采用1台HP高档UNI*效劳器HPIntegrityr*8620作为SMP计算效劳器,主要运行Ansys、Nastran、Marc计算应用。SMP计算效劳器采用高性能HP-U*11iTCOE高性能计算操作系统环境,并运行HPWorkLoadManager(WLM)动态资源管理工具对任务的资源分配进展管理和调度。另外,采用64节点、通过Infiniband高速互连的Linu*高性能计算集群〔128颗CPU,512G内存〕,主要运行Fluent、Fastran或LS-Dyna计算应用。高性能计算集群配置1个管理节点及2个I/O节点,并通过用户网络和管理网络进展互联。Cluster管理节点运行ClusterManagementUtility(CMU)管理软件实现Cluster中所有节点的集中管理、配置、激活/关闭等,并通过OpenPBS软件对用户提交的任务进展作业管理。SMP计算效劳器和Cluster管理节点通过1000Base-T千兆以太网连接到三部的骨干网中,各室工作组通过该网络申请计算资源和提交任务。待三院三部存储区域网络〔SAN〕建成后,SMP计算效劳器和ClusterI/O节点可通过扩展的光纤通道卡连接到SAN中,满足高性能计算环境对存储性能和空间的巨大需求。2.3SMP计算效劳器方案2.3.1CPU内存配置数量计算根据以上分析,SMP计算效劳器主要用于构造类计算任务,包括构造的设计、分析和仿真等。SMP效劳器的选型应与用户现场测试效劳器具有一样的构造和一样的产品系列机型,即采用基于Itanium2芯片的HPIntegrity〔安腾〕效劳器系列产品,并根据未来几年内三院三部的计算需求配置适当的型号和CPU内存数量。从测试结果上看,ANSYS类应用对系统资源和开销是最大的,而用户使用ANSYS来进展部件和系统设计也是最多的,因此按此类应用的峰值性能需求来计算出系统的配置,当然还应根据任务的并发情况来适当调整。根据用户计算需求的预测,该SMP计算效劳器应至少到达以下性能:同时运行5-6个ANSYS系统级任务〔每个600万单元〕,计算时间不超过12小时〔夜间运行〕;部件级ANSYS任务〔每个200万单元〕的计算时间在1-2小时内〔白天运行〕;用户目前此类应用用户有5人,按未来10人来规划。白天考虑4-5个部件级的并发。计算依据上述要求和实测数据:ANSYS实际测试结果:1个7万单元任务,4个1.3GHzCPU,8GBRAM,运行时间:2分15秒;本次选择1.5GHz的芯片,性能比测试机配置芯片性能高;ANSYS提供标准题的计算要求:600万单元的任务,要求20GB内存;系统级并发任务对CPU数目要求如下:6任务*(600万/7万)*(1.3GHz/1.5GHz)*(2分钟/720分钟)*4CPU=4.95CPU结论:对于在12小时内完成6个系统级任务,按每个任务分配1个CPU,共需6个1.5GHzCPU即可实现。如果每个系统级任务分配2个CPU,共占用12颗CPU,只需不到6个小时即可完成计算。部件级并发任务对CPU数目要求如下:5任务*(200万/7万)*(1.3GHz/1.5GHz)*(2分钟/90分钟)*4CPU=11CPU按每个任务分配2-3个CPU,共需11个1.5GHzCPU。结论:对于在1.5小时内完成5个系统级任务,共需11个1.5GHzCPU即可实现。整个系统配置CPU数目如下:按照白天在1.5个小时内完成5个并发部件级任务和晚上并发6个系统级人物的最大要求,考虑其他应用如Nastran、Marc、LS-Dyna任务的并发计算要求,建议本次SMP系统的CPU配置总数为12个。系统对内存的要求如下:我们以ANSYS应用对内存的要求作为估算标准。1700万单元ANSYS标准题的内存要求约为60GB。对于本系统来说,系统最大负荷时的并发任务量总计最大为6*600万单元,因此,我们建议本次SMP系统内存配置为128GB。2.3.2SMP计算效劳器型号及配置根据以上分析,我们配置16CPU和128GB内存的HPIntegrityr*8620安腾效劳器作为SMP计算效劳器,并安装在2米高机柜内。HPIntegrityr*8620具有51.2GB/s系统带宽、64GB/s内存带宽和8.5GB/s的I/O总线带宽,非常适合做高性能计算效劳器,并最多可支持32个CPU及扩展至256GB内存。HPIntegrityr*8620如下列图所示:除了满足上述用户的计算要求外,配置16CPU和128GB内存的r*8620计算效劳器还可胜任超过单任务3000万以上单元的系统部件的计算,并在4-12小时内得到计算结果。HPIntegrityr*8620计算效劳器的配置如下:效劳器型号HPIntegrityr*8620-32处理器12*Itanium21.5GHz/4MB内存128GBHDSyncDRAM内存硬盘4*146GB硬盘网络接口〔内置〕1*10/100/1000Base-T,接用户网络1*10/100/1000Base-T,接收理网络扩展网卡1*10/100/1000Base-T,接所骨干网DVD-ROM1*DVD+RW机柜1*RackSystem/E41U,PDU电源风扇N+1热拔插电源风扇软件配置-HP-U*11iv2TCOE操作系统〔无限用户许可〕-HPWorkLoadManager(WLM)动态资源管理器-HPMirrorDisk/U*磁盘镜像软件-C/C++/Fortran编译器配置的HPIntegrityr*8620还有13个可扩展的PCI-*插槽,未来可配置2块FiberChannel2Gb适配器分别连接至SAN(存储区域网络)上,以获得高性能的数据及所需的及可扩展的存储空间。HPIntegrityr*8620最多可扩展32个PCI-*插槽,满足I/O扩展的需要。2.3.3基于EPIC的安腾芯片技术针对高性能计算应用对高性能的需求,HP在系统设计上允许通过使用不断更新的IPF系列产品、采用先进的芯片组、使用更高性能的根底节点、支持更多的节点和提供更高的带宽等多种途径扩展系统的规模,提供高性能和最大的性能扩展空间,满足当前和为适应当前飞速开展的计算需要,一个高性能计算的全新时代应运而生,而HP正是以其基于第二代Itanium2处理器的安腾效劳器执业界之牛耳。未来各种高端应用的需要。具有革命意义的安腾处理器家族架构由HP与Intel共同研制开发,它基于全新的EPIC体系构造,降低了平台的本钱,提高了其性能和可扩展性.基于Itanium2的HP系统的速度比上一代产品快两倍,轻松超越IA-32和基于标准RSIC的系统的性能.基于Itanium2的惠普效劳器能够提供更强大的功能,更多的应用,附加的特性,以及更广泛的解决方案。IA-64体系构造在吸收RISC体系构造经历教训根底上另辟蹊径,一开场就走开放性的道路,充分利用现代芯片制造工艺开展成果、提供足够的资源;同时,通过力争成为新的高端工业标准、扩大批量来降低本钱。它的根本设计思想是:提供一种新的机制、充分利用硬软件协同能力来提高指令并行度:一方面大力开发先进的编译程序,消除程序中的条件转移指令、并基于猜想机制越过转移和存储指令界限调度指令的执行次序,把程序员利用串行语义编写的源程序转换成由可并行执行指令段序列组成的目标程序;另一方面使得处理器具有足够资源和智能,来纪录编译程序所发现的程序中可并行执行指令段之间的划分信息,并保证在程序运行过程中发现猜想和调度有错时仍然给出正确结果。对IA-64体系构造处理器来说,所执行的目标程序中可并行执行的指令段已经由编译程序显性地标识出来了、指令间的数据相关性和过程相关性也已经由编译程序消除了,使得处理器只需使用相对简单的逻辑来实现很高的指令级并行度〔ILP〕。相反,传统的RISC处理器没有足够的资源来纪录编译程序所产生许多有用的信息,也没有充分利用现代编译程序强大的对程序执行过程的调度能力。虽然在RISC体系构造下,设计师们也使用编译程序来优化目标程序、为处理器提高ILP创造条件。但是,处理器所执行的根本上是隐性并行和包含大量相关性的目标程序,发现并行、线路预测、动态调度等提高ILP的无序执行技术、完全是由处理器硬件利用复杂的芯片逻辑来实现的。尽管两种体系构造之间存在着许多差异,但是执行显性并行或者隐性并行目标程序是其中最主要的本质差异。所以最初创造这种新体系构造的惠普公司把它称为显性并行指令计算〔EPIC〕体系构造。除了强有力的编译程序外,IA-64体系构造微处理器必须提供足够的资源来实现EPIC设计思想、提高并行度和实现高性能,包括:新颖的指令集:允许编译程序产生由并行指令段组成的目标程序,并纪录指令段间的划分;大存放器空间:为编译程序通过存放器换名等技术消除相关性、产生尽可能在存放器中进展运算的优质目标程序提供充分的余地;具有足够长度的指令:便于在指令中大存放器空间中多个存放器和消除程序中转移指令;足够的指令发送端口和派送网络:用于提高每个时钟周期发送到指令数和提高发送到速度和效率;多种类型的新型存放器:允许编译程序越过条件转移和存储指令的界限调度目标程序中内存指令的位置、消除相关性,并弥补调整位置所产生的错误;更多的浮点执行部件:有利于处理器实现高并行度的浮点计算;更多的整数和多媒体运算执行部件:有利于处理器实现高并行度的整数和多媒体信息处理;更多的芯片上高速缓存:有利于提高缓存命中率、降低内存延迟;EPIC体系构造处理器提供的存放器资源IA-64的EPIC体系构造是对传统RISC体系构造的重大革新,许多方面突破了RISC体系构造的局限、开展了RISC体系构造,为利用新制造工艺和技术、按照摩尔定律预示的速度提高处理器性能提供了可靠的保证。2.3.4高性能计算环境HP-U*11iTCOEHPIntegrityr*8620采用HP_U*11iV2(现在成为唯一可支持安腾芯片的64位UNI*操作系统)操作系统(TCOE)提供高性能计算环境的根底,并配合相应的系统管理软件、语言编译器、并行模式、相关数学库,还可支持目前流行的各种第三方高性能计算商业软件包和应用软件包,例如Platform的LSF(负载平衡软件)和checkpoint,Etnus的TotalView,Pallas的Vampir及Gaussian等等,这些可根据实际要求灵活配置,以运行高性能计算应用程序和商业软件(含数据库软件)。HP_U*11i系统下的C,C++和Fortran编译器展示出卓越的实际应用性能,操作系统库充分利用了Itanium2架构的先进技术,其中包括:MLIB。一系列子程序,为科学和技术计算提供了常用数学软件,并针对Itanium2架构进展了优化;HPMPI。实现对Itanium2架构信息传递接口的高性能,为开发人员提供了API和软件库来支持下有效,可移植的并行信息传递的应用,是分布式计算的理想选择。2.3.5计算任务提交及管理所有向HPIntegrityr*8620计算效劳器提交的任务其所需的CPU内存等系统资源是通过HPWorkloadManager(WLM)动态资源管理工具来进展管理的。HPWorkloadManager(WLM)是一个非常简单、高效、易用的资源分区和管理工具,通过它,系统管理员可根据计算效劳器的资源情况及提交任务的优先级给使用用户灵活分配和调度CPU、内存及I/O等系统资源,当更高优先级的任务提交后,HPWLM可动态调整系统资源的分配,保证高优先级的任务获得所需的资源。HPWLM动态资源管理可通过本地或远程终端进展管理,其界面如下列图所示。2.3.6HPr*8620计算效劳器的特点和优势HPIntegrityr*8620是具有非常高性能价格比的SMP计算效劳器,非常适合三院三部的构造类计算任务的运算。其特点和优势如下:业已经测试证明的构造类高性能计算架构用户现场测试结果说明,HPIntegrity安腾效劳器的架构最适合作为Ansys、Nastran、Marc等应用的计算平台。优越的系统架构和CPU芯片技术优势与用户现场测试效劳器的架构一样的HPIntegrityr*8620高端SMP效劳器,提供更高的系统带宽、内存总线带宽和I/O总线带宽。基于这样的架构,HPIntegrityr*8620可为计算应用带来更高的性能和更好的加速比。另外,HPIntegrityr*8620采用基于EPIC〔显式并行指令计算〕技术的Itanium2MP芯片〔注:非Itanium2DP芯片〕,拥有更大的内存带宽和系统带宽。与RISC和超标量技术不同,EPIC技术是在程序编译阶段即实现指令的并行,这为强调并行的高性能任务实现更高的计算性能提供了根底。多操作系统支持以及硬件分区技术给用户更多的灵活性HPIntegrityr*8620可支持HP-U*、Linu*和Windows等操作系统,并支持在同一机箱内划分成1至4个完全电隔离的硬件分区〔nPars〕。这样,在需要的情况下,用户可灵活配置不同大小的硬分区及分别运行一样或不同的操作系统,从而给与用户最大的系统使用灵活性。易管理的高性能计算环境HP-U*11iTCOEHP-U*11iTCOE提供高性能、高可靠及平安的UNI*操作系统根底环境,并提供HP高性能C/C++和Fortran编译器、数学库MLIB和MPI工具。通过HPWorkloadManager(WLM)动态资源管理工具,管理员可根据SMP计算效劳器的资源情况及任务的优先级给不同使用用户灵活分配和调度CPU、内存及I/O等系统资源,HPWLM动态资源管理工具简单、高效、易用。投资保护优势HPIntegrityr*8620基于工业标准架构,拥有良好的可扩展能力〔其中内存可最大扩展到256GB〕,并支持在机箱内升级到下一代Itanium2芯片,最大可容纳32颗CPU,可实现最大程度的投资保护。2.4Cluster计算集群方案2.4.1HPCluster计算集群构造HP公司作为高性能科学计算集群技术的领导者,可提供最强大的、易于管理的一系列现有的Linu*集群解决方案。惠普结合了Linu*的优势、最好的软件、内部互连、工业标准的计算机平台、惠普集群技术专家、支持和效劳向用户提供具有增加容量和能力的Linu*集群系统。Linu*集群系统也叫做BeowulfCluster集群系统。HPBeowulf集群的逻辑架构如下:硬件局部应包括:计算节点管理节点I/O节点互连系统软件局部应包括:操作系统集群管理软件开发环境数学库、并行库作业管理系统文件系统和客户应用软件标准应用软件根据用户的需求分析,按HPBeowulf集群的逻辑架构,我们为本工程设计的Cluster计算集群方案如下:上述Cluster高性能集群主要为Fluent、Fastran等流体类应用提供计算环境,另外,根据用户现场测试的结果,LS-Dyna应用在此SMP和Cluster架构上均有非常出色的表现,用户也可选择在此Cluster计算集群中来运行此类应用。2.4.2Cluster节点系统配置根据用户需求,配置高性能计算节点配置配置64台计算节点。每台配置如下:计算结点处理器2*Opteron2.6GHz内存4GB内存硬盘1*60GBSATA硬盘网络接口〔内置〕1*10/100/1000Base-T,接用户网络1*10/100/1000Base-T,接收理网络网络互连接口1*InfinibandAdapter远程管理Integratedlightsout(iLO)软件配置RedHatEL3U2*86-64WSI/O节点配置配置2台I/O节点,每台配置如下:I/O节点处理器2*Opteron2.6GHz内存4GB内存硬盘2*146GBSCSIUltra320硬盘网络接口〔内置〕1*10/100/1000Base-T,接用户网络1*10/100/1000Base-T,接收理网络扩展网卡1*10/100/1000Base-T,接所骨干网远程管理Integratedlightsout(iLO)软件配置RedHatEL3U2*86-64ES用户数据中心建立以前,用户数据及应用程序临时存放在4个146GB硬盘中。用户数据中心建立后,可扩展配置2个2GB光纤通道卡接到SAN存储网络中,届时,所有Cluster计算集群的用户数据、应用等均放到SAN里。管理节点配置采用1台管理节点,配置如下:管理节点处理器2*Opteron2.6GHz内存8GB内存硬盘2*146GBSCSIUltra320硬盘网络接口〔内置〕1*10/100/1000Base-T,接用户网络1*10/100/1000Base-T,接收理网络扩展网卡1*10/100/1000Base-T,接所骨干网高速通讯网络Infiniband远程管理Integratedlightsout(iLO)软件配置-ClusterManagementUtility(CMU)-OpenPBS-MPI,PVM-C/C++/FortranpilersandMlibforAMD-RedHatEL3U2*86-64ES管理节点通过CMU管理计算节点,并通过OpenPBS进展作业的调度管理。2.4.3节点互连、管理和用户网络HPCluster高性能集群系统的计算节点通过高速的Infiniband互连技术实现互联,高速的Infiniband互连网络主要用于计算节点之间进展MPI通讯,交换节点应用进程信息和计算数据。Infiniband互连采用64端口的Infiniband交换机。整个高性能集群的每个节点连接分别连接到两个网络,管理网络和用户网络。管理网络主要用于节点管理信息的传输,用户网络又称存储网络,主要用于各节点与I/O节点之间的数据传输,包括应用程序和数据的装载、计算结果的保存等等。管理网络和用户网络均采用HPProCurve以太网络产品搭建。管理网络采用2台10/100Mb/sHPProCurve2650以太网交换机,用户网络〔存储网络〕采用2台1Gb/sHPProCurve2800系列以太网交换机。网络交换机配置如下:互连交换机〔Infiniband〕64端口Infiniband交换机,以太网交换机〔用户网络〕1*HPProCurveSwitch2824-20*10/100/1000Base-T-4*10/100/1000Base-T或mini-GBIC〔双功能定制端口〕1*HPProCurveSwitch2848-44*10/100/1000Base-T-4*10/100/1000Base-T或mini-GBIC〔双功能定制端口〕以太网交换机〔管理网络〕2*HPProCurveSwitch2650-48*10/100Base-T-2*10/100/1000Base-T所有Cluster集群计算节点、I/O节点和管理节点及上述互连交换机和以太网交换机均被分别安装在3个2米高E42的机柜中〔含PDU〕,安装位置进展适当调整,以优化机柜配线。2.4.4Cluster计算集群节点管理为了有效的管理HPCluster计算集群系统,管理节点配置了管理能力很强的管理软件CMU(ClusterManagementUtility)。CMU是一个非常出色的Beowulf集群系统环境下的管理软件,它负责系统的诊断、软件安装、性能监控、系统的克隆(Cloning)和事件的分析与管理。通过使用CMU友好的用户界面,集群管理将变得更加高效。CMU也将通过减少相关的管理任务,使HPCluster计算集群成为一个经济高效的解决方案。CMU使用了RILOE板或集成iLO的特性,使得所有计算节点的远程文本控制台在效劳器的所有状态下〔设置、启动、OS或暂停〕均可使用。并借助独立于CMU的WEB浏览器,远程任何活动节点的图形控制台。通过CMU管理程序,Cluster集群系统管理员可以远程控制效劳器电源,而无论效劳器处于何种状态〔即使效劳器关机〕。另外,通过CMU还可进展远程BIOS设置。CMU还具有将一个系统配置向集群中的所有计算节点传播的功能。CMU可以通过网络将一个映像效劳器的磁盘分区内容克隆到计算节点本地磁盘中。这可用于计算节点的首次安装,以及向核心或当前系统配置传播更新内容等。在目标分区与初始映像不同的情况下,CMU则会重点考虑目标磁盘分区。CMU在克隆阶段对目标磁盘进展分区,防止了在初次安装期间对各个计算节点进展分区。集群管理实用程序(CMU)可以有效地管理大量计算节点。CMU带有图形用户界面〔GUI〕,可以根据需要和集群中任意数量的节点进展定制。借助CMU,只需在单一显示屏上单击鼠标即可所有的计算节点控制台。CMU主窗口可通过配置显示界面来设置控制台效劳器硬件。通过CMU,可以监控、暂停、启动、重启或关闭选定的任何节点。还可以连接到集群中的多个节点,并通过一次键盘输入以播送的方式向其发出命令。CMU也可以管理来自集群的事件,如节点的增加或减少等。2.4.5Cluster计算集群作业管理高性能计算用户通过登录管理节点进展作业的提交,作业提交后,由管理节点上的OpenPBS作业管理软件进展管理和分发。OpenPBS为生产环境设计的,它可提供了图形和命令行两种用户界面来提交批处理、交互式作业,并提供查询作业、队列、系统的状态和跟踪作业的处理。在作业运行之前,用户可将需要的文件拷贝到执行节点上,和将这些指定的文件在作业执行完之后,拷贝出来。只有在所有的文件成功传输之后,作业将会被列入调度表。提交任务的用户可以指定作业的优先级,可以向队列和系统层提供默认值。OpenPBS支持单队列或多队列方式。并选择标准的first-in,firstout调度,或者改良的调度算法。OpenPBS可以使用户定义广泛的批处理作业的内部相关性。这些相关性包括:执行顺序、同步执行和根据指定作业的成功或失败结果条件执行。2.4.6HPCluster计算集群的特点和优势HPCluster计算集群具有以下特点和优势:具有很高的性能价格比。采用先进的Beowulf架构,扩展性好即可扩大到几百上千个节点,从而获得很高的性能和比拟低的总体本钱。方案采用惠普公司的高性能、高可靠性的产品。高节点内存带宽,高性能的HPProCurve网络交换产品,HPCMU集群管理软件。方案采用工业标准设备和顺应高新技术开展的趋势。如AMDCPU,Linu*技术,集群并行计算技术,开放代码程序。由HP亚太地区高性能计算参谋提供技术支持,由HP集群技术部门进展配置清单设计和由HP亚太地区工厂进展集成和测试,并提供并行测试报告。由惠普公司提供专业效劳支持。2.5高性能计算外接存储需求分析本次方案没有涉及存储区域网络的设计,本方案中给SMP计算效劳器和ClusterI/O节点配置的多个146GB硬盘仅考虑临时的应用需要,但高性能计算对存储空间的巨大需求是显而易见的。在这里,我们根据现场测试的结果,简单分析存储的容量要求,供三院三部在规划存储区域网〔SAN〕设计时参考。经多对实际测试情况的分析及与三部实际用户的交流发现,ANSYS构造类应用每20万单元大约需要差不多2GB存储空间,即每10万单元需1GB。假设以三个月作为用户的活泼生产数据迁移到近线存储空间〔作为非频繁数据〕的周期,以一年作为非频繁数据迁移到离线备份设备〔作为离线备份数据〕的周期,因此用户的SAN总存储空间需求为高性能磁盘空间加上近线磁盘空间:高性能磁盘空间=生产数据空间+20%冗余+预留30%近线存储磁盘空间=4*生产数据空间+20%冗余+预留15%而生产数据空间与计算任务量相关。以ANSYS为例,按SMP计算效劳器配置中分析,用户有10人,假设每月每人要计算2个600万单元的系统级任务,5个200万单元的部件级任务。每个系统级任务和部件级任务均产生3份计算结果〔不同的参数和条件,但不包含中间结果数据〕。因此,所需空间的计算如下:生产数据空间=10人*(1*600万单元+5*200万单元)/10万单元*1GB*3 =4.8TB考虑预留空间30%和20%的RAID冗余,可计算出所需的高性能磁盘空间约为7.2TB。近线存储磁盘空间约为25.9TB。即总的存储磁盘裸容量应为33TB。上述计算只针对ANSYS应用,对于Marc、Nastran、Fastran、Fluent、LS-Dyna等其他应用,也应一一分析其对存储资源的需求情况,并根据预测的用户数、任务量以及数据管理迁移策略等具体情况分别进展计算。另外,进展实际的估算时应根据用户实际的工作模式、任务量预测、考虑的数据迁移策略等作相应调整和计算。2.6HP方案的优势HP所提供的上述方案是经过深思熟虑的,从架构设计、选型配置等方面均经过专业的分析并以用户现场测试结果为根底,可行、适当、低风险和高性价比,是三院三部最好的选择。在以下方面,HP具有明显的优势:1〕HP提供的方案是真正可行、低风险的HP方案提供的计算环境系统架构与已被证明架构可行、对各种应用具有良好的适用性、高性能、易管理的现场测试系统方案相一致,不但可以保证用户可获得所期望的性能,还防止了由于采用未经测试系统架构所带来的风险。HP方案采用多种标准的工业架构〔Intel安腾2MP芯片、RedHat标准版Linu*〕及多种高性能计算应用软件〔ANSYS、Nastran等〕。在用户现场测试中,分别在该架构上测试了用户样题和标准题,不但证明了结果准确无误,计算性能也非常理想,而且测试过程中从未发生操作系统与应用不能匹配而临时对操作系统打补丁的问题,或测试题目的运算异常的现象。证明了HP方案的架构是稳定的、对应用的支持可靠的。2〕HP提供的方案具有非常高的性能价格比本次方案中,整个计算环境配置的计算CPU数共达144个〔SMP计算效劳器共16个CPU,Cluster计算节点共128个CPU〕,内存总数共达640GB。可支持超过3000万单元的任务运算,计算性能非凡。能够同时满足十一五期间流体和构造计算的最大要求。由于采用了SMP和Cluster混合的高性能计算体系架构,能充分利用高价格高性能SMP和高性能低本钱Cluster的优势,使得整体构建本钱仍较低,而使用户获得了非常高性能价格比的高性能计算环境。3〕HP提供的方案所采用的架构是合理、高性能和高可扩展的HP方案中采用与用户现场测试时一致的SMP+Cluster架构,针对了不同类型应用对不同架构计算平台具有不同的适应性的特点,为各类应用任务的计算都提供了最优的支持和性能表现,同时也给用户提供更加灵活的选择。测试结果已经历证了该架构是合理的、高性能的。4〕HP方案给用户提供了低本钱、易管理的高性能计算环境SMP单机运行构造题目,Cluster运行流体题目,是系统管理简单而且性能高。另外,用户可以通过HPWLM和CMU、OpenPBS等管理工具和简易管理界面即可进展计算节点的管理及计算任务的更为精细的调度和资源分配,大大简化了任务管理的复杂性及降低了管理本钱。HP的HPC应用及成功案例并行计算是提高高性能计算机计算速度、从而利用它们来解决各行各业实际问题的关键技术。无数实践经历说明,开发优质的并行计算软件难度很大、必须解决许多与实际应用相关的复杂问题。因此,开展并行计算技术不能光靠抽象研究算法、模型,必须结合实际应用的特点和需求以及所使用的计算机平台的特点、对应用软件有针对性地进展优化、提高并行度和计算速度。许多HPC应用领域的优质应用软件都是经过厂商、ISV和用户长期合作的结晶,经过反复的考验,才能在此根底上形成可重复使用的整套解决方案。因此,HPC解决方案具有很高的含金量,受到用户普遍重视。进入21世纪后,并行计算这一新兴学科有了飞速开展,显现出强大的生命力。最重要的标志就是,并行计算技术在生命科学和材料科学、计算化学、数值天气预报、石油勘探开发、航空航天、核能利用等近代科技领域得到了广泛的应用,能够较好地发挥高性能计算机并行计算能力的HPC应用软件数量越来越多,在此根底上形成了覆盖HPC所有重要应用领域的解决方案。HP与HPC领域中许多领先的ISV合作,在许多个能够最正确地发挥HP基于工业标准平台性能优势和技术特长、具有最正确用户根底和市场优势的关键领域,推出一系列HPC应用解决方案,包括:根底研究和国防研究解决方案计算机辅助工程(CAE)解决方案生命科学和材料科学解决方案GIS解决方案数字特技和内容创作等可视化计算解决方案电子设计自动化〔EDA〕解决方案产品全过程(PLM)管理解决方案天气和气象模型解决方案HPC主要应用领域规模和增长率HPC应用领域2004年市场规模年增长率根底研究10亿美元5.2%国防研究5亿美元6%生命科学10亿美元22%CAE6亿美元7.3%EDA3亿美元4,5%地球物理3亿美元5.5%PLM2亿美元5%GIS2亿美元5.7%HPC应用软件和解决方案是长期积累的成果,也是大量投资的产物。为了加速应用开发和保护原有投资,应用软件和解决方案移植和认证对促进HPC应用具有重要意义。为此,HP与Intel合作、共同投入巨资,在全球建立了三个解决方案中心:Cupertino解决方案中心、Grenoble解决方案中心和**解决方案中心,帮助广阔ISV、SI和用户进一步了解基于IPF硬软件系统和现有的解决方案以及开发工具,支持他们把现有的解决方案移植到IPF平台上、或者在这一平台上开发新的解决方案和应用软件。此外,HP还在、**和**等地设立了多个解决方案和体验中心,承当类似的任务。其中HPIntel**解决方案中心位于**外滩中心,拥有强大的根底设施、齐全和先进的硬软件设备和前沿的技术,提供进展各种模式应用开发的完美环境;拥有多名技术专家,具备应用开发、解决方案设计、性能优化等技术能力,以及丰富的行业和跨行业解决方案经历;拥有专用的宽带Internet接入线路,合作伙伴和客户可以与中心建立VPN联接,在中心技术专家配合下,进展远程开发和测试。这一中心是全球性的解决方案中心,中心专家将以HP和Intel总部和世界各地极其雄厚的资源和丰富经历为后盾、帮助合作伙伴和用户解决所遇到的问题。在网络化的世界中,许多难题往往很快就能得到答复。HP的解决方案中心以及与Intel等厂商共建的解决方案中心已经在工业标准平台上开发HPC应用软件和解决方案作出了重要奉献,今后这一作用必将越来越大。下面主要列举与本工程应用领域相类似的局部内容。1HP的根底研究和国防研究HPC解决方案政府资助工程、学院根底科学研究和国防应用是HPC传统的主要领域之一,也是HPC〔过去称为HPTC〕的发源地。今天厂商与高等学院和研究机构开展HPC领域尖端和根底研究仍然是开展HPC技术、推动HPC广泛和成功应用最重要力量,具有不可取代作用:开展尖端技术:当今世界上最尖端和最大规模的超级计算机工程往往都是为国防效劳、是国家综合实力的象征。此类工程一般都由国家出资组织厂商、大型国立实验室和著名高等院校合作承当。从当前TOP500排行榜和演变历史就可以清楚地看到最大的超级计算机和最尖端的技术都应用于航天和核技术的开展。HP在开展HPC尖端技术方面过去、现在和将来都发挥重要作用,美国所有从事核技术实验室〔如LLNL,LBNL,PNNL,Sendia,PNNL等〕和航天机构〔如NASA〕都是HP的重要用户和合作伙伴;探索自然奥秘:许多涉及到探索自然奥秘的HPC尖端应用,规模大、周期长、风险也非常大,又往往很难直接转为商品,此类研究往往只能放在高校和院所进展。例如,高能物理是HPC领域最高端的科研应用代表性领域。HP提供丰富的工具支持科研人员在HP工业标准和开放性平台上进展应用开发,包括CERNlib〔高能物理代码库〕、Geant〔事件模拟代码〕、MBONE〔协作软件〕、PAW〔物理分析工作站〕、PIAF〔并行交互分析工具〕等;开展根底研究:HPC根底研究是推动HPC技术开展和应用推广的根底,但是根底研究难度大、需要许多综合人才、直接创利能力又差,只有高等院校才是开展并行计算算法、软件和开发运行环境的最理想场所。HP一方面与国内外许多院校合作、建立了一系列联合开发实验室〔详见第四章〕,另一方面提供高性能超级计算机、丰富和优质的软件开发工具、数据分析和可视化工具作为面向根底研究解决方案,支持许多院校进展并行计算、数值模拟、软件优化和移植等方面根底研究,为HPC技术开展奠定坚实的根底;开发新技术:一方面,根底研究的创新性和剧烈竞争要求所使用的HPC系统具有先进性、高性能、可伸缩性、可用性、可维护性以及丰富的应用软件和解决方案;另一方面,从事根底研究的学院和机构有创新的传统、经费一般都比拟紧*。这一领域比拟喜欢别出心裁,蕴育了许多新技术如Internet、UNI*、Linu*和集群等;培育高级人才:人才是HPC技术开展和成功应用的关键,高等院校和国立实验室之所以能够取得许多工程和投资关键也在于人才。例如,LosAlamos国家实验室今后三年内将获得国防部420万美元的资助,以便实验室的计算机和计算科学部门进展分析、模拟、创立软件工具和评估网络。该实验室之所以被选中进展该方案是因为该实验室拥有高级超级计算机构造、性能模拟等方面的人才。我国目前正在建立的两大网格中国国家网格和中国教育网格其主要节点全部在科教单位〔详见第一章〕,其原因与高校拥有大量人才显然有关;HP许多国内外许多著名的科教机构合作提供支持它们进展HPC应用开发和人才培育的完整解决方案,包括工业标准平台、软件开发和移植工具、数据分析和可视化工具以及通过解决方案中心等机构提供技术效劳和支持,为HPC领域前沿工程研究、尖端技术开发、并行算法和理论根底研究开展作出了重要的奉献,创造了一系列成功的应用实例。HP集群架构超级计算机在根底研究领域中局部用户用户名称用户简介系统配置主要应用复旦大学著名高校128台HPProLiantDL360生命科学、网格西北工业大学著名理工大学42台r*2600组成集群航天、航空CAE研究清华大学清华大学高性能计算中心,国内最著名综合性大学120台r*2600集群系统网格高性能计算研究华中理工大学国内著名理工类学院57台r*2600效劳器集群生命科学等领先中国科技大学中国国家重点建立的高水平大学之一2台IntegritySuperdome,32台r*2600集群系统生命科学、工程、化学和材料等领域应用中科院物理研究所国内著名研究所AlphaServerSC45超级计算机凝聚态物理研究CaliforniaInstituteofTechnology加州技术学院的高级计算研究中心,支持学院和设在该院的喷气发动机实验室的科研6套4处理器的r*4610效劳器与HPSuperDome和V2500等大型效劳器联网科学和工程计算机模型研究OhioSuperputerCenter美国Ohio州的一个为大学和私人公司提供计算效劳的计算中心150个z*6000工作站、通过Myrinet联接组成的Linu*集群系统计算化学、物理和机械工程、全球天气预报等方面计算Queen‘sUniversityBelfast英国北爱尔兰一家大学23个节点〔50个Itanium2CPU〕HP-U*集群系统〔以后使用Linu*操作系统〕高性能技术计算RiceUniversityTe*as州一所大学,是美国最好的技术和研究大学之一;建立该州大学中第一个速度高达1TFLOPS的超级计算机-RTC〔RiceTelescaleCluster〕由132台z*6000工作站和4台r*5670效劳器,通过Myrinet联接,组成基于Linu*的集群系统高性能技术计算和高端的可视化应用UniversityofOslo挪威的一所大学,与Trosmo大学等四个单位联合组成一个支持高性能技术计算的网格利用基于Itanium工作站的Linu*集群系统与两台HPSuperDome效劳器联接,组成网格系统生物信息学、天体物理、地球物理、化学和金融模拟等领域的计算UniversityofTennessee美国田纳西州的一所大学,大量从事网格计算研究使用由大量基于Itanium2的集群系统组成网络,支持网格计算支持该校的开放性校园间网格工程〔SinRG〕UniversityofTromso挪威的一所大学,与Oslo大学等四个单位联合组成一个支持高性能技术计算的网格利用基于Itanium工作站的Linu*集群系统与两台HPSuperDome效劳器联接,组成网格系统生物信息学、天体物理、地球物理、化学和金融模拟等领域的计算KTH(RoyalInstituteofTechnology)瑞典最大的工程学院180个Itanium2处理器集群系统,包括74个HPr*2600效劳器和16个HPz*6000工作站〔2CPU〕支持瑞典科学院研究和国家合作,包括生命科学、生物信息学、计算化学、材料科学、天体物理、根底物理和计算工程2HP面向计算机辅助工程(CAE)的HPC解决方案当前,计算机辅助工程〔CAE〕已经开展成为制造业不可缺少的工具:工程师使用CAE系统开发和观察物理世界高度复杂和准确的模型,设计各种事物如交通工具(汽车、飞机、轮船和火车)、医疗设备、运动设备、民用建筑等。CAE技术的应用需要完成计算量大和复杂的计算任务,需要性能越来越高的计算机系统和复杂的应用软件,形成了规模巨大的基于64位系统的CAE市场。根据IDC的统计,CAE在HPC各分支中市场份额仅次于生命科学位居第二,到达6亿美元以上,年增长率到达7.3%。随着基于超级计算机的并行处理计算、网络和网格技术的开展,CAE技术逐步于传统的CAD技术融合在一起,向一体化、虚拟化和协作化的方向开展,成为HPC开展最快的分支之一。HP在CAE市场中居领先地位。自从2002年第一代Itanium2上市以来,所有一流的开发CAE软件的ISV厂商都已经全部采用基于Itanium2系统。HP与它们合作,推出了丰富和优化的Itanium2平台上计算机辅助工程HPC解决方案,许多著名的Linu*厂商也与HP合作,例如CAE领域著名的Linu*软件厂商MSC.Linu*,也与HP合作在HP工业标准平台上推出Linu*下的CAE应用软件。目前,HP能够全面提供构造分析、影响分析和流体动力学等三个主要分支许多著名的CAE应用软件,所有这些软件在HP工业标准平台上都表现出领先的性能,满足用户建立各类CAE系统的需要。HP提供全面的CAE关键技术解决方案和针对工业标准平台和集群架构优化的CAE应用软件,受到国内CAE用户的广泛欢送,创造了一系列成功应用实例,充分显示了现代并行计算机在国民经济中应用价值和HP在CAE领域的领先地位。2.1HP基于网络的一体化和虚拟化CAE解决方案当前计算机技术在机械工程的应用已经由传统的计算机辅助设计(CAD)开展到计算机辅助工程(CAE)。传统的CAE又开展成为基于网络的新一代CAE:把模拟和分析技术与CAD技术融为一体、把CAE前处理和后处理结合在一起,创造一个虚拟和智能的产品开发过程。例如:基于模拟的设计:使设计人员在产品实际投产前就能够观察和分析产品,从而加速和优化设计过程;虚拟样机:使用模拟技术对虚拟而不是实际样机进展工程测试;虚拟制造:使用模拟技术来模拟制造过程,从而优化制造过程;HP在多年CAE应用丰富经历的根底上推出了基于网络的CAE解决方案参考架构,利用网络帮助用户把HP领先的集群、效劳器、客户机、应用软件结合在一起,为用户建立CAD和CAE一体化、能够实现虚拟化设计和制造的提供强大、可靠和可伸缩平台。HP的CAE网络能够把与设计、制造有关的各种工程技术人员组成一个虚拟的协作网络,围绕设计工程分工协作。这一协作网络还具有交互功能:设计者可以通过网络观察根据原设计“生产〞出来的虚拟样机,并进展修改。这一过程周而复始,直至获得满足的结果,再投入正式生产。这样可以大大提高设计效率、加速新产品上市,产生巨大的经济效益。HP领先的CAE参考架构和丰富的系统平台和应用软件相结合,使得HP能够为CAE用户提供具有网络时代风格新一代的一体化CAE解决方案,大大提高设计水平,全面满足CAE各个应用领域的需要。2.2HP全面和丰富的CAE应用软件当前CAE应用软件主要分为:构造分析〔大多使用有限元分析〕、影响分析〔如汽车冲击影响分析等〕和计算流动动力学〔如飞机和水流的流体动力学等〕。在现代的CAE应用软件中,这三方面的软件也可以结合在一起构成高效的设计链。下表说明这三类应用的特点。三类主要的CAE应用CAE领域构造分析影响分析计算流体动力学并行方式SMPSMP(MPI)MPI可伸缩性1-8CPU2-16CPU4-128CPU最适用的硬件平台运行HP-U*或Linu*的Integrity效劳器效劳器或集群系统集群系统通用解决方案SMP架构的基于IPF的Integrity效劳器HP与领先厂商合作,全面提供各个CAE领域的应用软件。其中,有许多软件双方共同合作进展了针对HP工业标准平台特点的优化,提供领先的性能。HP也支持把三者结合在一起的解决方案,如MSC.Linu*的设计链加速器和Ansys的组合解决方案等。HP平台上的有限元分析(FEA)解决方案HP提供基于这一领域中著名的Ansys、MSC.Linu*等厂商软件的有限元分析解决方案,把FEA技术与HP工业标准平台的高性能和性价比结合在一起、应用于解决构造和固体对负载、接触、冲击、温度、电磁和其它环境条件的物理响应的问题,满足飞机和汽车设计、国防和民用工程设计、芯片制造等行业以及国家和大学实验室的需要。HP平台上的计算流体力学(CFD)解决方案HP提供基于这一领域中著名的Fluent、E*A、LTSC、MetapTech等厂商软件的计算流体力学解决方案,把CFD技术与HP工业标准平台的高性能和性价比结合在一起、应用于模拟和仿真流体、热流或材料流,满足航空、航天、汽车制造等行业设计飞机和汽车引擎和外形设计的需要。HP平台上的冲击分析和碰撞模拟解决方案HP提供基于这一领域中著名的ESI、PTC等厂商软件的冲击分析和碰撞模拟解决方案,使用FEA和CFD技术以多种尺寸模拟设计中动态冲击的结果,满足汽车、货车、火车制造行业的需要。这些行业利用车辆和乘客模型进展碰撞模拟,优化车辆的平安性能。许多用户如美国全国汽车碰撞分析中心利用运行Linu*的HP系统研究车辆碰撞对车辆影响的复杂计算机模拟问题、取得了满意的结果。HP平台上的生产过程模拟解决方案HP提供基于这一领域中CEI、CDAdapcoGroup等厂商的生产过程模拟解决方案。把模拟技术应用于制造过程和材料分析,例如金属印制、焊接、融合和压制等过程,使设计者能够优化生产能力和生产过程参数提高产品质量、适用程度和降低本钱。HP平台上设计链加速器解决方案HP与MSC.Linu*合作推出设计链加速器(DCA)解决方案通过为制造厂〔如汽车和飞机工业制造厂〕提供超级的高性能产品开发解决方案改良产品开发。DCA以更高精度和可靠性帮助公司开发基于先进的设计标准销售的产品。它通过从产品设计到正式投产前、进展复杂的模拟,包括计算流体力学〔CFD〕、碰撞和构造模拟,大大减少代价极大的设计错误。DCA解决方案的组成部件包括:HP工作站、效劳器、互联设备、SAN、Linu*操作系统、MSC.Linu*集群发行版本。组合技术解决方案Itanium2平台上基于Ansys公司著名的MultiPhysics软件的组合技术解决方案,把FEA和CFD技术组合在一起分析更加复杂的物理系统。例如,对行驶中汽车周围气流产生的噪声作空气声学分析,对飞机机翼周围气流产生的力对机翼构造影响的分析等。许多著名的FEA和CFD软件厂商如MSC.Software、Fluent、ESI等能够在Itanium2平台上提供把两种技术结合在一起的组合技术解决方案。2.3HP面向CAE的HPC解决方案在中国国内的应用当前,中国工业化开展非常迅速,已经成为了“世界制造中心〞,大局部全球知名的制造企业已在中国开办了工厂,而且中国国内制造业企业开展也非常迅猛,CAE应用市场潜力很大;另一方面,随着制造企业的增多,国内制造业竞争剧烈度不断加剧。任何制造企业都面临着提高产品设计质量和缩短产品的生产周期的问题,CAE以其应用数学模型确保产品设计的合理性、与优化技术组合产生最正确产品设计方案等众多优点,成为现代设计流程的核心和现代设计的聚焦点。在这些因素的综合作用下,中国CAE应用市场开展非常迅速,平均年市场增长率超过10%。HPCAE应用解决方案广泛的可用性,使它们得到中国国内汽车、轮船、飞机、桥梁、化工、医疗设备等领域的青睐,目前在中国也有一大批企业、研究院所和学院运用HPCAE解决方案进展现代工艺设计。例如,军队*研究所选择8CPU的HPIntegrity效劳器作为飞机设计CAE应用软件的硬件平台,运行GridGen,NSAERO和Tecplot等三个模块,进展飞机设计。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江西省电子信息工程学校工作人员招聘考试试题
- 2025江城哈尼族彝族自治县职业高级中学工作人员招聘考试试题
- 城市地下人行通道施工方案
- 2026年智能安防AI人脸识别创新报告
- 2026年制造业领域智能制造技术创新报告
- 智能研修模式中问题导向教学在心理健康教育中的应用与实践教学研究课题报告
- 幼儿园教师观察记录工具使用熟练度影响研究-基于观察记录质量与培训记录关联数据分析
- 2026年数码配件生产管理创新报告
- 2026年生物识别安全技术行业创新报告
- 2025年城市智慧停车管理系统与城市交通一体化可行性研究
- 上海铁路局招聘笔试考什么内容
- 北师大版七年级数学下册-第一章-名校检测题【含答案】
- 浙二医院胸外科护士进修汇报
- DGTJ08-2323-2020 退出民防序列工程处置技术标准
- 党支部书记讲廉洁党课讲稿
- 广东省佛山市华英学校2024-2025学年上学期七年级入学分班考试英语试卷
- 猴痘培训课件
- 施工试验送检方案(3篇)
- YY 0267-2025血液净化体外循环系统血液透析器、血液透析滤过器、血液滤过器及血液浓缩器用体外循环血路/液路
- 2025年四川省泸州市中考英语真题 (原卷版)
- 房屋被淹赔偿合同协议书
评论
0/150
提交评论