版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、低成本高性能计算的实现与测试 昆明理工大学云南省计算机技术应用重点实验室谭伟良2008-11-271实验室介绍 昆明理工大学云南省计算机技术应用重点实验室是云南省在信息技术方向唯一的一所省级重点实验室。目前拥有教授级研究人员19人,中职21人,普通计算机人员80多名。多年来,在社会各界的大力支持下,云南省计算机技术应用重点实验室在承担、完成科研项目方面及实验室的开放运行、队伍建设、培养人才、实验室管理等方面,都取得了不少成绩,其科研的规模和水平均已具备较强的实力。 研究所拥有一个由21台曙光服务器构成的理论峰值每秒超过1万亿次浮点运算能力的高性能计算集群,2台Sun的小型机,4台Sun服务器,
2、4台Dell的服务器,6台HP服务器,7台IBM服务器,台机40台,笔记本15台,拥有四个网络出口:校园网1G,网通150M,电信150M,联通150M。2概要相关介绍环境搭建性能测试心得体会3相关介绍 目前,HPC的应用范围越来越广,除了一些特殊的应用需要高性能计算外,一些如:数据挖掘应用、图像处理业务、基因测序比对处理等领域也越来越需要高性能计算。科学计算领域更快的速度更高的精度更大的范围信息服务领域更好地整合、提高可管理性更高的吞吐率更高的可靠性4低成本高性能计算的产生 一方面是有限的成本投入,一方面是对高性能计算的迫切需要。怎样在这两者之间取得一个平衡点? 因此,构建一个低成本、高性能
3、的解决方案由此产生。6多种结构的比较 结构特性SMPDSMMPPCluster可扩展性最差差强很强易管理性很强很强一般较差网络能力无需网络无需网络很强强并行编程方式共享变量共享变量、消息传递消息传递消息传递价格贵昂贵昂贵较低7硬件环境搭建硬件选购:1)计算节点: 对大量集群环境配置的经验性研究显示小型SMP平台最适合构建HPC集群,并且现在的多核技术已经达到平民化的程度,因此使用多路处理器的节点成为首选。9选用AMD处理器 在很多领域中,需要对大量的数据进行处理。 这种模式对每个节点上的性能及I/O吞吐量提出了很高要求。AMD皓龙处理器的直连架构和超传输总线(HyperTransport)技术
4、,保证了低内存延时和缓存的一致性,避免了系统扩展带来的性能瓶颈,可实现处理器核心之间的高速数据交换,提升节点性能,满足了应用的需求。以及其相对低廉的价格,是搭建一个低成本解决方案的重要因素。(更适合多核单节点的情况)102)网络 一般在大中型集群中,往往会使用InfiniBand,Myrinet等高速网络。但是他们的价格都不菲,针对于小型的集群搭建,使用千兆网络已经能够满足小型集群的网络通讯的需要。11网络比较1213硬件材料清单21台曙光A620r-F服务器每台服务器的主要参数: 2个AMD Opteron 2352 2.1G CPU 4G内存 250G SATA2硬盘 600W 2U单电源
5、 曙光A系列双路主板一台华为千兆交换机若干千兆网线14网络拓扑16实际运行中的机器17考虑因素 考虑到成本与实际环境的因素,我们使用开源软件对我们这个集群进行管理和相关的应用。 因为开源软件自身的局限性,不可能提供很好的集群管理机制。因此在较大规模集群方案中,如果还是使用开源的软件去对集群进行管理,日常的维护工作量就会明显增多。(建议使用专门的集群管理软件:CSM(Linux)、 SUN Cluster 3.0、 DCMM系统监控DCMS集群管理 ) 19软件 系统配置有标准的C、C+、Fortran和Java等主流编译器,将来还要在这基础上安装其它的并行编程环境,如PVM、HPF、OpenM
6、P、串行程序自动并行化工具、并行调试器、并行程序监控工具和并行数学库函数。还可以安装一些针对与某些领域的应用软件,如Accelrys Material Studio材料计算软件等。20开发模式支持串行程序、消息传递程序、SMP多线程程序、HPF数据并行程序、分布式共享虚存等多种编程模型。根据所提供的编程环境,能够很快的进行并行程序的开发。21适用于VO的函数库以及软件数学库:MKL、ACML、GotoBLAS、Atlas、BLAS、FFTW、IMSL 、Lapack 等编程环境:MPICH(MPI)/PVM ,C、C+、Fortran77、Fortran90、 Fortran99等程序的编译器
7、可用软件:MM5大规模天气数值预报模拟软件等其它:Matlab在多核及集群计算机上的并行计算工具箱3.3:Parallel Computing Toolbox 3.322性能测试测试软件:Linpack(hpl 1.0a)测试数学库:GotoBLAS 1.26、Atlas 3.6.0、MKL 10、ACML 4.0。23测试结果根据曙光工程师曹振南先生在如何做Linpack测试及性能优化所提供的思路,进行了相关的测试。分别对单节点,双节点,四节点,八节点,全部节点进行了测试。在单节点上,能达到75%的运算效率,但在多节点上,就达不到这个效率(如:网络因素)。 优化前:总体运算速度达到3000亿
8、次,效率约为22%。 进一步优化:预计总体运算速度会达到7000亿次,效率约为50%24测试结果(续)不同数学库:GotoBLASMKLacmlAtlas不同的MPI:MPI 1 MPI 226测试注意问题因为我们是使用核心是Barceiona的AMD 四核处理器,在使用GotoBLAS数学库时,必须使用最新的1.26版本。使用GotoBLAS数学库测试,在单节点上配置运行测试参数时,只需要配置如下:mpirun np 1 xhpl。则会同时调用8个核心进行计算。而使用其它数学库,要让8核同时进行计算,则需要明确配置8进程,如: mpirun np 8 xhpl 。27优点1.建设成本低廉,运
9、算速度能达到中型计算的规模。2.建设周期短。3.结构易于变化,容易适应需求的改动。因此很容易通过扩展,升级,获得更好的性能。4.目前通过Web进行监控,预计会通过web进行远程管理等工作。5.维护工作量少,运行成本低。29心得1.经过以上的对比,怎样去选择一个合理的方案去搭建一个低价格高性能的集群需要多方面的考虑。2.如果确实需要达到比较大的运算速度,采用更好的网络环境,更多的运算节点和更快的cpu是最直接的方式。303.单台内集成更多的运算核心会得到更好的效果,但是瓶颈在于CPU访问内存的带宽并不能随着CPU个数的增加而有效增长,所以怎样在价格和性能上做一个很好的平衡,将是必须考虑的问题。4.针对于一些高吞吐量的运算来说,I/O瓶颈的也是一个必须
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年首都医科大学附属北京朝阳医院医护人员招聘考试试题附答案详解
- 2026年无锡市精神卫生中心医护人员招聘笔试备考题库及答案详解
- 2026年遂宁市人民医院医护人员招聘考试参考试题及答案详解
- 2026年烟台市中医医院医护人员招聘考试备考试题及答案详解
- 2026年陕西中医药大学附属医院医护人员招聘考试备考试题及答案详解
- 2026年浙江医科大学附属第一医院医护人员招聘考试备考试题及答案详解
- 2026年自贡市第四人民医院医护人员招聘考试备考题库及答案详解
- 2026年玉溪市人民医院医护人员招聘笔试参考题库及答案详解
- 2026年咸宁市中心医院医护人员招聘笔试参考题库及答案详解
- (2026年)消毒供应中心的质量监测制度
- 2026年陕西高速铁路投资有限公司招聘(5人)考试备考题库及答案解析
- 2026年安徽辉隆农资集团股份有限公司社会公开招聘6人笔试备考题库及答案解析
- 水力发电设备防腐涂料施工合同
- 四川省凉山州2022-2023学年五年级下学期数学期末试卷(含答案)
- 汽车保险理赔(第四版)课件 项目7 车险事故车辆损失评估
- 多图中华民族共同体概论课件第十一讲 中华一家与中华民族格局底定(清前中期)根据高等教育出版社教材制作
- 商品和服务税收分类编码解析(45号公告)
- Cook球囊放置操作规程
- 小学道德与法治人教部编版(新)五年级下册(2020)-红军不怕远征难1.0-公开课
- 部编版道德与法治五年级下册期末综合测试卷含答案(共6套)
- 【电气专业】15D501建筑物防雷设施安装
评论
0/150
提交评论