Lenovo典型解决方案—HPC方案_第1页
Lenovo典型解决方案—HPC方案_第2页
Lenovo典型解决方案—HPC方案_第3页
Lenovo典型解决方案—HPC方案_第4页
Lenovo典型解决方案—HPC方案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、联想高性能计算解决方案2015年9月 Agendan HPC 基本概念n HPC 主要行业应用分析n HPC需求挖掘话术n HPC计算集群的组成和架构n 如何设计HPC计算集群系统什么是HPC?高性能计算(应用角度定义)用计算方法模拟现实应用场景CAE(汽车、航空航天、船舶)EDA(芯片设计单位)气象/气候/海洋预报(气象、海洋、环保)计算物理/化学/材料(大学、科研院所)生命科学(大学、科研院所)地震资料处理与油藏模拟(石油石化)特点数值模拟并行计算Fortran和C语言高性能计算机系统(IT术语)多服务器计算机集群系统,支持计算与IO密集型应用由服务器、存储、网络构建一个整合的计算机系统平

2、台有相应的集群系统管理软件实现资源及应用的统一管理与使用除传统的并行计算类应用外,还可以支持商业计算(如Big Data & Analytics)特点多处理器共同完成一个任务(作业)多用户、多作业很少会使用到数据库及虚拟化技术4地震资料处理油藏模拟分析金融衍生物分析保险精算分析资产负债管理投资风险分析统计分析机械/电子辅助设计过程模拟有限元分析失败风险分析药物研究蛋白质折叠基因工程医疗成像数字媒体渲染高校Web2.0环境科学天气预报新能源高能物理Bandwidth Consumption在线游戏石油石化金融工业制造业 生命科学数字娱乐多媒体政府高校HPC应用领域HPC领域主要应用分析高等教育行

3、业 现状与趋势: 普遍重视院校级计算平台建设 211 高校通用平台建设 各分院专有平台建设中科院各所HPC学科专用平台大数据教学实训平台建设 计算平台集中化 逐渐重视精细化、科学化管理 面临问题: HPC系统交付亟待标准化 需要专业化运维服务 继续优化用户体验 HPC领域主要应用分析 现状与趋势: 国外很活跃,国内在起步。HPC需求增长迅速 (测序设备更新带来基因数据的爆发增长) 用户分布领域广(科研院所、医疗机构、制药机构)中科院 (蛋白质基因所/生物物理所/华大基因/各高校生命科学院)主要模型 NAMD PRAM LogP Amber,CHARMM和Dreiding 数据处理要求时效性 存

4、储需求特别巨大,数据安全性要求高 面临问题:HPC建设经验缺乏,缺乏规划 海量的数据管理无法承担种类繁多的应用软件的优化 生命科学HPC领域主要应用分析环境气象 现状与趋势: HPC需求稳定增长 Power平台逐渐转向x86 从传统的气象海洋行业扩展到环保方面 智能化的数值预报 面临问题:HPC建设规模与需求不匹配 系统建设分散 各地应用水平相差巨大 HPC领域主要应用分析汽车航空 现状与趋势: 远程虚拟可视化技术逐渐成熟 CAD设计与CAE计算统一平台 建设规模相对较小 渗透到制造业的各个环节 面临问题: 应用软件投资巨大 提升许可证利用率,优化软件许 可证管理 HPC资源的需求无法把握,需

5、要HPC使用情况的数据,以便企业科学决策HPC领域主要应用分析石油勘探 现状与趋势: 计算密集,海量计算需求 GPU计算应用比较成熟 以万兆网络互联占据主导 存储IO要求高,尝试闪存阵列 面临问题: 粗放型设备管理方式 存储资源共享不足 项目主导的采购,多集群提升复杂度 HPC需求挖掘话术u 问题一:客户业务与应用最终用户计划用拟建的系统处理哪些业务,或运行什么类型的应用软件?如果客户的应用软件属于下列=类型中的一种,那么该项目就是HPC项目计算机辅助工程 - CAE(汽车、航空航天、船舶的设计单位) 芯片设计或电子设计自动化 - EDA(芯片设计单位) 气象/气候/海洋预报(气象、海洋、环保

6、部门) 计算物理/化学/材料等学科(大学、科研院所) 生命科学(大学、科研院所) 地震资料处理与油藏模拟(石油石化) 关于应用软件的进一步问题可以是:应用软件是否是商业软件(ISV提供)或开源软件,软件的名称是什么?用到哪一种“并行编程”方式,MPI?OpenMP?或者是CUDA?HPC需求挖掘话术u 问题二:客户现有计算机系统的状况已有计算机系统是由哪个厂商提供的?规模如何(server的数量和存储的容量)?如果现有计算机系统由下列厂商提供,并且是由多台server组成的,那就很有可能是HPC系统SGI或Cray曙光(Sugon)或浪潮(Inspur)神威(江南56所)或天河(国防科技大学)

7、其他厂商(HP,DELL,联想,华为)也有可能提供HPC系统u 问题三:拟建系统相关的硬件情况客户拟建的计算机系统是否计划使用下面特殊的硬件? 高速计算网络 InfiniBand或称IB网络Nvidia(英伟达)的GPGPUIntel Xeon PhiHPC需求挖掘话术问题四:拟建系统相关的系统软件情况客户计划如何管理和使用拟建的计算机系统?是否有计划采用下面一些系统软件? 集群系统管理软件 用来统一管理和维护系统所有的软、硬件资源管理与作业调度软件 作业调度管理并行文件系统 高性能的共享文件系统并行计算环境(MPI),以及编译器(特别是使用了Fortran编译器的)问题五:排除HPC可能的问

8、题 客户拟建的系统是否只是用来运行数据库?系统中的server是否采用虚拟化技术?如果上面问题的答案是“Yes”,那么该项目很有可能就不是HPC项目HPC计算集群的组成和架构HPC涉及到的技术l计算机系统体系结构服务器内部存储结构 (Server)网络互联 (InfiniBand)存储 (Storage)GPGPU & Xeon Phil集群系统软件集群系统管理软件 (xCAT, PCM)共享文件系统 (GPFS)资源管理与作业调度软件 (LSF)l并行计算环境编译器 (Intel Compiler)并行库与调试工具 (Platform MPI)数学与科学计算函数库 (MKL)l应用软件物理、

9、化学、材料、生命科学、CAE、油藏模拟、地震资料处理、气象/气候/海洋模式预报l并行程序编写与调优MPI、OpenMP、CUDA/OpenCLHPC计算集群的组成和架构HPC涉及到的知识点FLOPS:浮点运算次数/秒,例如 1G FLOPS即10亿次浮点运算/秒; 1T FLOPS即1万亿次浮点运算/秒Linpack: 国际上最流行的用于测试高性能计算机系统浮点性能的benchmark指标, 通过对高性能计算机采用高斯消元法求解一元 N 次稠密线性代数方程组的测试, 评价高性能计算机的浮点性能。衡量单位为浮点运算每秒(Flops)。理论浮点峰值: 指计算机每秒钟能完成的浮点计算最大次数。包括理

10、论浮点峰值和实测浮点峰值。 理论浮点峰值是该计算机理论上能达到的每秒钟能完成浮点计算最大次数, 它主要是由 CPU 的主频、数量和类型决定的。理论浮点峰值=CPU 主频CPU 每个时钟周期执行浮点运算的次数系统中 CPU 核数CPU每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的下表是目前常用的各种 CPU 的每个时钟周期执行浮点运算的次数。集群效率: 集群效率实测浮点峰值/理论浮点峰值*100%TOP500:世界上计算速度最快的500台超级计算机排名,每年6月和11月发布一次,网址: http:/www.top500.or

11、g TOP100:中国大陆最快的100台高性能计算机排名,每年11月发布一次,网址: http:/ 整体方案OS:Linux/AIX/Microsoft xCAT GPFSC/FortranPlatform 交换机集群软件+=+应用软件HPC计算集群的组成和架构如何设计HPC计算集群系统l计算节点根据应用软件的需求来确定处理器类型,系统架构,操作系统,内存容量;根据用户对系统处理能力的需求来确定浮点运算峰值;根据总体功耗、散热、占地空间需求选择采用刀片,机架式服务器还是高密度服务器;l网络根据应用软件对网络带宽和时延的要求来选择计算网络类型 (Infiniband,10GbE, or GbE)根据节点数量、网络收敛比的要求来设计网络拓扑结构lI/O 系统存储系统的架构(DAS, NAS or FC-SAN)I/O节点的数量,是否采用并行文件系统和数据管理策略l集群软件的选择根据集群规模、用户数量、计算类型以及用户预算等因素,考虑是否推荐功能强

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论