高性能计算仿真云平台建设_第1页
高性能计算仿真云平台建设_第2页
高性能计算仿真云平台建设_第3页
高性能计算仿真云平台建设_第4页
高性能计算仿真云平台建设_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Institute of Software,Chinese Academy of Sciences高性能计算云平台建设姚继锋姚继锋中国科学院软件研究所中国科学院软件研究所中科嘉速(北京)并行软件有限公司中科嘉速(北京)并行软件有限公司2012年年6月月29日日 广州广州Institute of Software,Chinese Academy of Sciences提要高性能计算中心建设的必要性高性能计算中心建设与运维建设运维运营从高性能计算到云计算Institute of Software,Chinese Academy of Sciences科研创新的三驾马车物理化学生物医药汽车新型能源海

2、洋工程金融新型材料理论分析飞机计算模拟科研创新观察实验船舶Institute of Software,Chinese Academy of Sciences高性能计算能力是学校科研能力的主要标志之一计算仿真是科研的三大途径之一物理、生物、天文、力学、新材料等众多学科发展高度依赖于高性能计算;几乎所有学科都可以利用计算及仿真技术计算能力至关重要,很多领域科研水平的高低取决于计算能力强弱宇宙学研究(南京大学) 湍流研究(北京大学) 材料机理研究(中国科大) Institute of Software,Chinese Academy of Sciences高性能/高端计算系统理应集中建设聚合建设,提

3、供大规模先进计算资源集约化建设,有限计算资源高效利用Institute of Software,Chinese Academy of Sciences为什么需要高性能计算中心专业的技术和服务团队,高效稳定的运维 用户不愿也很难进行有效的运维 专业技术人员的稀缺是资源中心,更是跨领域的研究创新中心 计算模拟需要多领域的融合 计算中心是最佳的舞台和平台趋势:集中的计算能力、数据及其处理能力 计算中心将是信息分析和处理中心学校/地区竞争力和科研力的象征计算中心时代1990Institute of Software,Chinese Academy of Sciences计算中心的发展网络中心时代199

4、02010PC时代19902010云计算时代2010网络服务数据服务计算服务Institute of Software,Chinese Academy of Sciences计算中心的发展天下大势,分久必合,合久必分Institute of Software,Chinese Academy of Sciences国外主要计算中心的发展1985美国圣地亚哥超算中心1986美国国家超级计算应用中心1989韩国超算中心2001日本东京工业大学GSIC2004巴塞罗那超算中心Institute of Software,Chinese Academy of Sciences国内主要超级计算中心北京,上海

5、,天津,深圳,济南,长沙,广州Institute of Software,Chinese Academy of Sciences国内计算中心建设单位的缺憾国外成功经验表明 建设单位应该是应用单位国家实验室、大学应用专家主导国内情况 政府主导 计算机专家主导高校应当成为我国大规模高性能计算中心建设单位 湖南大学,中山大学Institute of Software,Chinese Academy of Sciences归口和定位谁是婆婆?谁是金主?职责和功能 计算中心、网络中心、信息中心还是其他?建设和运维资金来源?核心问题:是否利于成果产出?是否能持续发展?Institute of Softwa

6、re,Chinese Academy of Sciences提要高性能计算中心建设的必要性高性能计算中心建设与运维建设运维运营从高性能计算到云计算Institute of Software,Chinese Academy of Sciences超算中心系统环境架构 安全,稳定,高速 易用,实用,功能强大内外部互联网络环境运维管理平台高 用 齐全,安全,稳定,可持续计算中心基础设施高性能计算应 应用 用户导向,丰富,高效超 超级计算机系统 统 先进,稳定,可靠,高效运维角度应用角度投资角度售后角度Institute of Software,Chinese Academy of Sciences主

7、机系统考量可靠性、稳定性可管理性兼容性性能及可扩展性可用性价格免费维护期技术支持能力应用支持能力Institute of Software,Chinese Academy of Sciences一次到位,当前投资方式的不足时间用户体验一步到位分步到位时间运营开销一步到位分步到位Institute of Software,Chinese Academy of Sciences高性能计算应用软件配置出发点 面向用户需求 面向系统架构:兼容性和性能 面向建设特点:买对的,买贵的两类应用软件 有源软件 商业软件软件同样是计算中心的资源优势Institute of Software,Chinese Ac

8、ademy of Sciences管理运维和应用平台建设管理员资源管理系统实时监控系统作业管理系统用户管理系统巡检管理系统管理者系统数据统计和分析系统用户数据统计和分析系统使用者作业管理系统数据管理系统可视化系统专业应用平台Institute of Software,Chinese Academy of Sciences人员配备系统技术支持应用技术支持研究开发Institute of Software,Chinese Academy of Sciences核心技术能力系统技术硬件系统电源冷却等支撑技术操作系统并行文件系统存储系统应用支持技术应用移植应用运行和调度应用咨询应用研究并行计算技术应用

9、分析和测评并行应用开发并行应用优化新体系架构技术可视化技术研究能力Institute of Software,Chinese Academy of Sciences提要高性能计算中心建设的必要性高性能计算中心建设与运维建设运维运营从高性能计算到云计算技 术Institute of Software,Chinese Academy of Sciences系统运维管理体系运维管理制度全方位的外围保障人 员管 理 专业、稳定、敬业的维护队伍高效运行的超级计算机系统深入扎实的系统技术严格分级、及时有效故障处理科学有效的主机运行指标严密的安全管理复杂系统环境的深入研究Institute of Softw

10、are,Chinese Academy of Sciences管理示例:应急预案主机房消防应急预案气体喷淋系统启动撤离及处置应急预案超级计算机系统紧急关机操作方法主机房断电应急预案机房空调故障应急预案重大灾难应急处理预案 I级操作:关闭主机系统外围设备II级操作:关闭非重要用户计算节点III级操作:关闭所有用户计算节点(D组)IV级操作:关闭SAN存储设备和LSF服务器V级操作:关闭磁盘阵列和所有存储节点Institute of Software,Chinese Academy of Sciences管理示例:断电关机流程与物业联系供电现状检查主机系统是否正常采取开门、布置应急风扇降温措施并观

11、察温度和供电是 是节点温度超50度30分钟未恢复供电否否否X=1第X级关机操作命令组合X=X+1按主机系统紧急关机操作方法直接拉闸关闭所涉范围所有设备电闸X5UPS低于5分钟否主机系统是否失电否UPS低于20分钟或节点平均温度超50度否是是是善后处理否双路断电操作确认是Institute of Software,Chinese Academy of Sciences技术示例:稳定性考量单点(单节点、单部件)故障发生率互联设备故障发生率系统内部供电部件故障发生率硬件故障致节点更换总次数运行自陷致节点重启总次数运行出错致作业迁移总次数Institute of Software,Chinese Ac

12、ademy of Sciences运维管理系统保障Institute of Software,Chinese Academy of Sciences高效运维要素Institute of Software,Chinese Academy of Sciences提要高性能计算中心建设的必要性高性能计算中心建设与运维建设运维运营从高性能计算到云计算Institute of Software,Chinese Academy of Sciences国际超级计算中心运营日常运营费用及来源(美元/每年)超级计算中心美国圣地亚哥超级计算中心建成时间1985人员规模400设备更新费用来源联邦机构6000万其中2

13、000万来自NSF;其余主要来自联邦机构、州政府的各个研究项目美国国家超级计算应用中心1986500联邦机构超过2000万美元主要来自NSF,部分来自于州政府(700万)、大学及其他联邦机构芬兰科学计算中心1970140中央政府机构5000万其中65%来自教育部,20%来自合作项目,15%来自其他方面瑞士国家超级计算中心199140联邦机构900万其中850万来自联邦机构;仅有50万来自第三方韩国KISTI超级计算中心1988中央政府机构3000万其中1000万来自韩国政府直接拨款;1000万来自与政府部门、高校的研究项目;另外1000万来自其他项目Institute of Software,

14、Chinese Academy of Sciences持续投入:最大的挑战定期建设经费常规运营经费除去基建经费,每年运营约占建设经费的 1/81/5(其中电力和冷却约占1/3)应有常规有效的投资机制Institute of Software,Chinese Academy of SciencesInstitute of Software,Chinese Academy of Sciences提要高性能计算中心建设的必要性高性能计算中心建设与运维建设运维运营从高性能计算到云计算用户网络化Institute of Software,Chinese Academy of Sciences云计算的理解

15、应用程序操作系统应用程序操作系统应用程序操作系统应用程序应用程序操作 操作系统 系统应用服务应用服务应用服务应用服务应用服务硬件虚拟化软件服务化Institute of Software,Chinese Academy of Sciences高性能计算中心是天然的云计算中心昂贵软硬件资源集中部署用户远程共享使用租赁资源而不是采购/建设资源但是 计算虚拟化技术技术不适于高性能计算Institute of Software,Chinese Academy of Sciences高性能计算云平台的核心是软件云计算的核心是平台软件当前缺乏好的平台面向各类用户需求的定制开发,厂商现有产品只能满足部分需求整合高性能计算云平台和其他云服务平台帐

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论