高性能计算机讲义_第1页
高性能计算机讲义_第2页
高性能计算机讲义_第3页
高性能计算机讲义_第4页
高性能计算机讲义_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

21世纪的计算机科学 陈国良国家高性能计算中心 合肥 Email glchen Homepage 国家高性能计算中心 合肥 2 2020 1 5 目录 计算和计算机科学计算科学与计算机科学计算与计算机科学的特点 地位 与作用计算与计算机科学的基本研究内容计算和计算机科学的应用高性能计算学科高性能计算硬件算法软件应用教育与人才培养 建立计算机科学发展的 生态系统 WHAT 什么是计算机科学发展的 生态系统 WHY 为什么要维持平衡的 生态系统 HOW 如何建立计算机科学发展的 生态系统 结论名人名言科学发现与竞争的计算机科学支撑基础简短结论 国家高性能计算中心 合肥 3 2020 1 5 1 计算与计算机科学 1 计算科学定义 计算科学是应用计算能力解决真实问题的一门学科 科学发现的第三支柱 计算科学 理论科学与实验科学并列成为科学发现的三大支柱 该说法已被科学文献广泛引用 并在美国得到国会听证 联邦和私人企业报告和承认 计算机科学直观定义 计算机科学的含意是强调算法和软件 硬件和系统 应用技术基础等 计算科学与计算机科学的关系 计算机科学是计算科学的核心和重要组成部分 两者密切相关 且它们所涵盖的内容有颇多的重叠 1 1计算科学与计算机科学 国家高性能计算中心 合肥 4 2020 1 5 1 计算与计算机科学 2 特点知识强度高 涉及面广 应用面广 无处不在的学科 有益于其它所有研究领域和无政治色彩的中性学科 地位与作用科学发现和人类社会文明进步的第三支柱 具有促进其它学科发展的基础作用 21世纪科学上最重要的和经济上最有前途的研究前沿 有可能通过熟练掌握和运用先进的计算技术科学获得解决 具有解决21世纪重大科学问题的综合作用 有助于研究交叉学科的相互影响 越来越多的新科学发现位于传统学科的交叉之处 而计算科学除了计算外 它能综合地研究这种多学科问题 是21世纪科学与工程发现的最普遍模式 当今科学与工程的特点是计算性和多学科性 计算科学的贡献是通过多学科结合来解决问题 1 2计算和计算机科学的特点 地位与作用 国家高性能计算中心 合肥 5 2020 1 5 1 计算与计算机科学 3 算法与软件计算理论与计算方法 算法设计与分析 算法实现与编程 系统软件 编译和OS 应用软件 开发工具与环境 程序设计和语言 软件工程与技术 硬件与系统定制与商用现成技术 COTS 的高性能微处理器 新型和混合式先进体系结构及其性能评价 I O和存储设备 电源 冷却和封装等 1 3计算和计算机科学基本研究内容 1 国家高性能计算中心 合肥 6 2020 1 5 1 计算与计算机科学 4 应用基础系统建模和计算机模拟 计算数学家 计算机科学家 应用领域专家共同对应用问题建立物理数学模型和施行计算机模拟 网络技术 包括快速 安全地提供计算资源 数据资源 用户接口标准以及异构组网 光网 电网 无线网等 技术 数据分析 管理和可视化 包括各种数据密集型计算应用的数据挖掘 存储 检索 处理 分析 管理和科学计算可视化等 各种常用应用使能 enabling 技术 网格产生 问题求解器 模版与可重用软件等 确保计算科学在不同应用领域中的成功有效应用 1 3计算和计算机科学基本研究内容 2 国家高性能计算中心 合肥 7 2020 1 5 1 计算与计算机科学 5 从传统应用到新兴应用历史上 物理和工程科学是计算和计算机科学应用驱动者 现今 像生物科学 从基于实验发展为基于计算 从个体研究发展为跨学科研究 从注意数值技术发展为生物医学计算方法等 等是计算和计算机科学的受益者 将来 社会科学和人文科学则是计算和计算机科学的主要消费者 1 4计算和计算机科学的应用 1 国家高性能计算中心 合肥 8 2020 1 5 1 计算与计算机科学 6 应用实例社会科学社会经济学 利用宏观经济理论和计算经济学 行为方程 来模拟经济活动 施行动态调整平衡 预测货币政策变化所带来的经济含义 修正改变金融政策来防止经济动荡 社会行为科学 当社会和行为科学家面临巨大的数据需要理解和保护这些数据时 社会科学家和计算科学家加强合作是最有利的 社会科学家可帮助计算科学家理解在社会生态系统中怎样运用计算机科学 行为科学家也能帮助计算机科学家开发良好的人机交互模型 心理学家和语言学家同计算机科学家合作 能联合开发易于理解 使用和语言翻译的计算机程序 等等 主体经济学 通过相互作用主体 包括个体 社会群体 机构 生物实体 物质实体等 动态系统建模来研究经济现象和规律 以达到理解以往的经验和规范作用 定量分析和发展理论以及改进方法等之目的 1 4计算和计算机科学的应用 2 国家高性能计算中心 合肥 9 2020 1 5 1 计算与计算机科学 7 物理科学挖掘资料发现新星球 褐矮星 美国国家虚拟观测站的计算机科学家用计算机搜索 约2分钟 两个天文数据库中数百万天体的资料时发现了它 它是研究人员在演示软件的可行性时无意发现的 是天文界惊人的精确发现 超新星建模 伽利略观察巨大星球爆炸500年后 人们对超新星 比太阳至少大10倍 中心坍塌的爆炸机制仍不清楚 最近许多物理学家和计算科学家用一维 二维 三维程序来模拟此现象 有可能提高对此现象的认识和增加对宇宙特性的理解 暗物质与暗能量 最近宇宙科学家发现宇宙在加速膨胀 这与爱因斯坦广义相对论理论物质行为相反 宇宙科学家猜想 除暗物质外 宇宙也可能包含暗能量 此能量将引力作为排斥力 从而导致加速膨胀 美国芝加哥大学天文学家用扩展版FLASH程序模拟了宇宙的能力 1 4计算和计算机科学的应用 3 国家高性能计算中心 合肥 10 2020 1 5 1 计算与计算机科学 8 工程与制造微气泡和船舶降阻 很久以来 研究人员已经知道其体积约在50 500微米之间的微气泡 在一些情形下可减少船舶80 的阻力 减少燃料消耗 增加航程 但是人们还不能确定最佳微气泡系统的特性 该在哪里加入 加入多少和加入多大的气泡 美国布朗大学通过使用高性能计算机系统 采用新的微气泡计算模型 可降低跟踪少量的微气泡移动来寻找降低阻力的方法 航空系统的高性能计算 在今天的航空中 飞机采用20世纪30年代设计的无线电导航台导航 它沿着固定航线飞行 不能直接地点到点飞行 这导致飞机的源 目的路径要远10 解决此问题的有效办法是使用高性能计算机来实时地预计飞机冲突和调整航班变化 1 4计算和计算机科学的应用 4 国家高性能计算中心 合肥 11 2020 1 5 1 计算与计算机科学 9 生物学解码蜜蜂通信 使用数码录像机记录蜜蜂之间的通信 研究人员发现一些蜜蜂使用声音编码来传达关于食物位置的信息 这种编码能阻止其它的蜜蜂种类拦截此信息 使用数码录像机需要存储和读取巨大的数据量 上万亿位 使用网络系统 便于广布在各地区的科学家们访问和分析记录蜜蜂行为的数以万帧计的录像 以便帮助解释特定种群适应环境的进化 保证种群继续繁荣 蛋白质动力学 以前蛋白质合成物被视为静态的实体 根据在成份之间的直接交互作用来了解生物学的功能 现在基于计算机模拟 蛋白质被视为有效率的分子机器 活跃的动态与它们的结构与功能密切联系 通过在超级计算机上使用并行方法和优化分子动力学程序来更好地理解蛋白质动力学行为 这对蛋白质工程学和改进药物设计等具有广泛的意义 1 4计算和计算机科学的应用 5 国家高性能计算中心 合肥 12 2020 1 5 1 计算与计算机科学 10 国家安全信息情报 它是收集国外敌对势力 组织与个人以及电子通信信息 这些在反间谍活动 反恐怖分子或犯罪活动中能发挥重要作用 在截取 过滤 分析和存储巨大数据方面 超级计算机和并行计算技术具有绝对优势 包括攻克敌人的复杂密码系统 重建和还原不完全和遭受破坏的信息等 解决信息情报问题与解决科学工程问题所使用的计算方法完全不同 传染病传播动态建模 根据遭受的苦难以及所产生的社会与经济后果 传染病对人类和动物的影响是巨大的 借助数学和计算机科学研究传染病的空间和时间传播机制和特征 帮助我们预测 制定和评估控制策略 并通过模拟程序提供虚拟场景 帮助人们面对流行疾病时 应采取的紧急措施和最有效的隔离决策等 强风暴预测 强风暴每年给国家带来的经济损失和人员伤亡是巨大的 由于不准确和缺乏时间性 约有3 4的龙卷风警报被证明是无效的 美国俄克拉荷马州立大学研究人员使用匹兹堡的超级计算机模拟过去所发生的大型龙卷风 首次模拟了整个暴风雨 真实地再现了完整的龙卷风发展过程 1 4计算和计算机科学的应用 6 国家高性能计算中心 合肥 13 2020 1 5 目录 计算和计算机科学计算科学与计算机科学计算与计算机科学的特点 地位 与作用计算与计算机科学的基本研究内容计算和计算机科学的应用高性能计算学科高性能计算硬件算法软件应用教育与人才培养 建立计算机科学发展的 生态系统 WHAT 什么是计算机科学发展的 生态系统 WHY 为什么要维持平衡的 生态系统 HOW 如何建立计算机科学发展的 生态系统 结论名人名言科学发现与竞争的计算机科学支撑基础简短结论 国家高性能计算中心 合肥 14 2020 1 5 2 高性能计算学科 1 高性能计算的含意通俗地讲 高性能计算就是一种性能 包括计算速度 存储容量 通信性能 运算量 计算的复杂程度和计算效率等 很高的一类计算 泛指向量计算 并行计算 分布式网络计算 网格元计算等 高性能计算的类型计算密集型 主要是科学工程数值计算 如大型复杂的科学工程应用问题的计算等 数据密集型 主要是海量数据处理 如数字图书馆 数据仓库 科学计算可视化等 通信密集型 主要是协同计算 如网格服务计算 远程医疗诊断等 2 1高性能计算 1 国家高性能计算中心 合肥 15 2020 1 5 2 高性能计算学科 2 高性能计算的战略意义高性能计算是一个国家的综合实力体现 对国家安全 科学探索 经济建设 国民健康等具有重要的深远的意义 为国家的变革 解决国家级难题 提升竞争力 改善全民生活质量等将会做出积极的贡献 高性能计算发展的主要驱动力以前 国家安全一直是驱动高性能计算工业及其发展的动力 现今 政府和企业界也都开始关注超级计算机研制及其工业的发展 2 1高性能计算 2 国家高性能计算中心 合肥 16 2020 1 5 2 高性能计算学科 3 高性能计算发展的主要障碍认为高性能计算只是花钱而不能投资回报的产业 缺乏能够使用高性能计算或积极探索其潜力的人才 使用目前的高性能计算的硬件 软件 算法 编程工具等方面存在着较大的困难 提高使用高性能计算机效率的要素改善使用高性能计算机的网络环境 加大对计算数学 计算机算法 计算机软件等方面的研究 培训科学计算等方面的专门人才 增加对研究基础设施的投资强度 2 1高性能计算 3 国家高性能计算中心 合肥 17 2020 1 5 2 高性能计算学科 4 美国有关发展高性能计算的建议报告从1982年到2005年 美国国防部 能源部 国家科学院 国家科学基金委以及美国总统信息技术顾问委员会 美国信息技术咨询委员会 美国国家竞争力委员会等提出的有关信息技术和计算机的建议报告中 大都涉及到了高性能超级计算机的内容 2 1高性能计算 4 国家高性能计算中心 合肥 18 2020 1 5 2 高性能计算学科 5 清单 按年代排序 1982年 美国国家科学院 关于科学研究及工程中的大规模计算 1993年 美国国家科学院 从台式计算机到万亿次计算机 充分发挥美国在高性能计算领域领导权 1995年 美国国家科学院 特别工作组关于未来国家科学基金委超级计算中心计划报告 1996年 美国总统信息技术顾问委员会 信息技术研究 为了未来 2000年 美国国家科学院 促使信息技术更好 2001年 美国国家科学院 无处不在 2002年 美国国防部 适用于国家安全部门的高性能计算 2003年 美国能源部 基于科学的大规模模拟 2003年 美国国家科学基金委 通过计算机基础结构变革科学与工程 2003年 美国国家科学基金委 信息时代的知识丢失 2004年 美国国家竞争力委员会 促使美国变革并提高竞争力 2004年 美国跨机构 联邦高端计算计划 高端计算复兴特别工作组 2005年 美国国家科学院 超级计算机未来 2005年 美国总统信息技术顾问委员会 计算科学 确保美国竞争力 2 1高性能计算 5 国家高性能计算中心 合肥 19 2020 1 5 2 高性能计算学科 6 美国发展有关高性能计算的行动计划1993年 美国科学工程技术联邦协调理事会 HPCC HighperformanceComputing Communication GrandChallenge 计划 提出发展万亿次 Tera 1012 计算机计划 1996年 美国能源部和LawrenceLivermore LosAlamos Sandia三大核武器国家实验室 ASIC AcceleratedStrategicComputingInitiative 计划 提出发展千万亿次 Pera 1015 计算机的目标 1997年 HPCC包括了HECC HighEndComputing Communication 被扩展为CIC Computing Information Communication 计划 1998年度的CIC蓝皮书 将千万亿次计算机硬件和软件研制列入了计划中 2002年启动HPCS计划 希望确定未来10到20年超级计算机的体系结构 2 1高性能计算 6 国家高性能计算中心 合肥 20 2020 1 5 2 高性能计算学科 7 历史的回顾 借鉴历史 我们必须长期持久地开展能确保解决杀手应用 速度最快 能力最强的高端计算机系统的研究 建立先进的新型计算机系统原型 美国国防先进研究计划署 DARPA 在20世纪70年代曾资助了ARPAnet和Illiac4阵列计算机项目 取得了历史性成就 20世纪80年代和90年代 美国DARPA布署了新的并行体系结构和先进原型方面的研究 并为美国国家科学基金委 NSF 能源部 DOE 国家航空航天局 NASA 等研究机构提供基础设施和资助在并行算法 软件工具和技术 先进科学应用等方面的研究 遗憾的是 DARPA后来终止了该计划 导致了持续至今的体系结构研究几乎空白 20世纪90年代 当学术界不慎重地宣判向量机退出历史平台时 随后日本研制的向量结构的地球模拟器却连续5次占据了世界高性能计算机500强的首位 我们要认真学习向量机的发展 兴衰历史教训 要得到有效的计算机体系结构 道路是曲折反复的 投资是长久持续的 2 2硬件 1 国家高性能计算中心 合肥 21 2020 1 5 2 高性能计算学科 8 高性能计算机体系结构的发展新趋势进入21世纪后 在2003年11月TOP500排名时 美国弗吉尼亚工学院一群师生采用商用部件花了4个月时间自制了排名第3的系统X 这导致了高性能计算机的 平民化 此后高性能机群系统名声大振 进入21世纪后 从2002年开始一直到2004年6月 世界TOP500排名时 日本并行机向量地球模拟器连续次居榜首 这启示我们 机群和MPP结构不是高性能计算机的最终体系结构 美国从2002年启动了高性能计算系统HPCS HighproductivityComputingSystems 计划 希望确定未来10年甚至20年的高性能计算机体系结构 它以高效能而非峰值计算能力作为评价机器指标 从此开始了高性能计算的一个创新时代 2 2硬件 2 国家高性能计算中心 合肥 22 2020 1 5 2 高性能计算学科 9 高性能计算机工业现状英特网的普及发展和商业计算机的迅速增长 转移了适用于科学工程计算和国家政府需求的高端计算机工业发展的注意力 高端计算机市场太小 无法引起工业界的兴趣 高端计算机的采购量远远小于服务器采购量 高性能计算机工业缺少市场驱动力 总结经验 高性能计算机工业生产 主要是政府行为 而不能过于依赖市场行为 2 2硬件 3 国家高性能计算中心 合肥 23 2020 1 5 2 高性能计算学科 10 计算方法与计算机算法数值计算方法 根据应用问题的数学物理模型 研究求解问题的离散计算原理和方法 侧重于研究计算方法的稳定性 收敛性和求解精度等 计算机算法 在计算机上求解给定应用问题的方法和步骤 通常使用某种程序设计语言 对所设计的算法编程运行在具体的机器上而实现问题的求解 2 3算法 1 国家高性能计算中心 合肥 24 2020 1 5 2 高性能计算学科 11 算法的进展与莫尔定律莫尔定律 Moore sLaw 处理器的性能大约每18个月番一番 它最早是从器件制造工艺的发展中推论而来的 虽不是一个自然规律 但近40年的计算机发展 证实莫尔定律确实非常准确 莫尔定律的限制 莫尔定律的本质是基于器件工艺水平的发展与提高 其受限于处理器的物理性能 算法的作用 面临着常规处理器性能的瓶颈 算法的进展将会成为计算机性能跟上莫尔定律的主要机制 改进算法可使性能的提高大体上等于或超过莫尔定律按硬件性能所预计的性能提高 2 3算法 2 国家高性能计算中心 合肥 25 2020 1 5 2 高性能计算学科 12 并行算法发展的新趋势扩大算法研究范围 近来 算法不仅仅单纯研究其自身的问题 也同时研究其硬件平台和软件支撑技术 形成了 结构 算法 编程 的一体化研究方法 注意和应用领域的结合 当今算法研究更讲究实用 更多地集中在应用领域 生物 化学 社会科学等 的算法研究上 理论研究与实验工作相互补 借助实验的方法来分析 模拟 评价大型复杂的算法 2 3算法 3 国家高性能计算中心 合肥 26 2020 1 5 2 高性能计算学科 13 并行算法研究面临的挑战新型并行计算模型 现有的第一代和第二代并行计算模型已不能准确反映当代的并行计算机特性 能够反映并行机多层次存储和硬件底层多级并行的第三代计算模型尚未完全建立和被采用 大规模并行系统上并行算法的实现 面对成千上万个处理器的并行系统 算法所产生的任务如何分解 映射和调度 大规模并行算法的运行 如何确保成千上万个进程的正确运行 包括执行过程中的监视 查错以及性能优化等 2 3算法 4 国家高性能计算中心 合肥 27 2020 1 5 2 高性能计算学科 14 算法 程序和软件这三个术语在严格意义下是不同的 但在实用中经常被混用 算法 求解问题的原理方法和具体步骤 程序 编程实现算法的若干代码段 软件 求解给定应用问题的一组程序 2 4软件 1 国家高性能计算中心 合肥 28 2020 1 5 2 高性能计算学科 15 科学计算和应用软件存在问题计算科学应用软件的寿命远远大于3 5年的计算机系统生命周期 而当今的科学应用所使用的都是上一代的软件工具 致使传统软件遗留的问题是多方面 长期 难以对其进行改良与修改 缺乏有用的 可靠的 易使用的软件工具 几乎无广泛承认的标准 无具规模的第三方 即计算科学软件公司 造成的后果国家对软件长期投资不足 形成了软件落后于硬件的局面 使得计算机的峰值速度不能充分发挥 造成计算机系统生产率下降 各部门引进硬件的同时 忽视和吝啬配套软件 即使引进了部分应用软件 也缺乏二次开发 造成系统的利用率不高 大型企业缺乏对软件的投资眼光 不愿积极主动参与合作开发商用软件 致使很多科学计算与商用软件市场份额很小 难于竞争市场 软件队伍培养不足致使软件的维护 升级 移植和改造难以进行 安于使用盗版软件 国家自主软件极其脆弱 亟待国家大力扶植 2 4软件 2 国家高性能计算中心 合肥 29 2020 1 5 2 高性能计算学科 16 软件危机程序设计语言 70年代后 编程几乎无多大进展 目前Fortran 50年历史 和C语言 35年历史 仍居主导地位 MPI涉及底层通信细节过多 HPF起初甚狂热 但几年以后变得很冷清 软件的可扩展性 未来的软件必须可扩展到成百上千乃至数以万计的处理器的并行系统上并具有有效的容错能力 这就要求我们必须考虑将软件各个部分之间的网络通信和I O接口设计成为完整的集成系统 软件应能全方位开发硬件的并行性 包括存储层次 I O及通信网络以及硬件底层的多级并行性等 2 4软件 3 国家高性能计算中心 合肥 30 2020 1 5 2 高性能计算学科 17 软件集成算法和软件的整合 当今一个典型的计算机研究和应用人员必须使用不同的软件 程序库 数据库和各种来源的数据分析系统 由于工具的不兼容性妨碍了算法和软件的整合 致使研究人员用来集成不同应用软件花费的时间超过他们自行开发的软件时间 集成软件需要各学科专家团队 任何人都不可能熟练地掌握所有必须的计算机和应用领域知识 包括收集数据 建立模型 设计算法 实现和运行算法 分析和可视化计算结果等 为此必须有一个跨学科的 各有专长的 技能互补的合作团队共同把不同部分整合到一个完整的应用软件系统中去 2 4软件 4 国家高性能计算中心 合肥 31 2020 1 5 2 高性能计算学科 18 传统的科学与工程计算科学工程计算的共性 在过去20年 计算物理是应用的主要驱动力 这类应用具有如下共同特点 应用程序常常由定义在R3 t子空间的一组PDE所描述 多物理模拟的不同物理区域的计算方法各不相同 很多应用均主要集中在大学和研究所 研究侧重点离散化PDE及其相应的线性 非线性方程的求解 强调并行机的速度和问题求解精度 很少关心相关的I O操作 并行化方法与编程模型并行化方法 最常使用区域分解法 编程模型 最常使用数据并行 应用实例计算流体力学 CFD 计算化学 CC 环境科学与能源 水表面模拟 水质量建模 石油和天然气开采 海洋模拟和地震模拟等等 2 5应用 1 国家高性能计算中心 合肥 32 2020 1 5 2 高性能计算学科 19 与社会相关的新兴应用新应用的共性 最近几年 与社会相关的应用急剧增加与传统的计算应用分享市场空间 其共性是 应用问题常常由图来定义 而不是离散的R3空间 计算过程中的交互常是全局性的 而不是通过边界来交换信息的 新出现的应用 无相应的使用经验和成熟的软件 很多应用常集中在与社会相关的国计民生方面 研究侧重点建立诚信机制 包括硬件 软件 人机界面 安全协议的使用等 巨量的数据 而不是科学计算 将是此类应用的主要处理对象 I O是最为关心的 数据的安全 属主 管理等带来一系列技术 法律和人道等问题 应用实例社会安全 交通管理军事应用商业 市场营销 风险投资 股票市场数字图书馆 数据挖掘 Web服务 远程医疗等 2 5应用 2 国家高性能计算中心 合肥 33 2020 1 5 2 高性能计算学科 20 并行应用的若干使能技术网格的产生问题计算求解过程 将物理区域及其边界面离散化为一组点 将点连成网格 给出格点控制方程并计算求解 网格产生过程 将物理空间映射为计算空间 为所有实体表面定义精确数值描述 沿着表面产生合适的网格 网格产生方法 迪卡尔网格法 结构网格法 非结构网格法和通用网格法 网格的映射 为了计算网格映射到一组处理器 可以使用图的剖分技术 网格生成软件 ADMeshversion0 95 方程求解器稠密线性代数算法 LU分解 块算法等 稠密线性代数库 EISPACK LINPACK LAPACK SCALAPACK等 稀疏线性系统 直接与迭代解法 稀疏特征值问题 单向量法 OR算法 子空间投射法等 可重用软件与算法软件和算法的编目分类 方便查找 软件和算法封装成可重用形式 设计模式 函数与库 组件和对象等 可重用主要方法 定义模板 开发MPI通信子和中性数据结构 标准库和组件等 2 5应用 3 国家高性能计算中心 合肥 34 2020 1 5 2 高性能计算学科 21 数据密集型应用及其管理科学发现的新机会科学仪器设备的进步 科学设备精度与分辨率的提高 传感性之类的采集源爆炸式增长 产生了前所未有的大量数据 其存储量估计以每年30 的速率增长 为21世纪的重大科学突破提供了历史性的机会 爆炸式增长的海量数据 像天体物理 每晚将产生超过40T T 1012 字节的数据 高能物理每年将产生数十P P 1015 级字节数据 高分辨率捕获人脑数据很容易超过几十P个字节 社会科学也还在经历同样数据爆炸 挖掘数据资料 计算机科学家在演示软件的可行性时 搜索两个天文数据库中数百万天体资料时发现了褐矮星 这是天天文界的惊人的精确发现 数据的管理建立数据仓库 面对着爆炸式增长的海量数据 为了使其能够符合各界需要 实现共享 国家应该建立国家级的数据仓库 鼓励和资助研究人员把他们的数据和专业软件存入这样的数据仓库 以及提供给遵守任何必须的 约定的安全或保密要求的供应者 协同管理和长期掌管 对于全国性的 乃至国际性的分布式合作产生的各种软件 为了使得数据能够符合现实需要以及被用于科学发现 数据从一开始产生就要施行协同管理和长期掌管 并应提供相应的长期的资助 开发有效的分析工具 面对如此巨大的数据 要处理几P字节的存储文档 没有仰赖高性能计算资源和高效软件的分析工具 就不能及时分析和理解这样的大规模数据集 2 5应用 4 国家高性能计算中心 合肥 35 2020 1 5 2 高性能计算学科 22 数据密集型计算科学数据挖掘 包括挖掘社会科学和行为科学数据 挖掘生物 医学 人脑数据 挖掘网上数据 挖掘商业市场方面的数据等等 数据处理 包括数据提取 确定框架和元数据结构 存储 传输 查询 分析和理解以及计算可视化等 建模与模拟 利用各种数据源完成数据建模和模拟分析 评估运作实验平台 开发综合系统设计 考验市场运作行为等 网格计算 改变传统高性能计算机使用概念 共享分布在不同地理位置的高性能计算机 贵重仪器 数据库等资源 网格计算显示了计算科学在先进研究领域的中心作用 分布在世界各地的科学家均各自计算一部分任务 通过英特网将其结果发至数据管理中心供各地科学家参考和协同计算 使用 在短期内网格计算不能取代高性能计算 更准确地说 网格计算 不如用 数据服务计算 更贴题 2 5应用 5 国家高性能计算中心 合肥 36 2020 1 5 2 高性能计算学科 23 计算机科学自身的问题 服务性与大众化 专业 计算机科学本身也是一门科学 但它会有益于其它所有科学 其本身染有 服务性 色彩 由于计算机科学几乎在现代社会 无处不在 易造成全社会都可兴办的 大众化 专业 淡化了计算机学科自身的特色 削弱了高层次研究型人才的培养 主干学科萎缩 相关学科涉足 计算机科学的主干课目日益萎缩 相关学科涉足者颇多 致使计算机科学小地盘越来越小 所剩下者可能只有 可计算性与计算复杂性 之类的学科了 长此下去 令人担心的是计算机学科会不会变成像今日的 公共数学课 那样 2 6教育与人才培养 1 国家高性能计算中心 合肥 37 2020 1 5 2 高性能计算学科 24 计算机教育的现状传统学科划分 限制了计算机科学研究与教育的有效发展 现今计算机学科一般都设置在数学学科或电子信息学科 而对天地与理化学科 工程技术学科 生物医学学科 社会行为学科以及人文学科等人才培养的需求考虑过少 影响了交叉学科的发展和缺乏多学科人才的培养 专业设置面偏窄 课程内容陈旧 现在的计算机专业设置虽几经修改与补充 但大体框架与80年代的基本一样 而课程内容仍嫌陈旧 很多新出现的 交叉性的 发展中的内容不能被及时反映进去 2 6教育与人才培养 2 国家高性能计算中心 合肥 38 2020 1 5 2 高性能计算学科 25 计算机高端高技术人才缺乏 而低端人才又似过剩 不少计算机人才仅限于计算机的操作和简单使用 而对计算机核心硬件体系结构 系统软件与应用软件 数值与非数值算法 基础设施与支撑技术 交叉研究与应用领域知识 计算机学科发展规划与领导决策等方面的深层次高端人才实在匮乏 从而实质性地影响了计算机学科未来发展与变革 缺乏人才培养专项资金 国家的许多科研项目和基础设施投资项目中 很少为这些浩大的计划提供项目管理人才研究生和博士后教育人才的专项培养资金 形成了 见物不见人 不符 以人为本 的基本国策 大学中形式化的评估 大学中的许多学科 包括计算机学科的发展受制于外部专家的周期性的 走过场的所谓合格评估 缺乏象学科发展定位与优先支持计划 学科长远与动态调整计划 高层次跨学科人才与国家创新人才培养计划 改革教育机制与教育理念等高水平的学科评估 2 6教育与人才培养 3 国家高性能计算中心 合肥 39 2020 1 5 2 高性能计算学科 26 加速培养21世纪计算机科学队伍计算机学科发展缺乏领军人物 在计算机学科发展中 缺乏真正能够在政府 学术界 企业界中具有长远观点的 富有想象力和创新性思维的享有盛誉的资深的计算机领军人物 据说美国现今也不到100位 多学科教育 在大学本科教育阶段 很难实行多学科培养教育计划 但是在大学中应该让更多的学生接触计算机学科 以便在毕业后对该领域有一定的理解 可行的途径是实行 主修 辅修制 和 双学位制 2 6教育与人才培养 4 国家高性能计算中心 合肥 40 2020 1 5 2 高性能计算学科 27 提倡终生学习模式 在大学中 我们希望教员拓展自己计算机科学方面的学识 并鼓励能在他们各自的专业领域中应用计算机科学 施行多学科合作研究与教育 提倡 终生学习模式 以应对不断发展中的计算机科学 选拔与招聘各级计算机学科领导人才 解决当前有能力且愿意担任领导的人才缺乏的途径是 对青年研究人员施行领导人培养计划 有意识 有目的进行在职培养 加强与弘扬公共服务意识 招贤纳士 积极吸引研究人员应聘国家各级公务员 在现有的计算机学科研究生课程中增设项目管理之类课程 培养学生的组织 协调与领导能力 2 6教育与人才培养 5 国家高性能计算中心 合肥 41 2020 1 5 目录 计算和计算机科学计算科学与计算机科学计算与计算机科学的特点 地位 与作用计算与计算机科学的基本研究内容计算和计算机科学的应用高性能计算学科高性能计算硬件算法软件应用教育与人才培养 建立计算机科学发展的 生态系统 WHAT 什么是计算机科学发展的 生态系统 WHY 为什么要维持平衡的 生态系统 HOW 如何建立计算机科学发展的 生态系统 结论名人名言科学发现与竞争的计算机科学支撑基础简短结论 国家高性能计算中心 合肥 42 2020 1 5 3 建立计算机科学发展的 生态系统 1 计算机科学的生态系统包括计算机学科本身的核心部分 支撑性研究基础设施和人才培养等 核心部分硬件 计算机微处理器与体系结构 输入 输出与存储设备 互连网络 供电与冷却系统等 软件 计算机算法 系统软件 应用软件 开发工具与环境等 3 1WHAT 什么是计算机科学发展的 生态系统 ecosystem 1 国家高性能计算中心 合肥 43 2020 1 5 3 建立计算机科学发展的 生态系统 2 基础设施定义 美国国家科学基金会将基础设施定性的描述为 是信息空间的一部分 科学家们可以在那里就 建立新型的科学与工程知识环境组织 推动具有新效能的新方式的研究 组成 包括软件仓库 数据档案 网络环境 中间件 计算服务 数据 信息和知识管理 和可视化服务 用户图形化界面 可视化计算结果 等 人才培养计算机科学知识障碍对学科发展的影响是长久的 全方位的 21世纪计算机科学创新应 以人为本 3 1WHAT 什么是计算机科学发展的 生态系统 ecosystem 2 国家高性能计算中心 合肥 44 2020 1 5 3 建立计算机科学发展的 生态系统 3 自然规律 犹如自然界各物种彼此维持长期的 稳定的生态平衡一样 计算机科学只有保持各种均衡 同步 协调式发展 才能使其兴旺发达起来 任何复杂系统均如此 只有当各部分兴旺才能保持整个系统的繁荣 3 2WHY 为什么需要维持平衡的 生态系统 1 国家高性能计算中心 合肥 45 2020 1 5 3 建立计算机科学发展的 生态系统 4 平衡的计算机科学生态系统软件 软弱 软件和算法不能适应和支持硬件发展速度和应用需求 应用 薄弱 支持软件 enablesoftware 和应用软件以及软件开发工具环境的研究不足 限制了计算机的广泛应用 硬件 过硬 过度追求峰值硬件性能 忽视与计算机科学需求相匹配的体系结构研究 峰值速度在科学应用上的实际发挥不足 人才结构不合理 高层次研究人才不足 强有力的计算机领导者稀少 软件 硬件人才比例失调 各部分投资不平衡 硬件与软件投资不平衡 学术研究与基础设施投资不协调 源头创新与应用集成研究认识不一致 人才培养与基础投资不相称等 3 2WHY 为什么需要维持平衡的 生态系统 2 国家高性能计算中心 合肥 46 2020 1 5 3 建立计算机科学发展的 生态系统 5 生态不平衡的后果 现在计算机科学生态系统的发展是不平衡的 致使 限制了计算机本学科研究人员的创新能力 消弱了计算机系统的生产能力 给那些有赖于计算机科学生态系统健壮性的众多学科的创新造成了负面影响 3 2WHY 为什么需要维持平衡的 生态系统 3 国家高性能计算中心 合肥 47 2020 1 5 3 建立计算机科学发展的 生态系统 6 蓝图的宗旨 计算机科学发展蓝图是指引和支持计算机科学协同研究和世纪创新的最佳方案 将引导国家在算法 软件 硬件 应用和基础设施的均衡投资 确保计算机科学的 动态生态系统 持久与健康发展 蓝图应当不仅重视计算机硬件 软件 数据采集和存储以及网络 而且要重视科学与工程计算 算法 社会和人文学科等应用 蓝图应当不仅要研究和优先考虑的关键技术问题 而且要制订解决这些问题的方案和进度 蓝图应明确政府 学术界和产业界的职责 3 3HOW 如何建立平衡的计算机学科发展 生态系统 国家高性能计算中心 合肥 48 2020 1 5 蓝图的基本组成 为了实现计算机科学的可持续发展 蓝图所规划的内容至少包含以下八个领域 计算机科学教育与培训 包括本科生课程设置 研究生培养计划和专业技术培训等 计算机科学基础设施 包括国家高性能计算中心 软件可持续发展中心 数据和软件仓库以及确保访问中心资源和进行多学科交叉合作的中间件和网络等 计算机算法和软件 包括数值和非数值算 系统软件和应用软件 软件开发工具与环境以及性能评估与分析等 计算机硬件和系统结构 包括定制和商用微处理器 先进计算机系统结构 互连技术 输入 输出和存储设备 电源 冷却封装技术等 网络技术 包括快速和安全地提供计算资源 数据资源 用户接口以及固定和移动地通信硬件 中间件 网络协议和标准等 密集性数据处理 包括各种来源的数据挖掘 采集 传输 存储 处理 分析可视化以及服务与管理等 计算机科学应用基础 包括系统建模 应用实验平台 性能分析工具 科学与工程计算成功应用地使能技术以及某些典型应用案例研究等 3 建立计算机科学发展的 生态系统 7 3 3HOW 如何建立平衡的计算机学科发展 生态系统 国家高性能计算中心 合肥 49 2020 1 5 蓝图的制定与实施蓝图的制定 计算机科学发展蓝图的制订 政府高级领导官员 学术界 研究所和大学 和产业界的计算机科学家要长期筹划 共同参与 分工合作 反复修改 统一协调 蓝图的修订 计算机科学发展蓝图应随着时局的发展 情况变化 要定期不断的更新 重新考虑新时期的发展重点和资金投向 蓝图的实施 业务领导机关负责监促检查蓝图落实情况 定期评审 并与投资挂钩 3 建立计算机科学发展的 生态系统 8 3 3HOW 如何建立平衡的计算机学科发展 生态系统 国家高性能计算中心 合肥 50 2020 1 5 目录 计算和计算机科学计算科学与计算机科学计算与计算机科学的特点 地位 与作用计算与计算机科学的基本研究内容计算和计算机科学的应用高性能计算学科高性能计算硬件算法软件应用教育与人才培养 建立计算机科学发展的 生态系统 WHAT 什么是计算机科学发展的 生态系统 WHY 为什么要维持平衡的 生态系统 HOW 如何建立计算机科学发展的 生态系统 结论名人名言科学发现与竞争的计算机科学支撑基础简短

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论