版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 如何设计一个高性能计算机1.要设计一个高性能计算机,首先我们得了解计算机的基本组成,运算以及运行方式。计算机的基本组成:输入设备,存储器,运算器,控制器,输出设备基本计算模式: 主机/终端, 客户机/服务器,服务器聚集,网格计算,云计算。2.了解计算的基本组成后我们还要知道高性能计算机的概念,从而从一个基本计算机身上,设计出一个高性能计算机。高性能计算机及分类,实现高性能的途径-并行平衡性, 局部性 , 周期隐藏SISD, SIMD, MIMD, MISD, SPMD指令级并行, VLIW, EPIC 流水线, 向量机, PVP, 数组处理机SMP, 紧偶合, 共享存储, Cache 一致性
2、 MPP, 机群,松散偶合, 分布式存储ccNUMA, 计算资源虚拟化3.获得高性能的途径 提高部件性能极其限度: CPU, 内存, 磁盘, 网络 并行处理, 设计优化, 性能优化 开发局部性: 空间局部性, 时间局部性 并行性与局部性的矛盾 周期隐藏(1)计算机-从串行到并行基本的串行计算机结构输入存储中央处理机(CPU)输出运算控制连接总线 4.高性能计算机分类基于体系结构的分类基于访存模式的分类基于指令流/数据流的分类1,机群系统: IA + Linux/NT: 联想深腾1800 系列,性价比高 RISC + Unix: IBM sp 系列,性价比低2,UNIX SMP 小型机: IBM
3、 690,SUN, 商务计算为主, 易编程, 可扩展性差3,(传统)大规模并行机(mpp): T3E,曙光1000 编程不易,曾停止发展 Cray XT系列的Red Storm 重新抬头, TOP10, 原因: 大规模时体积小4, 向量机(传统超级机):CRAY, 银河I 不再单独发展5,向量并行机 : NEC地球模拟器, Cray X1 速度高,效率高, 昂贵, 专用, 非产品化 在世界TOP500份额居第二6, ccNUMA: SGI Qrigin3000, Altix3000 兼顾可扩展性和可编程性7, 专用机: IBM BlueGene, BlueGen/L 解决规模(速度)和体积功耗
4、矛盾5.分类基于指令流/数据流的体系结构指令流(程序流)数据流并行单指令流单数据流(SID): 单计算机 单指令流多数据流(SIMD):数组处理计算机多指令流单数据流(MISD:栈计算机(无实用机)多指令流多数据流(MIMD):MPP, clusterSPMD: 单程序/多数据流, MPP, clusterMPMD: 多程序流/多数据流, 高吞吐(事务处理)6.CPU 芯片发展趋势CPU 芯片最终收敛到两家: Intel, IBM理由: 市场规模决定芯片生存现实:志强/安腾赶上/超过RISC芯片,单 CPU 速度达到每秒100亿次 IBM 采用铜连线、绝缘衬底、Low k 技术 Power6速
5、度超过80亿次/秒 HP/Compaq向INTEL 靠拢,Alpha 停止发展 SUN: 采用志强 SGI: 放弃MIPS, 采用IA64做 Altix 服务器 最终趋势: IA 和 RS6000(IBM Power) 存在和发展 流水线与向量机 7流水线与向量机流水线: pipelines向量处理机: vector processor, 并行向量处理机 (PVP)数组处理机: array processor内存访问流水线消息传递流水线(/message queue)8.网络计算模式1,主机(mainframe)/终端 (1980年代中期年以前) 直接I/O连接或互连网连接 效率高, 开放性,
6、扩充性差,技术复杂2, 客户机/服务器(client/server)(1980年代后期以来) 基于局域网(LAN)或广域网(WAN) 开放、可扩充 难管理 总拥有成本(TCO)高3.大规模并行处理系统结构设计规范系统设计目标: 浮点速度, 字长, 内存总容量, 磁盘总容量, 点-点通信带宽, 等分带宽(bi-section) , 可扩展性, 系统均衡性系统结构: 可扩展分布式(共享?)存储, MIMD/SPMD结点机: 单/SMP, CPU种类与主频, cache, 内存, I/O接口互连网络: 高速网: mesh(2D/3D), Tree, nCUBE; 以太网结点-网络接口: 与高速网对应
7、, 单/双卡, 带宽9.当了解了计算机与高性能计算机的原理与技术的时候,我们就可根据这些理论来进行设计一个高性能计算机。1.大规模并行处理系统结构设计规范(1)系统设计目标: 浮点速度, 字长, 内存总容量, 磁盘总容量, 点-点通信带宽, 等分带宽(bi-section) , 可扩展性, 系统均衡性(2)系统结构: 可扩展分布式(共享?)存储, MIMD/SPMD(3)结点机: 单/SMP, CPU种类与主频, cache, 内存, I/O接口(4)互连网络: 高速网: mesh(2D/3D), Tree, nCUBE; 以太网(5)结点-网络接口: 与高速网对应, 单/双卡, 带宽2.大规
8、模并行处理系统结构设计规范(续(1)I/O: 专用/通用结点机, PCI/专用通道, SAN/NAS外部网络连接: 前端机/客户机操作系统: 结点OS(Unix/Linux/WindowsNT), 并行OS (active message ), 实/虚存, 并行文件系统(2)使用模式: 批处理/交互式, 独占/多用户, client/server, 直接login, 远程host, 网格(3)并行编程环境: 并行优化编译, 库函数, 调试器, PVM/MPI, HPF(4)可视化工具: 并行程序运行可视化, 运行结果可视化3.MPP结构设计规范实例系统设计目标: 浮点速度: 25.6亿次/秒,
9、 32CPU(计算) 内存总容量: 1024MB, 磁盘总容量: 5GB 点点通信带宽: 80MB/秒(双); 等分带宽:480MBS 可扩展性: CPU数, 内存, 磁盘, 通信, I/O 系统结构: MIMD, 分布式内存结点机: 计算结点32个,单CPU, i860, 40MHz, 2指令/clock, 内存32MB; /O结点2个; 服务结点2个互连网络: 2_D mesh, wormhole 机制, 规模: 6 X 6;结点-网络接口: 双向DMA, FIFO, 带宽80MB/秒(双向)4.MPP系统结构设计案例研究: 曙光1000典型的MPP系统: CM5, nCUBE, Para
10、gon, T3D/E/F曙光1000系统总框图计算结点机框图计算结点总线 Mesh 接口: 接收/发送FIFO, 异步收发控制, 代码校验 I/O(服务)结点EISA总线Mesh接口(图): EISA 总线端: 双向DMA(直接内存存取) Mesh端: 接收/发送FIFO, 异步收发控制, 代码校验曙光1000大规模并行处理系统I/O结点服务结点I/O设备前端机4.MPP (Cluster)的通信系统u 通信流程u 通信网络u 路由机制u 路由(寻径)规则u 通信芯片及设计u 消息传递界面MPIu 通信优化 主动消息传送active messaging5.MPP (Cluster)的通信流程M
11、PI并行程序中的 发送(Send )语句状态切换( context switching): 用户态à OS 态Memory copy: (被传数据) 用户空间à系统空间打包启动发送返回用户态MPI并行程序中的 接收(Send )语句查询方式(主动)/中断方式(被动)状态切换( context switching): 用户态à OS 态接受, 解包Memory copy: (已接收的数据)系统空间à用户空间返回用户态Wormhole 路由器设计问题 异步控制逻单元(ACE)如何设计?2, X( Y1,异步前进: 仅当Li+1非锁存数据时, Li才能能发新的
12、申请; 当Li+1锁存时, Li不再锁存同一数据片(往前传)判正负和零, 修改, 剥离;3, 状态机(S0, S1, S2, S3) 和控制逻辑的设计 4, 路由开关设计 消息竞争: 在竞争输出锁存器L3时 发生. 1), 被堵塞: 进入 mesh 时 或拐弯时;前进道路已被占领 2), 随机竞争:异步逻辑无时钟同步,势必造成不确定状态 5.用户级 active message 的实现基本思路:将消息发送接收协议处理由空间移至用户空间2.消息包格式长度Tag 处理程序指针 参数,2,用户级处理程序发送: 用户组包并发送 接收: 抓取消息包并放入计算进程6.用户级 active message 的实现3, 软件层user applica
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于边缘计算的车联网服务故障检测与根因分析
- 浙江省绍兴市柯桥区2026届中考四模英语试题含答案
- 初中九年级地理单元教案:区域认知视域下江西自然地理要素的关联分析与实践应用
- 2026法律科技初创企业对传统律所的竞争压力分析
- 江苏省无锡市重点达标名校2026届中考四模历史试题含解析
- 河北省保定市博野县重点名校2026届中考冲刺卷英语试题含答案
- 2026届广西柳州市五城区重点达标名校中考英语考试模拟冲刺卷含答案
- 卫星遥感农业大数据分析报告
- 智能家居照明技术成熟度分析2025年应用场景与市场前景方案
- 2025年健康医疗投资资金申请策略分析方案
- 2026下半年湖南益阳市资阳区事业单位招聘工作人员16人易考易错模拟试题(共500题)试卷后附参考答案
- 2026浙江杭州市西湖区人民政府西溪街道办事处招聘编外合同制工作人员2人笔试模拟试题及答案解析
- 2026年科目1驾驶技术模拟题库及完整答案详解
- TSG08-2026《特种设备使用管理规则》全面解读课件
- 《2026年化学制药企业安全风险防控专项工作方案》解读
- PDCPD材料可行性研究报告
- 2025-2030中医院行业市场深度分析及竞争格局与投资价值研究报告
- 水利工程监理实施细则范本(2025版水利部)
- 有关PLC的毕业论文
- 员工职位申请表(完整版2026年版)
- 矛盾纠纷排查化解课件
评论
0/150
提交评论