如何设计一个高性能计算机档讲解_第1页
如何设计一个高性能计算机档讲解_第2页
如何设计一个高性能计算机档讲解_第3页
如何设计一个高性能计算机档讲解_第4页
如何设计一个高性能计算机档讲解_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、如何设计一个高性能计算机1要设讣一个高性能计算机,首先我们得了解汁算机的基本组成,运算以及运行方式。计算机的基本组成:输入设备,存储器,运算器,控制器,输出设备 基本计算模式:主机/终端,客户机/服务器,服务器聚集,网格计算,云计算。2. 了解汁算的基本组成后我们还要知道高性能计算机的概念,从而从一个基本讣算机身上, 设计岀一个高性能计算机。高性能计算机及分类,实现高性能的途径并行平衡性,局部性,周期隐藏SISD, SIMD, MIMD, MISD, SPMD指令级并行,VLIW, EPIC流水线,向量机,PVP,数组处理机SMP,紧偶合,共享存储,Cache 一致性MPP,机群,松散偶合,分

2、布式存储ccNUMA.计算资源虚拟化3获得高性能的途径提高部件性能极其限度:CPU.内存,磁盘,网络 并行处理,设计优化,性能优化开发局部性:空间局部性,时间局部性并行性与局部性的矛盾周期隐藏(1)计算机-从串行到并行基本的串行计算机结构4 高性能计算机分类基于体系结构的分类基于访存模式的分类基于指令流/数据流的分类1, 机群系统:IA + Linux/NT:联想深腾1800系列,性价比高RISC+ Unix: IBM sp系列,性价比低2, UNIX SMP 小型机:IBM 690, SUN,商务计算为主,易编程,可扩展性差3, (传统)大规模并行机(mpp): T3E,曙光1000编程不易

3、,曾停止发展Cray XT系列的Red Storm重新抬头,TOP10,原因:大规模时体积小4,向量机(传统超级机):CRAY,银河I不再单独发展5,向量并行机:NEC地球模拟器,Cray XI速度高,效率高,昂贵,专用,非产品化在世界TOP500份额居第二6, ccNUMA; SGI Qrigin3000, Altix3000兼顾可扩展性和可编程性7, 专用机:IBM BlueGene, BliieGen/L解决规模(速度)和体积功耗矛盾5 分类基于指令流/数据流的体系结构指令流(程序流)/数据流并行用捋令流m数据流(SI SD):用C P U计算机单指令流多数据流(SIMD):数组处理计算

4、机多指令流单数据流(MISD:栈计算机(无实用机)多指令流多数据流(MIMD): MPP, clusterSPMD:单程序/多数据流.MPR clusterMPMD:多程序流/多数据渝,高吞吐(事务处理)6.CPU芯片发展趋势CPU芯片最终收敛到两家:Intel IBM 理由:市场规模决定芯片生存 现实:志强/安腾赶上/超过RISC芯片.单CPU速度达到每秒100亿次IBM采用铜连线.绝缘衬底、Lo、vk技术Power6速度超过80亿次/秒HP/Compaq向INTEL靠拢,Alpha停止发展SUN:采用志强SGI:放弃MIPS,采用IA64做.ltix服务器 最终趋势:IA和RS6000 (

5、IBM Power)存在和发展 流水线与向啟机7.流水线与向量机流水线:pipelines向量处理机:vector processor,并行向量处理机(PVP)数组处理机:array processor内存访问流水线消息传递流水线(/message queue)&网络计算模式1,主机(mainframe)/终端(1980年代中期年以前)直接I/O连接或互连网连接效率髙,开放性,扩充性差,技术复杂2,客户机/服务器(client/ser-er)(1980年代后期以来) 基于局域网(LAN)或广域网(WAN) 开放、可扩充难管理总拥有成本(TCO)高3. 大规模并行处理系统结构设计规范系统

6、设计目标:浮点速度,字长,内存总容量,磁盘总容量,点点通信带宽,等分带宽(bisection), 可扩展性,系统均衡性系统结构:可扩展分布式(共享?)存储,MIMD/SPMD结点机:WSMP, CPU种类与主频,cache,内存,1/0接口互连网络:高速网:mesh(2D/3D),Tree,nCUBE;以太网结点网络接口:与高速网对应,单頌卡,带宽9. 当了解了计算机与高性能计算机的原理与技术的时候,我们就可根据这些理 论来进行设计一个高性能计算机。1大规模并行处理系统结构设计规范(1) 系统设计目标:浮点速度,字长,内存总容量,磁盘总容量,点点通信带宽,等分带®(bi-sectio

7、n),可扩展性,系统均衡性(2) 系统结构:可扩展分布式(共享?)存储,MIMD/SPMD(3) 结点机:单/SMP,CPU种类与主频,cache,内存,1/0接口(4) 互连网络:高速网:mesh(2D/3D),Tree,nCl:BE;以太网(5) 结点.网络接口:与高速网对应,单/双卡,带宽2大规模并行处理系统结构设计规范(续(1) I/O:专用/通用结点机,PCI/专用通道,SAN/NAS外部网络连接:前端机/客户机操作系统:结点 OS(Unix/Limix/WindowsNT),并行OS (active message ),实/虚存,并行文件系统(2) 使用模式:批处理/交互式,独占/

8、多用户,client/server,直接login,远程host,网格(3) 并行编程环境:并行优化编译,库函数,调试器,PVM/MPI, HPF(4)可视化工具:并行程序运行可视化,运行结果可视化3 MPP结构设计规范实例系统设计目标:浮点速度:25.6亿次/秒,32CPU(计算)内存总容量:1024MB,磁盘总容量:5GB点一点通信带宽:80MB/秒(双);等分带宽:480MBS可扩展性:CPU数,内存,磁盘,通信,I/O系统结构:MIMD,分布式内存结点机:计算结点32个,单CPU, i860,40MHz, 2指令/dock, 内存32MB;/O结点2个;服务结点2个互连网络:2_D m

9、esh, wormhole机制,规模:6X6;结点网络接口:双向DMA, FIFO,带宽80MB/秒(双向)4.MPP系统结构设计案例研究:曙光1000典型的 MPP 系统:CM5, nCUBE, Paragon, T3D/EVF曙光1000系统总框图计算结点机框图计算结点总线- Mesh接口:接收/发送FIFO,异步收发控制,代码校验1/0(服务)结点EISA总线一Mesh接口(图):EISA总线端:双向DMA(直接内存存取)Mesh端:接收/发送FIFO,异步收发控制,代码校验曙光1000大规模并行处理系统服务I/O结点结点F胡亡|久II'I I I/O设备 前端机4.MPP (C

10、luster)的通信系统通信流程通信网络路由机制路由(寻径)规则通信芯片及设计消息传递界面MPI通信优化一主动消息传送active messaging5.MPP (Cluster)的通信流程MPI并行程序中的发送(Send )语句状态切context switching):用户态 0 OS 态 Memory copy:(被传数据)用户空间0系统空间 打包启动发送返回用户态MPI并行程序中的接收(Send )语句査询方式(主动)/中断方式(被动)状态切换(context switching):用户态0 OS态 接受,解包Memory copy:(已接收的数据)系统空间0用户空间 返回用户态Wor

11、mhole路由器设计问异步控制逻单元(ACE)如何设计?2, X( Yl,异步前进:仅当Li+1非锁存数据时,Li才能能发新的申请;当Li+1锁存时,Li不再锁存 同一数据片(往前传)判正负和零,修改,剥离;3, 状态机(SO,S1,S2,S3)和控制逻辑的设计4, 路由开关设计消息竞争:在竞争输岀锁存器L3时发生.1) ,被堵塞:进入mesh时或拐弯时:前进道路已被占领2) ,随机竞争:异步逻辑无时钟同步,势必造成不确N状态.5用户级active message的实现基本思路:将消息发送/接收协议处理由o s空间移至用户空间2 消息包格式X Y长度Tag处理程序指针参数1 ,6用户级active message的实现3, 软件层user applicationsmessage p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论