超算、存储一体化的深度学习训练服务器工作站硬件配置方案_第1页
超算、存储一体化的深度学习训练服务器工作站硬件配置方案_第2页
超算、存储一体化的深度学习训练服务器工作站硬件配置方案_第3页
超算、存储一体化的深度学习训练服务器工作站硬件配置方案_第4页
超算、存储一体化的深度学习训练服务器工作站硬件配置方案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、超算+存储一体化的深度学习训练服务器/工作站硬件配置方案目录深度学习训练平台与理想计算架构深度神经网络计算特点与硬件配置分析UltraLAB图灵工作站与配置推荐一)深度学习训练平台现状与完美计算架构深度神经网络(DNN)计算数据模型繁多,结构复杂,主流模型含几十个隐含层,每层都在上千上万级的神经元,整个网络更多,其计算量巨大,市场上用于深度学习的训练计算机大致情况,(1)服务器/工作站(支持2、4、8块GPU架构):普遍存在噪音大,无法放置于办公环境,必须放到专门的机房,维护成本高,另外数据存储带宽、延迟、容量也不尽如意(2)分布式集群架构:性能强大,但是开发成本太高,是大多数科研单位无法承受

2、那么问题来了,市场上是否有一个理想产品,弥补上述缺陷,让更多单位都能用的起人工智能AI超级异构计算机El办泊人工智能AI超级异构计算机El办泊静咅环境GPU万廉I00严行砰储曲T卧UltraLABGXM图灵计算工作站是西安坤隆计算机公司2017年上半年推出的、目前市场上一款集GPU超算、海量存储于一体、基于办公静音环境、应用于深度学习(机器学习、人工智能)的AI超级计算机系统。和市面上深度学习计算机系统相比,显著优势:完全处于办公环境(静音级)、不在被噪音所困扰配备基于PCIe总线的海量高速并行存储(最大容量180TB),延迟低,支持最大15个并行读,硬盘io性能大幅提升,性能和管理远超传统的

3、DAS/NAS存储系统配备超级强大的计算能力,最大10个GPU卡,3.82万计算核,单精度浮点120Tflops不需要专门的机房,不占过多空间,维护成本极低不需要作业调度系统,管理难度大幅降低二)深度神经网络计算特点与硬件配置分析市场上大部分GPU计算机(服务器/工作站),重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了,实际情况是,机器硬件配置还需要整体均衡,只有这样这台机器性能才能更好的发挥市场上大部分GPU计算机(服务器/工作站),重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了,实际情况是,机器硬件配置还需要整体均衡,只有这样这台机器性能才能更好的发挥I5I14

4、1mil不敵霍预爱程$竝桩从区存罐氏于.显厚,井计算CPU2幷行荐fit上述图示,深度神经网络计算大致流程,下面通过深度神经网络计算环节,分析核心硬件配置理想要求数据存储要求做深度学习首先需要一个好的存储系统,将历史资料保存起来主要任务:历史数据存储,如:文字、图像、声音、视频、数据库等。性能要求:数据容量:提供足够高的存储能力,读写带宽:多硬盘并行读写架构提高数据读写带宽接口:高带宽,同时延迟低传统解决方式:专门的存储服务器,借助万兆端口访问缺点:带宽不高,对深度学习的数据读取过程时间长(延迟大,两台机器之间数据交换)成本高UltraLAB解决方案:将并行存储直接通过PCIe接口,提供最大1

5、6个硬盘的并行读取,数据量大并行读取要求高,无论是总线还是硬盘并行带宽,都得到加大提升,满足海量数据密集io请求和计算需要CPU要求主要任务:(1)数据从存储系统调入到内存的解压计算(2)GPU计算前的数据预处理(3)运行在代码中写入并读取变量执行指令,如函数调用启动在GPU上函数调用,创建小批量数据启动到GPU的数据传输(4)GPU多卡并行计算前,每个核负责一块卡的所需要的数据并行切分处理和控制(5)求解后数据保存前的压缩计算上述每一类操作基本都是单核计算模式,如果要加速这些过程,唯有提升CPU频率传统解决方式:CPU规格很随意,核数和频率没有任何要求UltraLAB合理推荐:CPU频率:越

6、高越好CPU三级缓存:越大越好CPU核数:比GPU卡数量大(原则:1核对应1卡,核数要有至少2个冗余)GPU要求主要任务:承担深度学习的数据建模计算、运行复杂算法传统架构:提供18块GPUUltraLAB合理推荐:数据带宽:PCIe8x3.0以上数据容量:显存大小也很关键计算匹配:CPU核-GPU卡1对1GPU卡加速:多卡提升并行处理效率内存要求主要任务:存放预处理的数据,待GPU读取处理,中间结果存放UltraLAB合理推荐:数据带宽最大化:单XeonE5v44通道内存,双XeonE5v48通道内存,内存带宽最大化内存容量合理化:大于GPU总显存(三)UltraLABGXM图灵计算工作站介绍

7、与配置推荐针对上述深度学习应用计算特点,UltraLAB图灵工作站具有深度学习最合理硬件配置架构,保证整个机器是一台理想化异构超算系统,完美强大高效还静音,目前提供两种机型:GX480M和GX610M3.1图灵计算工作站技术规格CPU2CPU1针对上述深度学习应用计算特点,UltraLAB图灵工作站具有深度学习最合理硬件配置架构,保证整个机器是一台理想化异构超算系统,完美强大高效还静音,目前提供两种机型:GX480M和GX610M3.1图灵计算工作站技术规格CPU2CPU1量大22袪1=上大SS4O我内百ffiSWTfriS机型机型硬件配置规格CPUGPU内存存储GX480M单CPU架构6核4

8、.5GHz8核4.3GHz10核43GHz最大6块GPU最大256GB并行存储,最大180TBGX610M双Xeon架构2*XeonE52637v4(共计8核3.5GHz)2*XeonE52643v4(共计12核3.4GHz)2*XeonE52667v4(共计16核3.2GHz)最大10块GPU最大1TB并行存储,最大180TB技术规格一览表(1)GX480M技术规格一览表NO主要项技术规格1CPU1颗intel至尊处理器推荐型号:6850KOC(6核4.5GHz)6900KOC(8核4.3GHz)6950XOC(10核4.3GHz)XeonE52687Wv4(12核3.0GHz)2芯片组in

9、telX99+PCH3内存插槽:8个,规格:DDR42400RegECC最大容量:256GB(8根32GB)4GPU卡数量:最大7个接口:PCIE8x3.0GPU种类:NvidiaGeforce、Quadro、TeslaIntelXeonPhi,AMDFirepro备注:散热系统必须是主动式5系统盘数量:2块单盘容量:512GB/1TB/2TB/4TBSSDSATA-6Gbps接口,支持RAID1数据盘数量:16块,单盘容量:4TB/6TB/8TB/10TB/12TBSATA企业级,最大容量180TB(RAID5),PCIe4x2.0接口6光驱DVD刻录7平台型号UltraLABS2AGDT0

10、1PCS电源1600w,数量1个(四块GPU卡)或2个(5个以上)机箱:双塔式机箱尺寸:深度658mm,宽度478mm,咼度674mm输出口:2个千兆以太端口(可选万兆),4个USB3.0口,2个USB2.0,1个VGA口硬盘位:16个3.5”热插拔,最大容量180TBPCI扩展槽:7个PCIe16x8键盘鼠标键盘:104键、有线、USB口,鼠标:1000dpi精度、光电、有线、USB口9曰显示器23”图显(高清,可升降转向,数量2台)10整机优化*2.1自动超频加速优化;*2.2高性能低延迟优化;11操作系统支持Window7/8/10,Windows2008/2012/2016支持Ubun

11、tu全系列12支持深度学习框架NvidiaGPU驱动程序,CUDA,NvidiaDigits,NvidiacuDNNCaffe,Torch,TensorFlow,CNTK,Theano,Chainer,DL4J,MXNet(2)GX610M技术规格一览表NO主要项技术规格1CPU2颗XeonE52600v4推荐型号:XeonE52637v4(4核3.5GHz)XeonE52643v4(6核3.4GHz)XeonE52667v4(8核3.2GHz)XeonE52687Wv4(12核3.0GHz)2芯片组intelC612+PCH3内存插槽:16个,规格:DDR42400RegECC最大容量:1T

12、B(16根64GB)4GPU卡数量:最大10个接口:PCIE8x3.0GPU种类:NvidiaGeforce、Quadro、TeslaIntelXeonPhi,AMDFirepro备注:散热系统必须是主动式5系统盘数量:2块单盘容量:512GB/1TB/2TB/4TBSSDSATA-6Gbps接口支持RAID1数据盘数量:16块,单盘容量4TB/6TB/8TB/10TB/12TBSATA企业级,最大容量180TB(RAID5),PCIe4x2.0接口6光驱DVD刻录7平台型号UltraLABS2AGDT01PCS电源1600w,数量1个(四块GPU卡)或2个(5个以上)机箱:双塔式机箱尺寸:深

13、度658mm,宽度478mm,咼度674mm输出口:2个千兆以太端口(可选万兆)4个USB3.0口,2个USB2.0,1个VGA口硬盘位:16个3.5”热插拔,最大容量180TBPCI扩展槽:10个PCIe8x3.0,1个PCIe4x2.08键盘鼠标键盘:104键、有线、USB口,鼠标:1000dpi精度、光电、有线、USB口9曰显示器23”图显(高清,可升降转向,数量2台)10整机优化*2.1自动超频加速优化:*2.2高性能低延迟优化;11操作系统支持Window7/8/10,Windows2008/2012/2016支持Ubuntu全系列12支持深度NvidiaGPU驱动程序,CUDA,N

14、vidiaDigits.学习框架NvidiacuDNN,Caffe,Torch,TensorFlow,CNTK,Theano,Chainer,DL4J,MXNet3.2产品特点(1)集GPU超算、并行存储于一体的超级训练系统基于办公环境,静音级支持最大10块GPU超算,单精度浮点最大到120Tflops配备高速并行存储(16个盘位),最大180TB容量支持双XeonE5v4高频处理器,加速密集预处理、高强度数据压缩等计算环节拥有CPU+GPU完美的深度学习架构2)预装完整开发工具的硬件系统,帮助快速启动深度学习研究项目基于GPU工作站系统,预装深度学习所需的软件:Nvidia驱动程序,CUDA

15、工具包,cuDNN,开源工具TensorFlow,Cafe,Torch,NVIDIADIGITS等MCJabiFftHYihg3.3深度学习工作站硬件配置参考(1)GX480M机型配置参考(超值型)该机型特点:支持最大到6块GPU卡,CPU的频率达到极致,每个环节保证达到最理想性能,整体配置均衡无死角,满足深度学习训练硬件配置要求NOCPU内存GPU/总显存单精度系统盘并行存储平台售价16850KOC(6核4.5GHz)32GB1块GTX10808GB8Tflops512GBSSD4TB双塔单电4650026850KOC(6核4.5GHz)32GB2块GTX108016GB16Tflops51

16、2GBSSD2*4TB双塔单电5500036850KOC(6核4.5GHz)64GB3块GTX108024GB24Tflops512GBSSD3*4TB双塔单电6750046900KOC(8核4.3GHz)64GB4块GTX108032GB32Tflops1TBSSD28TB双塔单电9800056900KOC(8核4.3GHz)96GB6块GTX1080Ti66GB68Tflops1TBSSD36TB双塔双电148000备注:含双23”高清图显(2)GX610M机型配置参考(高性能型)该机型特点:支持最大到10块GPU卡,CPU的频率和核数达到最大均衡,每个环节保证达到最高性能,整体配置均衡无

17、死角,满足深度学习训练对配置的要求NOCPU内存GPU/总显存单精度浮占八、系统盘并行存储平台售价12*XeonE5v4(8核3.5GHz)64GB4块GTX108032GB33Tflops512GBSSD28TB双塔单电11100022*XeonE5v4(12核3.4GHz)128GB6块GTX1080Ti66GB68Tflops1TBSSD36TB双塔单电18200032*XeonE5v4(12核3.4GHz)192GB8块GTX1080Ti88GB91Tflops1TBSSD44TB双塔双电21500042*XeonE5v4(16核3.2GHz)256GB9块GTX1080Ti99GB1

18、02Tflops1TBSSD60TB双塔双电24800052*XeonE5v4(16核3.2GHz)256GB10块GTX1080Ti110GB113Tflops1TBSSD90TB双塔双电31900062*XeonE5v4(16核3.2GHz)512GB10块QuadroP5000160GB89Tflops2TBSSD120TB双塔双电42800072*XeonE5v4(24核3.0GHz)512GB10块QuadroP6000240GB120Tflops2TBSSD150TB双塔双电775000备注:含双23”高清图显关于GPU计算卡主要型号参考No型号显存(MB)流处理器SP显存带宽(GBs)浮点计算指标TFLOPs(单精度)功耗备注1QuadroP600024GB384043211.98250w显存和性能最大2QuadroP5000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论