版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
陈怡然杜克大学电子与计算机工程系副教授杜克进化智能中心联合主任美国自然科学基金委新型可持续智能计算中心主任制约AI产业发展的硬件瓶颈TheHardwareBottlenecksHinderingDevelopmentofAIIndustry人工智能发展的三次浪潮ENIACUNIVACIIBM7090Pentium
IVIBM360/75CDC7600SDS920DEC-CK-10AppleIISun-2
Sun-3AT&TGlobalyst600PowerTower180eFijitsu
SPARC64
VIIIfx
Gateway-486DX2/66IBMPCMACIIfxIBMPS/290PowerMac8100/80AMD
Athlon
FX-57MacG4DELL340/2GMacG3Intel
Core
2
QX9770第一次兴起Perception,1957
第二次兴起MLP,19862012AlexNet2014GoogleNet2014VGG192015ResNet1522016DenseNet2502012,GTX5802013,GTX780Ti2014,GTX9802015,GTX9802016,GTX1080第三次兴起CNN,2012
GPU相对性能相对网络深度
/1/533/533492.html人工智能应用的硬件要求图灵机和冯∙诺依曼体系结构HeadTape内存计算逻辑单元控制单元计算、存储分离串行计算计算精度高单线程性能受限于所运行指令之间的数据依赖关系内存带宽瓶颈片上功率密度上限现有AI计算芯片2014-2018硬件神经元高速存储,高速互联经典机器学习算法寒武纪2014-2017SP:流式处理器SM:流式多处理器SFU:特殊函数处理器英伟达GPU2014-2017基于算法优化的FPGA神经网络硬件加速器赛灵思深鉴科技2016-2018TPU脉冲阵列混合精度计算部件加速神经网络推断和训练谷歌云TPU服务谷歌TPU一:大容量存储和高密度计算ILSVRC’12:AlexNet8层/1.4G操作ILSVRC’15:ResNet34~152
层/~3.9G操作ILSVRC’14:VGG16~19层/~15.5G操作模型复杂度越来越高剪枝(Pruning)非结构化剪枝结构化剪枝尽可能减少权重数量极大减小存储空间在AlexNet等网络上压缩10x以上剪枝同时维持结构化的存储访问减小存储的同时提高运算速度达到3x左右的速度提升非0值0值无效访问有效访问结构化剪枝CNN:剪除部分通道,缩小卷积核,剪除整层(W.Wenetal.,2016)5.17倍加速低精度量化低精度量化最小化目标:概率正则化
a=b=0.5零偏差最大化偏差低精度神经网络训练参数服务器p'=p+Δp降低通信开销DistBelief
by
Google三值量化降低通信开销WeiWenetal.,CEINIPS,2017截取前截断后三值量化最终结果降低训练的通信开销WeiWenetal.,CEINIPS,2017降低梯度的精度训练加速保证网络模型的精确性生产环境测试:128节点GPU集群;高速互连网络……参数服务器计算节点TernGrad3x训练加速,<2%精确性降低手势识别医疗诊断自动驾驶目标定位机器翻译语音识别二:面向特定领域的架构设计应用场景越来越丰富面向RNN的优化CE隐藏CE输出CE输出CE输出CE输出多功能管理单元(TMU)数据重用内存效率内在并行数据模式转换激活函数近似资源利用定制化PE设计可扩展性相比CPU平台(IntelXeonE5-2630),性能提高16倍,能耗降低60.7倍面向LSTM的优化蓝色条带:LSTM中的隐藏结构结构化稀疏LSTM中的隐藏结构下一层权重xhh
WeiWenetal.,CEIICLR,2018优化后模型性能提升10.59倍面向GAN的优化GANFanChenet.al,CEI,ASPDAC,2018相比于GPU平台,性能提升240倍能效提升94倍三:“云-终端”平台特点不同高安全性低能耗低延迟数据采集终端推理终端训练海量数据存储海量数据处理云端训练及推断高并行高带宽高存储高时延传输安全性移动平台的神经网络训练分布式训练架构传输优化TernGrad1-BitQuantization梯度量化:并行性优化针对不同手机计算能力的查找表移动平台的神经网络推断卷积层优化全连接层优化卷积层计算量巨大全连接层参数巨大系统性能随节点数呈线性提升MobileNets:EfficientConvolutionalNeuralNetworksforMobileVisionApplications
MoDNN:LocaldistributedmobilecomputingsystemforDeepNeuralNetwork四:芯片设计要求高,周期长,成本昂贵/verification-validation-testing-asicsoc-designs-differences/AI加速EDA设计片上系统印刷电路板PCB系统级封装DARPA:24小时无人值守规则检测热点ZhiyaoXieetal.CEI,ICCAD18架构及工艺面临挑战摩尔定律放缓忆阻器(memristor)是一种被动电子元件,被认为是电路的第四种基本元件。忆阻器的特性与神经元突触类似忆阻器单元“三明治”结构上电极金属氧化层下电极矩阵乘运算新型器件—忆阻器交叉开关阵列HPlab,2012神经元突触神经网络忆阻器人工智能芯片20152016.022016.052016.102017.02Testkeys脉冲忆阻器700x700µm2脉冲忆阻器3152x3152µm2ML1SL1SL2TestML2BSBMCLF1LF2脉冲忆阻器2520x2520µm2脉冲忆阻器2520x2520µm2电压忆阻器2847x2471µm2基于忆阻器的加速芯片CNN加速器图加速器相比于GPU平台,性能提升42.5倍能效提升7.17倍相比于GPU平台,性能提升16.01倍能效提升33.82倍Linghaosonget.al,CEI,HPCA,2017Linghaosonget.al,CEI,HPCA,2018适应性(AD)性能(PE)功效(PO)可编程(PR)扩展性(SC)通用硬件平台P.J.Fox,Tech.Report,2013Grafetal,NIPS,2009ASICMisraetal,Neurocomputing,2010可编程硬件Grafetal,NIPS,2009Misraetal,Neurocomputing,2010基于新型器件的可编程设计H.Li,HPEC,20104,DAC,2015NSFIUCRCASICCenterMembersincludefacultyacrossthreeresearchsites:YiranChenCenter/SiteDirectorHai"Helen"LiCenter/SiteCo-DirectorRobertCalderbankKrishChakrabartyXinLiMiroslavPajicChaoliWangPatrickJ.FlynnYiyuShiSiteDirectorSharonHuSiteCo-DirectorDannyChenWalterScheirerMichaelNiemierSiteCo-DirectorQinruQiuSiteDirectorYanzhiWangSiteCo-DirectorChilukuriMohanJaeOhVirPhohaPramodVashneySenemVelipasalarBeiYuBenjaminLeeCenter/SiteCo-DirectorIndustrypartners:TheAlterna
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西老区职业技术学院《卫生法学基础教程》2025-2026学年期末试卷
- 上海立达学院《投资组合管理》2025-2026学年期末试卷
- 上海商学院《交通运输经济法规》2025-2026学年期末试卷
- 忻州师范学院《大学生职业与发展》2025-2026学年期末试卷
- 上海科创职业技术学院《钢筋混凝土结构平面识读与钢筋算量》2025-2026学年期末试卷
- 上海邦德职业技术学院《经济学基础》2025-2026学年期末试卷
- 沈阳农业大学《服务贸易》2025-2026学年期末试卷
- 徐州工程学院《劳动与社会保障法》2025-2026学年期末试卷
- 沈阳药科大学《口腔局部解剖》2025-2026学年期末试卷
- 沈阳医学院《普通教育学》2025-2026学年期末试卷
- 2026广东广州市黄埔区大沙街道招聘编外聘用人员4人备考题库及参考答案详解
- 企业车间绩效考核制度
- 乡镇禁毒举报奖惩制度
- 2026年云南省公务员考试《行政职业能力测验》(省直卷)真题解析
- 医疗服务价格项目立项指南解读辅导2026
- 2026年江西赣州市高三一模高考数学试卷试题(含答案详解)
- 2026创新药licenseout交易模式与价值评估体系
- 抗衰品招商课件
- 全过程造价咨询服务的质量、进度、保密等保证措施
- 2026年高考数学复习讲练测专题04 导数题型全归纳(题型专练)(原卷版)
- 学生介绍班级
评论
0/150
提交评论