计算机行业专题报告:华为昇腾国产AI算力“扛旗者”_第1页
计算机行业专题报告:华为昇腾国产AI算力“扛旗者”_第2页
计算机行业专题报告:华为昇腾国产AI算力“扛旗者”_第3页
计算机行业专题报告:华为昇腾国产AI算力“扛旗者”_第4页
计算机行业专题报告:华为昇腾国产AI算力“扛旗者”_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机行业专题报告:华为昇腾,国产AI算力“扛旗者”1AI算力需求快速提升,未来市场大有可观1.1数据量增长带来算力需求提升,智能算力规模有望快速增长数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。根据白皮书数据显示,从2012年开始的6年中,Al计算的需求增加了30万倍。1)根据IDC测算,国内智能算力规模正在高速增长,2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS。2021-2026年期间,预计中国智能算力规模年复合增长率达52.3%。2)通用算力规模也正在高速增长,根据IDC测算,2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3EFLOPS。2021-2026年期间,预计中国通用算力规模年复合增长率为18.5%。1.2AI芯片是提供算力的基础,国内市场22-24年增速有望超40%AI包括人工智能芯片、服务器、计算架构、算法及应用等方面,本文主要关注算力层面,即AI芯片和服务器。1)全球市场:全球人工智能技术发展逐渐成熟,数字化基础设施不断建设完善,推动全球人工智能芯片市场高速增长。IDC全球范围调研显示,人工智能芯片搭载率(attachrate)将持续增高。根据Tractica、寒武纪招股书相关数据,全球人工智能芯片2022年市场规模预计约395亿美金,预计到2025年将达到726亿美金,年复合增长率达到22%。2)国内市场:22-24年复合增速有望达到46%。随着大数据的发展和计算能力的提升,根据寒武纪招股书,2022年中国人工智能芯片市场规模预计达368亿元,预计2024年市场规模将达到785亿元,复合增速有望达到46%。AI服务器市场保持快速发展:国内2021年市场规模超300亿元,增速近70%。1)全球市场:根据IDC发布的《全球人工智能市场半年度追踪报告》显示,2021年全球人工智能服务器市场规模达156.3亿美元,约合人民币1045亿元,全球年度人工智能服务器市场首次突破千亿元人民币,同比2020年增速达39%。其中,浪潮信息、戴尔、HPE分别以20.9%、13.0%、9.2%的市占率位列前三,三家厂商总市场份额占比达43.1%。人工智能服务器市场预计将继续高速增长,预计2026年全球人工智能服务器市场规模将达到347.1亿美元,五年复合增长率为17.3%。2)国内市场:根据IDC数据,2021年中国人工智能服务器市场规模达到59.2亿美元,与2020年相比增长68.2%,其中,浪潮信息、新华三、宁畅、安擎、华为等诸多中国厂商正加速推动人工智能基础设施产品的优化更新。预计到2026年,中国人工智能服务器市场规模将达到123.4亿美元。从工作负载角度而言:企业将把精力更多从人工智能训练转移到人工智能推理工作负载上,根据IDC数据,2021年中国数据中心用于推理的服务器的市场份额占比已经过半,达到57.6%,预计到2026年,用于推理的工作负载将达到62.2%。2昇腾生态羽翼渐丰,芯片扛旗者初露锋芒2.1昇腾AI软硬件平台,构建智能世界基石全栈AI软硬产品,覆盖“端边云”。昇腾计算产业凭借着以昇腾AI处理器为核心,通过系列硬件和基础软件构建全栈AI计算基础设施,为各行各业赋能。在硬件方面,包括模块、标卡、小站、服务器、集群等产品形态;在软件层面,包括

异构计算架构、AI框架、应用使能、全流程开发工具链等产品。2.1.1硬件是AI体系的基础,提供强大计算能力基于达芬奇架构的两颗“芯”。2018年10月,代号为310和910的昇腾处理器系列产品推出。1)昇腾310处理器:本质上是人工智能片上系统,主要应用于边缘计算产品和移动端设备等低功耗的领域。该芯片采用12nm制造工艺,最大功耗仅为8W,半精度(FP16)算力可达8TFLOPS,整数精度(INT8)算力可达16TOPS,同时还集成了16通道全高清视频解码器。2)昇腾910处理器:该芯片计算密度大,领先全球,相比于同时代的英伟达TeslaV100GPU还要高出一倍,其主要应用于云端,可以为深度学习的训练算法提供强大算力。在算力方面,昇腾910表现非常出色,半精度(FP16)算力可达320TFLOPS,整数精度(INT8)算力可达640TOPS,功耗只有310W,同时采用了7nm先进工艺进程,支持128通道全高清视频解码。从算力上看,昇腾910和英伟达A100性能基本上相当。行业性能领先的服务器。昇腾AI服务器具有超强算力,适用于中心侧AI推理以及深度学习模型开发和训练场景。1)Atlas800推理服务器(型号:3000):具有高算力和高能效特点。最大可支持8个Atlas300I/VPro,提供强大的实时推理能力,广泛应用于中心侧AI推理场景。2)Atlas800推理服务器(型号:3010):具有灵活配置,适配多项负载特点。最大可支持7个Atlas300I/VPro,广泛应用于中心侧AI推理场景。3)Atlas800训练服务器(型号:9000):具有高算力密度等特点。拥有4颗鲲鹏

920芯片,广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。4)Atlas800训练服务器(型号:9010):具有高算力密度等特点。可提供2.24PFLOPSFP16算力,广泛应用于深度学习模型开发和训练。5)Atals800TA2训练服务器:具有高速带宽等特点。双向互联带宽达392GB/s,广泛应用于深度学习模型开发和训练。6)Atlas500Pro智能边缘服务器:具有易于部署维护和支持云边协同等特点。最大支持3张Atlas300I/VPro推理卡,单卡功耗仅72W,发挥鲲鹏架构多核、低功耗优势,在边缘场景中广泛部署。华为昇腾超强算力推理+训练标卡。训练及推理标卡融合“通用处理器、AICore、编解码”于一体,需要安装到服务器上,通过服务器提供运算和模型,为数据中心提供强劲算力。1)推理卡:包括Atlas300V视频解析卡、Atlas300VPro视频解析卡、Atlas300IPro推理卡、Atlas300IDuo推理卡。其中,Atlas300IDuo推理卡在配置下可以输出整数精度(INT8)达到280TOPS,半精度(FP16)算力达到140TOPS。2)训练卡:主要以Atlas300TPro训练卡(型号:9000)、Atlas300TA2训练卡为主,可广泛应用于智慧城市、智慧交通、智慧园区、智慧金融等诸多AI行业场景。性能领先的训练集群。华为昇腾面向人工智能计算中心等重算力场景,构筑性能领先的训练集群,目前主要包含Atlas900PoD(型号:9000)、Atlas900A2PoD、Atlas900AI集群三种产品,广泛应用于深度学习模型开发和训练。1)Atlas900PoD(型号:9000):可提供20.4PFLOPSFP16算力,能效比最高可达20.4PFLOOPS/46kW,搭载32颗超强算力的鲲鹏920处理器,全节点100G网络互联,可实现高效加速应用。2)Atlas900A2PoD:提供25.6/24PFLOPSFP16算力,最大可拓展至3.2EFLOPS,全节点200G网络互联,能效比可达25.6PFLOPS/47.5kW,具有极致算力密度、极高A级能效、极简交付部署等特点。3)Atlas900AI:其总算力达到256P~1024PFLOPSFP16,相当于50万台高性能PC的计算能力,让人类更高效地探索宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。其他华为昇腾超高算力集成产品。1)开发者套件:Atlas200IDKA2开发者套件开发板集成了昇腾310B处理器,半精度为4TFLOPS@FP16,整数精度可达8TOPS@INT8,功耗为24W。可以直接为开发者提供运算和模型等,能满足视频图像分析、自然语言处理、机器人等多个领域的需求。2)智能小站:Atlas500AI边缘推理小站算力可达10TFLOPS@FP16或20TOPS@INT8,在有盘配置情况下,功耗为44.5W,无盘配置时,功耗32.3W。可独立部署,易于维护和支持云边协同。3)模块:Altas200AI加速模块仅有半张信用卡大小,却能提供22TOPS的INT8算力。具有在边端侧实现人脸识别、图像分类等功能,因此广泛应用于智能摄像机、机器人、无人机等边端侧AI场景。2.1.2软件释放硬件性能,推动AI生态繁荣华为针对AI场景,设计了异构计算架构CANN、AI计算框架MindSpore和第三方适配以及全流程开发工具链MindStudio。本文主要关注CANN、MindSpore和MindStudio。CANN是一种异构计算架构,功能类似英伟达CUDA。CANN位于计算资源层和应用层之间,即芯片使能层,实现了在高性能计算硬件和AI应用之间架起一座桥梁。部署在昇腾服务器,包含统一的编程语言、统一网络构图接口、高性能计算引擎以及算子库。通过AscendCL对外提供Device管理、Context管理、Stream管理、内存管理、模型加载与执行、算子加载与执行、媒体数据处理等API,帮助开发者实现在CANN平台上进行深度学习推理计算、图像预处理、单算子加速计算。在离线推理场景和训练场景都有应用。CANN释放AI硬件的极致性能,其高性能算子库和调优引擎,支撑快速部署神经网络。深度学习框架构建的模型是由一个个计算单元组成,这些计算单元被称为算子,对应着特定的计算逻辑,构成了加速神经网络的基础和核心。CANN支持超过1400个高性能算子,并提供900多种优选模型,并且覆盖了80%的DSL算子,其DSL算子相比业界其他的产品,提升了70%开发效率。正是这些丰富的算子,筑起了澎湃的算力源泉。此外,CANN还提供了新一代智能调优工具AOE,取代了繁琐的手动优化操作,降低了调优的门槛,并提高了调优的效率。以ResNet50网络为例,使用AOE进行调优的效率比上一代工具提升了一倍以上,并且性能提升超过100%。在CANN6.0版本下,模型迁移成功率可达90%。CANN在各领域深受认可。1)在学术领域方面:2022年3月,基于CANN的AI论文PLGAN强势上榜2022CVPR,5月荣获“软件行业示范案例”,12月,在第八届中国国际“互联网+”大学生创新创业大赛中,“基于昇腾算力及CANN的创新应用”突破“互联网+”国赛金奖。2)在科研领域方面:分子动力学模拟服务在CANN的助力下成功商用,AI预测性能达到现有产品的1.5+倍,可预测规模较传统方法提升10000+倍,为光伏材料、新能源电池、半导体材料研究带来巨大的商业应用价值。此外,昇腾AI平台端到端使能蛋白质结构预测基于CANN进行多维度性能优化,使得AI预测效率较Baseline提升2+倍,同时具备长序列推理能力,2022年底已支持3800+长度的蛋白质氨基酸序列,达到业界领先水平。MindSpore是华为推出的支持云边端灵活部署的深度学习框架。人工智能领域的发展,离不开深度学习框架。从2012年以前的Torch、OpenNN等原始深度学习框架的发布,到后面形成了TensorFlow和PyTorch双头垄断,再到现在中国国产框架有了一席之地,深度学习框架市场新品更新不断。2020年,华为研制的MindSpore正式开源,和TensorFlow、PyTorch、飞桨等框架共同为人工智能领域发力。MindSpore帮助开发者孵化出各种AI创新算法和应用,大幅提升效率。在2018年“华为全联接大会“上提出了人工智能面临的十大挑战,其中提到长部署周期,高开发成本、高技术门槛等问题,为了应对这些问题,昇腾MindSpore专注于实现开发友好、运行高效、全场景按需协同三大目标,以有效降低开发门槛。一般而言,开发深度学习软件框架能够把程序员从烦琐细致的具体编程工作中解放出来,从而将主要精力集中在人工智能算法的调优和改进上。昇思MindSpore作为新一代全场景AI框架,亦是如此,同时具有图算融合、分布式并行、企业安全可信等功能,能够实现模型的训练-推理-全场景部署。MindSpore易用性和性能全国领先。根据Omdia发布的2023年《中国人工智能框架市场调研报告》可知,有40%的开发者将“易用性”作为选择框架的首选因素,35%的开发者将”性能“作为选择框架的首选因素。其易用性是指产品被用户使用时,能够被用户理解、学习、使用和吸引用户的能力,易用性是产品的基本自然属性,标志着最终产的可用性和成熟度。MindSpore在易学习低门槛、易开发高效率、问题快速闭环三方面,提升易用性,并且成立了易用性SIG。《中国人工智能框架市场调研报告》中提到,在国外的端到端框架中,开发者认为TensorFlow,PyTorch的易用性更好,而本土框架昇思MindSpore和飞桨PaddlePaddle在易用性方面紧随其后。在端到端人工智能框架性能方面,MindSpore以13%的占比排名第三。MindSpore在全球AI框架使用率方面处于第一梯队。根据Om

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论