AI大模型研究框架_第1页
AI大模型研究框架_第2页
AI大模型研究框架_第3页
AI大模型研究框架_第4页
AI大模型研究框架_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AI服务器AI01

科学计算大模型ModelArts3.0AI多模态大模型NLP大模型CV大模型盘古大模型MindSpore

1

.2资料来源:2目前我们将迎来科技的重大转折点:

ChatGPT时刻。

而在ChatGPT背后,

不断迭代的GPT系列使得大模型成为当下科技企业

核心竞争力的重要体现,

未来,

大模型将成为AIGC时代的核心支撑。

华为作为国内科技龙头,

2021年发布的盘古大模型有

望在AIGC时代

中引领潮流。

我们将从:

昇腾/鲲鹏→

MindSporeAI框架→

ModelArts→盘古大模型四层架构进行分析:1

AI+•鲲鹏:华为自主芯片→鲲鹏芯片→鲲鹏服务器→

欧拉操作系统→高斯数据库→行业应用向外扩张,构建鲲鹏生态,提供算力支撑。•昇腾:昇腾AI处理器→CANN异构计算架构→

MindSporeAI框架→应用使能→行业应9用,助力打造华为昇腾全栈AI软硬件2

、人工智能框架:

MindSpore高效,

可实现全场景覆盖•CANN:作为华为昇腾AI基础软硬件平台的核心,

CANN向上支持多种AI框架,向下服务AI处理器与编程,助力芯片使能。•MindSpore:是国内首个支持千亿参数大模型训练AI计算框架,最佳匹配昇腾处理器算力,支持终端、边缘、云全场景灵活部署,开创全新的AI编程范式,降低AI开发门槛。3AI

ModelArts强势赋能开发者,

精度效率双提升•为机器学习与深度学习提供海量数据预处理及交互式智能标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能

力,帮助用户快速创建和部署模型,管理全AI工作流。4、盘古大模型:AI落地的重要途径•由NLP大模型、CV大模型、

多模态大模型、

科学计算大模型等多个大模型构成,目前已实现等AI场景落地。建议关注标的:某著名企业、拓维信息、

麒麟信安、

软通动力、常山北明、

海量数据、

润和软件3数据来源:华为云官网,摘要01020304鲲鹏服务器助力满足澎湃算力需求昇腾全栈AI软硬件平台构筑智能世界基石CANN-AI异构计算架构芯片使能MindSpore智能适配盘古大模型ModelArts强势赋能开发者落地场景可覆盖完整产业链多模态大模型科学计算大模型NLP大模型CV大模型AICO

NT

E

NTSAI501

601

AI

→→

→→

1、鲲鹏芯片:鲲鹏920作为低功耗、高性能的Arm处理器,

为鲲鹏服务器主板及整机产品提供芯片支撑,

是鲲鹏生态发展壮大的核心所在,在此基础上,华为进一步开启自主研发芯片,为鲲鹏生态发展奠定坚实基础。2、鲲鹏服务器:华为凭借多年积累的硬件工程能力,打造TaiShan服务器,

使能整个产业链,

进一步构建完整鲲鹏生态。3、欧拉操作系统:作为面向B端的电脑服务器操作系统,华为自主研发的EulerOS,以Linux稳定系统内核为基础,南向支持多样性设备,北向覆盖全场景应用,横向对接鸿蒙,通过能力共享实现生态互通。4、高斯数据库:华为GaussDB是主打政企核心业务负载的金融级分布式数据库,目前已实现助力部分保险及车企数字化转型。5、行业应用:华为以行业聚合应用,通过平台和生态双轮驱动,形成行业应用矩阵,

为众多行业客户提供解决方案。并陆续成立五大军团,不断开发全新应用场景。华为昇腾AI

AI→

CANN→MindSporeAI→→

1Ascend昇腾AI处理器作为基础,

通过模块、

标卡、

小站、

服务器等丰富的产品形态,

打造面向

“端、

边、

“的全栈解决方案,为整个昇腾AI产业的底层核心支撑。2、CANN:作为华为昇腾AI基础软硬件平台的核心,CANN向上支持多种AI框架,

向下服务AI处理器与编程,

以极致性能、极简开发、开放生态为目标,助力昇腾构建全场景人工智能平台。3、

MindSpore:是国内首个支持千亿参数大模型训练AI计算框架,覆盖包含生物医学在内的多个领域。4、应用使能:以昇腾AI处理器→

CANN异构计算架构→

MindSporeAI框架的传导机制,为深度学习、智能边缘以及行业应用解决方案等强势赋能。7数据来源:

昇思官网,鲲鹏:最强算力异构计算服务器行业应用

金融

运营商

…DL

Edge

SDK

MindXMindSpore芯片使能CANNAtlas系列AI训练卡AI推理卡训练服务器D

DM中间件数据库

Gauss

DB盘古大模型的底层算力支撑:昇腾…

能源

金融行业应用芯片自主化

鲲鹏920算力布局01

算力布局=+

制造

某著名企业公共交通交通政府

电力

医疗第三方平台

Mode

l

Arts操作系统

To

B:欧拉服务器

Taishan200全场景A

I框架ToC:

鸿蒙Ta

ishan

100驱动层数据来源:

昇思官网,801

Kunpeng数据来源:

鲲鹏计算产业发展白皮书,9.包含2280E边缘型、1280高密型、2280均衡型、2480高性能型、5280存储型和X6000高密型等产品型号。.基于华为鲲鹏920处理器

,旨在满足数据中心多样性计算需求。.包含2480、

2280和1280等三款高端产品型号。.基于鲲鹏920

3.0GHz高主频处理器

同时集

成三大创新RAS特性

,获得权威安全可信认

证。TaiShan200TaiShan200

Pro高效能计算

.

搭载具有 超强算力

的鲲鹏处理器.

多核计算架构.

高效加速应用开放生态

.

开放计算平台.

支持业界主流软件

.

携手合作伙伴,

共赢计算新生态.

包含2280均衡型和5280存储型等产品型号。.基于鲲鹏916处理器的数据中心服务器

,具有多核高并发、低功耗等计算优势

,适合为大数

据、

分布式存储等应用高效加速。安全

可靠.

处理器及

服务器芯

片全自研.

17年计算工程能

力铸就稳

如泰山品质鲲

器01

TaiShan100数据来源:

鲲鹏社区官网,10分布式存储中间件大数据平台OS数据库01

整机伙伴基础软件伙伴数据来源:

鲲鹏社区官网,云平台1164*910+32*

920形态:47U机柜12芯片:

昇腾310最高算力:

22TOPS数据来源:华为昇腾官网,01

AI数干颗鼻腾910算力:256P

~1024P

FLOPS8*910+4*

920最高算力:

2.24PFLOPS芯片:

异腾910最高算力:

280TFLOPS芯片:异腾310最高算力:

22TOPS

AI集群AI集群基础单元2*

920最高算力:

704TOPS芯片:异腾310最高算力:

88TOPS芯片:

昇腾310最高算力:

22TOPS芯片:

鲲鹏920最高算力:

352TOPSAI服务器

AI集群智能边缘加速卡AI模块AI整机硬件伙伴

应用软件伙伴辅助运营伙伴I

HV硬件伙伴一体机解决方案伙伴01

数据来源:昇腾社区官网,1302CANN

Mindspore14OSSVM

VM

HDC

其他TBEGraph

Executor

AIPPRuntimeHCCLGraph

plierDVPP其他NN库其他CANN:软硬协同释放澎湃算力应用开发接口计算图开发接口AIR算子开发接口TBENN库其他NN库其他Framework

Adapter02数据来源:

华为昇腾官网,AscendCLAOLABLACEATC15Expression

APIAI+数值计算表达融合动静表达统一单机分布式表达统一OpsDatasetTrain/Infer

NumpyN(NPU)CUDA(GPU)Eigen(CPU)oneDNN(CPU)Model

Zoo模型库VisionAudioArmourAI密态AI可信AIInsightSience科学计算电磁仿真/分子模拟/量子计算Extend强化学习/GNN/深度概率编程

…仓颜

Julia异腾计算语言自动微分

自动并行图算融合IR中间表达层Data数据加载数据格式异构加速数据增强02

MindSpore

硬件相关优化量子自动生成二阶优化流水线执行量化/剪

枝/蒸馏函数/OOP编程范式融合NN类型推导

--

plierAI数据来源:华为昇腾官网,ModelHubNLPRec内存优化Runtime16AutoMLMindSpore

模型导入MindSpore

Lite端侧推理端边增量学习Fine-tuning训练等MindSporeExtendMindIRIRMindSporeArmourAI模型导出安全机制MindSporeDevKitMindSpore

Data02

MindSpore

Servinig

云测推理数据来源:

昇腾计算产业发展白皮书,MindSpore

HubInsight

MindSporeMindSpore数据处理调试调优ModelZoo1703AIModelArts18自动驾驶领域

华为云ModelArts基于算法优化、语音质检等途径,有效提升了T3出行司乘安全检测模型的准确率和召回率,

使危险驾驶事件率下降38

.6%,

同时大幅降低模型开发和交付。•驾验领撼:

针对AI算法训练,华为云ModelArts支撑端到端训练效率提升;

分布式多级缓存技术可以将训练时长缩短50%;针对大规模集群训练,拓扑感知调度和动态软路由技术可以提升训练性能30%。

19数据来源:IDC,

华为云03

AI开发平台持续构建大模型训练及推理加速能力云服务方面的竞争优势越发明显ModelArtsD-Plan

s持续领跑机器学习某省市场应用开发全流程技术能力华为云已在已在

上沉淀了个商业领域的优质模型服务和运营等企业运作已成功在已十多个领域实现行业数据参与盘古大模型和天筹解决方案在行业的沉淀了知识计算基于于

项行百业智能升级从算力资源调度三

AIAI了

大行业场景年的技术创新与

持续迭代行商业化落地华为云生态伙伴计划AIAI生让

应用更高•

AI

Gallery资产管理以及提供数据处理支持全流程开发生产线开发生产线游戏等数个覆盖零售项项

根技术大幅提升升

应用的分布式训练互联网领域•

ModelArtsAI

Gallery型部署等次开发效求解器行业的落为

开发带来变革模型管理业务编排起ISV还汇聚了覆盖生产简化开发深耕技术地更简单应用部署模型训练算法开发ModelArtsModelArts应用实华为云MLOps和行业简化开让

落全场景习公有型和天应用部能力等UsecaseD-Plan开发效率服务高效争优开发开发发起行业生产年的历经提供行业加速生产从算业化简单业领型管术创助力销售产管实践计划型训网领企业自动型训医疗20003•机代算算术术术疗处发行次模排售作持持在在实货产市个个个沉地进识以人态加项场例覆幅助训和及历开型为为为业业的的显了了AIAIAIAIAIAIAIAIAIAIAIAIAI••921:•特征工程智能标注团队标注数据来源:华为官网,模型可视化

Notebook在线编码分布式集群

自动学习

预置算法Mindspore

主流AI开发框架AI

ModelArets数据集交易模型交易算法交易自定义镜像精度跟踪模型转换AIGallery在线服务批量服务边缘服务数据筛选数据标注

版本管理PC端开发环境多元网络搜索03异构资源超参搜索模型评估模型库AI应用2AI应用201AI

Gallery,

AI资源无限扩展常见算法、

工具,

AI

Gallery直

达轻松下载、开发更便利算法上传,资源AI资产,高效沉淀和流通MLOps

,

AI全流程生命管理提供各角色无缝协作平台

提升业务价值产出向导式完成AI服务运维和更新

降低运维、

更新门槛实现全流程一键化运行大模型加速AI业务上线训练推理效率指数级增长开发降再降

(月级>>天级)

所需样本显著降低

(万个>>几十)

小样本下,起步精度提升90%03

ModelArts亚实性数据来源:

华为云21视觉质检声音检测可乘安全…………

AI知识慎

天落

求解器AI

MindSporeTensorFlowPytorchRayDeepStreamMediaPipe…

NLP

OCR…

…ModelArts

OS03

ModelArts行业

场景

实例生产排程游对战数据来源:

华为云工艺优化工装识别二维切割出行调度生

产运

营销售服

务2204NLPCV232021

4

盘古NLP大模型:业界首个千亿参数的中文预训练大模型

,在CLUE实现了业界领先。

盘古CV大模型:业

,在

ImageNet上

优势和能力点:兼顾架构+小样本学习能力、微调能力、

集成行业知识的能力更强+以

商业价值驱动研发创新的“实干模式

”大模型+生态化、协同创新过去开发模式

"三高问题"

:开发人员专业性要求高、综合成本高、不可控程度高。需要拥有作为底座的"重型机械"——预训练大模型:提前将知识、数据、训

练成果沉淀到一个模型中,

然后将这个基础释放到产业。盘古大模型核心设计原则:模型大;网络结构强;优秀的泛化能力选择赛道:

NLP+机

觉未来规划:多

+

型一系列挑战:算力资源不足、

行业数据磨合、团队

“超人发挥”物流场景:协助某著名企业构建了“物的银行”——浦慧云

仓.人员行为、货物检测性能提升5-10%,

开发效率提升,

成本降低。落地行业:已在100多个行业场景完成验证,

包括能源、数据来源:华为云

24目前我们处在AI盘古大模型的价值:推动AI的低成本、

可复制。田奇加入华为云-8月:

核心专家加入-9月:

推动立项技术门槛

+

资源门槛多重力量的携手与跨界:产学研的纵向融合

,不同行业领域的横向协同

诞生AI工业化的虹吸效应。"盘古"开天记,

AI落地时零售、金融、工业、医疗、环境、物流等等。而大模型是最有希望将AI042020

3两大门槛:AIAI3

DEST20%首次使用

Encoder-Decoder架构.

小样本学习超越GPT系.

通用知识

x

行业经验.

生成与理解性能领先智能舆情04

智能营销数据来源:

华为云官网,25数据处理模型生成模型优化跨模态检索

跨模态生成

看图说话跨模

索大

态生成

丨看图说话语音识别语音分类任务

语音回归任务业界最大预训练CV模型:30亿参数,10亿级图像判别与生成联合预训练:底层/高层视觉预训练任务通用

100+场景验证:研发成本降低90%小样本学习性能领先:

ImageNet10%标签分类精度业界第一智能巡检智慧物流CV大模型:

分类丨分割

丨检测持续推出多模态大模型预训练

CV大模型04

CV++

亿级图片数据数据来源:

华为云官网,26优化策略:模型并行、数据并行、混

合精度运算、

稀疏

训练等节点并行调度

算法当

用Attention

Cache等技术加快推理速度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论