版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
体系化人工智能(Holistic
AI)技术探索02019
20221800900核心技术研发成本高GPT-3大模型训练成本费用成本时间成本460万美元
1
GPU
×
355年定制化、商务、运维成本高典型AI商用定制化项目成本构成日趋泛在的智能化需求和智能化技术赋能成本高之间的矛盾定制化研发部署交付测试售后运维售前解决方案数据采集合同验收需求沟通企业智能化需求持续增长中国移动商用落地的智能化项目数量三年增长100多倍智能化技术赋能成本高日趋泛在的智能化需求提供技术基础性能
降成本
自动化提高定制化任务性能需求复杂、
迭代优化、运营成本数据成本、
算法成本算力成本、
人才成本人工智能的应用弱人工智能(限定领域、人工参与)
(通用领域、
自动化)
强人工智能神经网络架构搜索单模型的通用化
基于AI任务的自动化A
Survey
on
Large
Language
Model
based
Autonomous
AgentsLLM使能的自主智能体自动机器学习LL
M支撑环境适宜:选择环境
,培育环境共性能力:
合理评估AI能力的可达性
,构建可达的共性AI能力业务本身是规模化的:
客户规模
,
经济规模平台化:
实用便捷的工具
,运营运维大屏数字内容推荐甘肃智能客服-服务家庭7600+万户-服务2500万甘肃百姓-观看率提升42%-6000万关系政务知识图谱-单省收入赋能7000+万-事项覆盖率
100%核
心
能
力
个通用能力机器视觉智能数据分析自然语言理解
感知智能⑥网
络
智
能
化
平
台⑦九
天
·
毕
昇
教
育
平
台⑧
城
市
AI
平
台
(合
作
)③
智
能
交
互
平
台④可
视
化
建
模
平
台⑤
智
能
推
荐
平
台①
九
天
深
度
学
习
平
台②九
天
AI
能
力
平
台个人领域(C)10086智能客服-服务10+亿客户-峰值月交互量
2.1
亿次-问题一次解决率94.2%智能语音智能推荐规
模
化
应
用
个
CHBN赋能价值家庭领域(H)政企领域(B)网络领域(N)管理领域(M)网络智能化能力簇预测智能诊断智能
决策智能
控制智能智能基站节电-29
省全网部署-单站减排
300千克/年-单站节电量提升8%-10%智慧党建-服务
16
万党员-知识检索效率提升90%-构建超
5万条知识点数据库平
台
型
产品个服务内部客户服务外部客户赋能价值
服务客户云端能力调用次数边端能力调用次数L1行业大模型L0基础大模型基于体系化人工智能的智力运营结构化数据大模型行业智能化应用视觉大模型语言大模型多模态大模型语音大模型物联网模型数据基础算力基础数据评测网络基础政府治理民生服务通信特色性能评测安全评测工业生产大小模型政务模型医疗模型客服模型能源模型交通模型司法模型网络模型支撑衍
生............基础大模型:
加快构建适用于泛场景的自主可控通用基础大模型
,打造通用智能底座行业大模型:
聚焦供给侧
,加快构建行业大模型
,加速国民经济主体行业的智能化转型升级
,促进我国整体生产力跃升人工智能训推技术服务平台基础设施算
力
网
络
大规模智算中心数据汇聚平台智算引擎九天基础模型测评系统交通运输航
空政
务建
筑能
源通
信冶
金医
疗以九天基础模型为基础
,联合通信、
能源、
航空等行业的骨干企业
,共建共享九天·众擎基座大模型7
+万亿累计调用次数1000+AI能力3700+支撑生产网络问题投诉级联优化通常需要在满足计算、
传输、
安全、
可控性等多项约束前提下
,组合使用多个模型或能力
,包括基础模型、
行业模型或面向特定任务的小模型
,并能够端到端优化服务于业务目标泛AI算力体系化AIOS泛在网络资源提供方AI能力大闭环原子化网络原生可信AI核心能力及模型提供方行业及个人客户大闭环业务可信体系化人工智能(Holistic
AI
,
HAI)
是中国移动研究院九天团队原创技术的攻关方向
,依托泛在的网络和AI算力
,在开放环境中实现对AI能力进行灵活且高效的配置、
调度、
训练和部署
,
以满足日益丰富的数智化业务需求
,
同时确保AI业务可信可控安全
,其主要特征为AI服务大闭环、
AI能力原子化重构、
网络原生AI及安全可信AI。根据智能化业务需求
,按需对AI能力进行调度、配置和运行监控,使其能在最合理的算网资源上运行和服务云/网/边/端/…
GPU/ASIC/
NPU/CPU/…泛AI算力提供方可信AI数据、模型、
能力、
业务的安全可信是体系化人工智能服务的重要基础
,
重点攻关AI服务可追溯、
可互信、
可审计、
抗攻击的基础理论与方法。“大闭环”AI以业务端到端的大闭环优化为目标
,
重点攻关多能力级联与并联优化、
开放动态环境中AI能力优化的基础理论和技术
,从而达到AI产业闭环。AI能力依据高复用、
易调度、
自闭环、
易适配等原则进行原子化拆解和重构。
一个典型的原子化AI能力包含通用智能层、
适配层、接口层
,通用智能层可多个能力共享。
AI原子化重构是体系化人工智能得以实现的基础。网络原生AI将AI能力与算力通过标准化的方式接入网络、
按需调度
,
重点攻关AI模型自动伸缩的理论和机制
,
制定AI计算资源、数据、
模型、
能力、
服务的功能、
流程、
接口和计量的标准
,实现AI能力在网云边端弹性部署、
计算和迭代。1、
“大闭环”(Big
Loop
AI)2、
AI技术原子化重构(Atomized
AI)3、
网络原生(Network
Native
AI)4、
安全可信(Trusted
AI)Standardization&TrustedAIassessment模型服务提供商task
instances
poolVector
DBLong-termmemory能力更新能力空间可追溯、
可计量
HAI
protocol解决方案原子能力区模型算法蒸馏定制区分层次多粒度的原子AI能力市场适配及优化
部署应用模型类1模型类n模型类N服务计量、评估、回收思维链任务分解开放动态环境优化需求1需求n需求N场景类1场景类nHai大模型动态测量评估n
场景类N原子能力区注册需求任务区n行业区功能区nmax
f
(D,M,
A,P,0,E,
S,
F,U,T)s.t.C
(D,M,P,0,E,
S,F,U,T)
≤
c其中:f
是一个复杂的函数,表示体系化人工智能的内部逻辑和流程。数据集
D={d1,
d2,
…,dn
}
,每个数据di
都有一个类型tj
∈{0,1,2,
…,t},表示文本
、
图像和语音等异构数据类型。模型集
M={m1
,m2
,
…,
mk}
,每个模型mi
都有一个类型kj
∈{0,1,2,
…,s},表示分类模型
、预测模型和生成模型等不同模型。原子能力集A
=
{a1,a2,
…,al
}
,ai
是第i个能力,表示语音识别,语音增强,
图像分割,机器翻译等不同的能力。真实环境数据分布集
P={p1,p2,
…,
pn
}
,每个分布pi
都有一个类型qj
∈{0,1,2,
…,q}
,表示高斯分布
、均匀分布和其他复杂分布。原子化评估集
E={e1
,e2
,
…,ek}
,每个评估ei
都有一个指标vj
∈{0,1,2,
…,v}
,
表示不同的评估指标。标准规范入库集
S={s1
,s2
,
…,sk}
,每个入库si
都有一个条件wj
∈{0,1,2,
…,w}
,表示入库准则。真实场景数据漂移集F={f1
,f2
,
…,
fn}
,每个漂移fi
都有一个类型
xi
∈{0,1,2,
…,
x},表示协变量漂移
、先验漂移和概念漂移等。数据传输的演化更新集U={u1,u2
,
…,
uk}
,每个更新ui
都有一个方法
yj
∈{0,1,2,
…,
y}
,表示校准模型
、和主动学习或迁移学习等方式。用户需求服务集T
=
{t1,t2,
…,tz
}
,表示用户提出动态的需求和任务;是一个动态的集合。c为算力存储资源
、
网络资源,
以及数据隐私等各种资源约束阈值;C
表示每个流程中对应消耗和占据的资源函数。考虑体系化人工智能的内部流程和逻辑,
进一步可以将f
分解为以下几个子函数:max
f(g,h,i,
j,k,
l,0)s.t.
C
(g,h,i,
j,k,l,0)
≤
c其中:端到端跨模态异构数据建模:g(D,
M);模型学习机理的优化建模:h(D,M,P,U);模型的原子化表征和建模:
i
(M,E);模型的标准规范入库:j
(M,S);数据漂移的优化建模:
k(D,
P,
F
);模型数据传输的演化更新:
l(M,F,
U);运行架构优化建模:0
(A,T
,
c),如何在资源约束和安全可信的前提下的完成整体业务流程。n
端到端优化n
基于大模型的调度体系n
原子化模型介绍模型的类型(通用型
,特定任务型)
,模型结构及参
数量,应用领域
,模态
,构建时长及机构功能描述主要完成的功能描述和列表输入输出输入输出样例可以是一对多
,一对一
,多对一等组合接口模型的前向和后向接口及信息适配器适配器选择性能准确率性能
,准确率
,及测试方法约束应用环境的约束条件。原则(1)重用度高(2)输入输出清晰
,功能清晰(3)不过于细小导致模型协同成本高于计算成本(4)适合于独立攻关(5)和基础模型能力互补Fig1.体系化原子模型示意图
(HAI
Atomic
Model
,
HAI-AM)其中绿色部分为其中一条可能的路径
Automatic
Mask
Pruning(AMP):automaticallyidentifytask-specificfilters/nodesfordifferenttasks
in
the
pre-trained
model.
applythe
Log
Expected
Empirical
Prediction(LEEP)
which
is
usedtoevaluatethetransferabilityofrepresentations
learned
bythesourcetasktothe
targettask.
Scalable
MaskSelection
Pruning(SMSP)
:fast-
adaptthe
pre-trained
modeltodownstreamtasks.One-Shot
Pruning
for
Fast-adapting
Pre-trained
Models
on
Devices,Haiyan
Zhao
and
Guodong
Long
,arXiv:2307.04365v1基础模型的功能解耦•知识分解
:包含结构分解和表征分解•每个因子网络包含两部分
:通用知识网络(CKN)
和特定任务网络(TSN)•一种新的信息衡量指标-InfoMax
Bottleneck
(IMB)
,使输入和通用特征间互信息最大(最大限度保留大模型的通用知识)
,使不同特定任务特征间互信息最小(使特定任务网络之间尽可能解耦)
。“Factorizing
Knowledge
in
Neural
Networks”,XingyiYang,JingwenYe,XinchaoWang,
ECCV
2022.Decoupleone
ModelintoAtomizednetworks"Generic-to-Specific
Distillationof
MaskedAutoencoders".Wei
Huang,Zhiliang
Peng,Li
Dong,
FuruWei,
&
JianbinJiao,QixiangYe.
(2023).
15996-16005.
10.1109/CVPR52729.2023.01535模型蒸馏h2h3
h4
<EOS>GenDistillerh1
h2
h3
h4layer1layer2
layer3
layer4Teacher
ModelGenDistillerGeneratedInput
f
h1
h2h3
h4EmbeddingPredicted
EmbeddingInputEmbeddingh1
h2
h3
h4
<EOS>DownstreamTasksPredicted
Embeddingh1fWeighted
SumFeature
ExtractorFeature
Extractor田(a)
Distillation
(b)
Downstream
:DistillingPre-trainedLanguageModelsbasedon
GenerativeModels,
Y.Gao,
ShileiZhang,ZihaoCui,
Chao
Deng,Junlan
Feng
*.Archive-2023基础模型的功能蒸馏FrozenT
istheframe
numbers
relatedwiththe
utterance
length,
B
referstothe
batchsize
,Ddenotes
the
featuredimension
,H
refersthe
numbersof
hidden
layersto
be
predicted
plustheoriginalfeature.[H×T,B,D]Distillation
Loss
:DistillingPre-trainedLanguageModelsbasedon
GenerativeModels,
Y.Gao,
ShileiZhang,Zihao
Cui,Chao
Deng,Junlan
Feng
*.Archive-2023Two-dimensionalAttention
Mechanism:基础模型的功能蒸馏n
端到端优化n
基于大模型的调度体系n
原子化参数量和内存消耗大:
适配器、蒸馏、剪枝搜索空间巨大:层级搜索、
免训练(training
free)端到端闭环数据稀疏:
无监督接口复杂:
维度一致、梯度连续"MetaAuxiliary
Learningfor
Low-resourceSpoken
Language
Understanding",YingyingGao,Junlan
Feng*,Chao
Deng,ShileiZhang.
Interspeech2022端到端闭环数据稀疏"Cascaded
Multi-taskAdaptive
Learning
Basedon
NeuralArchitectureSearch",YingyingGao,Shilei
Zhang,Zihao
Cui,
Chao
Deng,Junlan
Feng*.
Interspeech2023参数量大•
多个神经元网络层形成一个功能块•功能相似网络:输入相似时,输出相似•将一个网络分成多个功能块,
相似的功能块形成一个集合,这个集合称为:
等同网络块集合"Deep
Model
Reassembly",Xingyi
Yang
,etc.
NeurIPS2022Fuse
Multiple
Models
intoonetarget
model“Stichable
Neural
Networks”,Zizheng
PanJianfei
Cai
BohanZhuang,
Archive-2023Stitch
Multiple
Big
Models
intoonetarget
model网络问题投诉级联优化语音识别+
自然语言理解级联优化【12】InterfacesTop-K:TokenEmbeddingssoftmaxvaluesMatrixmultiply:softmaxoutput
*matrixGumbelsoftmax:smoothdistributionNLUASR"Cascaded
Multi-task
Adaptive
Learning
Basedon
Neural
ArchitectureSearch",Y.Gao,ShileiZhang,Zihao
Cui,Chao
Deng,Junlan
Feng*.
Interspeech2023Fuse
Multiple
Models
intoonetarget
modelCancadethree
models-speechenhancement
,
ASR
,
NLU-with
Bottleneck
Adapter"Cascaded
Multi-task
Adaptive
Learning
Basedon
NeuralArchitectureSearch",Y.Gao,ShileiZhang,ZihaoCui,Chao
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三级锅炉考试题及答案
- 学校网络安全与意识形态安全管理方案
- 药品不良事件监测试题及答案
- 药品检验三基三严考试题库及答案
- 药品生产企业法律法规及质量管理规范岗前培训试题及答案
- 医疗废物收集试题及答案
- 网络助学平台考试试题及答案
- 市数字城管系统改造项目数据普查建库及三维实景影像采集项目实施方案
- 垃圾分类管理制度培训
- 2026年广东南华工商职业学院单招职业技能测试题库(含答案详解)
- 物业小区控烟监督制度
- 2026年郑州市检验检测有限公司公开招聘19人笔试备考题库及答案解析
- 2026年春季安全教育班会记录表(19周):开学安全第一课-启航安全守护新学期
- 多模式镇痛临床实践与应用
- 2026吉林农业大学三江实验室办公室招聘工作人员笔试备考试题及答案解析
- 脑中风科普知识讲座
- 历史试题-汕头市2025-2026学年度普通高中毕业班教学质量监测(含解析)
- 部队食堂制度规范标准
- 妇产科学精准医学:围产期多组学监测与管理
- 二十届中纪委五次全会知识测试题及答案解析
- 2026年沈阳艺考乐理真题及答案
评论
0/150
提交评论