人工智能的工业应用课件_第1页
人工智能的工业应用课件_第2页
人工智能的工业应用课件_第3页
人工智能的工业应用课件_第4页
人工智能的工业应用课件_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工智能的工业应用SAMPLE TEXT可扩展的机器学习系统人工智能的兴盛是数据量变大、机器性能提升、并行计算发展的结果Scalable ML System Scalable SystemXT HERE YOU YOUR TEXT HE ADD YOUR数据处理的NE吞ED吐.随着 集群、机器数的增加 而增加智能水平/体验的壁垒、 随着业务/数据的增长而 增加什么是机器学习的可扩展性Scalable?AMPLE TEXT工业大数据需要高VC维模型VC维(Vapnik-Chervonenkis Dimension)又称VC理论;VC维反映了函数集的学习能力,VC维越大则模型或函数越复杂,学习能力

2、就越强;模型一定要与待解决的问题相匹配,如果模型过于简单,而问题本身的复杂度很高,就无法 得到预期的精度可扩展的机器学习系统机器学习数据特征模型工业追求极高的VC维度如何沿着模型走?学术界主导(ICML,NIPS,ICLR)非线性的三把宝剑:Kernel,Boosting,Neural Network模型大部分单机可加载解决数据分布式问题,以及降低系统overhead工业界针对应用定制模型基于思考或者观测得到的假设加入新的模型、结构,以加入更多参数典型案例:伽利略如何沿着模型走?工业界主导(KDD,WWW)模型相对简单粗暴分布式,工程挑战大高效并行并保证快速收敛工业界中一般针对应用定制特征为什

3、么有那么多特征,怎么产生这 些特征如何理解这些特征人工智能爱因斯坦没有免费的午餐定理:不存在万能模型“We show that all algorithms that search for an extremum of a cost function perform exactly the same, when averaged over all possible cost functions. In particular, if algorithm A outperforms algorithm B on some cost functions, then loosely speaking

4、there must exist exactly as many other functions where B outperforms A”- by Wolpert and Macready (1995) in No Free Lunch Theorem所有的机器学习模型都是一个偏置更多的模型假设更简单的模型假设更少的数据更多的数据支持与特征刻画工业界机器学习中并没有免费的午餐,要做出对业务问题合适的选择然而AI还远未普及与Hadoop相比工业界应用机器学习的难题工业界应用机器学习的难题需要AI应用平台Tenserflow,Mxnet,Caffe等工具日趋丰富但是,足够了么?为什么人工智能还

5、没有真的大规模应用到每个企业Hadoop为什么用的人多?先驱知识要求太多能做AI的还是研究/应用机器学习科学家核心机器学习算法平台只降低了一部分门槛更大的应用基础:降门槛 算法效果如何解决特征工程特征工程在工业界是巨大的难关什么是特征工程?现在的平台已经足够了吗?需要对机器学习与业务都非常理解不同的算法,要使用不同的特征工程达到同一个目标以新闻推荐为例一阶特征:每个用户直接喜欢什么二阶特征:用户的扩展兴趣(喜欢大数据的人,可能对机器 学习也感兴趣)不同模型如何添加?线性模型,学习阶特征线性模型,学习二阶特征政治哺机器人话题机器人话题啋篮盈体育政治话题计I体育.一政治话题习一、/ 识 互联网乐话

6、题哇 I 政治II识迟 1互联网1;音乐话题庄:非线性宏观特征模型 ,学习阶特征非线性宏观特 征模型, 学习二阶特征哑是否属于?机器人话题萄罪 1 .0 2l0是否属于?摇政治话题0.81习-、/识1B政治体育互联网习夕、/ 识 迟I 政治I体育I 互联网 音乐话题是否属于?机器人话题政治话题J音乐话题如何解决特征工程特征工程在工业界是巨大的难关需要对机器学习与业务都非常理解不同的算法,要使用不同的特征工程达到同一个目标如何解决特征工程特征工程是非常大的难题需要对机器学习与业务都非常理解不同的算法,同样的特征,获得效果不同如何进行自动的特征工程隐式特征组合(NN,FM)半显

7、式显示特征组合(GBDT)显式特征组合(特征叉乘)隐式特征组合主要特点对连续值特征天然友好最大的成功:语音图像高级离散变量处理相对更复杂隐式组合,基本无可解释性对离散特征需要Large Scale EmbeddingEmbedding NNFM, FNN, PNNDeepFMomolu tion11l la yer 1 : 6 kcrncls(S:5)ubsampling layer 2 : 2Y(lonvolurional layerul)sampling la er Con olutional layer3 : 16 kernels (SxS4: (2x2)CS: 1920 kernels

8、 (Sx5)r _,一 一 ._, - - - - - - - - - - - - - - - - -.,approx. top NII - 1 us ten n仁 廿.,_ _ - - - -class probabilitiesvideo,,vectors v Jserv1ng言watch vectorsearch vector二gendergeographic embeddingembedded video watchesembedded search tokens对离散特征需要Large Scale EmbeddingEmbedding NNFM, FNN, PNNDeepFM第四范式

9、DSN隐式特征组合半隐式特征组合主要是森林类算法为什么是“半隐式”看起来可以解释,实际上并不可解释看起来在做特征组合,实际上是层次贪心 的副产物主要特点理解容易,相对鲁棒,效果优秀Off-the-shelf离散特征非常难解,无现有方案第四范式HE-TreeNet,GBM解决大规模离散特征的树模型研 发 基 于 Embedding, Ensembling, Stacking的系列树 算法显式特征组合:问题主要基于贪心与搜索正则化Beam Search,MCTS遗传算法,模拟退火问题特别的难围棋的状态空间 31919;而个特征,选=2个特征,限制最大阶组合,状态空间为C难以组合连续值特征?显式特征

10、组合优势可解释性:提供深度业务洞 察可叠加性:增强所有机器学习算法显式特征组合:现状State-of-artOnline Boosting Feature Selection: 单特征Weak Learner基于Adaboost的选择Online Regularization:基于Lasso对梯度、权重截断现有算法的问题并非为n选m个k阶以下特征设计多为副产物,对信息损失的比较大二阶组合为主,基本无法高阶特征组合显式特征组合:FeatureGO第四范式FeatureGO算法基于MCTS,对特征组合状态进行估计调优的搜索剪枝技术利用LFC算法解决连续值特征组合问题组合特征可高达6阶算法背后的优化BoostingFully/Partially Corrective LearningCross Parameter-server Sharing(CPS)计算能力也是人工智能的一部分计算能力是新的性感,智能同样来自于计算Google立出了榜样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论