人工智能技术介绍完整版人工智能概述、围棋课件_第1页
人工智能技术介绍完整版人工智能概述、围棋课件_第2页
人工智能技术介绍完整版人工智能概述、围棋课件_第3页
人工智能技术介绍完整版人工智能概述、围棋课件_第4页
人工智能技术介绍完整版人工智能概述、围棋课件_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能技术介绍PPT人工智能技术概述第一节深度学习与智能围棋第二节深度学习与国际象棋第三节人工智能3.0第四节目录content人工智能的新革命第一节人工智能技术简述深度学习算法知识图谱人工智能将引领人类第四次工业革命–智能化时间18世纪末工业1.0创造了机器工厂的“蒸汽时代”20世纪初电力广泛应用蒸汽机信息物联系统1970年代初今天工业2.0将人类带入分工明确、大批量生产的流水线模式和“电气时代”工业3.0应用电子信息技术,进一步提高生产自动化水平自动化、信息化工业4.0开始应用信息物理融合系统(CPS)复杂度悄悄来临互联网时代正在终结人工智能机器人交通工具(即无人机、无人驾驶等)VR(虚拟现实)AI将催生“无用阶层”吗?人工/脑力劳动:翻译、记者...人工/体力劳动:保安、保姆...什么是人工智能(AI)?全面实施战略性新兴产业发展规划,加快人工智能等技术的研发和转化,做大做强产业集群把发展智能制造作为主攻方向,推进国家智能制造示范区、制造业创新中心建设人工智能:国家战略(2017年政府工作报告)人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。什么是人工智能?人工智能有那些类型?弱人工智能,包含基础的、特定场景下角色型的任务,如Siri等聊天机器人和AlphaGo等下棋机器人;通用人工智能,包含人类水平的任务,涉及机器的持续学习;强人工智能,指比人类更聪明的机器;195619741980198719932006AI的诞生1956达特矛斯会议,“人工智能”正式诞生孕育期电子计算机机器翻译与NLP图灵测试计算机下棋早期神经网络搜索式推理聊天机器人乐观思潮所有的AI程序都只是“玩具”运算能力计算复杂性常识与推理专家系统知识工程五代机神经网络重生未达预期削减投入摩尔定律统计机器学习AI广泛应用大数据计算能力应用增多深度学习人工智能2016人工智能发展历程人机交互主要运用到的技术包括机器人学和模式识别技术,机器人可以模拟人的行为,而模式识别则能使用计算机模拟人类器官对外界的各种感知。知识和数据智能处理知识处理时通常使用专家技术,它能运用特定领域中专家提供的专门知识和经验,通过智能推理求和,便可解决只有专家才能解决的问题。数据挖掘与分析面临大数据深度挖掘与分析时,通常采用机器学习,是基于人工神经网络的深度学习。可针对海量数据进行分析计算,并创建相应模型。核心技术010203人工智能核心技术是在多层神经网络发展的深度学习和深度神经网络的基础上,被运用于虹膜识别、步态识别、身份识别等方面。模式识别主要目标是让机器能够识别、操作人类语言,主要包括信息抽取、机器翻译、摘要、搜索及人机交互等。自然语言处理在工业、农业、商务、科技、教育、服务等领域被广泛应用,如农业方面的作物病虫预测专家系统等。专家系统其两个核心问题是图像分类和物体检测。在围绕图像内容的信息检索、广告投放、用户分析、商品推荐等互联网应用在应用广泛。图像识别四、人工智能的应用领域人工智能应用领域手机中的AI人工智能相关技术刚刚越过曲线高峰(处于狂热期),是推动透明化身临其境体验技术发展的主要动力涉及透明化身临其境体验的人本技术(如智能工作空间、互联家庭、增强现实、虚拟现实、脑机接口)是拉动另外两大趋势的前沿技术数字平台在曲线上处于快速上升期,其中的量子计算和区块链将在今后5—10年带来变革性的影响AI处于什么阶段?AIRoadmap国人为什么要关注AI?为什么人类能成为地球的主宰?基因:人和大猩猩的基因,有98.4%都是完全一样的,只有1.6%有区别“符号语言”(口头语言和书面文字):传递、保存、共享知识“集体知识”:人类的大脑可以相互共享信息,交换知识人类个体比其他动物没有多大优势,掌握了符号语言,人类社会的结构发生了突变,有了一个连接在一起的集体大脑。这种物种之间相互关联、相互作用的方式,才是我们和其他物种的真正区别脑容量:历史上的“尼安德特人”和我们的祖先脑容量是一样的。但后来尼安德特人就没留下来,只有我们这一支留下来了《时间地图:大历史导论》知识和创新是推动人类发展的动力AI学科结构AI的几大门派符号学派联结学派行为学派神经网络知识表示机器人模拟人的心智模拟脑的结构模拟人的行为聪明的AI有学识的AI深度学习知识图谱感知识别判断思考语言推理贝叶斯学派进化学派类推学派人工智能产业生态的三层基本架构基础资源层:主要是计算平台和数据中心,属于计算智能;技术层:通过机器学习建模,开发面向不同领域的算法和技术,包含感知智能和认知智能;应用层:主要实现人工智能在不同场景下的应用。基础资源支撑AI生态逐步形成:基础资源+技术+应用人工智能系统的技术架构智能终端智能云平台人工智能的新革命第一节人工智能技术简述深度学习算法知识图谱推理期知识期机器学习期人工智能的三个研究阶段1950s1970s1980s基于符号知识表示通过演绎推理技术基于符号知识表示通过获取和利用领域知识建立专家系统神经网络第二个高潮NP(non-deterministicpolynomial-time)难题中获重大进展助力大量现实问题神经网络第一个高潮期神经网络以深度学习之名再次崛起大幅提升感知智能准确率201790s中期统计学习登场并占据主流,支持向量机、核方法为代表性技术提出支持向量、VC维等概念统计学的研究成果经由机器学习研究,形成有效的学习算法联结学派对大脑进行逆向分析灵感来自于神经科学和物理学产生的是“黑箱”模型神经网络可归置此类符号学派将学习看作逆向演绎并从哲学、心理学、逻辑学中寻求洞见代表包括决策树和基于逻辑的学习机器学习&深度学习从以“推理”为重点到以“知识”为重点,再到以“学习”为重点机器可以自动“学习”的算法,即从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。目前,机器学习=“分类”人工智能>机器学习>深度学习深度学习是使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法深度学习是一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征用数据优化计算机程序的模型参数通过经验自动改进的计算机算法深度学习算法简介:机器学习机器学习的基本定理模型的出错率∝推论:模型复杂-》大样本

样本小-》简化模型

Classlabel(Classification)Vector(Estimation)机器学习实施过程特征提取特征1样本数据样本数据样本数据…n预处理特征样本集原始样本集机器学习算法训练预测输出验证集评价目标特征1…n目标特征1…n目标特征1…n训练集目标特征1…n目标特征1…n目标特征1…n验证集目标特征1…n目标特征1…n目标预测目标预测目标预测目标改进特征提取特征提取特征1样本数据样本数据样本数据…n特征样本集原始样本集目标特征1…n目标特征1…n目标统计分析变换特征运算特征选取是成败的关键人脑是通过分级的、多层网络模型来识别减少数据量,保留物体的有用信息低层信息预处理特征提取识别分类对效果影响极大手动化特征工程非常耗时图像识别的一般流程人脑识别图像的过程第一个模型是一个线性模型,低度拟合,不能很好地适应训练集;第三个模型是一个四次方的模型,过度拟合,虽然能非常好地适应我们的训练集,但在新输入变量进行预测时可能会效果不好;中间的模型似乎最合适经过算法预测的结果是一个连续的值,我们称这样的问题为回归问题。算法能够学会如何将数据分类到不同的类里,我们称这样的问题为分类问题。深度学习算法简介:数学基础当感知器用于两类模式的分类时,相当于在高维样本空间中,用一个超平面将两类样本分开神经网络的学习过程就是神经网络参数的设定过程一个神经元网络结构确定之后,需要对一系列参数(权重、阈值等)进行有效的设定。这个过程叫做学习或训练过程,此时的方法叫学习算法是一个由线性阈值元件组成的单层(或多层)神经元的神经网络当输入的加权和大于或等于阈值时,输出为1,否则为0模型假定神经元中间的耦合程度(即加权系数W)可变,这样,该模型可以学习深度学习算法简介:感知器监督学习通过已有的训练样本(即已知数据以及其对应的输出)训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,从而也就具有了对未知数据进行分类的能力各种神经网络类型LogisticRBMAutoEncoderSparseCodingConvolutional(卷积)强化学习类似人类与环境交互的方式,智能系统从环境到行为映射的学习,以使奖励信号函数值最大。环境对产生动作的好坏通过奖励信号作评价,而不是告诉强化学习系统如何去产生正确的动作。强化学习不能立即得到标记,而只能得到一个反馈,因此可以说强化学习是一种具有“延迟标记信息”的监督学习典型案例:AlphaGo深度学习的训练方法2006年,GeoffreyHinton在《科学》上发表论文提出深度学习主要观点:多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wisepre-training)来有效克服,逐层初始化可通过无监督学习实现的在著名的ImageNet问题上将错误率从26%降低到了15%,并且输入没有用到其他任何人工特征,仅仅是图像的像素迁移学习将从拥有大数据的源领域上学习到的东西应用到仅有小数据的目标领域上去,实现个性化迁移,即举一反三、触类旁通。典型案例:斯坦福学者使用卫星图像获取的灯光信息来分析非洲大陆的贫穷情况深度学习的神经网络训练方法LeNet-5:卷积神经网络手写数字识别的应用卷积过程包括:用一个可训练的滤波器fx去卷积一个输入的图像,然后加一个偏置bx,得到卷积层Cx。子采样过程包括:每邻域四个像素求和变为一个像素,加权再增加偏置,通过一个激活函数,产生一个缩小四倍的特征映射图C1层:输入图片大小: 32*32卷积窗大小: 5*5卷积窗种类: 6输出特征图数量:6输出特征图大小:28*28 (32-5+1)神经元数量: 4707[(28*28)*6)]连接数: 12304[(5*5+1)*6]*(28*28)可训练参数: 156[(5*5+1)*6]局部感受-卷积FeatureMap池化原理:根据图像局部相关的原理,图像某个邻域内只需要一个像素点就能表达整个区域的信息常见的方法:最大值池化(max-pooling)L2池化(L2pooling)均值池化(MeanPooling)LeNet-5YannLecun,1989年用美国邮政系统提供的近万个手写数字的样本来训练神经网络系统,在独立的测试样本中,错误率只有5%进一步运用CNN,开发出LeNet-5用于读取银行支票上的手写数字,这个支票识别系统在九十年代末占据了美国接近20%的市场深度学习的训练方法HintoninImageNet比赛140万图像,

1000类图库1000万图像20000类7层CNN准确率74%->85%深度学习的成功应用AlphaGo战胜李世乭图像识别全面超越人类语音识别接近人类将声学模型中混合高斯模型替换为DNN模型获得30%+相对提升TeslaAutopilot投入商用GoogleTranslate投入商用它把原文例如中文词先翻成一个词向量,变成一个数字向量。它对这个词向量再编辑,变成一个语义表示的方式。再把它翻译成它的目标语言,例如英文。人工智能的新革命第一节人工智能技术简述深度学习算法知识图谱知识图谱(KnowledgeGraph)知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,一般用三元组表示知识图谱亦可被看作是一张巨大的图,节点表示实体或概念,边则由属性或关系构成中国国家美国日本英国北京9,634,057平方公里13.5404亿2069.3万北纬38°56'东经116°20'3.1525亿华盛顿9,629,091平方公里北纬38°53′西经77°02'178平方公里16410平方公里1.26亿377835平方公里东京2188平方公里东经140°50'北纬35°44'……面积人口首都纬度经度面积人口知识图谱构建Web字典,术语表,百科,书本知识获取++已有知识库知识融合知识验证知识图谱名称规模Yago1千万实体,35万类别,1.8亿事实,100种属性,100语言Dbpedia4千万实体,250类别,5亿事实,6000种属性,Freebase2千5百万实体,2000主题,1亿事实,4000种属性谷歌知识图谱5亿实体名字,35亿条事实NELL3百万实体名字,300类别500属性,100万事实1千5百万学习规则基于人工规则的语义理解神话是孙楠和谁合唱的?文法解析知识库查询SPARQL查询语句生成答案生成孙楠和韩红合唱了神话韩红歌手6万歌曲260万专辑44万标签2000类param:singer孙楠#param:song神话#predicate:chorusWith神话是孙楠和谁合唱的查询神话这首歌曲的演唱者,演唱者要包括孙楠,输出还包括的另外一个演唱者文法规则模板歌手6万歌曲260万专辑44万标签2000类互联网各种音乐相关信息下载融合知识图谱的成功应用:现代搜索引擎半结构化信息抽取半结构化数据结构化数据文本数据实体对齐推理补充数据异构数据整合重要度计算实体抽取属性抽取属性值决策关系建立知立方数据本体生成系统索引生成检索系统实体识别本体库Pattern挖掘标签消岐SPARQL查询语句排序推理推荐统计Query展现检索系统索引生成面向知识图谱的Sogou搜索技术Gene

OntologyLOD

企业对知识图谱根据内部数据有大量的业务需求从两方面来建设知识图谱体系:

知识实体,算法企业知识图谱的建立语义理解智能检索与问答数据关联探索业务动态扩展非结构化数据计算机难以理解数据使用专业程度过高多元异构数据难以融合数据模式动态变迁困难结构化数据数据融合自由扩展数据模式行业智能问答业务需求技术方案数据挑战知识图谱助力企业商业智能通用知识图谱+行业知识图谱通用知识图谱的广度,行业知识图谱的深度,相互补充,形成更加完善的知识图谱

通用知识图谱中的知识,可以作为行业知识图谱构建的基础;而构建的行业知识图谱,再融合到通用知识图谱中

通用知识图谱行业知识图谱通用知识图谱创投专利深度学习与智能围棋第二节从AlphaGoLee/Master讲起蒙特卡洛树式搜索AlphaGo的实现原理AlphaGoZero01人机大战:深度学习算法的标志性成果最复杂(注:状态复杂度与博弈复杂度)的智力游戏:看似简单,实为复杂,具有10的170次方状态复杂空间涉及逻辑推理,形象思维,优化选择等多种人类智能(注:国际象棋只有逻辑推理,没有形象思维)02接近人类公认是人工智能领域长期以来的重大挑战03标志性国际学术界曾经普遍认为解决围棋问题需要15-20年时间04挑战为什么做围棋AI?创新性投入力度业内龙头

目前技术优势:起步早,算法新,技术强,资源雄厚最近一年专注于强化学习研究

拟于近期公布新论文和数据,并从此退出围棋AI领域GoogleDeepmind简介深度学习与智能围棋第二节从AlphaGoLee/Master讲起蒙特卡洛树式搜索AlphaGo的实现原理AlphaGoZero传统围棋AI算法—MCTS(蒙特卡洛树搜索)双人一人一步双方信息完备(棋类—完全信息,牌类—不完全信息)零和动态博弈问题计算机下棋棋类要素的数字化——恰当的数据结构棋盘、棋子、棋规(着法规则,胜负规则)用着法推演局面——博弈树展开从有利局面选择当前着法——博弈搜索局面评估——指标定义与综合展开深度为4的博弈树本方本方本方对方对方Ply1Ply3Ply4Ply2Ply0根节点为当前局面叶节点为展开终点双方轮流出手偶数层为本方奇数层为对方围棋落子蒙特卡洛数学模型及评估围棋对弈过程可以看做一个马尔科夫过程:五元组:{T,S,A(i),P(·|i,a),r(i,a)}T:决策时刻S:状态空间,S={i}A(i):可行动集合(可落子点)P(·|i,a):状态i下选择行动a的概率r(i,a):状态i下选择行动a后课获得的收益从当前局面的所有可落子点中随机(或者给胜率高的点分配更多的计算力)选择一个点落子重复以上过程直到胜负可判断为止经多次模拟后(计算越多越精确),选择胜率最大的点落子传统围棋AI算法—数学模型MCTS(蒙特卡洛树搜索)基本思想与特点:-将可能出现的状态转移过程用状态树表示-从初始状态开始重复抽样,逐步扩展树中的节点-某个状态再次被访问时,可以利用已有的结果,提高了效率-在抽样过程中可以随时得到行为的评价选择-从根节点出发自上而下地选择一个落子点扩展-向选定的点添加一个或多个子节点模拟-对扩展出的节点用蒙特卡洛方法进行模拟回溯-根据模拟结果依次向上更新祖先节点估计值深度学习与智能围棋第二节从AlphaGoLee/Master讲起蒙特卡洛树式搜索AlphaGo的实现原理AlphaGoZero13个卷积层,每层192个卷积核,每个卷积核3*3,参数个数800万+GPU3ms/步预测准确率57%PolicyNetwork(策略网络)在每个分支节点直接判断形势与Rollout随机模拟相结合,互为补充ValueNetwork(价值网络)给胜率高的点分配更多的计算力任意时间算法,计算越多越精确1、选取2、展开3、评估4、倒传MCTS(蒙特卡洛树搜索)通过随机模拟走子胜率来判定形势速度很快(1ms/盘)随机性与合理性的平衡Rollout(随机模拟走子)AlphaGo的实现原理控制宽度(250)控制深度(150)基本算法快速模拟围棋是完全信息博弈,从理论上来说可以通过暴力搜索所有可能的对弈过程来确定最优的走法PolicyNetwork策略网络:落子棋感深度神经网络的有监督学习,目标是获得在围棋盘面下的落子棋感学习职业棋手和业余高段棋手的棋谱(数十万份棋谱,上亿数量级的落子方式)把当前局面作为输入,预测下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数用PolicyNetwork作为第一感,将计算力分配到最有希望的选点分枝数从上百个减少到几个优先计算PolicyNetwork分数高的点,计算力充沛时,适当分配到其他分值较低的点PolicyNetwork—输入特征3×224248×552128×272192×132192×132128×1322048204820482048192×32192×32128×3248×523×112192×32192×32192×132192×132128×132128×27248×5248×552128×321000局部感知域权重共享特征训练卷积层+池化层模型结构13个卷积层,每层192个3*3卷积核数百万个参数训练数据KGS6d以上对局,17万,职业对局8万。训练数据量5000万+训练时间几十天运算速度GPU,3ms预测准确率57%左右互博,自我进化Agent通过和环境s的交互,选择下一步的动作a,这个动作会影响环境s,给Agent一个reward,Agent然后继续和环境交互。根据游戏结果迭代更新转移概率和评估函数神经网络结构与策略网络相同训练方法:自我对局目标:校正价值导向将策略网络权值作为初始值,自我对弈更新权值,从而提升棋力Pros:棋艺更高(win80%ofthegameswithSLpolicynetwork)Cons:走法集中,不适应MCTS多搜索范围的需求强化学习(RL)Fast-Rollout快速走子Rollout(随机模拟走子)通过随机模拟走子胜率来判定形势速度快随机性,合理性的平衡原因:1.策略网络的运行速度较慢(3ms)

快速走子在2us2.用来评估盘面。在同等时间下,模拟走子速度快乃至使用随机走子,虽然单次估值精度低,但可以多模拟几次算平均值,效果未必不好。提升棋力结构:局部特征匹配+线性回归特征:围棋专业知识ValueNetwork:胜负棋感深度神经网络的增强型学习(DeepMind独创)通过自我博弈,学习不同盘面下的胜负情况(三千万盘自我对局)获取在围棋盘面的胜负棋感(注:对每一个落子点给一个当时的快速的胜负感(估算),这个胜负估算并不是根据分析计算出来的,而是直觉)(通过AlphaGo几千万盘的训练学习得来的)形势判断:-1:白棋必胜<0:白棋优势0:双方均势>0:黑棋优势1:黑棋必胜ValueNetwork模型模型结构13个卷积层,每层192个卷积核,每个卷积核3*3数百万个参数训练数据PolicyNetwork自我对弈棋谱。3000万+特定盘面+胜负结果训练时间几十天运算速度GPU,3ms方法:在每个分支节点,使用ValueNetwork直接判断形势与Rollout随机模拟相结合,互为补充效果:职业水平,AlphaGoMCTS在对局中实时搜索Step1:基于策略网络落子,可能性大的落子拓展节点Step2:对未来走势进行评估,同时使用估值网络和快速走子,综合两者预测未来走法Step3:评估结果作为下一步走法的Q值。重新模拟。Step4:结合下一步走法的Q值和策略网络进行再一次模拟。如果出现同样走法,Q值起平均。新分数=调整后的初始分+0.5*通过模拟(策略网络+快速走棋)得到的赢棋概率+0.5*估值网络的局面评估分Step5:反复循环直到n次,或者timeout,选择被选择次数最多的走法作为下一步Put-Together深度学习与智能围棋第二节从AlphaGoLee/Master讲起蒙特卡洛树式搜索AlphaGo的实现原理AlphaGoZeroAlphaGoZero第3天,下了490万局棋,打败老大老三战绩老三学棋过程刚开始,随机下子热衷于吃子,完全不顾死活发现了如果先占住棋盘的边和角,后面占便宜学会了如何「打劫」、「征子」懂得看「棋形」第21天,败了老二第40天,完整走过了一个人类棋手学棋的全过程棋盘/黑子/白子棋子被围起来就死规则棋士柯洁10月19日02:22一个纯净、纯粹自我学习的AlphaGo是最强的...对于AlphaGo的自我进步来讲...人类太多余了老大AlphaGoLee,2016年3月4:1打败韩国棋手李世石老二AlphaGoMaster,2017年5月3:0打败中国棋手柯洁老三AlphaGoZero,2017年10月宣布自学围棋40天,打败所有人AlphaGoZero解析人类经验由于样本空间大小的限制,往往都收敛于局部最优而不自知(或无法发现),阿法元不再被人类认知所局限,而能够发现新知识,发展新策略区别1:特征提取层采用40个残差模块,每个模块包含2个卷积层。运用残差模块提升了网络深度,更深的网络能更有效地直接从棋盘上提取特征区别2:同时训练走子策略(policy)网络和胜率值(value)网络启示深度学习训练过程需要消耗大量人类标注样本,而这对于小样本应用领域(比如医疗图像处理)是不可能办到的。所以减少样本和人类标注的方法非常重要开局和收官和专业棋手的下法并无区别,但是中盘难于理解;机器经验与人类经验有很大差别,我们又该如何去选择和利用呢?智能围棋与蒙特卡洛树搜索没有棋感直觉不行,完全依赖棋感直觉也不行直觉需要通过严格的数学模型和计算方法,对棋感直觉进行验证AlphaGo使用蒙特卡洛树搜索,对落子棋感和胜负感进行计算验证。蒙特卡洛树搜索:搜索验证基于数学期望的胜负评估模型(胜率)基于蒙特卡洛模拟进行胜负结果采样(模拟采样比直觉更可靠)根据模拟采样结果验证盘面胜负的数学期望可靠程度与采样规模相关(采样越大,离真理会更近些)蒙特卡洛模拟采样:胜负棋感验证智能围棋与神经网络谷歌的AlphaGo是深度学习算法的标志性成果;深度卷积神经网络(DeepConvolutionalNeuralNetwork,DCNN),是近年发展起来,并引起广泛重视的一种高效识别方法。围棋算法具有高度的复杂性和代表性(10808,两个30年)。由于天文数字的状态空间和搜索空间,蛮力计算无法解决围棋问题(注:解决国际象棋的IBM深蓝是用蛮力方法,就是靠计算,这种方法在围棋这么大的计算与搜索空间是无法进行的)从围棋算法可以推广到深度学习应用的一般情形。围棋职业棋手的解决方法:棋感直觉+搜索验证AlphaGo的核心方法完全类似于完全职业棋手的解决方法AlphaGo的优势:完全以胜率为目标,不受任何其它因素影响深度学习与国际象棋第三节从AlphaGoLee/Master讲起蒙特卡洛树式搜索AlphaGo的实现原理AlphaGoZero

围棋复杂度增加8*8格国际象棋的状态复杂度为1046,博弈树复杂度为10123。19*19格的围棋,其状态复杂度已上升到10172,博弈树复杂度则达到惊人的10360,因此也被视为人类在棋类人机对抗中最后的堡垒。国际象棋围棋人机对抗的尝试与探索

在很长一段时间里,静态方法成了主流研究方向,中山大学化学系教授陈志行开发的围棋博弈程序“手谈”和开源软件GNUGO在2003年以前能够在9*9围棋中达到人类5-7级水平。

2006年S.Gelly等人提出的UCT算法(UpperConfidenceBoundApplytoTree,上限置信区间算法),该算法在蒙特卡洛树搜索中使用UCB公式解决了探索和利用的平衡,并采用随机模拟对围棋局面进行评价。该程序的胜率竟然比先前最先进的蒙特卡罗扩展算法高出了几乎一倍,但它也仅能在9路围棋中偶尔战胜人类职业棋手,在19路围棋中还远远不能与人类抗衡。静态方法UCT算法陈志行手谈AlphaGo横空出世这是围棋历史上一次史无前例的突破,人工智能程序能在不让子的情况下,第一次在完整的围棋竞技中击败专业选手。AlphaGo大战樊麾2016年D.Silver等人在世界顶级科学杂志《Nature》发表文章,称被谷歌公司收购的DeepMind团队开发出AlphaGo在没有任何让子情况下,以5:0完胜欧洲围棋冠军、职业二段选手樊麾。AlphaGo系统简介监督、强化学习该系统通过对16万局人类高手棋谱中的3000万手盘面进行监督学习和强化学习;策略、价值网络使用策略网络和估值网络实现落子决策和局势评估;蒙特卡洛算法通过与蒙特卡洛树搜索算法结合,极大地改善了搜索决策的质量;

异步分布并行算法提出异步分布式并行算法,使其可运行于CPU/GPU集群上。系统AlphaGo所向披靡

2016年3月AlphaGo与李世石进行围棋人机大战,以4比1的总比分获胜;

2016年末2017年初,它以Master为帐号与中日韩数十位围棋高手快棋对决,连续60局全胜。

2017年5月在中国乌镇围棋峰会上,它与柯洁对战,以3比0的总比分获胜。围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平,其最新版本自我估分在4500分左右,实力水平大约在13段左右,人类选手中已然无敌。AlphaGo大战李世石Master大战聂卫平AlphaGo大战柯洁AlphaGo新技能AlphaGo通过学习大量棋谱,以及更大规模的自我对弈完成学习,这种深度学习的能力使得它能不断学习进化。AlphaGo发现了人类没有的围棋着法,初步展示了机器发现“新事物”的创造性。这意味着它的增强学习算法可以从大数据中发现新的规律和知识,为人类扩展自己的知识体系开辟了新的认知通道。AlphaGo展现了曾被认为是人类独有、计算机难以做到的“棋感直觉”这些技术使得人工智能程序初步具备了既可以考虑局部得失,又可以考虑全局态势的能力,从而具备了一种全局性“直觉”能力。深度学习发现新着法棋感知觉新技能AlphaGoZero青出于蓝

学习策略整合策略、价值网络舍弃快速走子网络引入残差结构2.舍弃快速走子网络,不再进行随机模拟,而是完全使用神经网络得到的结果替换随机模拟,从而在提升学习速率的同时,增强神经网络估值的准确性。1.AlphaGoZero将策略网络和价值网络整合在一起,使用纯粹的深度强化学习方法进行端到端的自我对弈学习,神经网络的权值完全从随机初始化开始,使用强化学习进行自我博弈和提升。3.AlphaGoZero神经网络中还引入了残差结构,可使用更深的神经网络进行特征表征提取,从而能在更加复杂的棋盘局面中进行学习。AlphaGoZero青出于蓝

AlphaGo最高需要1920块CPU和280块GPU训练,AlphaGoLee用了176块GPU和48块TPU,而AlphaGoZero仅仅使用了单机4块TPU便完成了训练任务。硬件结构

AlphaGoZero仅用3天的时间便达到了AlphaGoLee的水平,21天后达到AlphaGoMaster的水平。AlphaGoZero成功证明了在没有人类指导和经验的前提下,深度强化学习方法在围棋领域里仍然能够出色的完成指定的任务,甚至于比有人类经验知识指导时,完成的更加出色。AlphaGo成功秘诀:蒙特卡洛树搜索在机器博弈中,每步行棋方案的运算时间、堆栈空间都是有限的,只能给出局部最优解,因此2006年提出的蒙特卡洛树搜索就成为随机搜索算法的首选。应用意义它结合了随机模拟的一般性和树搜索的准确性,近年来在围棋等完全信息博弈、多人博弈及随机类博弈难题上取得了成功应用。理论上,蒙特卡洛树搜索可被用在以{状态,行动}定义并用模拟预测输出结果的任何领域。

它结合了广度优先搜索和深度优先搜索,会较好地集中到“更值得搜索的变化”(虽然不一定准确),同时可以给出一个同样不怎么准确的全局评估结果,最后随着搜索树的自动生长,可以保证在足够大的运算能力和足够长的时间后收敛到完美解。AlphaGo成功秘诀:强化学习目标:从一个已经标记的训练集中进行学习。机器学习有监督学习SupervisedLearning无监督学习UnsupervisedLearning强化学习ReinforcementLearning目标:从一堆未标记样本中发现隐藏的结构。目标:在当前行动和未来状态中获得最大回报。在边获得样例边学习的过程中,不断迭代“在当前模型的情况下,如何选择下一步的行动才对完善当前的模型最有利”的过程直到模型收敛。强化学习的广泛应用阿里巴巴公司在双11推荐场景中,使用了深度强化学习与自适应在线学习建立决策引擎,对海量用户行为以及百亿级商品特征进行实时分析,提高人和商品的配对效率,将手机用户点击率提升了10-20%。无人驾驶广告投放强化学习在机器博弈以外还有很多应用,例如无人驾驶和广告投放等。

人工智能3.0第四节AI技术的新特征AI走向3.0认知计算AI3.0面对的挑战Q1:什么领域AI能够超过人?(完全信息博弈)充分的数据:需要有超级大的数据量,它不能举一反三,它要举多反三(完全信息博弈)信息具有确定性:数据是要有标注的,不是到网上弄一堆数据(完全信息博弈)完全信息:应用一定是单一领域,这个领域越垂直、越细越好。一个人工智能客服的应用不可以用来做导游,应用单一、一定要非常清晰不跨领域有懂行的专家去选择有效的神经网络模型,调整各种网络参数需要超大计算量,机器容易甩开人类一只乌鸦的启示图b:找到了坚果,砸不开。它就发现一个诀窍,把果子放到路上让车轧过去图c:靠近红绿路灯的路口,车子和人有时候停下了。图d:选择了一根正好在斑马线上方的一根电线蹲下来图e:把坚果抛到斑马线上,等车子轧过去,然后等到行人灯亮了日本新喀乌鸦一个完全自主的智能。感知、认知、推理、学习、和执行。远远超过任何机器人,乌鸦向我们证明了,这个解存在。无大数据学习,无人工标注好的训练数据,没人教它乌鸦头不到人脑的1%大小。人脑功耗大约是10-25瓦,它就只有0.1-0.2瓦启示Q2:AI+还是+AI?在AI技术成熟之前,这个行业、产品从未存在过。比如自动驾驶,亚马逊的Echo智能音箱、苹果的Siri语音助手。在人工智能技术未突破前,不存在这样的产品。因为AI,创造出了一条全新的产业链。AI+行业:从0到1行业本身一直存在,产业链条成熟;以前完全靠人工,效率比较低,现在加入AI元素后,使得行业效率有了明显提高。比如安防、医疗等领域。行业数据控制比AI技术更重要,例如医疗+AI,最重要的是大量准确的被医生标注过的数据。在国内,医疗数据拿出来非常困难。行业+AI:从1到nAI应用需要积累足够的数据和经过充分的学习才两个起作用当一个AI应用找到第一批用户时,他们使用的行为和记录被后台记录下来;开发者再对这种行为和记录进行迭代的改进,当再把该应用投向第二批用户的时候,其行为已经比第一代提升了涟漪效应应用场景相对闭可控数据比较便宜,且容易获取犯错误的影响不太大的场景辅助人类完成重复性的具体工作,真正能够提高社会生产力容错生产力成熟封闭可控数据相关技术成熟,具备可实现的切入点Q3:什么AI项目容易成功?新特征1:深度学习+自我博弈进化技术4与传统博弈人工知识不同,AlphaGo深度强化学习初步具备了“直觉感知(下一步在哪)”,“棋局推理(全局获胜机会如何)”,和“新颖落子(想人所不敢想)”等能力。将记忆人类棋局和自我博弈积累棋局结合起来。DeepMind算法减少了40%用于冷却的电量,即整体用电量效率提升15%2010年全球数据中心电力消耗为2355亿度,约占全球电力消耗1.3%(美2%,中1.8%)。谷歌公司电力消耗低于全球数据中心的1%DeepMind已为谷歌挣钱DeepMind的软件控制着数据中心的风扇、制冷系统和窗户等120个变量,使谷歌的用电效率提升了15%,几年内共为谷歌节约电费数亿美元。据ICTResearch统计:2015年我国数据中心能耗高达1000亿度,相当于整个三峡水电站一年发电量。5《Science》2016年1月1日发表“群智之力量(ThePowerofCrowds,Vol.351,issues6268)”的论文认为:结合群体智慧与机器性能来解决快速增长难题。其将群智计算按难易程度分为三种类型:实现任务分配的

众包模式(Crowdsourcing)、较复杂支持工作流模式的群(Complexworkflows)以及最复杂的协同求解问题的生态系统模式(Problemsolvingecosystem).新特征2:基于网络的群体智能已经萌芽6大规模个体通过互联网构架的参与,可以表现出超乎寻常的智慧能力,是解决开放复杂问题的新途径

美国普林斯顿大学Connetome项目开发了EyeWire游戏,玩家对显微图像中单个细胞及其神经元连接按功能进行涂色。第一次提供了哺乳动物视网膜的神经元结构和组织如何产生检测运动的功能。145个国家的165000多名科学家(玩家)参与成功的还有:苹果AppStore(130万个应用程序)、Wiki百科(4000万词条)等等美国普林斯顿大学Connetome项目通过群体参与来探讨大脑结构和功能之间映射的神经通路/(继续)7各种穿戴设备、人—车共驾、脑控或肌控外骨骼机器人、人机协同手术等实现生物智能系统与机器智能系统的紧密耦合。新特征3:人机一体化技术导向混合智能8自然语言处理视觉计算听觉感知

精灵宝可梦GO:AR:图形+视频谷歌:VR绘画应用TiltBrushFacebook:视频描述生成

架构跨媒体间桥梁新特征4:跨媒体推理已经兴起在语言、视觉、图形和听觉之间语义贯通,是实现联想、推理、概括等智能的重要关键9新特征5:无人系统迅速发展机械手在工业装配线上发展迅速在灵活运动的领域中,无人系统迅猛发展的速度远快于机器人因为人类或类动物的机器人,往往不如对机械进行智能化和自主化升级来得高效10人工智能3.0第四节AI技术的新特征AI走向3.0认知计算AI3.0面对的挑战我们正在进入AI3.0时代人工智能基础理论和基础学科建立的阶段,AI的具体学科,比如语音识别、机器翻译、自然语言处理、视觉等被建立起来,并形成了人工智能从业的方法论及学派AI1.0时代:1945-2005年以2006年谷歌翻译上线为标志的AI2.0时代,人工智能的发展从学术界到谷歌这样的公司主导,从以前的军用到民用,产品从ToB到大规模的ToC的过程人工智能技术被广泛用于各类智能产品之中算法(深度学习)+数据(大数据)+基础设施(计算能力)AI2.0时代:2006-2016年从软件到AI芯片,走向软硬结合从信息到服务崭新的、群雄逐鹿、百花齐放的时代AI3.0时代:2017-20xx年浅层次动因:需求、环境和技术社会新需求爆发:智能城市、智能医疗、智能交通、智能游戏、无人驾驶、智能制造等等AI的基础和目标巨变:大数据、多媒体、传感器网、增强实现(AR)、虚拟实现(VR)等等计算机模拟人的智能人机智能群体智能信息环境巨变:互联网、移动计算、超级计算、穿戴设备、物联网、云计算、网上社区、万维网、搜索引擎等等人工智能迈向新一代AI走向3.0的原因分析14PHCPH深层次分析:世界正从原来的二元空间进入新的三元空间世界原来是二元空间:人类社会空间(H)和物理空间(P)。但近年来,信息力量的迅速壮大,已长成除P、H两极之外的新一极:信息空间(C)。15信息来自于人类社会:书籍、交流、媒体、计算机信息开始互联:互联网、移动通讯和搜索信息绕过人类,直接来自于物理世界:传感器和物联网产生大数据:信息快速膨胀,人类已无法单独处理从大数据必然会走向大知识,并推动人类认识与控制能力的大变化近50年来,信息空间成长壮大的历程从AI落后人类的原因看大知识(智能大数据)面临的挑战强在记忆能力和计算能力,但是自我学习、举一反三的能力还不如5岁孩子面对未知环境的变化,未知的任务,决策能力很弱AI智能学习与创新的能力:理解尤其是对整体环境的理解能力,可以通过经验来学习新事物,获得新知识,并具备触类旁通的能力对于信息(不完全信息,模糊信息)的分析和决策能力人类智慧大知识需要结合大数据资源和AI的神经网络、符号智能、知识挖掘、人机交互等技术结合起来,不仅解决可解释性、通用性问题,而且形成新技术,实现新应用技术融合依靠大数据的深度学习和增强学习是AI当前最普遍成功的技术之一。但是,深度学习需要大量的标注数据,又是黑箱算法,其结果难以解释,而且只能专用,因为它和人类使用的知识形式差距太大AI技术现状从PH到CPH的人类空间演变并未结束,而正在深化。AI走向3.0正是这种深化演变为的一个结果AI2.0互联网多媒体、传感器人机交互自主装备大数据新一代人工智能自主智能系统群体智能智能大数据跨媒体智能人机混合增强智能AI走向3.0认知智能能理解会思考感知智能能听会说、能看会认计算智能能存会算新一代AI的技术方向空间变化带来了认知的新门类、新通道、新计算P物理空间C信息空间H人类社会自然科学工程技术多媒体与传感信息大数据自主装备大数据、互联网社区VRAR人机交互学习、预测、创造社会科学新认知17新门类:认识复杂巨系统:城市运行系统、环境生态系统、健康医疗系统(科学+工程+社会+影响)新通道:给自然科学、工程技术、社会科学提供了新途径、新方法新计算:AI2.0:建立在新老空间的互动CH、CP之上的AI知识表达神经网络也可以认为是一类新的知识表达,可标记为NN+W(权)

——W是数据表达的,可由学习自动生成

——NN是结构,由软件或硬件生成AI使用的知识表达还有另两类:符号型:可表达为概念、命题、推理(逻辑、归纳、联想……)形象型:可表达为形象(图形、动画、图像、视频、声音……)、结构、情景其中,形象型还可分为两类:——图形形象类:图形、动画……(人工表达)——图像形象类:图像、视频、声音……(传感器表达)23知识表达面临的挑战上表中x处,就是大数据智能需对付的挑战图像形象类:机器不可理解——模式识别技术

机器不能推理——跨媒体技术

?NN+W:

人不可理解——跨知识表达

机器不可推理——跨知识推理

?图形形象类的表达只用于图形学,能与其他表达跨越使用吗?知识能综合上述技术而表达吗?知识表达人可理解机器可理解机器推理符号√√√图形形象类√√√图像形象类√××NN+W×√×汇总四种表达的优缺点如右大知识的关键:新知识生成问题求解的目标与模式识别的目标有较大差异。模式识别目标:分类(如对、错)问题求解目标:方案(如规划、处方、设计等)。往往还需说明方案如何解决问题。——因此,自动生成新知识是问题求解的关键。各种生成新知识的工具:传统工具:逻辑推理、范例推理(CBR)新工具:自动博弈的(如AlphaGo)、知识图谱推理(如股权发现)、综合推理、统计推理(IBMWatson)新进展:MITAILab:自主浏览网页进行空白知识填补的能力;DeepMind:开发新AI技术利用外部记忆来解决需要逻辑推理才能完成的任务26人工智能面临挑战第四节AI技术的新特征AI走向3.0认知计算AI3.0面对的挑战认知计算认知计算是指一种能够规模化学习、有目的推理、并与人类自然交互的系统。它们不需要事先精确地编程,而是从它们与我们之间的交互和与环境之间的互动中学习和推理认知系统是概率性的。认知系统不仅能回答大量的问题,还能对更加复杂(且有意义)的数据提出假说、推理论述和建议认知系统还能理解「非结构化」的数据(全世界数据的80%),这使得它们能够跟上现代世界巨量、复杂和不可预测的信息认知计算的成功并不以图灵测试或模拟人类的能力作为判断标准。它的标准更加实际,例如投资报酬率、新的市场机会、治疗疾病和拯救生命新的「人-机共生」的人机关系让人与计算机能够协作决策,控制复杂情况,综合了机器的数据分析、统计推断能力,以及人类特殊能力,比如自我引导的目标、常识和价值观认知的定义认知(cognition)是人们推测和判断客观事物的心理过程,是在过去的经验及有关线索进行分析的基础上形成的对信息的理解、分类、归纳、演绎和计算认知活动包括思维、语言、定向和意识4部分认知反映个体的思维能力,是制定和执行护理计划的依据认知计算系统WatsonServicesAPICatalog语言类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论