AI第5章计算智能ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2020-01-05 格式：PPT 页数：83 大小：1.51MB 积分：25 举报 版权申诉

已阅读5页，还剩78页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 ArtificialIntelligence AI 人工智能第5章计算智能ComputationalIntelligence CI 2 内容第5章计算智能 1 概述 2 神经网络 3 模糊计算 4 遗传算法 3 现代科技发展的一个显著特点就是学科间的交叉渗透和促进如生物信息学计算智能是另一个有说服力的示例计算智能涉及神经计算模糊计算进化计算粒群计算蚁群计算自然计算免疫计算和人工生命等领域反映了多学科交叉与集成的发展趋势 5 1概述 4 通过人工方法模仿人类智能已有很长历史如仿生学的众多成果都是人类人工模仿智能的典型例证而现代人工智能领域则力图抓住智能的本质人工神经网络 ANN 主要是通过Hopfield网络的促进和反向传播 BP 网络训练多层感知器来推广的将神经网络 NN 归类于人工智能可能不太合适而归类于计算智能 CI 应更能说明问题实质进化计算人工生命和模糊逻辑系统的某些课题也都归类于计算智能 5 第一个对计算智能的定义由贝兹德克 Bezdek 于1992年提出他认为从严格意义上讲计算智能取决于制造者提供的数据数值而不依赖于知识另一方面人工智能则应用知识他认为人工神经网络应当称为计算神经网络 6 尽管计算智能与人工智能的界限并不十分明显但讨论它们的区别和联系是有必要的贝兹德克对相关术语给予一定的符号和简要说明或定义他给出有趣的ABC A Artificial 表示人工的非生物的即人造的 B Biological 表示物理的化学的生物的 C Computational 表示数学计算机 7 ABC与神经网络 NN 模式识别 PR 和智能 I 之间的关系可看出计算智能是一种智力方式的低层认知它与人工智能的区别只是认知层次从中层下降至低层而已中层系统含有知识而低层系统则没有 8 当一个系统只涉及数值低层数据含有模式识别部分不使用人工智能意义上的知识且具有计算适应性计算容错性接近人的速度近似于人的误差率这4个特性则该系统就是计算智能系统一个计算智能系统以非数值方式加上知识值即成为人工智能系统从学科范畴看计算智能是在神经网络 NN 进化计算 EC 及模糊系统 FS 这三个领域发展相对成熟的基础上形成的一个统一的学科概念 1 什么是计算智能 9 10 神经网络对人类智能的结构模拟方法通过对大量人工神经元的广泛并行互联构造人工神经网络系统以模拟生物神经系统的智能机理进化计算对人类智能的演化模拟方法通过对生物遗传和演化过程的认识用进化算法模拟人类智能的进化规律模糊计算对人类智能的逻辑模拟方法通过对人类处理模糊现象认知能力的认识用模糊逻辑模拟人类的智能行为 11 计算智能不仅涉及神经网络模糊系统和进化计算三个主要分支还包括粒子群算法蚁群算法人工免疫系统人工生命模拟退火算法粗集理论与粒度计算支持向量机量子计算DNA计算智能agent 12 生物智能 BiologicalIntelligence BI 由脑的物理化学过程反映出来的脑智能的基础人工智能 ArtificialIntelligence AI 非生物的人造的常用符号表示来源于人类知识的精华计算智能 ComputationalIntelligence CI 由数学方法和计算机实现的来源于数值计算的传感器 ABC ArtificialBiologicalComputational 2 关系 13 另一种观点计算智能和人工智能是不同的范畴虽然人工智能与计算智能之间有重合但计算智能是一个全新的学科领域无论是生物智能还是机器智能计算智能都是其最核心的部分而人工智能则是外层实践证明只有将AI和CI很好地结合起来才能更好地模拟人类智能才是智能科学发展的正确方向 14 内容提要第5章计算智能 1 概述 2 神经计算 3 模糊计算 4 遗传算法 15 5 2神经计算以神经网络为基础的计算广义上神经网络可泛指生物神经网络也可指人工神经网络人工神经网络 ArtificialNeuralNetwork 是指模拟人脑神经系统的结构和功能运用大量的处理部件由人工方式建立起来的网络系统人脑是ANN的原型 ANN是对人脑神经系统的模拟人工智能领域中在不引起混淆的情况下神经网络一般都指的都是ANN 16 现代计算机虽有很强的计算和信息处理能力但解决像模式识别感知评判和决策等复杂问题的能力却远远不及人特别是其只能按人预先编好的程序机械地执行缺乏向环境学习适应环境的能力 17 人脑是由大量的基本单元神经元经过复杂的互连而构成的一种高度复杂非线性并行处理的信息处理系统单个神经元的反应速度在毫秒级比起计算机的基本单元逻辑门反应时间在10 9s量级慢5 6个数量级但由于人脑的神经元数量巨大约为1010个每个神经元可与几千个其他神经元连接总连接数约为6 1013 因而对有些问题的处理速度反而比计算机要快得多且能耗要低得多由此可见人脑的性能要比现代计算机高得多 18 所谓人工神经网络是模仿人脑工作方式而设计的一种机器可用电子或光电元件实现也可用软件在常规计算机上仿真或者说是一种具有大量连接的并行分布处理器具有通过学习获取知识并解决问题的能力且知识是分布存储在连接权对应于生物神经元的突触中而不是像常规计算机那样按地址存储在特定的存储单元中 19 符号功能主义符号逻辑推理联结结构主义人工神经网络行为主义智能行为模拟模式动作联结主义的观点智能的寓所在大脑皮层是由大量非线性神经元互联而成并行处理的神经网络人工智能的各种学派 20 总体而言人工神经网络 ANN 是反映人脑结构及功能的一种抽象数学模型是由大量神经元节点互连而成的复杂网络用以模拟人类进行知识的表示与存储以及利用知识进行推理的行为简单地讲 ANN是一个数学模型可用电子电路实现也可用计算机程序来模拟是人工智能研究的一种方法人工神经网络力求从四个方面模拟人脑的智能行为物理结构计算模拟存储与操作训练 21 5 2 1人工神经网络研究的进展 1 萌芽期 20世纪40年代 1890年美国生物学家W James首次阐明了有关人脑结构及其功能以及相关学习联想记忆的基本规律 1943年心理学家McCulloch和数学家Pitts建立起了著名的阈值加权和模型简称为M P模型 1949年心理学家D O Hebb提出神经元之间突触联系是可变的假说 Hebb学习律 22 2 第一高潮期 1950 1968 以Minsky Rosenblatt Widrow等为代表人物 1957年Rosenblatt定义了一个神经网络结构称为感知器将神经网络研究从纯理论的探讨推向工程实现在IBM计算机上进行了模拟并可用电子线路模拟 3 反思期 1969 1982 1969年Minsky和Papert在感知机一书中指出感知机的缺陷异或运算不可表示使得神经网络的研究从兴起期进入了停滞期芬兰学者Kohonen提出了自组织映射理论 SOM 美国学者Grossberg提出了自适应谐振理论 ART 这些研究成果对神经网络以后的发展产生了重要影响 23 4 第二高潮期 1983 1990 1982年 Hopfield提出Hopfield模型 1984年 Hopfield设计研制了Hopfield网的电路较好地解决了著名的TSP问题引起了较大轰动 1985年 Hinton Sejnowsky Rumelhart等人在Hopfield网络中引入随机机制提出Boltzmann机 1986年 Rumelhart Hinton提出多层感知机与反向传播 BP 学习算法该方法克服了感知器非线性不可分类问题给神经网络研究带来了新的希望 1990年12月中国首届神经网络大会在北京举行 24 5 成熟期 1991 平稳发展应用广泛与其他领域的结合与进化计算结合与模糊逻辑结合实际应用计算机视觉自然语言理解优化计算智能控制等 25 并行分布处理并行结构耐故障实时动态非线性映射任意非线性映射能力非线性问题通过训练进行学习通过数据记录进行训练能处理由数学模型或描述规则难以处理的问题适应与集成自适应和信息融合能力复杂大规模多变量硬件实现快速和大规模处理能力并行处理人工神经网络的特性 26 神经网络的生物学机理神经元结构包括四个部分胞体神经细胞的本体维持细胞生存功能树突接收来自其他神经元的信号输入轴突输出信号突触与另一个神经元相联系的特殊部位 5 2 2人工神经网络的结构 27 一个神经元有两种状态兴奋抑制平时处于抑制状态的神经元其树突和胞体接收其它神经元由突触传来的兴奋电位多个输入在神经元中以代数和的方式叠加如果输入的兴奋电位总量超过某个阈值神经元会被激发进入兴奋状态发出输出脉冲并由突触传递给其他神经元神经元被触发后进入不应期在不应期内不能被触发然后阈值逐渐下降恢复抑制状态神经元的基本工作机制简化 28 神经元及其连接神经元之间的连接强度决定信号传递的强弱神经元之间的连接强度可以随训练改变信号可以起刺激作用也可以起抑制作用一个神经元接受信号的累积效果决定该神经元的状态每个神经元有一个阈值生物神经网络的六个基本特征 29 MP模型一种人工神经元的数学模型是最早的神经元模型之一是大多数神经网络模型的基础 MP模型示意图 1 神经元及其特性 30 人工神经元是仿照生物神经元提出的神经元可以有N个输入每个输入端与神经元之间有一定的连接权值神经元总的输入为对每个输入的加权求和同时减去阈值 u代表神经元的活跃值即神经元状态 31 神经元的输出y是对u的映射二值函数 f称为输出函数激励函数激活函数有几种形式 32 S型函数双曲正切函数 33 输出函数 f 的作用控制输入对输出的激活作用对输入输出进行函数转换将可能无限域的输入变换成有限范围内的输出 34 2 人工神经网络的基本特性和结构结构由基本处理单元及其互连方法决定人工神经网络由神经元模型构成这种由许多神经元组成的信息处理网络具有并行分布结构每个神经元具有单一输出并且能够与其它神经元连接存在许多多重输出连接方法每种连接方法对应一个连接权系数 35 严格地说人工神经网络是一种具有下列特性的有向图 1 对于每个节点i存在一个状态变量xi 2 从节点i至节点j 存在一个连接权系数wij 3 对于每个节点i 存在一个阈值 i 4 对于每个节点i 定义一个变换函数fi xi wij i 对于最一般的情况此函数的形式为 36 神经元模型确定之后一个神经网络的特性及能力即主要取决于网络的拓扑结构及学习方法人工神经网络 ANN 可以看成是以人工神经元为节点用有向加权弧连接起来的有向图人工神经元就是对生物神经元的模拟有向弧则是轴突突触树突对的模拟有向弧的权值表示相互连接的两个人工神经元之间相互作用的强弱 37 人工神经网络的结构基本上分为两类递归反馈网络和前馈网络 38 前馈网络前馈网络具有递阶分层结构由一些同层神经元间不存在互连的层级组成从输入层至输出层的信号通过单向连接流通感知器神经元从一层连接至下一层不存在同层神经元间的连接实线指明实际信号流通虚线表示反向传播连接权值 39 3 人工神经网络的主要学习方法人工神经网络最具有吸引力的特点是它的学习能力 1962年 Rosenblatt给出了人工神经网络著名的学习定理人工神经网络可以学会它能表达的任何东西神经网络的适应性是通过学习实现的学习是神经网络研究的一个重要内容人工神经网络的学习过程表现为对连接权值的训练 40 人工神经网络的学习方法涉及到学习方式和学习规则的确定不同的学习方法其学习方式和学习规则是不同的学习方式通过向环境学习获取知识并改进自身性能是NN的一个重要特点一般情况下性能的改善是按某种预定的度量通过调节自身参数权值随时间逐步达到的按环境提供信息量的多少学习方式有3种监督学习有师学习非监督学习无师学习再励学习强化学习 41 监督学习有师学习此学习方式需要外界存在一个教师可对给定的一组输入提供应有的输出结果正确答案已知的输出输出数据称为训练样本集学习系统 ANN 可根据已知输出与实际输出之间的差值误差信号来调节系统参数 42 非监督学习无师学习不存在外部教师学习系统完全按照环境提供数据的某些规律来调节自身参数或结构是一种自组织过程以表示出外部输入的某种固有特性如聚类或某种统计上的分布特征 43 再励学习强化学习介于有师与无师两种情况之间外部环境对系统输出结果只给出评价信息奖或惩而不是给出正确答案学习系统通过强化那些受奖的动作来改善自身的性能 44 误差纠正学习令yk n 为输入xk n 时神经元k在n时刻的实际输出 dk n 表示应有的输出则误差信号可写为误差纠正学习的最终目的使某一基于ek n 的目标函数达到最小以使网络中每一输出单元的实际输出在某种意义上逼近应有的输出学习规则 45 一旦选定了目标函数形式误差纠正学习就变成了一个典型的最优化问题最常用的目标函数是均方误差判据定义为误差平方和的均值其中 E为求期望算子上式的前提是被学习的过程是宽平稳的具体方法可用最优梯度下降法直接用J作为目标函数时需要知道整个学习过程的统计特性为解决这一问题通常用J在时刻n的瞬时值 n 代替J 即各数据偏离平均数的距离的平均数标准差表示实验误差大小的偏差平方和属等精度测量即在相同条件下各次测量值Xi对测定平均值X的偏差平方和后再求和 Xi X 2 概率意义下的加权平均根据大数定理有n次结果的平均值将趋向数学期望值 46 问题变为求 n 对权值w的极小值根据梯度下降法可得这就是通常所说的误差纠正学习规则或称delta学习规则在自适应滤波理论中对这种学习的收敛性有较深入的分析其中为学习步长 47 Hebb学习由神经心理学家Hebb提出的学习规则可归纳为当某一突触连接两端的神经元同步激活同为激活同为抑制时该连接的强度应为增强反之减弱式中 yk n xj n 分别为wkj两端神经元的状态其中最常用的一种情况是因 wkj与yk n xj n 的相关成正比也称为相关学习规则用数学方式可描述为 48 竞争学习网络各输出单元互相竞争最后只有一个最强者激活最常见的一种情况是输出神经元之间有侧向抑制性连接即原输出单元中如有某一单元较强则它将获胜并抑制其他单元最后只有此强者处于激活状态最常用的竞争学习规则可写为 49 当学习系统神经网络所处环境平稳时统计特性不随时间变化理论上通过监督学习可学到环境的统计特性这些统计特性可被学习系统作为经验记住但若环境是非平稳的统计特性随时间变化通常的监督学习没有能力跟踪这种变化为解决此问题需要网络有一定的自适应能力此时对每一个不同输入都作为一个新的例子来对待学习与自适应 50 此时模型即ANN 被当做一个预测器基于前一个时刻输入x n 1 和模型在n 1时刻的参数它估计n时刻的输出x n x n 与实际值x n 应有的正确答案比较其差值称为信息若信息e n 0 则不修正模型参数否则修正模型参数以便跟踪环境的变化 51 4 基于神经网络的知识表示这里知识并不像在产生式系统中那样独立地表示为每一条规则而是将某一问题的若干知识在同一网络中表示例如在有些神经网络系统中知识是用神经网络所对应的有向权图的邻接矩阵及阈值向量表示的 52 5 基于神经网络的推理通过网络计算实现把用户提供的初始证据用作网络的输入通过网络计算最终得到输出结果一般来说正向网络推理的步骤将已知数据输入网络输入层的各个节点利用特性函数分别计算网络中各层的输出用阈值函数对输出层的输出进行判定从而得到输出结果 53 5 2 3人工神经网络的典型模型及其算法人工神经网络相关算法已在智能处理系统中广泛应用迄今为止已经开发和应用了30多种人工神经网络模型在此我们仅对典型网络模型及其算法作简要介绍 1 反向传播 BP 模型2 Hopfield网络3 自适应共振理论 ART 模型 54 1 反向传播 BP 模型神经元的网络输入 neti x1w1i x2w2i xnwni 55 输入向量输出向量的维数网络隐藏层的层数和各个隐藏层神经元的个数的决定了网络拓扑增加隐藏层的层数和隐藏层神经元个数不一定总能提高网络精度和表达能力 BP网一般都选用二级 3层网络因为可以证明如果BP网络中隐层单元可以根据需要自由设定那么一个三层网络可以实现以任意精度近似任意连续函数 56 将待识别模式的输入矢量输入至输入层并传至后面的隐含层最后通过连接权输出到输出层网络中每个神经元通过求输入权值和非线性激励函数传递结果来工作其数学描述为式中 outi 所考虑层中第i个神经元的输出 outj 前一层中第j个神经元的输出激励函数 neti 网络中第i个神经元 57 对非线性激励函数的使用有几种常用形式其中经常采用的是前面介绍过的Sigmoid函数 58 BP算法基本思想样本集 S X1 Y1 X2 Y2 Xs Ys 逐一根据样本集中的样本 Xk Yk 计算出实际输出Ok及其误差E1 然后对各层神经元的权值W 1 W 2 W L 各做一次调整重复这个循环直到 Ep 所有样本的误差之和用输出层的误差调整输出层权矩阵并用此误差估计输出层的直接前导层的误差再用输出层前导层误差估计更前一层的误差逐层前推如此获得所有其它各层的误差估计并用这些估计实现对权矩阵的修改形成将输出端表现出的误差沿着与输入信号相反的方向逐级向输入端传递的过程 59 BP算法训练过程概述前提样本训练集输入值理想期望输出值 1 首先定义网络误差对于BP反向传播训练算法通常使用的网络误差是熟知的均方差但事实上并不是必须使用均方差可使用任何连续可微误差函数不过选择其他误差函数会增加额外的复杂性须注意不论选用哪种函数作为误差函数必须在网络输出期望值与实际值之间提供一个有意义的度量距离假设这样的训练集合存在即可讨论怎样利用它来训练一个网络 60 均方差定义式中 Ep是第p个样本 xp tp 的误差 tpj是第j个神经元输出的期望值即训练集合 opj是第j个神经元输出的实际值上式中每一项都反映单个输出神经元对整个误差的影响取绝对误差期望值和实际值之差的平方可以看出远离期望值的那些输出对总误差影响最大增加幂指数影响则更明显 61 BP反向传播算法是梯度下降训练算法中比较简单的一种核心思想调整权值使网络总误差最小梯度下降法也称为最速下降法基本思想从当前点出发取函数在该点处下降最快的方向作为搜索方向任一点的负梯度方向是函数值在该点下降最快的方向将n维问题转换为一系列沿负梯度方向用一维搜索方法寻优问题 62 网络中的每个权值都是N维误差空间中的一个元素在误差空间中权值作为独立的变量且相应误差表面曲线的形状由训练集合和误差函数共同决定权值的误差函数负梯度指向误差函数减小最快的方向如果在权值空间沿这个矢量移动最终将达到极小值该点梯度为零但该点可能是局部极小点如下图给出误差空间中梯度与Ep之间的关系形象地指出了误差函数达到局部最小值的情形 63 64 其中 pWji表示连接L 1层的源神经元i和L层的目的神经元j权值的变化权值的这个变化导致了权值空间中梯度沿降低误差方向变化正比关系变化上述结果的数学描述权值误差函数负梯度关系式 65 因此首先必须计算偏微分应用公式目标确定如何调整每个权值使网络收敛任务将上式转换成适合于计算机实现的微分方程 66 Opl是对L 1层的所有神经元输出求和得到因此可计算第二项偏微分展开得 67 定义误差信号 pj 两式合并得前述权值误差函数负梯度关系式式中常数是学习速率它控制在权值空间中对应每步沿负梯度方向变化的大小 68 为了得到可用的微分方程暂不考虑 pj的变化运用微分公式已知输出Opj是netpj的函数表示为激励函数 69 输出层中的目的神经元对于输出层中的目的神经元直接得到以Opj为自变量的误差函数Ep 可得出 70 隐含层中的目的神经元对于隐含层中的目的神经元不能直接对误差函数微分利用微分公式对L 1层中的所有神经元求和根据netpk的定义可计算式中第二个因子 71 得由定义可以得到得到 72

人人文库> 全部分类> 图纸下载 > 毕业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

AI第5章计算智能ppt课件.ppt

文档简介

温馨提示

最新文档

评论

AI第5章计算智能ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档