人工智能通识基础与应用课件

上传人：1*** IP属地：广东上传时间：2026-07-02 格式：PPTX 页数：40 大小：15.89MB 积分：20 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人工智能通识基础与应用第3章神经网络目录3.8自组织神经网络63认知计算3.6随机神经网络3.5Hopfield神经网络3.7深度学习63认知算3.5Hopfield神经网络3.5Hopfield神经网络1982年，美国物理学家霍普菲尔德提出了Hopfield神经网络，他利用非线性动力学系统理论中的能量函数方法研究反馈神经网络的稳定性，并利用此方法建立求解优化计算问题的系统方程式。基本的Hopfield神经网络是一个由非线性元件构成的全连接型单层反馈系统。概述特点1.Hopfield神经网络中的每个神经元既是输入也是输出，网络中的神经元在t时刻的输出状态实际上间接地与t-1时刻的输出状态有关。2.神经元之间互相连接，所得到的权重矩阵将是对称矩阵。3.Hopfield神经网络成功引入能量函数的概念，使网络运行的稳定性判断有了可靠依据。当网络达到稳定状态的时候,就是它的能量函数达到最小的时候。3.5Hopfield神经网络3.5.1离散型Hopfield神经网络Hopfield神经网络是全互联反馈神经网络，它的每一个神经元都和其他神经元相连接。N阶离散型Hopfield神经网络N可由一个n*n阶矩阵

和一个n维向量

所唯一确定，记为

，其中，

表示神经元i与j的连接强度，

表示神经元i的阈值。若用

表示t时刻神经元所处的状态(可能为1或-1)，即

，那么神经元i的状态随时间变化的规律(又称演化律)为其中，3.5Hopfield神经网络3.5.1离散型Hopfield神经网络离散型Hopfield神经网络的计算能量函数定义式中，

是各个神经元的输出。第m个神经元的输出变化时，即

或

时，会带动能量函数E的变化。3.5Hopfield神经网络3.5.2连续型Hopfield神经网络网络模型Hopfield神经网络可以推广到输入和输出都取连续数值的情形。这时，网络的基本结构不变，状态方程形式上也相同。若定义网络中第j个神经元Nj的总输入为uj，输出状态为vj，则网络的状态转移方程可写为式中，神经元的转移特性函数g为S型函数。两个函数的共同特点是，当x趋于正无穷或负无穷时，函数值饱和于两极，从而限制了神经网络中状态vi及流动信息ui的增长范围。3.5Hopfield神经网络3.5.2连续型Hopfield神经网络网络物理实现结构电子电路与Hopfield神经网络直接对应，利用运算放大器模拟神经元的转移特性函数，连接电阻决定各种神经元之间的连接强度，电容cj及电阻ρj用来模拟生物神经元的输出时间常数。按基尔霍夫电流定律有下列方程：令

带入并合并，得

从微分方程和状态方程可以看出连续型Hopfield神经网络的动态过程，随着时间的流逝，网络逐渐趋于定态，可以在输出端得到稳定的输出。3.5Hopfield神经网络3.5.2连续型Hopfield神经网络网络运行的收敛性定义系统的能量函数为对于该能量函数，有如下定理：假设神经元转移特性函数g具有反函数g-1,且g-1是单调、连续且递增的，同时网络结构对称：Tij=Tji，Tii＝0，i,j∈{1,2,..,n}，那么描述的网络是稳定的。能量分布也可用能量曲面来进行理解。要注意，能量分布曲面与吸引子分布应存在对应关系，即吸引子对应着能量曲面的极小区域。若网络的结构不对称，则无法保证网络的稳定性。这时，在网络的运行过程中可能出现极限环或混沌状态。3.6随机神经网络3.6随机神经网络前几节讨论的两种网络都为确定性的网络，组成它们的神经元均为确定性的，即给定神经元的输入后，其输出就是确定的。但在生物神经元中，由于有各种各样的干扰，这实际上是很难实现的。同时人工神经元的硬件实现也会有各种扰动，从而带来某些不确定性。因此讨论随机神经元显得必要且必须。下面讨论模拟退火(SimulatedAnnealing,SA)算法和玻尔兹曼机(BoltzmannMachine,BM)。3.6随机神经网络3.6.1模拟退火算法1953年，米特罗波利斯(N.Metropolies)等最先提出了模拟退火算法，其基本思想是把某类优化问题的求解过程与统计热力学中的热平衡问题进行对比，试图通过模拟高温物体退火过程的方法，来找到优化问题的全局最优或近似全局最优解。一个物体(如金属)的退火过程：首先对该物体加热(熔化)，那么物体内的原子就可高速自由运行，处于较高的能量状态。但是作为一个实际的物理系统，原子的运行总是保持最低的能态。刚开始温度较高时，高温使系统具有较高的内能，而随着温度的下降，原子越来越趋向于低能态，最后整个物体形成最低能量的基态。3.6随机神经网络3.6.1模拟退火算法在物体降温降火的过程中，其能量转移概率分布可从下面的玻尔兹曼分布规律得出。式中，P(E)是系统处于低能E时的概率；k为玻耳兹曼常数；T为系统温度。在神经网络的模拟过程中，注重的是基本概念与过程，而不是定量关系。为方便起见，在以后的分析过程中把k算入T。3.6随机神经网络3.6.1模拟退火算法模拟退火算法的基本思想如下：（1）初始化：初始温度T(充分高)，初始解状态S(算法迭代的起点)，每个T值的迭代次数L。（2）对k＝１,...,L依次进行步骤（3）-（6）。（3）产生新解S’。（4）计算增量ΔT＝C(S′)－C(S)，其中C(S)为评价函数。（5）若ΔT＜０则接受S’作为新的当前解，否则以概率e(-ΔT/T)接受S’作为新的当前解。（6）如果满足终止条件则输出当前解作为最优解，结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法。（7）T逐渐降低，且T➝０。然后转至步骤（2）。3.6随机神经网络3.6.1模拟退火算法模拟退火算法新解的产生和接受可分为以下四个步骤：（1）由一个产生函数从当前解产生一个位于解空间的新解，为便于后续的计算和接受。为了减少算法耗时，通常选择由当前新解经过简单地变换即可产生新解的方法。（2）计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生，所以目标函数差的计算最好按增量计算。（3）判断新解是否被接受。判断的依据是一个接受准则，最常用的接受准则是Metropolis准则：若ΔT＜０则接受S作为新的当前解S；否则以概率e(-ΔT/T)接受S′作为新的当前解S。（4）当新解被确定接受时，用新解代替当前解，这只需要将当前解中对应于产生新解时的部分予以变换，同时修正目标函数值。此时，当前解实现了一次迭代，在此基础上开始下一轮试验。当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。3.6随机神经网络3.6.1模拟退火算法模拟退火算法的特点：1.模拟退火算法与初始值无关，算法求得的解与初始解状态S(算法迭代的起点)无关。2.模拟退火算法具有渐近收敛性，已在理论上被证明是一种以概率1收敛于全局最优解的全局优化算法。3.模拟退火算法具有并行性。3.6随机神经网络3.6.2玻尔兹曼机网络模型玻尔兹曼机是由辛顿等于1984年提出的，其一般拓扑结构由输入层(节点数为n，为输入元素的扇出)、隐含层(节点数为q)及输出层(节点数为m)组成。设xi为神经元i的输出，则网络的状态变量可表示为x＝(x1,x2,...,xn)T，设网络的连接权值为wij，各神经元的阈值为{θi}，则神经元i的净输入为

，此时神经元i为1或0的概率如下。当网络温度T→0时，玻尔兹曼机神经元退化为离散型Hopfield神经元。3.6随机神经网络3.6.2玻尔兹曼机网络模型收敛情况：玻尔兹曼机网络也有同步和异步运行方式，对于异步串行的玻尔兹曼机网络，由于它的运行过程等价于相应状态能量函数的模拟退火过程，所以如果温度下降得足够慢，网络最终将收敛到能量函数的最小值，这也正是玻尔兹曼机网络可用于组合优化问题的原理。已经证明，对于全并行的网络，即使网络温度趋于0它也可能不收敛。如果是部分并行不太高，网络温度趋于0,则网络的大多数都收敛。3.6随机神经网络3.6.2玻尔兹曼机网络模型玻尔兹曼机与BP感知机在网络结构、数据表示及状态转换三个方面存在主要差异：（1）玻尔兹曼机由输入层节点到隐层节点的连接权值是对称的，即

。同样，从隐层节点到输入层节点的连接权值也是对称的。一般的BP感知机无此要求。同时，BP网络为前馈神经网络，输入层节点的输出值不受隐层及输出层节点的输出影响，但玻尔兹曼机则相互作用。（2）玻尔兹曼机的输入、输出及隐层状态都为二进制{0,1}，一般BP感知机为连续型输入及输出。（3）状态转移函数与BP感知机所使用的节点转移特性形状相似，但其意义不同。玻尔兹曼机按照概率曲线的能量分布进行状态的转移，转移是按概率的意义进行的。而BP感知机是利用S型函数对该节点的输入加权进行变换的，是具有确定性的。3.6随机神经网络3.6.2玻尔兹曼机学习算法结合模拟退火算法可给出玻尔兹曼机的一种训练算法，该算法试图把反映网络输入层、隐层和输出层之间的状态差异的熵测度降至最小。假设向量模式集合为{(X1,Y1),(X2,Y2),...,(Xp,Yp)}，玻尔兹曼机学习算法的步骤如下：(1)随机设定网络的初始连接权值wij(0)及初始温度。(2)按照已知概率依次给定训练样本，在训练样本的约束下按照模拟退火算法运行网络直到平衡状态，统计出各个，在无约束条件下按同样的步骤运行网络相同的次数，统计出各个。(3)根据修改每个权值。(4)重复上面的步骤，直到小于某个预设的容限。3.6随机神经网络3.6.2玻尔兹曼机学习算法玻尔兹曼机的学习算法可以分解为两个阶段，即正向学习阶段与反向学习阶段。在正向学习阶段，对网络环境节点(即输入层节点与输出层节点)加上固定信息Ak及Ck,k∈{1,2,...,p}，而让隐层节点自由动作。退火完毕后，记录相连的环境节点与隐层节点同时为状态１的概率Qhi和Rij，且让环境节点与隐层节点之间的连接权值随此概率以一定的比例增长，即至于反向学习阶段，只是把输入层加上固定信息Ak，让隐层及输出层自由动作。退火完毕后,记录相连的环境节点与隐层节点同时为状态１的概率Qhi′和Rij′，然后让其连接权值与此概率以一定的比例减少，即3.6随机神经网络3.6.2玻尔兹曼机学习算法其实,在实际退火过程中，正、反向学习一直是交叉进行的。也就是说，直到正向学习与反向学习达到足够的平衡(即Δwhi1及Δwij2足够小)时，认为网络已经基本上适应了环境。实际上，还有其他方法可用来确定连接权值的修改幅度，有一种在当前温度下取高斯分布来确定权值变化的方法。式中，W可由蒙特卡罗法得到。3.7深度学习3.7深度学习深度学习(DeepLearning)是机器学习研究中的一个新领域，其核心思想在于模拟人脑的层次抽象结构，通过无监督的方式分析大规模数据，发掘大数据中蕴藏的有价值信息。深度学习应大数据而生，给大数据提供了一个深度思考的大脑，深度学习就是堆叠多层，把这一层的输出作为下一层的输入。通过这种方式，就可以实现对输入信息进行分级表达。3.7深度学习3.7.1人脑视觉机理1981年的诺贝尔生理学或医学奖颁发给了休贝尔(D.H.Hubel)、威塞尔(T.N.Wiesel)及斯佩里(R.W.Sperry)。前两位的主要贡献是发现了“视觉系统的信息处理”，他们发现可视皮质是分级的。如图所示。该分级过程为，从低层的V1区提取边缘特征，到V2区的形状或目标的部分等，再到更高层，整个目标、目标的行为等。3.7深度学习3.7.2自编码器自编码器(AutoEncoder,AE)是一类在半监督学习和非监督学习中使用的人工神经网络，其功能是通过将输入信息作为学习目标，对输入信息进行表征学习(RepresentationLearning)。它是只有一层隐节点，输入和输出具有相同节点数的神经网络，其模型如图所示。按学习范式，自编码器可以分为收缩自编码器(UndercompleteAutoEncoder，UAE)、正则自编码器(RegularizedAutoEncoder，RAE)和变分自编码器(VariationalAutoEncoder，VAE)，前两者是判别模型，后者是生成模型。按构筑类型，自编码器可以是前馈结构或递归结构的神经网络。3.7深度学习3.7.2自编码器自编码器包含编码器(Encoder)和解码器(Decoder)两部分。目的是尽可能地复现输入信号，即求函数hw,b(x)≈x，也就是希望神经网络的输出等于输入。应用：自编码器具有一般意义上表征学习算法的功能，被应用于降维(DimensionalityReduction)和异常值检测(AnomalyDetection)。包含卷积层构筑的自编码器可被应用于计算机视觉问题，包括图像降噪(ImageDenoising)、神经风格迁移(NeuralStyleTransfer)等。3.7深度学习3.7.2自编码器自编码器是一个输入和学习目标相同的神经网络，其结构分为编码器和解码器两部分。给定输入空间和特征空间，求解两者的映射f、g使输入特征的重建误差达到最小。求解完成后，由编码器输出隐含层特征h，可视为输入数据X的表征。自编码器在多个领域有广泛应用，包括但不限于以下方面。数据降维与压缩：自编码器通过压缩数据（编码）提取其最重要的特征，可用于降维任务。特征提取：可以用自编码器提取数据中的关键特征，特别是在高维数据（如图像）中。去噪：自编码器可以用于去噪，通过在训练时输入带有噪声的数据，输出无噪声的重构图像或信号。生成数据：变分自编码器可以用于生成新数据，如图像、文本等。异常检测：通过训练自编码器重构正常数据，任何重构误差较大的数据点都可能是异常点。3.7深度学习3.7.3受限玻尔兹曼机受限玻尔兹曼机(RestrictedBoltzmanMachine,RBM)是一个单层的随机神经网络(通常不把输入层计算在神经网络的层数里)，其结构如图所示，本质上是一个概率图模型。从图中可以看出，输入层与隐层之间是全连接，但层内神经元之间没有相互连接。每个神经元要么被激活(值为1)，要么不被激活(值为0)，激活的概率满足S型函数。RBM的优点是，当给定一层时，另外一层是相互独立的，这样进行随机采样就比较方便，因为可以分别固定一层，采样另一层，交替进行。权值的每一次更新理论上需要所有神经元都采样无穷多次以后才能进行，即所谓的CD算法，3.7深度学习3.7.3受限玻尔兹曼机如果一个RBM包含n个可视单元和m个隐单元，用向量v和h分别表示可视单元和隐单元的状态。其中，vi表示第i个可视单元的状态，hj表示第j个隐单元的状态，那么，对于一组给定的状态v、h，RBM作为一个系统所具备的能量定义为式中，wij、bi、cj均为RBM的参数,且均为实数。其中wij表示可视单元i与隐单元j之间的连接强度，bi表示可视单元i的偏置，cj表示隐单元j的偏置。3.7深度学习3.7.3受限玻尔兹曼机RBM可通过极大似然法则进行无监督学习，假如有训练数据ν(1),ν(2),...,ν(d)，那么，RBM的目标等同于最大化目标函数，这里省略了偏置参数。为了用梯度上升算法进行训练，需先求出该目标函数对各个参数的偏导，经过代数变换后,得出最终的结果。上式以减号为界分为前后两部分,分别称为正相位和负相位。对于减号前面的部分，可以遍历整个训练数据，并利用公式直接算出。对于减号后面的部分,＜f(x)＞p(x)定义为函数f(x)在分布p(∙)上的均值，在RBM中，这个均值是无法通过数学推导得出解析式的。这便是RBM训练的主要困难所在。3.7深度学习3.7.3受限玻尔兹曼机为了减小RBM训练的计算复杂性，考虑让MCMC采样的状态以训练数据作为起点，可使用CD-n算法。在CD-n算法中，负相位的均值计算过程为：分别以各个训练数据作为初始状态，经过少数几次吉布斯采样状态转移，然后以转移后的状态作为样本，估算该均值。在实际应用中，只需要一次状态转移就能保证良好的学习效果。CD-n算法大大地加速了RBM的训练过程，这为近年来RBM的流行以及深度神经网络的兴起都做出了不可磨灭的贡献。不过，对于常规的极大似然学习，其学习过程等同于最小化RBM分布与训练数据分布之间的KL距离。在CD-n算法的学习中，这个规则是不成立的。因此，CD-n算法本质上并非是一个极大似然学习，经过CD-n算法得到的RBM模型，往往具备较差的模式生成能力。3.7深度学习3.7.4深度信念网络深度信念网络(DeepBeliefNets，DBN)深度信念网络（DeepBeliefNetworks，DBN）是一种由多层受限玻尔兹曼机（RestrictedBoltzmannMachines，RBMs）堆叠而成的深度学习模型。深度信念网络包含多个层次，每一层都学习数据中的高级抽象特征。在DBN中，最底层是可见层，负责接收输入数据。而顶层及其他所有隐藏层则是受限玻尔兹曼机，每个RBM层都学习输入数据的不同特征表示。DBN的一个关键特性是它的两阶段学习过程，首先是无监督的预训练，逐层调整权重，然后是有监督的微调，整体优化网络以提高特定任务的性能。DBN最初由欣顿等人在2006年提出，主要用于无监督特征学习。它结合了深度神经网络和信念网络的优点，通过逐层训练RBMs来学习数据的层次结构表示。DBN能够自动从数据中学习到有意义的特征表示，这些特征对于后续的分类、回归等任务非常重要。3.8自组织神经网络3.8自组织神经网络自组织神经网络是通过自动寻找样本中的内在规律和本质属性，自组织、自适应地改变网络参数与结构。多层感知机的学习和分类是以已知一定的先验知识为条件，即网络权值的调整是在监督情况下进行的。而在实际应用中，有时并不能提供所需的先验知识，这就需要网络具有能够自学习的能力。由科霍南(T.Kohonen)提出的自组织特征映射网络就是这种具有自学习功能的神经网络，这种神经网络是基于生理学和脑科学研究成果提出的。3.8自组织神经网络3.8.1网络的拓扑结构自组织特征映射网络(Self-OrganizingFeatureMaps,SOM)也称Kohonen网络。网络上层为输出节点，按某种形式排成了一个领域结构。对输出层中的每个神经元，规定它的邻域结构。输入节点处于下方，若输入向量有n个元素，则输入端有n个节点。所有输入节点到所有输出节点都有权值连接，而输出节点相互之间也有可能是局部连接的。自组织特征映射网络模型如图所示。网络的功能就是通过自组织方法用大量的样本训练数据来调整权值，使得网络的输出能够反映样本数据的分布情况。SOM可以用于样本排序、样本分类及样本特征检测等。3.8自组织神经网络3.8.2网络自组织算法模型网络自组织算法是指在网络环境中，由个体或节点基于一定的规则和机制，自发地形成具有特定功能和结构的组织或系统的方法。在网络自组织中，各个节点通常具有自主性和独立性，但它们之间存在着相互作用和关联。在

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能通识基础与应用课件

文档简介

温馨提示

最新文档

评论

人工智能通识基础与应用课件

文档简介

温馨提示

最新文档

评论

相关文档