人工神经网络_第1页
人工神经网络_第2页
人工神经网络_第3页
人工神经网络_第4页
人工神经网络_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工神经网络,中国科学院自动化研究所吴高巍2016-11-29,1,联结主义学派,又称仿生学派或生理学派认为人的思维基元是神经元,而不是符号处理过程认为人脑不同于电脑核心:智能的本质是联接机制。原理:神经网络及神经网络间的连接机制和学习算法,麦卡洛可(McCulloch),皮茨(Pitts),2,什么是神经网络,所谓的人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统(计算机)。个体单元相互连接形成多种类型结构的图循环、非循环有向、无向自底向上(Bottom-Up)AI起源于生物神经系统从结构模拟到功能模拟,仿生,人工神经网络,3,内容,生物学启示多层神经网络Hopfield

2、网络自组织网络,4,生物学启示,5,神经元组成:细胞体,轴突,树突,突触神经元之间通过突触两两相连。信息的传递发生在突触。突触记录了神经元间联系的强弱。只有达到一定的兴奋程度,神经元才向外界传输信息。,生物神经元,6,神经元,神经元特性信息以预知的确定方向传递一个神经元的树突细胞体轴突突触另一个神经元树突时空整合性对不同时间通过同一突触传入的信息具有时间整合功能对同一时间通过不同突触传入的信息具有空间整合功能,7,神经元,工作状态兴奋状态,对输入信息整合后使细胞膜电位升高,当高于动作电位的阈值时,产生神经冲动,并由轴突输出。抑制状态,对输入信息整合后使细胞膜电位降低,当低于动作电位的阈值时,无

3、神经冲动产生。结构的可塑性神经元之间的柔性连接:突触的信息传递特性是可变的学习记忆的基础,8,神经元模型,从生物学结构到数学模型,9,人工神经元,M-P模型,McCllochandPitts,Alogicalcalculusoftheideasimmanentinnervousactivity,1943,f:激活函数(ActivationFunction)g:组合函数(CombinationFunction),10,WeightedSumRadialDistance,组合函数,11,(e)(f),Threshold,Linear,SaturatingLinear,LogisticSigmoid

4、,HyperbolictangentSigmoid,Gaussian,激活函数,12,人工神经网络,多个人工神经元按照特定的网络结构联接在一起,就构成了一个人工神经网络。神经网络的目标就是将输入转换成有意义的输出。,13,生物系统中的学习,自适应学习适应的目标是基于对环境信息的响应获得更好的状态在神经层面上,通过突触强度的改变实现学习消除某些突触,建立一些新的突触,14,生物系统中的学习,Hebb学习律神经元同时激活,突触强度增加异步激活,突触强度减弱学习律符合能量最小原则保持突触强度需要能量,所以在需要的地方保持,在不需要的地方不保持。,15,ANN的学习规则,能量最小ENERGYMINIM

5、IZATION对人工神经网络,需要确定合适的能量定义;可以使用数学上的优化技术来发现如何改变神经元间的联接权重。,ENERGY=measureoftaskperformanceerror,16,两个主要问题结构Howtointerconnectindividualunits?学习方法HowtoautomaticallydeterminetheconnectionweightsorevenstructureofANN?,SolutionstothesetwoproblemsleadstoaconcreteANN!,人工神经网络,17,前馈结构(FeedforwardArchitecture)-w

6、ithoutloops-static反馈/循环结构(Feedback/RecurrentArchitecture)-withloops-dynamic(non-lineardynamicalsystems),ANN结构,18,Generalstructuresoffeedforwardnetworks,Generalstructuresoffeedbacknetworks,19,通过神经网络所在环境的模拟过程,调整网络中的自由参数Learningbydata学习模型Incrementalvs.Batch两种类型Supervisedvs.Unsupervised,ANN的学习方法,20,若两端的

7、神经元同时激活,增强联接权重UnsupervisedLearning,学习策略:HebbrianLearning,21,最小化实际输出与期望输出之间的误差(Supervised)-DeltaRule(LMSRule,Widrow-Hoff)-B-PLearning,Objective:,Solution:,学习策略:ErrorCorrection,22,采用随机模式,跳出局部极小-如果网络性能提高,新参数被接受.-否则,新参数依概率接受,学习策略:StochasticLearning,23,“胜者为王”(Winner-take-all)UnsupervisedHowtocompete?-Har

8、dcompetitionOnlyoneneuronisactivated-SoftcompetitionNeuronsneighboringthetruewinnerareactivated.,学习策略:CompetitiveLearning,24,重要的人工神经网络模型,多层神经网络径向基网络Hopfield网络Boltzmann机自组织网络,25,多层感知机(MLP),26,感知机实质上是一种神经元模型阈值激活函数,Rosenblatt,1957,感知机,27,判别规则,输入空间中样本是空间中的一个点权向量是一个超平面超平面一边对应Y=1另一边对应Y=-1,28,单层感知机学习,调整权值,

9、减少训练集上的误差简单的权值更新规则:初始化对每一个训练样本:ClassifywithcurrentweightsIfcorrect,nochange!Ifwrong:adjusttheweightvector,29,30,学习:BinaryPerceptron,初始化对每一个训练样本:ClassifywithcurrentweightsIfcorrect(i.e.,y=y*),nochange!Ifwrong:adjusttheweightvectorbyaddingorsubtractingthefeaturevector.Subtractify*is-1.,30,多类判别情况,Ifweh

10、avemultipleclasses:Aweightvectorforeachclass:Score(activation)ofaclassy:Predictionhighestscorewins,31,学习:MulticlassPerceptron,初始化依次处理每个样本PredictwithcurrentweightsIfcorrect,nochange!Ifwrong:lowerscoreofwronganswer,raisescoreofrightanswer,32,感知机特性,可分性:trueifsomeparametersgetthetrainingsetperfectlycorr

11、ectCanrepresentAND,OR,NOT,etc.,butnotXOR收敛性:ifthetrainingisseparable,perceptronwilleventuallyconverge(binarycase),Separable,Non-Separable,33,感知机存在的问题,噪声(不可分情况):ifthedataisntseparable,weightsmightthrash泛化性:findsa“barely”separatingsolution,34,改进感知机,35,线性可分情况,Whichoftheselinearseparatorsisoptimal?,36,S

12、upportVectorMachines,Maximizingthemargin:goodaccordingtointuition,theory,practiceOnlysupportvectorsmatter;othertrainingexamplesareignorableSupportvectormachines(SVMs)findtheseparatorwithmaxmargin,SVM,37,优化学习,问题描述训练数据目标:发现最好的权值,使得对每一个样本x的输出都符合类别标签样本xi的标签可等价于标签向量采用不同的激活函数平方损失:,38,单层感知机,39,单层感知机,40,单层感

13、知机,41,单层感知机,采用线性激活函数,权值向量具有解析解批处理模式一次性更新权重缺点:收敛慢增量模式逐样本更新权值随机近似,但速度快并能保证收敛,42,多层感知机(MLP),层间神经元全连接,43,MLPs表达能力,3layers:Allcontinuousfunctions4layers:allfunctions,Howtolearntheweights?,waitingB-Palgorithmuntil1986,44,B-PNetwork,结构Akindofmulti-layerperceptron,inwhichtheSigmoidactivationfunctionisused.,

14、45,B-P算法,学习方法-Inputdatawasputforwardfrominputlayertohiddenlayer,thentooutlayer-Errorinformationwaspropagatedbackwardfromoutlayertohidderlayer,thentoinputlayer,Rumelhart&Meclelland,Nature,1986,46,B-P算法,GlobalErrorMeasure,desiredoutput,generatedoutput,squarederror,Theobjectiveistominimizethesquarederr

15、or,i.e.reachtheMinimumSquaredError(MSE),47,B-P算法,Step1.Selectapatternfromthetrainingsetandpresentittothenetwork.Step2.Computeactivationofinput,hiddenandoutputneuronsinthatsequence.Step3.Computetheerrorovertheoutputneuronsbycomparingthegeneratedoutputswiththedesiredoutputs.Step4.Usethecalculatederror

16、toupdateallweightsinthenetwork,suchthataglobalerrormeasuregetsreduced.Step5.RepeatStep1throughStep4untiltheglobalerrorfallsbelowapredefinedthreshold.,48,梯度下降方法,OptimizationmethodforfindingouttheweightvectorleadingtotheMSE,learningrate,gradient,vectorform:,elementform:,49,权值更新规则,Foroutputlayer:,50,权值

17、更新规则,Foroutputlayer:,51,权值更新规则,Forhiddenlayer,52,权值更新规则,Forhiddenlayer,53,应用:Handwrittendigitrecognition,3-nearest-neighbor=2.4%error40030010unitMLP=1.6%errorLeNet:7681923010unitMLP=0.9%errorCurrentbest(SVMs)0.4%error,54,MLPs:讨论,实际应用中PreprocessingisimportantNormalizeeachdimensionofdatato-1,1Adapting

18、thelearningratet=1/t,55,MLPs:讨论,优点:很强的表达能力容易执行缺点:收敛速度慢过拟合(Over-fitting)局部极小,采用Newton法,加正则化项,约束权值的平滑性采用更少(但足够数量)的隐层神经元,尝试不同的初始化增加扰动,56,Hopfield网络,57,反馈结构可用加权无向图表示DynamicSystem两种类型Discrete(1982)andContinuous(science,1984),byHopfield,Hopfield网络,Combinationfunction:WeightedSumActivationfunction:Threshol

19、d,58,吸引子与稳定性,Howdowe“program”thesolutionsoftheproblemintostablestates(attractors)ofthenetwork?Howdoweensurethatthefeedbacksystemdesignedisstable?Lyapunovsmodernstabilitytheoryallowsustoinvestigatethestabilityproblembymakinguseofacontinuousscalarfunctionofthestatevector,calledaLyapunov(Energy)Functio

20、n.,59,Hopfield网络的能量函数,WithinputWithoutinput,60,Hopfield模型,Hopfield证明了异步Hopfield网络是稳定的,其中权值定义为Whateverbetheinitialstateofthenetwork,theenergydecreasescontinuouslywithtimeuntilthesystemsettlesdownintoanylocalminimumoftheenergysurface.,61,Hopfield网络:联想记忆,Hopfield网络的一个主要应用基于与数据部分相似的输入,可以回想起数据本身(attracto

21、rstate)也称作内容寻址记忆(content-addressablememory).,StoredPattern,MemoryAssociation,虞台文,FeedbackNetworksandAssociativeMemories,62,Hopfield网络:AssociativeMemories,StoredPattern,MemoryAssociation,虞台文,FeedbackNetworksandAssociativeMemories,Hopfield网络的一个主要应用基于与数据部分相似的输入,可以回想起数据本身(attractorstate)也称作内容寻址记忆(conten

22、t-addressablememory).,63,Howtostorepatterns?,=?,64,Howtostorepatterns?,=?,:Dimensionofthestoredpattern,65,权值确定:外积(OuterProduct),Vectorform:Elementform:Why?SatisfytheHopfieldmodel,66,AnexampleofHopfieldmemory,虞台文,FeedbackNetworksandAssociativeMemories,67,68,Stable,E=4,E=0,E=4,Recallthefirstpattern(x1

23、),69,Stable,E=4,E=0,E=4,Recallthesecondpattern(x2),70,Hopfield网络:组合优化(CombinatorialOptimization),Hopfield网络的另一个主要应用将优化目标函数转换成能量函数(energyfunction)网络的稳定状态是优化问题的解,71,例:SolveTravelingSalesmanProblem(TSP),Givenncitieswithdistancesdij,whatistheshortesttour?,72,IllustrationofTSPGraph,1,2,3,4,5,6,7,8,9,10,1

24、1,73,HopfieldNetworkforTSP,=?,74,HopfieldNetworkforTSP,=,Citymatrix,Constraint1.Eachrowcanhaveonlyoneneuron“on”.2.Eachcolumncanhaveonlyoneneuron“on”.3.Foran-cityproblem,nneuronswillbeon.,75,HopfieldNetworkforTSP,1,2,4,3,5,Time,City,Thesalesmanreachescity5attime3.,76,WeightdeterminationforTSP:DesignE

25、nergyFunction,Constraint-1,Constraint-2,Constraint-3,77,能量函数转换为2DHopfield网络形式,Networkisbuilt!,78,Hopfield网络迭代(TSP),Theinitialstategeneratedrandomlygoestothestablestate(solution)withminimumenergy,A4-cityexample阮晓刚,神经计算科学,2006,79,自组织特征映射(SOFM),80,WhatisSOFM?,NeuralNetworkwithUnsupervisedLearningDimensionalityreductionconcomitantwithpreservationoftopologicalinformation.Threeprincipals-Self-reinforcing-Competition-Cooperation,81,StructureofSOFM,82,竞争(Competition),Findingthebestmatchingweightvectorforthepresentinput.Criterionfordeterminingthewinningneuron:MaximumInnerProductMinimumEuclide

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论