浙江大学人工神经网络课件-完整版PPT课件.ppt

上传人：文*** IP属地：广东上传时间：2020-03-06 格式：PPT 页数：353 大小：6.07MB 积分：12 举报 版权申诉

已阅读5页，还剩348页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2020 3 2 1 人工神经网络ArtificialNeuralNetworks 2020 3 2 2 蒋宗礼软件学科部联系电话 67392508Email jiangzl 办公地点信息北楼214 2020 3 2 3 教材书名人工神经网络导论出版社高等教育出版社出版日期 2001年8月定价 12 4元作者蒋宗礼 2020 3 2 4 主要参考书目 1 PhilipD Wasserman NeuralComputing TheoryandPractice VanNostrandReinhold 19892 胡守仁余少波戴葵神经网络导论国防科技大学出版社 1993年10月3 杨行峻郑君里人工神经网络高等教育出版社 1992年9月4 闻新周露王丹力熊晓英 MATLAB神经网络应用设计科学出版社 2001 5 2020 3 2 5 课程目的和基本要求作为人工神经网络的入门课程用于将学生引入人工神经网络及其应用的研究领域介绍人工神经网络及其基本网络模型使学生了解智能系统描述的基本模型掌握人工神经网络的基本概念单层网多层网循环网等各种基本网络模型的结构特点典型训练算法运行方式典型问题掌握软件实现方法 2020 3 2 6 课程目的和基本要求了解人工神经网络的有关研究思想从中学习开拓者们的部分问题求解方法通过实验进一步体会有关模型的用法和性能获取一些初步的经验查阅适当的参考文献将所学的知识与自己未来研究课题包括研究生论文阶段的研究课题相结合起来达到既丰富学习内容又有一定的研究和应用的目的 2020 3 2 7 主要内容智能及其实现ANN基础PerceptronBPCPN统计方法Hopfield网与BAMART 2020 3 2 8 主要内容第一章引论智能的概念智能系统的特点及其描述基本模型物理符号系统与连接主义的观点及其比较人工神经网络的特点发展历史 2020 3 2 9 主要内容第二章人工神经网络基础本章在介绍了基本神经元后将概要介绍人工神经网络的一般特性主要包括生物神经网络模型人工神经元模型与典型的激励函数人工神经网络的基本拓扑特性存储类型 CAM LTM AM STM 及映象 Supervised训练与Unsupervised训练 2020 3 2 10 主要内容第三章感知器感知器与人工神经网络的早期发展单层网能解决线性可分问题而无法解决线形不可分问题要想解决这一问题必须引入多层网 Hebb学习律 Delta规则感知器的训练算法实验实现一个感知器 2020 3 2 11 主要内容第四章向后传播BP Backpropagation 网络的构成及其训练过程隐藏层权调整方法的直观分析 BP训练算法中使用的Delta规则最速下降法的理论推导算法的收敛速度及其改进讨论 BP网络中的几个重要问题实验实现BP算法 2020 3 2 12 主要内容第五章对传网生物神经系统与异构网的引入对传网的网络结构 Kohonen层与Grossberg层的正常运行对传网的输入向量的预处理 Kohonen层的训练算法及其权矩阵的初始化方法 Grossberg层的训练完整的对传网实验实现基本的对传网 2020 3 2 13 主要内容第六章统计方法统计方法是为了解决局部极小点问题而引入的统计网络的基本训练算法模拟退火算法与收敛分析 Cauchy训练人工热处理与临界温度在训练中的使用 BP算法与Cauchy训练相结合实验实现模拟退火算法 2020 3 2 14 主要内容第七章循环网络循环网络的组织稳定性分析相联存储统计Hopfield网与Boltzmann机 Hopfield网用于解决TSP问题 BAM BidirectionalAssociativeMemory 用于实现双联存储基本双联存储网络的结构及训练其他的几种相联存储网络实验实现一个Hopfield网 2020 3 2 15 主要内容第八章自适应共振理论人脑的稳定性与可塑性问题 ART模型的总体结构与分块描述比较层与识别层之间的两个联接矩阵的初始化识别过程与比较过程查找的实现训练讨论 2020 3 2 16 第1章引言主要内容智能与人工智能 ANN的特点历史回顾与展望重点智能的本质 ANN是一个非线性大规模并行处理系统难点对智能的刻画 2020 3 2 17 第1章引言 1 1人工神经网络的提出1 2人工神经网络的特点1 3历史回顾 2020 3 2 18 第1章引言人类对人工智能的研究可以分成两种方式对应着两种不同的技术传统的人工智能技术心理的角度模拟基于人工神经网络的技术生理的角度模拟 2020 3 2 19 1 1人工神经网络的提出人工神经网络 ArtificialNeuralNetworks 简记作ANN 是对人类大脑系统的一阶特性的一种描述简单地讲它是一个数学模型可以用电子线路来实现也可以用计算机程序来模拟是人工智能研究的一种方法 2020 3 2 20 1 1人工神经网络的提出 1 1 1智能与人工智能一智能的含义智能是个体有目的的行为合理的思维以及有效的适应环境的综合能力智能是个体认识客观事物和运用知识解决问题的能力人类个体的智能是一种综合能力 2020 3 2 21 1 1人工神经网络的提出智能可以包含8个方面感知与认识客观事物客观世界和自我的能力感知是智能的基础最基本的能力通过学习取得经验与积累知识的能力这是人类在世界中能够不断发展的最基本能力理解知识运用知识和经验分析解决问题的能力这一能力可以算作是智能的高级形式是人类对世界进行适当的改造推动社会不断发展的基本能力 2020 3 2 22 1 1人工神经网络的提出联想推理判断决策语言的能力这是智能的高级形式的又一方面预测和认识主动和被动之分联想推理判断决策的能力是主动的基础运用进行抽象概括的能力上述这5种能力被认为是人类智能最为基本的能力 2020 3 2 23 1 1人工神经网络的提出作为5种能力综合表现形式的3种能力发现发明创造创新的能力实时迅速合理地应付复杂环境的能力预测洞察事物发展变化的能力 2020 3 2 24 1 1人工神经网络的提出二人工智能人工智能研究如何使类似计算机这样的设备去模拟人类的这些能力研究人工智能的目的增加人类探索世界推动社会前进的能力进一步认识自己三大学术流派符号主义或叫做符号逻辑主义学派联接主义或者叫做PDP 学派进化主义或者叫做行动响应学派 2020 3 2 25 1 1人工神经网络的提出 1 1 2物理符号系统人脑的反映形式化现实信息数据物理系统物理符号系统表现智能 2020 3 2 26 1 1人工神经网络的提出 Newell和Simon假说一个物理系统表现智能行为的充要条件是它有一个物理符号系统概念物理符号系统需要有一组称为符号的实体组成它们都是物理模型可以在另一类称为符号结构的实体中作为成分出现以构成更高级别的系统 2020 3 2 27 1 1人工神经网络的提出困难抽象舍弃一些特性同时保留一些特性形式化处理用物理符号及相应规则表达物理系统的存在和运行局限对全局性判断模糊信息处理多粒度的视觉信息处理等是非常困难的 2020 3 2 28 1 1人工神经网络的提出 1 1 3联接主义观点核心智能的本质是联接机制神经网络是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统ANN力求从四个方面去模拟人脑的智能行为物理结构计算模拟存储与操作训练 2020 3 2 29 1 1人工神经网络的提出 1 1 4两种模型的比较心理过程逻辑思维高级形式思维的表象生理过程形象思维低级形式思维的根本仿生人工神经网络联结主义观点物理符号系统 2020 3 2 30 1 1人工神经网络的提出物理符号系统和人工神经网络系统的差别 2020 3 2 31 1 1人工神经网络的提出两种人工智能技术的比较 2020 3 2 32 1 2人工神经网络的特点信息的分布表示运算的全局并行和局部操作处理的非线性 2020 3 2 33 1 2 1人工神经网络的概念 1 定义1 Hecht Nielsen 1988年人工神经网络是一个并行分布处理结构它由处理单元及其称为联接的无向讯号通道互连而成这些处理单元 PE ProcessingElement 具有局部内存并可以完成局部操作每个处理单元有一个单一的输出联接这个输出可以根据需要被分枝成希望个数的许多并行联接且这些并行联接都输出相同的信号即相应处理单元的信号信号的大小不因分支的多少而变化 2020 3 2 34 1 2 1人工神经网络的概念 1 Hecht Nielsen 1988年续处理单元的输出信号可以是任何需要的数学模型每个处理单元中进行的操作必须是完全局部的也就是说它必须仅仅依赖于经过输入联接到达处理单元的所有输入信号的当前值和存储在处理单元局部内存中的值 2020 3 2 35 1 2 1人工神经网络的概念强调并行分布处理结构一个处理单元的输出可以被任意分枝且大小不变输出信号可以是任意的数学模型处理单元完全的局部操作 2020 3 2 36 1 2 1人工神经网络的概念 2 Rumellhart McClelland Hinton的PDP1 一组处理单元 PE或AN 2 处理单元的激活状态 ai 3 每个处理单元的输出函数 fi 4 处理单元之间的联接模式 5 传递规则 wijoi 6 把处理单元的输入及当前状态结合起来产生激活值的激活规则 Fi 7 通过经验修改联接强度的学习规则 8 系统运行的环境样本集合 2020 3 2 37 1 2 1人工神经网络的概念 3 Simpson 1987年人工神经网络是一个非线性的有向图图中含有可以通过改变权大小来存放模式的加权边并且可以从不完整的或未知的输入找到模式 2020 3 2 38 1 2 1人工神经网络的概念 2 关键点 1 信息的分布表示 2 运算的全局并行与局部操作 3 处理的非线性特征3 对大脑基本特征的模拟1 形式上神经元及其联接 BN对AN2 表现特征信息的存储与处理 2020 3 2 39 1 2 1人工神经网络的概念 4 别名人工神经系统 ANS 神经网络 NN 自适应系统 AdaptiveSystems 自适应网 AdaptiveNetworks 联接模型 Connectionism 神经计算机 Neurocomputer 2020 3 2 40 1 2 2学习 Learning 能力人工神经网络可以根据所在的环境去改变它的行为自相联的网络异相联的网络它在接受样本集合A时可以抽取集合A中输入数据与输出数据之间的映射关系抽象功能不同的人工神经网络模型有不同的学习训练算法 2020 3 2 41 1 2 3基本特征的自动提取由于其运算的不精确性表现成去噪音容残缺的能力利用这种不精确性比较自然地实现模式的自动分类普化 Generalization 能力与抽象能力 2020 3 2 42 1 2 4信息的分布存放信息的分布存提供容错功能由于信息被分布存放在几乎整个网络中所以当其中的某一个点或者某几个点被破坏时信息仍然可以被存取系统在受到局部损伤时还可以正常工作并不是说可以任意地对完成学习的网络进行修改也正是由于信息的分布存放对一类网来说当它完成学习后如果再让它学习新的东西这时就会破坏原来已学会的东西 2020 3 2 43 1 2 5适应性 Applicability 问题擅长两个方面对大量的数据进行分类并且只有较少的几种情况必须学习一个复杂的非线性映射目前应用人们主要将其用于语音视觉知识处理辅助决策等方面在数据压缩模式匹配系统建模模糊控制求组合优化问题的最佳解的近似解不是最佳近似解等方面也有较好的应用 2020 3 2 44 1 3历史回顾 1 3 1萌芽期 20世纪40年代人工神经网络的研究最早可以追溯到人类开始研究自己的智能的时期到1949年止 1943年心理学家McCulloch和数学家Pitts建立起了著名的阈值加权和模型简称为M P模型发表于数学生物物理学会刊 BulletinofMethematicalBiophysics 1949年心理学家D O Hebb提出神经元之间突触联系是可变的假说 Hebb学习律 2020 3 2 45 1 3 2第一高潮期 1950 1968 以MarvinMinsky FrankRosenblatt BernardWidrow等为代表人物代表作是单级感知器 Perceptron 可用电子线路模拟人们乐观地认为几乎已经找到了智能的关键许多部门都开始大批地投入此项研究希望尽快占领制高点 2020 3 2 46 1 3 3反思期 1969 1982 M L Minsky和S Papert Perceptron MITPress 1969年异或运算不可表示二十世纪70年代和80年代早期的研究结果认识规律认识实践再认识 2020 3 2 47 1 3 4第二高潮期 1983 1990 1982年 J Hopfield提出循环网络用Lyapunov函数作为网络性能判定的能量函数建立ANN稳定性的判别依据阐明了ANN与动力学的关系用非线性动力学的方法来研究ANN的特性指出信息被存放在网络中神经元的联接上 2020 3 2 48 1 3 4第二高潮期 1983 1990 2 1984年 J Hopfield设计研制了后来被人们称为Hopfield网的电路较好地解决了著名的TSP问题找到了最佳解的近似解引起了较大的轰动 3 1985年 UCSD的Hinton Sejnowsky Rumelhart等人所在的并行分布处理 PDP 小组的研究者在Hopfield网络中引入了随机机制提出所谓的Boltzmann机 2020 3 2 49 1 3 4第二高潮期 1983 1990 4 1986年并行分布处理小组的Rumelhart等研究者重新独立地提出多层网络的学习算法 BP算法较好地解决了多层网络的学习问题 Paker1982和Werbos1974年国内首届神经网络大会是1990年12月在北京举行的 2020 3 2 50 1 3 5再认识与应用研究期 1991 问题 1 应用面还不够宽2 结果不够精确3 存在可信度的问题 2020 3 2 51 1 3 5再认识与应用研究期 1991 研究 1 开发现有模型的应用并在应用中根据实际运行情况对模型算法加以改造以提高网络的训练速度和运行的准确度 2 充分发挥两种技术各自的优势是一个有效方法3 希望在理论上寻找新的突破建立新的专用通用模型和算法 4 进一步对生物神经系统进行研究不断地丰富对人脑的认识 2020 3 2 52 第2章人工神经网络基础主要内容 BN与AN 拓扑结构存储训练重点 AN 拓扑结构训练难点训练 2020 3 2 53 第2章人工神经网络基础 2 1生物神经网2 2人工神经元2 3人工神经网络的拓扑特性2 4存储与映射2 5人工神经网络的训练 2020 3 2 54 2 1生物神经网 1 构成 2 工作过程 2020 3 2 55 2 1生物神经网 3 六个基本特征 1 神经元及其联接 2 神经元之间的联接强度决定信号传递的强弱 3 神经元之间的联接强度是可以随训练改变的 4 信号可以是起刺激作用的也可以是起抑制作用的 5 一个神经元接受的信号的累积效果决定该神经元的状态 6 每个神经元可以有一个阈值 2020 3 2 56 2 2人工神经元神经元是构成神经网络的最基本单元构件人工神经元模型应该具有生物神经元的六个基本特性 2020 3 2 57 2 2 1人工神经元的基本构成人工神经元模拟生物神经元的一阶特性输入 X x1 x2 xn 联接权 W w1 w2 wn T网络输入 net xiwi向量形式 net XW 2020 3 2 58 2 2 2激活函数 ActivationFunction 激活函数执行对该神经元所获得的网络输入的变换也可以称为激励函数活化函数 o f net 1 线性函数 LinerFunction f net k net c 2020 3 2 59 2 非线性斜面函数 RampFunction ifnet f net k netif net 0为一常数被称为饱和值为该神经元的最大输出 2020 3 2 60 2 非线性斜面函数 RampFunction 2020 3 2 61 3 阈值函数 ThresholdFunction 阶跃函数 ifnet f net ifnet 均为非负实数为阈值二值形式 1ifnet f net 0ifnet 双极形式 1ifnet f net 1ifnet 2020 3 2 62 3 阈值函数 ThresholdFunction 阶跃函数 o net 0 2020 3 2 63 4 S形函数压缩函数 SquashingFunction 和逻辑斯特函数 LogisticFunction f net a b 1 exp d net a b d为常数它的饱和值为a和a b 最简单形式为 f net 1 1 exp d net 函数的饱和值为0和1 S形函数有较好的增益控制 2020 3 2 64 4 S形函数 2020 3 2 65 2 2 3M P模型 McCulloch Pitts M P 模型也称为处理单元 PE 2020 3 2 66 上次课内容回顾擅长两个方面目前应用语音视觉知识处理数据压缩模式匹配系统建模模糊控制求组合优化问题的最佳解的近似解不是最佳近似解辅助决策预报与智能管理通信自适应均衡回波抵消路由选择 ATM中的呼叫接纳识别与控制空间科学对接导航制导飞行程序优化 2020 3 2 67 上次课内容回顾发展过程萌芽期 20世纪40年代 M P模型Hebb学习律第一高潮期 1950 1968 Perceptron的兴衰反思期 1969 1982 第二高潮期 1983 1990 4个标志性成果再认识与应用研究期 1991 2020 3 2 68 上次课内容回顾生物神经网六个基本特征神经元及其联接信号传递训练刺激与抑制累积效果阈值人工神经元的基本构成 2020 3 2 69 上次课内容回顾激活函数与M P模型线性函数非线性斜面函数阈值函数S形函数M P模型 2020 3 2 70 2 3人工神经网络的拓扑特性连接的拓扑表示 2020 3 2 71 2 3 1联接模式用正号可省略表示传送来的信号起刺激作用它用于增加神经元的活跃度用负号表示传送来的信号起抑制作用它用于降低神经元的活跃度层次又称为级的划分导致了神经元之间的三种不同的互连模式 2020 3 2 72 2 3 1联接模式 1 层级内联接层内联接又叫做区域内 Intra field 联接或侧联接 Lateral 用来加强和完成层内神经元之间的竞争2 循环联接反馈信号 2020 3 2 73 2 3 1联接模式 3 层级间联接层间 Inter field 联接指不同层中的神经元之间的联接这种联接用来实现层间的信号传递前馈信号反馈信号 2020 3 2 74 2 3 2网络的分层结构单级网简单单级网 2020 3 2 75 简单单级网 2020 3 2 76 简单单级网 W wij 输出层的第j个神经元的网络输入记为netj netj x1w1j x2w2j xnwnj其中 1 j m 取NET net1 net2 netm NET XWO F NET 2020 3 2 77 单级横向反馈网 2020 3 2 78 单级横向反馈网 V vij NET XW OVO F NET 时间参数神经元的状态在主时钟的控制下同步变化考虑X总加在网上的情况NET t 1 X t W O t VO t 1 F NET t 1 O 0 0考虑仅在t 0时加X的情况稳定性判定 2020 3 2 79 多级网 2020 3 2 80 层次划分信号只被允许从较低层流向较高层层号确定层的高低层号较小者层次较低层号较大者层次较高输入层被记作第0层该层负责接收来自网络外部的信息 2020 3 2 81 第j层第j 1层的直接后继层 j 0 它直接接受第j 1层的输出输出层它是网络的最后一层具有该网络的最大层号负责输出网络的计算结果隐藏层除输入层和输出层以外的其它各层叫隐藏层隐藏层不直接接受外界的信号也不直接向外界发送信号 2020 3 2 82 约定输出层的层号为该网络的层数 n层网络或n级网络第j 1层到第j层的联接矩阵为第j层联接矩阵输出层对应的矩阵叫输出层联接矩阵今后在需要的时候一般我们用W j 表示第j层矩阵 2020 3 2 83 多级网 h层网络 2020 3 2 84 多级网非线性激活函数F X kX CF3 F2 F1 XW 1 W 2 W 3 2020 3 2 85 循环网 2020 3 2 86 循环网如果将输出信号反馈到输入端就可构成一个多层的循环网络输入的原始信号被逐步地加强被修复大脑的短期记忆特征看到的东西不是一下子就从脑海里消失的稳定反馈信号会引起网络输出的不断变化我们希望这种变化逐渐减小并且最后能消失当变化最后消失时网络达到了平衡状态如果这种变化不能消失则称该网络是不稳定的 2020 3 2 87 2 4存储与映射空间模式 SpatialModel 时空模式 SpatialtemporalModel 空间模式三种存储类型1 RAM方式 RandomAccessMemory 随机访问方式是将地址映射到数据 2 CAM方式 ContentAddressableMemory 内容寻址方式是将数据映射到地址 3 AM方式 AssociativeMemory 相联存储方式是将数据映射到数据 2020 3 2 88 2 4存储与映射后续的两种方式是人工神经网络的工作方式在学习训练期间人工神经网络以CAM方式工作权矩阵又被称为网络的长期存储 LongTermMemory 简记为LTM 网络在正常工作阶段是以AM方式工作的神经元的状态表示的模式为短期存储 ShortTermMemory 简记为STM 2020 3 2 89 2 4存储与映射自相联 Auto associative 映射训练网络的样本集为向量集合为 A1 A2 An 在理想情况下该网络在完成训练后其权矩阵存放的将是上面所给的向量集合 2020 3 2 90 2 4存储与映射异相联 Hetero associative 映射 A1 B1 A2 B2 An Bn 该网络在完成训练后其权矩阵存放的将是上面所给的向量集合所蕴含的对应关系当输入向量A不是样本的第一的分量时样本中不存在这样的元素 Ak Bk 使得Ai Ak A或者A Ak Aj且此时有Ai A Aj则向量B是Bi与Bj的插值 2020 3 2 91 2 5人工神经网络的训练人工神经网络最具有吸引力的特点是它的学习能力 1962年 Rosenblatt给出了人工神经网络著名的学习定理人工神经网络可以学会它可以表达的任何东西人工神经网络的表达能力大大地限制了它的学习能力人工神经网络的学习过程就是对它的训练过程 2020 3 2 92 2 5 1无导师学习无导师学习 UnsupervisedLearning 与无导师训练 UnsupervisedTraining 相对应抽取样本集合中蕴含的统计特性并以神经元之间的联接权的形式存于网络中 2020 3 2 93 2 5 1无导师学习 Hebb学习律竞争与协同 CompetitiveandCooperative 学习随机联接系统 RandomlyConnectedLearning 等 Hebb算法 D O Hebb在1961年的核心当两个神经元同时处于激发状态时被加强否则被减弱数学表达式表示 Wij t 1 Wij t oi t oj t 2020 3 2 94 2 5 2有导师学习有导师学习 SupervisedLearning 与有导师训练 SupervisedTraining 相对应输入向量与其对应的输出向量构成一个训练对有导师学习的训练算法的主要步骤包括 1 从样本集合中取一个样本 Ai Bi 2 计算出网络的实际输出O 3 求D Bi O 4 根据D调整权矩阵W 5 对每个样本重复上述过程直到对整个样本集来说误差不超过规定范围 2020 3 2 95 Delta规则 Widrow和Hoff的写法 Wij t 1 Wij t yj aj t oi t 也可以写成 Wij t 1 Wij t Wij t Wij t joi t j yj aj t Grossberg的写法为 Wij t ai t oj t Wij t 更一般的Delta规则为 Wij t g ai t yj oj t Wij t 2020 3 2 96 其它再例学习外部环境对系统的输出结果给出评价学习系统通过强化受奖的动作来改善自身性能学习规则误差纠错学习Hebb学习竞争学习 2020 3 2 97 练习题 P291 4 6 10 15 2020 3 2 98 上次课内容回顾网络的分层结构联接模式刺激联接与抑制联接前馈信号与反馈信号层级内联接循环联接层级间联接简单单级网 NET XW O F NET 单级横向反馈网 NET XW O t V O t F NET 2020 3 2 99 上次课内容回顾网络的分层结构非循环多级网层次划分非线性激活函数 F3 F2 F1 XW1 W2 W3 循环网短期记忆特征及其对输入信号的修复作用时间参数与主时钟稳定性 2020 3 2 100 上次课内容回顾存储与映射模式空间模式时空模式模式三种存储类型RAM CAM AM模式的存储与运行CAM LTM 训练AM STM 运行相联自相联映射异相联映射 2020 3 2 101 上次课内容回顾训练 Rosenblatt的学习定理无导师学习抽取样本集合中蕴含的统计特性样本集 A1 A2 An Hebb算法 Wij t 1 Wij t oi t oj t 有导师学习抽取样本蕴含的映射关系样本集 A1 B1 A2 B2 An Bn 训练算法Delta规则 2020 3 2 102 第3章感知器主要内容感知器与人工神经网络的早期发展线性可分问题与线性不可分问题 Hebb学习律 Delta规则感知器的训练算法重点感知器的结构表达能力学习算法难点感知器的表达能力 2020 3 2 103 第3章感知器 3 1感知器与人工神经网络的早期发展3 2感知器的学习算法3 2 1离散单输出感知器训练算法3 2 2离散多输出感知器训练算法3 2 3连续多输出感知器训练算法3 3线性不可分问题3 3 1异或 Exclusive OR 问题3 3 2线性不可分问题的克服实现问题的发现与解决 2020 3 2 104 3 1感知器与ANN的早期发展 McCulloch和Pitts1943年发表第一个系统的ANN研究阈值加权和 M P 数学模型 1947年开发出感知器 1949年提出Hebb学习律单输出的感知器 M P模型 2020 3 2 105 3 1感知器与ANN的早期发展 1962年 Rosenblatt宣布人工神经网络可以学会它能表示的任何东西 2020 3 2 106 3 2感知器的学习算法感知器的学习是有导师学习感知器的训练算法的基本原理来源于著名的Hebb学习律基本思想逐步地将样本集中的样本输入到网络中根据输出结果和理想输出之间的差别来调整网络中的权矩阵 2020 3 2 107 3 2 1离散单输出感知器训练算法二值网络自变量及其函数的值向量分量的值只取0和1函数向量权向量 W w1 w2 wn 输入向量 X x1 x2 xn 训练样本集 X Y Y为输入向量X对应的输出 2020 3 2 108 算法3 1离散单输出感知器训练算法 1 初始化权向量W 2 重复下列过程直到训练完成 2 1对每个样本 X Y 重复如下过程 2 1 1输入X 2 1 2计算o F XW 2 1 3如果输出不正确则当o 0时取W W X 当o 1时取W W X 2020 3 2 109 3 2 2离散多输出感知器训练算法样本集 X Y Y为输入向量X对应的输出输入向量 X x1 x2 xn 理想输出向量 Y y1 y2 ym 激活函数 F权矩阵W wij 实际输出向量 O o1 o2 om 2020 3 2 110 算法3 2离散多输出感知器训练算法 1 初始化权矩阵W 2 重复下列过程直到训练完成 2 1对每个样本 X Y 重复如下过程 2 1 1输入X 2 1 2计算O F XW 2 1 3forj 1tomdo执行如下操作 ifoj yjthenifoi 0thenfori 1tonwij wij xielsefori 1tondowij wij xi 2020 3 2 111 算法3 2离散多输出感知器训练算法算法思想将单输出感知器的处理逐个地用于多输出感知器输出层的每一个神经元的处理第1步权矩阵的初始化一系列小伪随机数 2020 3 2 112 算法3 2离散多输出感知器训练算法第2步循环控制方法1 循环次数控制法对样本集执行规定次数的迭代改进分阶段迭代控制设定一个基本的迭代次数N 每当训练完成N次迭代后就给出一个中间结果 2020 3 2 113 算法3 2离散多输出感知器训练算法方法2 精度控制法给定一个精度控制参数精度度量实际输出向量与理想输出向量的对应分量的差的绝对值之和实际输出向量与理想输出向量的欧氏距离的和死循环网络无法表示样本所代表的问题 2020 3 2 114 算法3 2离散多输出感知器训练算法方法3 综合控制法将这两种方法结合起来使用注意精度参数的设置根据实际问题选定初始测试阶段精度要求低测试完成后再给出实际的精度要求 2020 3 2 115 3 2 3连续多输出感知器训练算法用公式wij wij yj oj xi取代了算法3 2第2 1 3步中的多个判断yj与oj之间的差别对wij的影响由 yj oj xi表现出来好处不仅使得算法的控制在结构上更容易理解而且还使得它的适应面更宽 2020 3 2 116 算法3 3连续多输出感知器训练算法 1 用适当的小伪随机数初始化权矩阵W 2 初置精度控制参数学习率精度控制变量d 1 3 Whiled do3 1d 0 3 2for每个样本 X Y do3 2 1输入X x1 x2 xn 3 2 2求O F XW 3 2 3修改权矩阵W fori 1ton j 1tomdowij wij yj oj xi 3 2 4累积误差forj 1tomdod d yj oj 2 2020 3 2 117 算法3 3连续多输出感知器训练算法 1 程序实现 d i j n m为简单变量来表示 W为n行m列的二维数组样本集二维数组2 系统的调试3 Minsky在1969年证明有许多基本问题是感知器无法解决4 问题线性可分性可能与时间有关5 很难从样本数据集直接看出问题是否线性可分6 未能证明一个感知器究竟需要经过多少步才能完成训练 2020 3 2 118 3 3线性不可分问题 3 3 1异或 Exclusive OR 问题 2020 3 2 119 用于求解XOR的单神经元感知器 2020 3 2 120 线性不可分函数 2020 3 2 121 线性不可分函数 R O Windner1960年 2020 3 2 122 3 3 2线性不可分问题的克服用多个单级网组合在一起并用其中的一个去综合其它单级网的结果我们就可以构成一个两级网络该网络可以被用来在平面上划分出一个封闭或者开放的凸域来一个非凸域可以拆分成多个凸域按照这一思路三级网将会更一般一些我们可以用它去识别出一些非凸域来解决好隐藏层的联接权的调整问题是非常关键的 2020 3 2 123 两级单输出网在n维空间中划分出m边凸域 2020 3 2 124 第1次课堂测试 5分 4 Newell和Simon的物理符号系统所基于的假说是什么它在什么层面上如何实现对人类智能的模拟联接主义观点所基于的假说是什么它在什么层面上如何实现对人类智能的模拟画出有导师算法的流程图证明一个激活函数为线性函数的3级非循环网等价于一个单级网 2020 3 2 125 习题 P381 6 2020 3 2 126 第1次课堂测试解答要点 Newell和Simon的物理符号系统所基于的假说是什么它在什么层面上如何实现对人类智能的模拟要点物理符号系统心理符号对事务及变换的描述联接主义观点所基于的假说是什么它在什么层面上如何实现对人类智能的模拟要点联接机制生理模式联接权的调整与对变换的表示 2020 3 2 127 第1次课堂测试解答要点画出有导师学习算法的流程图要点如何处理精度与样本集两层循环证明一个激活函数为线性函数的3级非循环网等价于一个单级网要点一级网与多级网的的数学模型 2020 3 2 128 上次课内容回顾学习算法离散单输出感知器训练算法W W X W W XW W Y O X离散多输出感知器训练算法Wj Wj yj oj X连续多输出感知器训练算法wij wij yj oj xi 2020 3 2 129 上次课内容回顾线性不可分问题线性不可分问题的克服两级网络可以划分出封闭或开放的凸域多级网将可以识别出非凸域隐藏层的联接权的调整问题是非常关键 2020 3 2 130 第4章BP网络主要内容 BP网络的构成隐藏层权的调整分析Delta规则理论推导算法的收敛速度及其改进讨论BP网络中的几个重要问题重点 BP算法难点 Delta规则的理论推导 2020 3 2 131 第4章BP网络 4 1概述4 2基本BP算法4 3算法的改进4 4算法的实现4 5算法的理论基础4 6几个问题的讨论 2020 3 2 132 4 1概述 1 BP算法的出现非循环多级网络的训练算法UCSDPDP小组的Rumelhart Hinton和Williams1986年独立地给出了BP算法清楚而简单的描述1982年 Paker就完成了相似的工作1974年 Werbos已提出了该方法2 弱点训练速度非常慢局部极小点的逃离问题算法不一定收敛 3 优点广泛的适应性和有效性 2020 3 2 133 4 2基本BP算法 4 2 1网络的构成神经元的网络输入 neti x1w1i x2w2i xnwni神经元的输出 2020 3 2 134 输出函数分析应该将net的值尽量控制在收敛比较快的范围内可以用其它的函数作为激活函数只要该函数是处处可导的 2020 3 2 135 网络的拓扑结构 2020 3 2 136 网络的拓扑结构 BP网的结构输入向量输出向量的维数网络隐藏层的层数和各个隐藏层神经元的个数的决定实验增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力 BP网一般都选用二级网络 2020 3 2 137 网络的拓扑结构 2020 3 2 138 4 2 2训练过程概述样本输入向量理想输出向量权初始化小随机数与饱和状态不同保证网络可以学 1 向前传播阶段 1 从样本集中取一个样本 Xp Yp 将Xp输入网络 2 计算相应的实际输出Op Op Fl F2 F1 XpW 1 W 2 W L 2020 3 2 139 4 2 2训练过程概述 2 向后传播阶段误差传播阶段 1 计算实际输出Op与相应的理想输出Yp的差 2 按极小化误差的方式调整权矩阵 3 网络关于第p个样本的误差测度 4 网络关于整个样本集的误差测度 2020 3 2 140 4 2 3误差传播分析 1 输出层权的调整 wpq wpq wpq wpq qop fn netq yq oq op oq 1 oq yq oq op 2020 3 2 141 2 隐藏层权的调整 2020 3 2 142 2 隐藏层权的调整 pk 1的值和 1k 2k mk有关不妨认为 pk 1通过权wp1对 1k做出贡献通过权wp2对 2k做出贡献通过权wpm对 mk做出贡献 pk 1 fk 1 netp wp1 1k wp2 2k wpm mk 2020 3 2 143 2 隐藏层权的调整 vhp vhp vhp vhp pk 1ohk 2 fk 1 netp wp1 1k wp2 2k wpm mk ohk 2 opk 1 1 opk 1 wp1 1k wp2 2k wpm mk ohk 2 2020 3 2 144 上次课内容回顾基本BP算法neti x1w1i x2w2i xnwni 2020 3 2 145 上次课内容回顾 2020 3 2 146 上次课内容回顾样本权初始化向前传播阶段Op Fn F2 F1 XpW 1 W 2 W n 误差测度 2020 3 2 147 上次课内容回顾向后传播阶段误差传播阶段输出层权的调整 wpq qop fn netq yq oq op oq 1 oq yq oq op隐藏层权的调整 vhp opk 1 1 opk 1 wp1 1k wp2 2k wpm mk ohk 2 2020 3 2 148 4 2 4基本的BP算法样本集 S X1 Y1 X2 Y2 Xs Ys 基本思想逐一地根据样本集中的样本 Xk Yk 计算出实际输出Ok和误差测度E1 对W 1 W 2 W L 各做一次调整重复这个循环直到 Ep 用输出层的误差调整输出层权矩阵并用此误差估计输出层的直接前导层的误差再用输出层前导层误差估计更前一层的误差如此获得所有其它各层的误差估计并用这些估计实现对权矩阵的修改形成将输出端表现出的误差沿着与输入信号相反的方向逐级向输入端传递的过程 2020 3 2 149 算法4 1基本BP算法 1fork 1toLdo1 1初始化W k 2初始化精度控制参数 3E 1 4whileE do4 1E 0 2020 3 2 150 算法4 1基本BP算法 4 2对S中的每一个样本 Xp Yp 4 2 1计算出Xp对应的实际输出Op 4 2 2计算出Ep 4 2 3E E Ep 4 2 4根据相应式子调整W L 4 2 5k L 1 4 2 6whilek 0do4 2 6 1根据相应式子调整W k 4 2 6 2k k 14 3E E 2 0 2020 3 2 151 4 3算法的改进 1 BP网络接受样本的顺序对训练结果有较大影响它更偏爱较后出现的样本2 给集中的样本安排一个适当的顺序是非常困难的 3 样本顺序影响结果的原因分别依次 4 用 X1 Y1 X2 Y2 Xs Ys 的总效果修改W 1 W 2 W L w k ij pw k ij 2020 3 2 152 算法4 2消除样本顺序影响的BP算法 1fork 1toLdo1 1初始化W k 2初始化精度控制参数 3E 1 4whileE do4 1E 0 4 2对所有的i j k w k ij 0 2020 3 2 153 4 3对S中的每一个样本 Xp Yp 4 3 1计算出Xp对应的实际输出Op 4 3 2计算出Ep 4 3 3E E Ep 4 3 4对所有i j根据相应式子计算 pw L ij 4 3 5对所有i j w L ij w L ij pw L ij 4 3 6k L 1 4 3 7whilek 0do4 3 7 1对所有i j根据相应式子计算 pw k ij 4 3 7 2对所有i j w k ij w k ij pw k ij 4 3 7 3k k 14 4对所有i j k w k ij w k ij w k ij 4 5E E 2 0 2020 3 2 154 算法4 2分析较好地解决了因样本的顺序引起的精度问题和训练的抖动问题收敛速度比较慢偏移量给每一个神经元增加一个偏移量来加快收敛速度冲量联接权的本次修改要考虑上次修改的影响以减少抖动问题 2020 3 2 155 算法4 2分析冲量设置 Rumelhart等人1986年 wij joi wij wij 为上一次的修改量为冲量系数一般可取到0 9Sejnowski与Rosenberg 1987年 wij 1 joi wij wij 也是上一次的修改量在0和1之间取值 2020 3 2 156 4 4算法的实现主要数据结构W H m 输出层的权矩阵 V n H 输入隐藏层的权矩阵 o m 输出层各联接权的修改量组成的向量 h H 隐藏层各联接权的修改量组成的向量 O1 隐藏层的输出向量 O2 输出层的输出向量 X Y 一个样本 2020 3 2 157 算法的主要实现步骤用不同的小伪随机数初始化W V 初始化精度控制参数学习率循环控制参数E 1 循环最大次数M 循环次数控制参数N 0 whileE N Mdo4 1N N 1 E 0 4 2对每一个样本 X Y 执行如下操作 2020 3 2 158 4 2对每一个样本 X Y 执行的操作 4 2 1计算 O1 F1 XV O2 F2 O1W 4 2 2计算输出层的权修改量fori 1tom4 2 2 1 o i O2 i 1 O2 i Y i O2 i 4 2 3计算输出误差 fori 1tom4 2 3 1E E Y i O2 i 2 2020 3 2 159 4 2对每一个样本 X Y 执行的操作 4 2 4计算隐藏层的权修改量 fori 1toH4 2 4 1Z 0 4 2 4 2forj 1tomdoZ Z W i j o j 4 2 4 3 h i Z O1 i 1 O1 i 4 2 5修改输出层权矩阵 fork 1toH i 1tom4 2 5 1W k i W k i O1 k o i 4 2 5修改隐藏层权矩阵 fork 1ton i 1toH4 2 5 1V k i V k i X k h i 2020 3 2 160 建议隐藏层的神经元的个数H作为一个输入参数同时将循环最大次数M等作为算法的输入参数在调试阶段最外层循环内加一层控制以探测网络是否陷入了局部极小点 2020 3 2 161 4 5算法的理论基础基本假设网络含有L层联接矩阵 W 1 W 2 W L 第k层的神经元 Hk个自变量数 n H1 H1 H2 H2 H3 HL m样本集 S X1 Y1 X2 Y2 Xs

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

浙江大学人工神经网络课件-完整版PPT课件.ppt

文档简介

温馨提示

最新文档

评论

浙江大学人工神经网络课件-完整版PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档