




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
神经网络简介(2),多层网络,input layer,hidden layer(s),output layer,多层前馈网络的决策区域,如图可见,多层网络能够表示高度非线性决策面,比之前的单个单元的线性决策面表征能力更强。 问题:使用什么类型的的 单元来构建多层网络的基础?如果使用之前介绍的线性单元,多个线性单元的连接仍然是线性单元,而我们更希望表征非线性函数的网络。,sigmoid 单元,. . .,w1,w2,wn,w0,x0=1,z=i=0n wi xi,o,o=(z)=1/(1+e-z),(z) =1/(1+e-z) sigmoid function.,sigmoid 函数(logistic函数),(z) =1/(1+e-z),d(z)/dz= (z) (1- (z),梯度下降规则: 线性单元 e/wi = -d(td-od) od (1-od) xi 多层网络: 反向传播算法,反向传播算法,多层网络的学习算法。 反向传播的含义是通过对误差在神经网络中的反向传播,调整各个节点的权重,使得误差局部最小,反向传播算法(随机梯度下降),步骤: 初始化权重为小的随机数。 对于训练集中的每一个样本: 1. 计算此样本在神经网络中的输出 2. 对于每一个输出节点k,计算: 3. 对于每一个隐藏节点h,计算: 4. 更新权重: 其中:,反向传播算法的推导,梯度下降的权值修改法则 求导的链式法则,反向传播算法(输出节点),反向传播算法(输出节点),反向传播算法(隐藏节点),反向传播算法(内部节点),收敛性与局部最小值,对于多层网络,误差曲面可能含有多个不同的局部极小值,梯度下降可能陷入这些局部极小值的任何一个。因此,对于多层网络,反向传播算法仅能保证收敛到误差e的某个局部极小值,不一定收敛到全局最小误差。,缓解局部极小值问题一些常见的启发规则,为梯度更新法则加一个冲量项。冲量有时可以带动梯度下降过程冲过狭窄的局部极小值或滚过误差曲面上的平坦区域 使用随机的梯度下降而不是真正的梯度下降。不同误差曲面通常会有不同的局部极小值,这使得下降过程不太可能陷入任意一个局部极小值,使用多个同样的数据训练多个网络,但用不同的随机权值初始化每个网络。如果不同的训练产生不同的局部极小值,那么对分离的验证集合性能最好的那个网络被选中。或者保留所有的网络,并且把它们当作一个网络“委员会”,它们的输出是每个网络输出的平均值。,前馈网络的表征能力,布尔函数:任何布尔函数可以被具有两层单元的网络准确表示。 连续函数:每个有界
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 能力提升2.0方案解读
- 《窗边的小豆豆》课件
- 护理人员应知应会
- 皮牵引的护理诊断和措施
- 2025设备抵押贷款合同
- 2025二手车买卖合同范本
- 销售区域经理工作总结
- 公司总经理安全培训课件
- 红斑狼疮护理
- 2025解除购销合同协议书
- 2025年三方股权合作合同协议书
- 地方病竞赛试题及答案
- 弘扬伟大抗战精神为实现中华民族伟大复兴而奋斗2025-2026学年高二上学期爱国主义教育主题班会
- 社工抗压与情绪处理课件
- 单元考点必刷卷 (一)(含答案)我上学啦 2025-2026学年北师大版一年级数学上册
- 农村厨师安全培训课件
- 2025-2026学年人教版(2024)小学体育与健康三年级(全一册)教学设计(附目录P114)
- 起重机作业人员Q2证理论考试练习题含答案
- 四川遂宁2021-2024年中考满分作文64篇
- (完整)中小学“学宪法、讲宪法”知识竞赛题库及参考答案
- 轧钢安全规程培训课件
评论
0/150
提交评论