版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录1:深度学习发展史2:从神经网络到深度学习3:循环神经网络基础1第1页/共30页1:深度学习发展史2第2页/共30页深度学习发展史SVMBoostingDecision treeKNNNeural networkBack propagation19862006Deep belief netScienceSpeech2011 2012Computer visionNLPSpeech 2014Geoffrey Hinton 1949Learning model of neurons1958PerceptronHebbRosenblattGeoffrey Hinton DBNCNNRBMRNN机
2、器学习第一次浪潮:机器学习第二次浪潮浅层学习模型(Shallow Learning)深度学习模型(Deep Learning)First Winter of NNSecond Winter of NN3第3页/共30页synapse dendriteCell bodySynapticterminalsAxon轴突末梢 突触 树突细胞体轴突w1x1xn线性动态系统激励函数own神经元是构成神经网络的最基本单元(构件), 因此, 首要任务是构造人工神经元模型。细胞体Cell body树突dendrite突触synapse轴突Axon来自其它神经元神经元模型4第4页/共30页yyaxo x2x1xn
3、w1w2wnNNxwxwu11uifuifay0w1x1xn激励函数o=f(net)wnnet = WTX)(TnetfoxwXWnetii 典型的激励函数(Activation Function):线性函数,非线性斜面函数,阶跃函数,S型函数等。神经元模型5第5页/共30页Input LayerHidden LayerOutput Layerx1xMh1hLo1oNw11wm1wM1wmLwMLw1Lv11vl1vL1vLNmmlThhxwXWnetll)(lhlnetfh llnToohvHVnetnn)(nonnetfo 神经网络一般形式 Nonlinearity 非线性 Paralle
4、l Processing 并行处理 InputOutput Mapping 输入输出匹配 Adaptivity 自适应性ocx2x1xnw1w2wnckfonet)net(NNwxwx11net6第6页/共30页2:从神经网络到深度学习7第7页/共30页神经网络深度学习网络相似之处:不同之处:模拟人脑的分层网络结构;强调深度的重要性;突出特征学习的重要性;(逐层抽象)训练机制;8第8页/共30页为什么需要深度?深层网络具有刻画复杂函数的能力9第9页/共30页3:循环神经网络(RNN)10第10页/共30页递归神经网络模型11递归神经网络l吸收了HMM模型的有限序列关联的思想。l神经网络的隐藏层
5、结构能够更好的表达有限的观察值背后的复杂分布。l 递归神经网络(RNN),是两种人工神经网络的总称:l 一种是时间递归神经网络(recurrent neural network);l 一种是结构递归神经网络(recursive neural network);第11页/共30页递归神经网络模型12时序扩展第12页/共30页Recurrent Neural Network13l 针对对象:序列数据。例如文本,是字母和词汇的序列;语音,是音节的序列;视频,是图像的序列;气象观测数据,股票交易数据等等,也都是序列数据。l 核心思想:样本间存在顺序关系,每个样本和它之前的样本存在关联。通过神经网络在时
6、序上的展开,我们能够找到样本之间的序列相关性。RNN是一类扩展的人工神经网络,它是为了对序列数据进行建模而产生的。第13页/共30页循环神经网络模型14激活函数lRNN常用的激活函数是tanh和sigmoid。第14页/共30页循环神经网络模型15softmaxlSoftmax函数是sigmoid函数的一个变种,通常我们将其用在多分类任务的输出层,将输入转化成标签的概率。本质就是将一个K维的任意实数向量压缩(映射)成另一个K维的实数向量,其中向量中的每个元素取值都介于(0,1)之间。 第15页/共30页循环神经网络模型16简单循环网络SRN神经元之间的连接权重在时域上不变。第16页/共30页循
7、环神经网络模型17随时间反向传播算法BPTTBP回顾:定义损失函数 E 来表示输出 和真实标签y的误差,通过链式法则自顶向下求得 E 对网络权重的偏导。沿梯度的反方向更新权重的值,直到 E 收敛。BPTT的本质其实和BP很像,就是加上了时序演化。定义权重U,V,W。定义损失函数:我们将整个序列作为一次训练,所以需要对每个时刻的误差进行求和。第17页/共30页循环神经网络模型18随时间反向传播算法BPTT目前的任务是求 E 对于U,V,W 的梯度。定义E对于W 的梯度(U,V 同理):(1)求 E 对于V 的梯度。先求 E3 对于V 的梯度:W VU其中: 求和可得。第18页/共30页其中: 依
8、赖于 ,而 又依赖于 和W ,依赖关系一直传递到 t = 0 的时刻。因此,当我们计算对于W 的偏导数时,不能把 看作是常数项!循环神经网络模型19随时间反向传播算法BPTT(2)求 E 对于W 的梯度。注意,现在情况开始变得复杂起来。先求 E3 对于W 的梯度:W VU当我们求 对于W 的偏导时。注意到: 求和可得。第19页/共30页同样: 依赖于 ,而 又依赖于 和U 。类似求W,当我们计算对于U 的偏导数时,也不能把 看作是常数项!循环神经网络模型20随时间反向传播算法BPTT(3)求 E 对于U 的梯度。情况与W 类似。先求 E3 对于U 的梯度:W VU当我们求 对于W 的偏导时。注
9、意到: 求和可得。第20页/共30页循环神经网络模型21随时间反向传播算法BPTT参数意义: Whv:输入层到隐含层的权重参数,Whh:隐含层到隐含层的权重参数,Woh:隐含层到输出层的权重参数,bh:隐含层的偏移量,bo输出层的偏移量,h0:起始状态的隐含层的输出,一般初始为0。 第21页/共30页递归神经网络模型22随时间反向传播算法BPTT面临的问题:l 梯度消失问题l 梯度爆炸问题解决方案:l 选择其他的激活函数。例如ReLU。l 引入改进网络结构的机制,例如LSTM,GRU。l 现在在自然语言处理上应用十分广的的就是LSTM。第22页/共30页THANKS23LSTM LSTM 网络
10、网络长短期记忆网络通畅叫做”LSTMs”是一种特殊的RNNs, 它能够学习长期依赖。LSTM由Hochreiter&Schmidhuber(1997)引入,后来在很多人的努力下变得越来越精炼和流行第23页/共30页24f t ,i t ,o t 分别为遗忘门、输入门、输出门第24页/共30页25LSTMs的核心过程LSTM的第一步就是决定什么信息应该被神经元遗忘。这是一个被称为“遗忘门层”的Sigmod层组成的。它输入 ht1和xt,然后在Ct1 的每个神经元状态输出01之间的数字。“1”表示“完全保留这个”,“0”表示“完全遗忘这个”。 第25页/共30页26下一步就是决定我们要在神经元细胞中保存什么信息,这包括两个部分。首先,一个被称为“遗忘门层”的Sigmod层决定我们要更新的数值。然后,一个tanh层生成一个新的候选数值,Ct,它会被增加到神经元状态中。第26页/共30页27下一步我们就去做。 我们给旧的状态乘以一个ft,遗忘掉我们之前决定要遗忘的信息,然后我们增加it Ct。这是新的候选值,是由我们想多大程度上更新每个状态的值来度量的。 第27页/共30页28最后,我们要决
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖南长沙市第一医院自主招聘备考题库附答案详解【综合卷】
- 中国人民解放军第五七一八工厂 2026届校园招聘备考题库及参考答案详解(a卷)
- 2026江苏苏州太仓农商行招聘2人备考题库附参考答案详解(培优a卷)
- 2026山东省新动能基金管理有限公司校园招聘8人备考题库【必刷】附答案详解
- 2026天通苑北社区卫生服务中心招聘考试参考试题及答案解析
- 2026贵州安顺关岭自治县民族中等职业学校招聘社会培训外聘人员备考题库【综合卷】附答案详解
- 2026年上海第二工业大学单招职业适应性测试题库含答案详细解析
- 2026年天津职业技术师范大学单招职业技能考试题库附答案详细解析
- 2026年汕头职业技术学院单招综合素质考试题库含答案详细解析
- 智慧物流园区规划与建设总体方案
- 去极端化与民族团结课件
- 2025年大学试题(财经商贸)-商品学历年参考题库含答案解析(5套)
- 学堂在线 雨课堂 学堂云 遥测原理 章节测试答案
- 交通船管理办法
- 学堂在线 雨课堂 学堂云 中国建筑史-史前至两宋辽金 章节测试答案
- 代理记账人员管理制度
- 公司管理层离职管理制度
- 船舶建造监理合同协议
- (高清版)DB33∕T 881-2012 浙江省地质灾害危险性评估规范
- 高中音乐鉴赏爵士乐说课
- 陕西单招数学试题及答案
评论
0/150
提交评论