下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
长短记忆神经网络概述1.1LSTM的基本结构长短期记忆网络LSTM是循环神经网络的一个变体,其目的是为了防止在模型建立的过程中依赖性记忆下降情况的出现。LSTM在传统的循环神经网络的基础上,添加了输入门、输出门和遗忘门部分,防止传统循环神经网络模型中的梯度消失或者爆炸的情况的出现。并且,在LSTM网络中还添加了一个信息的存储器,即在网络的隐藏层中添加了一个单元状态c(t)。首先,定义输入门的函数为Sigmoid函数,可以决定哪一个值是需要被更新的,然后,在c(t)中加入tanh层,使其转变成一个新的候选向量模型中出现的梯度消失状况大多是与非线性激活函数有关的,逆向传播时,用到的非线性激活函数越多,梯度的衰减程度越大。而LSTM网络中的c(t)由于在训练过程中只与数乘和加法有关,因此可以有效的保存梯度以及整个网络的追溯期。LSTM网络中最为重要的一环是,通过三个特殊门对c(t)加以控制。在时刻t,整个LSTM网络一共有三个输入(x(t−1)cti(t)f(t)c(t)o(t)h(t)式中i(t)、f(t)、σ、tanh——分别表示Sigmoid函数和双曲正切激活函数;W、b——分别为相应的权重系数矩阵和偏置项;c(t)——th(t)——图2-1LSTM单元结构示意图Sigmoid函数和双曲正切函数分别见式(2-23)、(2-24)。σxtanhx=1.2双向RNN和双向LSTM双向循环神经网络(BRNN)是在传统的循环神经网络的基础上,增加了一条由后向前学习的路线,与原有的由前向后学习的路线相互配合,充分学习到数据的内在特征。2005年,双向LSTM也在传统LSTM的基础上被提了出来,实验结果表明,双向LSTM模型的精确度要高于最初的单向LSTM模型,这个结论也在很多其他问题的研究过程中被证实,比如语音分类、数字分类等。双向LSTM网络包括了两个LSTM网络,其中一个用来训练前向序列,另一个用来训练后向序列。这种结构的优越性体现在保留初始LSTM网络原有的优势的前提下,可以在输出层的同一时刻得到未来信息和历史信息,从而完成任务更为高效。结构如图2-2:图2-2BLSTM结构图2-2中,圆中的xt表示模型在t时刻的输入数据;矩形框中的LSTM为式(2-17)至式(2-22)描述的模型;ht和ht分别代表前向的LSTM与后向的LSTM在t时刻的输出表示,那么直接组合ht与ht得到h1.3LSTM的参数选择(1)batchsize(批量大小)Mini-batch的思想为:将整个时间序列数据分成多个长度为batchsize的小规模序列,将每一个小规模序列作为一个训练批次,进行迭代训练,训练次数为epoch。其中,小规模序列的长度的选择极为重要,直接影响了模型训练所花费的时间以及模型的优化程度,如果太小,则耗费大量的时间且不利于模型的收敛,如果太大,会导致相邻的两个小规模序列之间的差别不明显,模型结果容易陷入到局部最小值。(2)优化算法运用Adam算法来对模型中的参数进行迭代训练,算法的本质建立在梯度的一、二阶矩估计的计算上面,其优越性体现在参数更新过程中的平稳程度,公式如下:mt式中mtntmt——梯度的一阶矩估计nt——梯度的二阶矩估计(3)学习率在模型的训练过程中,学习率通过调整模型中优化参数的幅度,进而控制模型的训练速度,如果学习率设置过低,导致模型的训练速度太慢,学习率设置过高,会使得模型在训练时摇摆于几个极优值之间。通常情况下,学习率的设置是通过反复的实验确定的,没有一个特定的设置规则可以遵循。(4)epoch(训练次数)训练集中全部样本的训练总次数。(5)step(训练步长)训练模型的步数。(6)dropout由于整个神经网络结构采用的连接方式为全连接且网络层数较高,可能会导致模型的训练难度变大,收敛速度变慢,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 落地式钢管脚手架施工设计方案(附计算书)
- 体育场地各项施工工艺设计
- 装饰装修隐蔽工程验收记录单
- 植树节活动方案7篇
- 二月下旬主治医师考试妇科综合测试卷(附答案)
- 法考试卷(一)甄题综合练习题含答案
- 人工智能应用于物联网技术探讨
- 非全日制用工合同模板
- 《医院感染诊断标准》试题含答案
- 2026年保密教育线上培训真题试卷(+答案)
- 2025中国资源循环集团面向海内外公开招聘高端人才33人社招笔试历年难易错考点试卷带答案解析
- 2026年春人教版(新教材)初中信息科技八年级全一册第二学期教学计划及进度表(第4-6单元)
- 23-华为的组织建设(6版)
- 试用期入职新员工转正申请表模板表格(标准版)
- 老年患者围手术期术后高血糖管理方案
- 网络车展方案
- 项目经理施工现场安全管理要点
- 《涉外法治概论》课件 杜涛 -第1-6章 涉外法治的基础理论-涉外经济管理法律制度
- DB11∕T 1828-2021 文物保护工程资料管理规程
- 结直肠癌教学课件文字
- 2025年血型相关考试题目及答案
评论
0/150
提交评论