【《基于BiLSTM模型的文本情感分析案例》1700字】_第1页
【《基于BiLSTM模型的文本情感分析案例》1700字】_第2页
【《基于BiLSTM模型的文本情感分析案例》1700字】_第3页
【《基于BiLSTM模型的文本情感分析案例》1700字】_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于BiLSTM模型的文本情感分析案例目录TOC\o"1-3"\h\u23259基于BiLSTM模型的文本情感分析案例 1180831.1双向长短时记忆网络(BiLSTM)模型概述 1181131.2BiLSTM模型的构建 3248811.3结果分析 4双向长短时记忆网络(BiLSTM)模型概述在线评论是一种自然语言。虽然文本在形式上是自由的,但其内容却密切依赖于语境中的语义连接。只有更好地捕捉上下文信息,才能得到词语在情境下的真实含义。因此,针对在线评论的特点,本研究采用双向长短时记忆网络提取在线评论文本的上下文信息。双向长短时记忆网络(BiLSTM)是基于长短时记忆网络(LSTM)结构的改进模型。长短时记忆网络是循环神经网路的特殊类型,它弥补了网络模型存在的梯度衰减缺陷。在LSTM网络中,过去的数据信息通过LSTM单元链接到当前的神经元,而LSTM网络的最大特点是其使用了多个门控模块,门控模块的分工实现了在数据传输过程中对以往数据和运算结果拥有一段时间的记忆效果,这一特点决定了它相较于其他模型进行文本处理时的优越性。LSTM有三个门来控制数据在存储器中的往返行为。其中,第一个“输入门”控制新输入到存储器的信息,确定了在该状态下需要记住哪些新信息来处理输入。第二个“遗忘门”控制信息在内存中保存的时间,删除不重要的信息。最后,“输出门”提取存储在单元中的信息,控制最终的输出结果。LSTM内存单元的架构如图3.1所示。图3.1LSTM单元结构LSTM具体工作流程如下:(1)通过遗忘门f来选择具体从当前单元中丢去哪些不重要的信息。公式如下:ft=σW其中,σ表示激活函数,Wf表示该模块的权重,ht−1为t−1时刻的输出,xt表示t时刻存储器的信息接收,(2)控制新输入到存储器的信息,确定在该状态下需要记住哪些新信息,即哪些新信息需要被存储到单元状态中。该阶段主要包括两个过程,首先是计算激活值it,然后模块会使用tanh函数生成一个候选记忆单元,计算候选值cit=σct=tanhWc其中Wi为该模块的权重,b(3)对单元进行更新。将根据遗忘门和候选单元联合生成新的单元状态。公式如下:ct=(4)提取存储在单元中的信息并输出。该过程同样分为两个步骤,首先得确定最终的输出部分,然后将该结果与之前获得的新单元状态相乘得到最终输出。公式如下ot=σht=其中,Wo为该模块的权重,b虽然LSTM可以解决梯度爆炸和消失的问题,但它只能学习文本的前向信息,而不能学习文本的后向信息。由于一个词的语义不仅与之前的语义信息有关,与之后的语义信息也密切相关,因此本文使用BiLSTM(Bi-directionalLong-shortMemory,双向长短时记忆网络)来代替LSTM,该模型的结构如图所示。图3.2BiLSTM模型结构BiLSTM模型由上下叠加的两个LSTM网络组成,可以从正反两个方向处理文本,从而更好地提取上下文信息。BiLSTM模型的构建将标注的2万条在线评论按3:1的比例随机划分训练集和测试集。由于评论数据的长度(词语数量)参差不齐,而模型的输入要求序列的长度相同,因此需要统一长度。因此将每个评论限制为50个词语,截断长评论,并用零值填充短评论。在建立LSTM模型时,需要设置神经元数量、学习率等参数。同时为了应对模型的过拟合问题,在模型中添加了dropout层。通过大量的实验结果对比,最终选取表3.1中的参数,此时模型获得了较好的分类效果。表3.1BiLSTM模型参数参数名参数值词向量维度128神经元数量50批量大小32学习率0.01迭代次数4丢弃率0.5结果分析对于自然语言处理中情感分析任务,不仅要看最终的准确率,还应该以F1值作为最终的评价指标。F1-score是一个综合考虑精确率(precision)和召回率(recall)的度量值,能够对模型进行准确的度量。单个数据的F1值计算方式如下,precision=recall=F1=其中,TP表示真正例,FP表示假正例,FN表示假反例。Precision表示精确率,recall表示召回率。精确率表示的是在预测为正类的样本中正确预测的样本数所占的比率。召回率表示的是在原本即为正类的样本中正确预测的正类数所占的比率。F1值是精确率与召回率两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论