CN116150335B 一种军事场景下文本语义检索方法 (中国电子科技集团公司第二十八研究所)_第1页
CN116150335B 一种军事场景下文本语义检索方法 (中国电子科技集团公司第二十八研究所)_第2页
CN116150335B 一种军事场景下文本语义检索方法 (中国电子科技集团公司第二十八研究所)_第3页
CN116150335B 一种军事场景下文本语义检索方法 (中国电子科技集团公司第二十八研究所)_第4页
CN116150335B 一种军事场景下文本语义检索方法 (中国电子科技集团公司第二十八研究所)_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本发明公开了一种军事场景下文本语义检2馈给用户。2.根据权利要求1所述的一种军事场景下文本语义检索步骤1_2、对军事原始语料数据中冗余字符、停用词和繁简字进行清洗转换数据预处3.根据权利要求2所述的一种军事场景下文本4.根据权利要求3所述的一种军事场景下文本语义检索方法35.根据权利要求4所述的一种军事场景下文本语义6.根据权利要求5所述的一种军事场景下文本语义检步骤2_4_1:使用以欧式距离作为距离公式的K_均值算法对军事文本数据语义向量库7.根据权利要求6所述的一种军事场景下步骤3_1_1:遍历军用语义检索数据集中每一个问句,8.根据权利要求7所述的一种军事场景下文本语4检索精排模型离线构建包括还包括步骤3_2:基于军用预训练模型,构建文本检索精排模步骤3_2_2:在步骤3_1所获取的军用语义检索精排数据集9.根据权利要求8所述的一种军事场景下文本语义检步骤4_2_3:遍历步骤4_2_2检索文本候选集中每个5[0004]随着自然语言处理技术的发展,研究人员将文本信息检网络模型提取问句和答句各自的句内结构特征以及两者之间的交互信息并计算出相似度,从而提升基于文档检索的问答任务效果。邵明锐等将Transformer与注意力机制结合的深度神经网络模型应用于基于FQA的问答任务中,使模型在数据集较小的情况下也可以完成6用词表列表映射转换,即寻找每一个词对应位序将其数字化构建形成军用文本语料数据[0020]进一步地,步骤2_1针对文本检索任务,以原始语料数据中检索问答语料数据为7[0028]步骤2_4_1:使用以欧式距离作为距离公式的K_均值算法对军事文本数据语义向8Top(4*10*M)的子类作为检索文本候[0050]下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述9包括下文句子预测模型数据集和屏蔽语言模型[0068]模型结构选择:本发明选用BERTLager网络模型作为初始预训练模型,该模型Trm应位置表示句子级语义关系特征,其他每个单词对应位置则代表单词级语义特征。针对语义关系特征,取[CLS]对应位置隐含层向量,维度为1024,经过[1024,2问答对正负样本集合,利用步骤1_2获取的军事语境下词表列表将问答对文本数据映射转[0077](1)问句语言表示模型:利用军用预训练模型主体网络(模型非输入输出部分)对[0078](2)答案语言表示模型:利用军用预训练模型主体网络(模型非输入输出部分)对[0079](3)相似对计算:选用问答句的句子级特征表示(问答句语言表示模型[CLS]位置[0086]步骤2_4_1:使用以欧式距离作为距离公式的K_均值算法对军事文本数据语义向检索精排数据集,该军用语义检索精排数据集数据包括问句与N个召回文本,标签为N维[0100]利用军用预训练模型主体网络结构(模型非输入输出部分)作为文本检索精排模[0102]在[CLS]对应模型输出位置构建全连接分类网络:具体的,使用[1024,1024]和选择Adam优化器对多分类文本精排模型进行微调训练,训练次数置为5,模型学习率置为户需求强相关的文本集合;最后使用步骤3中文本检索精排模型获取最符合要求的文本答计算的方法,求取与问句强相关的文本集(Top_K)。通过在军用语义检索数据集上训练微提供的一种军事场景下文本语义检索方法的发明内容以及各实施例中的部分或全部步骤。[0121]本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论