CN113901191B 问答模型的训练方法及装置 (北京金山数字娱乐科技有限公司)_第1页
CN113901191B 问答模型的训练方法及装置 (北京金山数字娱乐科技有限公司)_第2页
CN113901191B 问答模型的训练方法及装置 (北京金山数字娱乐科技有限公司)_第3页
CN113901191B 问答模型的训练方法及装置 (北京金山数字娱乐科技有限公司)_第4页
CN113901191B 问答模型的训练方法及装置 (北京金山数字娱乐科技有限公司)_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

202110665052.02021.06.16中所述问答模型的训练方法包括:获取训练样所述目标词单元构建所述训练样本对应的样本2基于所述样本词组查询预先生成的场景定向词表空间,根据查定向词表空间是指基于所述初始文本意群构建的实体词关联关提取所述样本问题文本中的名词性原词和动词短语词干作为所述目标基于所述名词性原词和所述动词短语词干构建所述训练样将所述目标文本意群和所述训练样本中的样本问题文本输入至所述初始问答模型进基于所述预测答案文本和所述训练样本中的样本答案文本对所述初始问答模型进行基于所述样本问题文本生成词单元向量以及场景标签向量,以及基对所述词单元向量和所述场景标签向量进行整合,获得所述样本将所述样本问题向量和所述意群向量输入至所述初始问答模将所述样本问题向量和所述意群向量输入至所述初始问答模型,通过将所述融合向量输入至所述初始问答模型中的识别模块进行处通过所述初始问答模型中的输出层对所述关联实体中心词和所述上下文场景分布进3提取所述样本语料的多个初始特征,并对所述多个初始特征进行预处计算各个目标特征与所述样本语料的语境相似度,将所述样本词组映射到所述场景定向词表空间,计算所述样本根据词组相似度计算结果确定目标语境标签,并将所述目标语查询模块,被配置为基于所述样本词组查询预先生成的场训练模块,被配置为利用所述目标文本意群和所述训练样本对初始问答模型进行训所述构建模块,进一步被配置为获取样本语料,并构建所述样本将所述问题文本输入至如权利要求1-8任一项所述方法中的目标问答模型进行处理,文本处理模块,被配置为将所述问题文本输入至如权利要求1-8任一项所述方法中的界面展示模块,被配置为基于所述答案文本对回复界面4所述存储器用于存储计算机可执行指令,所述处理器用于执行所述行时实现权利要求1至8或10任意一项所述方5[0013]基于所述名词性原词和所述动词短语词干构建所述训练样本对应的所述样本词[0014]可选地,所述利用所述目标文本意群和所述训练样本对[0015]将所述目标文本意群和所述训练样本中的所述样本问题文本输入至所述初始问[0016]基于所述预测答案文本和所述训练样本中的样本答案文本对所述初始问答模型6[0024]通过所述初始问答模型中的输出层对所述关联实体中心词和所述上下文场景分[0038]可选地,所述利用所述目标文本意群和所述训练样本对7通过不断迭代的方式即可获得满足训练停止条件的目标问答模型;实现在模型训练过程8[0061]图2是本申请一实施例提供的一种问答模型的训练方法中问答模型的结构示意为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递[0074]BiLSTM:(Bi-directionalLongShort-TermMemory)由前向LSTM与后向LSTM组9[0078]语义依存分析:(SemanticDependencyPars[0085]图1示出了根据本申请一实施例提供的一种问答模型的训练方法的流程图,具体便对样本语料进行管理和使用。过分析样本语料中句子语言单位之间的语义关联,并将语义关联以依存结构呈现,使用语言依存刻画句子语义,实现在不需要抽象样本语料中的词单元的本申请的情况下,通过词单元所承受的语义架构来描述该词单元,实现规避句子表层句法结构的束缚,直接获取深关系和初始词组构建所述样本语料对应的所述场景粗粒度的诗词初始文本意群,同时通过LDA特征工程模型为各个古典诗词语料添加语境标[0117]具体的,样本问题文本具体是指预先准备的与样本语料所对应的领域相关的问成各个样本问题文本对应的待定向关联实体词组,方便后续映射到场景定向实体词表空此时即可结合样本问题文本对应的样本词组和语境标签确定各个样本问题文本分别对应问答系统训练出预测精准度更好的问答模型,可以整合多个不同功能的模块组件问答系[0134]进一步的,在利用目标文本意群和训练样本对初始问答由于初始问答模型为有监督模型,因此需要经过不断的优化和调参才能够完成模型的训[0135]步骤S1082,将所述目标文本意群和所述训练样本中的所述样本问题文本输入至[0146]通过所述初始问答模型中的输出层对所述关联实体中心词和所述上下文场景分入至初始问答模型,通过初始问答模型中的融合模块对样本问题向量和意图向量进行处[0149]步骤S1084,基于所述预测答案文本和所述训练样本中的样本答案文本对所述初[0152]本申请提供一种问答模型的训练方法,通过构建样本语料对应的初始文本意群了本申请一实施例提供的一种问答模型的训练装置的结构示意图。如图3所示,该装置包[0157]训练模块308,被配置为利用所述目标文本意群和所述训练样本对初始问答模型[0167]将所述目标文本意群和所述训练样本中的所述样本问题文本输入至所述初始问[0172]本申请提供的问答模型的训练装置,通过构建样本语料了从语义层面捕捉问题和语料间的关联,有效的保证了训练后的问答模型的预测精准度,组功能模块限定的装置权利要求应当理解为主要通过说明书记载的计算机程序实现该解[0175]本实施例还提供了一种文本处理方法,图4示出了根据本申请一实施例提供的一对应关系,之后利用对应关系和初始词组构建古典诗词语料对应的场景定向实体词表空[0198]通过目标古典诗词问答模型对待回答问题文本{请提供一首描写思乡之情的古[0201]文本处理模块604,被配置为将所述问题文本输入至所述问答模型的训练方法中施例中的各组成部分应当理解为实现该程序流程各步骤或该方法各步骤所必须建立的功置权利要求应当理解为主要通过说明书记载的计算机程序实现该解决方案的功能模块构多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网[0208]计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计[0209]其中,处理器720用于执行所述问答模型的训练方法或文本处理方法的计算机可被处理器执行时以用于问答模型的训练方法或储介质的技术方案与上述的问答模型的训练方法或文本处理方法的技术方案属于同一构[0213]上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围[0214]所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、容可以根据司法管辖区内立法和专利实践的要求进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论