CN111046152A Faq问答对自动构建方法、装置、计算机设备及存储介质 (平安科技(深圳)有限公司)_第1页
CN111046152A Faq问答对自动构建方法、装置、计算机设备及存储介质 (平安科技(深圳)有限公司)_第2页
CN111046152A Faq问答对自动构建方法、装置、计算机设备及存储介质 (平安科技(深圳)有限公司)_第3页
CN111046152A Faq问答对自动构建方法、装置、计算机设备及存储介质 (平安科技(深圳)有限公司)_第4页
CN111046152A Faq问答对自动构建方法、装置、计算机设备及存储介质 (平安科技(深圳)有限公司)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

道福安社区益田路5033号平安金融中本发明实施例公开了一种FAQ问答对自动构行解析并对解析后的文档进行分段以得到分段回答问题,基于预设的阅读理解模型生成FAQ问问题生成FAQ问答对,无需对非目标段落进行处理,在一定程度上减少了生成FAQ问答对时非目2对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为根据待回答问题及预设的筛选模型,从所述目标对所述待阅读的文档采用层叠CRF模型进行解析以得通过预设分段方式对所述XML文档进行分段,以得到具有预设文档结构的文档作为目根据所述待回答问题及预设的所述筛选模型对所述目标文档进行编码以得到第一段根据所述待回答问题计算每个所述第一段落文本向量与所述待回答问题相匹配的概将概率最大的所述第一段落文本向量所对应的段落确定为与所述待回答问题相匹配4.根据权利要求1所述的方法,其特征在于,所述根据所述目标段落及所述待回答问对所述目标段落及所述待回答问题分别进行编码以得到第二段落文本向量及问题文对所述第二段落文本向量及所述问题文本向量进行根据预设的提取模型对所述新文本向量进行编对所述目标文本向量进行计算以得到所述待回答问题的5.根据权利要求1所述的方法,其特征在于,所述根据所述目标段落及所述待回答问获取所述FAQ问答对并将获取的所述FAQ问答对反馈给用6.根据权利要求5所述的方法,其特征在于,所述若接收到用户发送的所述修改指令,则将所述修返回执行所述根据待回答问题及预设的筛选模型,从所3若未接收到用户发送的所述修改指令,则判断所述待若所述待回答问题不是预设数据库问题模板中的解析分段单元,用于对所述待阅读的文档进行解析并对解筛选单元,用于根据待回答问题及预设的筛选模生成单元,用于根据所述目标段落及所述待回存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述算机程序当被处理器执行时可实现如权利要4[0001]本发明涉及人工智能和自然语言处理技术领域,尤其涉及一种FAQ问答对自动构[0002]FAQ是英文FrequentlyAskedQuestions的缩写,中文意思就是“经常问到的问好的FAQ系统,应该至少可以回答用户80%的一般问题以及常见问题。这样不仅方便了用[0004]本发明实施例提供了一种FAQ问答对自动构建方法、装置、计算机设备及存储介[0007]对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档5[0017]本发明实施例提供了一种FAQ问答对自动构建方法、装置、计算机设备及存储介由于是先筛选出与待回答问题相匹配的目标段落,再根据目标段落及待回答问题生成FAQ[0026]图8为本发明实施例提供的FAQ问答对自动构建装置的解析分段单元的示意性框[0029]图11为本发明另一实施例提供的一种FAQ问答对自动构建装置的示意性框图;以及6[0036]请参阅图1,图1是本发明实施例提供的一种FAQ问答对自动构建方法的场景示意用户通过终端上传的待阅读的文档并根据待回答的问题和待阅读文档进行一系列处理后[0037]请参阅图2,图2是本发明实施例提供的一种FAQ问答对自动构建方法的流程示意Word文档。7处理效果较好。XML为ExtensibleMarkupLanguage的缩写,其中文全称为可扩展标记语终端的FAQ网页端上传待阅读的文档之后,可根据上传的待阅读的文档内容或者文档名选择相应的问题模板。例如,若用户在FAQ网页端页面上传待阅读的文档内容为寿险或意外中,预设的筛选模型例如为Bert(BidirectionalEncoderRepresentationsFrom8率并对计算出的概率进行排序取概率最大的第一段落文本向量所对应的段落作为目标段选出的段落及待回答问题生成FAQ问答对。具体地,可通过预设的阅读理解模型自动生成落进行处理,在一定程度上减少了生成FAQ问答对时非目标段落带来的干扰信息,生成的[0061]在本发明实施例中,服务器从目标文档中筛选出与待回答问题相匹配的段落之例如Bert模型对目标段落及待回答问题进行编码,然后再采用预设的模型例如Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(Deeplearning)的代表算法之一。自注意力机制(Self-型对目标段落及待回答问题进行编码可得到第一临时段落文本向量及第一临时问题文本9时段落文本向量及第三临时问题文本向量通过一个前向神经网络继续提取得到最终所需待回答问题分别进行编码只需得到第二段落文本向量及问题文本向量即可,例如用RNN(RecurrentNeuralNetwork)模型替[0063]S132、对所述第二段落文本向量及所述问题文本向量进行编码以得到新文本向量。具体地,是在Context-QueryAttention层对第二段落文本向量及问题文本向量进行Attention编码操作。其中,Attention编码操作包括Context-to-Query及Query-to-Context的Attention编码操作。Context-to-Query的Attention编码操作,指的是将向量进行计算加权求和得到包含Attention信息的文本向量。Query-to-Contex的Attention编码操作指的是将Query的长度M和Context的长度N,构成一个相关性矩阵M*N,过在Context-QueryAttention层对第二段落文本向量及问题文本向量进行Context-to-Query及Query-to-Context的编码操作可得到新设的提取模型例如为EncoderBlock,该EncoderBlock与步骤S131中EncoderBlock中的中叠加了三个EncoderBlock对新文本向量进行编码,以进一步从新文本向量中提取目标[0069]在本发明实施例中,通过EncoderBlock对新文本向量进行编码得到目标文本向个EncoderBlock编码得到的文本向量拼接在一起作为待回答问题的答案开始的位置,将第一个EncoderBlock编码得到的文本向量和第三个EncoderBlock编码得到的文本向量的答案开始及结束位置概率最大的作为待回答问题的答案开始及结束的位置,从而生成[0070]图6为本发明另一实施例提供的FAQ问答对自动构建方法的流程示意图,如图6所[0074]在本发明实施例中,服务器获取FAQ问答对并将获取的FAQ问答对反馈给用户之再反馈给用户。所示,对应于以上FAQ问答对自动构建方法,本发明还提供一种FAQ问答对自动构建装置203用于根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题[0085]其中,解析单元2021用于对所述待阅读的文档采用层叠CRF模型进行解析以得到标文本向量进行计算以得到所述待回答问题的答案开始及结束的位置,从而生成所述FAQ[0091]其中,反馈单元205用于获取所述FAQ问答对并将获取的所述FAQ问答对反馈给用否为预设数据库问题模板中的问题;更新单元209用于若所述待回答问题不是预设数据库[0092]上述FAQ问答对自动构建装置可以实现为一种计算机程序的形式,该计算机程序[0095]该非易失性存储介质303可存储操作系统3031和计算机程序3032。该计算机程序出与所述待回答问题相匹配的段落作为目标段落;根据所述目标段落及所述待回答问题,筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落步骤FAQ问答对并将获取的所述FAQ问答对反馈给用户;判断是否接收到用户发送的修改指令;所述待回答问题相匹配的段落作为目标段落的步骤;若未接收到用户发送的所述修改指[0104]应当理解,在本申请实施例中,处理器302可以是中央处理单元(CentralSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIn[0105]本领域普通技术人员可以理解的是实现上述实施例的方法中是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档步骤时,具体实现如下步骤:对所述待阅读的文档采用层叠CRF模型进行解析以得到文本向量进行计算以得到所述待回答问题的答案开始及结束的位置,从而生成所述FAQ问用户发送的所述修改指令,则判断所述待回答问题是否为预设数据库问题模板中的问题;或者光盘等各种可以存储程序代码的计算机可读存[0115]该集成的单元如果以软件功能单元的形式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论