CN119416882A 一种知识图谱开放域构建和rag问答方法、装置及存储介质 (山东智洋上水信息技术有限公司)_第1页
CN119416882A 一种知识图谱开放域构建和rag问答方法、装置及存储介质 (山东智洋上水信息技术有限公司)_第2页
CN119416882A 一种知识图谱开放域构建和rag问答方法、装置及存储介质 (山东智洋上水信息技术有限公司)_第3页
CN119416882A 一种知识图谱开放域构建和rag问答方法、装置及存储介质 (山东智洋上水信息技术有限公司)_第4页
CN119416882A 一种知识图谱开放域构建和rag问答方法、装置及存储介质 (山东智洋上水信息技术有限公司)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种知识图谱开放域构建和RAG问答方法、本发明提供一种知识图谱开放域构建和RAG识图谱实现RAG问答包括:针对问题进行知识图构建无法获取完整的知识图谱的问题,以及RAG检索的信息与问题相关性弱且多跳推理能力受2采用多路径数据处理策略,解析读取设定格式的非结构化的文本文件对读取的文本内容进行文本划分,得到文本块;利用大语言模型对每对初始三元组进行后处理,得到用于构建知识图谱的后处理三元组2.根据权利要求1所述知识图谱开放域构建和RA对于任意需要提取文本内容的文本文件,根据文本文件的格式3.根据权利要求1所述知识图谱开放域构建和R首先,确定文本内容中每部分内容的标题,根据每个标题所概括4.根据权利要求1所述知识图谱开放域构建和RAG问答方法大语言模型在开放域信息抽取提示词的约束下对开放域信息抽取提示词中的需进行5.根据权利要求1所述知识图谱开放域构建和构建用于过滤格式不规范的三元组,以及将头实体与关系都相同的尾实体合并的规对使用规则处理后的三元组,使用所述评分提示词控制大语言模型对三元组进行打36.根据权利要求1所述知识图谱开放域构建和RAG问将文本文件的文件名作为名称实体,并在名称实体与文本内容的将所有文本文件所属类别定义为类别实体,并在类别实体与所7.根据权利要求1所述知识图谱开放域构建和RAG首先针对问题进行知识图谱检索,获取与问题相关的上下使用beamsearch策略对每个推理链迭代执行推理链的推理扩充操作,直到达到推理链的最大长度限制或者达到自适应链终止策略指定的终索推理链中每个三元组所属文本块,其中每个推理链中的三元组为生成它的文本块投一8.根据权利要求7所述知识图谱开放域构建和RAG问答方法,其特征在于,使用beam使用双编码器模型计算问题和知识图谱中每个三元组的相关候选三元组集合中每个候选三元组都作为一个选项;基于候选三元组和问题的上下从候选三元组集合中的候选三元组中选取得分最高的前P个三元组;对于每个选中的基于beamsearch策略从所有生成的新的推理链中,选择概率最高410.一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其特征在5[0001]本发明涉及知识图谱开放域构建和RAG问答技术领域,尤其涉及一种知识图谱开6[0017]大语言模型在开放域信息抽取提示词的约束下对开放域信息抽取提示词中的需规则;[0034]使用beamsearch策略对每个推理链迭代执行推理链的推理扩充操作,直到达到推理链的最大长度限制或者达到自适应链终止策略指定7[0037](2)使用推理链来识别对回答问题有用的文本块,然后使用这些文本块作为上下[0038]更进一步地,使用beamsearch策略对每个推理链迭代执行推理链的推理扩充操[0041]从候选三元组集合中的候选三元组中选取得分最高的前P个三元组;对于每个选于该推理链检索与问题最相关的文本块作为上下文,解决传统RAG检索的信息与问题相关8整的知识图谱的问题,以及传统RAG检索的信息与问题相关性弱且多跳推理能力受限的问[0053]图2为本申请实施例提供的对读取的文本内容进行文本划分,得到文本块的流程[0054]图3为本申请实施例提供的大语言模型在第一阶段工作利用大语言模型对每个文[0055]图4为本申请实施例提供的对初始三元组进行后处理,得到用于构建知识图谱的[0058]图7为本申请实施例提供的首先针对问题进行知识图谱检索,获取与问题相关的9[0067](3)txt文件读取器:直接使用python的read命令读取txt类文本文件中的文本内[0074]大语言模型在开放域信息抽取提示词的约束下对开放域信息抽取提示词中的需[0091]使用beamsearch策略对每个推理链迭代执行推理链的推理扩充操作,直到达到加三元组后的推理链的概率即等于原始推理链概率乘以新添加三元组的概率;基于beamsearch策略从所有生成的新的推理链中,选择概率最高的前R条推理链作为下一步的候选[0097](2)使用推理链来识别对回答问题有用的文本块,然后使用这些文本块作为上下述处理单元执行所述计算机程序实现所述的所述知识图谱开放域构建和RAG问答方法,包[0104]当然,本发明实施例所提供的一种知识图谱开放域构建和RAG问答装置中存储单供的一种知识图谱开放域构建和RAG问答方上所述的方法操作,还可以执行本发明任意实施例所提供的一种知识图谱开放域构建和[0112]以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论