CN118820436B 智能问答方法、装置、计算机设备和程序产品 (中电金信数字科技集团股份有限公司)_第1页
CN118820436B 智能问答方法、装置、计算机设备和程序产品 (中电金信数字科技集团股份有限公司)_第2页
CN118820436B 智能问答方法、装置、计算机设备和程序产品 (中电金信数字科技集团股份有限公司)_第3页
CN118820436B 智能问答方法、装置、计算机设备和程序产品 (中电金信数字科技集团股份有限公司)_第4页
CN118820436B 智能问答方法、装置、计算机设备和程序产品 (中电金信数字科技集团股份有限公司)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

KR1026411370000B1,2品中的大语言模型针对问题数据的初始结果确定并基于任务规划策略和大语言模型得到目标结2基于所述问题数据确定所述问题数据对应的知识数据,并根根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上下文基于所述代理智能体中的强化学习模型、所述知识数据、所基于所述认知修正策略对所述大语言模型进行行动规划,确定出任根据代理智能体中的大语言模型对所述问题数据进行扩展,生成所述基于所述详细信息对所述问题数据进行结构分解,得到所述问题数所述根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上根据代理智能体中的大语言模型生成所述问题数据对应的基于所述代理智能体中的大语言模型对所述初始结果进行分解,得基于所述初始结果中包含的元素和所述大语言模型,对所述初始结所述基于所述认知修正策略对所述大语言模型进行行动规划,确定出任务规划策略,根据所述代理智能体中的强化学习模型对所述初始任务规划策基于所述验证结果确定待修正任务,并根据所述大语言模型基于所述反馈信息、所述任务规划策略和所述多模态问题数据构建根据所述历史输出序列确定所述用户的用户习惯类型信息和行3根据所述知识数据、所述第一上下文数据和所述第二上下基于所述代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行解析基于所述问题数据与代理智能体中的预设知识库中知识数据的相似度确定所述问题在所述代理智能体的对话上下文和其他任务上下文中检索确定所述问题数据对应的解构模块,用于基于所述问题数据确定所述问题数据对应的知识数据,能体中的大语言模型对所述问题数据进行结构分解,得到问题数据对应的第一上下文数确定模块,用于根据所述代理智能体中的大语言模型针对所规划模块,用于基于所述认知修正策略对所述大语言模型进所述解构模块具体用于根据代理智能体中的大语言基于所述详细信息对所述问题数据进行结构分解,得到所述问题数所述确定模块具体用于根据代理智能体中的大语言模型生成所述问题数据对应的初基于所述代理智能体中的大语言模型对所述初始结果进行分解,得基于所述初始结果中包含的元素和所述大语言模型,对所述初始结所述规划模块具体用于基于所述大语言模型对所述认知修正策略进根据所述代理智能体中的强化学习模型对所述初始任务规划策基于所述验证结果确定待修正任务,并根据所述大语言模型4第二构建模块,用于基于所述反馈信息、所述任务规划策略和所建所述用户对应的历史输出序列;训练模块,用于根据所述历史输出序列确定所述用户基于所述代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行解析在所述代理智能体的对话上下文和其他任务上下文中检索确定所述问题数据对应的9.一种计算机设备,包括存储器和处理器,所述存储器存行时实现权利要求1至4中任一项所述的方5预先构建的知识库对大语言模型进行训练,得到完成学习知识库中知识数据的大语言模[0009]根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上[0011]基于所述认知修正策略对所述大语言模型进行行动规划并基于所述任务规划策略和所述大语言模型6[0018]基于所述代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行[0024]基于所述问题数据与代理智能体中的预设知识库中知识数据的相似度确定所述[0025]在所述代理智能体的对话上下文和其他任务上下文中检索确定所述问题数据对7上下文数据和所述第二上下文数据构建针对所述初试[0044]基于所述代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行构模块具体用于基于所述问题数据与代理智能体中的预设知识库中知识数据的相似度确[0049]在所述代理智能体的对话上下文和其他任务上下文中检索确定所述问题数据对8[0058]根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上[0060]基于所述认知修正策略对所述大语言模型进行行动规划并基于所述任务规划策略和所述大语言模型[0064]根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上[0066]基于所述认知修正策略对所述大语言模型进行行动规划并基于所述任务规划策略和所述大语言模型[0070]根据所述代理智能体中的大语言模型针对所述问题数据的初始结果确定第二上[0072]基于所述认知修正策略对所述大语言模型进行行动规划并基于所述任务规划策略和所述大语言模型代理智能体中大语言模型输出的行动规划进行验证,得到与问题数据更加适配的行动规9[0076]图2为一个实施例中通过强化学习模型对代理智能体进行持续训练的流程示意COVID_19?”代理智能体首先访问其内部或外部的知识库,寻找与COVID_19症状相关的信模型对用户的问题进行深入分析和结构,包括理解问题的语义,如确定用户在询问有关[0096]步骤106,根据代理智能体中的大语言模型针对问题数据的初始结果确定第二上[0111]本申请实施例中,强化学习模型可以采用AsynchronousAdvantageActor_化学习模型为代理智能体提供动态记忆和对来自环境反馈调整的能力,以提高推理能力。不同用户的用户习惯类型,根据用户习惯类型构建不同用类型下个性化的认知修正策略,[0121]步骤404,基于代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑[0123]在一个示例性的实施例中,如图5所示,认知修正策略的样例是由action、策略的验证。代理智能体通过强化学习模型分析初始任务规划策略中每个任务的执行顺[0135]步骤802,基于问题数据与代理智能体中的预设知识库中知识数据的相似度确定[0136]本申请实施例中,长期知识数据是通过将知识数据存储[0138]步骤804,在代理智能体的对话上下文和其他任务上下文中检索确定问题数据对代理智能体提供了当前环境下最相关和有效的应的历史输出序列;[0166]训练模块,用于根据历史输出序列确定用户的用户习惯类型信息和行动反馈信[0168]基于代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行解析[0171]基于验证结果确定待修正任务,并根据大语言模型对待[0172]在其中一个实施例中,知识数据包含长期知识数据和短期知识数据;解构模块1102具体用于基于问题数据与代理智能体中的预设知识库中知识数据的相似度确定问题[0173]在代理智能体的对话上下文和其他任务上下文中检索确定问题数据对应的短期[0179]上述智能问答装置中的各个模块可全部或部分通过软件、硬件及其组合来实备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种智能问答方[0194]基于代理智能体中的强化学习模型对初始认知修正策略中的推理逻辑进行解析[0198]基于验证结果确定待修正任务,并根据大语言模型对待[0200]基于问题数据与代理智能体中的预设知识库中知识数据的相似度确定问题数据[0201]在代理智能体的对话上下文和其他任务上下文中检索确定问题数据对应的短期[0203]根据代理智能体中的大语言模型对问题数据进行扩展,生成问题数据的详细信机程序被处理器执行时实现上述各方法实施例中易失性存储器和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read_

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论