CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）

上传人：1*** IP属地：山西上传时间：2026-04-08 格式：DOCX 页数：70 大小：1.34MB 积分：10.8 举报 版权申诉

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）_第2页

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）_第3页

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）_第4页

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）_第5页

已阅读5页，还剩65页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

本申请实施例公开了一种样本数据生成方取用于提示第一大语言模型生成问题指令的第初始问题指令作为首个输入至第二大语言模型语言模型用于根据目标回答文本生成输入至第2获取用于提示第一大语言模型生成问题指令的第一提示文本，调用将所述初始问题指令作为首个输入至第二大语言模型的问题指所述目标回答文本时根据所述目标回答文本生成所述目标基于所述初始问题指令、多轮对话中的所述目标问题指令以及获取第一角色定义文本和第二角色定义文本，其中，所述第一角将所述第一角色定义文本输入至所述第二大语言模型，将所述第将所述初始问题指令输入第二大语言模型进行回答预测，生成首个构建所述第二提示文本，将所述第二提示文本和首个将下一个所述对话轮次的所述目标问题指令输入至所述第二大语言模型再次进行回将所述目标提示文本和首个所述对话轮次的所述目标回答文本输入所述第三大语言获取目标任务的任务信息，其中，所述目标任务为基于所述样3基于所述任务信息，构建用于提示第一大语言模型根据所述任建用于提示第一大语言模型根据所述任务信息生成问题指令的或者，当所述目标节点所在层级为所述目标层级之后将与所述目标节点关联且位于所述目标层级的节点作为目标角色定义文本用于提示所述第一大语言模型作为针对所述目标任务的从多个所述初始问题指令中随机采样出第一基于预设的扩展策略构建用于提示第一大语言模型按照所述扩展策略进行指令扩展将所述第三提示文本和所述第一问题指令输入所述第一大语言对所述第一问题指令进行多次的指令扩展，得到每一次指令扩展4其中，每当对所述第一问题指令进行指令扩展时，按照多个所述扩展策略中构建用于提示所述第一大语言模型参照所述第二问题指令生成问题指令的第四提示将所述第一大语言模型的温度参数配置为所述目标采样温度值，温度值用于指示所述第一大语言模型输出结果调用所述第一大语言模型基于所述第一提示文本进行问其中，每当生成所述初始问题指令时，确定当前生成的所述初第二生成模块，用于将所述初始问题指令作为首个输入至第二大语言模型的问题指样本构建模块，用于基于所述初始问题指令、多轮对话中的所述目标问所述处理器执行所述计算机程序时实现权利要求1至13任意一项所述的样本数据生成方算机程序被处理器执行时实现权利要求1至13任意一项所述行时实现权利要求1至13任意一项所述的样本数5[0011]第一生成模块，用于获取用于提示第一大语言模型生成问题指令的第一提示文答文本生成输入至所述第二大语言模型的目6[0019]构建用于提示第三大语言模型每当接收到所述目标回答文本时根据所述目标回[0020]将所述第二提示文本和首个所述对话轮次的所述目标回答文本输入所述第三大[0021]将下一个所述对话轮次的所述目标问题指令输入至所述第二大语言模型再次进[0024]将所述目标提示文本和首个所述对话轮次的所述目标回答文本输入所述第三大[0030]将所述目标节点所携带的所述候选关键词作为目标关键词，根据所述目标关键7目标角色定义文本用于提示所述第一大语言模型作为针对所述目标任务[0039]基于预设的扩展策略构建用于提示第一大语言模型按照所述扩展策略进行指令[0046]构建用于提示所述第一大语言模型参照所述第二问题指令生成问题指令的第四采样温度值用于指示所述第一大语言模型输出结果的随8[0056]本申请实施例至少包括以下有益效果：通过第一大语言9[0077]人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方[0083]服务器102通过第一大语言模型生成初始问题指令，然后将初始问题指令作为首[0084]服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集[0087]参照图2，图2为本申请实施例提供的样本数据生成方法的一种可选的流程示意型一般采用循环神经网络(RNN)或变种，如长短时记忆网络(LSTM)和门控循环单元(GRU)，中，第一角色定义文本用于提示第二大语言模型在多轮对话中作为针对目标任务的回答目标回答文本的生成质量，而且第二大语言模型能够生成与目标任务相关的目标回答文第三大语言模型每当接收到目标回答文本时根据目标回答文本生成问题指令的第二提示node11对应的子节点包括节点node22，节点node22所携带的候选关键词可以为数学推理，相当于节点node11对应的下游任务task11为代码生成任务，节点node22对应的下游任务[0127]进一步，假设节点node22对应的子节点包括节点node32和节点node33，节点[0130]其中，任务配置界面可以配置有多个第一复选框控件610、多个第二复选框控件自对应的位于第二个层级的节点存在关联关系，各个第二复选框控件620分别与各自对应的位于第三个层级的节点存在关联关系，各个第三复选框控件630分别与各自对应的位于有一个第一复选框控件610处于复选状态，当其中一个第一复选框控件610处于复选状态[0133]相关人员可以在任务配置界面中点击任意一个已展示的第二复选框控件620，在件620处于复选状态时，该第二复选框控件620的下一个层级的各个第三复选框控件630会[0134]相关人员可以在任务配置界面中点击任意一个已展示的第三复选框控件630，在复选框控件610后触发第一配置确定控件640，也可以在选择第一复选框控件610和选择第[0138]在终端的任务配置界面中，相关人员可以通过文本输入控件710输入目标任务的使得终端能够响应于对第二配置确定控件720的操作，根据文本输入控件710内的任务信node11的各个子节点中确定与任务信息匹配的节点，假设第三个层级匹配的节点为节点目标关键词，构建用于提示第一大语言模型根据任务信息生成问题指令的第一提示文本，词作为关联关键词，可以通过关联关键词和目标关键词的组合较为准确地表征任务信息，[0147]在一种可能的实现方式中，任务树中根节点所在层级的标角色定义节点，将目标角色定义节点所携带的第三角色定义文本作为目标角色定义文应的第三角色定义文本，第三角色定义文本的内容用于显示定义第一大语言模型的角色，杂度较高的第一扩展问题指令通常更加接近真实场景中相关人员所输入的比较复杂的问始问题指令随机采样出第一问题指令，使得部分初始问题指令能够进行问题指令复杂化，当前生成轮次采样得到的第二问题指令有可能是前一个生成轮次所生成的第二扩展问题[0170]方式一：假设随机采样出两个第二问题指令，第二问题指令a为“如何使用面是一些和前端开发中JavaScript代码生成相关的问题指令。样例1：指令：如何使用[0173]方式二：假设随机采样出两个第二问题指令，第二问题指令a为“如何使用词元数量与总词元数量的占比作为指令相似度；也可以通过其他方式来确定指令相似度，成的指令内容差异较小的初始问题指令，通常较少被保留的初始问题指令会存在质量问[0192]首先，指令生成模块获取用于提示第一大语言模型生成问题指令的第一提示文[0200]然后，指令生成模块调用第一大语言模型基于第一提示个初始问题指令的集合作为种子指令集合，种子指令集合内的初始问题指令均为种子指24.3923.1753.6651.83[0234]构建用于提示第三大语言模型每当接收到目标回答文本时根据目标回答文本生[0235]将第二提示文本和首个对话轮次的目标回答文本输入第三大语言模型进行问题[0239]将目标提示文本和首个对话轮次的目标回答文本输入第三大语言模型进行问题目标关键词，构建用于提示第一大语言模型根据任务信息生成问题指令的第一提示文本，[0254]基于预设的扩展策略构建用于提示第一大语言模型按照扩展策略进行指令扩展[0261]构建用于提示第一大语言模型参照第二问题指令生成问[0268]上述样本数据生成装置1100与应用于中心节点的样本数据生成方法基于相同的存储器1220、输入单元1230、显示单元1240、传感器1250、音频电路1260、无线保真广角摄像头融合实现全景拍摄以及VR(VirtualReality，虚拟现实)拍摄功能或者其它融[0271]存储器1220可用于存储软件程序以及模块，处理器1280通过运行存储在存储器[0276]传感器1250的数量可以为一个或者多个，该一个或多个传感器1250包括但不限[0277]加速度传感器可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比[0279]压力传感器可以设置在终端的侧边框和/或显示单元1240的下层。当压力传感器采集的握持信号进行左右手识别或快捷操作。当压力传感器设置在显示单元1240的下层[0282]本申请实施例提供的用于执行上述样本数据生成方法的电子设备也可以是服务个以上存储应用程序1342或数据1344的存储介质1330(例如一个或一个以上海量存储装[0286]本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现[0295]以

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）

文档简介

温馨提示

最新文档

评论

CN118861218B 样本数据生成方法、装置、电子设备及存储介质 （腾讯科技（深圳）有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN118861218B 样本数据生成方法、装置、电子设备及存储介质（腾讯科技（深圳）有限公司）