CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）

上传人：1*** IP属地：山西上传时间：2026-04-12 格式：DOCX 页数：67 大小：1.85MB 积分：9.6 举报 版权申诉

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）_第2页

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）_第3页

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）_第4页

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）_第5页

已阅读5页，还剩62页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

模型训练方法及用于模型训练的样本确定本说明书实施例提供模型训练方法及用于高于各候选样本中其他样本对于待训练模型的2确定所述候选样本集中第一候选样本的参考信息，其中，所述基于所述第一候选样本的参考信息生成提示指令，将所述提示对各候选样本的质量指标进行排序，确定执行所述训练任务的处理器高于所述各候选样本中其他样本对于所述待训练模型的2.根据权利要求1所述的模型训练方法，所述确定所述候选样本集中第一候选样本的确定所述第一候选样本与各个第二候选样本的相似度，其中，述候选样本集中除所述第一候选样本之外的根据所述相似度从所述各个第二候选样本中确定所述第一候选样本3.根据权利要求2所述的模型训练方法，所述确定所述第一候选样本与各个第二候选基于嵌入模型，分别确定所述第一候选样本的第一样本向量，以分别计算所述第一样本向量与各个第二样本向量的相似度，确定所述第一损失值和所述第二损失值之间的损失值差值，将3根据所述第一候选样本的标签、至少一个评分维度分别对所述第一响应结果进行评根据所述第一候选样本的标签、至少一个评分维度分别对所述第二响应结果进行评确定所述第一响应评分和所述第二响应评分之间的评分差值，6.根据权利要求1_5任一项所述的模型训练方法，所述从排序后的各候选样本中确定基于所述待训练模型的模型规格参数，从排序后的各候选样本中筛选所述目标样本，确定所述候选样本集中第一候选样本的参考信息，其中，所述基于所述第一候选样本的参考信息生成提示指令，将所述提示对各候选样本的质量指标进行排序，确定执行所述训练任务的处理器4相应地，所述利用所述目标任务对应的目标任务处理模型对所述任务数据进行处理，基于所述反馈信息构建更新样本集，基于所述更新样本集对所述所述至少一个任务处理模型基于如权利要求1_7任一项所述的模型训练方法训练得基于所述目标场景的场景标识，从模型库中查找适应于所述目标场所述模型请求包括目标场景的场景输入数据；所述基于所述模型请求，基于所述目标场景的场景输入数据，对所述初始任务处理模型进行所述模型请求包括模型规格参数；所述基于所述模型请求，从至少一所述模型训练单元，用于根据所述模型属性信息确定所述待训5述各候选样本中其他样本对于所述待训练模型的所述数据接收单元，用于接收用户输入的训练任务的候选样本集所述模型训练单元，还用于根据所述模型属性信息从所述模型库，确定所述存储器用于存储计算机程序或指令，所述处理器用于执行所述计算机程序或指所述存储器用于存储计算机程序或指令，所述处理器用于执行所述计算机程序或指理器执行时实现权利要求1_13任一项所述方法6训练模型的学习价值高于所述各候选样本中其他样本对于所述待训练模型的7[0020]基于所述模型请求，从至少一个任务处理模型中确定对8标样本对于待训练模型的学习价值高于各候选样本中其他样本对于待训练模型的学习价[0040]图7是本说明书一个实施例提供的一种基于目标任务处理模型的信息处理方法的[0043]图10是本说明书一个实施例提供的一种用于模型训练的样本确定装置的结构示[0048]在本说明书一个或多个实施例中使用的术语是仅仅出于9述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分示的数据等均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收[0051]本说明书一个或多个实施例中，大模型是指具有大规模模型参数的深度学习模[0054]上下文学习（In_ContextLearning，ICL是近年来在自然语言处理（Natural然语言生成模型）系列、BERT（BidirectionalEncoderRepresentationfrom究人员和开发者识别模型在处理某些类型指令时存在的问题，从而指导模型的改进和优推理去计算指标值来进行样本筛选，但使用IFD分数进行聚类和训练经验模型的工作步骤在指令调优训练时保证各个筛选出的目标样本是有利于提升[0064]本说明书实施例中，将有利于提升模型任务表现的候选样本视为高质量样本数[0069]参见图2，图2示出了根据本说明书一个实施例提供的一种模型训练方法的流程续对待训练模型进行指标调优训练。候选样本集中各候选样本为问答数据对，如候选样本狗”。量的候选样本中筛选出有利于增强待训练模型性能的多样性子[0083]本实施例一个可选的实施方式中，确定候选样本集中第一第二样本向量的余弦相似度（CosineSimilarity将该余弦相似度作为该第一样本向[0102]需要说明的是，质量指标可以用于衡量第一候选样本对于待训练模型的学习价值，各个候选样本的质量指标用于筛选出能够提升待训练模型的任务表现能力的候选样[0111]具体实现时，可以基于第一候选样本的标签以及第一响应结果计算第一响应指第二响应指标的差值作为该第一候选样本的为待训练模型针对输入的第一候选样本获得的预测结果，标签为第一候选样本的真实结响应结果或第二响应结果中响应yi的第j个t习价值高于各候选样本中其他样本对于待训练模型的[0147]图3是本说明书一个实施例提供的一种模型训练过程的流[0158]参见图5，图5示出了根据本说明书一个实施例提供的一种任务处理方法的流程能。还例如，某个第三方应用通过应用程序编程接口（ApplicationProgramming频处理模型可以更加准确地理解待处理视频的图像信息和声音信息在时间及空间的细粒[0178]步骤606：基于第一问答数据对和该演示示例构造演示数据；基于初始问答大模问答数据对，基于该第一问答数据对和该相似问答数据对确定第一问答数据对的质量指模型规格参数中至少一项。[0197]基于目标场景的场景标识，从模型库中查找适应于目标场景的目标任务处理模[0199]多个适应于不同任务处理场景的任务处理模型为模型库中存储的多种专门设计[0212]需要说明的是，任务处理接口为终端设备调度目标任务处理模型的交互编程接本对于所述待训练模型的学习价值高于所述各候选样本中其他样本对于所述待训练模型标样本对于待训练模型的学习价值高于各候选样本中其他样本对于待训练模型的学习价技术方案属于同一构思，用于模型训练的样本确定装置的技术方案未详细描述的细节内[0271]本说明书一个或多个实施例中，该计算设备1200可以理由一个或多个网络1360与保存数据的数据库1350通信。这些网络1360的示例包括公用交换电话网（PSTN，PublicSwitchedTelephoneNetwork）、局域网（LAN，LocalArea如因特网的通信网络的组合。接入设备1340可以包括有线或无线的任何类型的网络接口（例如，网络接口卡（NIC，networkinterfacecontroller中的一个或多个，诸如基于目标任务处理模型的信息处理方法的技术该计算机程序/指令被处理器执行时实现上述模型训练方法、用于模型训练的样本确定方[0286]上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据专利实信号和电信信号。

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）

文档简介

温馨提示

最新文档

评论

CN119357679B 模型训练方法及用于模型训练的样本确定方法 （阿里云飞天(杭州)云计算技术有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN119357679B 模型训练方法及用于模型训练的样本确定方法（阿里云飞天(杭州)云计算技术有限公司）