版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于多个原始数据集和预设开源模型确定多个原始数据集对应的多个初始监督数据集和多个个待混合数据集进行合并,得到目标监督数据2获取预设开源模型和多个待求解问题类型对应的多个原基于所述多个原始数据集和所述预设开源模型确定所述多个原始数据集对应的多个初始监督数据集和所述多个原始数据集对应的和所述预设开源模型确定所述多个原始数据集对应的多分别将所述多个原始数据集对应的待求解问题输入将所述正确执行结果、所述正确执行结果对应的待求解问题和所述将所述目标问题结果与所述原始数据集的原始问题结果进行比对,基于结果比对相同的目标问题结果对应的待求解问题和结果比对相同的目标问题结果对应的问题推理路径确定所述多个原始数据集对应的多个初标问题结果对应的待求解问题和结果比对相同的目标问题结果对应的问题推理路径确定重复执行所述分别将所述多个原始数据集对应的待求解问题输入至所述预设开源模型的步骤至所述将所述目标问题结果与所述原始数据集的原始问题结果进行比对得到结问题结果对应的待求解问题和结果比对相同的目标问题结果对应的问题推理路径确定所将结果比对相同的目标问题结果对应的待求解问题与结果比对相同的目标问题结果3基于预设推理路径数量对所述去重监督数据中所述待求解问题为同类型的问题推理表示确定所述多个中间监督数据集中的多个待将所述多个中间监督数据集对应的问题词向量表示可视化至二维空间在所述数据集分布图确定分布位置不一致的中间监督数据集为所述待存储器,其上存储有用于数据集构建的程序代码,当所述程序4[0002]在大型语言模型(LargeLanguageModel,LLM)出现涌现(Emergent)能力的背景调增强开源大语言模型的能力来构建数学问题求解系统则成不考虑数据质量而直接使用或简单过滤制作的全部5应的待求解问题和结果比对相同的目标问题结果对应的问题推理路径确定多个原始数据比对相同的目标问题结果对应的问题推理路径确定多个原始数据集对应的多个初始监督开源模型的步骤至将目标问题结果与原始数据集的原始问题结果进行比对得到结果比对对相同的目标问题结果对应的问题推理路径确定多个原始数据集对应的多个初始监督数预设推理路径数量对去重监督数据中待求解问题为同类型的问题推理路径进行筛选提取,6应的待求解问题相似的问题,又可求解与原始数据集对应的待求解问题类型不同的问题,该问题求解模型对题目或者问题进行求解能够提升问题求解效率[0020]通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目7[0030]通过有监督微调增强开源大语言模型的能力来构建数学问题求解系统则成为可虑数据质量而直接使用或简单过滤制作的全[0034]在步骤S101中,获取预设开源模型和多个待求解问题类型对应的多个原始数据多个初始监督数据集和多个原始数据集对应的多个问题词向量表示。在本申请实施例中,嵌入式自然语言处理(NLP)中的一组语言建模和特征学习技术的统称,来自词汇表的单词时,预设开源模型可以采用Codellama34B模型,进而利用Codellama34B模型分别生成8而基于多个原始数据集和预设开源模型确定多个原始数据集对应的多个初始监督数据集,应的待求解问题相似的问题,又可求解与原始数据集对应的待求解问题类型不同的问题,源模型输出的结果进行处理来构建出初始监督数据集。下文将结合图2来对初始监督数据集的构建过程进行详细描述。图2示出了本申请另一些实施例的数据集构建方法的示例性[0045]在步骤S201中,分别将多个原始数据集对应的待求解问能会存在代码部分,将该代码部分进行提取后得到多个问题答案对应的多个问题结果代9际应用情况来选取合适的执行方式去执行该问题结果代码,本申请在此方面不作任何限源模型的步骤至将目标问题结果与原始数据集的原始问题结果进行比对得到结果比对相相同的目标问题结果对应的问题推理路径确定多个原始数据集对应的多个初始监督数据本申请又一些实施例的数据集构建方法的示例性流程图,图5示出了本申请实施例的数据预设推理路径数量对去重监督数据d′中待求解问题为同类型的问题推理路径进行筛选提一待求解问题类型的问题推理路径基本能够符合待求解问题的[0057]在步骤S302中,将多个中间监督数据集对应的问题词向量表示可视化至二维空distributedstochasticneighborembedding)将多个中间监督数据集对应的问题词向和TAL_SCQ5K的问题词向量表示的分布位置与其余三个GSM_Hard、SVAMP和ASDiv的分布位[0061]图4示出可以实施本申请实施例的数据集构建方法的电子设备400的硬件配置的[0062]电子设备400可以对应于具有各种处理功能的计算设备,例如,用于生成神经网预设开源模型确定多个原始数据集对应的多个初始监督数据集和多个原始数据集对应的数据集;进而基于多个问题词向量表示确定多个中间监督数据集中的多个待混合数据集;以存储电子设备400中的处理过的数据和待处理的数据。存储器420可存储处理器410已处非易失性存储器中的至少一种。非易失性存储器可以包括只读存储器(ROM)、可编程ROM记忆棒中的至少一项。[0066]综上,本说明书实施方式提供的电子设备400的存储器420和处理器410实现的具件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecific括以用于存储信息的任何方法或技术实现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动法律制度适应新就业形态变革与权益保障研究-基于2024年平台用工劳动争议案件裁判规则实证分析
- 广西玉林市2026年七年级下学期语文期中试卷附答案
- 物业管理咨询公司工作管理办法
- 2026年小区保洁主管考试试题及答案
- 正畸用镍钛记忆合金丝细胞毒性的多维度剖析与安全评估
- 正常小鼠减重法测定rhvCNTF生物活性的方法学深度剖析与应用拓展
- 正交偶极子对阵列的谱估计算法:原理、应用与优化
- 2026年电气材料检测考试试题及答案
- 欧波同公司市场营销策略的多维剖析与优化路径
- 2026年服务顾问转正考试试题及答案
- “沙钢杯”第十一届全国钢铁行业职业技能竞赛(电工)理论试题库-中(多选题)
- 钢铁行业低硫烟气钙基干法脱硫技术规范
- 铁皮棚搭建合同
- 集合间的基本关系高一上数学人教A版(2019)必修第一册
- 六年级语文下册10古诗三首《竹石》公开课一等奖创新教学设计
- 教师礼仪在课堂管理中的应用
- TQGCML 3022-2024 智能空降门规范
- 2024届高考英语阅读理解说明文篇章结构课件
- 新生儿喂养不耐受-新生儿喂养不耐受诊断标准教学课件
- 维吾尔乐器简介课件
- 《云南省田坝煤矿二号井采矿权出让收益评估报告》
评论
0/150
提交评论