CN119179756B 基于大语言模型的海洋预警报智能问答方法及相关装置 (国家海洋环境预报中心)_第1页
CN119179756B 基于大语言模型的海洋预警报智能问答方法及相关装置 (国家海洋环境预报中心)_第2页
CN119179756B 基于大语言模型的海洋预警报智能问答方法及相关装置 (国家海洋环境预报中心)_第3页
CN119179756B 基于大语言模型的海洋预警报智能问答方法及相关装置 (国家海洋环境预报中心)_第4页
CN119179756B 基于大语言模型的海洋预警报智能问答方法及相关装置 (国家海洋环境预报中心)_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于大语言模型的海洋预警报智能问答方本申请公开了一种基于大语言模型的海洋类任务链和向量数据库中的每一向量化语料进的问题进行检索及重排序,得到目标向量化语2将所述问题与每一类任务链的基本信息进行匹配,得到与所基于最近邻搜索和重排序方法将所述问题与向量数据库中的每一向量化语料进行匹将所述目标向量化语料填充到所述目标任务链的提示词模板的海洋预警报大语言模型是对大语言模型进行增量预训练和指令精调将所述问题与每一类任务链的基本信息进行匹配,得到与所分别对所述问题和每一类任务链的基本信息进行向量化处理对于每一类任务链,计算所述向量化问题与所述任务链的向量化基本信息的相似度,若否,则选取默认任务链作为目标任务链;所述默认任务链的提示基于最近邻搜索和重排序方法将所述问题与向量数据库中的每一向量化语料进行匹对多个初步向量化语料进行重排序,并基于重排序结果对多个初步3对海洋预警报中文自然语言资料进行预处理,得到海洋预警报语料,对所述海洋预警报专业知识语料库进行标注,生成种子指令集;对所述种子指令集进行扩展,得到扩展后指令集,并对所述扩展后指利用所述海洋预警报多任务指令集对所述海洋5.一种基于大语言模型的海洋预警报智能问答任务链匹配模块,用于将所述问题与每一类任务链的基本问题相匹配的目标任务链;所述任务链的类型包括专业知识问答中选择题任务的任务链、答案生成模块,用于将所述目标向量化语料填充到所述目标任务链将所述问题与每一类任务链的基本信息进行匹配,得到与所分别对所述问题和每一类任务链的基本信息进行向量化处理对于每一类任务链,计算所述向量化问题与所述任务链的向量化基本信息的相似度,4若否,则选取默认任务链作为目标任务链;所述默认任务链的提示基于最近邻搜索和重排序方法将所述问题与向量数据库中的每一向量化语料进行匹对多个初步向量化语料进行重排序,并基于重排序结果对多个初步理器执行时实现权利要求1_4中任一项所述的基于大语言模型的海洋预警报智能问答方实现权利要求1_4中任一项所述的基于大语言模型5解决上述问题提供了崭新的思路。但现有的特定专业应用领域的模型普遍存在以下问题,[0005]本申请的目的是提供一种基于大语言模型的海洋预警报智能问答方法及相关装6[0010]基于最近邻搜索和重排序方法将所述问题与向量数据库中的每一向量化语料进充后模板作为输入,利用海洋预警报大语言模型输出对所述问题进行回答所得到的答案;所述海洋预警报大语言模型是对大语言模型进行增量预训练和指令精调算机程序被处理器执行时实现上述的基于大语言模型的海洋处理器执行时实现上述的基于大语言模型的海洋预警报智7[0023]图1为本申请实施例1提供的一种基于大语言模型的海洋预警报智能问答方法的[0024]图2为本申请实施例1提供的一种基于大语言模型的海洋预警报智能问答方法的[0029]图7为本申请实施例2提供的一种基于大语言模型的海洋预警报智能问答装置的[0030]图8为本申请实施例2提供的另一种基于大语言模型的海洋预警报智能问答装置8问题与向量数据库中的每一向量化语料进行匹配,得到与问题相匹配的目标向量化语料,9答案;所述海洋预警报大语言模型是对大语言模型进行增量预训练和指令精调后所得到题相匹配的目标任务链,将用户输入的问题与向量数据库中的每一向量化语料进行匹配,含有最新的海洋预警报语料,解决现有模型在知识更新机制方面存在明显的滞后的问题,生成任务的任务链采用第二种任务链形式,摘要总结任务的任务链采用第一种任务链形[0063]"请根据以上背景知识与天气形势场,描述海浪实况。以下是天气形势场:[0102]如图4所示,基于最近邻搜索和重排序方法将问题与向量数据库中的每一向量化[0106]利用向量数据库的Query接口,通过向量的相似度匹配在向量数据库中粗召回最邻搜索算法—分层可导航小世界(Hierarchiranking旨在对粗召回的top_K1条记录进行进一步的精细化排序处理,获得top_K2条记[0109]本实施例采用了bce_reranker_base模型来执行Re_ranking机制,该模型的核心原理是利用交叉熵编码器对用户输入的问题和初步召回的top_K1条记录进行深入的特征在重排序阶段舍弃一定数量的相关性最低的记录,还进一步优化了大语言模型推理的效[0112]本实施例收集海洋预警报中文自然语言资料,构建海洋应用户向智能问答系统提问的问题的内容主体;"input"为用户提问问题中额外的输入数[0134]现有模型存在数据安全与合规问题,这是由于现有模型依赖于国外非开源模型[0135]针对扩展后指令集,本实施例进一步进行抽样人工审核及修订,去除其中因chatglm3_6B模型幻觉造成的低质量指令,最终得到33035条指令,将指令格式转为nA.WAM模式\nB.WaveWatchIII模式\nC.SWAN模式\nD.NOWAMO模式"考虑多种影响海浪的因素,如地形引起的折射效应、波波间的非线性相互作用等,此外,[0144]增量预训练是大语言模型在大规模的无标签海洋预警报专业知识语料库上以无监督学习的方式进行预训练。本实施例使用的第一大语言模型为开源中文大语言模型集以有监督学习的方式进行指令精调,具体采用高效参数微调(Parameter_Efficient海洋预警报语料的海洋预警报专业知识语料库通过向量化技术进行存储,得到向量数据够将文本数据映射到一个768维的密集向量空间,利用余弦相似度来量化文本向量之间的[0166]本实施例先收集海洋预警报中文自然语言资料,构建海洋预警报专业知识语料能GPU服务器集群上执行,操作系统环境为RedHatEnterpriseLinuxServerrelease海洋预警报大语言模型Chinese_llama_alpaca2_13BChatglm3_6B准确率53.3%48.3%提供的基于大语言模型的海洋预警报智能问答方法属于问题处于大语言模型的海洋预警报智能问答装置实施例中的具体限定可以参见上文中对于基于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口现实施例1所述的基于大语言模型的海洋预警机程序被处理器执行时实现实施例1所述的基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论