CN119416782A 基于大语言模型的中医方学习方法、装置、设备及介质 (成都字节流科技有限公司)_第1页
CN119416782A 基于大语言模型的中医方学习方法、装置、设备及介质 (成都字节流科技有限公司)_第2页
CN119416782A 基于大语言模型的中医方学习方法、装置、设备及介质 (成都字节流科技有限公司)_第3页
CN119416782A 基于大语言模型的中医方学习方法、装置、设备及介质 (成都字节流科技有限公司)_第4页
CN119416782A 基于大语言模型的中医方学习方法、装置、设备及介质 (成都字节流科技有限公司)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于大语言模型的中医方学习方法、装置、本发明能为传统中医药的传承与发展提供了强2构建白话文表达的中医术语集合,所述白话文表达获取文言文表达的中医医案,基于切词工具对文言文表达的中医医案调用训练好的模型,从白话文表达的中医术语集合中查基于向量化工具分别对与每个文言文表达的中医术语相匹配的白话文表达的中医术创建每个文言文表达的中医术语的ID,根据每个文对若干文言文样本与若干白话文样本之间的对应关系根据标注后的若干文言文样本与若干白话文样本之间的对应关系创达的中医术语集合中查找到与每个文言文表达的中医术语相匹配的白话文表达的中医术基于相似度函数,分别计算每个文言文表达的中医术语与白话文3中的多个白话文表达的中医术语的相似度,得到每个文言文表达的中医术语的相似度集从每个文言文表达的中医术语的相似度集合中提取出相似度最高值,对应的白话文表达的中医术语作为与该文言文表达的中医术语相匹配的白话文表达的中8.一种基于大语言模型的中医方学习装置,所述装置用于实现权利要求1_7中任一项文本切分模块,用于基于切词工具对医生当前的白话文医案本文医案匹配模块,用于基于医案的语义向量表9.一种电子设备,包括存储器、处理器以及存储在执行时实现权利要求1_7中任一项所述的基于大语言模型4[0004]当前名老中医方学习算法主要有基于文本字符的搜索技术和基于文本语义的匹所述向量数据库基于文言文中医文本和大语言模获取文言文表达的中医医案,基于切词工具对文言文表达的中医医案进行切分,5基于向量化工具分别对与每个文言文表达的中医术语相匹配的白话文表达的中个文言文表达的中医术语对应的白话文语义向量表达构建向对若干文言文样本与若干白话文样本之间的对应关系[0011]优选地,所述向量化工具为BoW算法、TF_IDF算法、Word2Vec模型、BERT模型或高值对应的白话文表达的中医术语作为与该文言文表达的中医术语相匹配的白话文表达6图1是本发明一种实施方式提供的基于大语言模型的中医方学习方法的流程图,传输到客户端,客户端将图片再上传到服务器,服务器采用OCR(OpticalCharacter7[0023]步骤S30:基于向量化工具对医案术语集合进行向量化,得到医案的语义向量表量的具有相同意思的文言文表达的中医术语和白话8[0029]在本实施例中,基于开源训练框架训练模型(deepspeed加载基础模型QWen2_步骤a502:从每个文言文表达的中医术语的相似度集合中提取出相似度最高值,将相似度最高值对应的白话文表达的中医术语作为与该文言文表达的中医术语相匹配的[0035]步骤a60:基于向量化工具分别对与每个文言文表达的中医术语相匹配的白话文表达的中医术语进行向量化,得到每个文言文表达的中医术语对应的白话文语义向量表9图2是本发明一种实施方式提供的基于大语言模型的中医方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论