版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于预训练语言模型的电子病历文本命名体涉及一种基于预训练语言模型的电子病历文在超大规模中文语料中训练得到深层语言模型2步骤2,基于规范的医疗术语集对步骤1中经数据预处理的所述原始文本进行实体标2.根据权利要求1所述的基于预训练语言模型的电子病历文本命名实体识别方法,其3.根据权利要求1或2所述的基于预训练语言模型的电子病历文本命名实体识别方法,4.根据权利要求3所述的基于预训练语言模型的电子病历文本命名实体识别方法,其5.根据权利要求4所述的基于预训练语言模型的电子病历文本命名实体识别方法,其6.根据权利要求5所述的基于预训练语言模型的电子病历文本命名实体识别方法,其7.根据权利要求6所述的基于预训练语言模型的电子病历文本命名实体识别方法,其8.根据权利要求7所述的基于预训练语言模型的电子病历文本命名实体识别方法,其9.根据权利要求8所述的基于预训练语言模型的电子病历文本命名实体识别方法,其3[0003]自然语言处理是计算机与人工智能领域的一个交叉方向,命名实体识别(NamedEntityRecognition,简称NER)是自然语言处理的一个基本任务,旨在识别出自然语言文后将文本与规则进行匹配来实现实体识别,但该方法在构建规则时需要语言学背景知识,4于SNOMEDCT医疗术语集并采用BIO标注模式标注出步骤1中经数据预处理的所述原始文本5[0025]3.本发明提供的基于预训练语言模型的电子病历文本命名实体识别方法,采用ERNIE预训练语言模型代替常规的Bert预训练语言模型,通过建模海量数据中的实体概念[0027]图1为本发明实施例1提供的基于预训练语言模型的电子病历文本命名实体识别[0034]步骤2:基于规范的医疗术语集对步骤1中经数据预处理的原始文本进行实体标[0035]具体地,基于SNOMEDCT医疗术语集并采用BIO标注模式对步骤1中经数据预处理6原始文本疾病和诊断检查检验手术药物解剖部位总数原始文本疾病和诊断检查检验手术药物解剖部位总数标注集21162223184565363LSTM输出的隐状态序列与反向LSTM的序列在各个位置输出的隐状态进行按位置拼接得到分得到,一部分由LSTM的pi决定,另一部分则由CRF层的转移矩阵A决定,继而可以利用7[0057]模型训练时通过最大化对数似然函数,公式(3)给出了对一个训练样本(x,yx)的[0061]将步骤3中训练文本的训练集的字向量输入至上述BiLSTM-CRF序列标注模型中得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025新三基三严考试题题库(附答案)
- 2026农业农产品行业市场现状供需分析及投资评估规划分析研究报告
- 2025新时事热点政治题库及答案(满分必刷)
- 2025新中级会计职称考试经济法考试题及答案
- 2026届内蒙古巴彦淖尔五原县联考中考英语考前最后一卷含答案
- 河北省保定市竞秀区2026届中考英语最后冲刺模拟试卷含答案
- 2026届天津市大港油田重点达标名校中考语文模拟试题含解析
- 2026届江苏省苏州市葛江中学中考历史对点突破模拟试卷含解析
- 2026年计算机网络技术的实习报告3000字
- 农田水利设施隐患排查评估整治技术指南(2025年版)
- NB-T20048-2011核电厂建设项目经济评价方法
- TD/T 1036-2013 土地复垦质量控制标准(正式版)
- 《变电站二次系统数字化设计编码规范》
- 公交司机环境监测远端交互系统设计
- 小学五年级《美术》上册知识点汇总
- 中国儿童原发性免疫性血小板减少症诊断与治疗改编指南(2021版)
- 2023年新高考II卷数学高考试卷(原卷+答案)
- 电子支付与网络银行课件
- 京东集团员工手册-京东
- 消防工程移交培训资料及签到表
- 自来水企业危险源辨识清单
评论
0/150
提交评论