版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
街道华航社区华富路1018号中航中心WO2021143018A1,2021.07.22WO2021143020A1,2021.07.将各文本特征转换为第一Embedding向量;对所有第一Embedding向量进行处理,得到指定Embedding向量;基于医学术语库生成临床术语个候选文本Embedding向量;基于孪生网络分别计算指定Embedding向量与每一个候选文本2对所述临床术语进行多维度特征处理,生成与所述临床术语对应的多基于预设的深度卷积神经网络与预设的注意力模型对所有所述第一Embedding向量进基于预设的医学术语库生成与所述临床术语对应的候选集;其中将每一个所述候选文本输入至预设的transformerencoder网络,生成与各所述候选基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本基于所有所述相似度,从所有所述候选集文本中确定出与所述临床所述基于预设的深度卷积神经网络与预设的注意力模型对所有所述第一Embedding向将所有所述第一Embedding向量输入至所述深度卷积神经网络中,获取所述深度卷积神经网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第二池化层对所述卷积层中的各所述抽象特征Embedding向量分别进行池化处理,得到与各所的抽象特征Embedding向量作为所述第二Embed将所有所述第二Embedding向量输入至所述注意力模型,通过所述注意力模型输出与将所述多维度向量作为所述指定Embed分别获取每一个所述第二关键词在所述医学术语库中的出现关键词中筛选出所述出现次数大于预设出现次数阈值的第三关从所述医学术语库中获取与所述第三关键词对应的第3所述基于所有所述相似度,从所有所述候选集文本中确定出与所述从所有所述相似度中筛选出数值最大的第一相从所述候选集中获取与所述第一候选文本Embedding向量对应的第所述基于所有所述相似度,从所有所述候选集文本中确定出与所述从所有所述相似度中筛选出数值最大的第二相若存在所述第三相似度,获取与各所述第二相似度、所述第三相从所述候选集中获取与各所述第二候选文本Embedding向量一一对应的第二候选文接收预设用户从所有所述第二候选文中选择基于预设的分词工具对所述临床术语进行分词处理,得到对应的字特征基于预设的字转拼音模型获取与所述临床术语基于预设的医学词库获取与所述临床术语对应的手术部位特征络包括第一网络与第二网络,所述基于预设的孪生网络分别计算所述指定Embedding向量将所述指定Embedding向量输入至所述第一网络,获取所述第一网络输出的与所述指将指定候选文本Embedding向量输入至所述第二网络,获取所述第二网络输出的与所为所有所述候选文本Embedding中将所述向量余弦值作为所述第一向量数据与所述第二向量数据之间4第一生成模块,用于对所述临床术语进行多维度特征处理,处理模块,用于基于预设的深度卷积神经网络与预设的注意力模型对所有所述第一生成与各所述候选文本分别对应的多个候选文本Em计算模块,用于基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述确定模块,用于基于所有所述相似度,从所有所述候选集所述基于预设的深度卷积神经网络与预设的注意力模型对所有所述第一Embedding向将所有所述第一Embedding向量输入至所述深度卷积神经网络中,获取所述深度卷积神经网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第二池化层对所述卷积层中的各所述抽象特征Embedding向量分别进行池化处理,得到与各所的抽象特征Embedding向量作为所述第二Embed将所有所述第二Embedding向量输入至所述注意力模型,通过所述注意力模型输出与将所述多维度向量作为所述指定Embed分别获取每一个所述第二关键词在所述医学术语库中的出现关键词中筛选出所述出现次数大于预设出现次数阈值的第三关从所述医学术语库中获取与所述第三关键词对应的第5所述基于所有所述相似度,从所有所述候选集文本中确定出与所述从所有所述相似度中筛选出数值最大的第一相从所述候选集中获取与所述第一候选文本Embedding向量对应的第所述基于所有所述相似度,从所有所述候选集文本中确定出与所述从所有所述相似度中筛选出数值最大的第二相若存在所述第三相似度,获取与各所述第二相似度、所述第三相从所述候选集中获取与各所述第二候选文本Embedding向量一一对应的第二候选文接收预设用户从所有所述第二候选文中选择处理器执行时实现权利要求1至3中任一项所述的方6[0001]本申请涉及人工智能技术领域,具体涉及一种基于模型的临床术语的标准化方如何提高床术语标注化的准确性称为了当前亟[0006]对所述临床术语进行多维度特征处理,生成与所述临床术语对应的多个文本特[0007]基于预设的深度卷积神经网络与预设的注意力模型对所有所述第一Embedding向[0009]将每一个所述候选文本输入至预设的transformerencoder网络,生成与各所述候选文本分别对应的多个候选文本Embedd[0010]基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本7[0019]将所有所述第一Embedding向量输入至所述深度卷积神经网络中,获取所述深度卷积神经网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第二池化层对所述卷积层中的各所述抽象特征Embedding向量分别进行池化处理,得到与各所的抽象特征Embedding向量作为所述第二Embed[0020]将所有所述第二Embedding向量输入至所述注意力模型,通过所述注意力模型输[0022]可选地,所述基于预设的医学术语库生成与所述临床术第二关键词中筛选出所述出现次数大于预设出现次数阈值的计算所述指定Embedding向量与每一个所述候选文本Embedding向量之间的相似度的步骤,[0033]将所述指定Embedding向量输入至所述第一网络,获取所述第一网络输出的与所述指定Embedding向量对应的第一[0034]将指定候选文本Embedding向量输入至所述第二网络,获取所述第二网络输出的与所述指定候选文本Embedding向量对应的第二向量数据;其中,所述指定候选文本Embedding为所有所述候选文本Embeddi8[0035]通过余弦相似度公式计算所述第一向量数据与所述第二向量数据之间的向量余[0047]从所述候选集中获取与各所述第二候选文本Embedding向量一一对应的第二候选[0054]第二生成模块,用于基于预设的医学术语库生成与所述临床[0055]第三生成模块,用于将每一个所述候选文本输入至预设的transformerencoder[0056]计算模块,用于基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本Embedding向量之间的9进行处理得到指定Embedding向量。之后基于预设的医学术语库生成与所述临床术语对应的候选集,并将候选集中每一个候选文本输入至预设的transformerencoder网络以生成与各所述候选文本分别对应的多个候选文本Embedding向量,后续基于预设的孪生网络分经网络与注意力模型的处理生成所述临床术语对应的指定Embedding向量,以及通过预设的医学术语库以及transformerencoder网络生成与所述临床术语对应的候选集的候选文本Embedding向量,再基于预设的孪生网络对Embedding向量与候选文本Embedding向量进述候选文本分别对应的多个候选文本Embed[0076]S6:基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文[0080]在得到了所述第一Embedding向量后,基于预设的深度卷积神经网络与预设的注取它的上下文信息,如输入“左上肺叶切除”,输出为每一个字,包含上下文信息的获取所述深度卷积神经网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第二Embedding向量。以及将所有所述第二Embedding向量输入至所述注意力模型,通过所述注意力模型输出与所述第二Embedding向量对应的多维度向量。进而将所述多维应的多个候选文本Embedding向量。其中,所述Tansformerencoder网络为现有的Tansformer模型(机器翻译模型)的encoder网络结构。另外,可将所有候选文本输入至床术语生成指定Embedding向量的处理以生成对应的多个候选文本Embedd[0082]后续基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本Embedding向量之间的相似度。其中,在将指定Embedding向量与每一个所述候选文本Embedding向量输入至孪生网络后,可对应得到第一向量数据以及对应的多个第二向量数弦值来快速的计算出指定Embedding向量与每一个所述候选文本Embedding向量之间的相专家人员的选择从相似度数值最大的对应的多个候选文本中确定出与所述临床术语对应理以及特征转换处理得到对应的第一Embedding向量,然后基于预设模型对所有所述第一网络以生成与各所述候选文本分别对应的多个候选文本Embedding向量,后续基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本Embedding向量之间的设的深度卷积神经网络与注意力模型的处理生成所述临床术语对应的指定Embedding向候选集的候选文本Embedding向量,再基于预设的孪生网络对Embedding向量与候选文本Embedding向量进行相似度计算分析以实现筛选出最终的与临床术语对应的标准临床术是使用HMM模型(隐含马尔可夫模型)进行训练生成的,分词工具的训练生成过程采用的是word2vector方法或其他常见词向量方法在大规模中文语料上进行训练得到,在此不作过多阐述。之后基于预设的医学词库获取与所述临床术语对应的手术部位特征与手术入路特文献等文档进行人工构建生成的医学库,医学库中至少存储有手术术语,以及与手术术语相关的手术部位描述与手术入路描述。医学词库的应用可以认为是查询的操作,根据对临获取各文本特征的步骤的顺序不限于本实施例中示出的顺序,且各文本特征的获取处理还术部位特征与所述手术入路特征作为所述文本特征。本实施例通过使用分词工具、字转拼音模型以及医学词库可以快速地获取到与所述临床术语对应的字特征、词特征、医学词性该文本特征对应的Embedding向量进行相应处理以准确地生成用于与候选文本Embedding向量进行相似度计算的指定Embedding向量,进而基于得到的相似度数值来准确地确定出深度卷积神经网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第的池化层对所述卷积层中的各所述抽象特征Embedding向量分别进行池化处理,得到与各后的抽象特征Embedding向量作为所述第二Embedd型输出与所述第二Embedding向量对应量输入至所述深度卷积神经网络中,获取所述深度卷积神经网络对各所述第一Embedding网络对各所述第一Embedding向量进行特征信息提取后得到的对应的多个第二Embedding第一Embedding向量分别对应的抽象特征Embedding向量。具体的,所述卷积处理包括:Cx=21(f⃞xinput)+b,其中inputf表示输入的第一Embedding向量,fx,i表示卷积层中的各所述抽象特征Embedding向量分别进行池化处理,得到与各所述抽象特征Embedding向量作为所述第二Embedding向量。具体的,所述池化处理包括:其中表示对得到的Cx进行池化处理后得到的字特征的Embedding输入深度卷积神经网络后,输出为每一个字,包含其他特征的信息的SelfAttentionY后进行拼接确定向量Z,再基于向量Z以及Attention向量SelfAttentionZ于评价每种第二Embedding向量加权关系的Attention向量SelfAttentionY的具体过程包i进确定权重向量WeightY,所述权重向量WeightY通过如下公式确定:weighty=由query与对应key通过函数计算得到。query和key的维度为dk,value的维度为dv,计算Softmax为权重向量计算公式:Embedding向量对应的多维度向量的过程包括:将每一个第二Embedding向量分别代入到S4);selfAttentionz=得到的该多维度向量可以捕捉六个维度度卷积神经网络与预设的注意力模型能够快速智能地输出指定Embedding向量,有利于后续能够基于预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本有所述第二关键词中筛选出所述出现次数大于预设出现次数阈值中的出现次数。倒排索引(invertedindex)源于实际应用中需要根据属性的值来查找记的标准临床术语。由于后续只需执行临床术语对应的指定Embedding向量与每一个候选文术语库包含的每一个医学术语对应的Embedding向量进行数据比较处理,能够有效降低生出的与所述指定候选文本Embedding向量对应的第二向量数据;其中,所述指定候选文本Embedding为所有所述候选文本Embeddi预设的孪生网络分别计算所述指定Embedding向量与每一个所述候选文本Embedding向量获取所述第一网络输出的与所述指定Embedding向量对应的第一向量数据。以及同时将指定候选文本Embedding向量输入至所述第二网络,获取所述第二网络输出的与所述指定候[ht-1(Wi*[ht-1,xt]+bi);c=tanh(t输入至所述第一网络得到第一向量数据,以及将指定候选文本Embedding向量输入至所述予赘述。最后将所述向量余弦值作为所述第一向量数据与所述第二向量数据之间的相似似度公式计算所述第一向量数据与所述第二向量数据之间的向量余弦值来快速的计算出基于所有所述相似度来从所有所述候选集中确定出与所述临床术语对应的标准临床术语,[0117]S703:从所述候选集中获取与所述第一候选文本Embedding向量对应的第一候选述第一相似度的数量是否等于1。若等于1,获取与所述第一相似度对应的第一候选文本通过对所有相似度进行筛选处理后将数值最大的第一相似度对应的候选文本作为所述标[0124]S713:从所述候选集中获取与各所述第二候选文本Embedding向量一一对应的第对应的第二候选文本Embedding向量。之后从所述候选集中获取与各所述第二候选文本Embedding向量一一对应的第二候选文本。后续接收预设用户从所有所述第二候选文中选标准临床术语。本实施例当存在与相似度数值最大的相似度的数值相近的其他相似度时,[0128]本申请实施例中的基于模型的临床术语的标准化方法还[0133]处理模块3,用于基于预设的深度卷积神经网络与预设的注意力模型对所有所述[0135]第三生成模块5,用于将每一个所述候选文本输入至预设的Tansformerencoder所述候选文本Embedding向量之间的述手术部位特征与所述手术入路特征作为所[0147]第一输入单元,用于将所有所述第一Embedding向量输入至所述深度卷积神经网络中,获取所述深度卷积神经网络对各所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 五年级下册语文期末复习知识点
- 小学三年级上册《万以内的加法和减法(一)》两位数加减两位数的口算知识点试卷
- 小学三年级上册《不懂就要问》课后复述故事知识点试卷
- 小学科学《我的科学小课题研究》单元知识点试卷
- 湖北省武汉市2024-2025学年高二上学期期末考试英语试题
- 小学二年级下册语文园地知识点巩固试卷
- 2026年祖国在我心中测试题及答案
- 四川省成都市多校2025-2026学年高一上学期期末物理试卷
- 2026年清正廉洁测试题及答案
- 2026年普华永道笔试英文测试题及答案
- 端午节父亲节双节主题班会课件
- 2026年高考政治时政热点(必背)
- 4输变电工程施工质量验收统一表式(电缆工程电气专业)-2024年版
- 人卫社系列丛书编写要求
- 线型低密度聚乙烯
- 生物医用金属材料--ppt课件
- ∶万水系沉积物测量工作方法及技术要求
- 施工单位工程联系单最新
- 黔西南州金州教育云平台【官方入口】
- 兰州市中考英语英语任务型阅读理解试题(附答案)
- 教学能力大赛三相异步电动机的基本控制+教案
评论
0/150
提交评论