CN115269808B 面向医疗智能问答的文本语义匹配方法和装置 (齐鲁工业大学(山东省科学院))_第1页
CN115269808B 面向医疗智能问答的文本语义匹配方法和装置 (齐鲁工业大学(山东省科学院))_第2页
CN115269808B 面向医疗智能问答的文本语义匹配方法和装置 (齐鲁工业大学(山东省科学院))_第3页
CN115269808B 面向医疗智能问答的文本语义匹配方法和装置 (齐鲁工业大学(山东省科学院))_第4页
CN115269808B 面向医疗智能问答的文本语义匹配方法和装置 (齐鲁工业大学(山东省科学院))_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

WO2020147369A1,2020.07面向医疗智能问答的文本语义匹配方法和本发明公开了一种面向医疗智能问答的文2嵌入层对输入的文本以字粒度和词粒度分别进行嵌入操作,输出文本字嵌入语义编码层接收文本字嵌入表示和词嵌入表示并使用双向长短期记忆网络BiLSTM进多层次细粒度特征提取层对语义编码层输出的文本特征融合层对多种相关特征进行合并,之后进行多种匹配操预测层将最终匹配特征向量输入多层感知机得到一个浮点型的数值,以文本P为例,该模块接收文本P字、词嵌其中,N表示字粒度特征与词粒度特征的长度,公式(1BiLSTM对文本P字嵌入表示进行编码,其中,pf表示通过双向长短期记忆网络B得到的文本P第i个位置字粒度特征,表示通过前向长短期记忆网络LSTM编码得到的文公式(2)与公式(1)中符号含义基本一致,p"表示通过双向长短期记忆网络BiLSTM编码得到的文本P第j个位置词粒度特征,表示通过前向LSTM编码得到的文本P第j个位置词粒3txtQ_char,txtP_word,txtQ_word);对于输入文本中的每个字和词都按照字词映射转字词向量映射层:加载构建字词映射转换表步骤中word_embed和txtQ_word_其中pf表示文本P第i个位置字粒度特征,来自公式(1),表示文本P的软对齐注意力权重,表示对软对齐注意力权重做softmax操作映射为0_1的数值,表示使用软对齐注意力使文本P第i个位置字粒加权求和进行重新表示,表示使用软对齐注意力使文本P第j个位置词粒度特征可由文4其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的Dense()使用乘法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求和进其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的Den用减法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求和进行重新表示,表示使用减法对齐注意力使文本P第j个位5"表示文本P第i个位置字粒度特征与文本P第j个位置字粒度特征之间的自对齐注意力权重,表示对自对齐注意力权重做softmax操作映射为0_1的数值,表示使用自对齐注意力使文本P第i个位置字粒度特征由文本P所有字粒度特征加权求和进行重新表第一层编码结构使用多个注意力模块提取同一文本力得到字粒度级别的文本P软对齐特征与词粒度级别的文本P软对齐特征如公式(7)注意力得到字粒度级别的文本P乘法对齐特征与词粒度级别的文本P乘法对齐特征A(P",P")(8)注意力得到字粒度级别的文本P减法对齐特征与词粒度级别的文本P减法对齐特征度级别的文本Q软对齐特征字粒度级别的文本Q乘法对齐特征词粒度级别的文本Q乘法对齐特征字粒度级别的文本Q减法对齐特征⊙词粒度级别的文本Q减法对齐第二层编码结构对同一文本细粒度初始语义特征进行增强首先,将公式(7)中字粒度级别的文本P软对齐特征与公式(1)中文本P字粒度特征6相加得到字粒度级别的文本P深层软对齐特征如公Pc相加得到字粒度级别的文本P深层乘法对齐特征如Pc相加得到字粒度级别的文本P深层减法对齐特征如文本P深层乘法对齐特征公式(12)中字粒度级别的文本P深层减法对齐特征联接得与公式(2)中文本P词粒度特征Pw相加得到词粒度级别的文本P深层软对齐特征如公式月"=户"+P"(14)Pw相加得到词粒度级别的文本P深层乘法对齐特征如Pw相加得到词粒度级别的文本P深层减法对齐特征",如公式(16)所示:."="+P"(16)接着,联接公式(14)词粒度级别的文本P深层软对齐特征公式(15)中词粒度级别的文本P深层乘法对齐特征公式(16)中词粒度级别的文本P深层减法对齐特征得到联接公式(10)中字粒度级别的文本P深层软对齐特征与公式(14)词粒度级别的文本7字粒度级别的文本Q深层乘法对齐特征字粒度级别的文本Q深层减法对齐本Q深层乘法对齐特征词粒度级别的文本Q深层减法对齐特征词粒度级别的文本Q第一层编码结构同时使用若干层编码结构提取文本之注意力得到字粒度级别的文本P软对齐交互特征与字粒度级别的文本Q软对齐交互特征如公式(19)所示:字粒度级别的文本P减法对齐交互特征与字粒度级别的文本Q减法对齐交互特征如特征Qw进行软对齐注意力得到词粒度级别的文本P软对齐交互特征与词粒度级别的文本词粒度级别的文本P减法对齐交互特征与词粒度级别的文本Q减法对齐交互特征如第二层编码结构对文本之间初始语义交互特征进行增强文本P字粒度特征Pc相加得到字粒度级别的文本P深层软对齐交互特征所,如公式(23)所所=所+pr(23)之后,将公式(20)中字粒度级别的文本P减法对齐交互特征与公式(1)中文本P字粒度特征Pc相加得到字粒度级别的文本P深层减法对齐交互特征所,如公式(24)所示:成所=所+pr(24)最后,联接公式(23)中字粒度级别的文本P深层软对齐交互特征与公式(24)中字粒8文本P词粒度特征相加Pw得到词粒度级别的文本P深层软对齐交互特征如公式(26)所之后,将公式(22)中词粒度级别的文本P减法对齐交互特征与公式(2)中文本P词粒度特征Pw相加得到词粒度级别的文本P深层减法对齐交互特征如公式(最后,联接公式(26)中词粒度级别的文本P深层软对齐交互特征与公式(27)中词粒联接公式(24)中字粒度级别的文本P深层减法对齐交互特征与公式(27)中词粒度级字粒度级别的文本Q深层减法对齐交互特征字粒度级别的文本Q高层交互特征Q本间语义交互特征提取。9特征融合层分为两个子模块,第一个子模块对多种相关特联接公式(13)中字粒度级别的文本P高层特征Pc'与公式(25)中字粒度级别的文本P高层交互特征Pc”得到字粒度级别的文本P聚合特征并将字粒度级别的文本P聚合特征进行自注意力得到字粒度级别的文本P深层聚合特征如公式(32)所粒度级别的文本P聚合特征进行自注意力得到词粒度级别的文本P深层聚合特征如之后,联接公式(32)中字粒度级别的文本P深层的文本P深层聚合特征然后进行最大池化操作得到池化后文本P语义特征P',如公式.级别的文本Q深层聚合特征词粒度级别的文本Q聚合特征Q:、词粒度级别的文本Q深再将公式(35)中文本P深层聚合特征与文本Q深层聚合特征进行软对齐注意力得到软对齐后文本P深层聚合特征与软对齐后文本Q深层聚合特征如公式首先,将公式(34)中池化后文本P语义特征P'与池化后文本Q语其次,将公式(34)中池化后文本P语义特征P'与池化后文本Qabmu将最终匹配特征向量F作为输入,使用三层的全连接层并且在第一层和第二层全连接层之后使用ReLU激活函数进行激活在第三层全连接层之后使用sigmoid函数进行激活,从下载网络上的数据集获取原始数据:下载网络上已经预处理原始数据:预处理用于构建文本语义匹配知识库的原始数据汇总子知识库:汇总文本语义匹配断字处理知识库、文所述文本语义匹配模型通过使用训练数据集进行训练而得到,构建训练数据集:将经过构建训练正例和构建训练所述文本语义匹配模型构建完成后通过训练数据集进行文本语义匹配模型的训练与7.一种面向医疗智能问答的文本语义匹配装[0002]医疗智能问答能够针对患者提出的问题自动在问答知识库中找到与之语义相近处理任务的核心目标是一致的,自然语言文本的语义匹配度计算是一项极具挑战的工作,[0006]本发明的技术任务是按以下方式实现的,面向医疗智能问答的文本语义匹配方[0008]语义编码层接收文本字嵌入表示和词嵌入表示并使用双向长短期记忆网络[0009]多层次细粒度特征提取层对语义编码层输出的文本字、词粒度特征进行同一文word得到其相应的文本字嵌入表示和词嵌入表示txtP_char_embed、txtQ_char_embed、txtP_word_embed和txtQ_word[0017]以文本P为例,该模块接收文本P字、词嵌入表示并使用双向长短期记忆网络pf=+厅(1)粒度特征,来自公式(2),表示文本P第i个位置字粒度特征与第j间的软对齐注意力权重,表示对软对齐注意力权重做softmax操作映射为0_1的数值,表示使用软对齐注意力使文本P第i个位置字[0031]其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的表示使用乘法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求[0034]其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的示使用减法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求和进行重新表示,表示使用减法对齐注意力使文本P第j个位置词粒度特征可由文本P所有si"表示文本P第i个位置字粒度特征与文本P第j个位置字粒度特征之间的自对齐注意力权自对齐注意力使文本P第i个位置字粒度特征由文本P所有字粒度特征加权求和进行重新表示;注意力得到字粒度级别的文本P软对齐特征与词粒度级别的文本P软对齐特征",如公对齐注意力得到字粒度级别的文本P乘法对齐特征与词粒度级别的文本P乘法对齐特征如公式(8)所示:对齐注意力得到字粒度级别的文本P减法对齐特征与词粒度级别的文本P减法对齐特征",如公式(9)所示:P")(9)词粒度级别的文本Q软对齐特征字粒度级别的文本Q乘法对齐特征词粒度级别的文本Q乘法对齐特征字粒度级别的文本Q减法对齐特征词粒度级别的文本Q减法对征Pc相加得到字粒度级别的文本P深层软对齐特征如公式(特征Pc相加得到字粒度级别的文本P深层乘法对齐特征所=成+pf(11)特征Pc相加得到字粒度级别的文本P深层减法对齐特征别的文本P深层乘法对齐特征公式(12)中字粒度级别的文本P深层减法对齐特征联[0055]R=[或;所;](13)征与公式(2)中文本P词粒度特征Pw相加得到词粒度级别的文本P深层软对齐特征",如[0057]"=⃞"+P"(14)特征Pw相加得到词粒度级别的文本P深层乘法对齐特征特征Pw相加得到词粒度级别的文本P深层减法对齐特征",如公式(16)所示:[0061]"="+P"(16)[0062]接着,联接公式(14)词粒度级别的文本P深层软对齐特征公式(15)中词粒度级别的文本P深层乘法对齐特征公式(16)中词粒度级别的文本P深层减法对齐特征Ri=[";⃞";"](17)[0064]联接公式(10)中字粒度级别的文本P深层软对齐特征与公式(14)词粒度级别的字粒度级别的文本Q深层乘法对齐特征字粒度级别的文本Q深层减法对齐特征的文本Q深层乘法对齐特征词粒度级别的文本Q深层减法对齐特征词粒度级别的对齐注意力得到字粒度级别的文本P软对齐交互特征与字粒度级别的文本Q软对齐交互得到字粒度级别的文本P减法对齐交互特征与字粒度级别的文本Q减法对齐交互特征如公式(20)所示:粒度特征Qw进行软对齐注意力得到词粒度级别的文本P软对齐交互特征与词粒度级别的得到词粒度级别的文本P减法对齐交互特征与词粒度级别的文本Q减法对齐交互特征如公式(22)所示:[0078]在字粒度下,首先,将公式(19)中字粒度级别的文本P软对齐交互特征与公式(1)中文本P字粒度特征Pc相加得到字粒度级别的文本P深层软对齐交互特征如公式[0080]之后,将公式(20)中字粒度级别的文本P减法对齐交互特征与公式(1)中文本P字粒度特征Pc相加得到字粒度级别的文本P深层减法对齐交互[0082]最后,联接公式(23)中字粒度级别的文本P深层软对齐交互特征与公式(24)中字粒度级别的文本P深层减法对齐交互特征得到字粒度级别的文本P高层交互特征Pc,,[0084]在词粒度下,首先,将(2)中文本P词粒度特征相加Pw得到词粒度级别的文本P深层软对齐交互特征如公式[0086]之后,将公式(22)中词粒度词粒度特征Pw相加得到词粒度级别的文本P深层减法对齐交互特征[0088]最后,联接公式(26)中词粒度级别的文本P深层词粒度级别的文本P深层减法对齐交互特征得到词粒度级别的文本P高层交互特征P″w,[0090]联接公式(24)中字粒度级别的文本P深层减法对齐交互特征与公式(27)中词粒特征字粒度级别的文本Q深层减法对齐交互特征字粒度级别的文本Q高层交互特征Q″c、词粒度级别的文本Q深层软对齐交互特征词粒度级别的文本Q深层减法对齐交[0104]联接公式(13)中字粒度级别的文本P高层特征Pc′与公式(25)中字粒度级别的文本P高层交互特征Pc′得到字粒度级别的文本P聚合特征并将字粒度级别的文本P聚合特征进行自注意力得到字粒度级别的文本P深层聚合特征如公式(公式(28)中词粒度级别的文本P高层交互特征P″w得到词粒度级别的文将词粒度级别的文本P聚合特征进行自注意力得到词粒度级别的文本P深层聚合特征如公式(33)所示:P⃞"=[R;P](35)粒度级别的文本Q深层聚合特征词粒度级别的文本Q聚合特征:、词粒度级别的文本[0113]再将公式(35)中文本P深层聚合特征与文本Q深层聚合特征进行软对齐注意力得到软对齐后文本P深层聚合特征与软对齐后文本Q深层聚合特征如公式[0115]随后,将公式(36)中软对齐后文本P深层聚合特征进行最大池化操作得到池(38)中减法匹配特征PQab、公式(39)中点乘匹配特征PQmu、公式(40)中深层减法匹配特征[0129]将最终匹配特征向量F作为输入,使用三层的全连接层并且在第一层和第二层全连接层之后使用ReLU激活函数进行激活在第三层全连接层之后使用sigmoid函数进行激[0138]所述文本语义匹配模型构建完成后通过训练数据集进行文本语义匹配模型的训[0168]参照说明书附图和具体实施例对本发明的面向医疗智能问答的文本语义匹配方入表示和词嵌入表示并使用双向长短期记忆网络BiLSTM进行编码输出文本P字、词粒度特将文本P字粒度特征与文本P词粒度特征进行软对齐注意力得到字粒度级别的文本P软对齐文本P词粒度特征进行乘法对齐注意力得到字粒度级别的文本P乘法对齐特征与词粒度级特征进行减法对齐注意力得到字粒度级别的文本P减法对齐特征与词粒度级别的文本P减将词粒度级别的文本P软对齐特征与文本P词粒度特征相加得到词粒度级别的文本P深层软度特征进行软对齐注意力得到字粒度级别的文本P软对齐交互特征与字粒度级别的文本Q度特征与文本Q词粒度特征进行减法对齐注意力得到词粒度级别的文本P减法对齐交互特征与词粒度级别的文本Q减法对齐交互特征;第二层编码结构对文本之间初始语义交互特文本P软对齐交互特征与文本P字粒度特征相加得到字粒度级别的文本P深层软对齐交互特本P深层软对齐交互特征与词粒度级别的文本P深层减法对齐交互特征得到词粒度级别的度级别的文本P聚合特征进行自注意力得到字粒度级别的文本P深层聚合特征;在词粒度进行最大池化操作得到池化后文本Q深层聚合特征;第二个子模块进行多种匹配操作获得[0171](1)嵌入层对输入的文本以字粒度和词粒度分别进行嵌入操作,输出文本字嵌入[0172](2)语义编码层对接收字嵌入表示和词嵌入表示并使用双向长短期记忆网络[0173](3)多层次细粒度特征提取层对语义编码层输出的文本字、词粒度特征进行同一[0175](4)预测层将最终匹配特征向量输入多层感知机得到一个浮点型的数值,将其作是,经过断字操作处理后的数据、经过分词操作处理后的数据并不会合并到同一文件中,感冒表现的症状都有哪些123456789?向量矩阵来初始化当前层的权重参数;针对输入文本txtP_char、txtQ_char、txtP_word、txtQ_word得到其相应文本字嵌入表示和词嵌入表示txtP_char_embed、txtQ_[0215]其中,embedding_matrix是字映射转换表步骤中训练所得的字词向量矩阵,[0216]相应的文本txtP_char、txtQ_char、txtP_woEmbedding层处理后得到相应的文本字嵌入表示和词嵌入表示txtP_char_embed、txtQ_[0218]以文本P为例,该模块接收文本P字、词嵌入表示并使用双向长短期记忆网络BiLSTM进行编码得到文本P字、词粒度特征,记为P"={P",P",…,P⃞},本P第i个位置字粒度特征,表示通过后向LSTM编码得到的文本P间的软对齐注意力权重,表示对软对齐注意力权重做softmax操作映射为0_1的数值,表示使用软对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特[0232]其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的表示使用乘法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求[0235]其中,TimeDistributed(Dense())表示对每一个时间步的张量都进行相同的示使用减法对齐注意力使文本P第i个位置字粒度特征可由文本P所有词粒度特征加权求和[0238]其中,pf表示文本P第i个位置字粒度特征,pf表si"表示文本P第i个位置字粒度特征与文本P第j个位置字粒度特征之间的自对齐注意力权自对齐注意力使文本P第i个位置字粒度特征由文本P所有字粒度特征加权求和进行重新表示;注意力得到字粒度级别的文本P软对齐特征与词粒度级别的文本P软对齐特征",如公对齐注意力得到字粒度级别的文本P乘法对齐特征与词粒度级别的文本P乘法对齐特征如公式(8)所示:对齐注意力得到字粒度级别的文本P减法对齐特征与词粒度级别的文本P减法对齐特征",如公式(9)所示:词粒度级别的文本Q软对齐特征字粒度级别的文本Q乘法对齐特征g、词粒度级别的文本Q乘法对齐特征字粒度级别的文本Q减法对齐特征词粒度级别的文本Q减法对征Pc相加得到字粒度级别的文本P深层软对齐特征如公式(特征Pc相加得到字粒度级别的文本P深层乘法对齐特征特征Pc相加得到字粒度级别的文本P深层减法对齐特征别的文本P深层乘法对齐特征公式(12)中字粒度级别的文本P深层减法对齐特征联[0256]R=[或;所;](13)征与公式(2)中文本P词粒度特征Pw相加得到词粒度级别的文本P深层软对齐特征",如特征Pw相加得到词粒度级别的文本P深层乘法对齐特征特征Pw相加得到词粒度级别的文本P深层减法对齐特征",如公式(16)所示:[0262]"="+P"(16)[0263]接着,联接公式(14)词粒度级别的文本P深层软对齐特征公式(15)中词粒度级别的文本P深层乘法对齐特征公式(16)中词粒度级别的文本P深层减法对齐特征[0264]Ri=[";⃞";"](17)[0265]联接公式(10)中字粒度级别的文本P深层软对齐特征与公式(14)词粒度级别的字粒度级别的文本Q深层乘法对齐特征字粒度级别的文本Q深层减法对齐特征的文本Q深层乘法对齐特征:、词粒度级别的文本Q深层减法对齐特征词粒度级别的对齐注意力得到字粒度级别的文本P软对齐交互特征与字粒度级别的文本Q软对齐交互得到字粒度级别的文本P减法对齐交互特征与字粒度级别的文本Q减法对齐交互特征如公式(20)所示:粒度特征Qw进行软对齐注意力得到词粒度级别的文本P软对齐交互特征与词粒度级别的文本Q软对齐交互特征:,如公式(21)所示:得到词粒度级别的文本P减法对齐交互特征与词粒度级别的文本Q减法对齐交互特征:,如公式(22)所示:[0279]在字粒度下,首先,将公式(19)中字粒度级别的文本P软对齐交互特征与(1)中文本P字粒度特征Pc相加得到字粒度级别的文本P深层软对齐交互特征所,如公式[0281]之后,将公式(20)中字粒度级别的文本P减法对齐交互特征与公式(1)中文本P字粒度特征Pc相加得到字粒度级别的文本P深层减法对齐交互[0283]最后,联接公式(23)中字粒度级别的文本P深层软对齐交互特征与公式(24)中字粒度级别的文本P深层减法对齐交互特征得到字粒度级别的文本P高层交互特征Pc″,[0285]在词粒度下,首先,将公式(21)中词粒度级别的文本P软对齐交互特征与公式(2)中文本P词粒度特征相加Pw得到词粒度级别的文本P深层软对齐交互特征如公式[0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论