CN119398160A 实体及实体关系的确定方法及信息抽取模型的训练方法 (南京硅基智能科技有限公司)_第1页
CN119398160A 实体及实体关系的确定方法及信息抽取模型的训练方法 (南京硅基智能科技有限公司)_第2页
CN119398160A 实体及实体关系的确定方法及信息抽取模型的训练方法 (南京硅基智能科技有限公司)_第3页
CN119398160A 实体及实体关系的确定方法及信息抽取模型的训练方法 (南京硅基智能科技有限公司)_第4页
CN119398160A 实体及实体关系的确定方法及信息抽取模型的训练方法 (南京硅基智能科技有限公司)_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实体及实体关系的确定方法及信息抽取模体及实体关系的确定方法及信息抽取模型的训第一实体和各第一实体之间的实体关系确定提实体之间的实体关系确定为各目标实体之间的2对所述提问信息中的法律要素进行特征提取,得到所述提问信息对应的多个要素特基于所述第一事件信息对应的监督向量和所述多个要素特征确定所述提问信息对应基于所述多个第一实体和各所述第一实体之间的实体关系,确在所述第二事件信息与所述第一事件信息相同的情况下,将所信息对应的多个目标实体中各所述目标实体之间的实体关通过多个要素提取模型对所述提问信息中多种类型的法律要素进行特对所述第一事件信息对应的监督向量与各所述要素特征采用注意力机制对所述多个第一要素特征中各所述第一对所述多个第二要素特征进行特征融合处理,得到内容特征,并根基于各所述标签序列对应的多个标签信息,确基于各所述标签序列对应的条件概率,在所述多基于所述提问信息和所述多个第一实体,确定所述提问信息对3基于所述多个第一实体、各所述第一实体之间的实体关系和各所所述多个第一实体、各所述第一实体之间的实体关系和各所述第一实体对应的初始特征,通过多个神经网络层基于所述句法图和各所述第一实体对应将所述多个神经网络层中最后一个神经网络层确定的各所述节点的通过所述多个神经网络层中的第一神经网络层基于各所述节点对通过所述多个神经网络层中的第二神经网络层基于各所述节点的在所述第二事件信息与所述第一事件信息不相同的情况下,定所述提问信息对应的多个第二实体以及所述多个第二实体中各所述第二实体之间的实基于所述多个第二实体和各所述第二实体之间的实体关系,确在所述第三事件信息与所述第二事件信息相同的情况下,将所信息对应的多个目标实体中各所述目标实体之间的实体关4对所述法律事件信息进行向量化处理得到监督向量,并对基于所述监督向量和所述多个要素特征确定所述训练文本基于所述多个预测实体和所述多个目标实体,确定所述信息抽取获取所述训练文本对应的真实标签序列,并基于所述真实标签基于所述条件概率确定所述信息抽取模型对应对所述第一损失函数和所述第二损失函数中的参数进行优化,以第一获取模块,被配置为获取用户输入的提问信息和所第一处理模块,被配置为对所述第一事件信息进行向量特征提取模块,被配置为对所述提问信息中的法律第一确定模块,被配置为基于所述第一事件信息对应的第二确定模块,被配置为基于所述多个第一实体和各所述第一实体之间的实体关系,第三确定模块,被配置为在所述第二事件信息与所述第实体关系确定为所述提问信息对应的多个目标实体中各所述目标实体之间的实体第二获取模块,被配置为获取训练文本、所述训练文本第二处理模块,被配置为对所述法律事件信息进行向量化处第四确定模块,被配置为基于所述监督向量和所述多个要素特第五确定模块,被配置为基于所述多个预测实体和所5优化模块,被配置为对所述第一损失函数中的参数进行其中,当所述一个或多个程序被所述一个或多个处理器执行器实现根据权利要求1_9中任一项所述的实体及实体关系的确定方法,或实现根据权利要6以基于所确定的法律事件对咨询信息进行进一步的处理(如检索相关的案例和法律依据等以为用户提供准确的咨询意见。[0003]本申请实施例提供了一种实体及实体关系的确定方法及信息抽取模型的训练方7[0008]在一些实施例中,上述基于上述多个第一实体和各上述第一实体之间的实体关实体对应的核心信息以及各上述第一实体之间的核心关系;上述基于上述多个第一实体、[0011]在一些实施例中,上述基于上述提问信息特征和上述提8二事件信息相同的情况下,将上述多个第二实体确定为上述提问信息对应的多个目标实之间的实体关系确定为上述提问信息对应的多个目标实体中各上述目标实体之间的实体9[0023]现有的命名实体识别(NamedEntityRecognition,NER)模型和关系抽取同的法律案件中的法律实体信息也不相同。例如,民事侵权事件中所涉及的法律实体信息型对法律实体信息进行抽取的过程会较为复杂,而且无法采用监督学习的方式让模型学习所需抽取的实体和实体关系;并且,用户所输入的咨询信息中的法律信息内容通常较长且致传统的NER模型和RE模型无法很好地实现对法律实体信息和实确定方法及信息抽取模型所得到的结论仅用于向用户形成咨询于基于提问信息中的实体确定各实体之间的实体提问信息中的实体及实体关系进行抽取,以使法律事件检测模型140基于提问信息中的实取模型100先获取用户输入的提问信息以及在之前的法律事件检测过程中所得到的法律事件检测结果(即第一事件信息并通过实体抽取层10中的监督模型110对该第一事件信息[0030]示例性地,通过信息抽取模型100所得到的提问信息对应的第一实体及第一实体[0032]在第二事件信息与上述第一事件信息不相同的情况下,信息抽取模型100可以基事件检测模型140基于该次信息抽取所得到的第二实体及第二实体之间的实体关系,确定件信息不相同的情况下,继续通过信息抽取模型100基于第三事件信息进行法律信息的抽提高法律咨询场景下的实体及实体关系抽取的准该提问信息进行上一轮法律事件检测时所得到的法律事件检化处理,以得到第一事件信息对应的监督向量。其中,监督模型可以由BERT模型或Transformer模型构成;监督向量用于辅助内容模型更加准确地确定出提问信息中的实体一事件信息对应的法律信息类型中的因果关系标记[0045]步骤240,基于第一事件信息对应的监督向量和多个要素特征确定提问信息对应模型可以进一步对多个要素特征和监督向量进行融合,从而得到提问信息对应的内容特的多个第一实体后,通过信息抽取模型中的图神经网络GNN基于提问信息对应的多个第一[0049]示例性地,图神经网络GNN能够基于提问信息中多个第一实体以及各第一实体之的各边用于表示各第一实体之间的实体关系。图神经网络GNN能够采用信息传递机制逐次于第二事件信息进一步进行法律案件或法律条文的检索以为用户提供法律咨询[0060]通过上述方案,通过训练多个专用于提取相应类型的要[0061]图3为本申请一些实施例提供的另一种实体及实体关系的确定方法的流程图,如[0062]步骤310,对第一事件信息对应的监督向量与各要素特征进行拼接处理或点乘处为:化工厂R=[f1,f2,.…,fn]、鱼塘F2=[f1,f2,…,fn]、排污F3=[f1,f2,…,fn]等,则对上述上述监督向量s与各要素特征Ri进行点乘处理,可以得到点乘后的各第一要素特征。[0065]步骤320,采用注意力机制对多个第一要素特征中各第一要素特征的权重进行调[0071]图4为本申请一些实施例提供的再一种实体及实体关系的确定方法的流程图,如[0075]步骤420,基于各标签序列对应的多个标签信息,确定各标签序列对应的转移概[0077]示例性地,可以基于训练后的转移概率矩阵确定多个标[B主体,B行为]+A[B行为,O非实体]+A[O非实体,B损害事实]+A[B损害事实,B主损害事实体]+[B主体,B主体]+A[B主体,I行为]=0.0+0.8签序列Y对应的转移概率确定。指数函数用于计算得分函数的对数似[0083]步骤440,基于各标签序列对应的条件概率,在多个标签序列中确定目标标签序特比算法确定目标标签序列Y*的过程中,CRF层基于标签序列中各个标签信息之间的转移[0086]图5为本申请一些实施例提供的又一种实体及实体关系的确定方法的流程图,如通常会涵盖与提问信息中各第一实体有关的所有可能的上下文[0089]沿用上例,通过BERT模型提问信息中各第一实体对法图可以基于第一实体以及各第一实体之间的实体关系确定。最后将最后一层GCN得到的定的提问信息特征以及GCN所确定的提问信息对应的核心信息,确定提问信息对应的第二融合特征进行分类,得到的分类结果即为提问信息对应的法律事件信息(即第二事件信间的核心关系,进而能够基于各第一实体对应的核心信息和各第一实体之间的核心关系,[0098]图6为本申请一些实施例提供的又一种实体及实体关系的确定方法的流程图,如[0099]步骤610,以各第一实体为节点,并以各第一实体之间的实体关系为边确定句法[0100]在一些实施例中,在得到上述多个第一实体以及各第一实体对应的特征进行更新。以多个节点中的目标节点为例,可以通过多层GCN中的前一层中的目标节点对应的当前特征即为目标节点对应定为各第一实体对应的核心信息和各第一实体之间[0107]在一些实施例中,上述多层GCN中的最后一层GCN得到的[0108]通过上述方案,通过多层GCN基于句法图对BERT模型输出的各第一实体对应的初[0109]图8为本申请一些实施例提供的又一种实体及实体关系的确定方法的流程图,如特征H(+1)为第l+1层的各节点对应的更新后的特征。[0119]表示通过归一化的邻接矩阵将第层GCN确定的节点对应的当前特征[0121]在一些实施例中,在第一层GCN得到目标节点对应的第一特征后,再通过第二层第一特征,对目标节点对应的第一特征进行更新,得到目标节点对应的更新后的第一特征[0124]在一些实施例中,在通过多层GCN得到各第一实体对应的核心信息以及各第一实法律事件进行分类,得到一个或多个目标事件信息。其中,该分类模型可以基于全连接在多层GCN的输出与提问信息出现偏离的情况下导致无法得到准确的法律事件检测结果的将各第二实体之间的实体关系确定为提问信息对应的多个目标实体中各目标实体之间的L1=-NZ⃞[y;log(J)+(1-y)log(1-列)]2)标签序列,并基于训练文本对应的目标标签序列,确定目标标签序列对应的条件概率P(YIX)。其中,目标标签序列对应的条件概率可以基于目标标签序列对应的转移概率确L2=-NZ⃞1logp(YIX)(3)[0151]示例性地,在确定出内容模型对应的第一损失函数和CRF层对应的第二损失函数能够提高法律咨询场景下的实体及实体关系抽取[0158]第二确定模块1150,被配置为基于多个第一实体和各第多个要素模型中的各要素模型分别用于提取表征各标签序列对应的多个标签信息之间的依赖关系;基于各标签序列对应的转移概率,SpecificIntegratedCircuit,ASIC或者是被配置成实施本申请一些实施例的一个或[0182]程序1305具体可以被处理器1301调用使电子设备1300执行实体及实体关系的确述实施例中的实体及实体关系的确定方法或信息抽取模[0184]可执行指令具体可以用于使得电子设备1300执行实体及实体关系的确定方法或[0186]本申请一些实施例提供的计算机可读存储介质所能达到的有益效果可参考上文备而使用。的电连接部(电子装置便携式计算机盘盒(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论