版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据进行知识抽取来生成目标信用主体的知识体自身的实体、属性以及各信用主体之间的关以及基于目标信用主体的第一风险预测结果和本公开提供的方法和装置例如可以应用于金融2获得信用主体的目标特征数据,其中,所述信用主体包含目标信用主对所述目标特征数据进行知识抽取来生成所述目标信用主体的知基于所述知识图谱,从所述非目标信用主体中确定出与所述目标信按照预设路径方向获得包含所述目标信用主体的最短路径,其中,所述基于所述包含所述目标信用主体的最短路径和/或所述知识图谱的社区划分结果,从所述非目标信用主体中确定出与所述目标信用主体具有关联关系的关联信用主体,其中,基于所述目标信用主体的第一风险预测结果和所述关联信用主体的第二风险预测结基于所述对应的知识抽取逻辑,对所述目标特征数据进行知通过网络本体语言定义所述领域本体的所属类别以及隶属于所述所基于所述实体标识、属性标识以及关系标识,构建用于描述调用所述图数据库的知识抽取中间件对所述目标特征数据进行知识抽取来获得目标利用所述目标字段信息充填所述实体描述框架来生成所述目标信用主体的知识图谱,3应的所述第一属性信息以及与所述关系标识对应的对所述目标特征数据进行标注来获得标注序列信息,其中,基于弱监督学习的抽取方法对所述目标特征数据进行抽取来获得第二关系信息,其基于所述第二实体信息、所述第二属性信息和所述第二关系信息生述属性标识对应的所述第二属性信息以及与所述关系标识对应的所述基于所述置信度阈值,从所述信用主体中抽取置信度值满足所述置对所述领域本体的所属类别进行一致性检测来清理异常所述类将所述目标信用主体的目标特征数据输入所述风险预测模型来获得所述目标信用主将所述关联信用主体的目标特征数据输入所述风险预测模型来获得所述关联信用主获取训练样本数据,其中,所述训练样本数据包括信用正常的信4在所述第一风险预测结果表征所述目标信用主体的信用异常在所述第一风险预测结果表征所述目标信用主体的信用正常,在所述第一风险预测结果表征所述目标信用主体的信用正常,生成模块,用于对所述目标特征数据进行知识抽取来生成所述第一确定模块,用于基于所述知识图谱,从所述非目标信第一获得子模块,用于按照预设路径方向获得包含所述目第二确定子模块,用于基于所述包含所述目标信用主体的最短路径和/或所述知识图第二确定模块,用于基于所述目标信用主体的第一风其中,当所述一个或多个程序被所述一个或多个处理器执处理器执行根据权利要求1至11中任一项5目标特征数据进行知识抽取来生成上述目标信用主6应的上述第二属性信息以及与上述关系标识对应的上述理来完善上述知识图谱;和/或对上述领域本体的所属类别进行一致性检测来清理异常上述类别。最短路径和/或上述知识图谱的社区划分结果,从上述非目标信用主体中确定出与上述目的目标特征数据输入上述风险预测模型来获得上述关联信用主体的第二风险预7特征数据进行知识抽取来生成上述目标信用主述属性标识对应的上述第一属性信息以及与上述关系标识对应的上述第8短路径和/或上述知识图谱的社区划分结果,从上述非目标信用主体中确定出与上述目标第一将上述目标信用主体的目标特征数据输入上述风险预测模型来获得上述目标信用主述风险预测模型来获得上述关联信用主体的第二风险预据包括信用正常的信用主体的特征数据和信用低的信用主体的特征数据;以及训练模块,9用信用主体之间存在的关联关系,导致对该信用主体的信用风险预测的结果准确率不高,[0032]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目[0041]图9示意性示出了根据本公开实施例的适于实现上文描述的信用风险的预测方法[0042]图10示意性示出了根据本公开实施例的适于实现上文描述的信用风险的预测方使用或者结合指令执行系统使用。为可应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内[0054]需要说明的是,本公开实施例所提供的信用风险的预测方法一般可以由服务器中。本公开实施例所提供的信用风险的预测方法也可以由不同于服务器105且能够与终端取方式不同。由于目标特征数据指的是能够表征监控对象发生信用违约行为可能性的数图谱的构建以不同数据结构的数据为基础,可以较为全面客观地反映实体之间的关联关型包含某个学科领域内的基本术语和术语之间的关系,或者称为概念以及概念之间的关[0070]具体实施时,可以利用对本体进行语义描述的网络本体语言(OntologyWeb单向关系可以包含关系起点和关系终点。其中关系类型代表关系的不同类型和作用范围,法来表示的资料模型(DataModel用来描述Web资源的特性,以及资源与资源之间的关架用于信息需要被应用程序处理而不是仅仅显示给人观看的场合。的百科网页数据,其中百科网页数据一方面作为附加数据可以对原始数据进行很好的补StockholderInfo字段包含企业的股东信息,KeyPersonInfo字段包含企业关键人物的信自不同数据源的数据转换为具有统一Json数据格式的多个数据,再实现数据的批量化导种实体之间关联关系的构建,可以包括但不限于人物和企业实体对于某一企业的参股关[0085]图4示意性示出了根据本公开实施例对结构化数据知识抽的到第二实体信息、与属性标识对应的第二属性信息以及与关系标识对应的第二关系信[0089]在本公开中,非结构化的文本数据采用经典的双向长短期记忆神经网络-条件随payee][贷款本金/type][1097250.07元/amt]以及[支付/act]截止2014年3月11日止的[积[0094]图5示意性示出了根据本公开实施例对非结构化数据知识抽取流程图。如图5所换为表格文件,放到输入文件夹下,作为待抽取的文章。然后在DeepDive的主程序文件通过规则给其中的部分数据分配相应的标签。首先是定义标签表用于存储打标的监督数以得到实体之间关联关系的置信度结果,如表5所示。在置信度的预设阈值为0.85的情况Jena推理机的数据包含两部分,一部分数据是RDF格式的三元组知识,也就是领域企业实[0109](2)Enterprise[0115]通过本公开的实施例,通过知识库推理对企业关联信息知识图谱进行补充和完路径方向包括出度方向和入度方向;通过预设社区发现算法获得知识图谱的社区划分结和/或知识图谱的社区划分结果,从非目标信用主体中确定出与目标信用主体具有关联关[0118]其中企业基本属性类的特征变量用来描述企业的基本信息,可以包括注册资本、[0120]其中企业外部关系类变量刻画的是企业在图谱网络结构与其他高风险节点是否和关联交易关系统计实体节点三度关系内包含的高风险节点数量和比例作为风控模型的[0128]在本公开中,在Neo4j图数据库中实现通过最短路径算法判断企业实体与其他实划Cypher查询语句中的最短路径可能会产生不同的查询计划。在Neo4j图数据库中内部如果可以搜索路径时进行关系谓词的评估,那么在Neo4j图数据库中将会采用快速双向广度历的搜索可能会很大占用资源并耗费大量时间。如在两个节点之间没有最短路径的情况[0130]在Neo4j中使用Cypher查询语句进行最短路径的查询,基于最短路径获取当前企业的风险特征信息,查询当前的企业节点和低信用评分列表中的企业和人物的最短路径,[0132]可选地,节点的度指的是在网络中所有n个节点和当前节点有路径连接的实体p与某一节点i之间所有连通路径中最短的一条。基于最短路径能得到两个节点之间的亲和叫做当前节点p的亲密度,亲密度概念是为了描述当前节点p和网络中其他节点的亲疏体的目标特征数据输入风险预测模型来获得关联信用主体的第表征目标信用主体的信用异常的情况下,确定目标信用主体的信用风险预测结果为高风常企业和低信用企业的特征得到风控模型对企业风[0152]图8示意性示出了根据本公开实施例的信用风险的预测装[0154]生成模块820,用于对目标特征数据进行知识抽取来生成目标信用主体的知识图[0156]第二确定模块840,用于基于目标信用主体的第一风险预测结果和关联信用主体包括:第一构建模块850,用于构建用于描述信用主体的关联信息的领域本体。定义模块识对应的第二属性信息以及与关系标识对应的第体的所属类别进行一致性检测来清理异常类主体的最短路径和/或知识图谱的社区划分结果,从非目标信用主体中确定出与目标信用的目标特征数据输入风险预测模型来获得关联信用主体的第二风险预路(ASIC或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实[0171]图9示意性示出了根据本公开实施例的适于实现上文描述的信用风险的预测方法[0172]在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形“示例性方法”部分中描述的根据本发明各种示例性实施例的信用风险的预测方法中的前中所示的操作S410~操作S4120、如图5中所示的操作S510~操作S5100以及如图6中所示的操作S610~操作S640。[0176]可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序[0177]图10示意性示出了根据本公开实施例的适于实现上文描述的信用风险的预测方储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)根据本公开实施例的方法流程的不同动作的单一处理单元或者是ROM1002以及RAM1003通过总线1004彼此相连。处理器1001通过执行ROM1002和/或RAM例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM1002和/或RAM1003和/或ROM1002和RAM1003以外的一个或多个存储器。[0186]本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可不脱离本公开精神和教导的情况下,本公
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四爱三有活动实施路径
- 读书活动策划书
- 系统流程对比分析
- 为教育插上翅膀
- 圣诞小精灵课件
- 14小马过河课件
- 常规教育教研体系构建
- 大班毕业活动流程策划
- 不同家庭教育模式比较研究
- 2026年上海市中考二模英语试卷试题及答案详解
- 2025届新高考英语复习《完形填空》题型分析及策略
- 2025年福建鑫叶投资管理集团有限公司招聘考试试卷真题
- 2026年上海市徐汇区高三下学期二模地理试卷和答案
- 上海市静安区2026年下学期九年级中考二模 历史试卷(含答案)
- 2026年山东春考《网络技术类专业知识》模拟试题及答案解析
- 如何提高老年人健康体检率
- 消化科人文关怀服务建设
- 2026年内蒙古公务员录用考试《行测》题(含答案)
- 涉氨制冷试题及答案
- 2026年抚顺辅警招聘考试历年真题及完整答案
- 2026年医师定期考核人文试题库100道带答案(满分必刷)
评论
0/150
提交评论