CN113661488B 用于访问主数据管理系统的数据记录的方法 (国际商业机器公司)_第1页
CN113661488B 用于访问主数据管理系统的数据记录的方法 (国际商业机器公司)_第2页
CN113661488B 用于访问主数据管理系统的数据记录的方法 (国际商业机器公司)_第3页
CN113661488B 用于访问主数据管理系统的数据记录的方法 (国际商业机器公司)_第4页
CN113661488B 用于访问主数据管理系统的数据记录的方法 (国际商业机器公司)_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2021.09.29PCT/IB2020/052498202WO2020/201875EN2020.10.08用于访问主数据管理系统的数据记录的方法的在所接收的请求中被引用的一个或多个属性个搜索引擎的搜索性能满足当前选择规则。并2标识所述多个属性中的在所接收的请求中被引用的一个或多个属性的选择所述主数据管理系统的所述搜索引擎中的一个或多个搜索引擎的或多个搜索引擎的用于搜索所述属性集合的至少一部分的值的性能满足其中,所述结果包括与由所述搜索引擎中的评分引擎获得的为所述结果的每个数据记录分配指示所述数据记录的完成度权重和指示所述数据记对于所述组件的至少一部分中的每个组件,确定所述用户参数的5.根据权利要求4所述的方法,还包括提供将所述用户参数的值与所述组件参数的所6.根据权利要求4所述的方法,还包括使用预定义模型对所述用户参数的值的变化与用所述更新后的权重来更新被分配给所述组件的3对于所述搜索引擎中的每个搜索引擎,确定指示所述搜索引擎的性能的性能参数的11.根据权利要求9所述的方法,所述选择规则使用将属性关联到对应搜索引擎的表,确定用户参数的值,所述用户参数的值量化对所述搜索引擎使用所确定的与所述搜索引擎的组合中的每个搜索引擎相关联的值来标识小于预定14.根据权利要求1-12中任一项所述的方法,其中标识所述属性集合包括将所接收的15.根据权利要求1-12中任一项所述的方法,将所述属性集合输入到预定义机器学习模型,并且从所述机器学习模型接收能够被用于搜索所述属性集合的一个或多个搜索引17.根据权利要求1-12中任一项所述的方法,其中所提供的所述结果包括根据所述请18.一种包括计算机可读存储介质的计算机程序产品,所述计算机可读存储介质具有管理系统的数据记录,所述数据管理系统包括用于使得能够访问所述数据记录的搜索引4标识所述多个属性中的在所接收的请求中被引用的一个或多个属性的选择所述主数据管理系统的所述搜索引擎中的一个或多个搜索引擎的或多个搜索引擎的用于搜索所述属性集合的至少一部分的值的性能满足其中,所述结果包括与由所述搜索引擎中的评分引擎获得的为所述结果的每个数据记录分配指示所述数据记录的完成度权重和指示所述数据记其中,所述结果包括与由所述搜索引擎中的评分引擎获得的为所述结果的每个数据记录分配指示所述数据记录的完成度权重和指示所述数据记述权重提供器被配置用于根据在提供所述结果时涉及的组件的性能来对所述匹配得分进其中所提供的所述结果包括具有高于预定义得分阈值的加权匹配得分的非重5[0002]企业数据匹配涉及匹配和链接从不同来源接收的客户数据并创建真实数据的单[0003]各种实施例提供了如独立权利要求的主题所描述的用于访问主数据管理系统的搜索引擎的用于搜索属性集合的至少一部分的值的性能满足当前选择6[0017]图4A描绘了包括来自不同引擎的搜索结果的表格,所述搜索结果被标准化和合[0023]图5是用于更新权重的方法的流程图,所述权重用于对多个搜索引擎处理搜索请7[0036]根据一个实施例,该方法还包括基于对所提供的结果的用户操作来更新选择规且所选择的搜索引擎是那些所标识的条目的搜索引擎。选择规则的更新可以包括更新表,例如,如果对来自搜索引擎SEx并且与搜索的给定属性Tx相关联的显示结果的点击次数小分,其中所提供的结果包括具有高于预定义得分阈值的加权匹配得分的非重复数据记录。8[0040]例如,所接收的数据请求的搜索结果的产生涉及搜索过程的执行(本方法可包括施例的搜索过程的至少一部分组件中的每个组件分配指示其执行其相应功能的性能的权太有用。9权重。该实施例可以使数据管理系统能够基于其对数据搜索的自身经验来保持自我改进。至少一个。例如,活动监视器可以使用点击计数和/或可以检查在各个结果上花费的时间如搜索引擎1(SE1))的性能。对于每个搜索引擎,这可以导致三个性能参数值Perf_att1_SE1、Perf_att2_SE1和Perf_att3_SE1。搜索引擎SE1的当前权重可以从Perf_att1_SE1、并且从所述机器学习模型接收可以用于搜索所述属性集合的一个[0059]图1是用于访问主数据管理系统的数据记录的方法的流程图。数据记录包括多个用一个或多个搜索引擎来增强,该一个或多个搜索引擎能够访问中央储存库的数据记录。索和匹配引擎能够基于输入数据的类型或所进行的查询的类型来利用多个搜索和索引引可以以特定概率确定输入文本是否可以是名称或地址或电话号码或SSN等。引擎选择器还括由搜索引擎获得的用于搜索属性的不同值并且由用户点击或使用的结果的平均匹配得[0071]在步骤111中,可以例如由主数据管理系统的结果提供器提供由搜索引擎的组合评分的一个或多个评分引擎的至少一部分可以是或可以不是给定搜索引擎的一部[0078]在步骤203中可以对匹配得分进行加权。可以根据产生结果所涉及的组件的性能[0079]使用加权匹配得分,在步骤205中可以通过去除结果的重复数据记录并保留具有为名称+出生日期(Name+DOB),并且实体标识器将第一令牌标识为具有90%置信度的名称[0086]在步骤305中,可以为结果的每个数据记录分配指示数据记录的完成度权重和指重(与名称属性相关联)Wb为0.9,因为它们是具有90%置信度的标识名称属性的实体标识置信度的DOB的实体标识器的结果集。完成度权重wc基于每个记录的完成度。例如R1完成[0089]图5是用于更新权重的方法的流程图,该权重用于对多个搜索引擎处理搜索请求[0090]在向用户提供结果时,活动监视器可以在步骤501中监视对所提供的结果执行的见图4D)与用户对所列范围中具有完成度的数据记录执行的点击的百分比之间的关联。在更新后的权重可以用于对执行新的搜索请求所产生的数据记录的匹配[0094]图7描绘了根据本公开的示例的计算机系统700的框图表示。计算机系统700例如[0096]主数据管理系统701还可以被配置成处理用于访问存储在中央储存库710中的数置信度将它们映射到存储在中央存储库710中的数据记录的属性,这允许它们用于执行结的SSN。实体识别器721可以被配置成使用机器学习模型来分类或识别存储在中央储存库擎。基于引擎选择器722的规则,可以选择多个搜索引擎并使用它们来获得良好的候选列用户理解更好的匹配。匹配质量还可以基于关于可以在UI上寻找的匹配质量的显式反馈。[0099]主数据管理系统701还包括不同的API,用于允许存储以及访问中央储存库710中理系统701包括用于应用可见性规则的组件727和用于应用同意管理的另一组件728。主数据管理系统701包括用于对要存储在中央储存库710中的数据应用标准化规则的组件729。以包括管理搜索用户接口(UI)741,用于提交用于查询中央资料库710中的数据的搜索查索请求。可以使用主数据管理系统701的匹配和评分服务来对搜索请求的执行结果进行评[0104]图9描绘了示出根据本主题的处理请求的示例的图。图9的第一列901示出了所接果R1至R7可能需要使用如列906中所示的数据控制过滤器来过滤。在被过滤之后,如列907因为提交结果的用户不被允许访问它们。[0107]1.一种用于访问主数据管理系统的数据记录的方法,所述数据记录包括多个属[0108]用一个或多个搜索引擎来增强所述主数据管理系统,以便能够访问所述数据记一个或多个搜索引擎的用于搜索所述属性集合的至少一部分的值的性能满足当前选择规[0114]2.根据条款1所述的方法,还包[0119]为所述结果的每个数据记录分配指示所述数据记录的完成度权重和指示所述数[0124]6.根据条款5所述的方法,还包[0125]7.根据第5条所述的方法,还包括频率和访问结果中的给定结果的持续时间中[0134]使用所确定的与所述搜索引擎的组合中的每个搜索引擎相关联的值来标识小于所述机器学习模型接收可以用于搜索所述属性集合的一个或多个训练集,其中每个训练属性集合被标记以指示适合于执行所述训练属性集合的搜索引擎;[0141]19.一种用于根据预定义搜索过程括一个或多个值以及所述用户参数的相关联的值;使用所确定的关联来确定更新后的权重;[0151]21.根据条款20所述的方法,还[0152]22.根据条款20所述的方法,还包括使[0154]在此参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/[0156]计算机可读存储介质可以是能够保留和存储由指令执行设备使用的指令的有形[0157]本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/接收计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的[0158]用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言(例如以通过任何类型的网络连接到用户计算机系统的计算机,包括局域网(LAN)或广域网可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计[0159]在此参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/据处理装置和/或其他设备以特定方式工作,使得其中存储有指令的计算机可读存储介质以由执行指定功能或动作或执行专用硬件和计算机指令的组合的专用的基于硬件的系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论