版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号CN113544726A
(43)申请公布日2021.10.22
(21)申请号202080020197.9(74)专利代理机构北京英赛嘉华知识产权代理
有限责任公司11204
(22)申请日2020.03.10
代理人王达佐王艳春
(30)优先权数据
(51)Int.CI.
2019-0436742019.03.11JP
G06030/02(2006.01)
2019-1889862019.10.15JP
G06030/06(2006.01)
2019-1889852019.10.15JP
G06Q50/70(2006.01)
(85)PCT国际申请进入国家阶段日
2021.09.10
(86)PCT国际申请的申请数据
PCT/JP2020/0103792020.03.10
(87)PCT国际申请的公布数据
W02020/184580JA2020.09.17
(71)申请人株式会社博报堂DY控股集团
地址日本东京
(72)发明人猪谷诚一道本龙权利要求书2页说明书40页附图53页
(54)发明名称
中介装置、系统以及计算机程序
(57)摘要
一种中介装置,具备请求获取部、重复确认
获取部、确定部、以及获取发送部。请求获取部获
取请求信息。重复确认获取部获取重复确认信
息。重复确认信息是显示由第1个人数据管理方
管理的第1个人数据和由第2个人数据管理方管
理的第2个人数据是涉及同一个人的个人数据的
信息,其中,第2个人数据管理方是与第1个人数
据管理方不同的个人数据管理方。确定部基于重
复确认信息来确定筹集方案以及/或者交付数
据。获取发送部按照由确定部确定的筹集方案获
取个人数据,以及/或者向数据利用方所保有的
利用方装置发送由确定部确定的交付数据。
V
9
Z
Z
寸
9寸
2
1
g
CN113544726A权利要求书1/2页
1.一种中介装置,其特征在于,具备:
请求获取部,所述请求获取部构成为获取请求信息,所述请求信息包含数据利用方所
需要的个人数据的条件即对象条件;
重复确认获取部,所述重复确认获取部构成为获取重复确认信息,所述重复确认信息
是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人
数据是涉及同一个人的个人数据的信息,其中,所述第2个人数据管理方是与所述第1个人
数据管理方不同的个人数据管理方;
确定部,所述确定部构成为基于所述重复确认信息来确定筹集方案以及/或者交付数
据,所述筹集方案示出与从包括所述第1个人数据管理方以及所述第2个人数据管理方在内
的多个个人数据管理方筹集的个人数据相关的条件,所述交付数据是基于从所述多个个人
数据管理方筹集到的个人数据而生成的数据,并且是发送给所述数据利用方所保有的利用
方装置的数据;以及
获取发送部,所述获取发送部构成为,按照由所述确定部确定的所述筹集方案获取个
人数据,以及/或者向所述利用方装置发送由所述确定部确定的交付数据。
2.根据权利要求1所述的中介装置,其特征在于,
所述确定部基于所述重复确认信息来确定所述筹集方案。
3.根据权利要求2所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,筹集通过所述重复确认信息显示为是涉及同
一个人的个人数据的所述第1个人数据和所述第2个人数据中的任意一方。
4.根据权利要求3所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,筹集所述第1个人数据和所述第2个人数据中
的价格便宜的一方。
5.根据权利要求1〜4中任一项所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,对通过所述重复确认信息显示为是涉及同一
个人的个人数据的所述第1个人数据和所述第2个人数据双方进行筹集。
6.根据权利要求1〜5中任一项所述的中介装置,其特征在于,
所述重复确认获取部从管理所述重复确认信息或能够生成所述重复确认信息的外部
装置获取所述重复确认信息。
7.根据权利要求1〜6中任一项所述的中介装置,其特征在于,
还具备存储部,所述存储部构成为储存所述重复确认信息,
所述重复确认获取部从所述存储部获取所述重复确认信息。
8.根据权利要求1〜7中任一项所述的中介装置,其特征在于,
所述多个个人数据管理方各自对在该个人数据管理方寄存有个人数据的个人或者该
个人的个人数据分配规定的识别信息即注册识别信息,
所述重复确认信息是以下信息:示出所述第1个人数据管理方和所述第2个人数据管理
方中涉及同一个人的所述注册识别信息。
9.根据权利要求1〜7中任一项所述的中介装置,其特征在于,
所述重复确认获取部获取相似度信息作为所述重复确认信息,所述相似度信息表示从
所述多个信息库获取到的多个个人数据之间的相似度。
2
CN113544726A权利要求书2/2页
10.根据权利要求1〜9中任一项所述的中介装置,其特征在于,
所述个人数据管理方是信息库。
11.一种系统,其特征在于,
具备权利要求1〜10中任一项所述的中介装置,并且所述系统还具备:
通知信息获取部,所述通知信息获取部构成为获取与通过所述获取发送部获取到的个
人数据相对应的通知信息,所述通知信息是通知给在所述个人数据管理方寄存有个人数据
的个人的信息;以及
通知信息发送部,所述通知信息发送部构成为发送由所述通知信息获取部获取到的通
知信息。
12.一种计算机程序,该计算机程序使计算机发挥作为中介装置的功能,所述计算机程
序的特征在于,
所述中介装置具备:
请求获取部,所述请求获取部构成为获取请求信息,所述请求信息包含数据利用方所
需要的个人数据的条件即对象条件;
重复确认获取部,所述重复确认获取部构成为获取重复确认信息,所述重复确认信息
是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人
数据是涉及同一个人的个人数据的信息,其中,所述第2个人数据管理方是与所述第1个人
数据管理方不同的个人数据管理方;
确定部,所述确定部构成为基于所述重复确认信息来确定筹集方案以及/或者交付数
据,所述筹集方案示出与从包括所述第1个人数据管理方以及所述第2个人数据管理方在内
的多个个人数据管理方筹集的个人数据相关的条件,所述交付数据是基于从所述多个个人
数据管理方筹集到的个人数据而生成的数据,并且是发送给所述数据利用方所保有的利用
方装置的数据;以及
获取发送部,所述获取发送部构成为,按照由所述确定部确定的所述筹集方案获取个
人数据,以及/或者向所述利用方装置发送由所述确定部确定的交付数据。
3
CN113544726A说明书1/40页
中介装置'系统以及计算机程序
[0001]相关申请的交叉引用
[0002]本国际申请要求2019年3月11日在日本专利局提交的日本发明专利申请第2019-
043674号、2019年10月15日在日本专利局提交的日本发明专利申请第2019-188985号、以及
2019年10月15日在日本专利局提交的日本发明专利申请第2019-188986号的优先权,所述
日本发明专利申请的全部内容通过引用而并入本文。
技术领域
[0003]本公开涉及对数据利用方与个人数据管理方之间的个人数据交易进行中介的中
介装置以及使计算机发挥作为中介装置的功能的计算机程序。
背景技术
[0004]已知对个人数据进行管理的个人数据管理方。作为个人数据管理方可列举例如信
息库。由寄存个人数据的个人向个人数据管理方传达有关数据利用的策略等,个人数据管
理方按照所通知的策略等判断是否可以向第三方提供数据。
[0005]此外,专利文献1公开了一种信息处理系统,其目的在于防止从被寄存数据的信息
库等所保有的信息处理装置泄露个人信息等。
[0006]现有技术文献
[0007]专利文献
[0008]专利文献1:日本专利第6342094号公报
发明内容
[0009]发明要解决的问题
[0010]此外,可以认为当企业等个人数据利用方(以下称为数据利用方)从个人数据管理
方筹集个人数据时,将数据利用方所需的个人数据的条件即对象条件通知给个人数据管理
方。
[0011]然而,数据利用方却难以掌握个人数据管理方保有什么个人数据。因此,可以设想
作为查询对象的个人数据管理方未充分保有符合对象条件的个人数据的情形。该情形下,
数据利用方有时会向另外的个人数据管理方查询等而产生再次交流。此时,数据利用方在
筹集个人数据时的工作负荷增加,进而使得数据利用方所进行的通信的通信量增加。
[0012]此外,设想同一个人在多个个人数据管理方寄存个人数据的情况。该情况下,数据
利用方或个人数据管理方无法掌握寄存在个人数据管理方的哪些数据是同一个人的数据。
因此,当数据利用方从多个个人数据管理方筹集个人数据时,可能会产生个人数据的重叠
购入。在此所述的重叠购入是指,通过不同的途径两次购入同一人物的个人数据。设想数据
利用方会考虑设法以避免上述重叠购入的方式来筹集个人数据。
[0013]本公开的一个方面在于提供一种技术,其既能够满足数据利用方在同一个人向多
个个人数据管理方寄存数据的情况下产生的需求,又能够更容易地对数据利用方所需要的
4
CN113544726A说明书2/40页
个人数据进行筹集,而且能够减少数据利用方所进行的通信的通信量。
[0014]解决问题的技术方案
[0015]本公开的一个方案为一种中介装置,其具备请求获取部、重复确认获取部、确定
部、以及获取发送部。请求获取部获取请求信息。重复确认获取部获取重复确认信息。重复
确认信息是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的
第2个人数据是涉及同一个人的个人数据的信息,其中,第2个人数据管理方是与第1个人数
据管理方不同的个人数据管理方。确定部基于重复确认信息来确定筹集方案以及/或者交
付数据。筹集方案示出与从包括第1个人数据管理方以及第2个人数据管理方在内的多个个
人数据管理方筹集的个人数据相关的条件。交付数据是基于从多个个人数据管理方筹集到
的个人数据而生成的数据,并且是发送给数据利用方所保有的利用方装置的数据。获取发
送部按照由确定部确定的筹集方案获取个人数据,以及/或者向利用方装置发送由确定部
确定的交付数据。
[0016]根据上述构成,按照基于重复确认信息而确定的筹集方案来筹集个人数据。以及/
或者向利用方装置发送基于重复确认信息而确定的交付数据。因此,能够满足数据利用方
在同一个人向多个个人数据管理方寄存数据的情况下产生的需求。此外,由于中介装置代
替数据利用方从多个个人数据管理方筹集数据,因此,能够更容易对数据利用方需要的个
人数据进行筹集,并且能够减少数据利用方所进行的通信的通信量。
[0017]在本公开的一个方案中,确定部可以基于重复确认信息来确定筹集方案。
[0018]根据上述构成,按照基于重复确认信息而确定的筹集方案来筹集个人数据。因此,
能够满足数据利用方在同一个人向多个个人数据管理方寄存数据的情况下产生的需求。
[0019]在本公开的一个方案中,确定部可以确定以下筹集方案,即,筹集通过重复确认信
息显示为是涉及同一个人的个人数据的第1个人数据和第2个人数据中的任意一方。
[0020]根据上述构成,能够抑制从多个个人数据管理方重复购入涉及同一个人且内容相
同的个人数据。
[0021]在本公开的一个方案中,确定部可以确定以下筹集方案,即,筹集第1个人数据和
第2个人数据中的价格便宜的一方。
[0022]根据上述构成,能够抑制重复购入涉及同一个人且内容相同的个人数据,而且数
据利用方能够以更便宜的金额购入个人数据。
[0023]在本公开的一个方案中,确定部可以确定以下筹集方案,即,对通过重复确认信息
显示为是涉及同一个人的个人数据的第1个人数据和第2个人数据双方进行筹集。
[0024]根据上述构成,能够在同一个人向第1个人数据管理方和第2个人数据管理方寄存
有内容不同的个人数据的情况下,从多个个人数据管理方收集同一个人的个人数据。
[0025]在本公开的一个方案中,重复确认获取部可以从管理重复确认信息或能够生成重
复确认信息的外部装置获取重复确认信息。
[0026]根据上述构成,中介装置易于获取反映个人数据的最新重复状况的重复确认信
息。进而,中介装置易于基于最新重复状况来确定筹集方案。
[0027]在本公开的一个方案中,中介装置还可以具备存储部,存储部构成为储存重复确
认信息。重复确认获取部可以从存储部获取重复确认信息。
[0028]根据上述构成,即使在中介装置与管理重复确认信息的外部装置之间不进行数据
5
CN113544726A说明书3/40页
交换,中介装置也能够获取到重复确认信息。因此,能够减少中介装置的通信量。
[0029]在本公开的一个方案中,多个个人数据管理方各自可以对在该个人数据管理方寄
存有个人数据的个人或者该个人的个人数据分配规定的识别信息即注册识别信息。重复确
认信息可以是以下信息:示出第1个人数据管理方和第2个人数据管理方中涉及同一个人的
注册识别信息。
[0030]根据上述构成,在多个个人数据管理方以不同的注册识别信息管理涉及同一个人
的个人数据的情况下,中介装置能够掌握哪些个人数据是涉及同一个人的个人数据。因此,
中介装置能够基于所掌握的结果来确定筹集方案。
[0031]在本公开的一个方案中,重复确认获取部可以获取相似度信息作为重复确认信
息,相似度信息表示从多个信息库获取到的多个个人数据之间的相似度。
[0032]根据上述构成,即使在中介装置与管理重复确认信息的外部装置之间不进行数据
交换,中介装置也能够获取到重复确认信息。因此,能够减少中介装置的通信量。
[0033]在本公开的一个方案中,个人数据管理方可以是信息库。
[0034]本公开的一个方案为一种系统,其具备所述中介装置,且可以具备通知信息获取
部以及通知信息发送部。通知信息获取部构成为获取与通过获取发送部获取到的个人数据
相对应的通知信息。通知信息是通知给在个人数据管理方寄存有个人数据的个人的信息。
通知信息发送部构成为发送由通知信息获取部获取到的通知信息。
[0035]根据上述构成,使用从个人数据管理方获取到的个人数据并发送通知信息。因此,
能够向寄存有个人数据的个人发送适合于该个人的通知信息。
[0036]本公开的另一个方案是一种计算机程序,计算机程序使计算机发挥作为所述中介
装置的功能。根据上述构成,能够获得与上述中介装置同样的效果。
附图说明
[0037]图1是示出第1实施方式的筹集系统的构成的图。
[0038]图2是示出第1〜第5实施方式的中介装置的硬件结构的框图。
[0039]图3是示出第1实施方式的中介装置的功能性结构的框图。
[0040]图4是第1实施方式的数据筹集处理的流程图。
[0041]图5是用于说明请求信息的图。
[0042]图6是用于说明针对第1信息库的第1实施方式的元数据请求的图。
[0043]图7是用于说明针对第2信息库的第1实施方式的元数据请求的图。
[0044]图8A是示出第1信息库的分类表基础数据的图;图8B是示出第2信息库的分类表基
础数据的图。
[0045]图9是用于说明第1实施方式的元数据的图。
[0046]图10是用于对确定个人数据的筹集方案的逻辑的一例进行说明的图。
[0047]图11是用于说明针对第1信息库的数据请求的图。
[0048]图12是用于说明针对第2信息库的数据请求的图。
[0049]图13是用于说明来自信息库的交付数据的图。
[0050]图14是用于说明标准字典的图。
[0051]图15是用于说明第1信息库的数据转换用字典的图。
6
CN113544726A说明书4/40页
[0052]图16A是示出来自第1信息库的交付数据的图;图16B是示出来自第2信息库的交付
数据的图。
[0053]图17是示出来自第1信息库的转换后的交付数据的图。
[0054]图18是示出来自第2信息库的转换后的交付数据的图。
[0055]图19是用于说明通过集成来自各信息库装置的交付数据而生成的集成数据的图。
[0056]图20是示出第2实施方式的中介装置的功能性结构的框图。
[0057]图21是示出第2实施方式的数据筹集处理的流程图。
[0058]图22是示出第3实施方式的筹集系统的构成的图。
[0059]图23是示出管理方装置的硬件结构的框图。
[0060]图24是用于说明管理方装置9所保有的重复管理表的图。
[0061]图25是示出第3以及第4实施方式的中介装置的功能性结构的框图。
[0062]图26是示出第3以及第4实施方式的数据筹集处理的流程图。
[0063]图27是用于说明ID请求的图。
[0064]图28是用于说明ID结果信息的图。
[0065]图29是用于说明重复确认请求的图。
[0066]图30是用于说明重复结果信息的图。
[0067]图31是用于说明第3实施方式的元数据请求的图。
[0068]图32是用于说明针对第1信息库的第4实施方式的元数据请求的图。
[0069]图33是用于说明针对第2信息库的第4实施方式的元数据请求的图。
[0070]图34是示出收集有同一个人的个人数据的集成数据的图。
[0071]图35是示出包含个人数据的价格信息的重复状况表的图。
[0072]图36是示出第5实施方式的中介装置的功能性结构的框图。
[0073]图37是第5实施方式的数据筹集处理的流程图。
[0074]图38是示出第6实施方式的筹集系统的构成的图。
[0075]图39是示出进行广告分发的装置的硬件结构的框图。
[0076]图40是广告分发处理的流程图。
[0077]图41是第7以及第8实施方式的数据筹集处理的流程图。
[0078]图42是用于说明第7实施方式的元数据请求的图。
[0079]图43是示出实施了匿名加工处理的来自第1信息库的交付数据的图。
[0080]图44是用于说明第8实施方式的元数据请求的图。
[0081]图45是示出执行了统计信息化的来自第1信息库的交付数据的图。
[0082]图46是示出第9实施方式的中介装置的功能性结构的框图。
[0083]图47是第9实施方式的数据筹集处理的流程图。
[0084]图48是示出第9实施方式中的来自第1信息库的转换后交付数据的图。
[0085]图49是示出第9实施方式中的来自第2信息库的转换后交付数据的图。
[0086]图50是示出表示多个个人数据彼此的相似度的相似度矩阵的图。
[0087]图51是示出相似度阈值和关联成功数之间的关系的图。
[0088]图52是示出将个人数据表现为数据点的坐标空间的图。
[0089]图53是示出将相似度阈值和关联成功数之间的关系扩展成多维度的图。
7
CN113544726A说明书5/40页
[0090]附图标记的说明
[0091]1…筹集系统;2…利用方装置;2a…数据利用方;
[0092]3、7、8、11、12…中介装置;4〜6…信息库装置;4a〜6a…信息库;
[0093]9…管理方装置;9a…注册管理方;33、73、83、113--控制部;
[0094]331…请求获取部;332…元数据请求生成部;333…元数据请求发送部;
[0095]334…元数据接收部;335…条件整理部;336…筹集方案确定部;
[0096]337…数据请求生成部;338…数据请求发送部;339…数据接收部;
[0097]340…形式处理部;341…数据发送部;731…元数据获取部;
[0098]732…更新处理部;831…ID请求生成部;832iID请求发送部;
[0099]833…ID接收部;834…重复确认生成部;835…重复确认发送部;
[0100]836…重复确认接收部;931…重复确认获取部;932…更新处理部;
[0101]1231…相似度判定部。
具体实施方式
[0102]以下参照附图来说明用于实施本公开的实施方式。
[0W3]口.第1实施方式]
[0104][1T.整体构成]
[0105]图1所示的筹集系统1具备利用方装置2、中介装置3以及多个信息库装置4〜6。
[0106]利用方装置2是使用个人数据的数据利用方2a所保有的装置。数据利用方2a是使
用个人数据来提高利润的企业等。
[0W7]在此,本实施方式中所述的个人数据与是否具有个人识别性无关,是指关于个人
的全部信息。个人数据包括能够确定和识别个人的个人信息。在此所述的个人信息是例如
日本国个人信息保护法第2条第1项所规定的“个人信息”。个人信息除了包括能够通过该信
息本身来识别个人的信息以外,还包括能够与其他信息进行对照并由此来识别个人的信
息。作为除个人信息以外的个人数据,可列举个人的位置信息或购入信息、IP地址、互联网
浏览历史等企业或网络上累积的信息等。此外,作为除个人信息以外的个人数据,还可以列
举被加工成无法与个人建立关联的关于个人行动或状态等的数据等。
[0108]利用方装置2经由如互联网、专用无线/有线通信线路网的网络而与中介装置3连
接。
[0109]中介装置3是用来代替数据利用方2a向信息库装置4〜6进行个人数据的请求,而
且按照适合于数据利用方2a的条件来收购个人数据并向数据利用方2a进行交付的装置。中
介装置3例如为在数据利用方2a与信息库4a〜6a之间进行个人数据交易中介的从业方所保
有。中介装置3经由诸如互联网、专用无线/有线通信线路网的网络而与利用方装置2、以及
信息库装置4〜6连接。后文将对中介装置3的硬件结构以及功能进行详细说明。
[0110]信息库装置4〜6各自分别为信息库4a〜6a所保有。信息库4a〜6a所经营的业务
为:管理被个人寄存的个人数据并且将该个人数据提供给企业等第三方。
[0111]信息库装置4〜6中储存有个人经由个人所保有的智能手机、平板电脑终端、个人
计算机等信息处理终端11〜17而寄存的个人数据。信息库装置4〜6经由诸如互联网、专用
无线/有线通信线路网的网络而与中介装置3、以及信息处理终端11〜17连接。如后文所述,
8
CN113544726A说明书6/40页
在信息库装置4〜6与中介装置3之间进行各种信息的交换,并且经由中介装置3将个人数据
交付给数据利用方2a。
[0112]另外,在图1中仅图示了三个信息库装置4〜6,不过,中介装置3通常也可以与除三
个以外信息库装置进行个人数据等数据的交换。
[0113][1-2.中介装置]
[0114]接下来,参照图2来说明中介装置3的硬件结构。中介装置3具备通信部31、存储部
32、以及控制部33。
[0115]通信部31是用于使中介装置3与网络连接的通信界面。中介装置3能够经由通信部
31与利用方装置2、信息库装置4〜6通过有线或无线进行数据通信。此外,中介装置3也可以
经由通信部31与互联网连接,并经由互联网与外部装置进行数据通信。
[0116]存储部32储存各种数据。
[0117]控制部33以具有CPU33a、RAM、R0M、以及闪速存储器等半导体存储器(以下称为存
储器33b)的周知的微计算机为中心而构成。通过由CPU33a执行保存在非转移实体记录介质
中的程序来实现控制部33的各种功能。在该示例中,存储器33b对应于保存有程序的非转移
实体记录介质。此外,通过执行该程序来执行与程序相对应的方法。此外,构成控制部33的
微计算机的数量可以为一个或多个。
[0118]控制部33通过由CPU33a执行程序来进行后述图4所示的数据筹集处理。控制部33
通过进行数据筹集处理,而作为图3所示的请求获取部331、元数据请求生成部332、元数据
请求发送部333、元数据接收部334、条件整理部335、筹集方案确定部336、数据请求生成部
337、数据请求发送部338、数据接收部339、形式处理部340以及数据发送部341而发挥功能。
用于实现构成控制部33的上述这些元素331〜341的功能的方法不限于软件,也可以使用通
过组合逻辑电路和模拟电路等而形成的硬件来实现上述一部分或全部元素的功能。
[0119]下文首先参照图3对各元素331〜341的功能的概要进行说明。然后参照图4的流程
图对各元素331〜341的功能进行详细说明。
[0120]〈请求获取部〉
[0121]请求获取部331经由通信部31接收来自利用方装置2的请求信息。请求信息是包含
数据利用方2a所需要的个人数据的条件即对象条件的信息。后文将对请求信息的具体示例
进行说明。
[0122]〈元数据请求生成部〉
[0123]元数据请求生成部332基于由请求获取部331接收到的请求信息来生成向信息库
装置4〜6发送的元数据请求。在此所述的元数据请求是用于向信息库装置4〜6请求元数据
的信息。在此所述的元数据是指,显示信息库4a〜6a所保有的个人数据中与请求信息所包
含的对象条件相符的个人数据的属性的信息。在此所述的个人数据的属性是指个人数据所
涉及的个人的属性,例如个人的年龄、性别等。个人数据的属性当然也可以是除年龄以及性
别以外的个人的属性。换言之,个人数据的属性是该个人数据所包含的表示个人的年龄、性
别等各种属性的各数据项目。即,个人数据的属性是指个人数据的数据项目。
[0124]在本实施方式中,元数据示出关于该信息库所保有的符合对象条件的全部或一部
分个人数据的数据概要。在此所述的数据概要可以是例如个人数据的一部分属性、与个人
数据的各个属性相关的统计信息等。
9
CN113544726A说明书7/40页
[0125]元数据是显示信息库所保有的符合对象条件的全部或一部分个人数据由哪种属
性的个人数据构成的信息。具体而言,如后文所述,元数据中包括该信息库所保有的符合对
象条件的全部或一部分个人数据的统计量的信息等。后文将对元数据请求以及元数据的具
体示例进行说明。
[0126]此外,在本实施方式中,各信息库装置4〜6各自能够处理的数据形式互不相同。因
此,元数据请求生成部332按照各信息库装置4〜6能够处理的数据形式而分别对各信息库
装置4〜6生成元数据请求。
[0127]〈元数据请求发送部〉
[0128]元数据请求发送部333经由通信部31向信息库装置4〜6发送通过元数据请求生成
部332生成的元数据请求。作为针对元数据请求的应答,接收到元数据请求的信息库装置4
〜6向中介装置3发送元数据。
[0129]〈元数据接收部〉
[0130]元数据接收部334经由通信部31从信息库装置4〜6接收元数据。
[0131](条件整理部〉
[0132]条件整理部335根据从信息库装置4〜6接收到的元数据来整理交易条件。
[0133](筹集方案确定部〉
[0134]筹集方案确定部336基于通过元数据接收部334接收到的元数据来确定适合于数
据利用方2a的筹集方案。在此所述的筹集方案示出与从信息库装置4〜6所保有的符合对象
条件的个人数据中筹集的个人数据相关的条件。即,从信息库装置4〜6筹集(也就是购入)
与筹集方案示出的条件相符的个人数据。后文将对筹集方案的确定逻辑进行说明。
[0135]〈数据请求生成部〉
[0136]数据请求生成部337按照通过筹集方案确定部336确定的筹集方案生成数据请求。
数据请求是用于向信息库装置4〜6请求个人数据的数据。数据请求生成部337按照各信息
库装置4〜6可处理的数据形式分别对各信息库装置4〜6生成数据请求。后文将对数据请求
的具体示例进行说明。
[0137]〈数据请求发送部〉
[0138]数据请求发送部338经由通信部31向信息库装置4〜6发送通过数据请求生成部
337生成的数据请求。
[0139]〈数据接收部〉
[0140]数据接收部339经由通信部31从接收到数据请求的信息库装置4〜6接收交付数
据。交付数据包含数据请求中指定的个人数据。后文将对交付数据的具体示例进行说明。
[0141]〈形式处理部》
[0142]形式处理部340将从多个信息库装置4〜6接收到的交付数据的数据形式调整成共
同的数据形式并集成为一个数据,由此生成集成数据。后文将对集成数据的具体示例进行
说明。
[0143]〈数据发送部》
[0144]数据发送部341经由通信部31向利用方装置2发送通过形式处理部340生成的集成
数据。由此,从信息库4a〜6a筹集到的个人数据被交付给数据利用方2a。
[0145][1-3.处理]
10
CN113544726A说明书8/40页
[0146]接下来参照图4的流程图对中介装置3的控制部33所执行的数据筹集处理进行说
明。其中,通过经由通信部31从利用方装置2接收请求信息而开始执行数据筹集处理。此外,
若从数据利用方2a接收到请求信息,则将接收到的请求信息储存在存储部32。
[0147]<S101>
[0148]在S101中,请求获取部331从存储部32获取来自数据利用方2a的请求信息。本实施
方式的请求信息包括图5所示的各个项目。即,请求信息包括时间戳、交易ID、语句类型、目
的站、发送源以及语句内容。其中,语句类型是表示该信息属于请求信息、元数据请求、元数
据等哪种数据的数据。
[0149]语句内容包含预算、报酬、对象条件、请求项目、分布统计轴、利用组织、利用目的
以及利用条件的信息。
[0150]预算的信息包括数据利用方2a就该交易而言能够支付的预算额的信息、以及表示
数据利用方2a的费用结算方式的信息。
[0151]报酬的信息是数据利用方2a对提供个人数据的个人支付的报酬的信息。报酬的信
息包括报酬的形式、报酬的发行方、报酬的发行时间、可使用与报酬相关的特别优惠等的地
域、报酬的生效时刻以及失效时刻等信息。
[0152]对象条件是数据利用方2a所需要的个人数据的条件。对象条件例如是用于对个人
数据的个人属性(例如性别、年龄、习惯等)进行指定的条件。当数据利用方2a需要条件不同
的多个个人数据时,语句内容所包含的对象条件也为多个。此外,语句内容包括数据利用方
2a针对每个对象条件需要几件符合该对象条件的个人数据的件数信息。
[0153]例如,在图5的示例中,第一个对象条件为:个人数据所涉及的个人的性别为男性
且最近三个月浏览食谱网站的次数为3次以上。并且,数据利用方2a所需要的符合该对象条
件的个人数据的件数为1000件。第二个对象条件为:个人数据所涉及的个人的性别为女性
且最近三个月浏览食谱网站的次数为7次以上。并且,数据利用方2a所需要的符合该对象条
件的个人数据的件数为1000件。
[0154]请求项目是数据利用方2a希望交付的个人数据的项目(例如性别、年龄层、作为居
住地的都道府县等)o
[0155]分布统计轴对从信息库装置4〜6发送的元数据中包含的个人数据的一部分项目
进行指定。即,如后文所述,从信息库装置4〜6发送的元数据中包含信息库4a〜6a所保有的
符合对象条件的全部或一部分个人数据的一览表(即列表)。该列表中针对每一个个人数据
的ID均包含该个人数据的一部分项目、和该个人数据的数据价格。在此所述的个人数据的
一部分项目换言之即为个人数据所涉及的个人的一部分属性,例如未婚率、年龄层等。分布
统计轴对该列表中包含的个人数据的上述一部分项目进行指定。此外,在本实施方式中,分
布统计轴所包括的个人数据的属性被设定成由对象条件指定的属性以外的属性。
[0156]利用组织、利用目的以及利用条件的信息表示个人数据的利用组织、利用目的以
及利用条件。利用组织的信息包括例如利用组织的法人编号、名称、地址、国家、行业等。利
用目的的信息包括例如利用的类别(顾客分析、直邮广告发送等)和个别利用目的。个别利
用目是例如顾客信息扩展、统计创建、对个人数据的提供源本人的访问、广告分发等。
[0157]请求获取部331从利用方装置2接收上述请求信息。
[0158]<S102>
11
CN113544726A说明书9/40页
[0159]接下来,在S102中,元数据请求生成部332基于在S101中接收到的请求信息来生成
元数据请求。分别对作为个人数据供应方的每一个信息库4a〜6a生成元数据请求。具体而
言,图6示出针对第1信息库4a的元数据请求的示例。此外,图7示出针对第2信息库5a的元数
据请求的示例。图6以及图7示出的元数据请求均包含相同的项目。
[0160]具体而言,元数据请求包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送
源以及语句内容。参照交易ID是在S101中接收到的请求信息,换言之,即关于该元数据请求
的请求信息的交易ID。
[0161]语句内容包含报酬、对象条件、请求项目、分布统计轴、利用组织、利用目的以及利
用条件的信息。语句内容所包含的这些信息与请求信息的情形相同。
[0162]在此,在本实施方式中,各信息库装置4〜6各自能够处理的数据形式不同。因此,
按照发送目标方的信息库装置4〜6能够处理的数据形式来生成元数据请求。
[0163]例如,在第1信息库装置4能够处理的数据形式中,表示个人数据所涉及的个人的
性别的变量是“Gender”,“个人的性别为男性”的意思与保存到该变量中的值“1”建立对应。
此外,“个人的性别为女性”的意思与保存到变量"Gender”中的值“2”建立对应。
[0164]另一方面,例如,在第2信息库装置5能够处理的数据形式中,表示个人数据所涉及
的个人的性别的变量为“性别”,“个人的性别为男性”的意思与保存到该变量中的值“男性”
建立对应。此外,“个人的性别为女性”的意思与保存到变量“性别”中的值“女性”建立对应。
[0165]因此,元数据请求生成部332在例如图6所示的针对第1信息库装置4的元数据请求
中,以如“Gender=l”等数据形式来指定对象条件的项目中的“个人数据所涉及的个人的性
别为男性”这一条件。
[0166]另一方面,元数据请求生成部332在例如图7所示的针对第2信息库装置5的元数据
请求中,以如“性别=男性”等数据形式来指定对象条件的项目中的“个人数据所涉及的个
人的性别为男性”这一条件。
[0167]此外,基于图8A以及图8B所示的分类表基础数据来创建各信息库装置4〜6的元数
据请求。分类表基础数据是用于将元数据请求等所包含的各项目转换成各信息库装置4〜6
各自能够处理的数据形式的信息。在某个信息库装置的分类表基础数据中,以该信息库装
置能够处理的数据形式描述的“变量名”、“值”以及“意思”被设定成相互建立对应。在本实
施方式中,作为中介装置3的交易对象的各信息库装置4〜6的分类表基础数据预先储存在
中介装置3的存储部32中。不过,分类表基础数据的定位不限于此。例如,在生成元数据请求
时,中介装置3可以向各信息库装置4〜6发送请求分类表基础数据的信息,并获取各信息库
装置4〜6的分类表基础数据作为其应答信号。即,可以在生成元数据请求的定时获取分类
表基础数据。
[0168]<S103>
[0169]接下来,在S103中,元数据请求发送部333经由通信部31向信息库装置4〜6发送在
S102生成的元数据请求。作为元数据请求的应答信息,接收到元数据请求的信息库装置4〜
6向中介装置3发送元数据。
[0170]<S104>
[0171]接下来,在S104中,元数据接收部334经由通信部31从各信息库装置4〜6接收元数
据。以各信息库装置4〜6能够处理的数据形式来描述元数据。
12
CN113544726A说明书10/40页
[0172]本实施方式的元数据包括图9所示的各项目。图9示出从第2信息库装置5接收到的
元数据。
[0173]元数据包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源、分类代码基
础数据以及语句内容。参照交易ID是与该元数据相关的元数据请求的交易ID,换言之,向作
为该元数据发送源的信息库装置发送的元数据请求的交易ID。分类代码基础数据是用于确
定与作为该元数据发送源的信息库装置相关的分类代码基础数据的信息。
[0174]语句内容包含对象者的信息即对象者信息。对象者信息包括请求信息所包含的对
象条件、以及该信息库所保有的个人数据中的符合对象条件的全部或一部分个人数据的件
数。此外,对象者信息表示符合对象条件的全部或一部分个人数据由具有哪种属性的个人
数据构成。
[0175]具体而言,对象者信息包括请求项目统计量。请求项目统计量是与请求项目指定
的各属性有关的个人数据的统计量(平均、方差、偏度、中位数等)、最大值以及最小值等。此
外,对象者信息包括方差协方差矩阵、个人数据的数据价格分布的信息、以及其他多变量的
统计量的信息。
[0176]在此,数据价格分布的信息表示在按通过分布统计轴指定的属性对个人数据进行
分类时各个类别所包含的个人数据的数据价格。例如,在分布统计轴中指定有“未婚已婚、
年龄层、3个月有无购买杂志”的属性。该情况下,数据价格分布的信息中可包含“未婚已婚:
未婚;年龄层:30;3个月有无购买杂志=无”的分类所包含的个人数据的数据价格“260、
280、290、…”。
[0177]在本实施方式中,设想成元数据包含的个人数据的信息的件数大于在请求信息中
指定的个人数据的件数。更详细而言,假设元数据所包含的符合某个对象条件的个人数据
的信息的件数大于在请求信息中指定的符合该对象条件的个人数据的件数。这是由于:在
基于元数据来选择在请求信息中指定的件数的个人数据时,对多种个人数据的选择方法
(即筹集方案)进行研究后从多种筹集方案中选定适合于数据利用方2a的筹集方案。不过,
通过元数据显示其属性的个人数据的件数不限于此,该个人数据的件数例如也可以与在请
求信息中指定的个人数据的件数相同。
[0178]<S105>
[0179]接下来,在S105中,条件整理部335从符合各信息库装置4〜6的数据形式的元数据
中整理交易条件。具体而言,条件整理部335利用各信息库装置4〜6的分类表基础数据,将
符合各信息库装置4〜6的数据形式的元数据调整成共同的数据形式,从而整理交易条件。
[0180]此外,条件整理部335基于在S104中从各信息库装置4〜6接收到的元数据,生成如
图10的虚线所示的列表(以下称为元数据列表)。元数据列表是使个人数据的ID、数据源、由
分布统计轴指定的属性、以及数据价格建立了对应的数据。数据源是用于识别该数据是来
自哪个信息库的数据的信息。如上文所述,在本实施方式中,生成的元数据列表所包含的数
据的件数大于在请求信息中指定的个人数据的件数。此外,图10的元数据列表的“数据源”
一列中的“第1”表示第1信息库4a,“第2”表示第2信息库5a。
[0181]<S106>
[0182]接下来,在S106中,筹集方案确定部336基于在S105中生成的元数据列表来确定适
合于数据利用方2a的筹集方案。在本实施方式中,筹集方案确定部336基于信息库装置4〜6
13
CN113544726A说明书11/40页
所保有的每个个人数据的数据价格和数据利用方2a所指定的预算额来确定筹集方案。然
后,在关注由分布统计轴指定的属性时,筹集方案确定部336基于元数据所示出的个人数据
的分布(以下称为原始数据分布)的再现性来确定筹集方案。即,筹集方案确定部336在数据
利用方2a的预算额的范围内以使得通过筹集方案筹集的个人数据的数据分布接近原始数
据分布的方式来确定筹集方案。
[0183]以下,参照图10对筹集方案的确定方法进行具体说明。在图10中,为了简便而考虑
了由100个数据组成的元数据列表。在该事例中,来自数据利用方2a的请求信息仅包含一个
对象条件。例如,请求信息仅包含图5的对象条件1"个人数据所涉及的个人的性别为男性且
最近三个月浏览食谱网站的次数为3次以上”这一对象条件。图10的100个数据是符合对象
条件的数据。并且,数据利用方2a需要的与对象条件相符的个人数据的件数为40件。即,从
所述100个数据中选择40个数据。此外,数据利用方2a的预算额为11000日元。
[0184]数据价格的总额最便宜的筹集方案是方案A,即,在数据价格按从小到大的顺序对
数据进行排序,并购入从第1到第40的数据。此外,在图10中,对在筹集方案中购入的数据标
示“1”的旗标,对未购入的数据标示“0”的旗标。方案A的购入数据价格的总额为10570日元。
但是,例如未婚和已婚的比例在原始的100个数据(以下称为原始数据)中为59:41(=3:2),
而在方案A中为12:28(=1:2.5),从而偏离了原始数据的分布。此外,在图10中,对应于未婚
的值为“0”,对应于已婚的值为“1”。这样,存在以下疑虑:实际上可筹集的个人数据的其他
项目没有再现原始数据的分布。因此,对购入的数据的明细不同的其他类型(例如图10的方
案B和方案C等)也进行研究,并且以与方案A同样的方式评价数据价格的总额以及相对于元
数据的分布即原始数据分布的偏离。此外,可使用例如KL(Kullback-Leibler)-divergence
(KL散度)等指标值来评价相对于原始数据分布的偏离。图10的示例中,偏离原始数据分布
最小的筹集方案是方案C,但是方案C的数据价格的总额为12420日元,超出了预算。因此,确
定采用在预算额范围内偏离原始数据分布最小的方案B作为筹集方案。如上所述,从多个筹
集方案中将在预算额的范围内偏离原始数据分布最小的方案确定为筹集方案即为本实施
方式的筹集方案的确定逻辑。此外,在上文中对请求信息仅包含一个对象条件的情形进行
了例示说明,不过,请求信息包含多个对象条件的情形也是同样的确定逻辑。另外,当请求
信息包含多个对象条件时,为了不改变在请求信息中指定的各对象条件的件数而变更筹集
的数据,从而研究多个方案。
[0185]<S107>
[0186]接下来,在S107中,数据请求生成部337按照通过筹集方案确定部336确定的筹集
方案来生成请求个人数据的数据请求。数据请求生成部337以符合各信息库装置4〜6的能
够处理的数据形式的方式分别对各信息库装置4〜6生成数据请求。
[0187]图11示出针对第1信息库4a的数据请求的示例。图12示出针对第2信息库5a的数据
请求的示例。这些数据请求均包含相同的项目。
[0188]具体而言,数据请求包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源
以及语句内容。参照交易ID是与该数据请求相关的元数据的交易ID,换言之,从作为该数据
请求的发送目标方的信息库装置接收到的元数据的交易ID。
[0189]语句内容包含与各对象条件相对应的对象者信息。对象者信息包含条件语句、件
数、支付额以及购入数据的信息。
14
CN113544726A说明书12/40页
[0190]条件语句表达对应的对象条件。件数以及支付额表示就对应的对象条件而言,从
作为该数据请求的发送目标方的信息库装置筹集的个人数据的件数以及支付额。
[0191]购入数据对从作为该数据请求的发送目标方的信息库装置筹集的个人数据进行
确定。具体而言,购入数据用于指定基于由统计分布轴指定的各属性以及数据价格而筹集
的个人数据。
[0192]此外,语句内容包含请求项目,请求项目是数据利用方2a希望交付的个人数据的
项目。
[0193]数据请求生成部337以符合各信息库装置4〜6的能够处理的数据形式的方式,使
用各信息库装置4〜6的分类代码基础数据分别对各信息库装置4〜6生成数据请求。
[0194]<S108>
[0195]接下来,在S108中,数据请求发送部338经由通信部31向信息库装置4〜6发送在
S107中生成的数据请求。
[0196]<S109>
[0197]接下来,在S109中,数据接收部339从接收到数据请求的信息库装置4〜6接收如图
13所示的包含由数据请求指定的个人数据的交付数据。
[0198]具体而言,交付数据包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源
以及语句内容。参照交易ID是与该交付数据相关的数据请求的交易ID,换言之,向作为该交
付数据的发送目标方的信息库装置发送的数据请求的交易ID。
[0199]语句内容包含与各对象条件相对应的对象者信息。对象者信息包含条件语句、件
数以及数据主体的信息。条件语句以及件数与数据请求所包含的条件语句以及件数相同。
数据主体是由数据请求所包含的购入数据指定的个人数据。数据主体包含由个人数据的项
目中的请求项目指定的项目。并且,语句内容包含请求项目的信息。
[0200]<S110>
[0201]接下来,在S110中,形式处理部340使从多个信息库装置4〜6接收到的交付数据的
数据形式达成统一。具体而言,形式处理部340将从各信息库装置4〜6接收到的交付数据的
数据形式转换成共同的数据形式。然后,形式处理部340将来自各信息库装置4〜6的且已被
转换成共同的数据形式的交付数据集成为一个数据。以下进行具体说明。
[0202]首先,在将来自各信息库装置4〜6的交付数据的数据形式转换成共同的数据形式
时,形式处理部340使用图14所示的标准字典。标准字典储存在存储部32中。标准字典是如
下数据:使中介装置3中就个人数据可包含的各项目而规定的意思、变量名以及值相互建立
对应而设定成的数据。以下将规定的变量名以及值分别称为“标准变量名”以及“标准值”。
形式处理部340使用该标准字典首先创建各信息库装置4〜6的数据转换用字典。数据转换
用字典是用于将各信息库装置4〜6的交付数据的变量名以及值转换成由标准字典规定的
标准变量名以及标准值的数据。
[0203]在创建数据转换用字典时,形式处理部340在“意思”项目中对图8A和图8B所示的
该信息库的分类表基础数据和图14所示的标准字典进行核对。此外,在进行该核对(即匹
配)时,例如可以单纯地使双方数据在“意思”项目内的文本进行匹配,也可以通过除此之外
的其他方法使其匹配。
[0204]在“意思”项目中对分类表基础数据和标准字典进行核对之后,生成图15所示的数
15
CN113544726A说明书13/40页
据转换字典,该数据转换字典是通过使分类表基础数据所包含的“变量名”和“值”、标准字
典所包含的“标准变量名”和“标准值”、以及“意思”相互建立对应而生成的。此外,可以在将
来自各信息库装置4〜6的交付数据的数据形式转换成共同的数据形式时生成数据转换字
典,也可以预先生成数据转换字典,并将其储存在存储部32中。
[0205]然后,形式处理部340使用信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年重庆护理职业学院单招职业倾向性考试题库及答案详解一套
- 洪湖市乌林镇招聘社区网格员真题附答案详解
- 2026年陕西国际商贸学院单招综合素质考试题库及参考答案详解1套
- 2026年遂宁工程职业学院单招职业技能测试题库及参考答案详解
- 2026年苏州高博软件技术职业学院单招职业技能考试题库带答案详解
- 2026年西安电力机械制造公司机电学院单招职业技能测试题库及完整答案详解1套
- 黔东南苗族侗族自治州丹寨县招聘社区网格员备考题库附答案详解
- 茂南区鳌头镇招聘社区网格员考试试题附答案详解
- 梅河口市兴华乡招聘社区网格员考试试题附答案详解
- 2026年遂宁职业学院单招职业技能测试题库带答案详解
- 武汉遗体捐献协议书模板
- 《番茄病虫害》课件
- 人事管理制度及工作流程
- 2025年牢牢坚守廉洁与廉政职业底线专题课件
- 国家开放大学《企业信息管理》形考任务1-4答案
- 中医护理基础病后调护
- 四年级语文下册 拼音与字词专项训练(部编版)
- 江苏省常州市教育学会2023-2024学年八年级下学期期末语文试题(含答案解析)
- 公园设施维修投标方案
- 2.4 保护妇女、儿童和老人的合法权益
- 股骨颈骨折护理查房股骨颈骨折PPT
评论
0/150
提交评论