【《差分隐私保护方法概述》1900字】_第1页
【《差分隐私保护方法概述》1900字】_第2页
【《差分隐私保护方法概述》1900字】_第3页
免费预览已结束,剩余1页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

差分隐私保护方法概述差分隐私(DifferentialPrivacy,DP)保护方法作为做著名的隐私保护方法,这种新型隐私保护算法主要是用于面向数据库中的数据隐私泄露ADDINEN.CITE<EndNote><Cite><Author>熊平</Author><Year>2014</Year><RecNum>135</RecNum><DisplayText><styleface="superscript">[65]</style></DisplayText><record><rec-number>135</rec-number><foreign-keys><keyapp="EN"db-id="50efwwxadstx58e92x4v0z0iwd9etfzx9evz"timestamp="1614936620">135</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>熊平</author><author>朱天清</author><author>王晓峰%J计算机学报</author></authors></contributors><titles><title>差分隐私保护及其应用</title></titles><pages>101-122</pages><volume>37</volume><number>1</number><dates><year>2014</year></dates><urls></urls></record></Cite></EndNote>[65]。在这种隐私保护的方式下,统计数据库中的被操作的数据不会因为一条或者几条数据的改变,而导致整体结果的改变。这会使用户隐私数据得到极大的保护,原因是攻击者无法通过已有数据去计算出其他数据。这样在保护用户隐私数据的前提下,使所查询出来的数据依然保持原数据的一些统计特性,这样可以保证在敏感信息不泄露的情况下,帮助其他用户进行挖掘。这种方法与其他隐私保护的方法(如匿名算法)不同的是,前一种方法只需要加入少量噪声就可以实现大规模的隐私保护。而后者缺少一种严格的方法去证明该模型的隐私水平,相较于差分隐私而言,缺少方法的可靠性。差分隐私方法的主要是通过对原有的数据处理方法,增加一个随机噪声系数来实现的。设为需要隐私保护的数据,包含用户项目矩阵,为原函数,则通过差分隐私保护得到的结果为: (2-1)MACROBUTTONMTEditEquationSection2SEQMTEqn\r\hSEQMTSec\r1\hSEQMTChap\h这里的原函数为的算法,其输出结果为评分,即连续的数值。差分隐私保护的相关概念定义2.1(差分隐私ADDINEN.CITE<EndNote><Cite><Author>Dwork</Author><Year>2011</Year><RecNum>97</RecNum><DisplayText><styleface="superscript">[66]</style></DisplayText><record><rec-number>97</rec-number><foreign-keys><keyapp="EN"db-id="50efwwxadstx58e92x4v0z0iwd9etfzx9evz"timestamp="1614930431">97</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Dwork,Cynthia%JCommunicationsoftheACM</author></authors></contributors><titles><title>Afirmfoundationforprivatedataanalysis</title></titles><pages>86-95</pages><volume>54</volume><number>1</number><dates><year>2011</year></dates><isbn>0001-0782</isbn><urls></urls></record></Cite></EndNote>[66])首先,我们需要定义一个算法,所定义的算法当处在一定取值范围下,如果参与的数据集和若满足以下关系 (2-2)两个数据集和可以成为临近数据集,其含义必须为两者之间的数据内容最多只有一条不同。其中是表明控制隐私大小的参数,该参数同时表示了随机算法的两个数据集上的结果分布。在该算法中是通过添加的噪声的方式对数据进行保护的。影响噪声大大小有多个方面:首先,会影响噪声。其次算法的灵敏度也会影响所添加的噪声。算法的灵敏度主要表现在数据前后的微弱改变,可能会造成算法的巨大改变。全局灵敏度和局部灵敏度是算法灵敏度的重要两个方面。定义2.2(全局灵敏度ADDINEN.CITE<EndNote><Cite><Author>Dwork</Author><Year>2006</Year><RecNum>98</RecNum><DisplayText><styleface="superscript">[67]</style></DisplayText><record><rec-number>98</rec-number><foreign-keys><keyapp="EN"db-id="50efwwxadstx58e92x4v0z0iwd9etfzx9evz"timestamp="1614930432">98</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Dwork,Cynthia</author></authors></contributors><titles><title>DifferentialPrivacy</title></titles><dates><year>2006</year></dates><urls></urls></record></Cite></EndNote>[67])函数的全局灵敏度是在两个相邻数据求值时的最大差异,定义如下:(2-3)其中,表示范数,和最多在一条记录上不同,从中我们可以得出一个结果论,全局灵敏度的大小只和函数相关,和数据本身及其相关分布并不关系。但全局灵敏度存在一定的局限性,例如当函数的灵敏度较大时,为了达到隐私保护的效果需要向函数的结果中添加较大的随机噪声才能够达到目标。而局部灵敏度可以克服这一问题的出现。定义2.3(局部灵敏度ADDINEN.CITE<EndNote><Cite><Author>Nissim</Author><Year>2007</Year><RecNum>99</RecNum><DisplayText><styleface="superscript">[68]</style></DisplayText><record><rec-number>99</rec-number><foreign-keys><keyapp="EN"db-id="50efwwxadstx58e92x4v0z0iwd9etfzx9evz"timestamp="1614930434">99</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>Nissim,Kobbi</author><author>Raskhodnikova,Sofya</author><author>Smith,Adam</author></authors></contributors><titles><title>Smoothsensitivityandsamplinginprivatedataanalysis</title><secondary-title>Proceedingsofthethirty-ninthannualACMsymposiumonTheoryofcomputing</secondary-title></titles><pages>75-84</pages><dates><year>2007</year></dates><urls></urls></record></Cite></EndNote>[68])假设对任意函数,表示函数输出向量的维度,函数在数据集上对应的局部灵敏度如下:(2-4)通过公式我们发现,数据集中的数据与函数共同决定局部灵敏度的大小,主要原因在于局部灵敏度主要与数据集中的特征有关,其大小要比全局灵敏度要小很多。定义2.4(全局灵敏度与局部灵敏度的关系)由定义2.3我们可以发现局部的敏感度的大小主要是有数据集中的数据与函数共同决定。考虑到全局灵敏度和局部灵敏度之间的原理,其定义可以如下。(2-5)局部灵敏度和数据集中的特征有关,考虑到如果通过局部灵敏度来计算隐私保护隐私参数的话,会对数据带来严重的隐私泄露的风险。为了更好的确定添加噪声的大小。我们定义需定义局部灵敏度的平滑上界(SmoothupperBound)共同计算出添加噪声的大小。定义2.5(平滑ADDINEN.CITE<EndNote><Cite><Author>Nissim</Author><Year>2007</Year><RecNum>99</RecNum><DisplayText><styleface="superscript">[68]</style></DisplayText><record><rec-number>99</rec-number><foreign-keys><keyapp="EN"db-id="50efwwxadstx58e92x4v0z0iwd9etfzx9evz"timestamp="1614930434">99</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>Nissim,Kobbi</author><author>Raskhodnikova,Sofya</author><author>Smith,Adam</author></authors></contributors><titles><title>Smoothsensitivityandsamplinginprivatedataanalysis</title><secondary-title>Proceedingsofthethirty-ninthannualACMsymposiumonTheoryofcomputing</secondary-title></titles><pages>75-84</pages><dates><year>2007</year></dates><urls></urls></record></Cite></EndNote>[68])在给定数据集和为之间,其函数的的局部灵敏度,如果存在,并且函数满足并且,则可以表示函数的局部灵敏度的平滑上界。(2-6)差分隐私的实现步骤及相关机制为了对数据进行差分隐私数据保护,需要向数据函数中添加噪声,拉普拉斯机制最能够得到广大学者认可的噪声机制。定义2.6拉普拉斯机制该机制的准备条件,需定义一个函数,该函数如果和另一个加密的结果。满足以下关系,则可以表示所定义的随机算法的符合该机制。(2-7)除此之外通过以上定义,我们可以得出该机制的相关推论。如果越大则噪声大小也越大,如果越大噪声大小就越小。我们可以将其转化为平滑灵敏度表示的表达式即:(2-8)其中,表示隐私参数,隐私参数越小,噪声越大,结果可用性越小,隐私保护越好,反之亦得,隐私参数越大,隐私保护越弱。表示原函数在数据处的平滑灵敏度,,为平滑上界不成立的概率,用户在-DP的保护下会有概率的隐私泄露。原函数的平滑灵敏度对基于拉普拉斯机制的差分隐私保护起到重要作用,函数的灵敏度可以指从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论