数据发布中匿名技术研究_第1页
数据发布中匿名技术研究_第2页
数据发布中匿名技术研究_第3页
数据发布中匿名技术研究_第4页
数据发布中匿名技术研究_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号: 密级: U D C : 编号: 工学硕士学位论文数据发布中匿名技术研究硕士研究生 : 商 宗 民 指导教师 : 刘 杰 教授学科、专业 : 数据库与知识工程论文主审人 : 张 沛 键 教授哈尔滨工程大学2012 年 1 月分类号: 密级: U D C : 编号: 工学硕士学位论文数据发布中匿名技术研究硕士研究生: 商 宗 民指导教师: 刘 杰 教 授学位级别: 工 学 硕 士学科、专业: 计算机应用技术所在单位: 计算机科学与技术学院论文提交日期:2013 年 1 月论文答辩日期:2013 年 3 月学位授予单位: 哈尔滨工程大学Classified Index: U.D.C:A Dissertation for the Degree of M. EngAnonymous technology research In Data PublishingCandidate: Shang Zong Min Supervisor: Prof. Liu JieAcademic Degree Applied for: Master of EngineeringSpecialty: Computer Applied TechnologyDate of Submission: Jan, 2013Date of Oral Examination: Mar, 2013University: Harbin Engineering University哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字): 日期: 年 月 日哈尔滨工程大学学位论文授权使用声明本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。本论文(在授予学位后即可 在授予学位 12 个月后 解密后)由哈尔滨工程大学送交有关部门进行保存、汇编等。作者(签字): 导师(签字):日期: 年 月 日 年 月 日 I摘要数据挖掘和数据发布是当前数据库应用的两个重要领域。一方面,数据挖掘与知识发现在各式各样的数据应用领域中都扮演着非常重要的角色。数据挖掘的目的在于从大量的数据中抽取出潜在的、有价值的知识、模型、规则等;另一方面,数据发布是将数据库中的数据直接地展现给用户,促进数据的交流和共享,而在数据的各种应用中,直接发布数据表中的数据会暴露数据所有者的隐私信息,给个人造成不必要的精神伤害或是财产的损失,因此我们在数据发布前有必要对相关数据进行匿名化处理。匿名化方法是一种安全有效的数据隐私保护方法,它是数据发布隐私保护方法里基于限制发布的一种,它能有效的平衡数据的有效性和隐私保护之间的关系,是近年来数据发布隐私保护的一个研究热点。匿名化的基本思想是把原始数据表进行某种变换,使攻击者不能从变换后的数据表中轻易分析出某个元组的敏感属性值,从而不能识别敏感信息所属的具体个体,达到隐藏个体隐私信息的目的。本文首先分析了数据发布隐私保护中现有的主要技术和匿名化方法,并归纳、总结了现有匿名模型的优缺点。为了解决目前存在的多维敏感属性信息泄露问题我们结合了现有多敏感属性隐私泄露保护的多维桶分组技术,提出了一种敏感性分级的基于有损链接的(g ,k)-匿名模型,并给出了此模型的形式化描述和相应的实现算法。本文的具体工作有:(1) 现有的隐私保护模型在匿名处理时主要是采用泛化和隐匿的技术,该技术首先需要为每一维准标识符属性预定义一颗泛化树,在准标识符维数较多的情况下信息损失很大,容易出现过度泛化的情况,本文基于有损链接的思想,在Anatomy分解发布的基础上引入了组内属性值交换的概念,通过把组内每一维属性值随机交换,可以有效抵制现有模型因为泛化和隐匿造成的较大信息损失,同时克服了所有模型都存在的背景知识攻击和存在性攻击问题。(2) 针对多维敏感属性隐私数据发布的多维桶分组技术存在的近似猜测攻击问题,本文在多维桶分组技术基础上提出了一种基于多维桶技术并综合考虑多维敏感属性值敏感级别分布的(g,k)-匿名模型。该模型因为控制了分组中同一敏感度属性值的分布数量,从而能有效抵制近似猜测攻击。(3) 通过大量数据集的实验,对实验结果的分析比较表明本文所提方法的正确性和有效性,测试了数据的发布质量和执行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论