(计算机软件与理论专业论文)基于bibd的数据库压缩水印技术.pdf_第1页
(计算机软件与理论专业论文)基于bibd的数据库压缩水印技术.pdf_第2页
(计算机软件与理论专业论文)基于bibd的数据库压缩水印技术.pdf_第3页
(计算机软件与理论专业论文)基于bibd的数据库压缩水印技术.pdf_第4页
(计算机软件与理论专业论文)基于bibd的数据库压缩水印技术.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于b i b d 的数据库压缩水印技术 基于blb d 的数据库压缩水印技术 摘要 随着数据库技术的不断发展及数据库管理系统的广泛应用,同多 媒体数据一样,数据库也面临着版权保护的问题。当在i n t e r n e t 上 允许指定用户远程查询和访问数据库时,数据提供者要担心数据被窃 取、非法拷贝;在大量的数据背后隐藏着许多重要的信息,利用数据 挖掘技术可以从看似无规律的数据中挖掘出有用的商业信息。由此引 出了对数据所有权的保护问题。数据库水印技术正是由此而产生的。 基于b i b d ( b a l a n c e di n c o m p l e t eb l o c kd e s i g n ,平衡不完全组 设计理论) 的数据库压缩水印技术,根据关系数据库的特殊性,结合 了组合设计的区组设计思想,将b i b d 弓i 入关系数据库数字水印算法 中。本文阐述了基于b i b d 的数据库压缩水印技术的开发思路和构建过 程,主要内容包括: 1 详细分析了当前数据库水印技术的最新研究成果及其普遍存 在的问题。 2 引入了系统构建涉及的组合数学知识及相关定理、推论。 3 介绍本系统构建的主要技术、存在的问题,以及解决问题所 需的关键技术。 本文在算法上的创新有以下几个方面: 1 二维空间标识法。首先对数据库的元组进行标识,将一维空 间映射到二维空间。这种方法摒弃了原有只依赖于元组主键的做法, 更加的灵活。 2 水印信息压缩。数字水印技术从其理论上必须要对承载实体 的内容进行一定的修改,不论是版权字符串还是含有版权信息的图 片,转换为数字串后数值量都会非常大。如果直接将如此庞大的数字 串嵌入到原来的数据库当中,这本身就是对原有数据库极大的伤害, 势必将造成数据库中很多原数据的改变。因此本文采取了水印压缩算 法,在保证水印信息不丢失的情况下,最大限度的减小了需嵌入的水 莲手b i b d 豹数攥瘁瓣缭农爨l 技术 印量。 3 首次将组合数学中的平衡不完全区组设计( b i b d ) 方法弓| 入 到数据库水印算法中。由于b i b d 算法本身就保证了元素的利用率和 均衡性,正符合了数据库水印技术对于嵌入算法的要求,即通过使用 b i b d 算法,则在水印数据量一定的情况下,可以最大限度地降低被 修改的元组数量,减少对原有数据库数据的修改。 4 使焉用户奁定义方式定义参数。叠蘸主流的数据库静类繁多, 企业存储的数据也是形式多样,仅仅依靠水印嵌入系统判断数据的重 要性与否是不妥当的,因此在本系统中,采用了用户自定义的方式, 将重要数据和最不关键数据的定义权交给了使用者,使之更加灵活、 方便地使焉本系统,更加适应实际中的需要。 关键词:数据库水馨,区组设计,平衡不完全区组设计( b i b d ) ,压 缩水印,水印信息与处理 皋于b i b d 的数据库压缩水印技术 c o m p r e s s e dw a t e r m a r k i n gf o rd a t a b a s eb a s e do nb i b d a b s t r a c t a l o n gw i t ht h ec o n s t a n td e v e l o p m e n to fd a t a b a s et e c h n o l o g ya n dt h e e x t e n s i v ea p p l i c a t i o n so fd a t a b a s em a n a g e m e n ts y s t e m ,t h ed a t a b a s ea l s o f a c e dt h ei s s u eo fc o p y r i g h tp r o t e c t i o nj u s ta sm u l t i m e d i ad a t a w h e n u s e r sc a nr e q u i r ea n dv i s i td a t a b a s er e m o t e l yb yi n t e r n e t ,t h ed a t a p r o v i d e r sn e e dt ob e c o n c e r n e da b o u td a t at h e f ta n di l l e g a lc o p i e s ;t h e r ei s s om a n yi m p o r t a n ti n f o r m a t i o nh i d d e nb e h i n dal a r g en u m b e ro fd a t a s o m eu s e f u lb u s i n e s si n f o r m a t i o nw i l lb eo b s e r v e df r o mt h es e e m i n g l y e r r a t i cd a t ab yu s i n gd a t am i n i n gt e c h n o l o g y t h i sl e a d st ot h eo w n e r s h i p o ft h ed a t ap r o t e c t i o ni s s u e s ,m o r e o v e ra r i s e st h ed a t a b a s ew a t e r m a r k i n g t e c h n o l o g y b a s e do nt h eb i b d ( b a l a n c e d i n c o m p l e t e b l o c k d e s i g n ) c o m p r e s s e dd a t a b a s ew a t e r m a r k i n gt e c h n o l o g y , a c c o r d i n gt ot h es p e c i a l n a t u r eo fr e l a t i o n a ld a t a b a s e ,w i t hac o m b i n a t i o no fd e s i g nb l o c kd e s i g n i d e a s ,i n t r o d u c e sb i b di n t ot h ed i g i t a lw a t e r m a r k i n ga l g o r i t h m t h i s p a p e rp r o p o s e s t h ed e v e l o p m e n ti d e a sa n db u i l d p r o c e s s o ft h i s t e c h n o l o g y , t h em a i nc o n t e n t si n c l u d ea sf o l l o w s : v l 皋十b i b d 的数据库压缩水e 技术 1 d e t a i l e d a n a l y s i s o ft h ec u r r e n td a t a b a s e sw a t e r m a r k i n g t e c h n o l o g ya n dt h el a t e s tr e s e a r c ha c h i e v e m e n t sa sw e l la st h e i rc o m m o n p r o b l e m s 2 i n t r o d u c t i o no ft h ef u n d a m e n t a lt h e o r yo ft h i ss y s t e mi n v o l v i n ga c o m b i n a t i o no f c o n s t r u c t i n g m a t h e m a t i c a l k n o w l e d g e a n dr e l a t e d t h e o r e m ,i n f e r e n c e s 3 i n t r o d u c t i o no ft h i ss y s t e m sm a i nt e c h n o l o g y , t h ee x i s t i n g p r o b l e m s ,a n dt h ek e yt e c h n o l o g yf o rs o l v i n g t h e s ep r o b l e m s i nt h i sp a p e r , t h ea l g o r i t h mi n n o v a t i o n sa r ei nt h ef o l l o w i n ga r e a s : 1 t w o d i m e n s i o n a li d e n t i f i c a t i o n f i r s t l y , i n d e n t i f yt u p l e so ft h e d a t a b a s e ,b ym a p p i n go n e d i m e n s i o n a lt ot w o d i m e n s i o n a ls p a t i a ls p a c e t h i sm e t h o di sm u c hm o r ef l e x i b i l i t yt h a nt h eo r i g i n a lw a yw h i c hr e l i e s s o l e l yo n t h ep r i m a r yk e y 2 c o m p r e s s i o no fw a t e r m a r ki n f o r m a t i o n d i g i t a lw a t e r m a r k i n g t e c h n o l o g yf r o mi t st h e o r e t i c a le n t i t i e sm u s tm o d i f ys o m eo ft h eo r i g i n a l c o n t e n t w h e t h e rt h ec o p y r i g h ti sas t r i n go ri m a g e ,t h en u m b e ro fs t r i n g a f t e r c o n v e r t i n gn u m e r i c a lq u a n t i t y w i l lb ev e r y l a r g e i fd i r e c t l y e m b e d d i n gs u c hah u g en u m b e ro fc h a r si nt h ed a t a b a s e ,i ti stg r e a th a r m t ot h eo r i g i n a ld a t a b a s e t h i sp a p e ra d o p t e daw a t e r m a r kc o m p r e s s i o n a l g o r i t h m ,w h i c hm a x i m i z et h ed e c r e a s eo ft h ee m b e d d e di n f o r m a t i o n w i t h o u ta n yl o s t v i i 基于b i b d 的数据库压缩水即技术 3 i n t r o d u c t i o no ft h ec o m b i n a t i o no fm a t h e m a t i ct h e o r y 一一b a l a n c e i n c o m p l e t eb l o c kd e s i g n ( b i b d ) i n t o t h ed a t a b a s ew a t e r m a r k a l g o r i t h m f o rt h ev e r yf i r s tt i m e 。b i b da l g o r i t h mi t s e l fi sag u a r a n t e eo fe f f i c i e n c y , w h i c hi se x a c t l yt h er e q u i r e m e n to ft h ed a t a b a s ew a t e r m a r k i n ga l g o r i t h m 4 u s e r - d e f i n e dp a r a m e t e r t h e r ei saw i d er a n g eo fd i f f e r e n tc u r r e n t m a i n s t r e a md a t a b a s e ,a n dd i v e r s ed a t af o r mo fe n t e r p r i s es t o r a g ed a t a b a s e 。 i t i sn o ta p p r o p r i a t et h a tt h ew a t e r m a r k i n gs y s t e m ss o l e l yj u d g et h e i m p o r t a n c eo ft h ed a t a 。i nt h i ss y s t e mb yu s i n gu s e r - d e f i n e dp a r a m e t e r , t h ed e f i n i t i o no fi m p o r t a n c eo fd a t ai sd e l i v e r e dt ot h eu s e r s ,w h i c hm a k e s t h es y s t e mm o r ef l e x i b l e ,e a s i e rt oa c c e s s ,a n dm o r es u i t a b l et ot h ea c t u a l n e e d s k e yw o r d s :d a t a b a s ew a t e r m a r k i n g ,b l o c kd e s i g n ,b a l a n c e i n c o m p l e t e b l o c k d e s i g n ,c o m p r e s s e dw a t e r m a r k i n g ,w a t e r m a r k i n f o r m a t i o na n dm a n a g e m e n t 基于b i b d 的数据库压缩水印技术 东华大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本 人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用 的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的 内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律 结果由本人承担。 学位论文作者签名:栗新字 日期:四年1 2 月 同 撼十b i b d 的数据库胍缩水印技术 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅域借阅。 本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本版权书。 本学位论文属于 | 不保密硪 学位论文作者签名:荤薪孑 目期:孰订年 朔 日 吲j 也 肭:2 名 年 签 p 耐 侈 j y i 刻 导 期 活 r 基十b i b d 的数据库胝缩水印技术 第一章序论 数据库技术的不断发展及数据库管理系统的广泛应用,同多媒体数据一样, 数据库也面临着版权保护的问题。当在i n t e r n e t 上允许指定用户远程查询和访问 数据库时,数据提供者要担心数据被窃取、非法拷贝;在大量的数据背后隐藏着 许多重要的信息,利用数据挖掘技术可以从看似无规律的数据中挖掘出有用的商 业信息。由此引出了对数据所有权的保护问题。 1 1 课题背景 从本质上看,网络安全就是网络上的信息安全。从广义上来说,凡是涉及到 网络信息的保密性、完整性、可用性、真实性和可控性的相关技术和理论都是网 络安全的研究领域。信息安全的技术主要包括监控、扫描、信息隐藏、检测、加 密、认证、防攻击、防病毒以及审训l j 等几个方面。 其中,信息隐藏将在未来网络中保护信息不受破坏方面起到重要作用,所谓 数据隐藏技术1 2 j ,是把机密信息隐藏在大量信息中不让对手发觉的一种方法。信 息隐藏的方法主要有隐写术、数字水印、可视密码、潜信道、隐匿协议等。它区 别于用密码保护,不会置身于明处,随时都可能遭受他人破译的攻击。 而数据库水印技术是信息隐藏技术的一个分支。对水印研究的兴趣主要是由 于同益增长的对内容版权保护的关注。很明显,人们愿意在网上下载图片、音乐 和视频。国际互联网是一个优秀的数字媒体发行系统,很廉价,不需要仓库和库 存品,且交付几乎是瞬间完成的。但是,内容拥有者也看到了盗版的高风险性。 随着高质量数字录制设备数量的剧增,被盗版的风险也随之剧增。当普通消 费者录制一首歌或一段电影的唯一途径是使用模拟磁带时,盗版复制品一般要比 原始作品的品质低,再次,盗版复制的作品质量更差。但是,通过数字录制设备 的歌曲和电影,在质量上即使有畸变,也只是很轻微的程度。利用这种录制设备 和互联网,盗版者可以不费吹灰之力地录制和发行受版权保护的数字媒体,而无 需付给真正版权所有者正当的补偿。因此,内容所有者正在急切地寻找能有效保 护他们权利的技术。 内容所有者最早使用的方法是密码学。在发送之前加密内容,仅把密钥给予 基于b i b d 的数据库心缩水印技术 那些购买了内容的合法用户。遗撼瓣是,密码学对数字媒体内容存在两大瓣题静 : 是数字媒体内容的超分粕问题,即内容一旦解密,便可以随意的被拷j j 3 、f 之播, 快速发展的霹络为菲法传接提供很大鹃便利,给媒体态容制造齑造成了巨大损 失,从硝制约着数字媒体应用的进行;二是数字媒体内容的访问控制问题,因为 数字媒体内容( 如视频流) 昀蕊密解密需要巨大盼运算负蘅,并且难以满足瘴用 的时效性。人们常常认为通信安全可以通过加密来完成,但这并不能完全解决阀 题。一方西加密螽盼文髂嚣其不可理解性妨碍数字媒体的传播;另一方医数字媒 体信息经过加密后容易引起攻击者的好奇和 生意,并有被破解的可能性,而且一 壁加密文件被破解后萁内容就完全透嚼了。 因为密码学的不足,人们寻求新的技术解决方案。数字水印技术是目前信息 安全技术领域的一个新方向曛是种可以在开放网络环境下保护舨权和认证柬 源及完整性的新必技术,刨作者的姓名,创作时间,剁作信息期个人标志等桐应 的版权入信息可以通过数字水印系统不感知的水印形式嵌入在数字媒体中。人们 无法从袭嚣上感知水印,只有专门的检测仪器或计算枫软件才可以检测出隐藏的 数字水印。为了保护版权入的经济利益,在数字作品上直接标识版权入的信怠会 鹎显损害作最韵矮量,丽剽用文件的附加信息标识舨权又很不安全。捆比之下, 在不过多损害作品质量的前提下,便用数字水印技术将版权管理信息秘密潜入数 据中,是一个菲常理想黪解决方案。首先,数字水印是不可见或不可听的,因聪 对消费糟的利益不构成侵害;其次,数字水印具有几乎不可破译性,偷换水印的 难度毒 常大,舨权管理信息菲常安全,保护了数字媒体所有翥鲶剩益。 数字水印技术是2 0 世纪9 0 年代兴起的- - i - j 崭新的技术,它通过在数字产晶 中嵌入可感知或不霹惑知豹售怠来确定数字产品的所有权或检验数字内容的原 始性1 5 l 。数字水印研究领域一致认为【6 】,数字版权管理的核心思想是能够控制内 容麓合法传播,保护叛权所有者豹幂| l 盏。密妈学和数字承印技术是解决关系数据 库版权问题的一种很前沿的方法。目前,数字水印技术作为数字产品版权保护问 题翁一种有效手段,翼盏成为天靠】研究麴焦点。 数据库水印【5 j 是指用信号处理的方法在数据库中嵌入不易察觉且难以去除 魏标记,在不破坏数据瘁内容器可爱性麓女誊提下,达到保护数据摩安全躲莲熬l 刀。 通过水印对关系数据库数据版权进行管理,已经成为数据库管理系统研究和研制 基于b i b d 的数据库压缩水印技术 的一个崭新课题,豳前也得到了业界的普遍重视。 本文主要讨论了一种基于平衡不完全区缰设计( b i b d ) 的核心思想和核心 技术的压缩水印关系数据库数字水印技术和版权管理框架,力求为关系数据库的 版权保护寻求新的有效方法。 1 2 国内外研究的发展历史及现状 1 2 1 发展历史 1 9 9 3 年a z t i r k e l 等所撰写的“e l e c t r o n i cw a t e rm a r k ”一文中首次使用了 “w a t e rm a r k ”这一术语。这一命名标志着数字水印技术作为 j 正式研究学科 的诞生。后来二词合二为一就成为“w a t e r m a r k ”,而现在一般都使用“d i g i t a l w a t e r m a r k i n g ”一词来表示“数字水印 l 弱。现在所说的“东印 一般指的都是 数字水印。 数字水印技术黧9 3 年被提出以来,壹予其在信息安全和经济上的重要地磁 发展较为迅速,世界各国的科研机构、大学和商业集团都积极的参与或投资支持 我方面的研究。如美国蒌孝政部、美国版权工作缓、美国洛靳阿莫颠国家实验室: 美国海陆空研究实验室、欧洲电信联盟、德国囡家信息技术研究中心、同本n t t 信息与通信系统砑究中心、麻省理工学院、南加利福尼亚大学、剑橇大学、瑞士 洛桑联邦工学院、微软公司、朗讯贝尔实验室等都在进行这方面的研究工作。i b m 公司、蜀立公司、n e c 公司、p i o n e e r 电子公蠢和s o n y 公司等五家公司还宣羹j 联合研究基于信息隐藏的电予水印。 国际学术界陆续发表了许多关于数字水鼋技术方面的文章,几个有影响的雷 际会议( 例如i e e e ,s p i e 等) 及一些国际权威学术期刊( 例如s i g n a lp r o c e s s i n g 等) 相继出版了有关数字永帮技术的专题。1 9 9 6 年5 月,雷际第一届信息隐藏 学术讨论会( i n t e m a t i o n a li n f o r m a t i o nh i d i n gw o r k s h o p ,i h w ) 在英国剑桥牛顿 研究所召开,截止至2 0 0 7 年该研讨会已举办了九届。在1 9 9 9 年第三届信患隐藏 国际学术研讨会上,数字水印成为主旋律,全部3 3 篇文章中有1 8 篇是关于数字 水印的研究。1 9 9 8 年的国际图像处理大会( i c i p ) 上,还开辟了两个关于数字 水印的专题讨论。由m a r t i nk u a e r 创建的w a t e r m a r k i n gw o r l d 已成为一个关于数 字承印的著名网上论坛。 蘧手b i b d 豹数挺瘁艨维拳秘技术 随着技术信患交流的加快耜水印技术的迅速发震,国内塑研究单位也蹩逐 步跌技术舔踪转向深入系统研究,备大研究所和高校纷纷投入数字水印的研究, 其孛院较有代表性的有哈尔滨工监大学,天津大学,= 艺京邮电大学,中圆群学院 自动化研究所等,她们是图内较早投入水印技术研究且取得较好成绩的科研单 位。我鬻予1 9 9 9 年1 2 月l l 目,囊= | :京电予技术应用研究所组织,翟开了第一 届信息隐藏学术研讨会( c i h w ) ,截止至2 0 0 7 年1 2 月已成功的举办了七届, 很大程度地推进了国蠢永印技术的研究与发展。同时,国家对信息安令产j 渗的健 康发展也非常的重视,在2 0 0 3 年的科技型中小企业技术创新基金若干重点项 西指南中,骧确指出了对于“数字产品产极保护( 基于数字水露、信息隐藏或 者网络认诞等先遴技术) 和“个性化产品( 证件) 的防伪( 基于永印、编码或 挑战应蓊等技术) 等多项防盗版和防伪技术予以重点支持。 。2 2 在数值型数据方面嚣研究现获 匿内外对于数值型数据方面的数据库水甥技术傲了大量的工律,主要集中在 以下几种技术: lr a k e s ha g r a w a l 豹关系数据霹数字水印技术戮 餐 r a k e s ha g r a w a l 于2 0 0 2 年在香港举行的第2 8 属v l d b ( i n t e r n a t i o n a l c o n f e r e n c eo n 黟l a r g ed a t ab a s e s ) 大会上提患了对关系数据痒中数值型属链 僮进行标记的策赂,该标记策略首先假定可以标记的关系数据蓐的数值型属性的 属性值允许一定的误差,在其误差范墨蠹不影响关系数据麾数据豹具体使用。 r a k e s ha g r a w a l 的关系数据库数字水印技术的思想与空间图像数字水印技术的 p a t c h w o r k 算法思想禳相近。 2r a d us i o n 关系数据库数字水印技术f 1 2 i t l 霹 r a d us i o n 的关系数据库承霹技术是在2 0 0 2 年e 琶戳a s ( t h ec e n t e rf o r e d u c a t i o na n dr e s e a r c hi ni n f o r m a t i o na s s u r a n c ea n ds e c u r i t y ) 所作的技术性报告 孛提出熬。这一关系数据痒数字水邸技术也是对数馕囊藩褴进行标记的。绘定数 值型项翻集合s 和一个秘密的排序密钥k ,蕾先用加密键值哈希对其进行秘密排 序。这耪秘密排序,透过对数据豹分散效果,提高了防止像“选取”或“增加” 等不同类型攻击的能力。r ,s i o n 关系数据库数字水印技术对数值型属性进行标记 攘于b i b d 的数据库胍缩水印技术 该算法的水印嵌入过程如下所示: ( 1 ) 秘密排序。给定数值型项褥集s = s 1 ,s 2 ,s 。 属于r 和个秘密的排序 密钥k s ,根据标准化项目的最大意义比特位的抛密键值哈希对其进行秘密排痔, 如i n d e x ( s i ) = h ( k s ,m s b ( n o r m ( s i ) ,k s ) 。 ( 2 ) 予集构造。将秘密排序后的数值项羁集划分子集s i 用来嵌a l l 特位水印 标记。假定水印信息是m 个比特位长,刚整个水印带宽将是m 个比特位,每个 比特位嵌入,隐藏到每个标避豹s i 中。 ( 3 ) 水印编码。将水印比特位值编码到s i 中的比特位编码过程如下。 设哆融,e 9 ,妇k 是实数如f = 9 0 ,v f a l s e = 7 , 矿t r u e = 1 0 ) 。称c 是一个簧信因子( 水印检测提取时也用到这些参数值) : 设蒯= 谢; 艿( s ,) =;x f s f 魄) 为置中大于拉曙冬,) + c 拳艿心,) 的项目数, 则有, 如果,。岱。) 吆。幸i s ;1 ) ,那么恍撑r k ( s ,) 拦p 髓p ,# l s e ,i n v a l i d 是e : 如果v c ( s r ) 舻纛毒i s , i ) ,那么粼赡8 ,= t r d e ,f a t s e ,i n v a l i d 斑l s e : 如聚收 ) g 妒触宰i s ;! ,宰i s , 1 ) ,那么搬撂政。= t r u e ,f a l s e ,觑懈嬲;是 i n v a l i d 。 萁承馨提取过程,首先瓣水印数据进行秘密搀序,然善棂据边赛数组对羹 序 后的数值集进行熙配构造子集,结合标志数组从子集中提取水印比特值,比特位 解褥熬过程霜承邸嵌入孛的编码过程致。从数据中恢复繇有水印备份螽,在所 有恢复的水印比特位上用多数选举方式配置,从而确定原始水印比特位。 3 张勇薄豹基于云模型羲水印关系数据疼技术 1 4 1 1 5 】 国内关于数字水印在关系型数据库方面的研究,主要是提出了基于云模型的 揍 二8 1 8 d 的数据瘁艨缩水秘援承 数据瘴水印技术。云模型是中雷电子系统工程研究蹶的李德毅院士撬懑的定静定 量互换模型,解放军理工大学的张勇博士在2 0 0 3 年l o 胃发表的论文水印关系 数据瘁中,掇据关系数据库菜些数值型霭性允诲一定误差的特点,嗣样是借鉴 了图像水印技术的p a t c h w o r k 算法思想,提出一种基于云模型的水印关系数据库 技术,来解决关系数据库数据韵版权保护问题有一定的可行性。该模掣只需要溺 期望值e x ( e x p e c t e dv a l u e ) 、熵e n ( e n t r o p y ) 、超熵h e ( h y p e re n t r o p y ) 3 个参 数描述,它们葳映了概念的定量特性。其中,麓望嚣x 表示最能代表这个概念翰 值,通常是云重心对应的值,反映了褶应概念的信惠中心值;熵n 拦概念模糨 度酌度量,熵的大小直接决定了在论域中可被概念撅接受豁元素个数,体现了概 念的亦拢亦彼性的域度;超熵h e 可谓熵的熵,反映了云的离敖程度,超熵的大 小间接地反映了云的厚度。云由许多个云滴组成,每个云滴就是这个概念映射 到数域空间的1 个点,即1 次具体实现,这种实现带有不确定性,云同时给出这 个点能够代表该概念的确定程度。当e h 很小,或者超漓h 相对于熵酞来滋 很大时,云在整体上表现为雾状,此时云就被称之为雾。单个的云滴并没有实际 意义,只有云滴的整体所表现浅柬的特征才有实际意义。 其嵌入框图如图| 。l 所示。 曰日 篷1 1 关系数据瘁云农印信号嵌入拯隧 ,2 。3 在非数值型数据方面巍奄研究现状 国外对于非数值型数据的水印研究并不多。主饔有: l r a d us i o n 的关于j 数值型关系数据库觞水印技术 r a d us i o n 在2 0 0 4 年i c d e ( h at h ep r o c e e d i n g so ft h e2 0 t hi n t e r n a t i o n a l c o n f e r e n c eo nd a t ae n g i n e e r i n g ,b o s t o n ) 中提磁的。该方法假设不同的数据种摸 之间的改变与嗣一_ j 巾类数据之间的替换给数据带来的改变是等效的。 麟十b i b d 的数据库j 卡缩水e 技术 2a g u s t is o l a n a s 和j o s e pd o m i n g o f e r r e r 的关于非数值型关系数据库的水 印技术 这一技术是在2 0 0 6 年的m d a i ( m o d e l i n gd e c i s i o n sf o r a r t i f i c i a li n t e l l i g e n c e , b e r l i n ) 上提出的。它是在r a d us i o n 研究的基础之上,通过加入用户定义的相 似性函数( u s e r - d e f i n e ds i m i l a r i t yf u c t i o n ) 来最小化水印数据对于数据瘁数据的 改变。 1 2 4 目前研究存在的问题 除了以上比较著名的研究之外,综合其他的研究状况( 见参考文献 【1 6 一 2 s 】) ,可以看溺善蘸的研究主要存在善以下的问题。 1 共同的问题 嚣蘑,水印数攮痒多集中于数值型数据,两在菲数氇型数据方面的毒开究还毒 常有限f 2 6 l ,不论是i b m 实验室的r a k e s ha g r a w a l 和普渡大学的r a d us i o n ,还 是解放军理工大学的张勇蒜士缝稍所磷究的水印方法都是针对数值型数攒的。但 是在现实生活中,非数值型数据如字符型、日期型等办是关系型数据库必不可少 的组成部分。仅仅针对于数值型数据的属性不仅不符合现实豹要求,更重要的是, 方便了破坏者对水印进行攻击,只要针对数值型数据的属性进行修改,就口j _ 以擦 除掉数据麾中嵌入的水窜信息。 2 特性化的缺点 ( 1 ) a g r a w a l 的关系数据痒数字水印技术 该水印技术是假定数据库中只包含数值型字段,且每个字段都能嵌入水印, 两般应篇的数据库不可熊仪有数值型字段。其次,a g r a w a l 的算法,剩鲻数掘 库中各个属性的顺序来嵌入水印,当改变属性顺序或删掉某个属性时,可能会导 致检测失效,因此必须依靠原数据库来检测。该算法不具备很好的可检测性和盲 检性。最后,该水印技术只能检测到有没有水印标记,而不能够嵌入或提取到有 意义的水印信息。 ( 2 ) r a d us i o n 关系数据库数字水印技术 该技术是基于数值型字段“均方差”特性对数值型字段进行标记的,此种标 记方式很大程度地限制了水印的嵌入容量。并且,因为该算法利用了每个分组中 堆十b i b d 的数据库抹缩水印技术 数据的分布属性嵌入水印,数据库中不同字段的字段值域各不相同,具有很好的 鲁棒性。但当数据更新时,分组的数据发生变化,从而改变的数据的分布,较易 破坏其中的水印,需要在更新后在该分组中重新嵌入水印,因此该算法不具有很 好的可更新性。而且,该水印技术方案始终没有公开他的方法,并且其方法中元 组划分集合大小的确定和元组的排序始终没有给毒明确的浼法。 ( 3 ) 张勇博士基于云模型的水印关系数据库技术 针对传统模糊集理论的不彻底性,李德毅教授在传统模糊集理论和概率统计 的基础上提出了定性定量不确定性转换模型云模型,以云模型为基础经过系统研 究和发展形成了云理论包括云模型、虚云、云运算j 云变换。 该水印技术亦是针对数值型字段进行标记的,并且有一个明显的缺陷,就魁 在水印检测提取时需要有原始关系数据库的参与,没有实现亩测,因此不具有离 检性。 1 3 研究的目标及其意义 各种数字媒体的数字水印技术都应具有定的鲁棒性,关系数据库数字水印 技术也不例外,也应该可以防御各种各样的攻击,包括币常的数据更新_ ; 翼恶意的 攻击。因为关系数据库数据需要经常维护更新,所以包含在一个关系数掘库中的 标记不能因力正常的数据更新两在无意中被去除掉,否则其效果就如同恶意攻击 样。即如果数据窃取者不知道关系数据加了水印,那么窃取者在对偷来的关系 数据进行讵常更新时不能因数据的更新焉丢失嵌入在关系数据库擘的水印信息。 如果数据窃取者知道偷来的关系数据加了水印,他就会试图擦掉水印或杵用其他 方法声明对关系数据假的所有权。 水印系统应该能保护数据的原始所有权而阻止数据窃取者各种形式的恶意 攻击。对水印关系数据库常见的恶意攻击方式有: ( 1 ) 子集攻击:数据窃取者不使用水印关系库的全部属性和元组,仅仅使用 其属性或元组的子集,从丽希望擦除水印。 ( 2 ) 混合和匹配攻击:数据窃取者从包含相似信息的多个关系库中获取不相 连的元组创建自己的关系库。 ( 3 ) 添加攻击:数据窃取者在窃取来的已经加水印的关系数据库上再简单地 皋十b i b d 的数据库胜缩水e j j 技术 加上他自己的水印,并声明自己对关系数据库的所有权。 ( 4 ) 可逆性攻击:如果数据窃取者在其偷来的关系数据库内发现了一个虚幻 的水印,他就可以采取可逆性攻击,声称自己对关系数据库的所有权。而实际上 数据窃取者声称的水印只是随机出现的水印。 当然,针对关系数据库不同的水印算法,对其攻击方式还很多并且各不相同, 每个水印算法都应能够防御各种攻击,都应具有很强的鲁棒性。 1 4 本文的组织结构 本文的研究内容主要由六章组成: 第一章:绪论,主要介绍了论文的研究背景及国内外研究动态。 第二章:介绍数据库水印技术的相关部分。 第三章:介绍了平衡不完全区组设计理论( b i b d ) ,这也是本文的基础王哩论 部分。 第四章:介绍基于b i b d 数据库水印系统的相关技术以及具体的设计方案。 第五章:介绍基于j a 、,a 的水印管理系统框架及其具体实现。 最后,论文的第六章对全文做了总结,回顾了全文研究内容,并探讨了下一 步需要完善进一步研究的内容。 1 5 本文创新及主要贡献 本文的创新点及主要贡献如下: 1 论文研究的重点是关系数据库数字水印的生成,嵌入和检测提取。平衡 不完全区组设计( b i b d ) 思想起源1 9 世纪中叶英格兰数学家科兜盟( t e k i r k m a n ) 提出的具有游戏性质的1 5 女生问题,目前不仅被应用于试验设计上, 还与编码理论等有密切关系,极大地推动了现代应用数学的发展。本文创造性的 将该理论引入关系数据库数字水印技术中,并在实践中验证了其可行性。 2 压缩水印信息是本文对水印信息预处理提出的独特方法。系统在结合了 奇偶校验法的同时,还增加了对原始水印信息的压缩步骤,在保证了水l = i j 信息小 丢失的基础之上,极大程度地降低了嵌入关系数据库的水印信息量。 3 论文在系统初期创造性地提出了用户自定义方法。通过用户自定义数据 皋卡b i b d 的数据库限缩水印拽术 库、数据库表、最重要字段、最不重要字段以及压缩参数,使得系统更加切合实 际需要,能够随着具体应用的不同,做出不同的判断,同时也使得用户自然地拥 有了对原始数据痒及承印信息静私有权。 4 。系统将旗于平衡不完全区组设计( b i b d ) 的数据库水印技术和构建的管 理系统应焉到,实践涯骥了算法的正确性。 ,6 本耄夺结 防止拷贝和版毂保护是数字水馨领域的主要驱动力。随罄因特网技术的琶速 发展,在因特网上允许授权用户远程查询和访问数据库已成为普遍簧求,f r 是数 据提供者担心数据被窃取、菲法拷炙,版权得不到鸯效僳护,蠢就要有一种机制 来表明数据库数据的侵权拷贝。通过向关系数据库数据上添加水印来解决这种问 题。通过求印对关系数据库数据版毅进行管理,已经成为数据瘴管理系统研究和 研制的个崭新课题。 本耄介绍了数字水酃技术熬发震历史帮当前溺凑井豹磷究动态,数字承印技 术的定义和基本原理,数字水印的基本特征和必要条件。阐述了关系数据库数字 承印技术麓算法,提出了论文的磷究重点。最焉介缨了本文翁蠹容缌织结构和本 文的创新和主要贡献。 基于b i b d 的数据库胜缩水日j 技术 2 1 基本概念 第二章水印关系数据库 水印可以定义为可感知的或不可感知的形式嵌入到数字作品( 文本、音频、 视频、图形和图像等) 中的、用于版权保护、内容检验或提供其它信息的信号。 数字水印技术f 4 】,是将代表数字作品著作权人身份的特定信息、用,、指定的 标识或序列码等,按照某种方式嵌入到被保护的信息中,在产生版权纠纷时,通 过相应的算法提取出该数字水印,从而验证版权归属,确保数字作品著作权人的 合法利益,避免非法盗版的威胁【2 7 1 。被保护的信息可以是任何一种数字作品, 如软件、图像、音频、视频、数据库或一般性的电子文档等。数字水印是嵌住数 字产品中的数字信号,水印的存在要以不破坏原数据的欣赏价值、使用价值为原 则。数字水印技术是水印生成、嵌入、检测、提取以及攻击等过程的统称。 数字水印的基本原理是嵌入某些标识数据到宿主数据中作为水印,使得水印 在宿主数据中不可感知和足够安全。为了保证由于水印的嵌入而导致的宿主数据 失真不被觉察到必须应用到某种感知准则。不管是隐性还是显性,都是必须的。 因而作为不可觉察性的要求,宿主数据上的每个采样点的值( 空f h j 域或频率域) 的改变程度与其自身相比应该相对比较小。为了保证水印算法的鲁棒性,水印信 息在宿主数据上通常上很大的冗余度。这意味着水印信息可以从其部分数据中恢 复出来。但如果在恢复过程中能提供更多的数据那么鲁棒性则更强。 数字水印技术按照不同的分类方式,可以划分为不同的类别【7 1 【引。 ( 1 ) 按水印的特性划分 按水印的特性可以将数字水印分为鲁棒数字水印和脆弱数字水印两类。鲁棒 数字水印主要用于在数字作品中标识著作权信息,如作者、作品序号等,它要求 嵌入的水印能够经受各种常用的编辑处理;脆弱数字水印主要用于完整性保护, 与鲁棒水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印 的状态就可以判断数据是否被篡改过。 ( 2 ) 按水印所附载的媒体划分 按水印所附载的媒体可以将数字水印划分为图像水印、音频水印、视频水印、 文本水印以及用于三维网格模型的网格水印等。随着数字技术的发展,会出现更 举手b 1 b d 豹数摆瘁抵臻拳爨j 技拳 多种类的数字媒体,同时也会产生相赢酶水印技术。 ( 3 ) 按水印瀚检测过程划分 按水霹酶检测过程可以将鼗字水球划分必臻文水印和誊水印。明文水印在捻 测过程中需要原始数据,露盲水印的检测只需要密钥,不需鼗原始数据。一般柬 说,明文水印的鲁捧性比较强,但其应用受到存储成本的限制。舞静学术界研究 的数字水印大多数是盲水印。 ) 按水印的用途划分 不同的应用需求造就了不同的水印技术。按水印的用途,可以将数字水印划 分为票据防伪水印、版权保护水印、篡改提示水印和隐蔽标识永印。 f 5 ) 按求印豹隐藏位置划分 按数字求印的隐藏位置可以将其划分为时( 空) 域数字水印、频域数字水印、 时频域数字水印和时间尺度域数字水印。时( 空) 域数字水印是直接在信号空 阍上叠加水印信患,而频域数字水印、时频域数字水印和时闽尺度域数字水印 则分别是在d c t 变换域、时频变换域和小波变换域上隐藏水印。 相比于其他技术,数字水印技术的优势很骧显:数字水印技术弥补了秀拜密一 解密技术不熊对解蜜后的数据提供进一步裸护的不是;弥补了数字签名不能在原 始数据中次性嵌入大量信息的弱点;弥誉 、了数字标签容易被修改和剔除的缺 陷:弥霉 了数字指纹仅能绘出如版权破坏者信息的髑限。 2 2 关系数据库水印的核心技术 数据麾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论