已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)多重数字文本水印的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要近年来,数字水印的研究主要集中在图像和音视频等领域,而对文本水印的研究较少。由于文本本身的特点,在其中加载水印的难度较大。已有的研究结果普遍存在非格式化文本难以嵌入水印、格式化文本的水印严重依赖文本的格式特征、水印难以深入到文本的内容中、水印嵌入容量不足、鲁棒性较差等问题。针对以上问题,本文提出了在文本中分别加载不同的水印,将自然语言处理技术、零水印、不对称加密和数字时间戳等技术应用于文本水印技术,来对文档进行版权保护、完整性验证、文档真伪鉴别等。具体说来,本文的主要工作如下:1 对目前文本水印的发展状况进行了较详细的分析、归纳和总结,提出了目前存在的一些需要解决的关键问题。在介绍了文本数字水印的概念、特点、研究现状的基础上,提出了一种在文本中加载多重水印的技术,该方法不仅可以加载验证版权信息的鲁棒性水印,还可以加载验证文本完整性以及有无篡改等信息的脆弱性水印。2 提出了一种新的基于中文分词的水印技术。利用自然语言处理技术中的中文分词对中文文档进行分词处理,在此基础上,剔除不重要的和无意义的词语,并提取数字摘要来唯一标注文档。同时对于每个文本段也提取其数字摘要,并将这两个数字摘要与作者版权信息同时嵌入每个文本段后的格式控制字符中。借鉴了生物界繁衍延续的方法,将水印信息多次重复嵌入,只要没有移除和破坏嵌入的所有水印,就能检测出水印信息。实验结果表明,该方法隐蔽性好,鲁棒性强,即使对文本进行格式攻击和存储攻击也不会丢失水印信息。3 给出了一种基于时间戳认证的零水印算法。在对文档进行预处理后,提取出能唯一标识文本的数字指纹,并与版权信息绑定后生成水印信息。然后向时间戳权威机构t s a 申请时戳,t s a 对用户的水印信息加盖时间戳,生成含有时间戳信息的零水印。将数字时间戳零水印与文件进行绑定后,就可以作为该文档的版权信息在某段时间内有效的证明。在同一个文档中同时嵌入几种水印方案时,要考虑这几种水印相互间的影响。本文提出的多重水印因为嵌入的载体不同,也没有改变文本的内容,因此这几种水印相互间没有影响。关键词:文本水印;多重水印;中文分词;数字时间戳a b s t r a c ta tp r e s e n t ,t h er e s e a r c ho fd i g i t a lw a t e r m a r k i n gt e c h n ol o g ym a i n l yc o n c e n t r a t e di nt h ea r e a so fi m a g e s ,a u d i oa n dv i d e oe t c ,h o w e v e rl e s sw a t e r m a r kr e s e a r c ho nt e x t b e c a u s eo ft h es p e c i a lc h a r a c t e ro ft e x t ,i t sv e r yd i m c u l tt ol o a dw a t e r m a r ki ni t t h er e s e a r c hr e s u l t sh a v eb e e ns h o w e dt h a tc l a s s i c a la l g o r i t h m sh a v es o m ep r o b l e m ss u c ha su n f o r m a t t e dt e x ti sd i f f i c u l tt oe m b e dw a t e r m a r k s ,w a t e r m a r k si nf o r m a t t e dt e x ta r en o tr e l a t e dw i t ht e x tc o n t e n t s ,t h ec a p a c i t yo fw a t e r m a r ki sl e s sa n du n m e a s u r e d ,a n dt h er o b u s t n e s si sp o o le t c i nv i e wo f t h e s es h o r t a g e s ,t h ep a p e rp r e s e n t san e wm e t h o dw i t hl o a d i n gd i f f e r e n tw a t e r m a r k si n t oo n et e x td o c u m e n t ,w h i c ht a k e st h ea d v a n t a g e so fn a t u r a ll a n g u a g ep r o c e s s i n gt e c h n o l o g y , z e r o - w a t e r m a r k ,a s y m m e t r i ce n c r y p t i o n ,a n dd i g i t a lt i m e s t a m p i n gt e c h n o l o g y i tc a np r o t e c tt h ec o p y r i g h to ft e x td o c u m e n t ,d e t e r m i n et h ei n t e g r i t ya n dt h ec r e d i t a b i l i t yo ft h et e x t t h er e s e a r c h e si n c l u d e di nt h ep a p e rc a nb es u m m a r i z e da sf o l l o w s :i i nt h i sp a p e r ,t h eh i s t o r yo ft e x tw a t e r m a r k ,r e s e a r c hb a c k g r o u n da n dd e v e l o p m e n ts t a t u si sf i r s t l yd e s c r i b e d ,a n a l y s e da n ds u m m a r i z e d t h e nt h es h o r t a g eo fe x i s t i n ga l g o r i t h m si sp r e s e n t e d a f t e ri n t r o d u c i n gt h ec o n c e p t ,c h a r a c t e ra n dr e s e a r c hs t a t u so ft e x tw a t e r m a r k ,an e wt e c h n o l o g yo fm u l t i p l et e x tw a t e r m a r ki sp r o p o s e d t h i sn e wm e t h o dn o to n l yc a np r o t e c tc o p y r i g h ti n f o r m a t i o nf o rt e x td o c u m e n tw i t hr o b u s t n e s sw a t e r m a r k ,b u ta l s oc a nd e t e r m i n et h ei n t e g r i t ya n dt h ec r e d i t a b i l i t yo ft h et e x t ,f u r t h e r m o r e ,i tc a nb ea b l et ol o c a t et h et a m p e ri nt h et e x t 2 an e ww a t e r m a r ka l g o r i t h mt e c h n o l o g yb a s e do nc h i n e s ew o r ds e g m e n t a t i o ni sp r o p o s e d i tu s e sc h i n e s ew o r ds e g m e n t a t i o no fn a t u r a ll a n g u a g ep r o c e s s i n gt e c h n o l o g yt os e g m e n tt h ec h i n e s et e x td o c u m e n t t h e nd e l e t i n gt h eu n i m p o r t a n ta n dm e a n i n g l e s sw o r d s ,a n de x t r a c t i n gi t sd i g i t a lf i n g e r p r i n tt oo n l yt a gt h et e x td o c u m e n t a tt h es a m et i m e ,w ea l s oe x t r a c tt h ed i g i t a lf i n g e r p r i n t sf r o me v e r ys e g m e n t ,t h e ne m b e dt h et w od i g i t a lf i n g e r p r i n t sc o m b i n e dw i t ht h ec o p y r i g h ti n f o r m a t i o ni n t ot h ef o r m a tc o n t r o lc h a r a c t e r sb e h i n de a c hs e g m e n t d r a w i n go nt h ec o n t i n u i t yo ft h ep r o l i f e r a t i o no fb i o l o g i c a lf i e l d ,w a t e r m a r ki n f o r m a t i o nw i l lb er e p e a t e de m b e d d e d ,a n dt h e yc a nb ed e t e c t e da sl o n ga sa l le m b e d d e dw a t e r m a r kh a v en o tb e e nr e m o v e da n dd e s t r u c t e d t h er e s u l t so fe x p e r i m e n t a t i o ns h o wt h a tt h i sa l g o r i t h mi si n v i s i b l ea n dr o b u s ta g a i n s tv a r i o u st e x tp r o c e s s i n ga t t a c k ss u c ha sf o r m a t t i n ga n ds a v i n ga t t a c kw i l ln o td e l e t et h ew a t e r m a r ki n f o r m a t i o n 3 az e r o - w a t e r m a r ka l g o r i t h mb a s e do nt i m e - s t a m p i n ga u t h o r i t yi sp r e s e n t e d i it h ea l g o r i t h mw i l le x t r a c td i g i t a lf i n g e r p r i n tt oo n l yt a gt h et e x td o c u m e n t ,a f t e rt h ec h i n e s et e x td o c u m e n ti sp r e t r e a t m e n t ,a n de n c r y p ti tw i t ht h ec o p y r i g h ti n f o r m a t i o n t h e n ,s e n d i n gar e q u e s tt ot i m e - s t a m p i n ga u t h o r i t yf o rat i m e s t a m p i n g t h et i m e s t a m p i n ga u t h o r i t ys i g n sat i m e - s t a m p i n go nt h eu s e r sm e s s a g e s ,s oaz e r o w a t e r m a r ki sr e g i s t e r e di nt h ed a t a b a s es i n c et h e n t h ez e r o w a t e r m a r kw i t hat i m e 。s t a m p i n gi st i e dt ot h et e x td o c u m e n t ,s oi tc a np r o v es o m e b o d yh a st h ec o p y r i g h ts i n c es o m e t i m e w h e ne m b e d d i n gs e v e r a ld i f f e r e n tw a t e r m a r k si n t oo n et e x td o c u m e n t ,w em u s tm a k es u r et h a to n eo ft h e mw o n tc h a n g eo ri n f l u e n c et h eo t h e r s i nt h i sp a p e r , t w od i g i t a lt e x tw a t e r m a r k sa r ee m b e d e di nd i f f e r e n to b j e c ta r e a sw i t hd i f f e r e n tm e t h o d s ,a n dd o n tc h a n g et h et e x tc o n t e n t ,s ot h e s ew a t e r m a r k sa r en o tb ei n f l u e n c e db ye a c ho t h e rk e yw o r d s :t e x tw a t e r m a r k ;m u l t i p l ew a t e r m a r k ;c h i n e s ew o r ds e g m e n t a t i o n ;d i g i t a lt i m e - s t a m p i n gi i i长沙理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:王飞燕、日期:2 0 0 8 年瑚夕日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1 、保密口,在年解密后适用本授权书。2 、不保密町( 请在以上相应方框内打“4 ”)作者签名:王飞燕、导师虢本叶导师签名:纪冷e t 期:2 0 0 8 年乡月矽日r 期:2 0 0 8 年f 月汐日长沙理工大学硕+ 学位论文第一章绪论1 1 引言i随着多媒体技术和互联网技术的飞速发展,各种形式的数字产品,如图像、文本、视频、音频等,纷纷通过网络发布。由于数字产品具有发行成本低、可以被快速无损复制等特点,所以得到越来越广泛的应用,数字产品在给生产者和消费者带来方便的同时也不得不面对被非法使用和传播的威胁。这就使得多媒体数字作品的版权保护面临着新的威胁和挑战。因此,如何既充分利用互联网的便利,又能有效地保护信息安全的问题,己受到人们的高度重视。目前在数字产品的版权保护方面主要有两种方法:密码技术和数字水印技术。密码技术是信息安全技术领域的主要传统技术之一,它是基于香农信息论及密码学理论的技术。虽然密码技术手段可以用来解决网络信息安全中的部分问题,但是密码技术存在着以下三大缺点:它明确地提示攻击者哪些是重要信息,容易引起攻击者的好奇和注意,并有被破解的可能性;一旦加密文件被破解,其内容就完全透明;攻击者可以在破译失败的情况下将信息破坏,使得即使是合法的接收者也无法阅读信息内容。也就是说,密码技术只能保护传输中的内容,而内容一旦解密就不再有保护作用了。因此,迫切需要一种更好的技术,该技术能够在数字内容被解密后还能够继续保护其内容。在这种背景下,数字水印技术诞生了,数字水印技术是信息隐藏技术的分支之一。数字水印技术由于其不可感知性、可验证性、没有密码管制等特点,已经成为诸多数字版权保护标准中强烈推荐或不可或缺的一部分,越来越多的学者、专家正在对数字水印技术从算法、理论、协议、应用等方面展开研究乜,。目前数字水印的研究及应用前景越来越受到人们的重视,成为了信息安全技术研究领域一个新兴的研究方向,它作为隐蔽通信信息和知识产权保护等的主要手段,正得到广泛的研究与应用。1 2 选题的背景和意义在数字信息时代,各种数字化产品也急速发展。在上世纪九十年代,出现了数字水印技术用以保护数字产品的版权。当前,数字水印的研究主要集中在图像、音频、视频等方面,对以文本文档为载体的数字水印研究较少川。长沙理工大学硕十学位论文但是,在数字化的生活中,人们的很多创意和工作都以数字文本的方式存储和传输。数字文本的容易复制、篡改、伪造和传播等特性,使得其很容易被攻击和非法传播。例如在电子政务和电子商务等系统中,大量有价值的文本在网络上流动,如果这些文本被篡改,将会产生严重的后果,数字文本的安全保护问题迫在眉睫。因此,如何充分利用互联网的便利,同时又能对数字文本的版权和内容的真实性、完整性进行保护,己成为一个非常重要和紧迫的课题。新兴的文本数字水印具有很重要的理论意义和应用价值。数字文本水印与图像、视频、音频数字水印有很大的不同。图像、视频和音频中加载数字水印的空间很大,可利用人类的视觉系统和听觉系统的掩蔽特性,在图像、音频、视频中真正加入一定的物理信息,使人们难以分辨出加水印后的载体与原始载体的区别。但是,数字文本是由字、句子、段落和标点符号等有规律的结构结合而成,在其中嵌水印而又不易被感知,并不是一件容易的事。在数字文本中嵌入水印,就是以一定的方式对文本内容或格式进行修改,通过将修改前后的两种不同状态分别定义为“0 和“l ”,以此嵌入水印信息且不易被察觉。非格式化文本中可插入标记的可辨认空间较小,在其中加入水印比较困难。目前,文本水印技术的研究主要集中在以下几个方面:( 1 ) 将文档处理为灰度图像,采用数字图像水印技术嵌入水印b h a t t a c h a r j y a 等人- 提出一种将文本作为图像处理来用于追踪复印盗版的文档水印算法。( 2 ) 利用格式文档的特征,通过修改格式属性在文档中嵌入水印j 。t b r a s s i l 、n f m a x e m c h u k 和s h l o w 等人提出了基于字移编码、行移编码和特征编码“。的水印技术。字移编码是通过对文档某些行中的某些单词进行移位而与其相邻的单词并不移动来嵌入水印,没有移动的单词作为水印提取过程中的参考位置;行移编码则是通过垂直移动文档中的某些行来进行水印的嵌入的,不移动的行在水印提取时作为位置参考;特征编码的方法就是通过改变某些字母的某一特征来插入水印标记。例如,改变某些字母的字体、高度、宽度等。d i n gh u a n gc 川利用正弦波的特征因子表征字间距的变化量;y o u n g w o nk i m 等人“利用文本中字间距的统计特性来嵌入水印;赵东宁和李德毅等人“2 ,在云模型的基础上,用云滴的纵坐标和横坐标来控制行间距和字间距;戴祖旭等人n 3 ,提出了一种改进的文本文档质心检测方法;n o p p o r nc h o t i k a k a m t h o r n t 川提出了基于字符间距宽度序列编码的文本数字水印技术。在特征编码方面,曹卫兵等人n 副提出了改变汉字字体和中英文标点来嵌入水印的方法;刘玉玲和孙星明等人n 耵通过改变文档中某些字符的大小来嵌入水印;吴悠等“”提出了修改文档中字符的颜色值,将水印信息以正弦波的形式嵌入文本中;张静等人n 钔给出了一种用于p d f 文档的数字水印算法,通过哈达码变换,将长沙理工大学硕士学位论文p d f 文档字符码的特征信息嵌入到文档字符间距中。( 3 ) 基于汉字笔画特征的水印技术汉字结构独特,字体多样。横、竖、撇、捺、折组成了汉字的基本笔画。戈英民和郑岗n 引将汉字文本变换成图像格式,对最普遍的基本笔画撇、捺、点等进行修改,选取在人眼视觉不敏感的4 5 0 或1 3 5 0 方向上修改黑色像素区域从而嵌入水印信息。湖南大学的孙星明等人们幢提出了基于汉字数学表达式的水印方法,该方法借助于汉字数学表达式唯一描述汉字的结构特征,从而将水印码加载于汉字的结构拆分中。“) 基于自然语言处理的水印方法m i k h a i lj a t a l l a h 和v i c t o rr a s k i n 等人忙2 ,提出了基于自然语言处理的文本数字水印算法,通过构建t m r ( t e x t m e a n i n gr e p r e s e n t a t i o n ) 树,进行语义的转换,如等价、替换和嫁接等嵌入水印和检测水印;张宇等人n 给出了基于句法分析和基于语义的文本水印算法;眭新光和罗慧他通过用同义词替换文档中的单词来嵌入水印。通过研究当前国内外数字文本水印技术,发现现有的文本水印技术存在着基于格式的水印算法鲁棒性差、很难抵抗格式攻击,基于自然语言的水印算法由于自然语言技术的不成熟而难以在实际中应用,水印信息与文本内容无关,嵌入的水印信息量较小,不能对文档的完整性提供验证等缺点。针对以上这些单一的水印技术的不足,本文研究了一种多重数字文本水印技术,通过在文档中嵌入不同功能的水印,共同提供数字文本的版权保护、完整性验证和篡改定位的功能。1 3 数字水印的研究现状从1 9 9 3 年正式提出数字水印( d i g i t a lw a t e r m a r k ) 至今,无论是在国内还是在国外,数字水印技术的研究都引起了人们极大的关注。数字水印技术是利用数字文件中普遍存在的冗余数与随机性,向数字文件中加入可以判定区分的秘密信息,从而达到保护数字文件知识产权和完整性的一种技术”。这些嵌入的秘密信息即水印,通常是不可见的,但也有根据实际需要嵌入的可见水印。数字水印技术一方面弥补了密码技术的缺陷,它可以为加密后的数据提供进一步的保护,另一方面,数字水印技术也弥补了数字签名技术的缺陷,它可以在原始数据中一次性嵌入大量的加密信息。因此,数字水印技术一产生,就受到了国际学术界和企业界的高度重视并成为当前多媒体信息安全领域中发展最快的热点技术之一。作为一门新兴的多学科应用技术,数字水印涉及了许多不同领域的理论和技术,如信息论、编码理论、检测理论、密码学、多媒体技术、信号处理、图像处理、模式识别、计算机科学等技术。数字水印与其它众多科学的发展是相互促进长沙理工大学硕士学位论文相互推动的关系。随着人们对数字水印技术的研究和对其作用的认识的不断深入、使用范围的不断扩大,数字水印技术己在网络图像、卫星数字视频传输、数字图书馆、医学图像、数字知识产权保护、电子商务、加密和安全通信、军事地图和军事机密的网络传输等领域得到广泛的应用。目前,已经支持或展开认证水印研究的机构既有政府部门,也有大学和知名企业。不少著名大学和研究机构投入相当大的人力和财力资源,致力于该项技术的研究,已取得了一定的成果。如美国的麻省理工学院、p u r d u e 大学、n e c 和i b m研究所、英国的g e o r a g em a s o n 大学、瑞士洛桑联邦工程技术学院、西班牙v i g o大学、日本n t t 研究中心及荷兰菲利浦公司等。我国学术界对数字水印技术的反应也非常快,己经有相当一批有实力的科研机构投入到这一领域的研究中来n 引。为了促进数字水印及其他信息隐藏技术的研究和应用,1 9 9 9 年1 2 月1 1 日有关应用研究单位联合发起召开了我国第一届信息隐藏学术研讨会。2 0 0 0 年1 月,由国家智能机专家组和中科院自动化所模式识别国家重点实验室组织召开了数字水印学术研讨会,来自国家自然科学基金委员会、国家信息安全测评认证中心、中国科学院、北京邮电大学、国防科技大学、清华大学、北方工业大学、上海交通大学、天津大学、中国科技大学、北京大学、北京理工大学、中山大学、北京电子技术应用研究所等单位的专家学者和研究人员深入讨论了数字水印的关键技术,报告了各自的研究成果。从这次会议反应的情况上看,我国相关学术领域的研究与世界水平相差不远,而且有自己独特的研究思路。1 3 1 数字水印的概念与特征数字水印技术是指将数字、序列号、文字、图像标志等信息嵌入到多媒体数据中,以起到版权保护、秘密通信、数据文件的真伪鉴别等作用。被嵌入的不明显的记号,即数字水印,通常是不可见或不可察的,但是通过一些计算操作可以被检测或者被提取。数字水印与数字内容紧密结合,成为数字内容不可分离的一部分,并可以经历一些不破坏数字内容使用或操作而存活下来n ”。另外,还可以通过对数字水印的检测和分析来保证数字信息的完整性、可靠性。数字水印是保护知识产权和多媒体信息防伪的有效手段。一般来说,数字水印应具有如下的基本特征:( 1 ) 不可感知性不可感知性指嵌入水印信息后,不会引起载体文件产生可感知的失真,即隐藏文件和原载体应充分接近,经过一系列隐藏处理,使目标数据没有明显的降质现象,否则便失去了隐藏的意义。嵌入在多媒体数据中的数字水印,首先应该从视觉( 或听觉) 上是不可感知的,即嵌入水印不应对载体质量造成严重的影响。4长沙理工大学硕十学位论文( 2 ) 鲁棒性鲁棒性指含水印信息的多媒体数据受到一定的处理后,仍然能恢复隐藏的水印信息,即要求所嵌入的信息不能轻易地抹去,如多媒体数据作有损压缩时,或信息在传输过程中受到噪声干扰、滤波及可能的人为破坏时,包括有意识的攻击,如内容篡改,以及无意的攻击,如图像压缩、滤波、裁剪等,嵌入的信息要保持其完整性。在对多媒体数据进行了这些操作以后,鲁棒的水印算法仍然能够从中提取出所嵌入的水印来。( 3 ) 安全性安全性对于一个水印方案来说是至关重要的,指其他使用者在不知水印算法和密钥时,不能获得水印信息。一般来说,在水印嵌入和提取时,都会使用一个密钥,如果不知道密钥,对于鲁棒水印方案,则无法提取、伪造、修改或移去水印;对于脆弱和半脆弱水印方案,则无法提取或伪造水印。( 4 ) 可验证性可验证性是指数字水印能够为数字内容的版权归属提供无争议的证明。提取的水印可以用来判别数字内容是否受到保护、监视被保护数据的传播、鉴别真伪以及控制非法拷贝等。( 5 ) 不可测性不可测性指对非法者来说,要检测到秘密信息的存在并提取出来应十分困难,至少在秘密信息的有效期内是不可能的。( 6 ) 稳定性稳定性指水印信息能够永久的存在,并在一定的条件下可以提取。1 3 2 数字水印的嵌入和检测数字水印技术产生自对数字内容版权保护的需求,即要求在不影响数字内容正常使用的前提下,将作者的序列号、公司标志、有意义的文本等标识版权信息的数字水印与数字内容绑定为一个整体,并在需要的时候可以方便的验证数字内容的版权归属。一个完整的数字水印方案n 引主要包括水印嵌入和水印提取两部分。水印嵌入的输入包括数字载体x 、数字水印w 、密钥k ,输出为嵌入水印的数字载体x p ,水印提取的输入是嵌入水印的数字载体x p 、密钥k ,并可能包括数字内容x ,其输出为数字水印w 或其存在的假设检验结果。数字水印的通用基本框架可用六元组( x 。,w 。,k 。,g ,e ,d ) 表示,其中:x 。表示所要保护的数字产品x p 的集合。w 。表示所有可能的水印信号w 的集合。k 。是水印密钥k 的集合。g 表示利用密钥k 和待嵌入水印的数字产品x p 共同生成水印的算法:5长沙理工大学硕士学位论文g :x ,k ,j 以,形= g 沁,k )( 1 1 )e 表示将水印w 嵌入数字产品x p o 中的嵌入算法,可表示为:e :墨形一x ,x p w = e 池,矽)( 1 2 )其中x p o 代表原始数字产品,x p w 代表嵌入水印后得到的数字产品。d 表示水印检测算法,即d :x ,一 o ,1 )d x c 础,= :,篆秽3 ,这里,h l 和h o 分别代表二值假设,表示水印信息的有无。图1 1 展示了一般的水印信息嵌入模型,其功能是将水印信息加入原始数据中。该模型的输入是水印、载体数据和一个可选的密钥,输出是添加了水印的数据。密钥可用来加强安全性,以避免未授权方恢复和修改水印,当密钥为公钥和私钥时,嵌入水印的技术通常分别称为公开水印技术和秘密水印技术。图1 2 是判断某一数字产品中是否含有指定的水印信息的数字水印检测模型。匝弭匪习图1 1 水印信息嵌入模型圆 原始图像i匦哥一叠厂i密码ii 一图1 2 水印信息检测模型1 3 3 数字水印的分类数字水印种类很多,根据不同应用领域和目的可分为以下几类:( 1 ) 按作用分按作用可分为鲁棒水印和脆弱性水印。前者主要用于版权保护,嵌入的水印6长沙理工大学硕士学位论文能抵抗常见的编辑处理、图像处理和有损压缩等,在经历有意或无意的攻击后水印不被破坏,仍能检测出来以提供认证。后者则用于数据的完整性保护,判断数据内容是否被篡改。( 2 ) 按检测方法分按水印检测是否需要原作品可分为盲水印和非盲水印。盲水印在检测过程中不需要原数据,而非盲水印则需要原始信息的介入。( 3 ) 按水印嵌入的方法分根据嵌入技术的不同可分为时空域水印和变换域水印。时空域水印技术是指将水印信息嵌入数字作品的时间域( 常用于数字音频作品) 或空间域( 主要针对数字图像或视频) 中。基于变换域的技术是先将作品做某种变换,常用的变换技术有离散傅里叶变换、离散余弦变换、离散小波变换、哈达码变换等,然后把水印嵌入到作品的变换域中。变换域数字水印技术具有更好的鲁棒性。( 4 ) 按内容分按内容可将水印划分为有意义水印和无意义水印。有意义水印是指水印本身是有意义的文字串或者是某个数字图像( 商标、印鉴等) 或数字音频片段的编码;无意义水印则只对应于一个序列号。有意义水印的优势在于:如果由于受到攻击或其他原因致使解码后的水印破损,人们仍然可以通过视觉观察确认是否有水印;但对于无意义水印来说,如果解码后的水印序列有若干码元错误,则只能通过统计决策来确定信号中是否含有水印。( 5 ) 按用途分类可分为版权保护水印、篡改提示水印、票据防伪水印、隐蔽标识水印、印刷数字水印等。( 6 ) 按水印的载体分类可将水印分为图像数字水印、视频数字水印、音频数字水印、文本数字水印和关系数据库数字水印技术等n ”。到目前为止,图像数字水印是研究最多也是最成熟的技术,主要用于数字图像的版权保护;视频水印技术主要是将水印数据直接嵌入视频流中,从而控制视频的应用;音频水印主要用于网上音乐等音频数字的版权保护;由于关系数据库数据本身的特殊性,关系数据库数字水印技术在国内研究很少,它可用来验证关系数据库的所有权归属;文本水印技术所处理的文本既可以是格式文本如p d f 、d o c 等格式,又可将文本当作二值图像来处理。1 3 4 常见的数字水印算法近年来,数字水印技术研究取得了很大的进步,下面对一些典型的算法进行了分析,这些算法主要针对图像数据。( 1 ) 空域算法。该类算法中典型的水印算法是将信息嵌入到随机选择的图像点长沙理工大学硕士学位论文中最不重要的像素位( l e a s ts i g n i f i c a n tb i t s ,l s b ) 上,保证嵌入的水印是不可见的。但是由于使用了图像不重要的像素位,算法的鲁棒性差,水印信息很容易为滤波、图像量化、几何变形的操作破坏。( 2 ) 变换域算法。在该类算法中,通常利用离散傅立叶变换( d i s c r e t ef o u r i e rt r a n s f o r m ,d f t ) ,离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ,d c t ) 或离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) 等将图像变换到相应的频率域,然后通过改变变换域系数的方法来实现水印的嵌入。该类算法的隐藏和提取信息操作复杂,抗攻击能力强,很适合于数字作品版权保护的数字水印技术中。( 3 ) 压缩域算法。基于j p e g 、m p e g 标准的压缩域数字水印系统不仅节省了大量的完全解码和重新编码过程,而且在数字电视广播及v o d ( v i d e oo nd e m a n d )中有很大的实用价值。相应地,水印检测与提取也可直接在压缩域数据中进行。( 4 ) n e c 算法。由n e c 实验室的研究人员提出,在数字水印算法中占有重要地位,其实现方法是,首先以密钥为种子产生具有高斯n ( o ,1 ) 分布的伪随机序列,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做d c t 变换,最后用伪随机高斯序列来调制该图像除直流分量外的1 0 0 0 个最大的d c t 系数。该算法具有较强的鲁棒性、安全性、透明性等。由于采用特殊的密钥,因此可防止i b m攻击。( 5 ) 生理模型算法。人的生理模型包括人类视觉系统h v s ( h u m a nv i s u a ls y s t e m ,h v s ) 和人类听觉系统h a s ( h u m a na u d i b l es y s t e m ,h a s ) 。基本思想是利用可感知变化阈值j n d ( j u s tn o t i c e a b l ed i f f e r e n c e ,j n d ) 确定在图像的各个部分所能容忍的数字水印信号的最大强度,从而能避免破坏视觉质量。这一方法同时具有好的透明性和强健性。1 3 5 数字水印的应用水印系统要满足的条件总是建立在应用基础上的。一种技术或方法如果没有它的应用价值,那么对它的研究也就没有任何意义。所以探讨水印的应用价值是很有必要的,我们都知道,没有普遍适用的水印嵌入方法。对于不同的应用就有不同的要求。1 。用于篡改提示的水印:确定数字作品的内容是否被修改、伪造或特殊处理过,即完整性检测。这可用脆弱性水印来实现,它对特定的修改有弱的健壮性,而其它的修改则是破坏性的。在所有可能的水印应用中,用于图像认证的水印对健壮性要求最低。用于版权保护的水印:目前版权保护可能是水印最主要的应用,其目地是嵌入数据的来源信息以及比较有代表性的版权所有者信息,从而防止其它团体对该数据宣称拥有版权。这样水印就可以用来公正的解决所有权问题,这种应用要求8长沙理工大学硕士学位论文非常高的健壮性。用于盗版跟踪的数字指纹:它的目的是传输合法接受者的信息而不是数据来源者的信息,主要用来识别数据的单个发行拷贝。这很像软件产品的序列号,对监控和跟踪流通数据的非法拷贝非常有用。这一类应用在发行的每个拷贝中嵌入不同的水印,通常称之为“数字指纹一。它不仅要能抵抗恶意的攻击,还要能抵抗一些标准的数据处理。用于拷贝保护的水印:在多媒体发行体系中,希望存在这样的一个拷贝保护机制,即它不允许未授权的媒体拷贝。在开发系统中很难实现拷贝保护,然而在封闭或私有系统中,拷贝保护是可行的。在这样的系统中,可用水印来说明拷贝状况。1 4 本文的主要工作和论文的结构1 4 1 本文的主要工作数字水印技术对数字信息的安全具有重要意义,国内外学者对它的研究正方兴未艾。本文通过对数字水印特征和研究现状的分析,发现由于文本的独特结构使得对文本水印研究有一定的难度,研究进展相对比较缓慢。目前己有的文本水印方法比较单一,存在水印鲁棒性差、抵抗攻击性不强、隐蔽性不太好、水印信息无法深入文本内容之中以及水印嵌入容量较小等不足。针对以上这些单一的水印技术的不足,本文研究了基于中文文档的多重数字文本水印技术,通过在文档中嵌入不同功能的水印,共同提供数字文本的版权保护、完整性验证和篡改定位的功能。第一重水印主要提供文档的完整性验证和篡改定位的功能,同时水印中也能加载文档的版权信息。该算法嵌入水印后允许对文档内容做一些修改,修改限制在添加、删除和改变文档内容中的一些无实际意义的词语,这种修改对水印没有影响。但是,如果进行了限制之外的修改攻击,那么可以检测出攻击并定位攻击的位置。如果攻击者在已经加载了版权水印的文档中嵌入伪造的版权水印信息,那么如何判断出两个水印的嵌入时间顺序,所以本文提出了第二重基于时间戳的水印技术。在同一个文档中嵌入两种不同功能的水印,那么必须保证这两种水印相互之间没有影响,后嵌入的水印不能对先嵌入的水印造成破坏。本文的主要工作有以下几个方面:( 1 ) 介绍数字水印技术的发展历程,并总结了数字水印技术的概念、特征以及目前主要的研究成果。详细讨论了数字水印技术研究的现状,特别是文本水印的研究现状,包括数字水印技术的特征、分类、算法优缺点和抗攻击策略等。( 2 ) 研究了一种新的基于中文分词的水印技术。利用自然语言处理技术中的中文分词对中文文档进行分词处理,在此基础上,剔除不重要的和无意义的词语,9长沙理工大学硕士学位论文在提取数字摘要来唯一标注文档。同时对于每个文本段也提取其数字摘要,并将这两个数字摘要与作者版权信息同时嵌入每个文本段后的格式控制字符中。借鉴了生物界繁衍延续的方法,将水印信息多次重复嵌入,只要没有移除和破坏嵌入的所有水印,就能检测出水印信息。该方法隐蔽性好,鲁棒性强,即使对文本进行格式攻击和存储攻击也不会丢失水印信息。( 3 ) 给出了一种基于时间戳认证的零水印算法。在对文档进行预处理后,提取出能唯一标识文本的数字指纹,并与版权信息绑定后生成水印信息。然后向时间戳权威机构t s a 申请时戳,t s a 对用户的水印信息加盖时间戳,生成含有时间戳信息的零水印。将数字时间戳零水印与文件进行绑定后,就可以作为该文档的版权信息在某段时间内有效的证明。“) 在分析介绍了文本数字水印不足的基础上,提出了一种在文本中加载多重水印的技术,该方法不仅可以加载验证版权信息的鲁棒性水印,还可以加载验证文本完整性以及有无篡改等信息的脆弱性水印。在同一个文档中同时嵌入几种水印方案时,要考虑这几种水印相互间的影响。本文提出的多重水印技术因为加载的对象和嵌入的载体不同,而且没有修改文本的内容,因此这几种水印相互间没有影响。1 4 2 论文的组织结构本文分五章展开:第一章绪论主要介绍选题的背景和意义,并讨论了数字水印技术的研究背景、国内外研究现状、数字水印的概念与特征、数字水印的分类和应用、常用的水印算法,并提出本文对于多重文本水印技术的研究内容与思路。第二章介绍并分析了数字文本水印技术,讨论了数字文本水印的概念和特性,给出了数字文本水印的系统框架,总结了目前主要的数字文本水印算法,存在的主要问题,并简述了针对文本水印的攻击策略等。第三章研究了一种新的基于中文分词的水印技术,该方法能够提供版权保护和文档内容的完整性验证。文中详细阐述了算法的设计思想、嵌入过程和检测过程,并进行了大量的实验论证,包括抵抗攻击性能测试,以及与其它算法进行比较,得出各种算法的特点和不足。第四章给出了一种用于版权保护的基于时间戳认证的中文文档零水印算法。介绍了相关的背景知识,论述了算法的设计思想,给出了实验结果,并进行了性能分析。同时阐述了多重数字文本水印技术,在同一个文档中嵌入多重不同功能的水印时,必须要注意各种水印相互之间不能有影响。第五章总结本文的工作和主要贡献,并给出一些有待进一步研究的问题。l o长沙理工大学硕士学位论文第二章数字文本水印技术在数字信息时代,各种数字化产品也急速发展。在上世纪九十年代,出现了数字水印技术用以保护数字产品的版权。当前,数字水印的研究主要集中在图像、音频、视频等方面,对以文本文档为载体的数字水印研究较少。但是,文本数字水印同样具有很重要的价值。文本数字水印与图像、视频、音频数字水印不同。图像、视频和音频加载数字水印的空间很大,可利用人类的视觉系统和听觉系统的掩蔽特性,在图像、音频、视频中真正加入水印信息,使人们难以分辨出加水印后的载体与原始载体的区别。但是,数字文本是由字、句子、段落和标点符号等有规律的结构结合而成,在其中嵌入水印而又不易被感知,并不是一件容易的事。2 1 数字文本水印的基本原理在数字文本中嵌入水印,就是以一定的方式对文本内容或格式进行修改,通过将修改前后的两种不同状态分别定义为“0 ”和“1 ”,以此嵌入水印信息且不易被察觉。非格式化文本中可插入标记的可辨认空间较小,在其中加入水印比较困难。文本数字水印的目的不在于限制或控制数据的获取,而是通过对水印的提取或检测,确认文档的所有权和文档内容的完整性验证以及篡改定位等。对文本数字水印的研究有助于保护文本数字信息的版权及增加文本数字信息在互联网上传输的安全。嵌入的水印信息可以是版权标志、用户序列号或者产品相关信息。一般,它需要经过适当变换再嵌入到数字产品中。通常,定义水印为如下的信号:w = 铲形i 形0 ,f = o ,l ,2 ,刀一1 ( 2 1 )在公式( 2 1 ) 中,刀一1 为水印序列的长度,d 代表值域。水印为一维数字序列,水印信号的值域一般是二值形式,如0 = o ,1 等其他形式。2 2 数字文本水印的系统模型水印嵌入就是把水印信号w = 比) 嵌入到原始文档x o = & 。q ) ) 中,一般的水印嵌入规则可描述为:州七) = x o ( 七) ow ( 七)( 2 2 )公式( 2 2 ) 中。为某种叠加操作,根据文本嵌入方式的不同而变化。水印的提取和检测时可以有原始文档的参与,也可以没有原始文档的参与。当前大多数的水印提取检测不需要原始文档,实现了盲检测。长沙理工大学硕士学位论文文本数字水印的嵌入和检测系统的基本框架如下图所示。图2 1 展示了一般的文本水印嵌入模型,其功能是将水印信息加入文本文档中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GA 2179-2024警用服饰移民管理警察丝织胸标
- 邵东县重点中学2025-2026学年初三教学情况调研(一)物理试题含解析
- 2026年大学大一(康复工程)康复辅助器具设计开发阶段测试题及答案
- 思想主题教育会议纪要
- 2025年前台防疫接待礼仪技能题
- 护理管理精讲课程获取
- 护理职业安全与防护技能
- (二模)铜川市2026届高三模拟预测(二)地理试卷(含答案详解)
- 2026二年级数学 苏教版数学乐园综合实践三
- 心理健康教育实施方案
- 2026年河南林业职业学院单招职业适应性测试题库带答案详解
- 河北衡水恒通热力有限责任公司招聘笔试题库2024
- 苏科版三年级劳动下册第03课《纸黏土浮雕》公开课课件
- 2009-2022历年上海事业单位考试《基本素质测验》真题摘选附带答案详解(2023上岸必备)
- 2023年苍南县姜立夫杯数学竞赛高一试卷浙江省
- 2023年嘉兴平湖市特殊教育岗位教师招聘考试笔试题库及答案解析
- GB/T 4056-2019绝缘子串元件的球窝联接尺寸
- 高压电器及成套配电装置
- 秘书科工作规范
- 人力资源培训与开发PPT全部课件
- 第一单元写作《写出人物的精神》课堂实录 部编版语文七年级下册
评论
0/150
提交评论