




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士论文 基于w o r d 文档的数字水印算法研究与实现 摘要 随着i n t e m e t 技术与数字技术的飞速发展,数字媒体已成为人们获得知识的主要方 式,与此同时,也产生了许多负面的问题,比如作品非法复制与传播等侵权行为。当前 应用于图像、视频、声音等方面的水印方法已经有很多,其中一些方法也起到很好的效 果,遗憾的是,这些方法一般不能适用于文本文档的规则结构,也不能采用文本文件的 规则结构来进行有效地检测。在各种多媒体数据信息中,数字文本的传播与复制相对来 说更容易,有时也它比图像、视频与声音等数据信息也更有价值。因此,近年许多研究 者对文本数字水印的研究已产生广泛的关注。 本论文详细探究了这种新型的数字文本版权保护技术,在深入分析文本数字水印现 有状况、分类、算法及一些关键技术的基础上,提出了两种适合w o r d 文档的改进型 数字水印新算法。其中一种是改进型基于行移的数字水印算法,该算法的主要思想是通 过计算、判断w o r d 文本的行间距,并利用正弦波的周期性规律嵌入水印信息来对文 本版权进行保护。与以往的算法相比,改进型行移算法计算量相对较少,水印嵌入时仅 需计算、判断文本的行间距,无需计算其重心,并利用正弦波自适应规律来实现水印嵌 入与检测有效。实验结果表明:该改进型算法的水印嵌入和提取检测效率非常高,且抗 攻击性和鲁棒性均比较好。另一种改进型基于r g b 值变化的水印算法,即修改文本中 不同字符的字体颜色值,同时将水印以正弦波的特征形式嵌入到文本中。水印检测时, 通过提取字体的颜色特征,重构正弦波来鉴别文本是否含有水印。与以往的算法相比, 该改进型算法既可以用于英文文本,也可用于中文文本。在w o r d 文档中进行水印的 嵌入具有普遍性和通用性。实验结果表明,改进的算法实现的水印具有良好的视觉透明 性和检错能力。 本论文虽然已经取得了一定的结果,但由于现在文本数字水印技术还是个新的研究 领域,加之文本文档的特殊性,目前嵌入水印的方法还不很成熟。文本水印技术已经在 文本文档的版权保护方面取得了一些的效果,且随着数字水印技术的不断改进与发展, 通过文本数字水印技术、密码学、数字签名等技术的相互结合,相信它能够发挥更好的 保护作用,构建更安全的保护系统。 关键词:数字水印,w o r d 文档,改进型算法,r g b ,鲁棒性 1 绪论 硕士论文 a b s t r a c t w i t l lt h ed e v e l o p m e n to fi n t e r n e ta n dd i g i t a lt e c h n o l o g y , d i g i t a lm e d i ah a sb e c o m et h e m a i nm e a n so fa c c e s st ot h ek n o w l e d g e ,b u ta l s ob r o u g h tas e r i e so fq u e s t i o n ss u c ha s i n f r i n g e m e n t , i l l e g a lc o p y i n ga n dd i s s e m i n a t i o no fw o r k s i nr e c e n ty e a r st h ed i g i t a l w a t e r m a r k i n gt e c h n o l o g ya s at r a d i t i o n a le n c r y p t i o ns y s t e mc o m p l e m e n ti sb e c o m i n ga f r o n t i e rr e s e a r c hf i e l do ft h ei n t e r n a t i o n a la c a d e m i cc o m m u n i t y c u r r e n t l ym a n ye f f e c t i v e m e t h o d sa r eb e i n gu s e df o re m b e d d i n gt h ew a t e r m a r k i n gi ni m a g e sa n dv i d e o ,b u tt h e s e m e t h o d sd on o ta p p l yt ot h et e x to ft h ed o c u m e n ts t r u c t u r eo ft h er u l e s ,b u tt h e s em e t h o d sd o n o tf i tt ot h er u l ec o n s t r u c to fat e x tf i l e a si nm a n yt y p e so fm u l t i m e d i ad a t a , t h es p r e a d , c o p yo fd i g i t a lt e x ti se a s i e r , a n dh i g h e rv a l u et h a nt h ed a t ao fi m a g e s ,s o u n d t h e r e f o r e ,t h e s t u d yo f t h ed i g i t a lt e x tw a t e r m a r k i n gh a sb e c o m ei n c r e a s i n g l yi m p o r t a n t i nt h i sp a p e r , t w on e wm o d i f i e dd i g i t a lw a t e r m a r k i n ga l g o r i t h m sw e r es t u d i e da f t e ra d e t a i l e dr e s e a r c ho ft h et e x td i g i t a lw a t e r m a r k i n gt e c h n o l o g ya n dd e e pa n a l y s i so ft h es t a t u s , c l a s s i f i c a t i o n , a l g o r i t h m sa n dk e yt e c h n o l o g i e so ft e x td i g i t a lw a t e r m a r k i n g o n ei s t h e i m p r o v e dd i g i t a lw a t e r m a r k i n ga l g o r i t h mb a s i n gt h er o w s h i f t t h i sa l g o r i t h m sm a i ni d e a si s t h ec a l c u l a t i o na n dj u d g e m e n to ft h et e x tl i n es p a c i n ga n de m b e d d i n go fw a t e r m a r k i n gb y u s i n gt h ec y c l i c a ln a t u r eo fs i n ew a v e c o m p a r e dw i t ht h ep r e v i o u sm e t h o d s ,t h em o d i f i e d a l g o r i t h mo f r o ws h i f ti sl o wc a l c u l a t i o n , o n l yc a l c u l a t i n gt h es p a c eo fr o w , n o tj u d g i n gf o c u s , e m b e d d i n gt h ew a t e r m a r k i n gb yu s i n g t h ec y c l i c a ln a t u r eo fs i n ew a v ew h e ne m b e d d i n gt h e w a t e r m a r k i n ga n db l i n dw a t e r m a r ke x t r a c t i o n t h er e s u l t ss h o wt h a tt h ea l g o r i t h mc a l l a c h i e v eag o o de m b e d d i n ga n dd e t e c t i o no fw a t e r m a r k i n g ,a n dh a v et h eb e t t e rr o b u s t n e s sf o r t h et r a d i t i o n a la t t a c k s a n o t h e rm o d i f i e dm e t h o di st h ew a t e r m a r k i n ga l g o r i t h mb a s i n go na r g bv a l u e s t h ew a t e r m a r k i n g ,丽t l lt h em o d i f i c a t i o no ft h ec o l o ro fc h a r a c t e rf o n ti nt h et e x t , c a nb ee m b e d d e di n t ot h ed o c u m e n t a f t e rt h em o d i f i c a t i o n , t h ef o n tc o l o r so fv a r i o u s c h a r a c t e r ss h o wt h ec h a r a c t e r i s t i c so fas i n ew a v e t h ea u t h e n t i c i t yo faw o r dd o c u m e n tc a n b ev e r i f i e db yd i s t i l lt h ec h a r a c t e r i s t i c so ff o r n tc o l o ra n dr e c o n s t r u c tt h es i n ew a v e c o m p a r e d w i t l lt h ep r e v i o u sa l g o r i t h m s ,t h em o d i f i e da l g o r i t h mc a nb eu s e di ne n g l i s h ,b u ta l s ot ot h e c h i n e s et e x t a tt h es a m et i m e ,e m b e d d i n gw a t e r m a r k i n gi sm o r eu n i v e r s a la n dc o m m o nf o r t h ed o c u m e n to f d o cf o r m a t t h ee x p e r i m e n t ss h o wt h a tt h ew a t e r m a r k e dd o c u m e n t sh a v e g o o dp e r c e p t u a lt r a n s p a r e n c ea n dt h ec h a r a c t e rc h a n g e si nt h ew o r dd o c u m e n t sc a nb e d e t e c t e d 硕士论文 基于w o r d 文档的数字永印算法研究与实现 a l t h o u g ht h i sp a p e rh a sm a d es o m eg o o dr e s u l t s ,b u tt h ee m b e d d i n gw a t e r m a r k i n g m e t h o d sa l s oa r en o tm a t u r ef o rt h et e x td i g i t a lw a t e r m a r k i n gt e c h n o l o g yb e i n gar e l a t i v e l y n e wf i e l d ,a n dt h es p e c i a ln a t u r eo ft h et e x td o c u m e n t s t e x tw a t e r m a r k i n gt e c h n o l o g yi nt h e p r o t e c t i o nc o p y r i g h to ft e x td o c u m e n t sh a so b t a i n e dac e r t a i ne f f e c t a st h ew a t e r m a r k i n g t e c h n o l o g i e sc o n t i n u et oi m p r o v ed e e p l y , b yi n t e g r a t i n go ft e x t d i g i t a lw a t e r m a r k i n g t e c h n o l o g y , c r y p t o g r a p h y , a n dd i g i t a ls i g n a t u r e s ,t h o s ew i l lg i v eab e t t e rp r o t e c t i o n ,c o n s t r u c t am o r es e c u r es y s t e mo f p r o t e c t i o n k e y w o r d s :d i g i t a lw a t e r m a r k i n g ,w o r dd o c u m e n t ,m o d i f i e da l g o r i t h m ,r g b ,r o b u s t n e s s i i i 声明尸明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 己在论文中作了明确的说明。 研究生签名:皇竖妥伊g 年g 月心日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:垒竖生彤年罗月f j 日 硕士论文 基于w o r d 文档的数字水印算法研究与实现 1 绪言 1 1 数字水印技术背景介绍 上世纪9 0 年代以来,随着现代通信技术、多媒体技术、计算机信息产业和全球互 联网的迅猛发展,各种类型的数字媒体,包括图像、音频、视频、文字等等,得到广泛 的传播和应用。与此同时,传统的媒体发行出版及其传播方式,如电视、电影、广播、 期刊、杂志以及图书等等,正有逐渐被数字媒体所取代的趋势。如今通过数字媒介可以 容易地获取、复制和传播各种信息,这也极大地丰富了人们的生活,也使人们的工作效 率得到成倍的提高。但在丰富人们生活的同时,也暴露出许多严重的安全性问题。故希 望传播信息时,能够有效地保护作品的版权,防止被人非法复制或篡改,机密信息传播 时不被非法截取或破译。当前的信息安全技术大都以密码学作为理论基础,无论是采用 密钥系统或是公钥系统,两者的保护方式都是控制文件的存取,将信息文件加密成密文 文件,不致于被非法用户解读。但随着计算机处理能力的提高,增加密钥长度用来提高 系统密级的方法也变得很不安全。因此,迫切需要一种新的保护技术,使文件的内容被 解密后仍可够继续保护其内容 1 1 。 由于仅仅依靠密码学技术有其局限性,即它对解密后的文件失去保护作用。故近年 来,研究者开始提出一种新的关于信息安全的技术,并开发设计与传统密码学不同的技 术,就是将机密信息隐藏于需要保护的文件中,再通过网络进行传递信息。由于非法拦 截者从网络上获取的机密资料文件,与传统加密过的乱码文件不一样,看起来和一般资 料的一样,因此可以轻松地逃过非法拦截者的破译。并且在通常使用中隐藏于文件中的 机密信息不会被轻易地消除,即使经过多次解密、再加密、压缩、数模变换等过程,设 计巧妙的机密信息也仍可以继续存在加密文件中,并在版权鉴定时,可通过一定的方法 进行检测出来以用作的证据。这正是传统加密系统所没有的功能,也正是信息隐藏的核 心思想。因此,数字水印技术作为版权保护的最后屏障得到了快速的发展。 数字水印技术是信息隐藏技术领域的一个非常重要的方向,也是最近十年来出现的 一种有效的数字产品版权保护技术 2 1 。该技术用一定的算法将一些版权信息直接嵌入多 媒体信息内容当中,嵌入后不影响原原信息内容的价值及使用,也不能被人的知觉系统 觉察到,只能通过特定的检测器或阅读器提取隐藏的水印信息。隐藏的水印信息可以是 作者的信息、公司的标志图案、有一定意义的文本等等,可以用来鉴别数字产品的各种 版权信息。图1 1 所示为水印嵌入前后效果图,图1 1 ( a ) 为原始图像,也称宿主图像, 图1 1 ( b ) 为版权水印图像,图1 1 ( c ) 为嵌入水印后的图像,而图1 1 ( a ) 和图1 1 ( c ) 不能引 起人眼视觉上的差别【3 】。与传统的加密技术不同,数字水印技术不能阻止盗版复制传播 等非法活动的发生,但它可以鉴别对象是否受到版权保护,为被保护数据的非法传播和 硕论文 拷贝、解决版权纠纷提供证据。有时为了增加非法去除水印的难度,大多的数水印都采 用密码学中的加密( 包括公开密钥、私有密钥) 体系来进行加强,在水印的嵌入、提取时 采用一种密钥或几种密钥。 ( 曲原始圈像0 ) 水印图像0 ) 嵌入水印后的图像 图1 1 在图像中嵌入数字水印前后效果图 文本数字水印作为数字水印的一个重要分支,应用极为广泛,备受关注,它是通过 特殊的方式,将隐秘信息嵌入到文本信息中但并不对文本的信息内容、形式、格式等 造成大的视觉影响,以此达到信息隐藏的目的。 1 2 数字水印技术国内外研究状况 人们许多信息都是以文本的形式存储和传输的。文本一种重要的信息传递手段,但 其版权保护问题也迫在眉睫。上世纪9 0 年代初,i e e ei mc o n f _ o ni m a g eh o c e s s i n g 国 际会议将水印技术列为会议专题,从此数字水印成为热门的研究方向。 一个数字水印算法可分为两个部分:( 1 ) 水印信息的嵌入嵌入时主要有两个问题, 一是生成数字水印,可以是一串伪随机数,也可以是与作者有关的信息经过加密而成; 二是嵌入算法, 白 入的目标是使数字水印在不可见性和鲁棒性之间找4 平衡;( 2 ) 提取 水印信息,检测主要是设计一个相应于嵌入过程的检测算法。检测的结果或是原水印, 或是判断水印是否存在。检测的目标是尽可能使错判与漏判的几率最小。 与传统的数字加密技术相比较而言,数字水印技术拥有以下几个优势和特点:( 1 ) 水印信息直接被嵌入到数字产品内容中,依据水印检测器的输出信息,对内容本身提供 相应的保护;而加密技术只能保证内容的安全传播,不能保护信息内容本身;( 2 ) 水印信 息始终存在于保护的数字产品内容中,对图像、视频内容的信号处理难或完全破坏隐藏 其中的水印信息,水印检测器仍可以检测出水印信息;( 3 ) 水印的嵌入既不能被感知,也 不会影响数字产品的使用;而加密技术会对数字产品内容扰乱,只有在解码密之后,才 能正常使用,故不利于数字图像、视频等数字产品的传播和使用。 目前对水印技术的研究主要集中在水印理论模型、水印结构、水印嵌入策略、水印 检测算法、水印性能评价、水印算法分析及水印的标准化等方向。依据水印信息载体的 不同,对数字水印的研究可以分为图像、视频、音频和文本水印等。近年,还有学者提 硕士论文基于w o r d 文档的数! # 水印算法研究与实现 出了针对软件产品的软件水印等新的数字水印研究领域。关于图像、视频、音频数字水 印方面的研究很多,并取得了很好的研究成果。我国学术界在此领域的研究也非常活跃, 许多研究者做出了很大的贡献。在实现算法上,图像、视频、音频数字水印三者较相似, 主要都是利用各自的冗余信息,利用h v s ( h u m a nv i d e os y s t e m ) 、h a s ( h u m a na u d i o s y s t e m ) 的特点来进行加载数字水印 4 1 。 目前,研究得比较成熟的是图像的信息隐藏,因为图像中存有较大的冗余信息。由 于存在这些冗余信息,研究者可以在图像文件中隐藏大量的机密信息,并不致于引起观 察者怀疑。同样,音频信号中也存在较多的冗余信息,也可以在声音中隐藏信息或嵌入 水印。文本中进行信息隐藏主要是通过改变文本模式或改变文本的某一些基本特征来实 现信息的嵌入。 通常,文本文件都是由字符、行和段落等有规律的结构组成,对其作一些微小的改 动人的肉眼是难以觉察的,也就是说这并不会影响文本的整体形象和使用。目前,提出 的文本数字水印方法并没有能将数字水印嵌入到文本的内容中去,而仅仅停留在文本的 外表,即文本的版面布局上。比如b r a s s i l 、m a x e m c h u k 和l o w 等提出的文本数字水印 的算法思想【5 6 l 是轻微调整文档中的以下结构完成编码,这些结构有垂直移动行距、水 平调整字距、调整文字特性( 如字体等) 。以上的方法都是基于空间域的,抵抗攻击性 并不强,攻击者对字符间距、行间距进行随机处理就可以破坏原来的水印。 国内外已经有许多研究者对数字水印技术进行了大量的研究,但由于文本信号中不 存在冗余,文本中一个比特发生变化,文本就会产生错误,所以数字水印的研究成果主 要集中在静态图像和视频方面。尤其国内有关文本数字水印的研究就更少,仅有的研究 也是仅根据汉字文本的特点对m a x e m c h u k 等人提出的基于格式的方法进行改进,这些 方法在一些正常的操作下就可以完全破坏水印信息。美国有学者已提出基于内容的自然 语言数字水印算法,这对以前所提出的数字水印技术有了一定的改进,实现了将水印信 息嵌入到文本内容中,且鲁棒性较好,但它是以英文语言文本为载体。目前,国内基于 中文语言的水印报道很少。因为与英语相比,汉语具有如下特点:( 1 ) 汉语缺乏狭义的 形态:( 2 ) 语法更灵活;( 3 ) 语义也更灵活。 尽管数字水印技术的研究已有十余年,并取得了较大的发展,然而它还没有为数字 内容进行安全有效地保护。最主要的原因是水印算法的鲁棒性和抗攻击性还未能达到实 际应用的要求。比如,版权保护的水印要求具有很高的安全性,目前的技术还不能满足 很高的要求,而用户对水印技术的期望又过高。也有一些人开始对其能否用于实际的多 媒体内容保护表示质疑。因此目前水印技术领域有待解决的问题主要是设计鲁棒性高、 安全性强的水印算法和系统,以及大容量、低复杂度的水印算法,因此对水印技术的研 究仍非常活跃。国内水印技术的研究起步较晚,力量也薄弱分散。但是越来越多的研究 者开始致力于水印技术的研究与开发。 1 绪论 硕士论文 1 3 本文的主要研究路线 数字水印技术就是通过一定算法将一些标志性信息嵌入到数字产品内容中,要求嵌 入水印后不影响原数字产品的使用价值,且不能被的感官系统觉察,它只有通过特定的 检测器或阅读器才能提取出水印。 对于文本数字水印技术来说,根据不同的嵌入原理和载体形式,文本水印算法可以 分为以下几类:针对普通文本文件的字移、行移水印,二值图像法和针对格式化文档的 字符特征水印。与其他水印技术相类似,每一类文本水印方法,都必将研究以下三方面 内容:水印的不可见性、鲁棒性和嵌入量。不可见性使得攻击者不能觉察到载体含有水 印信息,鲁棒性保证经过软件、人为等攻击后,仍可以恢复出可靠的版权信息。当水印 信息的嵌入量较大时,将会影响水印不可见性和稳健性。若提高不可见性,其办法是降 低嵌入量或嵌入强度。若嵌入强度降低以后,就会影响水印的稳健性、鲁棒性不强。因 此数字水印中的鲁棒性、不可见性、容量三者是相互影响,相互制约的关系。 在文本文档中嵌入数字水印,将文本文档视作二值图像处理,有文献【7 8 】提出了通 过调整文本行间距( 行移编码) 、行内单词间距( 字移编码) 、字符高度( 特征编码) 等嵌入水 印的算法,也有文献【9 】根据汉字字符特征对行移编码和质心检测方法作了改进和简化, 实现了水印盲检测,还有文献【lo 】提出了通过修改句子中单词块的边缘、中心处像素值来 嵌入水印的算法。 文本数字水印可以解决目前许多电子文本版权保护,是一项极有潜力的关键技术。 所以本论文对于中文文本版权及保证隐蔽通信的安全等方面有深远的意义,并有广泛的 应用前景。本论文主要研究基于w o r d 文档的数字水印的算法及其实现,这些研究也 会促进其他一些与自然语言处理有关的领域的发展,例如:数据挖掘、信息抽取以及智 能搜索等。 本论文的研究路线主要是先对现有的技术进行综合的分析和研究,再通过对字移、 行移水印,字体r g b 值变动等水印算法进行了改进实验,并分析其结果,最优调和鲁 棒性、不可见性和容量三者之间的矛盾。 1 4 本论文的主要内容安排 随着计算机和网络的快速发展,许多信息都以文本的方式存储和传输。文本作为一 种重要信息传递的手段,其版权保护问题却疑迫在眉睫。文本数字水印是解决当前大量 电子文本版权保护的一项极有开发潜力的技术。本论文共分5 章,第1 章简要分析了数 字水印技术的基本概念、国内外研究现状和主要应用范围,及论文内容安排。第2 章主 要分析信息隐藏基本概念与通用模型,数字水印技术特点、分类、主要研究方法,文本 数字水印的研究意义,主要研究方法。第3 章重点研究改进型行移水印算法及其实现。 4 硕士论文 基于w o r d 文档的数字水印算法研究与实现 改进型的行移水印算法通过计算和判断文本行间距,并利用正弦波的周期性规律嵌入水 印信息。与前人提出的方法相比较,改进型行移算法计算量少,水印嵌入时只需判断计 算行间距,不要计算重心,并利用正弦波自适应的嵌入水印,实现水印盲提取。实验结 果表明:该算法很好的实现了水印的嵌入和检测,并对传统攻击有着较好的鲁棒性。第 4 章重点研究了修改文本块中不同字符的字体r g b 值,将水印以正弦波的特征形式嵌 入文本中检测时通过提取字体颜色特征,重构正弦波来鉴定文档。实验结果表明:该算 法实现的水印具有较好的视觉透明性和检错能力。第5 章对本文进行了总结,对文本数 字水印发展进行了展望。 2 数字水印技术综述 硕士论文 2 数字水印技术文献综述 2 1 引言 1 9 9 0 年,t a n a k a 等人提出了把一些隐秘信息加入图像中用来确认图像版权的思路。 随后,于1 9 9 3 年t d k e l 等首先明确地定义“水印 ,并较详细地描述了利用嵌入的数字 水印来实现版权保护的方法。从此,数字水印技术逐渐成为信息与网络时代实现数字产 品版权保护的有效手段。 简言之,数字水印技术就是在原始数字产品内容( 例如图像、声音、视频、文档等) 中嵌入的一些不可轻易去除的版权标识信息。它与钞票中的水印相类似,是嵌入数字产 品中的版权标识,用以证实该数字产品的版权归属。数字水印可以分为不可见水印和可 见水印两种,通常我们所说的数字水印主要是指不可见水印,而这些不可见的水印并不 会影响载体数据的正常使用。 上世纪9 0 年代,研究者对各种数字水印技术的研究主要集中于图像、视频和音频 等数字媒体,这是因为有大量的图像和视频产品需要进行版权保护。而文本数字水印的 研究却很少,如在文本、数据库、程序代码等中的应用。嵌入水印的方法被用在各种版 权所有者的身份鉴定中,也可向录制设备发指令携带水印的内容不能被录制。 目前,数字水印技术己经初步形成了一些基本的理论框架,但仍处于发展阶段,理 论上看也还不够成熟。但是数字水印技术作为- i - j 交叉的新兴学科,可以借鉴其它学科 的理论知识来逐步形成并完善自己的理论体系,在越来越多的领用有成功的应用。数字 水印技术源于信息隐藏技术,并与之密切联系。因此本章将先简单介绍信息隐藏的基本 概念、分类和应用,然后从数字水印的基本原理、方法、特点等方面进行了综合的论述, 最后较为深入地分析和研究文本数字水印的基本方法,并分析了它存在一些局限性。 2 2 信息隐藏简介 用密码技术将明文进行加密后成密文,攻击者就不能看懂,因而可以阻止机密信息 的泄露。然而,现今的互联网上,看不懂的密文乱码却无疑成了“此处有机密信息”的 标签,攻击者完全可以截取密文,并对其进行破译获得机密信息。为了机密信息的安全, 研究者重新采用以柔克刚的思路运用古老的信息隐藏技术,并在其基础上进行改进,不 至于引起攻击者的注意,起到迷惑的作用。 2 2 1 信息隐藏的一些概念及模型 信息隐藏就是把一些机密信息秘密地隐藏在公开信息中,再通过公开信息的传输来 传递隐藏的机密信息。公开信息的形式有多种多样,比如图像、音频、视频和文本等【1 1 1 。 6 硕士论文 基于w o r d 文档的数字水印算法研究与实现 加密后的通信有可能被监测者或非法者截取,再对其进行破译,或将密文破坏再发 送,因此影响到机密信息的安全性。而对信息隐藏而言,监测者或非法拦截者则很难判 断传输的公开信息中是否有机密信息,进而也很难破译机密信息,这样就可以保证机密 信息的安全。在多媒体信息技术的快速发展的同时,也为信息隐藏技术的发展提供更大 的发展潜力。 通常,需要隐藏的信息称为秘密信息,它可以是有关版权的信息或一些秘密的数据, 也可以是序列号;而公开信息则称为载体信息,如图像、视频、音频、文档等。这种信 息隐藏过程一般需要密钥来进行控制,首先通过嵌入算法将秘密信息隐藏于载体信息中 并生成密钥,再通过通信信道传递隐藏有秘密信息的公开信息,最后通过检测器和密钥 从载体中提取出秘密信息。信息隐藏的一般模型如图2 1 所示。 图2 1 信息隐藏技术的一般模型 信息隐藏技术主要由以下两个部分组成:( 1 ) 利用密钥来实现秘密信息的隐藏;( 2 ) 通过检测器利用密钥从隐秘载体中检测提取出秘密信息。在未知密钥的情况下,攻击者 难以从隐秘载体中获得、去除甚至察觉秘密信息。 2 2 2 信息隐藏技术的分类 信息隐藏技术的主要应用领域有隐写术、隐蔽通信、版权标记技术和匿名技术,王 丽娜等【1 2 】对信息隐藏技术进行了分类,见图2 2 所示。 图2 2 信息隐藏技术分类 7 2 数字水印技术综述 硕士论文 从图2 2 可知,数字水印是信息隐藏的一个非常重要的分支。数字水印技术就是利 用一定的算法将特殊的标识嵌入到数字产品( 比如图像、声音、文档、图书、视频等) 中,用以鉴定数字产品的版权,并作起诉非法侵权行为的有力证据。同时要求能够顺利 地对数字水印进行检测与分析,用以确保版权信息的完整可靠,成为版权保护和数字产 品防伪的一种行之有效的方法。 信息隐藏学是一门在通讯、计算机、保密学等多个领域有着广泛应用的新兴交叉学 科。数字水印技术在数字产品领域的应用也越来越受到人们广泛的关注与研究。 2 3 数字水印技术简介 数字水印要求其具有不可见性,即要求嵌入水印的数据与原始数据相比较,既不能 被人们察觉到有差异,也不应该使原始数据质量大大下降。另外,数字水印还要求具有 良好的鲁棒性,也就是说要具有良好的抵抗非法攻击的能力。 现今人们越来越广泛关注数字产品版权的保护问题,数字水印也己经成为信息隐藏 技术的一个极其重要分支,正逐步成为一个数字产品的版权保护问题很有潜力的解决方 案之一。数字水印除了具有信息隐藏技术的一般特点以外,还有其本身固有的特点和研 究方法。信息隐藏的目的是传递秘密信息,而数字水印技术的目的是保护隐秘的信息载 体。 2 3 1 数字水印的通用模型 数字水印的通用模型可以分为水印嵌入和水印检测两个部分: ( 1 ) 水印嵌入 水印嵌入时要解决的主要问题有两个。第一个是生成数字水印,它可以是一串伪随 机数,也可以是与作者信息有关的一些字符串、图标等经过加密产生;第二个是嵌入算 法,其目标是使得数字水印在不可见性和鲁棒性之间找到一个较好的平衡。水印嵌入要 系统输入的是数字水印、载体数据和一个可选的公钥或私钥。水印也可以是任意形式的 数据,比如数值、文本、图像等。密钥用来加强其安全性,可以防止未经授权的第三方 恢复或篡改水印;水印嵌入系统的输出称为加入了数字水印的数据,即隐秘载体。如图 2 3 所示。 8 图2 3 通用数字水印的嵌入模型 硕士论文基于w o r d 文档的数字水印算法研究与实现 ( 2 ) 水印检测 水印检测时主要是要设计一个与嵌入算法相适应的检测算法。检测时输入是已经嵌 入水印的数据、公钥或私钥、原始水印或原始载体。输出的结果是数字水印,或是某种 可信度值,表明了所检测的数据中是否存在给定水印或是其存在的可能性有多大。如图 2 4 所示。 ( 盲检测时不需要原始载体) 图2 4 通用数字水印的检测模型 在水印的嵌入和检测过程中,需要考虑嵌入水印的宿主信息在经过一些无意的或恶 意的攻击后,在宿主信息的使用价值没有受到大的影响时,水印仍然可以安全地被提取 出来。因此,数字水印的研究目标不单是提出一些新的算法,而且要求宿主信息在经过 各种攻击后水印仍然存在并能被正确地提取出来。 2 3 2 数字水印的主要特点 数字水印技术发展的主要目标是为数字作品提供有效的版权保护,随后研究者们又 发现数字水印在其它一些领域还具有潜在的应用,比如隐秘的网络通信、隐蔽的一些标 示和数字产品的防伪鉴定等。在不同的应用领域,对数字水印的要求也各不相同,通常 认为数字水印应该具有以下几个主要的特点【1 3 1 : ( 1 ) 不可检测性 不可检测性是指原始载体与隐秘载体应该具有一些相同的特征,若两者的统计噪声 分布相同,这样非法拦截者就不能以统计噪音分布情况来判断是否存在有隐蔽信息,从 而可以骗过非法拦截者。 但) 鲁棒性 鲁棒性是指数字水印在经过常规的信号处理或操作后,仍然可以检测提取到数字水 印。常规的信号处理可以是滤波、信道噪声、a d 与d a 的转换、剪切、重采样、尺度 变化、位移以及有损压缩编码等操作中的一种或几种。也就是说,数字水印在经历某一 系列攻击操作后,仍然可以较好地保存隐藏的数字水印,若攻击者将数字水印去除,这 9 2 数字水印技术综述硕士论文 又将会明显降低数字作品的质量,甚至严重破坏数字作品质量以致不能使用。 ( 3 ) 不可见性 不可见性是指水印嵌入后的载体数据没有出现明显的质量下降现象,且要求数字水 印应该不容易被人感知到它的存在。这也就是说,一方面要求数字水印视觉上的不可见 性,即存在的数字水印不应该影响被保护的数字信息的正常使用;另一方面要求数字水 印的统计方法也不能被恢复,比如对许多用同样的处理方法嵌入过水印的数字信息,即 使用统计方法也不能提取隐藏的水印或判断载体信息中是否存在隐藏的水印。 ( 4 ) 容量 容量是指嵌入的水印信息要能够表达数字作品所有人的标志信息,或是购买者的序 列号信息等。版权纠纷时,足够的水印信息有利于使数字产品拥有者或购买者的合法权 益得到有效的保护。 ( 5 ) 安全性 安全性是指要求具有很强的抗攻击性的嵌入算法。嵌入水印和提取水印的方法对未 经授权的他方是绝对保密的,且不可被非法者轻易地破坏。 2 3 3 数字水印的分类方法 目前数字水印的分类方法比较多,常见的分类方法主要有以下五种: ( 1 ) 以嵌入效果分类 以嵌入效果分类,数字水印通常可以分为可见水印和不可见水印两种。可见水印其 主要作用是在于清楚地标识出版权信息,防止非授权者非法使用该数字作品。而不可见 水印是一种应用前景非常广泛的水印,在其表面上并不能觉察到水印的存在,一旦数字 产品发生版权纠纷的时候,不可见水印就可以作为有效的证据对版权所有者的权益进行 依法保护。 ( 2 ) 以加载方式分类 以加载方式分类,数字水印通常可以分为变换域数字水印和空域数字水印。变换域 数字水印主要包括w a v e l e t 变换、d c t 变换、f o u r i e r 变换和分形等其它变换域法; 空域数字水印主要包括p a t c h w o r k 法、结构微调法、最低有效位法( 即l s b 方法) 和纹理块映射编码法等。现在,研究者基本认为鲁棒性较好的是变换域水印。 ( 3 ) 以提取过程分类 以提取过程分类,数字水印可以分为盲水印和非盲水印。盲水印一般只需要密钥就 可以检测提取,而非盲水印则需要提供原始的水印和原始的数据,再进行检测提取。通 常,非盲水印与盲水印比较,前者的鲁棒性较强,遗憾的是前者的存储成本较高而使其 应用受到限制,故现在数字水印数基本上都是盲水印。 ( 4 ) 以健壮性分类 1 0 硕士论文基于w o r d 文档的数字水印算法研究与实现 数字水印可以分为鲁棒性水印和脆弱性水印两种。鲁棒性水印就是说在数字作品中 隐藏版权等信息,它要求水印能够经受住各种各样的编辑;而脆弱性水印就是主要对数 字产品是否被篡改进行鉴定保护,这也就要求它对任何改动的信号都必须极其敏感,检 测时,再从脆弱性水印的状态来判断数字作品先前是否被改动。 ( 5 ) 以附载体分类 以附载体进行分类,数字水印又可以分为音频数字水印、视频数字水印、图像数字 水印、软件数字水印、数据库数字水印、文本数字水印、网页数字水印和电子邮件数字 水印等等。 2 3 4 数字水印的应用前景 数字水印技术具有非常好的应用潜力,它的主要优点有以下几个方面:首先是数字 水印不可被观察者觉察,但也不影响观察者的视觉质量;其次是即使在数字内容受到处 理操作或格式变换的条件下,数字水印一直存在于数字作品中,而在文件头的数据区域 加入的一些附加信息可以被轻松的去除,特别是在文件格式变换的时候;最后是数字作 品内容在受到处理操作后,数字水印也同样受到相同操作,这就可以通过检测数字水印 信号的变化来获得数字作品内容同样的操作处理情况。也正是因为以上的三大特点使得 数字水印技术在数字产品保护及相关领域的应用具有非常好的潜力。数字水印技术主要 在以下领域有较好的应用前景: ( 1 ) 版权保护 数字作品的拥有者利用密钥产生一个数字水印,然后将水印嵌入到原始数据中,再 公开发布带有水印的数字作品。一旦该数字作品出现版权纠纷问题时,版权所有者可以 利用盗版作品或者水印作品中获取的数字水印作为版权拥有证据,从而可以有效地保护 所有者的权益。这时要求嵌入的水印要有很好的安全性、稳健性、透明性和不可逆性。 ( 2 ) 标题与注释 将数字作品的标题和注释等内容以水印形式嵌入作品中。这种隐式注释水印不容易 丢失。 ( 3 ) 图像认证 图像认证的主要目的是检对图像数据是否被改动。此时,使用易碎水印来实现图像 的认证,易碎水印对一些变换( 如格式变化、图像压缩等) 的稳健性很低。在所有数字水 印中,认证水印的稳健性要求是最低级别的。 ( 4 ) 保护控制 在数字作品发行过程中,通常不允许未授权的第三方拷贝作品。可以用数字水印来 说明作品的拷贝情况,例如d v d 防拷贝系统,d v d 播放器不允许播放或拷贝带有“禁 止拷贝”水印的作品,带有“仅一次拷贝”水印的作品可被复制一次,但不允许再此复制。 2 数字水印技术综述硕士论文 目前世界上需要著名的公司都在加快数字水印技术的研究,以此来保护其发行的数字作 品。 ( 5 ) 篡改提示 当一些数字作品被用于一些特殊情况( 如法庭、医学、新闻以及商业) 时,通常需 要确定这些作品的内容是否被改动或处理过。为此常常将原始图像分成若干个独立单元 块,每个单元块嵌入各不相同的水印。通过检测每个单元数据块中的水印来确定该作品 是否被修改或处理过。通常要求这类水印的稳健性必须是非常脆弱的,且不需要提供原 始数据就可以进行检测。 2 4 文本数字水印概述 随着商务、政务电子信息化的快速发展,企事业单位、党政机关等相关部门将处理 大量的电子文字资料,其中一些涉及个人隐私、商业机密等非常重要的文件,有时它们 需要通过网络进行传输。保证这些文本信息的传输安全是非常重要的。因此,对文本数 字水印的研究有助于保护这些文本信息网络传输的安全性和其版权问题。 文本数字水印技术就是将版权人身份的重要信息嵌入电子出版物中,在发生版权纠 纷时,通过提取出嵌入的数字水印,从而可以验证该出版物的版权归属问题,确保数字 作品所有权人的合法利益,有效防止盗版。 总的来说,文本可以分成三大类:( 1 ) 以a s c i i 码表示其内容的文档,它使用某种 语言描述其内容及风格;( 2 ) 以像素点阵描述文档内容的图像,也就是说每页文档用一 个图像表示;( 3 ) 纯文本文件和计算机源码文件,比如纯文本、w o r d 文档、w 曲页等【l 4 1 。 2 4 1 文本数字水印的研究意义 尽管数字水印可以应用在许多类型的多媒体数据( 包括文本、图像、声音以及视频) 中,但目前大部分数字水印技术的研究都与图像、音频、视频等数据的保护相关,而数 字水印在文本上的应用却非常少。 文本数字水印是数字水印的一个重要分支,它是通过一些特殊的方式将隐秘信息嵌 入到文本文档中,但在视觉上不会对文本的使用造成较大的影响,因此可达到隐藏信息 的目的。因为有大量的图像、声音和视频产品急需要加以保护,所以造成对文本数字水 印的研究非常少。此外,文本的冗余空间较少,这也使得文本数字水印的研究难度相对 增加。 近来,随着计算机和网络技术的快速进步,许多很有创意的作品都是以文本的形式 进行存储和传输,数字电子图书馆与档案馆也以电子文本形式保存了非常多的需要版权 保护的作品,另外,电子商务、电子政务同样也需要传输许多电子文档。实际上,文本 文档作为一种重要的信息传递方式,目前其应用范围非常广。一些纸张文档比图像、音 1 2 硕士论文基于w o r d 文档的数字水印算法研究与实现 频、视频等数据更重要,比如合同、支票、遗嘱、证明和契约等。可预
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 投标部合同管理办法
- 月报告制度管理办法
- 新媒体通联管理办法
- 小区停车卡管理办法
- 学生转班级管理办法
- 审议管理办法引导语
- 新停车收费管理办法
- 学校运营商管理办法
- 商务座服务管理办法
- 新员工班级管理办法
- 省级高技能人才培训基地建设项目申报书填写要求【模板】
- 试生产前安全审查(吴祥林)课件
- 2022年浙江省东阳市教师城乡选调《教育基础知识》试卷及标准答案【含解析】
- MT 285-1992缝管锚杆
- GB/T 3522-1983优质碳素结构钢冷轧钢带
- 检验科临床基因扩增实验室质量手册
- 正性肌力药及血管扩张药血管活性药在心血管手术中的应用课件
- 南昌市红谷滩区街道社区行政村统计表
- 单位工程质量评估报告范本
- T-SDDA 0002-2021 住宅装饰装修工程质量验收标准
- DB32-T 3153-2016公路桥梁伸缩装置病害评定技术标准-(高清现行)
评论
0/150
提交评论