(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf_第1页
(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf_第2页
(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf_第3页
(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf_第4页
(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(信号与信息处理专业论文)基于模糊聚类理论的文本水印算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆大学硕士学位论文中文摘要 摘要 计算机和网络的飞速发展,将人类带入信息文明时代。人们随时随地都能接 收到包括视频、图像、声音、文字等形式的各种媒体信息。其中由语言文字组成 的文本以其精确表达、蕴含信息量大、灵活阅读、可快速检索等特点,成为人类 最广泛应用的信息媒体形式之一。比如,人们每天接触到的法律文书、政府公文、 电子文档、网络新闻、论坛、博客等都是文本。文本是人类信息交流的重要的载 体形式。随着文本的广泛使用,文本的版权保护问题也日益凸现。 文本数字水印技术是解决此问题的方法之一。2 0 世纪9 0 年代初,将版权信息 嵌入文本文件中来确认版权归属的技术逐渐发展起来。但是受文本文件本身结构 单一、处理手段特殊等特点的限制,文本水印的成果相对较少。同时,既然可以 在文本文件中嵌入水印,那么也可以利用此性质,将秘密信息嵌入其中来传递。 这样就涉及到比版权确认更重要的问题国家信息安全。首先,研究文本数字 水印技术,用这项技术来审查可疑文本文件,可以及时截获和破解来自外部的秘 密信息,阻止国内涉密信息通过此渠道向外传递:其次,可以利用此项技术来传 送自己的涉密信息。因此,对文本数字水印的研究显得尤为迫切和重要。 本文利用模糊聚类理论,建立选择水印载体汉字的数学模型,提出一种基于 此理论的文本数字水印算法。该算法取汉字的使用频率、笔画数和汉字在文本中 的分散均匀度三分量构造成的特征向量作为模糊聚类分析的原始数据。一个文本 中,某些汉字会被多次重复使用,选择使用频率高的汉字,提高水印的容量;选 择那些在文本中分布均匀度高的汉字,使水印均匀分散到文本中,文本受到攻击 时,水印损失小;选择笔画少的汉字,这类汉字一般比较瘦小,微调其字符宽度, 保真度好。水印嵌入前,原始水印编码用m 序列伪随机排序的方法作置乱处理,然 后用微调汉字宽度的方式嵌入水印编码,用微调汉字r g b 值的方式,将编码汉字 每1 6 个标记为一组,而且编码具有一定的自纠错功能,在载体汉字部分丢失的情 况下可以完全恢复水印。提取水印时,根据水印的各种可能攻击方式,分别设定 水印提取的判定条件,使水印在某些破坏条件下可以完全恢复,某些条件下能部 分恢复。最后对这种水印算法做了格式变换、删除、添加、替换攻击实验,与其 他一些水印算法比较表明,该算法的鲁棒性、保真度较好,容量较大。 关键词:模糊聚类,文本水印,笔画数,频率,分布均匀度 重庆大学硕士学位论文 英文摘要 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e ra n dn e t w o r k ,h u m a nw a l k si n t ot h e i n f o r m a t i o na g e h u m a nc a nr e c e i v ev a r i o u sm e d i af o r m so fi n f o r m a t i o ns u c ha sv i d e o , i m a g e s ,s o u n d s ,a n dt e x te v e r ym o m e n t i nt h ee x a c te x p r e s s i o n ,c o n t a i n sl a r g ea m o u n t o fi n f o r m a t i o na n df l e x i b l er e a d i n g ,t h ec h a r a c t e r i s t i c so ft h er a p i dr e t r i e v a l ,t e x t b e c o m et h em o s tw i d e l yu s e dm e d i af o r m so fi n f o r m a t i o nb e c a u s ei t c a ne x a c t e x p r e s s i o n ,c o n t a i n sl a r g ea m o u n to fi n f o r m a t i o n , f l e x i b l er e a d i n ga n dr a p i dr e t r i e v a l f o re x a m p l e ,l e g a ld o c u m e n t s ,t h eg o v e m m e n to f f i c i a ld o c u m e n t s ,e l e c t r o n i cd o c u m e n t , n e t w o r kn e w s b b sa n db l o ga l la r et e x t t e :x th a sb e c o m et h en e wi m p o r t a n tc a r t i e ro f h u m a nc o m m u n i c a t i o n w i t ht h ew i d eu s eo ft e x t ,i t sc o p y r i g h tp r o t e c t i o ni sb e c o m i n g m o r ea n dm o r ei m p o r t a n t t e x td i g i t a lw a t e r m a r k i n gt e c h n o l o g yi so n eo ft h ew a y st os o l v et h i sp r o b l e m t h e t e c h n o l o g y t h a te m b e d d e dc o p y r i g h ti n f o r m a t i o ni nt h et e x tf i l et oc o n _ f i r mt h e o w n e r s h i po ft h ec o p y r i g h te v o l v e d t e x tw a t e r m a r kr e s u l t sr e l a t i v e l ys m a l lb e c a u s e t e x tf i l eh a st h ec h a r a c t e r i s t i c so fs i n g l es t r u c t u r ea n ds p e c i a lp r o c e s s i n gm e t h o d w a t e r m a r kc a nb ee m b e d d e di nt e x tf i l e s ,s os e c r e ti n f o r m a t i o nc a nb ee m b e d d e di nt e x t f i l e st o o t h i si n v o l v e sm o r ei m p o r t a n tp r o b l e mt h a nc o p y r i g h tc o n f i r m 一一n a t i o n a l s e c u r i t y f i r s t ,w ec a nu s et h et e x td i g i t a lw a t e r m a r k i n gt e c h n o l o g y t or e v i e ws u s p i c i o u s t e x tf i l e s ,i n t e r c e p t e da n dc r a c ks e c r e ti n f o r m a t i o nc o m ef r o mo u t s i d et i m e l y , s t o pt h e i n f o r m a t i o nh a n d l e dt h r o u g ht h i sc h a n n e lf r o mh o m et ot h er e l a y s e c o n d ,w ec a nu s e t h i st e c h n o l o g yt ot r a n s m i tc o n f i d e n t i a li n f o r m a t i o n t h e r e f o r e ,t h es t u d yo ft e x td i g i t a l w a t e r m a r ki sp a r t i c u l a r l yu r g e n ta n di m p o r t a n t t h i sp a p e re s t a b l i s h e sac l u s t e r i n gm o d e lu s i n gc h i n e s ec h a r a c t e r i s t i c si nt e x t d o c u m e n ta si t sv a r i a b l e ,b a s e do nf u z z yc l u s t e r i n gt h e o r y t h ea l g o r i t h mc h o o s e st h e c h i n e s ec h a r a c t e r so fl e s ss t r o k en u m b e r , h i g h e rf r e q u e n c ya n dh i g h e rd i s t r i b u t i o n u n i f o r m i t yc o m p o s ef e a t u r ev e c t o ra st h eo r i g i n a ld a t ao ff u z z yc l u s t e r i n ga n a l y s i s i na t e x t ,w es e l e c th i g h e rf r e q u e n c yc h i n e s ec h a r a c t e r si no r d e rt oi m p r o v et h ec a p a c i t yo f t h ew a t e r m a r k ,s e l e c th i g h e rd i s t r i b u t i o nu n i f o r m i t yc h i n e s ec h a r a c t e r s i no r d e rt o r e d u c ew a t e r m a r k sa t t a c kd a m a g e ,a n ds e l e c tl e s ss t r o k en u m b e rc h i n e s ec h a r a c t e r s ,i t i sr e l a t i v e l yt h i n n e ra n dh a sg o o dv i s u a ln o tv i s i b l ew h e nf i n e - t u n i n gi t sc h a r a c t e rw i d t h b e f o r ew a t e r m a r k i n ge m b e d ,t h eo r i g i n a li m a g ec o d i n gu s em s e r i e sp s e u d or a n d o m s o r tt os c r a m b l i n g t h e n ,w ee m b e d d e dw a t e r m a r kc o d i n gb yf i n e - t u n i n gc h i n e s e i i c h a r a c t e rw i d t ha n de v e r y16c o d i n gc h a r a c t e r st a g sf o rag r o u pb yf i n e - t t m i n g 廿l e c h i n :e s ec h a r a 沌e r sr g bv a l u e 。t h ec o d i n gh a sc e r t a i na u t o n o m o u se r r o rc o r r e c t i o n 凡n c t i o n w 1 1 e nt h ec a r r i e rc h i n e s ec h a r a c t e r sl o s tp a r tt h ew a t e r m a r kc a l lb ef u l l y r e s t o r e w er e s p e c t i v e l ys e tt h ej u d g m e n to ft h e w a t e r m a r ke x t r a c t i o nb yt h e w a t e r m a r k - sv a r i o u sa t t a c kw a y s ,i tm a k et h ew a t e r m a r kc a nf u l l yr e c o v e ri n s o m e d a m a g ec o n d i t i o na n dp a r t l yr e c o v e ri no t h e rd a m a g ec o n d i t i o n e x p e r i m e n t a lr e s u l t s d e m o n s t | 疵t l l ee f f e c t i v e n e s so ft h ea l g o r i t h ma g a i n s tp a r t i a ld e l e t i n g ,a d d i n g ,a n d f o r m a ta d j u s t i n go ft e x t t h ea l g o r i t h mh a sg o o dc o n c e a l m e n t ,w e l ln ov i s i b i l i t y , a n d b i g g e rc a p a c i t y a c c o r d i n gt oh u m a nv i s u a ls y s t e m ,i tc l a s s i f i e s t h ec h i n e s ec h a r a c t e r si nt e x t d o c u m e n t sb vt h e i rc h a r a c t e r so fs t r o k en u m b e r , f r e q u e n c ya n dd i s t r i b u t i o nu n i f o r m i t y t h e ni tc h o o s e st h ec h i n e s ec h a r a c t e r so fl e s ss t r o k en u m b e r , m o r ef r e q u e n c ya n d h i g h e rd i s t r i b u t i o nu n i f o r m i t yt ob ee m b e d d e d e x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h e e f f e c t i v e n e s so ft h ea l g o r i t h ma g a i n s tp a r t i a ld e l e t i n g ,a d d i n g ,a n df o r m a ta d j u s t i n go f t e x t t h ea l g o r i t h mh a sg o o dc o n c e a l m e n t k e yw o r d s :f u z z yc l u s t e r i n g ,t e x td i g i t a lw a t e r m a r k i n g ,s t r o k en u m b e r , f r e q u e n c y , d i s t r i b u t i o nu n i f o r m i t y i i i 重庆大学硕士学位论文1 绪论 1 绪论 1 1 课题的提出背景 当今世界是信息时代,获取信息已经成为社会各行各业发展的重要条件之一, 信息技术广泛地渗透和影响着人类的学习、工作和生活。作为科研工作者,在搞 课题开发时,只有获取相关领域的最新发展动态,才能为自己的研究确定准确的 方向;在军事行动上,只有知己知彼,才能百战百胜。 信息如此重要,获取信息主要有以下途径: 个人信息源:直接走访信息相关人; 电子信息源:电视、网站; 文献型信息源:报纸、杂志、书籍; 现场型信息源:现场观察。 由信息获取途径分析,可以得出,信息大致有音频、视频、图像、文本等媒 体存在形式。音频信息能被人理解,归根到底,它是某种语言的表达,如果没有 相应的语言作支撑,音频将毫无意义;视频包含动态图像和音频,其中音频起到 了提醒解释的作用,图像使表达更加形象生动,如果视频中没有音频,只有图像, 或许人根本不能正确理解视频旁表达的准确意思;图像带来的信息形象,但是没 有文字配合说明,同样将使人难以理解;而文字可以清楚准确地表达意图。因此, 国家的法律文书、各种公文、科研论文等都是以文本的形式存在。音频、视频、 图像这些媒体形式只作为它的补充形式,应用在宣传、解说、教学等方面。 与其他几种媒体形式比较,文本除了能精确表达意思之外,还有以下优点: 信息量大,易于阅读、携带,可以让读者自由发挥自己的想象力 几百页的一本书,可以将一个朝代的历史交代清楚,可以讲述一段神奇的故 事,可以将一个深奥的科学理论阐述清楚。文本文件贮存为电子文档,与其他媒 体形式相比,占用空间小。文本印装出书,携带方便,不需要任何其它设备就可 以阅读。文本阅读过程,读者还可以发挥自己丰富的想象力,而将一个文本描述 的东西拍摄为视频,则是别人对文本本身理解之后,编制出来的,禁锢了人们的 想象力发挥。 可以多样性阅读获取信息 如果要从视频、声音、图像获取信息,就得按部就班地看或者听,中间的些 许跳跃,或许就遗漏了重要的信息;但是对文本而言,可以采取的阅读方式有浏 览、跳读、精读,还可以在书上标注重点,感兴趣的地方写上自己的心得体会或 重庆大学硕士学位论文 1 绪论 者提出自己的不同见解。 快速检索 文本具有快速检索的功能,读者可以很方便地找到自己感兴趣的语句,提高 信息获取的效率。 文本这种媒体形式在人们工作、学习、娱乐等方面占据举足轻重的地位,那 么,与其他媒体形式比较,它的使用量和使用率也是最高的。2 0 世纪末2 1 世纪初, 文本水印研究的理论和实践逐渐地出现,如b r a s s i lj 等提出了一种用于版权保护的 文本水印 。在文本中嵌入水印,可以作版权认证。此外,文本水印技术也可以用 来传递秘密信息,利用这项技术,一方面可以为作为秘密信息传递的一种方式, 另一方面,也可以用来检测文本文件是否携带秘密信息。所以,研究文本水印技 术是很有必要的。 1 2 国内外研究的现状 数字水印技术的研究兴起于上世纪9 0 年代初,文本数字水印是数字水印的分 支之一,数字水印的理论适用文本水印,同时,根据文本自身的特点,还有其独 特的水印嵌入提取方式。 o g o r m a nl 等申请了一个利用行移和词移的方法在文本中嵌入水印的专利 【2 】,用来保护版权。它分发给用户的每一个电子文本,都赋予一个特定的识别码, 将这个识别码用文本行移和词移的方法嵌入,根据提取到的用户文本中的识别码 来确认使用者的合法性。 b o r g e s 等提出了一种利用彩色调制方法在文本中嵌入水印的方法【3 】。它对假定 的一个打印和扫描信道模型,提出了针对文本色彩调制的检测度量的标准和分析 错检率的方法。此外,它还利用一个感性碰撞模型去评估一个嵌入水印和未迁入 水印的字符的之间的感性差异。然后综合考虑感性分析模型和检错率分析的结果, 确定最适颜色调制的值。 q a d i rma 等【4 】为了保护文本的完整性特征,通过对文本内容、作者、文本特 征的分析,生成文本的数字签名,然后用不可见编码的方法将数字签名嵌入文本 中,取得了较好的效果。 l o wsh t 5 】等提出一种质心检测的方法提取水印,对采用行移方法嵌入的水印 检出率较高,文本即使经过打印、扫描、传真等攻击,依然可以检出水印。 m a x e m c h u knf 采用行尾添加空格等不可见编码的方式在文本中添加水印, 水印的提取依据行末不可见编码的有无和数目解码【6 】。这种方法鲁棒性差,水印容 量有限,而且隐蔽性不强。 b a r a n bb 等【7 】基于格式文档特征编码的思路,提出利用数字印章在文本中嵌入 2 重庆大学硕士学位论文1 绪论 水印或传递保密信息的方法,根据这种技术,开发出了商用的软件。该软件适应 性强,可以在多种文件格式下使用,还可以根据需求使嵌入的水印可见或不可见。 赵东宁等提出了基于云模型的文本数字水印技术 8 】。它针对文本的特点,将行 移、字移的模糊性和随机性有机结合在一起,实验分析表明,该水印技术对数字 文本的版权保护有一定的实际应用价值。 上述水印嵌入的思路,均不改变原文的内容,只对原文作结构性调整,比如 采取字移、行移、特征编码等改变文本格式的方法,不能抵抗录入、格式重排等 攻击,鲁棒性较差。优点是可见性好。 姜传贤等【9 】针对法律或军事领域在使用文本文件时必须要求真实性的要求,提 出一种鲁棒可逆文本水印算法。根据0 1 水印序列和同义词替换评价模型,将水印 有选择地嵌入到原始文本中。文中投票原则的使用,提高了水印的鲁棒性并降低 了误检率,只有拥有密钥和其他秘密参数的用户才能完全恢复原始数据。仿真结 果表明,采用该算法嵌入的水印具保真度和鲁棒性较好。 j a i n a m i t 提出一种基于x m l 文件格式的文本数字水印i l ,它合理利用x m l 文件的规则,在不改变文件既定功能的情况下,通过改变文件语法结构或逻辑结 构来嵌入水印。这种水印嵌入方法保真度好,鲁棒性较强。它的缺点是应用面窄, 只适用于x m l 文件。 v y b o m o v ao 等提出了一种基于自然语言的文本水印技术【1 1 1 。其基本思路是通 过对文本句子的语法结构或语义结构转换来嵌入水印信息。它利用转换句子语法 结构不会改变句子语义结构的性质,将基于语法的水印算法和基于语义的水印算 法有机结合,提高自然语言文本水印嵌入容量。这种算法鲁棒性好,保真度强。 但是由于自然语言语义复杂,表达方式灵活多变,基于自然语言的文本水印算法 理论有待完善。 1 3 课题的研究内容及结构 本文主要提出了一种基于模糊聚类理论文本水印的算法,根据模糊聚类理论 建立了从文本中选择水印载体文字的模型,对原始水印的编码作为随即排序后, 嵌入载体文字中;嵌入算法中,采用一种特殊编码方式,编码两两关联,保证互 相关联的两个载体文字缺其一时,水印可以完全恢复;最后用一个水印嵌入提取 的实验系统地演示了水印算法的全过程,实验结果和理论分析一致。 全文分为五章: 第一章是绪论,主要阐述了课题研究的背景和国内外研究的现状。 第二章是数字水印技术的概述,从发展历史、分类、基本特征、水印模型、 评价分析指标等方面对数字水印的相关知识作了介绍,又从文本载体特征、文本 重庆大学硕士学位论文1 绪论 水印的算法、对文本水印存在的不足和发展方向以及文本水印与涉密信息安全等 方面做了论述。 第三章是本文的重点,从认识模糊数学和聚类分析理论入手,最终提出一种 基于模糊聚类理论的文本数字水印算法模型,从理论上详细地论述了这种算法关 于载体文字选择、水印编码、水印嵌入、水印提取的全过程。 第四章是本文提出的水印算法的实验部分和实验结果分析的内容。用完整的 实验过程和结果分析,证明了该算法的可行性。 第五章结束语,是对全文工作的总结和后续工作的展望。 4 重庆大学硕士学位论文 2 数字水印技术概述 2 数字水印技术概述 “科学技术是第一生产力”,科学技术的发展进步在人类社会的发展进步中起着 主导性的作用。人类从茹毛饮血的渔猎时代经历封建社会的农耕文明以及资本主 义社会的工业文明时代如今已经进入高度信息化的信息时代。信息化的发展,使 人类社会的发展效率飞速提高,随之使社会发展的效益也得到提高。随着信息化 的日益发展,窃取信息资源、虚假信息传播等问题频频发生,信息安全越来越受 到人们的关注,信息安全保障成为全球关注的焦点。 信息化的发展突出表现是:信息传递网络化以及信息资源数字化的普及。信 息资源的数字化,使得信息的可以方便准确地存取和复制。网络的普及,为信息 的交流和传播提供了便捷的途径。但随之也带来了严重的问题,如数字作品( 图 像、音频、视频、文本等) 侵权、篡改、剽窃以及泄露涉密信息等都变得相当容 易,只需轻点鼠标就可能完成。为了保护数字产品的所有权,保证数字作品的安 全性( 真实性和完整性) ,保护用户的私密信息,数字水印这项新的技术应运而生。 数字水印( d i g i t a lw a t e r m a r k i n g ) 是一种信息隐藏技术,它的基本思想是在数 字产品( 图像、音频、视频、文本等) 中嵌入秘密信息,以便保护数字产品的版 权、证明产品的真实可靠性、跟踪盗版行为或者传递其他信息( 如产品附加信息、 秘密信息等) 1 2 】。一般,秘密信息是经过变换再嵌入到数字产品中,通常称变换 后的秘密信息为数字水印( d i g i t a lw a t e r m a r k ) 。数字水印的存在对数字产品质量没 有影响,而且数字内容经过拷贝、编辑、压缩、加密等操作,数字水印仍能保持 不变。 2 1 数字水印的发展史 2 1 1 水印的起源 一提到水印,人们很自然地想到日常几乎每天要接触东西纸币。水印确 实也是由造纸行业发明出来的。1 3 世纪末,在意大利小城f a b r i a i l o 的造纸工厂为 了给自家产品作标识,各个厂家都在纸模中加入了能识别自己厂家的细线模板, 这样生产出来纸品在细线区域会略薄一些,也更加透明。这是水印的雏形。 “水印”一词由德语的w a s s e r m a r k e 这个词演化而来,指墨水滴在纸上产生的 效果。 1 9 5 4 年,美国人开始研究“数字水印”技术。m u z a c 公司申请了一项名为 “i d e n t i f i c a t i o no fs o u n da n dl i k es i g n a l s 的专利,这项专利在音乐中嵌入了一种 不可感知的标识码。到2 0 世纪9 0 年代初期,“数字水印”这一术语开始被学术界 重庆大学硕士学位论文 2 数字水印技术概述 认可并广泛使用,数字水印技术在理论研究和实际应用领域都进入快速发展的轨 道。 2 1 2 空域数字水印算法 最早出现的数字水印算法主要针对的是图像,而且空域水印的研究较多。1 9 9 3 年,a z t i r k e l 等【1 3 】第一次提出电子水印( e l e c t r o n i cw a t e rm a r k ) 的概念,论述了 水印在保护版权、标记图像、防伪和访问控制等方面的作用,文中采用两种方法 在图像中嵌入水印,一种是采用l s b ( 1 e a s ts i g n i f i c a n t b i t ) 方法在图像中嵌入水印, 一种是基于水印嵌入图像时的线性关系来嵌入水印。同时指出,采用l s b 算法, 水印嵌入和提取简单;后者水印算法比较复杂,但是安全性相对较高。接着,1 9 9 4 年在文献 1 4 】中正式出现了“数字水印”( d i g i t a lw a t e r m a r k ) 这个词。1 9 9 6 年, r a y m o n d 等【15 】设计出了对线性和非线性滤波以及j p g 压缩攻击具有良好鲁棒性的 水印算法。 2 1 3 频域数字水印算法 鲁棒性低是空域水印的共性不足。为了提高鲁棒性,i n g e m a rj c o x 等【1 6 j 利用 扩频通信的思想,将图像的频域看作通信信道,而将水印看作在此信道上传输的 信号,把水印系统必须抵抗的噪声视为信号传输时受到的攻击,这里要求水印具 有独立同分布的高斯随机向量的特征,在图像最重要的频谱成分中将水印以扩频 的方式嵌入进去。实验结果表明,该方法得到的水印对图像缩放、空域滤波、裁 剪等攻击等具有很好的鲁棒性。但该算法是非盲水印,提取水印时需要原始图像。 1 9 9 8 年,x i el i e h u a 等【1 7 】提出一种盲水印算法,它将数字签名作为水印嵌入 图像,来标记作品的版权归属。接着,b r i a nc h e n 等1 1 8 j 采用量化索引调制 ( q u a n t i z a t i o ni n d e xm o d u l m i o n ) 的水印算法,现在已经是数字水印技术中一个典 型方案,它水印容量大方,具有较好的鲁棒性。此后,陆续有很多频域水印算法 出现。 2 1 4 数字水印在数字媒体领域的应用 早先数字水印在图像领域研究较多,逐渐地,水印技术在文本、视频、音频 等媒体领域的研究工作陆续开展起来。 1 9 9 4 年,贝尔实验室的m a x e m c h u k 采用字移编码、行移编码和特征编码的方 式,在数字文本中嵌入水印,来保护版权。1 9 9 6 年,b e n d e r 等【l9 j 利用在文档中添 加空格以及同义词替换的算法嵌入水印,取得来较好的效果。 视频域水印始见于1 9 9 4 年,m a t s u i 等【2 0 】提出的一种通过改变视频每一帧图像 的d c t 系数,使图像像素值发生变化的d c t 视频水印算法,它的抗噪声和剪切 攻击的能力差。l a n g e l a a r 等【2 l 】提出通过改变视频流变长码和通过丢弃部分高频视 频流系数,这两种视频压缩域上的水印算法。后一种算法复杂,水印容量相对较 6 重庆大学硕士学位论文 2 数字水印技术概述 小,但是水印鲁棒性好,在低码率情况下,能抵抗m p e g 解码后重新编码的攻击。 m i n g h u ac h e n 等【2 2 】在视频流中嵌入脆弱水印,跟踪和定位视频流传播过程中的错 码,这种方法简便易行,提高了视频解码时错码诊断效率和准确率。 1 9 9 6 年出现了音频域水印,当时b e n d e r 等提出利用回声、扩频、l s b 、相位 编码等四种水印算法【1 9 。b o n e y 等【2 3 1 用扩频水印方案将水印加载到音频信号中, 取得了很好的效果。s w a n s o n 等【2 4 j 将音频信号的每个单元分割成几个较小的块, 在其中嵌入不可感知的伪随机序列作为水印,用作音频的版权保护,实验证明, 水印的鲁棒性很好。 近来,陆续出现了图形和三维模型水印的研究,王金荣等【2 5 j 提出一种大规模 三维网格鲁棒公钥非盲谱水印算法,与其他非盲水印算法相比,该算法保真度好, 鲁棒性强。何文广等 2 6 1 提出一种基于局部几何空间的三维模型水印算法,实验结 果表明,该水印鲁棒性和保真度良好,实现了盲检测。 2 2 数字水印的分类 根据分类的标准不同,数字水印有很多种分类方式。常见分类方法有以下几 种: 基于感知特性的分类 根据水印的感知特性,水印可以分为可见水印和不可见水印。 可见水印是指不需要变换转换,通过人的感官就可以直接感知到的水印。这 种水印在图像和视频领域应用较多,一般是为了宣传自己的作品,但又不想被人 盗用而嵌入。 不可见水印人的感官无法直接感知,但是可以通过一些算法从媒体中提取出 来。这是应用范围最广的一种水印。它用在版权保护、涉密信息传递等领域。 基于水印本身特性的分类 根据水印本身自有的特性,水印可分为鲁棒性水印和脆弱性水印。 鲁棒性水印在经过某些信号处理过程和一定强度的攻击后,水印依然存在或 者可以被检测到。它主要应用于数字产品的版权保护方面。 脆弱性水印对信号的处理过程和攻击非常敏感,稍微的变动,将使水印不能 检测到或者检测到原水印的变化。这种水印主要应用在数字产品完整性保护方面。 基于水印内容的分类 依据水印信息的内容表达的意义,水印分为有意义水印和无意义水印。有意 义水印,水印信息通过一定的转换,明确地表达了某种可以被人理解的含义。无 意义水印,通常只对应于一串随机数,并不表达具体的含义。 基于载体类型的分类 7 重庆大学硕士学位论文 2 数字水印技术概述 数字水印加载于哪种载体,就称这种水印为哪种水印。比如加载在图像中的 水印,就叫图像水印,加载在文本中的水印,就叫文本水印,依此类推。 基于加载域的分类 水印加载在哪个域,对水印的算法性能具有决定性的作。加载域有时空域和 变换域之分,水印相应地划分为时空域水印和变换域水印。 时空域水印直接在载体信号的时间或空间域中叠加水印信息,水印算法简单, 实时性强,但鲁棒性较差,在脆弱性水印或半脆弱性水印设计领域应用较多。变 换域水印的嵌入和提取都在变换域进行,水印的鲁棒性强,容量较大。 基于水印检测器的分类 按照水印的检测过程,可将水印分为盲水印、半盲水印和非盲水印。盲水印 检测时不需要原始载体信息,只需要密钥;半盲水印检测时也不需要原始载体信 息,但需要原始水印信息;非盲水印检测过程需要原始载体和原始水印信息。 如图2 1 所示,开关1 和开关2 均打开状态是盲水印检测;开关2 闭合开关1 打开状态是半盲水印检测:开关1 和开关2 均闭合状态是非盲水印检测。 e x t r a c t e d w a t e r m a r kw 图2 1 盲检测与非盲检测水印 f i g u r e2 1b i n dd e t e c t i o nw a t e r m a r ka n dn ob l i n dd e t e c t i o nw a t e r m a r k 另外还有基于用途和基于密钥的分类等。 2 3 数字水印的基本特征 在数字水印的多个特征中,最基本的几个特征包括安全性、保真度、鲁棒性 和容量。 安全性 数字水印的安全性,是指水印抵抗恶意篡改、伪造的能力。假如水印是为了 保护作品版权的,那么首先要保证嵌入作品的水印不被认为篡改,这样,当提取 出水印时,才能拿来宣示所有权。如果水印被篡改而失去宣示所有权的意义,这 时就说水印的安全性不高。 保真度 水印的保真度是针对加载水印后的作品本身而言的,是水印加载前后,作品 重庆大学硕士学位论文 2 数字水印技术概述 相似性的衡量。无庸置疑,嵌入水印之后的作品和原作品之间肯定是有差异的, 但是,这种差异不能对作品的正常使用产生影响,同时,嵌入作品的水印,人不 能通过感官直接感知。保真度还要求,采用众多同一种算法嵌入的水印,用统计 的方法无法确认水印存在或者提取出水印。 鲁棒性( 稳健性或健壮性) 鲁棒性是水印的一个重要性能指标,它指含水印载体在经过各种信息处理过 程或者攻击后,水印依然存在或者被检测到的特性,即水印的难以清除性。 容量 水印容量是指在单位时间内或在一个作品中,嵌入载体作品的最大比特数。 随着水印容量的增大,水印算法的设计难度将提高,要在大容量下依然保持较高 的鲁棒性,将以损失水印的保真度为代价。 一般地,水印保真度、鲁棒性和容量三者是相互制约、相互依存的关系,其 关系如图2 2 所示。 c a p a c i t y 图2 2 容量、鲁棒性和保真度关系示意图 f i g u r e2 2r e l a t i o n s h i pa b o mc a p a c i t y ,r o b u s t n e s sa n df i d e l i t y 2 4 数字水印模型 2 4 1 基本模型 一个数字水印系统一般都必然包含水印嵌入器和检测器。嵌入器完成在载体 作品中嵌入水印的功能。要完成水印嵌入,嵌入器的输入必须有载体作品和原始 水印信息。嵌入器的输出作为检测器的输入,如果检测器在检测时需要原始载体 或者原始水印,那么其输入还包含这两个量。检测器的功能和嵌入器正好相反, 它将水印从载体作品中提取出来或者检测水印是否存在。图2 3 为数字水印处理系 统的基本模型。 9 重庆大学硕士学位论文 2 数字水印技术概述 图2 3 数字水印处理系统的基本模型 f i g u r e2 3b a s i cm o d e lo fw a t e r m a r k 图中,m 、m 分别为原始水印、检测解码后的水印,c 、g 、g 分别为载体作 品、含水印的载体作品、受到攻击后的含水印载体作品,形、形分别为水印生成 器生成的水印和水印检测器生成的水印,如、k 、场分别为水印生成密钥、水 印嵌入密钥和水印检测密钥,n 。为水印受到的攻击噪声。 在水印系统基本模型的基础上,可以演化出数字水印系统的通信模型。 2 4 2 通信模型 根据通信系统的信息传输模型,水印可以看作经过水印嵌入器到检测器的一 个信息传输过程。有三种基于通信的水印模型,见图2 4 图2 6 。第一种称为盲检 测水印的模型,这里载体被当作噪声处理;第二种是发送端带边信息的水印模型, 载体作品依然作为噪声,但同时也是水印嵌入器的输入;第三种为基于信道复用 的水印模型,这里载体作品和水印一起以信道复用的方式传输。 ( a ) 非盲检测器的水印系统;( b ) 盲检测器的水印系统 图2 4 盲检测水印基本模型 ( a ) w a t e r m a r ks y s t e mo f n ob l i n dw a t e r m a r kd e t e c t o r ( b ) w a t e r m a r ks y s t e mo fb l i n dw a t e r m a r kd e t e c t o r f i g u r e2 4b a s i cm o d e lo fb l i n dd e t e c tw a t e r m a r k 图2 5 含边信息的水印模型 f i g u r e2 5t h ew a t e r m a r k i n gm o d e l w i t he d g ei n f o r m a t i o n 1 0 重庆大学硕士学位论文 2 数字水印技术概述 o b s e r v e dw o r k s 图2 6 基于信道复用的水印模型 f i g u r e2 6t h ew a t e r m a r k i n gm o d e lb a s e dc h a n n e lr e u s e 2 5 数字水印系统的评价指标 2 5 1 保真度评价 数字水印的保真度评价实际上是指水印不被人感官察觉的一种度量。它分主 观评价和客观评价。 主观评价 一副作品的好坏,最直接的方法就是采用主观打分来评定。常用i t u r r e c 5 0 0 质量等级评判标准作为打分标准,如表2 1 所示。 表2 1i t u rr e c 5 0 0 质量等级评判标准 啦! ! 兰:! q 型业翌垒竖! 查呈堕垒j ! 型:垦些竺:i q o r a t i n gi m p a i r m e n t q u a l i t y 5 i m p e r c e p t i b l ee x c e l l e n t 4 p e r c e p t i b l eb u tn o ta n n o y i n g g o o d 3 s l i g h t l ya n n o y i n g f a i r 2 a n n o y i n g p o o r ! ! 型! 竺旦z 垫g星型 客观评价 水印的客观评价指标通常有:峰值信噪比、信噪比、均方误差、平均绝对差 分、拉普拉斯均方误差等,见表2 2 。 表2 2 水印的失真的客观评价指标 :! 垒! ! 皇兰:三q 竖皇! 堂! 空璺坠! 堑2 里! 堂皇垒璺1 2 坐壁! ! 里璺坐垒! ! ! 旦堕2 呈 d i f f e r e n c em e a s u r e m a x i m u md i f f e r e n c e a v e r a g ea b s o l u t ed i f f e r e n c e m d = m a x i ,。一厶,。i 用h a d :一1 i ,。扩l ,。m nz m _ 一i “。” ”。,n 重庆大学硕士学位论文 2 数字水印技术概述 续表2 2 : m e a ns q u a r ee r r o r n o r m a l i z e dm e a ns q u a r ee r r o r l p - n o r m l a p l a c i a nm e a ns q u a r ee r r o r s i g n a lt on o i s er a t i o p e a ks i g n a lt on o i s er a t i o i m a g ef i d e l i t y c o r r e l a t i o nm c g e e n o i t n a l i z e dc r o s s - c o r r e l a t i o n c o r r e l a t i o nq u a l i t y m s e = 击丢以厂) 2 n m s e = 而1 e 。o m , n _ i “) 2 鹿一 ( 古驴。以一 v 9 l m s e = ( vz j 。,。一vz l ,。) x 2 j 。,。) 2 m ,n埘,” v 2 i 。,。= i ,+ l ,。+ i 。一l 一+ j 。,。l + i m , , , - i 一4 1 ,一 s n r = e 1 2 ,。yo ,。一j 二,。2 m ,im ,n p s n r = m n m a 。x i 三,。z ( o ,。一厶,。) 2m 刀 f = 1 - 也厂

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论