(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf_第1页
(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf_第2页
(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf_第3页
(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf_第4页
(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(通信与信息系统专业论文)面向实用型的数字水印算法研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学硕士学位论文 摘要 随着多媒体及网络技术的飞速发展,音视频作品非法复制、修改及传播等 盗版侵权问题也越演越烈。音、视频数字水印技术正因为其能提供一种新的有 效且可靠的版权保护的方案而受到广泛的关注。如何设计实用性强的音、视频 水印框架,除了需考虑经过压缩的音、视频数据本身的数据量大,冗余度小的 特点之外,还需结合人类的心理声学模型,使算法在同步性、鲁棒性、不可见 性、实时性及安全性等方面能达到平衡。 本文在分析国内外大量有关音、视频水印算法的基础上,分别设计了基于 d c t 量化的同步音频水印算法和基于w a t s o n 感知视觉模型的差分能量d e w 压 缩域视频水印算法,并且将两种算法运用到实际的版权保护系统中。 基于d c t 量化的同步音频水印算法研究,首先利用能量阈值,消除“静音 区域,以此选定音频水印嵌入区域、再在准备嵌入水印的音频段内,将载体音 频信号分割成指定长度的音频帧段,并在每一帧的时域内嵌入同步码,以抵制 同步攻击,然后结合d c t 变换系数特点动态选定水印嵌入的具体系数,最后采 用双极性抖动调制算法进行水印信息的嵌入。 基于w a t s o n 感知视觉模型的差分能量d e w 压缩域视频水印算法,在水印 嵌入帧的选取方面,选取基于双阈值的镜头分割算法,并根据特征值的大小再 在每一镜头中选取相应的关键帧进行水印信号的嵌入,而在水印具体嵌入过程 中,深入研究w a t s o n 视觉模型,并在此基础上动态协调相应d c t 系数,以此计 算相应块的j n d 值,并利用j n d 的值来最大程度的在不影响视频视觉效果的前 提下保证水印的嵌入容量,并且在基于传统d e w 水印嵌入算法的基础上进行改 进,不再只选择单一的高频系数,而选取次低频系数进行相应的幅度修改,其 次还简化了相应的能量计算公式,进一步降低了算法的复杂度,也从侧面提高 了算法的实时性。 对设计好的算法框架进行实验验证,并给出了相应的试验结果以及与相关 文献的对比数据。从实验结果分析可知,音视频水印算法均具有很强的健壮性, 能抵抗相应的同步攻击及各种压缩攻击。 关键词:数字水印技术,双极性抖动调制算法,镜头分割算法、j n d ,d e w 武汉理工大学硕士学位论文 a b s t r a c t w i t l lt h ed e v e l o p m e n to fm u l t i m e d i aa n dn e t w o r kt e c h n o l o g y , t h ep r o b l e mo f i l l e g a lc o p y i n g ,m o d i f y i n ga n dd i s s e m i n a t i n gt h ea u d i oa n dv i d e ow o r k sa l eg e t t i n g w o r s e t h ed i g i t a lw a t e r m a r k i n gt e c h n o l o g i e so fa u d i oa n dv i d e oa l et h ev e r yw a yo u t o ft h e p r o b l e ma n d h a sa t t r a c t e de x t e n s i v ea t t e n t i o n t h e s t r o n g f e a s i b l e w a t e r m a r k i n gs c h e m e so fa u d i oa n dv i d e os h o u l dc o n s i d e rt h e i rr e d u n d a n c yd a t aa n d c o m p r e s s e dp r o c e s s ,b e s i d e s ,b e i n gc o m b i n e dw i t ht h eh u m a np s y c h o a c o u s t i cm o d e l , t h e ys h o u l dg e tt h eb a l a n c ea m o n gt h ei m p e r c e p t i b i l i t y , r o b u s t n e s s ,s y n c h r o n i z a t i o n , t h er e a l t i m en a t u r ea n ds e c u r i t y t w ow a t e r m a r k i n gs c h e m e sa r ep r o p o s e db a s e do nt h ea n a l y s i so fan u m b e ro f r e l a t e dr e f e r e n c e s o n ei st h es y n c h r o n i z a t i o na u d i ow a t e r m a r k i n ga l g o r i t h mr e s e a r c h b a s e do nd c t q u a n t i z a t i o n ,a n dt h eo t h e ri st h ei m p r o v e dd e wc o m p r e s s e dv i d e o w a t e r m a r k i n ga l g o r i t h mb a s e do nw a t s o nv i s u a lm o d e l t h e n ,a p p l i e dt h i st w o c o r r e s p o n d i n ga l g o r i t h mt ot h ea c t u a lc o p y r i g h tp r o t e c t i o ns y s t e mo fd r m ,i no r d e r t os o l v et h ep r o b l e mo f c o p y r i g h td i s p u t e s f i r s t l y , t h es y n c h r o n i z a t i o na u d i ow a t e r m a r k i n ga l g o r i t h mr e s e a r c hb a s e do n d c t q u a n t i z a t i o nu s e st h ee n e r g yt h r e s h o l dt oe l i m i n a t et h e m u t e a r e a , s ot h a ti t c a l ls e l e c tt h er i g h tw a t e r m a r k i n ge m b e d d i n ga r e a s e c o n d l y , d i v i d i n gt h es p e c i f i c c a r r i e ra u d i os i g n a l si n t o t h ef r a m e sw h i c hh a v i n gt h es a m el e n g t h t h i r d l y , e m b e d d i n gt h es y n c h r o n o u sc o d e si n t oe v e r ya u d i of r a m et or e s i s tt h ec o r r e s p o n d i n g s y n c h r o n i z a t i o na t t a c k s a n dt h e n ,s e l e c t i n gt h es p e c i f i cw a t e r m a r ke m b e d d i n g c o e f f i c i e n t sb a s e do nt h ec h a r a c t e r i s t i c so fd c tt r a n s f o r m a tl a s t ,u s i n gt h ed u a l p o l a r i t yd i t h e rm o d u l a t i o na l g o r i t h mt oe m b e dt h ew a t e r m a r ki n f o r m a t i o n i nt h ea r e ao fs e l e c t i n gw a t e r m a r ke m b e d d i n gv i d e of r a m e s ,t h ei m p r o v e dd e w c o m p r e s s e dv i d e ow a t e r m a r k i n ga l g o r i t h mb a s e do nw a t s o nv i s u a lm o d e lu s e st h e d o u b l et h r e s h o l dl e n ss e g m e n t a t i o na l g o r i t h mt od e c o m p o s et h eo r i g i n a lv i d e o s e q u e n c ei n t os e v e r a li n d e p e n d e n ts c e n e s a n dt h e ns e l e c t st h ef r a m e so fb i g g e s t c h a r a c t e r i s t i cv a l u et ob et h ew a t e r m a r k i n gf r a m e s i nt h ep r o c e s so fe m b e d d i n g , i i 武汉理工大学硕士学位论文 m a k i n gf u l lu s eo fw a t s o nv i s u a lp e r c e p t i o nm o d e lt oa d j u s tt h ed c tc o e f f i c i e n t so f t h ec o r r e s p o n d i n gb l o c k s ,t h e nc a l c u l a t i n gt h ej n d v a l u e s m o r e o v e r , o nt h ep r e m i s e o fn o n - a f f e c t i n gt h ev i s u a le f f i c i e n t , b yu s i n gt h ej n dv a l u e sc a l l g u a r a n t e et h e e m b e d d i n gc a p a c i t yt ot h eg r e a t e s td e g r e e a n df o rt h ev e r yg o o dc o n s i d e r a t i o no ft h e b a l a n c eb e t w e e nt h er o b u s t n e s sa n dv i d e oq u a l i t y , w em a k es o m ei m p r o v e m e n t so n t h eb a s i so ft h et r a d i t i o n a ld e ww a t e r m a r ke m b e d d i n ga l g o r i t h m f u r t h e r m o r e ,t h i s a l g o r i t h mn ol o n g e ro n l yc h o o s e ss i n g l eh i g hf r e q u e n c yc o e f f i c i e n t s i ts e l e c t st l l es u b l o wc o e f f i c i e n t st od os o m ec o r r e s p o n d i n gr a n g em o d i f i c a t i o n c e r t a i l d y ,i ta l s o s i m p l i f i e dt h ec o r r e s p o n d i n ge n e r g yc a l c u l a t i o nf o r m u l a , a n dm a k e sa 内i n h e r r e d u c t i o no ft h ec o m p l e x i t yo ft h i sa l g o r i t h m ,a n di ta l s op a r t l yi m p r o v e st h er e a l t i m e p e r f o r m a n c e d oe x p e r i m e n t so nt h ec o r r e s p o n d i n gw a t e r m a r k i n gf r a m e w o r k , a n d t h e ng i v i n g t h ec o r r e s p o n d i n gr e s u l t sa n dc o m p a r i s o nd a t ao fr e l a t e d d o c u m e n t s e x p e r i m e n t s p r o v et h a t t h ea u d i oa n dv i d e o w a t e r m a r k i n gs c h e m ep e r f o r m sw e l li n i m p e r c e p t i b i l i t y , w a t e r m a r kc a p a c i t ya n dt h er o b u s t n e s st or e s i s tt h e t e m p o r a l s y n c h r o n i z a t i o na t t a c k , w h i t eg a u s s i a nn o i s ea t t a c ka n dc o m p r e s s i o na t t a c k a n d t h e ya l lh a v eg o o dp e r f o r m a n c eo fr e a l t i m en a t u r ea n dc a nr e s i s tv a r i o u sc o m p r e s s e d a t t a c k k e y w o r d s :d i g i t a lw a t e r m a r k i n gt e c h n o l o g y , d u a lp o l a r i t yd i t h e rm o d u l a t i o n a l g o r i t h m ,l e n ss e g m e n t a t i o na l g o r i t h m ,y n d ,d e w i i i 武汉理工大学硕士学位论文 1 1 课题来源 第1 章绪论 本课题的研究来源于国家“8 6 3 计划项目:基于数字水印和动态安全许可 的数字版权管理和认证技术。 1 2 课题研究背景、目的和意义 在多媒体技术和网络技术高速发展的时代,图像、图形、音频、视频等众 多消费类数字产品层出不穷,以及日益丰富的多媒体信息传播和发布方式,使 得多媒体数据的版权保护问题受到领域内相关学者的更为广泛的关注。数字水 印( d i g i t a lw a t e r m a r k i n g ) 技术,作为一种信息隐藏技术,为多媒体数据文件在 防伪、防篡改、作品认证以及保障数据安全和完整性方面提供了一种重要的技 术手段。水印技术不同于传统的版权保护技术,如访问控制与加密技术,其作 为一种版权标识,存在于数字作品的整个生命周期,以便对作品进行版权跟踪【l j 。 密码学一直受到学者的极大重视是因为其被认为是通信系统中最主要的也 是最重要的信息安全手段,而如今出现的信息隐藏技术,在计算机通信技术和 互联网膨胀的今天成为了学者的研究热点。目前兴起的水印技术为多媒体数字 信息隐藏技术的一个重要分支,其与传统意义上的密码技术不同,水印信息存 活于数字产品的整个生命周期,并且作为一种版权标识对产品进行版权跟踪, 还有就是,传统的访问控制及密码技术对数据的保护程度不够,并不能从根本 上防止数据的非法复制及对媒体版权的鉴别,水印技术则有效地解决了此类问 题【2 1 。因此,针对于水印相关技术的研究已经成为数字多媒体网络安全领域必不 可缺的一部分。 近年来,水印技术的研究呈多元化发展,但在音、视频水印研究方面,仍 存在一些问题: ( 1 ) 没有很好地将水印处理技术与相应的音、视频编解码统一起来。数字 媒体的发布通常需要经过编码和解码,而传统意义上的水印处理一般不能很好 地与音视频压缩编码技术结合,因而使得算法本身的健壮性较差,不能有效地 武汉理工大学硕士学位论文 积极地抵抗压缩攻击;另外由于音视频信号的压缩编码处理,其冗余空间相应 减少,而水印信息的嵌入又是利用原始宿主信号的空间冗余特征进行处理的, 故音视频水印算法容量及不可感知性两者之间的平衡问题也亟待解决【3 】; ( 2 ) 音、视频测试平台相比较于静止图像平台而言,其搭建过程更复杂也 更艰难,也因此更不利于音、视频水印相关技术的研究。因为音、视频等多媒 体数据在存储、传输、编解码、压缩等方面的复杂度,以及含有时间域掩蔽效 应等特性的h v s 模型的研究技术尚未成熟,所以对于音、视频算法本身而言, 它们并没有一个统一的标准,因而也就不能用于评定算法的优劣【4 j ; ( 3 ) 水印算法包括嵌入及检测等处理技术目前仍未形成统一的国际标准, 也即目前并没有得到世界各国的认可和支持【5 j 。一般形成国际标准的算法具有通 用性、健壮性、优越性以及有效性等共性,而又由于音视频压缩编码过程中经 常使用d c t 变换,且是各国目前的研究热点,也即基于d c t 变换的水印算法 最有可能形成标准; ( 4 ) 音、视频水印攻击形式特殊,不同于普通的静止图像。因为音、视频 文件一般需经过压缩处理后再进行传播,故其相关的水印算法要求实时性和抵 抗常见攻击的能力要高于静止的图像水印,其常见的攻击有变换码率、帧攻击、 重量化等攻击,使得对音、视频水印算法的性能要求更高。 上述热点与难点之间的矛盾,是研究工作的契机,同时也是一个挑战,本 课题研究的目的是在深入探讨人类视觉模型的基础上,改进一些经典的算法, 并分别建立一套基于压缩域的音视频水印算法框架。为切合国际市场发展需求, 立足于目前国际研究热点d c t 及d w t 变换,对于音频水印算法,综合考虑 算法的同步性、鲁棒性、不可见性以及安全性等特点,充分利用d w t 的多分辨 率特性以及d c t 的解相关能力及聚能作用,对于视频水印算法,采用基于双阈 值的镜头分割算法、改进d e w ( d i f f e r e n t i a le n e r g yw a t e r m a r k i n g ) 算法等方法, 使算法在复杂度低的情况下,仍然保持较高的实时性以及较大的水印容量,并 且也能够在水印不可见性以及鲁棒性两者性能之间取得很好的平衡睁引。 1 3 相关领域国内外研究现状 目前,国内外相关领域的研究人员已经设计了大量的有关音、视频水印的 解决方案,本小节将从音、视频水印算法的整体设计框架的各个关键技术出发, 对于各种各样的有效的水印处理方法进行归纳和总结。 武汉理工大学硕士学位论文 首先从音频角度出发,要想设计出优秀的音频数字水印算法,除了考虑音 频信号本身的特点,如信号的数字化程度以及其存储格式的不同,还需要考虑 如何充分利用人类心理学模型( 尤其是人类听觉特性) 。一般音频数字水印按作 用域分为压缩域以及时域算法两种,具体如表1 1 所示。 表1 1 常用的音频水印方法及特点 其次考虑视频,因为视频是由一系列动态的图像帧组合而成的,故如何选 取关键的视频帧作为水印嵌入帧,以及如何选取水印具体的嵌入位置直接影响 水印算法的实时性、不可见性以及鲁棒性和抵抗常见攻击的能力,一般,有以 下几种解决方案: ( 1 ) 镜头分割法,主要包含基于图像特征的非压缩域镜头分割法以及基于 编码信息的压缩域镜头分割法,其中非压缩域的镜头分割方法有基于图像像素 匹配、颜色直方图、双阈值、边缘等,而压缩域的镜头分割方法则有运动矢量 法、d c t 系数法和d c 系数法等。使用镜头分割法对视频内容进行定位,可以 解决视频接收过程中所出现的不同步问题,从而使水印算法能够有效地抵抗时 间同步攻击; 武汉理工大学硕士学位论文 ( 2 ) 逐帧嵌入法,即在原始视频的每一帧中均进行水印信息的嵌入,w ue t a 1 【5 1 及s u ne ta 1 【6 1 等设计的水印框架中采用的均是此方法,它可以抵抗一些常见 的帧攻击,如帧丢弃、帧剪切、帧变换等,但由于其是对每一帧均嵌入水印信 息,故算法实时性较差,水印容量也不高; ( 3 ) “双3 0 随机概率法,即在嵌入过程中随机选取总视频帧数的3 0 作 为水印嵌入的关键帧,避免逐帧进行嵌入,提高算法实时性。z h e n ge t “9 j 就是 采用此种关键帧选取方法,该方法的水印嵌入和提取实时性较高,能抵抗帧间 共谋攻击等,但在水印信息提取的可靠性方面则较差; ( 4 ) 聚类法( c l u s t e o ,即运用各种不同的但积极有效地聚类方法,从原始 视频序列中提取出在某些关键特征方面具有很大相似程度的视频帧作为待嵌入 水印信息的帧【1 7 】。此类算法的复杂度依赖于所选取的聚类方法的计算复杂度, 但从某一程度上来看,其相对于逐帧进行水印信息的嵌入的方法,仍具有较好 的实时性,能抵抗各种较常见的攻击。 视频同音频一样,一般需要经过压缩后传输和存储,故视频水印框架中存 在原始域及压缩域两种,具体如下分析: ( 1 ) 原始域,即将水印信号直接嵌入到原始的没有经过压缩的视频帧中, 如s a mb e h s e t a 4 1 、s u ne ta l t l 2 1 、l i ue ta l 1 3 1 均设计了相关的原始域视频水印算法。 该方法的水印容量较大,并且算法的复杂度低,但一般对于各种正常或恶意的 压缩攻击的抵抗性能不好; ( 2 ) 压缩域,即结合视频的压缩编码技术进行水印信息的嵌入,如w ue t a l 【5 1 、s u ne ta l 6 1 、t i a ne ta l 1 4 】等均进行此类算法的研究。该方法能有效抵抗各种 压缩攻击,但由于在压缩域进行水印信息的嵌入,原始信息本身的空间冗余度 大大减少,所以使得其水印容量不是很大。 如何有效的将水印信号添加到宿主视频信号中,所采用的方法可归纳为: ( 1 ) 最低有效位法( l e a s ts i g n i f i c a n tb i t ,l s b ) ,为一种最基本的信息嵌 入方法,s a m p a t h 堪】设计的此类算法是先对水印b i t 进行编码,再根据每一水印 b i t 对应的码字进行水印信息的嵌入,而在水印提取的时候则根据l s b 向量与对 应的码字关系来判断b i t 位值。该方法本身简单,实现起来很容易,并且水印嵌 入和提取的速度很快,实时性很高,但缺憾为其算法的鲁棒性很差; ( 2 ) 差分能量水印算法( d i f f e r e n t i a le n e r g yw a t e r m a r k i n g ,d e w ) ,是由 l a n g e l a a r 等在大量理论研究以及实验分析的基础上所提出的一种对于部分压缩 4 武汉理工大学硕士学位论文 视频画面中的高频离散余弦变换系数进行有选择地取舍,以此来进行水印嵌入 的方法。每一位水印信息的产生则是通过由两个不同区域( 一般其物理位置相 邻) 的高频离散余弦变换系数能量值之间的差进行编码来实现的。s u ne ta l t l 9 】设 计了一种基于j n d 的差分能量算法,此方法的优点在于它不需要对已经压缩好 的视频码流进行重新再编码,而是直接去掉原压缩码流的部分信息,以此来进 行水印信息的嵌入; ( 3 ) 扩频调制法( s p r e a ds p e c t r u m ,s s ) ,是以加性抑或者是乘性的方式将 水印信号嵌入到待保护的视频序列中,s u ne ta i r 6 设计的扩频算法是基于加性 的,该方法具有较好的不可见性,但其提取水印信息时需要原始视频序列的参 与; ( 4 ) 量化系数调制方法,同信号量化过程相似,一般采用固定的或数值可 变的量化步长来将信号划分为不重叠的区域,并为各区域选取一个适当的值。 s u ne ta l 1 5 】设计了一种基于j n d 模型的量化系数调制法水印框架,采用j n d 的 值为量化的步长,保证水印信息最大程度的嵌入到原始视频中,且不影响最初 始视频的视觉效果。理论分析及实验证实此类算法的鲁棒性依赖于量化所取的 步长,即步长越小,则说明信号的鲁棒性越好,因此算法的灵活度较高。 一般为保证水印信号的安全性,一般需对需嵌入的水印信号进行预处理, 其方法大概有如下几类: ( 1 ) 随机置乱方法 1 2 , 1 9 l ,如采用z i g z a g 变换、a r n o l d 变换、生成随机置 乱矩阵等。这种方法在水印信号预处理过程中较常见,因为其可以保证水印信 号的安全性,而且也能确保水印信号大小的稳健性; ( 2 ) 分段处型4 1 ,由于视频序列本身存在的时间冗余性的特点,可以将原 始水印信号按照一定的方式分割成小的片段,并且将各个片段分别嵌入到相应 的不同视频帧中,为保证水印信号安全性,一般进行水印分段前,先进行水印 信息的置乱处理,使用这种方法,可以在不影响算法实时性的前提下,保证较 大的水印嵌入容量; ( 3 ) 可视分存技术( v i s u a ls e c r e ts h a r i n g ,v s s ) ,将水印信号分解为n ( n 1 ) 幅分存图( 需保证n 幅分图可重构为原始水印信号,缺一不可) ,该方法在增大 嵌入水印容量( 将水印嵌入容量扩大了n 倍) 的同时,也可保证水印信号的安 全性,但算法的不可见性在某种程度上有些降低。 对上述视频水印系统中所使用的方法及特点进行归纳整理,如表1 2 所示。 武汉理工大学硕士学位论文 表1 2 常用的视频水印方法及特点 1 4 本文的主要工作和组织结构 本文在研究国内外大量先进音、视频水印算法框架设计的基础上分别设计 了基于d c t 量化的同步音频水印算法和基于w a t s o n 感知视觉模型的差分能量 d e w 压缩域视频水印算法,并且将两种相应的算法运用到实际的版权保护d r m ( d i g i t a lr i g h t sm a n a g e m e n t ) 系统中,以此来解决版权纠纷问题。 基于d c t 量化的同步音频水印算法研究,综合考虑算法的同步性、鲁棒性、 不可见性、安全性等特点,首先利用能量阈值,消除“静音区域,以此选定 音频水印嵌入区域、再在准备嵌入水印的音频段内,将载体音频信号分割成指 定长度的音频帧,在每一段帧的时域内嵌入同步码,以抵制同步攻击,然后结 合d c t 变换系数特点动态选定水印嵌入的具体系数,最后采用双极性抖动调制 6 武汉理工大学硕士学位论文 算法进行水印信息的嵌入。 基于w a t s o n 感知视觉模型的差分能量d e w 压缩域视频水印算法,在水印 嵌入帧的选取方面,为保证水印算法的实时性,避免逐帧进行嵌入,选取基于 双阈值的镜头分割算法,并根据特征值的大小再在每一镜头中选取相应的关键 帧进行水印信号的嵌入,传统的基于阈值的镜头分割算法一般只能检测出镜头 切变或者是渐变其中的一种,而本文采用的双阈值算法则能同时检测到这两种 镜头之间的切换,而在水印具体嵌入过程中,深入研究w a t s o n 视觉模型,并在 此基础上动态协调相应d c t 系数,以此计算相应块的j n d 值,并利用j n d 的 值来最大程度的在不影响视频视觉效果的前提下保证水印的嵌入容量,并且在 基于传统d e w 水印嵌入算法的基础上进行改进,为很好的兼顾水印信息的鲁棒 性以及视频的质量二者之间的平衡,不再只选择单一的高频系数,而选取次低 频系数进行相应的幅度修改,其次还简化了相应的能量计算公式,进一步降低 了算法的复杂度,也从侧面提高了算法的实时性。 如何将音、视频水印算法应用于实际的d r m 版权保护平台中也是本文所讨 论的问题,在此,本文主要研究了音、视频水印信号的生成模块、相应的嵌入 及其提取模块,以及模块间如何与d r m 系统平台进行通信等关键问题。 本文的组织结构为:第一章综合研究了音、视频水印技术的发展现状及其发 展趋势,归纳并总结了目前主流的音、视频水印算法中所采用的各种技术;第 二章则设计了一种基于d c t 量化的同步音频水印算法,在综合考虑算法的同步 性、鲁棒性、不可见性、安全性等特点的前提下,将载体音频信号分割成指定 长度的帧,在每一帧的时域内嵌入同步码,以抵制同步攻击,而在频域中自适 应地嵌入水印,并通过实验的验证分析算法不可见性、鲁棒性以及抵抗一般攻 击的性能;第三章研究了w a t s o n 视觉感知模型以及传统意义上的d e w 算法,并 在此基础上设计了基于w a t s o n 感知视觉模型的差分能量d e w 压缩域视频水印算 法,并且通过实验验证算法的不可见性、鲁棒性、抵抗噪声攻击、帧攻击、压 缩攻击的性能并对算法的水印容量及实时性程度与有关的经典算法进行了对 比;第四章主要描述了如何有效地将音、视频算法应用于w d d r m 系统中,并针 对w d d r m 系统平台中各个模块的功能及设计步骤进行了详细说明;第五章是对 本文的总结,除了指出本文的主要研究成果外,还展望了今后音、视频水印相 关技术的研究方向。 7 武汉理工大学硕士学位论文 第2 章基于d c t 量化的同步音频水印算法研究 2 1 相关理论分析 2 1 1 同步信号 本章设计的算法中选取经典的m 序列作为待嵌入的同步信号,现假如有 口。 和概 两个m 序列,且其均具有相同的周期,设为t ,其中序列值范围为 a n , 6 刀 - 1 ,1 ) ,则扛。) 和娩 互相关函数的表达式为: 疋,。( f ) = 亭屯, ( 2 1 ) m 序列 口。) 的自相关函数有如下性质: f lt = 0 r 。( f ) 2 一上,o 2 - 2 ) l 1 现假设其中的妇。) 序列为原始的同步信号序列,吒 - 1 ,1 ) 为需进行验证的 同步信号序列,若兄,。( o ) 告,则判定慨) 为一同步信号。阈值厂意味着若b n 中最多只有( 丁一f ) 2 , p - 与缸疗 不同,则判定b n ) 为一同步信号。 2 1 2 听觉模型算法 听觉模型算法的基本原理为依据h a s ,在不影响人耳的听觉效果的前提下 来进行水印信息的嵌入。在音频信号中进行水印信息嵌入的过程相对于在静止 的图像中进行嵌入的过程要复杂一些,其原因所在是人类h a s 比h v s 系统更 敏感,更易识别细微的改变。人耳的掩蔽效应分为同时掩蔽( s i m u l t a n e o u s m a s h i n g ) 也即频域掩蔽和异时掩蔽( n o n s i m u l t a n e o u sm a s h i n g ) 也即时域掩蔽 两种【9 】。 人耳掩蔽效应中的频域掩蔽现象指的是,在现象发生的某一时刻,掩蔽者 和被掩蔽者二者在此时刻并存,一般人听力可感知的频率范围为2 0 h z - 2 0 k h z , 武汉理工大学硕士学位论文 而其听力的强度范围则为5 d b - - , 1 3 0 d b ,其中人耳对于2 k h z - , - 4 k h z 这一频率段 内的声音尤其敏感。另外,人耳刚好能感知到的最低声压级听阈为声音的函数, 若一声音信号的声压级低于听阈值,则该声音信号为不可听【1 0 1 。但当一个较强 信号存在时,听阈值将被提高,即掩蔽阈值增大。因此,利用此类特性,首先 可将被掩蔽的较弱信号视为不可到达人耳的信号,也即与人耳无关,因此不对 其进行包括编码在内的以及水印信息的预处理等操作;其次,对量化噪声的频 率整形,降低量化码率,同时改善音频编码的质量【l 。 时域掩蔽又分为两种,即前掩蔽( p r e - m a s k i n g ) 和后掩蔽( p o s t m a s k i n g ) 。 前者指的是效应产生在掩蔽开始之前的某一特定的时刻,而后者指的则是产生 在其效应之后【1 2 1 。利用前掩蔽效应,对于选择水印信息的嵌入位置至关重要, 并且其还能有效地抑制住由于时间分辨率较低而引起的预回声效应,此时的掩 蔽阈值可表示为一函数,其值由时间、频率以及声压级等共同确定。 2 1 3 量化嵌入思想 量化索引调制( q u a n t i z a t i o ni n d e xm o d u l a t i o n ,q i m ) 方法为音频等多媒体 数字水印实现盲检测提供一种新的方法及解决思路,其基本原理为依据水印b i t 的类别将宿主系数量化至不同的区间【1 3 】。在一般常见的调制方法中,比较有影 响力的应为抖动调制d m ( d i t h e rm o d u l a t i o n ) 方法。 假设需量化的参数记为厂,其选定的量化步长取值为,而等待需进行嵌入 的水印比特则表示为w 0 ,1 ) ,量化后系数则记为厂,则不同极性的抖动调制 方法如下所示。 ( 1 ) 单极性抖动调制指量化参数的极性应该且必须单一,即参数形式全为 正数亦或者全为负数,比如d f t 变换系数幅度。图2 1 所示的为f 0 和f 1 a 2 2 ( 后+ 1 ) + 三i 7 r 所= 2 七+ 1 2 k a - 丢矿所= 2 k a n d r 兰 2 ( k + 1 ) + 三矿朋= 2 k a n d r 圭 ( 2 3 ) 然后根据厂。的值确定水印比特位信息,若厂在区间a 范围内,表示水印比 特“1 ,若处于区间b 范围内,表示水印比特“o 。当m = 0 时,l f - f i 1 5 a , 即量化误差为1 5a ,而当m 0 ,i f f i a ,即量化误差最大为,至于厂 0 时,参数量化情况与上情况类似【l 制。 ( 2 ) 双极性抖动调制指量化参数极性可以不唯一,既可为正数也可为负数, 比如d w t 及d c t 的系数、d f t 系数相位值。图2 2 所示的即为及w 之间的 原理图。 ababa baba l r r 4 一3 - 2 一 o 2 3 ) 图2 - 2 双极性量化原理图 l o 武汉理工大学硕士学位论文 当倒且w = ,时,= 2 嚣;稍m = m 2 k 当厂。r w - - o ,厂= 主妻:;会参加m := 2 七2 k + 。 当厂 。且w = 1 时,厂= j l - 2 - 2 尬k a 矿f 聊:m = 2 - 后2 k + 1 ) 当厂 。且w = 。时,f , = f , 【- 之2 庀k a 二会箩加= m 一= ( 2 - 七2 k + 1 ) 然后根据的值确定水印比特位信息,若在区间a 范围内,表示水印位 “1 ”,若处于区间b 范围内,表示水印位“0 ”。由量化过程所造成的最大误差 用表示,可以得出其满足l 一i ,与单极性量化误差不同u 5 1 。 2 2 篁法设计 2 2 1 基于a r n o l d 变换的水印预处理 本章中所选取的水印图像为一大小为m m ,且能有效代表版权信息的有 意义的二值图像形,为了防止水印图像遭到恶意篡改攻击,如矢量量化、剪切 等,首先利用a r n o l d 变换对代表版权信息的水印图像w 进行置乱变换【1 6 1 。令矿 为l 1 的二值图像。即有: 矿= w ( m ,刀) ,1 所l ,1 刀l ,w ( m ,刀) 0 , 1 ) ( 2 - 4 ) 首先对水印图像进行a r n o l d 变换,而a r n o l d 变换的次数需保存为密钥k , 其目的是为方便以后利用密钥k 对置乱后图像进行恢复的操作。图2 3 所示的即 为a r n o l d 变换与恢复的过程,置乱后的图像可表示为: 形= 形( 所,刀) = w ( m ,刀) ,1 聊l ,1 胛l ( 2 5 ) 讣睁州 p 6 , 然后按从上到下,从左到右的顺序扫描矩阵,可得到序列 武汉理工大学硕士学位论文 v = 瓴,1 f m m ) ,将m 序列放在序列v 之前即组成新的待嵌入序列k ,最 后所得的待嵌入的信号序列结构如图2 - 4 所示。实验结果表明,给出的2 0 次的 图像置乱度可以准确地反映其置乱效果,并且实验也证实可由置乱后的图像无 差错地恢复出原始水印图像。 k = 孑暑丁+ 。:三震:m + 丁c 2 7 , 武汉 理工 武汉 理工 ( a ) 置乱前水印( b ) 2 0 次变换后水印( c ) 恢复后水印 图2 3a r n o l d 变换与恢复的过程 - j 竹_ 一y _ 同步 水印序列 同步 水印序列 信号 ( 置乱) 信号 ( 置乱) _ 巧 -1 7 i 7 2 2 2 音频信号预处理 图2 4 待嵌入序列组成图 每一个音频信号a ,在每个时刻的能量分布都不全是一样的,即总会存在一 小段能量值极小的“静音区域 ,而且在此“静音区域中,人耳能够分辨出 其中及其微弱的噪声,若在此类区域中嵌入水印信号,相当于在此位置处给原 始数据叠加噪声,这样人耳会很容易分辨出噪声,从而对水印信息的不可感知 性造成一定程度的影响;还有就是在水印提取的过程中,因为在“静音区域 中计算得到的能量值很小,从而使得相应变换域的系数值也很小,进而导致水 印信息更易被篡改或破坏【1 7 】,所以需要对原始音频信号预先进行“去除静音 操作,先假设已经求得的静音区域与非静音区域之间的能量阈值为乃,则具体 的划分过程如下所示: ( 1 ) 将原宿主信号分成时间相等的n 块,分别计算各块的能量巨( 1 f n ) , 武汉理工大学硕士学位论文 若巨乃,则为静音块,反之则为非静音块。 ( 2 ) 将m 个相互连接的静音区域块( 本文中m 选取为3 ) 构成的范围标记为静音 区域,n 个连续非静音区域块( 本文中n 值选取为2 0 ) 构成的范围标记为非静音区 域,在区域划分好后,再将所有的标记为静音区域及长度范围不合格的非静音 区域a s ( 也即所谓的人耳敏感区域) 去除,不执行水印信息的嵌入过程,余下 的区域则标记为非静音区域,也即人耳非敏感区域,在此区域内可以进行水印 信息的嵌入,并将此区域记为载体a e 【l 引。 2 2 3 水印嵌入位置选择 及不可感知性有着不同程度的影响,因此如何选定d c t 系数为水印算法尤为关 键的一步1 9 1 。 d c t 解析形式为: ,(ji)=c(后)艺厂(甩)c。s。(2n2+1)kz(zn+oxznffi0l ( 2 - 8 ) ,( j i ) = c ( 后) 厂( 甩) c o s iw i ( 2 - 8 ) 厶j j m,=删cos警(zn+oxzk=0 协9 ) 厂( 刀) = c ( 尼) f ( 后) c o s i 石一l ( 2 - 9 ) l 二 j 其中,0 刀,k n ,f 为时域的序列,而f 则为进行d c t 变换后的系数序 f 1 甜:o c ( 甜) 兰 j 善甜。 ( 2 - 1 。) m 曾i - i 妒c k ) c o s 篱卜叭卅? 。s 篱 ( 2 - 1 。 + 酽n - i 艄c o s l ( 2 n 2 + 1 ) k z r h 帆c c o s 警 一“。 假定印,刀) = c ( d e ( 力c 。s 警 为。c t 域中第f 个系数,( f ) 上叠加的噪 武汉理工大学硕士学位论文 声信号e ( f ) 衍生出的对时域第1 1 个点f i n ) 的影响。则噪声信号对相应时域位置序 列造成的影响衫= 艺| p ( 刀) i = 篓f c ( 力e ( d c 。s 垦专笋l 故在值一定的情况下n 列造成的影响衫= i p ( f ,刀) i = j c ( 力e ( d c o s 兰等等竺l ,故在 值一定的情况下 可得到p ,的最小值。= o 所以取衫最小值的时候所对应的f 值为嵌n 入水印d c t 系数 位置坐标,因为此时进行水印信息的嵌入所引起时域误差p ,的值最小,即对原 始音频的影响程度最低刚。 2 2 4 基于d c t 量化的水印信号嵌入 对音频信号预处理后,对音频有效嵌入区域进行水印信息的处理,将有效 嵌入区域以固定的长度进行分段处理,设分段后每个音频长度为n ,为满足水印 信号的有效嵌入,需选择6 4 x 6 4 段数据作为水印嵌入位置【2 1 1 ,然后,对相应每 一原始帧数据执行离散余弦变换过程。! t l l n = 8 ,则由水印嵌入位置分析可得,当 待0 或汪4 时g 厂达到最小值,为e ( f ) ,因此选取d c t 变换频域中d c 系数和 第四a c 系数作为水印信息的嵌入位置。而又由于频域中的直流系数与交流系数 对于水印的不可感知性及鲁棒性的影响程度不一样,因此,为在水印不可见性 及鲁棒性二者时间达到最大程度的平衡,对于计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论