(基础数学专业论文)数字音频水印算法的研究.pdf_第1页
(基础数学专业论文)数字音频水印算法的研究.pdf_第2页
(基础数学专业论文)数字音频水印算法的研究.pdf_第3页
(基础数学专业论文)数字音频水印算法的研究.pdf_第4页
(基础数学专业论文)数字音频水印算法的研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

福建师范大学学位论文使用授权声明 ; 本人( 姓名)睦荔琏学号专业基型 熬兰一所呈交的论文( 论文题目:数字音频水印算法的研究) 是我个 人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了 文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或 撰写过的研究成果。本人了解福建师范大学有关保留、使用学位论文 的规定,即:学校有权保留送交的学位论文并允许论文被查l 弼j 阳1 昔阅; 学校可以公布论文的全部或部分内容;学校可以采用影印、缩印或其 他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 福建师范大学硕士学位论文 摘要 计算机和互联网技术的发展,使得多媒体数字作品的创作、存储和传输变得极其便利, 以m p 3 为代表的音乐在互联网上广泛传播,使得艺术作品的作者和发行者的利益受到极大 损害。数字水印技术作为解决这一主题的有效途径引起人们的普遍关注,它通过在原始数 据中嵌入能够标识作者身份的信息来证实数据的所有权或完整性。 本文对数字音频水印算法进行了研究和探讨: ( 1 ) 较为系统地介绍了数字水印的概念、通用模型;概述了数字音频水印的概念、 基本性能要求以及数字音频的应用领域;归纳了数字音频水印的分类;阐述了数字音频水 印系统的评价标准和基本要求。 ( 2 ) 对数字音频水印的研究现状进行总结,包括时间域水印算法、变换域水印算法 和压缩域水印算法的分析和介绍。 ( 3 ) 研究了基于人类心理声学模型的数字音频水印算法。 ( 4 ) 提出了一种基于局部极值的音频水印算法,该算法在小波变换域上以局部极值 作为同步信号,通过修改局部极值来实现水印的嵌入。利用局部极值作为水印同步手段, 在水印提取过程中,不需要原始音频信号,实现水印盲检测。实验结果表明,该算法能满 足水印透明性的要求,同时具备较强的鲁棒性,盲检测使得算法更适合应用于音频作品的 版权保护领域。 关键词:音频水印,鲁棒性,局部极值 福建师范大学硕士学位论文 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n ta n d 、i d c l yu s a g eo f c o m p u t e rt e c h n o l o g ya n di m e m mt e c h n o l o g y t h ec r e a t i o n , s t o r a g ea n dr c a s m i s s i o no ft h em u l t i m e d i ad i g i t a lp r o d u m ( m 曲a si m a g e s ,v i d e o sa n da u d i o ) a r eb e c o m i n gm o r ec o n v e n i e n t t h ew i d e l ys p r e a do ft h ei n t e r u e tm u s i cb a s e do nm p 3f o r m a t b e n e f i t sf r o mt h em a t u r eo f c u g 跏a u d i oc o m p r e s s i o nt e c h n o l o g y , b mi nt h es a m e 血ehd o e st h ec x 1 1 c n l e h a r mt ol b em u s i cp r o d u c 扭o w l l e l a n dp u b l i s h e r sf o rt h ec o p y r i g h tt h e r e f o r e ,h o wt op e r f o r m p 蜘g h t p r o t e c t i o na n di n f o r m a t i o ns e c u r i t yo ni m e m e ti sap r o b l e mn e e i 埘t ob es o l v e dm g e n t l y a sav a l i dm c d u x l d i g i 咖w a 主既m 越虹n gi sb e c o m i n gar e s e a r c hh o t s p o to fc a 咀眦i tv e r i f i e st h ed a t a l lo w n e r s h i pa n d t n t e g r a u t yb y 盘d k d d i n gt h e 锄珂1 础ci n f o r m a t i o ni n t oo r i g i n a ld a t as t o l d g e t h i sp a p e rf o c u s e so nt h er e s e a r c ho f a u d i ow a t e r m a r k i n ga l g o r i t h m : ( 1 ) i nt h eb e g i m l i n gi ts y s t e m a t i c a l l yi n t r o d u c et h ec o n c e p ta n dt h ec o m m o nm o d e lo f d i g i t a lw a t e r m a r k i n g ;t h e ns u m l l l s l d t 碡$ t h ec o n c e p t , t h eb a s i cp e r f o r m a n c er 既l u i r e m e n ta n dt h e a p p l i c a t i o n so fa u d i ow a t e r m a r k i n g ,a n dt h e na n a l y s e st h ec l a s s i f i c a t i o no fd i 垂t a ia u d i o w a t e r m a r k i n gs y s t e m ;a n da tl a s te x p o u n d st h ee v a l u a t i o ns t a n d a r da n db a s i cr e q u i r e m e n to f a u d i ow a t e r m a r k i n g ( 2 ) i ts u m m a r i z e dt h ep r e s e n tr e s e a r c hb a c k g r o u n d , i n c l u d i n gt h et i m ed o m a i na u d i o w a t e r m a r k i n g ;w a n s f o r m d o m a i na u d i o w a t e r m a r k i n g a n dc o m p r e s s i o nd o m a i na u d i o w a t e r m a r k i n g ( 3 ) i ts t u d i e st h ea u d i ow a t e r m a r k i n ga l g o r i t h mb a s e do nt h eh u m a np s y c h o l o g i c a la c o u s t i c s m o d e l ( 4 ) i tp r o p o s e sa na u d i ow a t 黜r k i n ga l g o r i t h mb a s e do nl o c a le x t i c m ev a l u e 砌s a l g o r i t h mt a k e sa d v a m a g c so ft h eg o o dm u l t i - r e s o l u t i o np r o p e r t i e s o fd i s c r e t ew a v e l e t r a m s f o r m a t i o nb ys c a r c h i n gl o c a le x t r e m ev a l u ei nt h el o w - f i v q u e n c yc o e f f i c i e n t so fd w t d o m a i na n dm a k e st h el o c a le x t r e m ev a l u ea st h es y n c h r o n o u ss i 驴a 1 1 kw a l kw a s e m b e d d e db ym o d i f 弛gt h el o c a le x t r 黜v a l u e sa n di t sn e i g h b o r i n gc o e f f i c i e n t s a n dt h e w a t e r m a r kc a l lb ee x t r a c t e dw i t h o u tt h eo n # h a la u d i os i g n a l e x p e r i m e n t a lr e s u l t sd e m o n s t r a t e t h ea l g o d t h mi sr o b u s ta n di m p e r c e p t i b l e ,i t sf e a t u r ei sf i tf o rt h ec o p y r i g h to f t h ea u d i ow o r k k e y w o r d s :a u d i ow a t 豇加触1 d n g r o b u s t n e s s ,l o c a le x t r e m ev a l u e 福建师范大学硕士学位论文 中文文摘 近年来,数字多媒体技术及互联网技术的迅猛发展使得图像、视频和音频等多种形式 的多媒体数字作品的创作、存储和传输变得极其便利。以m p 3 为代表的网络音乐在互联网 上广泛传播就是得益于数字音频压缩技术的成熟。但是,i n t e m e t 上盗版音乐制品的复制和 传播,使得艺术作品的作者和发行者的利益受到极大损害。在这种背景下,能够有效地 实行版权保护的数字水e p ( d j g i t a lw a t e r m a r k i n g ) 技术应运而生。 数字水印是一门新兴的多学科交叉的应用技术,它为最终解决数字产品版权保护问题 提供了方向。数字音频水印技术是数字水印的一类。所谓音频水印,是一种利用数字音频 作品中存在的冗余数据和随机性,将一些标志信息嵌入在音频作品中,用于证明作者对作 品的所有权,并作为鉴定、起诉非法侵权的证据,或通过对水印的检测和分析,保证数字 音频作品的完整可靠性,从而成为知识产权保护和防伪的有效手段。水印的嵌入不影响原 始内容的使用价值。通过隐藏在多媒体内容中的信息,可以达到确认内容的版权和内容的 完整性。 本文主要对数字音频水印算法进行了研究和探讨。全文共分成五章: 第一章:阐述了数字音频水印技术的研究背景和意义,数字水印和数字音频水印的基 本概念,概述了数字音频水印算法的研究进展和现状,列举了本文的主要研究内容,最后 给出了全文的结构。 第二章:首先介绍了数字水印的概念及通用模型,概述了数字音频水印的概念及其典 型的应用,归纳了数字音频水印的分类;阐述了数字音频水印系统的评价标准和基本要求。 第三章:本章对数字音频水印技术中经常用到的诸如音频信号基础知识、音频文件格 式做了简单的介绍,对听觉的感知特性以及人耳的昕觉掩蔽特性、m p e g 编码中使用的心 理声学模型等进行了的介绍。 第四章:提出了一种基于局部极值的音频水印算法:该算法利用了小波变换具有多分 辨率特性,在小波域的逼近系数上定义局部极值,通过修改局部极值来实现水印的嵌入, 利用局部极值作为水印同步手段,在水印提取过程中,通过定位局部极值来检索水印嵌入 位置,实现水印信息的提取,该算法是一种盲检测的水印算法。 实验结果表明,该算法在满足水印透明性的要求,具备较强的鲁棒性,能得到较高的 水印检测和提取精度,取得较为满意的效果。是一种较为可行的数字音频水印方法。该算 法的盲检测使得更适合应用于音频作品的版权保护领域。 第五章:总结全文的工作,并指出今后进一步研究的方向。 本文的创新点:提出一种基于小波域的音频水印算法。该算法利用了音频的水印自身 信息( 局部极值) 作为同步信号,实现了盲检测。同步信息的定位应用在小波域上,小波 变换具有时频特性和去噪功能,有利于提高水印的鲁棒性;把水印嵌入在小波域的逼近系 数中,提高了水印的鲁棒性。实验结果表明了该算法具有较好的透明性和良好的鲁棒性。 l i 第一章绪论 第1 章绪论 本章阐述了数字音频水印技术的研究背景和意义,数字水印和数字音频水印的基本 概念,概述了数字音频水印算法的研究进展和现状,列举了本文的主要研究内容,最后 给出了全文的结构。 1 1 课题研究背景和意义 随着计算机网络技术和多媒体信息处理技术的飞速发展,特别是网络带宽的提高和 数据压缩技术的发展,数字媒体作品如数字化音乐、图像、影视等可以方便快捷地制作、 加工、分发。但是随之而来的是,数字化信息产品面临着非法侵权盗版和恶意篡改的考 验。今天,无论是独特创意的数字化艺术作品,还是巨额投资而成的数字电影视盘,盗 版者能以极为低廉的成本获得与原版作品完全一样的复制品,并以此谋取暴利,严重地 损害了创作者和发行者的利益。而一些具有特殊意义的信息,如涉及政府机要、司法诉 讼、企业策划等信息,则会遭到攻击和篡改伪造。一系列数字化技术本身特性带来的负 面效应,已成为信息产业持续健康发展的一大障碍,出于对利益的考虑,数字产品的版 权所有者迫切需要解决知识产权保护问题。 传统的加密技术对内容的保护只局限在加密通信的通道中或加密状态下,一旦解 密,则毫无保护而言;密码学中的认证方法对多媒体内容的保护也无能为力,这一方面 是由于多媒体内容的真实性认证往往需要容忍一定程度的失真,而密码学中的认证方法 不容许一个比特的改变;另一方面,用于多媒体认证的认证信息往往需要嵌入到多媒体 内容中,并不另外保存,而密码学中的认证方法则需要另外保存认证信息码( m a c ) : 再者,多媒体内容的数据量极大,加密解密需要巨大的运算负荷,难以满足应用的时效 性。为了解决这一难题,近几年国际上提出一种新的有效的数字信息产品版权保护和数 据安全维护的技术数字水印技术。 数字水印( d i g i t a lw a t e r m a r k i n g ) 1 - 3 是一门新兴的多学科交叉的应用技术,它为最终 解决数字产品版权保护问题提供了方向。数字音频水印技术是数字水印的一类。所谓音 频水印,是一种利用数字音频作品中存在的冗余数据和随机性,将一些标志信息嵌入在 音频作品中,用于证明作者对作品的所有权,并作为鉴定、起诉非法侵权的证据,或通 过对水印的检测和分析,保证数字音频作品的完整可靠性,从而成为知识产权保护和防 伪的有效手段,水印的嵌入不影响原始内容的使用价值。通过隐藏在多媒体内容中的信 息,可以达到确认内容的版权和完整性。 数字音频水印技术具有广泛的用途和应用前景,包括音频作品的知识产权保护、数 字指纹、隐藏标志和篡改提示、隐蔽通信、访问控制和拷贝保护等多个领域。近几年来, 国内外对于音频水印投入了大量的研究工作,且提出了许多音频水印算法,数字音频水 印取得了一些研究成果,但是距离实际应用还有很长的路要走,虽然许多水印方法都经 过了精心设计,但仍然难以抵抗蓄意的攻击。例如,2 0 0 0 年9 月初,旨在开发保护数字 福建师范大学硕士掌位论文 音乐播放、存储和分发技术规范的国际组织s d m i ( s e c u r ed i s i t a lm u s i ci n i t i a t i v e ) 为其 p h a s c - - i i 水印方案的筛选宣布了一个为期三周的公开挑战,约请公众来评价四种水印技 术( a ,b ,c ,f ) 抵抗攻击的能力。一组来自p r i n c e t o n 大学、r i c e 大学、x e r o x 实验室 的研究者参加了这次挑战并对四个音频水印技术进行了成功的攻击【4 】。从最近的报道来 看,还没有一种方法可以抵抗住各种攻击,这说明音频水印技术距离实际应用还有很长 的一段路要走。对数字音频水印的研究,不仅可以跟踪国际的先进技术和研究成果,而 且可以提高我国在知识产权保护方面的基础研究水平,完善我国的知识产权保护体系。 因此,对数字音频水印的研究,不仅具有现实的学术意义,而且具有长远的经济价值和 社会效益。 本课题研究目的是针对数字音频作品的版权保护问题而提出来的,对已提出的音频 水印算法进行分析和实现,并提出了一种基于局部极值的音频水印算法,仿真实验结果 表明,提出的算法对高斯噪声( 满足正态分布0 均值) 、重采样、重量化、m p 3 压缩 解压等操作表现出较好的鲁棒性,可以应用于数字音频作品的版权保护。 1 2 数字音频水印研究现状 数字音频水印技术是一门综合的高新技术,它是信号处理技术、通信技术、信息安 全技术、计算机技术、音频处理技术等相关学科综合发展的产物。由于音频压缩算法( 如 m p 3 ) 得到突破进展,加上网络传输、共享的推波助澜,使得工业界对音频作品的版权保 护有越来越追切的需要。因此,音频水印在近些年来得到了越来越多的重视,音频水印 的研究工作也有了飞速地发展。大多数文献都将音频水印算法分为时间域算法、变换域 算法和压缩域算法等三种类型。下面就这三种类型的数字音频水印算法研究现状做一个 总结。 1 2 1 时间域算法 时间域水印算法是在时间域上将水印直接嵌入到数字音频信号,与频域水印算法相 比,算法简单且易于实现,但对一般信号处理如音频压缩和滤波等的抵抗能力较差。时 域算法中具有代表性的有最不重要位算法、扩频方法、回声隐藏算法和相位编码算法。 最不重要比特位( l s b l e a s ts i g n i f i c a n tb i t ) 方法是把水印嵌入到载体作品最简单的 方法。文献【5 】应用了该方法实现的一种水印方法,文中用一段伪随机序列来控制嵌入水 印的位置。最不重要位算法把任何的水印都看作是一串二进制位流,而音频文件的每一 个采样数据也是用二进制数来表示,这样,可以将每个采样值的最不重要位( 一般为最 低位) ,用代表水印的二进制位替换,以达到在音频信号中嵌入水印的目的。伪随机信 号可以由伪随机序列发生器的初始值来产生,这样在收发双方只需要秘密地传送一个初 始值,而不需要传送整个伪随机序列。最不重要位算法简单易实现,但是这种方法的主 要缺点是鲁棒性较差。如果不采用冗余技术,则水印信息很容易被噪声、重采样等所破 坏。实际上,这种技术只是在封闭的、点对点的环境中才有用。 b a s s i a 等人【6 】提出了一种检测时不需要原始信号的水印方案。假设随机序列w ( i ) 表示水印信号( 以f ) 一,+ 口k 口是一个常数) ,通过与原始信号z ( f ) 相加得到隐蔽信号 y ( i ) :y o ) = x ( o + ,( x ( f ) ,“f ) ) 。函数,( ) 考虑了基本的音频掩蔽效应,使水印的幅度依 赖于音频信号的幅度,即根据每个音频样本的幅度来对之进行修改,以使水印不可觉察。 该方法具有一定的鲁棒性,但它只能检测一个音频信号是否包含水印,而不能提取嵌入 的水印信息,即在本质上是一个1 比特水印算法。 m a l l g o u t 等人【7 通过用样条插值函数来改变音频信号两个连续的最大值和最小值之 间中间段的相对长度,使之大于或小于某一阈值来分别植入1 或0 。在文献【8 】中,作者 进一步提出了一种新型算法,把包络线小波分解系数的极值点作为重要点,通过改变信 号重要点之问的距离来嵌入数据。此算法对m p 3 压缩、低通滤波具有高的顽健性,通 过使用自适应量化步长也可对时问缩放具有顽健性,亦适用于采用其它特征作为重要点 的情况,缺点是嵌入率较低。 回声数据隐藏方法【9 】通过在时间域向音频信号f ( t ) 上引入作为水印的回声信号 a f o a t ) 来隐藏信息:c ( f ) = 厂( f ) + a f ( f a t ) ;a 为衰减率,址为延迟时间,其选取以 人耳无法分辨为准则。通过改变回声信号的延迟时间来对水印信号进行编码,如选择缸 代表编码0 ,选择出。代表编码1 。解码不需要原始信号,通过信号倒谱的自相关函数 来进行。倒谱自相关函数在延迟时间缸和垃。上产生两个峰值,根据两个峰值之间的 距离决定水印信号的编码是1 还是0 。回声隐藏可以有效且几乎无失真地将水印数据嵌 入到音频信号中,但它很容易被敌手即使在没有任何先验知识的情况下检测出来,而且 在检测时由于计算倒谱使得复杂度相当高。 b o n e y 等人在文献【lo 】中提出了一种用于音频水印的扩频方法。他们选用的也是一个 p n 序列。为利用人耳听觉系统( h a s h u m a na u d i t o r ys y s t e m 的长时掩蔽效应,文中对 每个包含5 1 2 采样点的熏叠块,计算出它的掩蔽阀值,并近似地采用一个1 0 阶的全极 点滤波器,对p n 序列进行滤波。利用h a s 的短期掩蔽效应,即根据信号相应的时变能 量,对滤波后的p n 序列作加权处理,这样在音频信号能量低的地方可削弱水印。另外, 水印还要利用音频压缩、解压实现低通滤波,以保证水印可抵御音频压缩。作者用“低 频水印”和“无码水印”来表示水印的两个空间成分。利用原始信息和p n 序列,采用 相关性方法,则可通过假设检验将水印提取出来。实验结果显示了该方法对m p 3 压缩、 粗糙的p c m 量化和添加噪声都具有较强的鲁棒性。 c v e j i c 等人【l l 】利用h a s 中的时域掩蔽现象将基于扩频的水印嵌入到未压缩的原始 音频数据中。该算法不需要频域变换,所以计算代价很低可用于实时操作。该算法采用 盲检测,可抵抗4 8 k b i t s 的m p 3 压缩、全通滤波、回声、重采样、调幅、噪声、均衡化 等许多音频信号处理。但作者没有引入任何抵抗同步攻击的机制。 人耳缺乏感知绝对相位值的能力,但对相位值的相对差异要敏感些。相位成分比振 幅成分更重要,如果要除去加到相位成分中的水印信息,就必然会给音频质量带来令人 塑苎堑苎查兰堡圭兰竺丝苎 无法接受的破坏。另外根据通信理论,相位调制对噪声信号具有较强的健壮性。基于这 些原因,b e n d e r 等人【1 2 】提出了一种相位编码的方法:首先把总长度n 的信号分割为小 的音频片断c ;( h ) ,对每个音频片断应用离散傅立叶变换d f t ,把时域信号片断转换为 频率、幅度和相位,并按公式计算出幅度。( 七) 和相位垂 ) 。由于两个相邻音频片断间 的相位差很容易检测出来,因此他们的相位差必须保持不变,只是按如下公式向第一个 信号片断中植入0 和1 ,然后用原来的相位差构造一个新的相位序列 = 脍i f i 吨m = :0 。 葫( _ i ) = 九( 七) + l 画( _ j ) 一九( _ j ) j 如( 七) = 如- 1 1 ( ) + 舻,( _ j ) 一九一。( ) j 使用新的相位序列旃( _ j ) 及原始傅立叶变换的幅度。( 姊进行傅立叶逆变换并全部 串连起来产生最后的输出。检测水印时先对信号进行同步,然后检测相位,并把该相位 和两个特定点上的参考相位相比较来得到0 和1 。在另一个相位编码系统中j ,低于2 k h z 的傅立叶变换低频系数被完整的保留,而高频系数的相位值则被去掉,基于近邻参考相 位值以及待植入的信息比特值重新分配。例如,相对于参考相位的一个小的顺时针旋转 代表“1 ”,而一个小的逆时针旋转代表“0 ”。虽然相位编码是一种有效的数据隐藏方法, 但它对大多数的音频压缩技术却十分敏感。 s w a n s o n 等人【” 通过直接修改音频样本来嵌入版权保护信息。该算法与音频信号 内容相关,首先把音频分帧,然后把利用时域和频域掩蔽现象进行感知整形的伪随机序 列加到音频数据上,以此来保证嵌入的水印不可昕到并且对加p 3 压缩、有色噪声、重 采样等信号处理具有鲁棒性。此外,他们还提出了双水印的概念,即在检测时一个需要 原始音频而另一个不需要,并且认为双水印可以用于解决死锁问题。 f o o t e 等人【1 4 提出一种新方法,通过轻微地压缩和扩展小的音频区域来进行信息隐 藏。通过与原始音频进行比较可以检测到压缩或扩展的各个区域,而这些区域的位置和 长度代表了隐藏的信息。该方法在理论上是没有噪声的,也不引起频谱的变化,这是与 其它方法 e 较最大的优势。该方法尽管在理论上有新意,但其明显的缺点是不能进行盲 检测,这在许多实际应用中是没有意义的。 1 2 2 变换域水印算法 变换域水印算法是把水印信息嵌入到音频载体的变换域的数据中。一般的变换有离 散傅立叶变换( d f t ) ,离散余弦变换、离散小波变换等。 早期的音频水印技术将水印信号放在如高频区域之类的听觉上不重要的区域,以使 之不可听到【l ”。在高频区域,人的听觉敏感性相对于i k h z 左右的峰值有所下降。p r u e 8 s 等人首先整形一个伪随机序列,然后把数据嵌入到预先选择的音频频带【1 司。s o l a n a 公司 则把数据植入到音频信号的子带【”,并开发了一个叫作e d n a 的数字音频标记产品。 第一章绪论 t i l k i 等人【18 】在一个交互式电视系统的开发中,提出了一种将信息隐藏进电视伴音的方 法。在2 4 k h z 到6 4 k h z 范围内的中频带傅立叶变换系数被数字签名所代替,选择中频 带是为了使数据保持在最敏感的低频范围之外。数字签名信号相对于音频信号具有较低 的幅度,且只植入到具有高能量值的分量中,以进一步保证其不可听到。这些早期的音 频数据隐藏算法注重于如何保持高的听觉质量,对音频信号处理的抵抗力不强。 自从t r i c k l e 等人的开创性论文 1 9 】引发表后,从通信系统中借鉴来的扩频( s p r e a d s p e c t r u m ) 技术的思想在数字水印技术中得到了越来越多的应用。扩频技术的基本思想是 把窄带数据扩展到一个大的频带,对音频来说,即整个可听频谱。扩频技术有两种方法: 跳频扩频( f h s s ) 系统和直接序列扩频( d s s s ) 系统,水印技术中采用的是直接序列扩频系 统d s s s ,即将一个数字水印序列与高速伪随机码相乘或叠加到原始音频信号上,并利 用人类听觉系统的掩蔽效应进一步来整形水印信号以保证其不可听到,文献哪】和文献【2 1 1 分别利用了m p e g i 的心理声学模型i 和m p e g - i ia a c 的掩蔽模型。水印检测通过计 算带水印音频信号( 或从其中计算出来的水印信号) 和原始水印信号之间的相关性来进 行。c o x 等人瞄】被认为是扩频技术应用在数字水印上的代表性的文章。他们用( o ,1 ) 之 间满足高斯随机分布产生的x ,构成水印序列z = 而,而,z 。,用x 去修改原始信号d c t 变换系数中最重要的n 个系数矿= m ,v 2 ,v 。,得到修改后的系数u = v , 0 + 饿;) ,再进 行i d c t 得到加水印的信号。此方法最初应用于数字图像,但稍加修改即可很方便地扩 展到数字音频和视频。扩频理论通常作用在频域上,对音频压缩、低通滤波等信号处理 具有很强的顽健性,缺点是检测器严重依赖于带水印音频信号和原始水印之间的同步, 对抖动等同步攻击不够顽健。 k i r o v s k i 等人网提出几种新技术用于在音频信号中有效地嵌入和检测直接扩频序列 水印信息。主要目的是提高检测准确性、水印的不可感知性,抵抗同步攻击和消除攻击, 并在公开音频信道上建立隐蔽通信。该算法能够有效抵抗由于转速不均匀的抖晃引起的 时间和频率缩放、重采样、重量化、去噪、滤波等攻击。但实验中并没有给出详细的实 验数据。 “等人口】提出了一种基于倒谱的音频信号数据隐藏方法。倒谱系数通常比时域上的 原始样本更能经受信号处理的攻击,包括具有挑战性的时间伸缩( t i m e - s e a l i n g ) 和变调 ( p i t c h - s h i t t i n gw a r p i n g ) 攻击。与经典的扩频( s s ) 技术相比,在没有原始信号时这种方法 顽健性更强。该文提出了一种基于统计平均变换( s m m ,s t a f f s t i e a l - m e a n m a n i p u l a n o n ) 的 嵌入算法:首先选择一个倒谱系数的子集作为特征,通过将统计平均值增加到实数a 来 嵌入“l ”,增加到b ( b a ) 来嵌入“0 ”。因此,在解码器选择门限( a + b ) 2 即可简单地 做出判决。统计平均值变换方法( s m m ) 对音频同步结构的变化敏感性很小,这使它可能 经受住包括t i m e s c a l e 在内的大多数挑战性的攻击。如何自适应地选择a 和b 是需要进 一步完善的问题。 音频信号的正弦波模型将信号表示成一系列随时间变化的正弦波 福建师范大学硕士学位论文 尘ljl s ( n ) = 4 ) c o s 殄( 刀) 协( o ) = q ( 后) + b ( o ) l l lk = o 模型的3 个参数振幅4 0 ) 、相位谚( o ) 和频率c o , ( n ) 随时间缓慢的变化。g i r i n 等人瞰】将 水印嵌入到这些动态变化的参数中,这种思想的基本原理是对恰当选择的频率轨迹进行 适当的修改是不会被察觉的。水印的嵌入分为两步:首先,用基于正弦波模型的高质量 合成信号代替原信号,使泛音的频率轨迹能够清楚的被识别出来。然后,对频率轨迹进 行调制将水印信息嵌入。该方法的缺点是由于不能保证信号的形不变性,因而增加了原 始音频信号和带水印音频之间的可见差异。 1 2 3 压缩域水印算法 数字音频压缩技术的成熟,使得以m p 3 为代表的压缩格式网络音乐得以在互联网 上广泛传播。通常有如图1 1 、1 2 、1 3 所示的3 种方法可以得到带水印的压缩音频。 嵌入方法l ( 如图1 - 1 所示) 在非压缩域进行,即先向非压缩原始音频中加入水印然后再压 缩。嵌入方法2 ( 如图1 2 所示) 在压缩域上进行,水印直接加到m p e g 音频比特流上, 这使水印嵌入非常迅速,但顽健性较差,任何解压缩再压缩的处理都可以轻易地除去水 印。嵌入方法3 ( 如图1 3 所示) 首先将压缩格式的音频解压,然后将水印植入到非压缩域, 最后带水印的音频内容再被重新压缩成带水印的压缩格式音频。该方法可以提高水印的 顽健性,但时间开销太大,因为压缩过程要花费很长时间,所以不适合在线交易和分发。 图1 - 1 带压缩音频水印的嵌入方法1 f i g l - 1a u d i ow a t e r m a r k i n ge m b e dm e t h o d i 图1 2 带压缩音频水印的嵌入方法2 f i g l - 2a u d i ow a t e r m a r k i n ge m b e dm e t h o di i 第一章绪论 图1 - 3 带压缩音频水印的嵌入方法3 f i 9 1 - 3a u d i ow a t c m m d d n ge m b e dm e t h o d 剑桥大学的p e t i t c o l a s 等人提出了一种叫作“m p 3 s t e g o ”的水印技术闭。m p 3 s t e g o 在压缩过程中将水印信息隐藏进m p 3 文件。这种方法顽健性较差,作者承认任何攻击 者可以通过解压比特流再重新压缩来除去隐藏的水印信息。另一方面,m p 3 s t e g o 实际 上并没有在压缩域上直接植入水印,被处理的对象是p c m 数据,水印是在压缩过程中 被植入的,因此很耗时。 w a n g 等人田墟出的方法基于m p e gl a y e rh i m d c t 变换,m p 3 压缩和水印嵌入同 时进行。原始音频信号的低频m d c t 系数以及特定位置处的m d c t 系数的小数点后第 一个非零位置p 在经过m p 3 编码器压缩后将不会发生变化。基于这一原理,可以通过 改变m d c t 系数的值来影响p ,从而将水印嵌入到m d c t 系数中。实验结果表明即使 经过连续9 次6 4 k b i t s 的低比特率压缩,仍然能将水印提取出来,实际上经过4 次这 样的压缩后音频信号已经能明显的听出噪声了。计算过程仅包含简单的乘法和除法,可 以用于实时系统中。 q l a o 等人网提出了两种将水印直接嵌入到m p e g 音频流中的方法。第一个将水印 嵌入到m p e g 音频流的比例因子( s c a l ef a c t o r s ) 中,第二个将水印嵌入到m p e g 编码的样 本数据中。比例因子是使样本完全利用量化范围的乘数,共6 3 个级另1 ( 0 - 6 2 ) 。当比例因 子级别增加时声音增强,减小时声音变弱。实验表明比例因子级别小的改变( 如增加或 减少1 ) 不会被人感觉到,第一个方法的根据就在于此。水印嵌入过程非常简单,就是把 比例因子与相应的水印比特位相加。另一个方法的基本思想是把水印比特序列加到编码 样本序列上。可是,这些编码样本对改变是非常敏感的。实验表明,如果把每个编码样 本加l 或减1 ,引入的失真就很容易被人耳检测到。为了解决这个问题,作者引入了一 个尺度参数s p :在每s p 个样本上,随机选择l 或2 个样本来嵌入水印。选择一个好的 尺度参数可以使失真最小,实验也验证了这一点。该算法首次提出在比例因子中嵌入水 印,但没有给出详尽鲁棒性测试结果。 其它的压缩域算法还有:文献【2 9 j 在压缩格式音频未完全解压状态下基于音频掩蔽效 应自适应地嵌入数字水印,水印与音频内容高度相关并且植入速度非常快;文献【3 0 】在 m p e ga u d i ol a y e r2 压缩过程中嵌入水印;文献【3 1 】在矢量量化过程中植入水印: 文献 9 2 将水印直接嵌入到s i g m a d e l t a 调制比特流中:文献 3 3 在m p e g i i a a c 压缩过程中 通过修改压缩系数来植入水印;文献口4 】中的水印植入方法类似于m p 3 s t e g o 方法。 福建师范大学硕士学位论文 1 3 本文的研究内容及其结构 本文主要提出了一种基于小波域的音频水印算法。该算法利用小波变换的多分辨率 特征,把水印嵌入在小波变换域上的细节部分。其关键在于利用小波的逼近系数为信号 波形,定位局部极值点,通过修改局部极值的方法实现水印数据的嵌入,利用局部极值 作为水印同步手段,在水印提取过程中,不需要原始音频信号,实现水印盲检测。经实 验表明,算法能满足水印透明性的要求,具备较强的鲁棒性。 在论文的安排上,第1 章为绪论,主要介绍了课题的研究背景、数字音频水印研究 现状,最后给出了本文的研究内容及其结构。第2 章介绍了音频水印概念及通用模型、 介绍了水印音频的典型概念、典型应用、分类以及水印的攻击类型。第3 章介绍了数字 音频水印的特点,包括对数字音频相关知识,音频文件格式。介绍了听觉系统的感知特 性和m p e g 编码中使用的心理声学模型。第4 章提出了一种基于局部极值的音频水印算 法,简单介绍了小波理论、水印预处理、水印的嵌入和提取方法,最后在m a t l a b 7 1 实 验环境下,进行了实验仿真,并给出了结果。第5 章首先对本文的工作做了小结,并说 明了下一步的工作重点,以及对音频水印的研究方向进行了展望。 第2 章数字音频水印概论 第2 章数字音频水印概论 2 1 数字水印概念及通用模型 随着数字技术和因特网的发展,图像、音频、视频等形式的多媒体数字作品纷纷在 网络上发布,其版权保护与信息完整性保证逐渐成为迫切需要解决的一个重要问题。数字 水印( d i 画t a lw a t e r m a r k i n g ) 技术作为信息隐藏技术研究领域的重要分支,是实现多媒体版 权保护与信息完整性保证的有效方法,目前也正成为信息领域的一个研究热点。 数字水e 口作为信息隐藏技术研究领域的重要分支,是实现数字作晶版权保护的有效 办法。数字水印技术作为一种崭新的信息安全技术,它是将具有确定性和保密性的信息 有意识地嵌入到数字作品中,并作为原始数据的一部分而保留在其中,而且不影响原始 数字作品的使用价值。即使在数字作品受到破坏或解密之后仍可用它来跟踪数据的复制 和传输,用以证明数字作品的所有权,或作为鉴定盗版、侵权的证据,从而达到对数字 作品的有效保护。 一般地,数字水印系统保护嵌入和检测两个部分【3 5 1 。嵌入部分至少具有两个输入量: 一个是原始信息,它通过适当变换或作为待嵌入的水印信号;另一个就是要在其中嵌入 水印的载体作品。水印嵌入的输出结果为含水印的载体作品。含水印的载体作品或另一 件原始作品可作为水印检测器的输入量。大多数检测器试图尽可能地判断出水印存在与 否,若存在,则输出为所嵌入的水印信号。图2 1 给出了数字水印处理系统基本框架的 示意图。可以定义秀九元体( m ,x ,w ,k 。g ,e 皿,a t 。d ,e ) ,分别定义如下: m 代表所有可能的原始信息的集合; x 代表所要保护的数字作品x 的集合,即内容; w 代表所有可能的水印信号w 的集合; k 代表水印密钥k 的集合; g 代表利用原始信息m 、密钥k 和原始数字产品x 共同生产水印的算法,即: g :m xxk w ,w = g ( m ,x ,k ) e m 表示将水印w 嵌入数字产品x 中的嵌入算法,即: e r a :x w x x w = e m ( x w ) 这里,x 代表原始作品,x w 代表含水印产品。为了提高安全性,有时候 在嵌入算法中包含嵌入密钥。 a t 表示对含水印产品k 的攻击算法,即: a t :x k x x = a t ( x x 5 这里,k 表示攻击者伪造的密钥,x 表示被攻击后的含水印作品。 d 表示水印检测算法,即: 福建师范大学硕士学位论文 一他班砒耻腻黧, e x 表示水印提取算法,即: e x :x k w ,w i = e x ( x 。,k ) 图2 1 数字水印处理系统基本框架 f i g2 - 1a b a s i cf r a m e w o r kf o ra u d i ow a t e r m a r k i n gs y s t e m 2 2 数字音频水印的概念 数字音频水印作为数字水印的在音频上应用。通过在音频载体中嵌入数字水印信 息,来实现拷贝限制、使用跟踪、盗用确认等功能是解决这一问题的一个可行而有效的 途径。近年来有关音频水印方面的研究工作发展的速度很快,尤其在变换域的音频信息 的嵌入方面。一般说来,它是一种在不影响原始音频质量的条件下向其中嵌入具有特定 意义且易于提取信息的技术。根据应用目的不同,被嵌入的信息可以是版权标识符、作 品序列号、文字( 如艺术家和歌曲的名字) 、甚至是一个小的图像或一段音频等。水印与 原始音频数据紧密结合并隐藏在其中,通常是不可听到的,而且能够抵抗一般信号处理 和盗版者的某些恶意攻击。与传统密码学相比,水印一直存在于宿主信号中,可以一直 对数字作品提供保护,而采用传统加密手段保护的媒体在解密之后就不再受到任何保 护。 2 3 数字音频水印的典型应用 随着数字水印技术的研究的深入,数字音频水印的应用领域在不断的扩展。目前,音 频水印的典型应用包括 3 6 3 9 : ( 1 ) 版权保护领域 版权保护是数字水印技术研究和发展的直接动力,也是最主要的潜在应用领域之 一。即数字音频作品的所有者首先将水印信息嵌入到原始音频信号内,然后公开发布其 含水印版本音频作品当该数字音频作品被盗版或者出现版权纠纷时,所有者即可从盗 兰:兰茎圭童塑查塑堡笙 版音频作品或含水印版数字音频中获取水印信号作为依据,从而保护所有者的权益。在 这种应用场合中,要求水印是不可能或相当难以被去除的。 ( 2 、信息取证( i n f o r m a t i o nf o r e n s i c s ) 领域 为了避免未经授权的拷贝制作和发行,数字音频作品的出版人在不同的拷贝中嵌入 不同的i d 或序列号作为不同的水印( 数字指纹) 嵌入到音频作品的合法拷贝中,一旦发 现未经授权的拷贝,就可以根据此拷贝所恢复出的指纹来确定它的来源,用于追踪盗版 者。这在游戏中有一个有趣的应用实例是d o 蛐游戏制作公司在分发给测试者使用的测 试版本游戏的音频中加入水印以警告和跟踪泄密的游戏测试者。 ( 3 ) 访问控制和拷贝保护领域 在数字音频作品录制,播放设备的设计中应用音频水印技术,当录制播放设备工作 时,检查音频作品上是否有水印存在,以决定该数字音频作品应不应该被录制播放,使 得只有满足条件的使用者才能播放或拷贝含有水印的数据,拒绝非法拷贝音频作品的流 行和使用。例如,在一个d v d 系统中,一个特制的d v d 播放器只允许播放或拷贝含有 特定水印的数据。 隐蔽标识 将数字音频作品的标题、注释等内容( 例如,一首音乐作品的录制时间和地点等) 以 水印形式嵌入该作品中,这种隐式注释不需要额外的带宽,且不容易丢失。 ( 5 ) 数字广播控制 在广播领域中,可用数字音频水印技术以不依赖于特定频段的方式执行自动任务, 包括广播站节目类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等 ( 6 ) 数字认证领域 由千脆弱水印对篡改具有高度敏感性,可以用作信息系统中的认证工具。发送者在 数字信息中嵌入一个脆弱水印,在传输过程中含有水印的信息即使只遭到很小篡改,接 收者也无法从数据中检测到水印,因此可以断定数字信息己经受了篡改。在实际应用中, 对特定的修改( 如常用的j p e g m p 3 压缩操作) 具有一定的鲁棒性,而对于恶意篡改具有脆 弱性的“半脆弱水印”更具有应用前景。 ( 7 ) 隐蔽通信领域 将需要传递的秘密信息嵌入到允许公开的数字

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论