(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf_第1页
(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf_第2页
(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf_第3页
(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf_第4页
(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机应用技术专业论文)鲁棒性压缩音频水印算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士学位论文 摘要 随着互联网的发展和音频压缩技术的不断成熟,以m p 3 为代表的网络音乐 在数字广播、网上音频点播、在线音乐销售等系统中得到了广泛应用,由此引发 的音频媒体版权保护和安全认证等问题变得愈加突出。数字水印技术作为传统加 密方法的有效补充手段,是一种可以在开放的网络环境下保护版权和认证来源及 完整性的新技术,近年来己成为信息安全领域的一个研究热点。本文主要结合 m p 3 音频编码标准,对鲁棒性压缩音频水印技术进行了研究。 本文首先对数字音频水印技术作了较为全面的综述;然后针对已有组合压缩 音频水印算法中存在的同步问题,结合隐含同步和恒定水印的思想,提出了一种 基于局部恒定特征的组合压缩音频水印算法;在此基础上,为了进一步降低水印 的误码率,提出了一种基于级联编码的鲁棒压缩音频水印算法。本文的主要工作 包括: 1 首先对音频水印技术的有关知识进行了概述;然后从原始音频和压缩音 频两种载体出发,介绍和分析了各自典型的水印算法;最后总结了目前音频水印 中主要的攻击手段及对策,并讨论了鲁棒音频水印的评价框架。 2 提出了一种基于局部恒定特征的组合压缩音频水印算法。该算法首先采 用压缩音频内容分析方法,选取与音乐节奏、节拍等边缘信息相对应的局部区域 作为水印的嵌入位置,然后在各局部区域上提取一种对音频信号处理和同步攻击 不敏感的恒定统计特征,最后,将经过混沌调制的水印信息嵌入到m p 3 音乐局 部区域的恒定统计特征量中。实验结果表明,该算法不仅具有较好的感知透明性, 而且能够有效地抵抗常规音频信号处理以及随机剪切、抖动和邗m 等同步攻击。 3 针对上述算法在某些攻击( 1 0 的随机剪切、t s m 4 ) 下仍存在误码 率较高的情况,提出了一种基于级联编码的鲁棒压缩音频水印算法。该算法采用 b c h 码与重复码依次对嵌入前的水印序列进行编码,使得提取出的水印序列具 有纠错能力,从而进一步降低了水印经过各种音频信号处理和部分同步攻击后的 误码率,并通过对实验结果进行分析,得出了在音频水印算法中应用级联编码来 降低误码率的若干结论。 关键词:压缩音频水印鲁棒性m p 3 编码同步攻击局部恒定特征级联编码 江苏大学硕士学位论文 w i t ht h ed e v e l o p m e n to ft h ei n t e m e ta n dm a t u r eo fa u d i oc o m p r e s s i o n t e c h n i q u e s ,t h en e t w o r km u s i c , s u c h 勰m p 3 ,i sw i d e l ya p p l i e dt od i g i t a la u d i o b r o a d c a s t i n g , a u d i o - o n - d e m a n da n do n l i n em u s i cs a l e ss y s t e m s t h e r e f o r e ,t h e p r o b l e m so fc o p y r i g h tp r o t e c t i o na n ds e c u r i t ya u t h e n t i c a t i o nf o ra u d i om e d i ab e c o m e i n c r e a s i n g l yp r o m i n e n t a sa l le f f e c t i v ec o m p l e m e n to ft r a d i t i o n a le n c r y p t i o n , d i g i t a l w a t e r m a r k i n gi san e wt e c h n o l o g yt op r o t e c tc o p y r i g h ta n da u t h e n t i c a t es o u r c eo r i n t e g r a l i t yo ft h em e d i ai na l lo p e nn e t w o r ke n v i r o n m e n t , a n di nr e c e n ty e a r si th a s b e m eo n eo ft h er e s e a r c hf o c u s e si nt h ei n f o r m a t i o ns e c u r i 哆d o m a i n t h et h e s i s m o s t l yc o m b i n e sw i 也m p 3c o d i n gs t a n d a r d a n dm a k e ss o m er e s e a r c ho nr o b u s t c o m p r e s s e da u d i ow a t e r m a r k i n gt e 虻l m i q u e s t h et h e s i sf i r s tg i v e sac o m p r e h e n s i v es u m m a r i z a t i o na b o u tt h ed i g i t a la u d i o w a t e r m a r k i n g , t h e ni n t e g r a t e st h ei d e ao fl o c a l i z e dw a t e r m a r k i n gt e c h n i q u ea n d i n v a r i a n t w a t e r m a r k , a n d p r o p o s e s an o v e l c o m b i n e da u d i o c o m p r e s s i o n w a t e r m a r k i n ga l g o r i t h mb a s e d0 1 1l o c a l i z e d - l n v a r i a n t - f e a t u r e ( u f ) b y a n a l y z i n gt h es y n c h r o n i z a t i o np r o b l e mw h i c he x i s t si nt r a d i t i o n a la l g o r i t h m s i no r d e r t ob r i n gd o w nt h e b i te r r o rr a t e ( b e r ) ,t h ep a p e ra l s op r o p o s e sar o b u s tc o m p r e s s e d a u d i ow a t e r m a r k i n ga l g o r i t h mb a s e do nc o n c a t e n a t i o no fb c hc o d e sa n dr e p e t i t i o n c o d e s t h em a i nw o r l ma r ea sf o l l o w s : 1 t h er e l a t e dk n o w l e d g eo fa u d i ow a t e r m a r k i n gt e c h n i q u ei sf i r s ti n t r o d u c e d ; t h e nt h et y p i c a lw a t e r m a r k i n ga l g o r i t h m sf o rb o t hu n c o m p r e s s e da n dc o m p r e s s e d a u d i oa r ei n t r o d u c e da n da n a l y z e d ;f i n a l l y , t h em a i na t t a c k sa g a i n s tc u r r e n td i g i t a l w a t e r m a r k i n gw i t ht h e i rs o l u t i o n sa r cs u m m a r i z e d , a n dt h ee v a l u a t i o nf r a m e w o r kf o r r o b u s ta u d i ow a t e r m a r k i n gi sa l s od i s c u s s e d 2 al i f - b a s e dc o m b i n e dc o m p r e s s i o n w a t e r m a r k i n ga l g o r i t h mf o ra u d i os i g n a l s i sp r e n t e d t h el o c a l i z e de m b e d d i n gr e g i o n st h a tc o r r e s p o n d i n gt om u s i ce d g e sl i k e a u d i or h y t h m sa n db e a t s ,a r ef i r s ts e l e c t e db ya d o p t i n ga na u d i oc o n t e n ta n a l y s i si nt h e a u d i oc o m p r e s s i o np r o c e d u r e ,t h e nt h el n v a r i a n ts t a t i s t i cf e a t u r e ( i s f ) t h a ti s i n s e n s i t i v et os i g n a lp r o c e s s i n ga n ds y n c h r o n i z a t i o na t t a c k si se x t r a c t e df o re a c h r e g i o n $ f i n a l l y , t h ew a t e r m a r ki sm o d u l a t e db yar a n d o mc h a o t i cs e q u e n c ea n d e m b e d d e di n t ot h ei s fo fl o c a l i z e dr e g i o n s t h ee x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h e a l g o r i t h mi sq u i t ei m p e r c e p t i b l e ,a n dt h er o b u s m e s sa g a i n s tc o m m o na u d i os i g n a l p r o c e s s i n ga n ds y n c h r o n i z a t i o na t t a c k s , s u c ha sr a n d o mc r o p p i n g ,j i t t e r i n ga n dt s m n 江苏大学硕士学位论文 ( t i m es c a l em o d i f i c a t i o n ) ,i sa l s oi m p r o v e dc o m p a r i n gt ot r a d i t i o n a lc o m p r e s s e d a u d i ow a t e r m a r k i n ga l g o r i t h m s 3 a i m i n ga tt h eh i g hb e r c a s e se x i s t i n gi nt h ea b o v ea l g o r i t h mu n d e rs o m e a t t a c k s ,ar o b u s tc o m p r e s s e da u d i ow a t e r m a r k i n ga l g o r i t h mb a s e do nc o n c a t e n a t i o n c o d i n gi sp r e s e n t e d t h ew a t e r m a r ki sc o d e db yc o n c a t e n a t i o no fb c h c o d e sa n d r e p e t i t i o nc o d e st om a k et h ea b s t r a c t e dw a t e r m a r ks e q u e n c eh a v i n gc o r r e c t i o n c a p a b i l i t y , s ot h a tt h ew a t e r m a r k sb e rc a nb eb r o u g h td o w nf u r t h e r f u r t h e r m o r e , a c c o r d i n gt ot h ea n a l y s i sf r o mt h ee x p e r i m e n t s r e s u l t ,s e v e r a lc o n c l u s i o n sa b o u tt h e a p p l i c a t i o no fc o n c a t e n a t i o nc o d e si na u d i ow a t e r m a r k i n ga l g o r i t h mm o b t a i n e di n t h ee n d k e yw o r d s :c o m p r e s s e da u d i ow a t e r m a r k i n g ,r o b u s t n e s s ,m p 3c o d i n gs t a n d a r d , s y n c h r o n i z a t i o na t t a c k , l o c a l i z e di n v a r i a n tf e a t u r e ,c o n c a t e n a t i o nc o d e m 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规 定,同意学校保留并向国家有关部门或机构送交论文的复印件和电 子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学位论 文的全部内容或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 保密口,在年解密后适用本授权书。 不保密口。 学位论文作者签名:f 五剑 溯年6 月旧日 特狮签名猫9 乞 伊寸年务 碍 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。除文中已注明引用的内容以外, 本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。 对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 俚刮 日期:2 咿乡月l g 日 江苏大学硕士学位论文 1 1 课题研究背景 第一章绪论 自上个世纪以来,计算机网络技术和信息技术得到了空前地发展,特别是以 j p e g 、m p e g 编码标准为代表的媒体压缩技术的日益成熟,使得诸如图像、视 频和音频等多媒体产品在全球范围内呈现爆炸性增长,人类已经迈进了崭新的数 字化信息时代。数字媒体通过其表现直观、获取容易、传播迅速和存储方便等优 点,不但极大地丰富了人们的生活,也使得在网络环境下信息共享、协同工作的 效率得到前所未有的提高。然而,正如大多数技术都具有正反面的作用,数字化 技术在带给人们获取数字媒体产品便利快捷的同时,也引起了许多严重的安全问 题,例如:媒体产品的版权侵犯、软件或文档的非法拷贝、各种数字信息的肆意 篡改等等。这些问题若得不到妥善的解决,多媒体信息的应用必将受到极大的限 制,“建设数字化社会”也只能成为空谈。因此,如何有效解决网络环境下的数 字媒体版权保护和信息安全问题,就成为了一个亟待解决的研究课题。 以密码技术为核心的安全机制在传统信息安全领域取得了巨大的成功,但并 不适合解决媒体数据的版权保护和信息完整性问题。首先,传统加密算法一般用 于加密文本信息,对于图像、音乐和视频等媒体信息来说,其加密则复杂得多。 即使能够加密,也会因加密媒体的不可理解性而限制其传播和交流;其次,加密 系统只能保证数据的安全传输,却无法保护媒体内容本身,接收的数据一旦被解 密,便无法跟踪用户对解密数据的使用情况,使得非法用户可以任意地复制、修 改和传播该数据。 在这种背景下,国际上出现了一种旨在对数字图像、音乐、视频和文本内容 提供有效版权保护和内容认证的新技术一数字水印( d i g i t a l w a t e r m a r k i n g ) 技术。 与传统加密技术不同的是,数字水印的目的不在于限制或控制数据的获取,而是 充分利用人类听觉和视觉系统的特性,在不影响数字媒体可用性的条件下,嵌入 一种具有特定意义的标记( 水印) ,该标记可以经受常规信号处理和攻击而不被 清除,必要时可以通过对它进行检测和分析以保证媒体信息的完整性、可靠性和 版权归属,其优点在于:一方面作为加密技术的补充,为解密后的数据提供进一 步的保护;另一方面,由于可以在原始数据中嵌入大量秘密信息,又弥补了数字 签名技术的缺陷。数字水印技术虽然不能阻止盗版活动的发生,但它可以证明原 江苏大学硕士学位论文 创者对媒体产品的所有权,监视被保护媒体的传播、真伪和非法拷贝,并为版权 纠纷提供证据,目前已成为国际上学术研究及技术应用所关注的一个热点。 作为诸多领域的交叉学科,数字水印技术的研究涉及了计算机科学、入类生 理学、密码学、多媒体处理、数据压缩、信息论和通信理论等领域,具有重要的 理论和现实意义。近十多年来,随着网络通信和音频感知编码技术的飞速发展, 以m p 3 为代表的压缩音乐广泛应用于数字广播系统、音频点播、在线音乐销售 等大型商业系统中,使得音频媒体产品的版权保护和完整性认证需求就显得愈加 迫切。本文结合m p 3 音频编码标准,对鲁棒性压缩音频水印技术进行了深入地 研究。 1 2 数宇水印研究现状和发展 数字水印技术是信息隐藏技术的一个分支,其概念最早由t i r k e l 等人【l 】在 1 9 9 4 年国际图像处理会议0 c i v 0 4 ) 中提出,并成功应用于图像数字水印中。从 此以后,数字水印技术便引起了全世界众多研究者、科研机构和公司的广泛关注, 并且迅速成为图像处理和多媒体信息安全领域的研究热点之一。国际学术界于 1 9 9 6 年5 月在英国剑桥牛顿研究所召开了第一届国际信息隐藏技术研讨会 ( i m v :i n t e r n a t i o n a li n f o r m a t i o nh i d i n gw o r k s h o p ) ,迄今为止该会议已经召开了 八届,每次均将数字水印作为主要议题之一,而下一届也将于今年6 月在法国的 s a i n tm a l o 召开;自1 9 9 9 年起,国际光学工程师协会s p i e 和图像科学与技术协 会i s & t 每年举办专门的“多媒体内容安全和水印的专题讨论会”( s e c u r i t y a n d w a t e r m a r k i n go f m u l t i m e d i ac o n t e n t s ) ;而国际数字水印专题讨论会( i w d w : i n t e r n a t i o n a lw o r k s h o po nd i g i t a lw a t e r m a r k i n g ) 也于2 0 0 2 年至2 0 0 5 年分别在韩 国的首尔和意大利的锡耶纳召开了三届和一届,第五届则刚于去年1 1 月在韩国 济洲岛召开完毕。在所有这些国际性水印研讨会中,与会者越来越多,会议所涉 及的水印研究范围也越来越广。此外,国际上的权威学术期刊( 如s i g n a l p r o c e s s i n g 等) 也都在一些重要会议上开辟了数字水印的专题。 由于数字水印技术在多媒体内容认证和版权保护方面的应用具有巨大潜力, 自2 0 世纪9 0 年代起,不少著名大学、研究机构和知名企业都投入了大量的人力 和财力对此进行研究和开发,并取得了一定的成果。其中包括美国麻省理工学院、 英国剑桥大学、g e o r g em a s o n 大学、德国e r l a n g e n n u r e m b e r g 大学、n e c 研究 所、m 研究所、索尼、微软公司等。除此之外,国外不少公司也相继推出了 2 江苏大学硕士学位论文 一系列多媒体水印产品,如b l u e s p i k e 公司的“g i o v a n n i 数字水印系统”1 2 j , g o g n i c i t y 公司的“a u d i o k e y m p 3 水印系统”,a d o b e 公司自从p h o t o s h o p 4 0 开 始已经集成了d i g i m a r c 公司【3 】的数字水印技术“p i c t u r em a r c ”等。与此同时, 国际上对于数字水印标准的制定活动也表现得非常积极,如i b m 、n e c 等信息 产业巨头也一直参与有关版权保护水印标准的制定工作。如拷贝保护技术工作组 ( c p t w g :c o p yp r o t e c t i o nt e c h n i c a lw o r k i n gg r o u p ) 于1 9 9 8 年成立了专门的小组 d h s g ,考虑制定版权保护水印的技术标准,并提出了一些基本的要求。安全数 字音乐原创( s d m i :s e c u r e dd i g i t a lm u s i ci n i t i a t i v e ) 早在1 9 9 9 年便公布了第一阶 段鲁棒性测试规程,以保护在i n t e r n e t 上发布的数字音频文件,其第二阶段防非 法复制的技术标准也正在制定当中。 随着国际间的信息与技术交流,国内在数字水印方面的研究也逐步从技术跟 踪转向深入系统研究。自1 9 9 9 年第一届中国信息隐藏学术研讨会( c m w :c h i n a i n f o r m a t i o n h i d i n g w o r k s h o p ) 召开以来,国内的许多高校和科研机构如中山大学、 哈尔滨工业大学、北京邮电大学、中科院自动化所、清华大学、山东大学等,都 积极参与到这个领域的研究和交流之中,为我国信息隐藏研究领域迈出了共同探 讨协作研究的第一步。目前该会议已成功举办了六届,第七届全国信息隐藏学术 研讨会c i h w 2 0 0 7 也将于今年1 1 月在南京理工大学召开。这些研讨会使得近十 年国内数字水印技术的研究交流越来越频繁,水印研究者也越来越多,同时也取 得了很多可喜的成果。在数字水印技术实用化方面,国内一些公司也已经开发出 相应的水印产品,其中有代表性的有:上海的阿须数码技术有限公司专门从事数 字水印、多媒体信息和网络安全、防伪技术等软硬件开发,并已经申请了一项国 际和三项国家数字水印技术专利;北京华旗数码影像技术研究院研发的新一代图 像、文本数字水印技术也已成功应用于新华社图片版权保护系统和新华社文稿版 权保护系统。这些公司的创办表明了数字水印技术在国内已经走上了实用化和商 业化的道路。 数字水印技术的提出最初源自图像水印,随着研究的不断深入和媒体产品的 日益丰富,其应用也逐渐发展到音频、视频和三维模型等媒体更为丰富的载体上。 相比其他媒体水印来说,音频水印的研究具有相当大的难度,这主要是因为人类 听觉系统h a s ( h u m a na u d i t o r ys y s t e m ) l e 人类视觉系统h v s ( h u m a nv i s u a l s y s t e m ) 对媒体的失真更为敏感。目前数字音频水印的研究主要集中在时域水印 和变换域水印。前者主要有最低有效位l s b ( l e a s ts i g n i f i c a n t b i t s ) 算法和回声隐藏 3 江苏大学硕士学位论文 ( e c h oh i d i n g ) 算法等。如文献f 4 1 提出用水印数据替换时域采样点的最低有效位来 达到水印嵌入的目的。通过利用人类听觉系统h a s 对声音信号具有的后屏蔽特 性,作者还设计出一种基于回声隐藏的水印嵌入方法,通过调整音频信号回声的 幅度、偏移及衰减幅度来嵌入水印。提取过程是通过计算编码信号倒谱的自相关, 再搜索其峰值出现的位置来实现。时域水印算法虽然嵌入的水印信息量较大,但 同时带来了可感知的噪声,而且对信号处理稳健性差的缺点也十分明显。因此, 越来越多的研究者借鉴信号处理中常用的一些变换技术,将水印数据嵌入到变换 域中。如文献5 】提出一种离散傅立叶变换( d f t ) 域的音频水印算法,他们利用人 类听觉掩蔽效应,用水印序列替换d f t 中频佗4 k h z , - 6 4 u - i z ) 系数来完成水印嵌 入。文献f 6 1 提出一种采用扩频思想的离散余弦变换( p e r ) 域水印算法。此外,还 有一些基于离散小波变换( d w d 域的音频水印【7 捌和倒谱域的水印算法嗍。 现有的音频水印算法大都针对非压缩的音频载体,如w a v 格式,然而在实 际应用中,大多数音频信号都是以压缩的形式存储并传输,由于压缩去除了音频 媒体的大部分冗余信息,用传统水印算法嵌入的水印信息将不可避免地会受到音 频压缩的影响,因此基于m p e g 编码的压缩音频水印技术成了目前音频水印技 术中的一个新的研究方向。目前,压缩音频水印算法主要分为三种【9 1 0 】: 0 ) m p e o ( m p 3 、a a c ) 玉, 缩域水印算法,即直接将水印信息添加到m p e g 音频比 特流上;( 2 ) 比特流水印算法,即首先将压缩格式的音频解压,然后将水印植入 到非压缩域,最后带水印的音频内容再被重新压缩成带水印的压缩格式音频;( 3 ) 组合压缩水印算法,该方法将频域扩频水印方法与分析一合成方法,最大的优点 是可以同时实现音频压缩和水印嵌入,在压缩参数和水印参数之间实现最佳的匹 配,计算复杂度较低。 文献【1 1 】提出了修改m p e g 音频帧的比例因子和编码样本序列两种方法来嵌 入水印。文献f 1 2 1 提出在m p 3 压缩过程中隐藏水印信息的方法,用该方法嵌入水 印后的m p 3 文件经过解压再重新压缩后水印信息将会丢失,因而鲁棒性不高。 文献 1 3 ,1 4 提出一种基于m p e g - 2 a a c 的比特流音频水印算法,这类算法由于 需要经过“解码一加水印一编码”的处理流程,而且水印是嵌入在反量化后的频 域系数中,因而实时性和鲁棒性都不太高。文献 1 5 1 提出一种新的基于m d c t ( 改 进离散余弦变换) 的m p 3 音频水印算法。该算法的水印嵌入过程可以与m p 3 压 缩过程同步完成,提供压缩音频水印系统的实时性,而且水印提取不需要原始音 频,是一种盲检测水印算法。在此基础上,文献f 1 6 1 提出了基于遗传算法的m i ) c x 4 江苏大学硕士学位论文 域音频水印算法。该算法在m p 3 压缩过程中利用遗传算法来选择最优的m d c t 系数嵌入水印信息,既保证了水印的安全性又优化水印的透明性和鲁棒性。 压缩音频水印技术中需要考虑的几个关键问题有:由于人耳昕觉相比视觉敏 感,而且压缩编码又去除了音频信号的大部分冗余信息,使得以压缩音乐为载体 的音频水印嵌入受到更大的限制,因此如何设计一种不可感知性好、鲁棒性高以 及实时性强的水印嵌入策略是我们将要努力的方向;另外,同步攻击对所有音频 水印技术都是一个需要考虑的难题。 本文对已有压缩音频水印算法进行了分析和研究,特别借鉴了前人解决音 频水印同步问题的思想,结合音频编码标准对鲁棒压缩音频水印技术进行了初 步探索和研究。在此基础上,还研究了级联编码对压缩音频水印系统的影响, 通过实验对级联编码改进数字水印信道的界限进行了分析。 1 3 论文的主要工作 本课题得到江苏省高校自然科学指导性计划项目( 0 5 j k d 5 2 0 0 5 0 ) 资助。 本文在广泛阅读国内外现有的数字音频水印、鲁棒水印等相关文献后,分析 和比较了已有压缩音频水印算法的特点,借鉴原始音频水印中解决同步攻击的方 法,设计了一种基于局部恒定特征的组合压缩音频水印算法。在此基础上,又引 入一种级联编码策略,提出了一种更为完善的鲁棒压缩音频水印算法。本文的主 要研究的内容和工作包括以下几个方面: 1 音频水印技术及其抗同步攻击问题的研究 介绍数字音频水印技术的系统模型、基本特征、分类及应用领域,从原始音 频和压缩音频两种载体出发,研究现有的一些典型音频水印算法,并讨论在音频 水印技术中解决同步攻击的主要对策,为下文的进一步研究打下基础。 2 抗同步攻击压缩音频水印技术的研究 同步攻击对于任何音频水印系统都是一个严重问题,而压缩音频水印技术由 于受到音频编码的约束,其同步问题的解决存在一定的限制。本文通过对原始音 频水印算法中解决同步攻击的各种方法进行比较和分析,得出隐含同步和恒定水 印的方法更适合用于解决压缩音频水印中的同步问题,在此基础上,提出一种新 的抗同步攻击组合压缩音频水印算法。首先采用压缩音频内容分析的方法在压缩 过程中提取音频特征,并选取抗音频信号处理和同步攻击能力强的局部区域作为 水印嵌入位置,再通过在局部区域中寻找一种抗各种攻击能力好的恒定统计特征 5 江苏大学硕士学位论文 来进行水印嵌入。通过实验分析,该算法能在保证水印音频感知质量良好的情况 下,有效地抵抗一般音频信号处理和随机剪切、抖动、髑m 等同步攻击。 3 级联编码在压缩音频水印中的应用研究 一般来说,水印误码率是衡量音频水印鲁棒性的一个主要参数。在研究纠错 编码基本原理和级联编码策略的基础上,对本文的抗同步攻击组合压缩音频水印 进行了完善,提出一种基于级联编码的鲁棒压缩音频水印算法。该算法以b c h 码为内码、重复码为外码对嵌入前的水印信息进行编码,使得水印提取时能够更 有效地纠正水印序列中的错误比特,解决了水印在某些较强攻击( 如1 0 的随机 剪切的缩放比 4 的t s m 等) 下误码率偏高的问题,从而进一步提高了压缩音 频水印的鲁棒性。 1 4 论文的结构安排 论文共分五章,主要内容概要如下: 第一章介绍本课题的研究背景和意义,简要回顾了数字水印技术的研究现状 及发展,并阐述了本文的主要研究内容和工作。 第二章对数字音频水印技术的有关知识进行概述,重点分析和比较了原始音 频水印和压缩音频水印中的一些典型算法,总结了目前在音频水印中解决同步攻 击的对策,并介绍了鲁棒水印的评价框架。 第三章简要介绍了m p 3 编码标准中的关键技术,分析了已有组合压缩音频 水印算法的不足,结合隐含同步和恒定水印的思想,提出了一种基于局部恒定特 征的组合压缩音频水印算法,并对该算法的实验结果进行了分析。 第四章对纠错码及其在数字水印中的应用进行概述,提出了基于级联编码的 鲁棒压缩音频水印算法,并通过实验分析了级联编码对压缩音频水印的影响。 第五章对全文进行总结,并对未来的研究方向进行了一些展望。 6 江苏大学硕士学位论文 第二章数字音频水印技术综述 随着越来越多的数字化音像和音乐制品的制作和发行,音频媒体的版权保护 也显得越来越重要。通过在音频载体中嵌入水印信息,可以实现拷贝限制、使用 跟踪、盗版确认等功能。近年来,有关数字音频水印技术的研究工作发展很快, 出现了许多具有代表性的算法。本章对数字音频水印技术进行了概述,从原始音 频和压缩音频两类载体出发,分析比较了各自具有代表性的水印算法,总结了目 前音频水印面临的主要攻击问题及其解决方案,并介绍了音频水印的评价框架, 为本文鲁棒压缩音频水印技术的研究提供了理论基础。 2 1 音频水印技术简介 音频水印是多媒体数字水印技术研究的一个分支,与图像、视频水印技术不 同,音频水印具有自己的一些特点:( 1 ) 音频是一维信号,而图像、视频都是二 维信号,两者的带宽不同;( 2 ) 人类听觉感知系统比视觉感知系统更为灵敏,人 耳对声音的相位感知不敏感,而对音频信号周期即音调感知敏感;( 3 ) 相比静止 图像,音频数据量要大的多,音频水印算法通常需要分块处理。然而作为一种非 平稳信号,在对声音进行分块变换时,还需要考虑信号的时变特性。下面首先从 音频水印的概念、框架模型、基本特性、分类及应用等方面对音频水印技术进行 概述。 2 1 1 音频水印概念及其系统模型 数字音频水印技术就是在不影响原始音频质量的条件下向其中嵌入具有特 定意义且易于提取的信息的过程。根据应用目的的不同,被嵌入的信息可以是版 权标识符、作品序列号、文字( 如艺术家和歌曲的名字) ,甚至是一个小的图像 或小段音频等。水印与原始音频数据紧密结合并隐藏在其中,通常是不可听到的, 而且能够抵抗一般音频信号处理和盗版者的某些恶意攻击【m 。 从信号处理的角度看,嵌入的水印信号可以看成是在载体强信号下迭加的一 个弱信号,只要迭加的水印信号强度低于人类听觉系统( h a s ) 对声音的感知门 限,则人耳就无法感知到信号的存在。由于人类感觉器官存在感知冗余,以及音 频信号本身也存在数据特性冗余,因此通过对音频载体信号作一定的调整,就有 可能在不引起人感知的情况下嵌入某些信息。 7 江苏大学硕士学位论文 从数字通信的角度看,水印嵌入又可理解为在一个宽带信道( 音频载体) 上 用扩频通信技术传输一个窄带信号( 水印) 。尽管水印信号具有一定的能量,但 分布到信道中任意频率上的能量是难以检测到的。水印的检测则是一个有噪信道 中弱信号的检测问题。 传统音频水印算法主要包括水印的嵌入和水印的检测提取两个过程。其系 统模型如图2 2 所示。 图2 1 数字音频水印系统模型 设a 和a 分别表示原始音频和嵌入水印后的音频,w 为原始水印,w 为 水印提取结果,可以是判断水印是否存在的结果,也可以是提取出来的水印信息, 这取决于水印提取算法。k 和k7 分别表示嵌入和提取时所需的参数( 如密钥、 边信息等) 。又设e 为水印的嵌入算法,则水印的嵌入过程可以表示为: a = e ( a p ( a ) ,l 【,w p ( w ) )( 2 1 ) 其中,a p 和w p 分别表示对原始音频载体a 和原始水印w 的预处理操作, 这可以是一种变换操作( 如水印的降维、置乱,载体的d w t 、d c t 等) ,也可 以是空操作。 水印的检测,提取可以分为两类:一类在检测时不需要原始数据a 与原始水 印w ,称之为盲检测算法;另一类是非盲检测算法,在检测时需要原始数据a 或原始水印w 作为参考才能提取出水印。设d 为水印检测操作,a 表示传输过 程中受到干扰的音频信号,则水印的盲检测过程可表示为: w = d ( a ,k )( 2 2 ) 相应地,非盲检测过程可表示为: w = d ( a ,a ,k ) ( 2 3 ) 最后还需要计算w 和w 的相似度p ,当p 超过给定阈值t 时,则认为音 频中嵌入了水印;反之,说明音频中没有嵌入水印。通常用误码率b e r 作为度 量标准。 在实际应用中,一个完整的水印系统还可能包含特定的水印生成模块,如扩 频水印、混沌水印、纠错编码水印、基于音频特征的水印等。音频水印技术作为 8 江苏大学硕士学位论文 水印技术的重要部分之一,最终需要引入到音频信息处理系统之中,作为保障其 信息安全的重要砝码。随着越来越多的音频处理系统与有损压缩编码的结合,音 频水印的系统构成与具体的音频编码也变得不可隔离。 目前,针对m p e g 压缩音频的水印算法主要有三种嵌入方案刚o l ,如图2 2 所示。 水印l , 咝姐鎏严骘频 ( a ) 压缩域音频水印 比特流音频水印 水印l 幽咂b 咝刮篇徽p 掣 ( c ) 组合压缩音频水印 图2 2 基于m p e g 编码的音频水印嵌入方案 方案一是压缩域音频水印,这种方法作用在压缩域上,水印直接加到m p e g 编码器参数之中,如图2 2 ( a ) ;方案二是比特流音频水印,它首先解压音频比特 流,再将水印添加到音频信号非压缩域,最后将带水印的音频内容重新编码成压 缩格式音频,如图;方案三是组合压缩音频水印,这是一种在原始音频压缩 编码的同时进行水印嵌入的方法,如图2 2 ( c 。 2 1 2 音频水印的基本特征 一般来说,音频水印的特征会随具体应用要求的不同而有所区别,本文我们 主要讨论的是用于版权保护机制的鲁棒性音频水印,它具有以下的一些基本特 征: 1 不可感知性 不可感知性又称透明性,是指水印嵌入不会给音频质量带来感知上的变化。 通常采用主观试听测试的方法进行度量,客观上也通过信噪比s n r ( s i g n a lt o 9 江苏大学硕士学位论文 n o i s ep a t i o ) 等性能指标来衡量;它的另一层意思是,水印对非授权用户来说在统 计上是不可恢复的,即对大量使用相同方法和水印处理过的信息产品,即使采用 统计方法也无法提取、确定甚至移除水印。这可以通过在水印生成阶段使用一组 密钥来保证水印统计上的安全性。 2 鲁棒性 音频水印应该具有经受各种常规信号处理、水印去除和同步攻击的能力。任 何企图移除和破坏水印的操作都将导致音频质量的严重破坏。鲁棒性应该包含抵 抗如有损压缩、滤波、噪声干扰、重采样、随机剪切和抖动等。 3 水印带宽 水印带宽指单位长度的音频中可以嵌入的信息量,通常用比特率t , p s 来表 示,即每秒能够嵌入水印的比特数。一般来说,水印信息容量越大,水印的检测 和提取就越方便。 4 安全性 音频水印应该具有抗非法嵌入、检测和篡改等恶意攻击的能力。水印的安全 性不应该通过算法本身来实现,而应该依赖于密钥。理想情况下,如果水印生成、 嵌入或提取的密钥未知,即使水印算法已知,也无法提取、伪造、去除水印数据。 5 计算的复杂度 计算复杂度也是衡量音频水印算法的一个重要因素,由于音频的数据量大而 且实时性要求高,所以水印嵌入和检测算法应该足够快,以满足对分布式网络上 的多媒体数据进行监控和管理的要求。 6 盲检测 非盲检测水印虽然有较强的稳健性,但由于受传输通道容量、存储空间及其 他实际情况的限制,在检测时获得原始数据是很不现实的,因此非盲检测水印的 应用受到很大的限制。实际的应用中使用哪种检测方式取决于具体的应用场合。 2 1 3 音频水印的分类 根据不同的分类标准,数字音频水印可以分为如下几类嗍: ( 1 ) 按照水印载体的数据域可分为:原始音频水印和压缩音频水印。原始音频 水印针对非压缩音频信号进行处理,如在p c m 音频信号中嵌入水印;而压缩音 频水印则是与某种音频编码标准如m p 3 、a a c 、m p e g - 4 等相结合,水印载体 为压缩音频。从嵌入的位置来看,前者又可分成时域水印和变换域水印。 江苏大学硕士学位论文 ( 2 ) 按照水印的抗攻击能力可分为:鲁棒性水印和脆弱性水印。鲁棒水印指在 恶意攻击下仍不能被篡改、去除的水印,除非载体受到严重的破坏。一般用于版 权保护、数字指纹等领域。脆弱水印对音频媒体处理较为敏感,作品的改动可以 反映在水印状态中,其中还有一类称为半脆弱水印,这类水印对滤波、压缩等信 号处理稳健,对裁剪、恶意攻击等敏感。脆弱半脆弱水印通常应用于多媒体认 证与防伪。 ( 3 ) 按照水印嵌入的信息量可以分为:1 比特水印和多比特水印。前者仅可判 断音频载体中“有水印”或“无水印”两种情况;而后者可以是有意义的信息, 如版权所有者姓名、商标和产品条码等,在实际中有更大的应用价值。 ( 4 ) 按照水印检测时是否需要原始音频或水印信息可分为:私有水印和公有水 印,也称非盲检测水印和盲检测水印。私有水印在检测过程中需要原始作品的参 与,通常鲁棒性较强,但其应用受到存储、传输速度等条件的限制;公有水印由 于检测不受原始载体的限制,其应用更加广泛,例如访问控制与隐蔽通信等应用 领域中通常都使用公有水印。 ( 5 ) 按照水印嵌入和检测所采用的加密算法可分为:对称水印和非对称水印。 目前绝大多数水印方案都是对称水印,即水印的嵌入与水印的检测互逆。同密码 学一样,水印的安全性不能依靠保密水印算法来保证。在水印算法公开的条件下, 攻击者如果知道密码,就能轻易删除水印,所以目前大多数水印算法都不公布密 钥。非对称水印要求公开水印算法和密钥,以方便任何人检测水印,却无法根据 公开的信息来破坏水印。目前,非对称水印的研究报道还比较少,真正有意义、 切实可行的非对称水印算法仍需要大量的研究。 2 1 4 音频水印技术的应用领域 数字水印的出现最初是为了保护多媒体产品的版权,然而随着水印技术的发 展,事实上人们还发现数字水印在广播监听、认证和完整性效验、指纹鉴别、拷 贝及使用控制、标题与注释等领域都有重要应用。下面对数字水印技术的这几种 典型应用及针对各种应用的设计要求予以简要介绍。 1 版权保护 版权保护是数字音频水印技术产生的源动力,也是最主要的潜在应用领域之 一。版权所有者在数字音频产品中嵌入版权信息( 水印) ,然后公开发布他的水 印版本作品。当该作品被盗版或出现版权纠纷时,所有者可利用从盗版作品中获 1 1 江苏大学硕士学位论文 取的水印信号作为依据,从而保护其合法权益。这要求水印必须有较好的不可感 知性、稳健性和安全性。目前已有很多用于版权保护的音频水印算法【1 9 2 0 1 。 2 广播监控 对于购买了广告的商业用户来说,他们需要知道购买的广告是否在规定时段 内被播放和播放了多少次。这可以通过在待播广告的音频中嵌入特定信息,利用 监控设备自动跟踪电台或电视台的广告播放情况。另一个应用是关于音频内容的 监控,音乐家或者演员也会要求电台在播放他们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论