(信号与信息处理专业论文)数字音频多水印技术的研究.pdf_第1页
(信号与信息处理专业论文)数字音频多水印技术的研究.pdf_第2页
(信号与信息处理专业论文)数字音频多水印技术的研究.pdf_第3页
(信号与信息处理专业论文)数字音频多水印技术的研究.pdf_第4页
(信号与信息处理专业论文)数字音频多水印技术的研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(信号与信息处理专业论文)数字音频多水印技术的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 随着i n t e r a c t 的日益普及,多媒体信息的交流已经达到了前所未有的深度和广度, 其发布形式也愈加丰富。人们可以通过网络发布自己的作品、重要信息和进行网络贸易 等,但随之出现的问题也十分严重。如作品侵权更加容易,篡改更加方便。在这种背景 下,数字水印技术作为多媒体数据版权保护和内容可靠性认证的一种新技术,从2 0 世 纪9 0 年代以来得到了迅速的发展,成为当今国内外学术界研究的一个热点。 本文以音频数据作为水印嵌入对象,主要研究数字音频多水印技术。首先,阐述了 课题提出的意义和研究背景,分析了相关概念及特性,回顾了几种典型的算法。其次, 介绍了本论文中用到的基本理论知识。最后,针对两个不同问题,本文给出了不同的解 决方案。第一种方法以独立分量分析算法为基础,针对作品多著作权的版权保护问题, 给出一种基于盲源分离的小波域多重音频水印方法,该方法可以同时将代表不同作者的 信息嵌入到音频中。第二种方法针对数字媒体需要同时进行版权保护和篡改区域定位的 目的,给出一种基于小波变换的多目的音频水印方法。该方法利用一个水印信号,实现 了版权保护和篡改区域定位的双重目的,具有操作简单和计算量较少的优点。但是,该 水印方法实际上是1 比特水印,即只能检测到音频信号中是否含有水印信息,直观性较 差。针对这一缺点,本文又给出了一种基于线性混合的双变换域多目的音频水印方法, 该方法通过嵌入两个水印信号,同时实现了版权保护和篡改区域定位的目的。 实验结果表明,三种方法均满足音频水印技术对透明性、鲁棒性和安全性的要求; 从隐秘信号中分离水印信号时,都不需要宿主信号的参与,可以应用于数字音频产品的 版权保护或篡改区域定位。 关键词:音频水印;盲源分离;版权保护;篡改定位 大连理工大学硕士学位论文 s t u d y o nt h et e c h n i q u eo fm u l t i p l ed i g i t a la u d i ow a t e r m a r k i n g a b s t r a c t a st h ed e v e l o p m e n to ft h ei n t e m e t ,t h ec o m m u n i c a t i o no ft h em u l t i m e d i ai n f o r m a t i o n h a sb e c o m em o r ea n dm o r ep r e v a l e n ti nd e p t ha n dw i d t ht h a nb e f o r e t h ed i g i t a lw o r k s i m p o r t a n ti n f o r m a t i o na n di n t e m e tt r a d ec a nb ei s s u e do v e rt h ei n t e r n e 4b u ta tt h es a m et i m e , i ta p p e a r sas e r i e so fp r o b l e m s t h ep i r a t ea n dt a m p e r i n ga r em o r ea n dm o r es i m p l e d i 舀t a l w a t e r m a r k i n g a san e wm e a nt o p r o v i d ec o p y r i g h tp r o t e c t i o na n da u t h e n t i c a t i o n o f m u l t i m e d i ad a t ah a sb e e nd e v e l o p i n gr a p i d l ys i n c e1 9 9 0 s ,a n db e , c o m e 络a ni n t e r n a t i o n a l l yh o t t o p i ca tp r e s e n t i nt h i sp a p e r , t h em a i nt a s ki sf o c u s e do nd i 【g i t a la u d i ow a t e r m a r ks c h e m e f i r s t l y t h e m e a n i n go ft h et a s k , t h er e s e a r c hb a c k g r o u n d , a n dt h er e l a t e dc o n c e p t sa n dc h a r a c t e r i s t i c sa r e i n t r o d u c e d s o m et y p i c a lm e t h o d sa r er e v i e w e da sw e l l s e c o n d l y ,b a s i cb a c k g r o u n d k n o w l e d g er e l a t e di si n t r o d u c e d a f t e ra l l ,t h r e ek i n d so fd i 【g i t a la u d i ow a t e r m a r k i n gm e t h o d s a r ep r o p o s e dt os o l v et w od i f f e r e n tp r o b l e m s a i ma tt h er e q u i r e m e n tf o rt h ea p p l i c a t i o nt h a t n e e ds o l v et h ec o p y r i g h to ft h em u l t i p l ea u t h o r s ,ad i s c r e t ew a v e l e tt r a n s f o r m w d d o m a i nm u l t i p l ew a t e r m a r k i n gs c h e m eb a s e do nb l i n ds o u r c es e p a r a t i o n ( b s s ) i si n t r o d u c e d i nt h ef i r s tm e t h o d t h es e c o n dm e t h o d ,am u l t i p u r p o s ew a t e r m a r k i n gs c h e m eb a s e do nd w t , i su s e dt os o l v et h ep r o b l e mt h a ts o m e t i m en e e dt op r o t e c tt h ec o p y r i g h to ft h em u l t i m e d i a a n dl o c a t et h et a m p e r e da r e a ss i m u l t a n e o u s l y i nt h i sm e t h o d ,o n l yo n ew a t e r m a r ki su s e dt o r e a l i z et w od i f f e r e n tp u r p o s e s b u ti nf a c t ,i ti s1 - b i tw a t e r m a r ks c h m e i tc a no n l yd e t e c t w h e t h e rt h e r ei saw a t e r m a r ki nt h eh o s ta u d i o t oo v e r c o m et h i ss h o r t c o m i n g , a l li m p r o v e d s c h e m et h a tad u a l d o m a i nm u l t i p u r p o s ew a t e r m a r k i n gs c h e m eb a s e do nl i n e a rm i x i n gi s i n t r o d u c e di nt h et h i r ds c h e m e e x p e r i m e n t a lr e s u l t ss h o wt h a ta l lo ft h et h r e em e t h o d sc a ns a t i s f yt h er e q u i r e m e n t so f t r a n s p a r e n c y , r o b u s t n e s sa n ds e c u r i t y ;t h ew a t e r m a r ks i g n a lc a nb ee x t r a c t e db l i n d l y ; a c c o r d i n gt op r a c t i c a la p p l i c a t i o n s t h ew a t e r m a r k i n gs c h e m ep r o p o s e di nt h i sp a p e rc a l lb e a p p l i e di ne o p y r i g h tp r o t e c t i o no rt a m p e r e da r e a sl o c a l i z a t i o n k e yw o r d s :a u d i ow a t e r m a r k i n g ;b l i n ds o u r c es e p a r a t i o n ;c o p y r i g h tp r o t e c t i o n ;t a m p e r e d a r e al o c a l i z a t i o n 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料与我- - n 工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名;,丝盏墨日期:型z :! :兰 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位 论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送 交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理 工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也 可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名:二麴! 益墨 导师签名:j 芝f z 丑年l 月日 大连理工大学硕士学位论文 1绪论 1 1 选题的意义和研究背景 随着数字多媒体技术及互联网技术的迅猛发展,使得图像、视频和音频等多种形式 的多媒体数字作品的创作、存储和传输变得极其便利。以m p 3 为代表的音乐作品通过网 络渗透到世界的每一个角落。人们可以很方便地通过网络下载自己喜欢的音乐,这不仅 促进了信息的共享,同时也使得人们获得资源的成本大大减少。但随之带来的问题是: 盗版者可以利用网络途径获得这些非授权资源,制作成大量的c d 光盘等进行非法销售, 并获得巨大的商业利益,使得作品的制作者或发行者蒙受巨大的损失。在水印技术提出 之前,传统的加密技术是版权保护的主要手段,但是,由于数字产品发行量非常大,且 易于复制,并且考虑到音乐制片公司需要在网络上宣传产品,这就给非法盗版者以可乘 之机。因此,如何实施网络环境下的版权保护和信息安全已经成为一个亟待解决的问题。 数字水印技术在这种情况下应运而生,并且在多媒体数据安全保护中发挥着越来越 大的作用。目前,数字水印技术主要涉及数字图像、视频和音频等领域。在数字水印发 展之初,人们的注意力主要集中在图像和视频上,因为与这两种水印嵌入技术相比,在 数字音频信号中嵌入水印的技术难度较大,这主要是由于人类听觉系统与视觉系统相比 具有更高的灵敏度。随着数字水印技术研究的深入,越来越多的学者将目光投向了数字 音频水印技术领域。这是因为利用听觉系统的一些特性,如掩蔽效应、听觉系统对绝对 相位不敏感等特性来嵌入水印,同样可以取得很好的效果。目前,大多数数字音频水印 技术主要集中在版权保护的鲁棒水印或内容完整性验证的脆弱水印等单个目的水印技 术上。随着人们对数字音频水印技术关注的越来越多,已经将研究领域延伸到音频多水 印系统。本文主要研究数字音频多水印技术。 1 2 数字音频水印技术概述 1 2 1 数字音频水印技术的概念 数字音频水印技术是一种信息隐藏技术,它的基本思想是在数字音频中通过一定的 算法嵌入秘密信息,达到保护产品的版权、证明产品的真实可靠性、跟踪盗版行为或者 提供产品的附加信息等目的。这些信息可以是具有特定意义的信息,如:版权标志、用 户序列号或者是产品相关信息等,可以用来识别音乐制品的来源、版本、原作者、发行 者、所有者以及合法使用者对数字音频产品的所有权;也可以是不具有任何意义的随机 数字音频多水印技术的研究 信号,用来证实待检测音频产品的存在性或完整性。水印信号根据具体的应用可以是一 维序列,也可以是二维阵列,甚至是三维或高维信号。一般与应用的载体相关。 众所周知,人类的听觉系统是有缺陷的检测器,听觉信号在可被人类察觉前必须有 一个最小的强度和对比级,这些最小级取决于人类听觉系统( h u m a na u d i t o r ys y s t e m , h a s ) 的空间、时间和频率特征。而数字音频产品是为了满足人们的听觉要求的,所以 在不破坏其使用价值的前提条件下,嵌入数字音频水印而不被察觉是有可能的。任何数 字信号有其固定的误差范围,即所谓的噪声,因为它只是模拟信号的近似值。数字音频 水印的制作过程可以看作是将水印信息作为附加噪声融合在原始音频信号中,只要附加 噪声的强度远远小于人的感觉器官能够察觉到的最小强度,水印信息就无法被感知,所 有数字音频水印技术都明确地或隐含地利用了人类听觉系统的这个特征。 1 2 2 数字音频水印技术的基本架构 典型的数字音频水印系统应包括水印的生成、嵌入和提取或检测三部分。 ( 1 ) 水印的生成 通常,希望嵌入到宿主音频信号中的水印信息一般不能直接嵌入,都需要经过一些 预处理的过程。例如,由于音频信号是一维的,因此想要将一个二维图像作为水印信号 嵌入到音频之前需要先将其降成一维。有时为了增强安全性,还要进行置乱等操作。这 些操作都是在水印的生成阶段进行的。 ( 2 ) 水印的嵌入 水印信息的嵌入是数字音频水印系统的核心部分,通常需要考虑水印的不可见性和 鲁棒性。二者是相互矛盾的,需要根据具体的应用在二者之间做出折衷选择。在应用于 版权保护的水印系统中,需要算法具有很高的鲁棒性。而在完整性验证等应用领域,对 鲁棒性的要求则不是很高。 数字音频水印嵌入模型如图1 1 所示。 水印信息 密钥 图1 1 数字音频水印系统的嵌入模型 f i g 1 1t h ee m b e d d i n gm o d e lo f t h ed i g i t a la u d i ow a t e r m a r k i n gs y s t e m 大连理工大学硕士学位论文 ( 3 ) 水印的提取或检测 如果嵌入的是有意义的水印信息( 如图像等) ,就需要在隐秘音频信号中提取水印信 息。如果嵌入的是1 比特水印信息( 如m 序列等) ,就需要检测音频中是否含有水印信息。 数字音频水印提取或检测模型如图1 2 所示。 密钥 图1 2 数字音频水印系统的提取或检测模型 f i g 1 2t h ee x t r a c t i n go rd e t e c t i n gm o d e lo ft h ed i g i t a la u d i ow a t e r m a r k i n gs y s t e m 1 2 3 数字音频水印技术的特性 数字音频水印技术应具有以下一些特性: ( 1 ) 鲁棒性( r o b u s t n e s s ) 一 鲁棒性是指含有水印信息的隐秘信号在经过各种信号处理操作或恶意攻击之后,产 生一定失真的情况下,仍能保持水印的完整性和鉴别的准确性。从理论上讲,水印信息 可以被消除,但必须具备相应的密钥,一个成功的音频水印技术在密钥不完备的情况下, 任何试图去除水印的方法都会严重破坏原始音频数据。在某些情况下,鲁棒性毫无用处 甚至被极力避免,如水印研究的另一个重要分支就是脆弱水印,它具有和鲁棒性相反的 特点。 ( 2 ) 安全性( s e c u r i t y ) 安全性表现为水印能够抵抗恶意攻击的能力。数字音频水印系统的安全性与密码系 统的安全性非常相似。水印嵌入的算法是公开的,安全性建立在密钥管理的基础上,只 有拥有密钥的用户才能提取到正确的水印。 ( 3 ) 透明性( t r a n s p a r e n c y ) 透明性要求隐藏的水印信息必须和原始音频数据紧密融合在一起。嵌入水印后,音 频产品应该不会产生明显失真,即嵌入的水印不会影响到音频产品的使用价值。透明性 要求水印嵌入方法利用h a s 的有限性,在不超出听觉门限能量的情况下,使水印的能 量取得最大值。 数字音频多水印技术的研究 ( 4 ) 水印容量( c a p a c i t y ) 水印容量是指原始音频信号中可以嵌入的最大信息量。水印信息必须能够表示音频 产品内容的创建者或所有者的标志信息。这样,在发生纠纷时,提取或检测到的水印才 能够证明该音频产品真正的版权归属。 ( 5 ) 可靠性( r e l i a b i l i t y ) 对于音频产品的合法所有者来说,可靠性是指水印信息应当易于从音频产品中提取 或检测。 ( 6 ) 漏警概率虚警概率( d i s m i s s a l f a l s ea l a r mp r o b a b i l i t y ) 在音频水印技术的实际应用中,需要通过比较提取水印和原始水印的相关性来判断 水印存在与否。水印明明存在,却检测不到水印存在的概率称为漏警概率;反之,水印 根本不存在,却检测到水印存在的概率称为虚警概率。 在以上的各个特性中,最基本的两个特性是鲁棒性和透明性,但这两者之间是存在 矛盾的。从嵌入的强度来看:鲁棒性与嵌入的强度直接相关,水印嵌入的强度越大,则 鲁棒性越好;但如果嵌入的强度过大,则又会影响到透明性。因此,在研究水印嵌入算 法的过程中,必须折衷考虑这两个因素,使嵌入的水印在两者之间达到一个令人满意的 平衡。 1 2 4 数字音频水印技术的分类 数字水印是加在数字媒体中的信号,这个信号使人们能够建立产品所有权,辨识购 买者或数字产品的一些额外信息。按隐秘信号中的水印是否可见,可以分为可见水印和 不可见水印两大类【。可见水印多见于数字图像水印中。本文主要研究数字音频水印技 术,属于不可见水印。数字音频水印技术按照不同的标准可以分为很多类别,具体如下: ( 1 ) 按照水印的抗攻击能力 按照水印抗攻击的能力可以分为脆弱水印和鲁棒水印。 脆弱水印是指一类对常见的信号处理操作比较敏感的水印,对于这类水印而言,只 要嵌入水印的信号稍作修改,嵌入其中的水印就会变化或消失。脆弱水印主要用于产品 的完整性保护,通过提取出的水印的完整性来证实产品的完整性或真实性【2 - 4 1 。 4 大连理工大学硕士学位论文 鲁棒水印是一类抗攻击性能非常强的水印。与脆弱水印相比,鲁棒水印的应用范围 要广泛得多,目前绝大多数文献研究的都是鲁棒水印。鲁棒水印主要应用于保护数字产 品的所有权f 5 捌。 有些水印系统将鲁棒水印和脆弱水印结合起来,可以对经过恶劣信道或被恶意处理 的信息进行恢复,用鲁棒水印进行所有权认证,用脆弱水印进行完整性认证,用数字指 纹进行非法复制跟踪,是音频水印技术比较完整的应用方法。 ( 2 ) 按照水印的用途 按照水印的用途可以分为单目的水印和多目的水印【吼1 4 1 。 单目的水印是指实现单一目的的水印,如版权保护的鲁棒水印或内容完整性验证的 脆弱水印。大多数水印方法都是单目的水印。而多目的水印是指同时实现多个目的的水 印,如同时完成版权保护和内容完整性验证的水印。 ( 3 ) 按照嵌入信息的容量 按照嵌入信息的容量可以分为1 比特水印和多比特水印。 1 比特水印是指嵌入的水印信息没有具体的含义,检测结果只分为“有水印”和“无 水印”两种情况,这种水印实质上只含有1 比特的信息【1 2 , 1 5 1 。 多比特水印是指嵌入的信息具有一定的含义如版权信息、产品的标识码、出版时 间或者购买者的一些相关信息等。相对来说,多比特水印的方案通常更具有实际应用的 价值。 ( 4 ) 按照水印检测的方式 按照水印的检测方式可以分为盲水印和非盲水印。 盲水印也称作公有水印,是指在水印检测的过程中不需要原始音频数据。从实际应 用角度来看,由于原始数据很难获得,盲水印具有更广阔的前景。 非盲水印也称作私有水印,是指在水印的检测过程中,需要用到原始音频数据作为 参考。这类水印的特点是在算法的选择上更加灵活多变,能够充分的考虑到水印的鲁棒 性和透明性的要求。 从水印技术的发展过程来看,早期的水印算法大多是采用非盲水印的方法,如文献 【1 6 。随着水印理论和技术上的不断完备,盲水印算法必将成为趋势。 ( 5 ) 按照水印嵌入的位置 按照水印嵌入的位置分为时域水印、变换域水印和压缩域水印。 数字音频多水印技术的研究 时域水印的嵌入是通过修改原始音频数据时域采样值的强度实现的。具有计算简 单、效率高的特点。缺点也很明显,如嵌入的信息量不能太多;鲁棒性差等。在时域算 法中,重要的一大类算法是脆弱水印算法,因为这类算法具有对攻击的时间或空间位罱 的定位能力,因此,时域算法多用于内容认证或篡改提示。 变换域水印算法是通过修改原始音频信号的变换域系数进行水印嵌入的。常见的变 换域包括离散傅立叶变换( d i s c r e t ef o u r i e rt r a n s f o r m ,d v t ) 、离散余弦变换( d i s c r e t e c o s i n et r a n s f o r m ,d c t ) 和离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) 等。变换域 算法的优点是可以充分利用人类的感知特性,以达到更好的鲁棒性和不可见性。 压缩域算法是指充分考虑j p e g 、m p e g 和v q 技术的结构和特性,将水印嵌入到 压缩过程各种变量中的方法。 1 2 5 数字音频水印技术的应用 数字音频水印技术的应用极为广泛。主要有以下七个领域:版权保护、广播监控、 交易跟踪、认证或篡改检测、拷贝控制、标注水印以及隐秘通信。 ( 1 ) 版权保护 版权保护是数字音频水印最主要的应用之一。音频产品的所有者可以将标示其为该 产品唯一合法拥有者的信息嵌入到产品中。当发生版权纠纷时,合法的版权拥有者可以 从产品中提取出水印,以此来证明该产品的归属权。 ( 2 ) 广播监控 广告商希望他们从广播商处买到的广告时段能够按时全部播放,广播商则希望从广 告商处获得广告收入。为了实现广播监控,可雇佣监控人员对所播出的内容直接进行监 视和监听,但这种方法不但花费昂贵而且容易出错。或者利用动态监控系统将识别信息 置于广播信号之外的区域,但是该方法涉及兼容性问题。水印技术可以对识别信息进行 编码,是替代动态监控技术的一个好方法。它利用自身嵌入在内容之中的特点,无需利 用广播信号的某些特殊片段,因而能够完全兼容于所安装的模拟或数字的广播基础设 备。 ( 3 ) 交易跟踪 交易跟踪是指利用水印记录作品的某个拷贝所经历的一个或多个交易。例如,水印 可以记录作品的每个合法销售或发行拷贝的接受者。作品的所有者或创作者可以在不同 6 大连理工大学硕士学位论文 的拷贝中加入不同的水印。如果作品被滥用,所有者可以找出应该负责的人。 ( 4 ) 认证或篡改检测 在认证应用中,没有必要对除去水印或使之无法检测的攻击保持高的鲁棒性,因为 这不是攻击者的兴趣所在。但是,必须防止在一个已被篡改的媒体数据中伪造一个用于 认证的水印。在实际应用中,还希望能够定位篡改区域,并且区分保持内容操作( 如中 等强度的m p 3 压缩) 和恶意篡改。一般来说为了满足这些需要,嵌入容量必须要大,并 且能够实现水印的盲检测或非相关检测。 ( 5 ) 拷贝控制 前述几种水印基本上都是在不合法行为发生之后起作用。显然,最好的方法是在不 合法行为未发生之前加以制止。通常,人们希望可以欣赏媒体数据,却不希望它被拷贝。 这时可以将水印嵌入到内容中,与内容一同播放。如果每个录制设备都装有一个水印检 测器,设备就能够在输入端检测到“禁止拷贝”水印的时候禁用拷贝操作。 ( 6 ) 标注水印 标注水印一般要求嵌入比较多的信息,例如文章各节内容的说明、作者、歌蓝c d 的歌词、订购信息和网站连接等等。标注水印要求采用公开水印算法,即提取水印时不 需要原始数据的任何信息。一般来说,标注水印还需要对常规的图像或音频信号处理, 例如中等强度的有损压缩、滤波、噪声等,以及轻微的同步攻击几何变形具有一定的鲁 棒性,但不需要抵抗恶意攻击。 ( 7 ) 隐秘通信 同数据加密技术一样,音频水印技术也可以应用于信息的隐秘通信。与数据加密相 比,水印技术用于通信具有更好的隐藏性,因为它不但隐藏了通信的内容,而且还隐藏 了通信过程的存在性,不易引起怀疑,从而逃过恶意的拦截,提供了非密码的安全途径。 1 2 6 数字音频水印技术的评价标准 随着数字音频水印技术的发展,往往需要评价一个水印算法的优劣,相应地出现了 一系列音频水印评价标准。最常用的评价标准是主观测试法,也就是利用人耳的主观评 价来判断算法的质量,对于一个成功的音频水印技术而言,嵌入的水印不应该影响音频 产品的听觉质量,即加入水印后的音频产品与原始音频产品相比较,在听觉上应该不会 有明显的差别。最常用的主观测试法是主观平均判分法( m e a no p i n i o ns c o r e 。m o s ) 法, 该方法需要招集若干实验者,由他们对音频信号质量的好坏进行评分,求出平均分数作 数字音频多水印技术的研究 为对音频信号质量的评价结果。现在比较通用的标准是5 分制,各档次评分标准如表1 1 所示。 表1 1 音频信号质量评价标准 t a b 1 1 q u a l i t ye v a l u a t i o ns t a n d a r d sf o ra u d i os i g n a l 主观评价会受到测试者的背景知识、观测环境等其它因素的限制和影响,评价结果 的一致性较差,而且费时费力,因此在研究和开发阶段并不实用。客观测度作为一个可 以定量评价数字音频水印的标准,在性能评价中占有十分重要的地位。通常情况下,可 以对不同嵌入机制的音频水印算法采用不同的客观度量方法,常用的客观评价方法有: ( 1 ) 信噪比( s i g n a l i o - n o i s er a t i o ,s n r ) 如果把嵌入的水印信号看作是加载到原始音频信号上的噪声,则可以通过计算信噪 比来衡量嵌入的水印信号对音频信号的影响程度。假设原始音频信号即宿主信号为 x ( n ) ,嵌入水印的音频信号即隐秘信号为0 ) ,则信噪比表示为 s n r 1 0 l 0 9 1 0 竺 荟【) 一删2 ( 1 1 ) 其中,n 为音频信号的采样点数,工为音频信号的总长度,且0 ,l c l ,单位为d b 。 ( 2 ) 峰值信噪比( p e a ks i g n a l t o - n o i s er a t i o ,p s n r ) 向宿主信号中嵌入水印信号之后,通过观察其峰值信噪比也可以定量地评价隐秘信 号的透明性。峰值信噪比的计算公式为 8 一 大连理工大学硕士学位论文 p s n r = 1 0 l 0 9 1 0 盟壁竺塑 荟k ) 一m ) 】2 ( 1 2 ) ( 3 ) 相关系数( c o r r e l a t i o nc o e f f i c i e n t ) 为了检验提取的水印信号与嵌入的水印信号之间的相似性,可以通过计算它们的归 一化相关系数来判定。假设w 0 ) 与m ) 分别表示嵌入的水印信号和提取的水印信号, 为水印信号的长度,归一化相关系数的计算公式为 p ( 嵋奶一 ( 1 3 ) ( 4 ) 归一化汉明距离( n o r m a l i z e dh a m m i n gd i s t a n c e , n h d ) 对于水印信号为二进制序列的情况,可以通过计算提取的水印信号与嵌入的水印信 号之间的归一化汉明距离来检测其相似性。计算公式为 功。专荟嘶) 。郇) ( 1 4 ) 其中,w o ) 表示嵌入的水印信号,的) 表示提取的水印信号,表示水印信号的 长度,“o ”表示异或操作。 1 2 7 音频水印技术的发展状况及典型算法 ( 1 ) 音频水印技术的发展状况 和数字图像水印算法相比,音频数字水印算法研究较晚。在时域中,文献【1 7 】提出 了直接在时域中修改采样信号的幅度,达到嵌入水印的目的。 文献【1 8 】中,作者提出了回声编码的同态信号处理技术,把回声作为信号嵌入到宿 主信号中。 b a s s i a 等人提出了通过改变音频信号采样数据最低有效位来嵌入水印【1 9 1 。该算法在 提取水印时不需要宿主信号。 b e n d e r 提出了回波数据隐藏的水印嵌入技术,在时域内将水印的二进制数据置于 十分接近音频信号数据( 在l m s 内) 的位置上。 数字音频多水印技术的研究 k i m 提出了在数字音频信号中直接嵌入数字印章的方法,该方法在提取水印时不需 要原始音频信号【2 l 】。 在频域内,b e n d e r 提出了基于相位编码的水印嵌入技术。它通过轻微改变音频信 号相位嵌入二进制水印。b e n d e r 还提出了基于频率跳变扩频和直接序列扩频的水印嵌入 技术。 b o n e y 等人提出了采用于人的听觉系统频率掩蔽特性相似的滤波器对伪随机序列滤 波的方法产生水印,在时域中利用h a s 的时域掩蔽特性,采取加权方式在数字音频信 号中嵌入水印的算法【2 2 - 2 4 1 。 w u 等人提出了基于数字音频信号内容分析的离散傅立叶变换域水印嵌入算法f 矧。 该算法在提出水印时不需要宿主信号,并且能抵抗常见的各种攻击。 x u 等人提出了数字音频信号内容自适应的水印嵌入方法【矧,文中实现了嵌入水印 的不可见性和稳健性的折衷。首先数字音频信号按照时域特性被分割成不同类型的段, 然后按照这些段的特性设计水印嵌入方案,最后采用回波跳变技术嵌入和提取水印。 r u i z 等人提出了基于变换- 力口密编码( 采用使信号通过全通滤波器的方法使信号加 密) 的数字音频信号的水印嵌入算法1 2 7 】,嵌入的水印是数字灰度级水印。在嵌入过程中, 首先将灰度级水印转换成一维的水印序列;然后计算水印序列的短时能量和水印序列的 水印片断,确定嵌入水印的能量;最后在离散傅立叶变换域实现水印的嵌入过程。该算 法虽然能使水印嵌入的能量自适应音频信号能量的变化,但该算法提取水印过程中需要 原始信号的参与,因而不便于工程实际应用。 f u r o n 等人提出了数字音频信号的公钥水印处理技术【挪,在提出水印时不需要宿主 信号。该算法建立在一系列假设的基础上,但实际上音频信号不满足高斯概率密度函数 特性以及嵌入过程中利用了听觉系统模型的因素给检测水印带来了困难。 从综合性能上讲,变换域的方法更加优越一些,是以后的发展方向。 ( 2 ) 回声隐藏法 下面将介绍一种典型的数字音频水印方法:回声隐藏法。 回声隐藏法是一种有效的水印嵌入方法,它通过在音频信号的时域中加入回声来嵌 入水印信息,利用回声的不同延时表示水印不同的比特信息【冽。该方法有许多显著的优 点: 嵌入操作简单,容易实现,只需要将宿主信号的一部分进行复制、按比例缩减、 平移并添加到宿主信号中即可,以上过程可由式( 1 5 ) 描述 1 0 大连理工大学硕士学位论文 ) ,o ) - x ( n ) + d 哨o j )( 1 5 ) 回声隐藏方法一般不会引起明显的噪声,特别是利用心理声学模型可以确定一 个不被人感知的最大回声延时,以达到水印不可听性的要求。 回声隐藏方法可以实现粗糙同步。 利用回声隐藏方法嵌入水印信号可以实现盲检测。 l ! 簋 卜廷口! 陆一 “ ( a ) 一般的回声隐藏方法 ( a ) r e g u l a rm e t h o df o re c h o - h i d i n g ( b ) 双重回声隐藏方法 c o ) d u a le c h o - h i d i n gm e t h o d ( c ) 双向双重回声隐藏方法 ( c ) b i d i r e c t i o n a ld u a le c h o - h i d i n gm e t h o d 图1 3 各种回声隐藏方法示意图 f i g 1 3s k e t c hm a pf o rv a r i o u se c h o - h i d i n gm e t h o d s 同时,该方法也存在一些缺点:由于自然界中许多声音本身就带有回声,这会大大 地增加虚警概率,甚至有时会引起不可避免的错误。例如,普通声音都含有可以引起 f a l s e - p o s i t i v e 错误的回声,当嵌入回声的振幅量较小时,倒谱检测的尖峰会被淹没,使 水印的检测变得非常困难;但是当振幅量较大时,则会严重影响音频信号的质量。另外, 数字音频多水印技术的研究 该方法在检测时利用了倒谱技术,使检测过程的计算量较大,导致检测水印所花费的代 价比较昂贵。最早提出的回声隐藏方法的核心表达式为: o ) 一6 ( n ) + 口6 0 - 0( 1 6 ) y ( n ) 。j i l ( ”) 工( ,1 )( 1 7 ) 其中,x ( n ) 代表宿主信号,y ( n ) 代表隐秘信号,代表卷积操作,d 代表回声延时 的偏移量,其大小必须经过反复实验获得,这样做的目的是为了确保回声刚好处于不被 人耳感知的范围内。下面给出了双重回声隐藏方法的核心表达式【3 1 1 ; _ 1 1 0 ) 一6 0 ) + q 6 - d 1 ) 一a :6 - d 2 )( 1 8 ) 其中,一对正负6 ( ) 函数能够有效地提高水印的鲁棒性能,为了保证引入的回声刚 好处于不被人耳感知的范围内,要求两个延时偏移量d 。和d :满足相差不大于5 个采样点 的条件,即l d l d :is 5 。此后,又给出了一种改进的回声隐藏方法【3 2 1 ,该方法不同于以 往的回声隐藏方法,它在加入一个后向回声的同时又对称地引入一个前向回声,该方法 的核心表达式为: _ 1 0 ) 一6 ) 4 a i 6 0 d 。) + q 6 0 + 吐) 一吒6 0 一吐) 一口:6 0 + d 2 )( 1 9 ) 这样,通过同时引入前向回声和后向回声的方法,可以有效地提高水印的检测率, 从而提高算法的鲁棒性。三种方法的示意图如图1 3 所示。 回声隐藏方法中水印提取的通用表达式如式( 1 1 0 ) 所示 c y n 】一f 4 0 n ,( y m 】) ) - f 。1 ( t n f 研”】) ) + f 4 0 n f ( 陋】) ) - c # n + c h n 】 ( 1 1 0 ) 对于式( 1 6 ) 所描述的一般回声隐藏方法 ,1 c 伽卜a 6 0 d ) 一譬6 0 一2 z ) + 譬6 一材) ( 1 1 1 ) 二 j 可以看出,最大的峰值出现在nt d 处,其振幅为口;对于式( 1 8 ) 所描述的双重回 声隐藏方法,a 1 一口:m a r d 2 2 西一d 时,有 大连理工大学硕士学位论文 c h n 】= a 1 6 ( 弹一d ) + 6 ( n 一2 d ) j 一冬p o 一2 e ) + 幼。一) + 6 0 一钳) 】 ( 1 1 2 ) + 等 6 0 一鲥) + 筘。一甜) + 3 6 0 一钮) + 6 0 一耐) 卜 可以看出,双重回声隐藏方法与一般的回声隐藏方法相比,只是抑制了其余冲激处 的振幅,最大的峰值n d 处的振幅仍然是睇,可见,双重回声隐藏的方法并不能从根 本上提高算法的性能;而式( 1 9 ) 所描述的双向双重回声隐藏方法,为了方便计算,将其 简化为双向单重回声嵌入 _ i l ( n ) - 6 ( ,1 ) + 口6 ( ”- d ) + a 6 ( n + d )( 1 1 3 ) 此时 c j 【忍】= 口【6 ( 打一d ) + 6 ( 球+ d ) j 一要【6 ( h 一2 d ) + 2 6 0 ) + 6 ( 蚪+ 2 d ) 】 ( 1 1 4 ) + 手p o 一材) + 孙。一d ) + 筘o + d ) + 6 0 + 掰) 卜 最大峰值n - d 处的振幅为口+ 口3 + + l a ( 1 一口2 ) ,这里要求i 口i t l 。可见,提 高了检测到的峰值处振幅,并且,a 越小,峰值处振幅提高的幅度越大,因此可以说, 双向回声隐藏方法相对于一般的回声隐藏方法而言改进明显。 1 3 本论文的主要研究内容 本论文针对数字音频产品的多作者版权保护和篡改区域定位等问题展开研究,主要 研究内容以及章节安排如下: 第1 章对数字音频水印技术进行了概述。 第2 章介绍了文中涉及的一些基础知识和基本原理。首先,简要地介绍了音频信号 的基本特征。其次,阐述了盲源分离的基本思想,并详细地描述了解决盲源分离问题的 常用算法:独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 算法。最后,介绍了小 波变换的概念和性质。 第3 章给出了一种基于盲源分离的小波域多重音频水印方法。利用线性混合和盲源 分离技术同时实现了两个鲁棒水印信号的嵌入和提取。 数字音频多水印技术的研究 第4 章针对同时对数字媒体进行版权保护和篡改区域定位的需要,给出了一种基于 小波变换的多目的音频水印方法。通过在音频信号中嵌入一个水印实现了音频信号的版 权保护和篡改区域的定位。 第5 章为了克服第4 章中方法的不足,给出一种基于线性变换的双变换域多目的音 频水印方法。该方法通过同时嵌入鲁棒水印和脆弱水印,实现了版权保护和篡改区域定 位的双重目的。 第6 章对全文进行了总结,并对数字音频水印技术今后的发展的景进行了展望。 1 4 大连理工大学硕士学位论文 2 基础知识和基本原理概述 2 1 数字音频信号的特征嘲 对大多数数字音频信号表示有两个重要的参数:采样量化精度和瞬态采样率。采样 率是指声音信号在从模拟信号转换成数字信号过程中单位时间内采样的次数。采样精度 位数的大小影响到声音质量,位数越多,音频质量越高,而需要的存储空间也越多;位 数越少,音频质量越低,需要的存储空间越少。 高质量的数字音频信号最流行的描述样本格式是1 6 b i t s 线性量化,如w i n d o w s 可视 音频格式( w i n d o w sa u d i ov i s u a l , w a v ) 和音频交换文件格式( a u d i oi n t e r c h a n g ef i l e f o r m a t , a i f f ) 。对较低质量音频信号格式是采用8 b i t s z 律或a 律的非线性量化方式。 这些量化方法使信号产生了一些畸变,在8 b i t s z 律中显得更为明显。 音频信号的采样率一般为8 k h z 、9 6 k h z 、1 0 k h z 、1 2 k k 、1 6 k h z 、2 2 0 5 k h z 、4 4 1 k i - i z 。 采样率影响数据隐藏量,因为它给出了可用频谱的上限,假设信号的采样频率为8 k h z , 则引入的修改分量的频率不会超过4 k h z 。 本文实现的数字音频水印算法就是把数字水印嵌入在w a v 文件的p c m 数据中。 2 2 盲源分离简介叫 近年来,盲源分离( b l i n ds o u r c es e p a r a t i o n , b s s ) 已经成为信号处理学界和神经网络 学界共同感兴趣的研究热点领域,并获得了迅速的发展。 假设一组源信号经过一个混合矩阵进行变换,输出得到一组观测信号,盲源分离需 要解决的问题就是在源信号和混合矩阵均为未知的情况下,仅依靠观测信号提供的信息 确定一个变换,以恢复出各路源信号。盲源分离的核心问题是分离( 解混合) 矩阵的学习 算法,它属于无监督学习,基本思想是抽取统计独立的特征作为输入的表示,而又不会 丢失信息。当混合模型为非线性时,一般无法从混合数据中恢复出源信号,除非对信号 和混合模型有进一步的先验知识可以利用。因此,本论文中只讨论线性混合模型的情况。 盲源分离可以用如下混合方程描述 x = a s ( 2 1 ) 公式( 2 1 ) 所描述的内容是n 维源向量s i s , ,是,疋】t 经过一个m x n 维的混合矩阵a 进 行线性变换,得n m 维观测向量x = k ,毛,矗r 。盲源分离的目的就是要在a 和s 均 为未知的情况下确定一个解混合矩阵w ,使得 数字音频多水印技术的研究 y - w x ( 2 - 2 ) 其中,y 为源信号s 的估计值,并且y 中的各个分l y t 均尽可能相互独立。 实现盲源分离的算法可以分为三大类: ( 1 ) 信号经过变换后,使不同信号分量之间的相依性最小化,这种方法称为独立分 量分析( i n d e p e n d e n tc o m p o n e n ta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论