




已阅读5页,还剩50页未读, 继续免费阅读
(信号与信息处理专业论文)变换域鲁棒数字音频水印技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 随着网络多媒体技术的广泛应用和发展,以及多媒体数据压缩技术的不断成熟,使 得图像、音频、视频等数字化产品在网上大量发行。为了防止多媒体信息被侵权及非法 篡改,数据内容的版权保护变得越来越重要。作为数字产品版权保护的有效方法,数字 水印技术已经得到了广泛的研究及应用,成为当今国内外学术界研究的一个热点。 本文以音频数据作为嵌入对象,主要研究工作和取得的成果如下: ( 1 ) 基于分块离散余弦变换量化的鲁棒音频水印方法的研究。该方法提出一种利用 d c t 的能量压缩特性量化嵌入水印并实现盲提取的音频水印算法。其中以分块d c t 系数 的d c ( 直流) 系数作为量化嵌入系数。在实现了水印的盲提取过程中,该方法体现出了良 好的透明性并且对常规信号处理攻击具有较好的鲁棒性。 ( 2 ) 基于盲源分离的自同步多重音频水印方法的研究。针对现有音频水印方法同步 性较差这一现状,本方法采用在伪装音频信号进行离散小波变换之后,在变换域中利用 峰值搜索音频信号的特征点作为目标点的方式,提取出系列特征点作为水印嵌入的同步 点,同嵌入同步信息相比,利用音频自身特征位置作为同步点,不仅节省了嵌入同步码 的操作,而且可以抵抗时间轴的同步攻击。 实验结果表明,以上两种方法均满足音频水印技术对透明性、鲁棒性和安全性的要 求;从隐秘信号中分离水印信号时,都不需要宿主信号的参与,可以应用于数字音频产 品的版权保护或篡改区域定位。 关键词:音频水印;信息隐藏;独立分量分析;自同步;量化 大连理工大学硕士学位论文 s t u d y o nt h et e c h n i q u eo f r o b u s td i g i t a la u d i ow a t e r m a r k i n g i nt h et r a n s f o r md o m a i n a b s t r a c t a st h ee x t e n s i v ea p p l i c a t i o na n dd e v e l o p m e n to ft h ei n t e r n e ta n dm u l t i m e d i at e c h n o l o g y , 弱w e l la st h eg r a d u a lm a t u r i t yo ft h em u l t i m e d i ad a t ac o m p r e s s i o nt e c h n o l o g y ,m a n yd i g i t a l p r o d u c t si n c l u d i n gi m a g e ,a u d i oa n dv i d e oa r ew i d e l yi s s u e dt h r o u g hi n t e r n e t i no r d e rt o p r e v e n tt h em u l t i m e d i ai n f o r m a t i o nf r o mb e i n gi n f r i n g e da n di l l e g a l l yt a m p e r e d ,t h e c o p y r i g h tp r o t e c t i o no ft h ed a t ai sb e c o m i n gm o r ea n dm o r ei m p o r t a n t a sa ne f f e c t i v e m e t h o df o r t h ec o p y r i g h tp r o t e c t i o no fd i g i t a lp r o d u c t ,d i g i t a lw a t e r m a r k i n gt e c h n o l o g yh a s b e e nw i d e l ys t u d i e da n de m p l o y e d ,t h u sb e c o m i n gar e s e a r c hf o c u sa m o n gp r e s e n ta c a d e m i a b o t ha th o m ea n da b r o a d t a k i n gt h ea u d i od a t aa st h eh o s ts i g n e d ,t h ec o n t e n t sa n da c h i e v e m e n t so ft h i st h e s i sa r e 嬲f o l l o w s : ( 1 ) 1 1 1 er o b u s ta u d i ow a t e r m a r k i n gm e t h o db a s e do nt h eb l o c k w i s ed i s c r e t ec o s i n e t r a n s f o r ma n dq u a n t i z a t i o ni ss t u d i e d b yu s i n gt h ee n e r g yc o m p r e s s i o nf e a t u r eo fd i s c r e t e c o s i n et r a n s f o r m ,t h ew a t e r m a r ki se m b e d d e di nt h eh o s ta u d i os i g n a lt h r o u g hq u a n t i z a t i o n m e t h o d t h i sm e t h o dc a nr e a l i z et h eb l i n de x t r a c t i o n a n dt h ed c ( d i r e c tc u r r e n t ) p a r to ft h e b l o c kd c tc o e f f i c i e n t si sc h o s e na st h ee m b e d d i n gc o e f f i c i e n t s i nt h ep r o c e s so fw a t e r m a r k e x t r a c t i o n , t h ep r o p o s e dm e t h o dh a sn o to n l yag o o dt r a n s p a r e n c yb u ta l s ot h eb e t t e r r o b u s t n e s su n d e rv a r i o u sa t t a c k so rc o n v e n t i o n a ls i g n a lp r o c e s s i n go p e r a t i o n s ( 2 ) ms e l f - s y n c h r o n i z a t i o na n dm u l t i - c o p y r i g h ta u d i ow a t e r m a r km e t h o db a s e do n b l i n ds o u r c es e p a r a t i o ni ss t u d i e d i nr e s p o n s et ot h ep o o rs y n c h r o n i z a t i o nc h a r a c t e r i s t i co f e x i s t i n ga u d i ow a t e r m a r km e t h o d s ,am e t h o dw i t hs e l f - s y n c h r o n i z a t i o nt h a ts e a r c h i n gt h e p e a kl o c a l i z a t i o no fd i s g u i s e da u d i os i g n a li sp r o p o s e d c o m p a r i n gw i t l lt h em e t h o do f e m b e d d i n gs y n c h r o n i z i n gi n f o r m a t i o n ,t h i sm e t h o dc a nn o to n l yo m i ts o m eo p e r a t i o n s ,w h i c h a r eu s e dt oe m b e dt h es y n c h r o n i z i n gc o d e ,b u ta l s or e s i s tt h es y n c h r o n i z i n ga t t a c ko ft h et i m e a x i s e x p e r i m e n t a lr e s u l t ss h o wt h a tb o t ho ft h et w om e t h o d sc a l ls a t i s f yt h er e q u i r e m e n t so f t h et r a n s p a r e n c y ,r o b u s t n e s sa n dt h es e c u r i t y ;t h ew a t e r m a r ks i g n a lc a nb ee x t r a c t e dw i t h o u t t h eh o s ts i g n a l 硼1 ew a t e r m a r ks c h e m ep r o p o s e di nt h i sp a p e rc a nb ea p p l i e di nc o p y r i g h t p r o t e c t i o na n dt a m p e r e da r e a sl o c a l i z i n g 一i i i 变换域鲁棒数字音频水印技术的研究 k e y w o r d s :a u d i ow a t e r m a r k ;i n f o r m a t i o n h i d i n g ;i n d e p e n d e n t c o m p o n e n ta n a l y s i s ( i c a ) ;s e l f - s y n c h r o n i z a t i o n ;q u a n t i f i c a t i o n i v 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目: 垄童整遮盘! 壹垫壁丝翠型竺翌壅 作者签名:至墨笙日期:三! :2 年l 月二生日 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 煎童垒亟醴! 玺垫垒薹塑兰翌鳖垫三3 窒 作者签名:至鱼至日期:之! 塑年厶月:堕日 导师签名:曼至丝日期:三:翌年生月二生日 大连理工大学硕士学位论文 1 绪论 1 1 选题的意义和研究背景 网络多媒体技术的飞速发展,使彼此间的距离无形中大大地缩短了,随着网络的日 益普及,多媒体信息的交流达到了前所未有的深度和广度。各种形式的多媒体作品包括 音频、视频、图像等纷纷以网络的形式发布甚至个人也可以借助普通的个人计算机,通 过网络,就可以方便、迅速地将自己的多媒体数字作品放在网络上,供全世界欣赏。传 统的图书馆和博物馆同样可以经过数字化等工作把书籍、艺术品等以多媒体数字作品的 形式传达到世界每一个角落。国际互联网逐渐普及的副作用也十分明显:作品侵权更加 容易、篡改更加方便。任何人都可以通过一台普通的个人计算机,在互联网络上轻易取 得他人的原创作品,尤其是数字化图像、音乐、电影等等,在不经过作者的同意下任意 复制、修改,从而侵害了作者的著作权。因此,如何实施网络环境下的版权保护和信息 安全已经成为一个亟待解决的问题。 数字水印技术是一门新兴的多学科交叉的应用技术,它为最终解决数字产品版权保 护问题提供了方向。并且在数字产品版权保护中发挥着越来越大的作用。目前,数字水 印技术主要涉及数字图像、音频和视频等领域。随着网络通信和多媒体技术的进一步发 展,以及新一代音频数据压缩标准m p 3 的广泛应用,越来越多的学者将目光投向了数 字音频水印技术领域。这是因为利用听觉系统的一些特性,如掩蔽效应、听觉系统对绝 对相位不敏感等特性来嵌入水印,同样可以取得很好的效果。就目前来看,大多数数字 音频水印技术主要集中在版权保护的鲁棒水印【l , 2 1 或内容完整性验证的脆弱水印【3 】等水 印技术上。本文主要研究鲁棒数字音频多水印技术。 1 2 数字音频水印技术概述 1 2 1数字音频水印技术的概念 数字音频水印技术是一种信息隐藏技术,它的基本思想是在不影响原始音频质量的 前提下,利用一定的算法向其中嵌入用于版权保护或内容完整性检验的一些标志性信 息,达到保护产品的版权、证明产品的真实可靠性、跟踪盗版行为或者提供产品的附加 信息等目的。 满足听觉要求的数字音频产品就能为人们所接受,所以在不破坏其使用价值的前提 条件下,嵌入数字音频水印而不被察觉是有可能的。任何数字信号都有其固定的误差范 围,即所谓的噪声。数字音频水印的制作过程可以看作是将水印信息作为附加噪声融合 变换域鲁棒数字音频水印技术的研究 在原始音频信号中,只要附加的噪声强度远远小于人的感觉器官能够察觉到的最小强 度,水印信息就可无法被感知。由于人类听觉系统( h u m a na u d i t o r ys y s t e m ,h a s ) 对声音 变化的灵敏度要高于人类视觉系统( h u m a nv i s u a ls y s t e m ,h v s ) 对图像变化的灵敏度,因 而在音频信号中嵌入水印难度相对较大。 1 2 2 数字音频水印技术的基本架构 典型的数字音频水印系统应包括水印的生成、嵌入和提取或检测三部分。 ( 1 ) 水印的生成 水印生成应保证水印唯一性、不可逆性等属性。水印信号一般是由伪随机数发生器 生成的,而且利用密钥进行加密。 ( 2 ) 水印的嵌入 水印信息的嵌入是数字音频水印系统的核心部分,通常需要考虑水印的透明性和鲁 棒性。二者是相互矛盾的,需要根据具体的应用在二者之间做出一个折衷选择。在应用 于版权保护的水印系统中,需要算法具有很高的鲁棒性。而在完整性验证等应用领域, 对鲁棒性的要求不是很高。 数字音频水印嵌入模型如图1 1 所示。 水印信息 密钥 图1 1 数字音频水印系统的嵌入模型 f i g 1 1 t h ee m b e d d i n gm o d e lo f t h ed i g i t a la u d i ow a t e r m a r k i n gs y s t e m ( 3 ) 水印的提取或检测 如果嵌入的是有意义的水印信息( 如图像等) ,就需要在隐秘音频信号中提取水印信 息。如果嵌入的是1 比特水印信息( 如m 序列等) ,就需要检测音频中是否含有水印信息。 数字音频水印提取或检测模型如图1 2 所示。 大连理工大学硕士学位论文 密钥 图1 2 数字音频水印系统的提取或检测模型 f i g 1 2 t h ee x t r a c t i n go rd e t e c t i n gm o d e lo f t h ed i 西t a la u d i ow a t e r m a r k i n gs y s t e m 1 2 3 数字音频水印技术的特性 数字音频水印技术应具有以下一些特性: ( 1 ) 鲁棒性( r o b u s t n e s s ) 鲁棒性是指含有水印信息的隐秘信号在经过各种信号处理操作之后,产生了一定失 真情况下,仍能保持水印的完整性。鲁棒性包含两层含义: 一是抗攻击性,数字水印应具有一定的安全性,能抵抗各种蓄意地攻击,数字水印 对一般用户来说是不可检测和消除的。 、 二是抗干扰性:数字水印应该能抵抗一般的数字信号处理,并继续保持较好的可检测 性。 ( 2 ) 透明性( t r a n s p a r e n c y ) 透明性即不可感知性,要求隐藏的水印信息必须和原始音频数据紧密融合在起。 嵌入水印后,加入水印信息后的音频文件的声音质量不可产生可听到的失真。即嵌入的 水印不会影响到音频产品的效果。 ( 3 ) 安全性( s e c u r i t y ) 安全性表现为水印在抵抗恶意攻击方面的能力。数字音频水印系统的安全性与密码 系统的安全性非常相似。水印嵌入的算法是公开的,安全性建立在密钥管理的基础上, 只有拥有密钥才能提取到正确的水印。 ( 4 ) 漏警概率虚警概率( d i s m i s s a l f a l s ea l a r mp r o b a b i l i t y ) 在音频水印技术的实际应用中,需要通过比较提取水印和原始水印的相关性来判断 水印存在与否。水印明明存在,却检测不到水印存在的概率称为漏警概率;反之,水印 根本不存在,却检测到水印存在的概率称为虚警概率。 ( 5 ) 可靠性( r e l i a b i l i t y ) 对于音频产品的合法所有者来说,可靠性是指水印信息应当易于从音频产品中提取 或检测。在拷贝控制应用中,对可靠性要求很高。例如,一般要求d v d 视频水印检测 一3 一 变换域鲁棒数字音频水印技术的研究 器应该在1 0 1 2 帧中有一次虚警,或在1 0 0 0 年连续操作中大约有1 次虚警发生。 ( 6 ) 快速高效性( r a p i d i t ya n dh i g he f f i c i e n c y ) 水印处理算法应该易于实现。尤其水印检测算法必须足够快,以满足产品发行网络 中对多媒体数据的管理要求。 在以上的六个特性中,最基本的两个特性是鲁棒性和透明性,但这两者之间是存在 矛盾的。从嵌入的强度来看:鲁棒性与嵌入的强度直接相关,水印嵌入的强度越大,则 鲁棒性越好;但如果嵌入的强度过大,则又会影响到透明性。因此,在研究水印嵌入算 法的过程中,必须折衷考虑这两个因素,使嵌入的水印在两者之间达到一个令人满意的 平衡。 1 2 4 数字音频水印技术的分类 数字音频水印技术按照不同的标准可以分成很多种类别,具体地说,可进行如下所 述的分类: ( 1 ) 按照水印的抗攻击能力可以分为脆弱水印和鲁棒水印 脆弱水印是指对常见的信号处理操作比较敏感的一类水印,只要嵌入水印的信号稍 加修改,嵌入其中的水印就会变化或消失。脆弱水印主要用于产品的完整性保护,通过 提取水印的完整性来证实产品的完整性、真实性1 4 4 1 。 鲁棒水印是一类抗攻击性能非常强的水印。鲁棒水印的应用范围广泛,目前绝大多 数文献研究的都是鲁棒水印。鲁棒水印主要应用于保护数字产品的所有权【7 - 1 2 。 ( 2 ) 按照水印的透明度可以分为可见水印【1 3 】和不可见水印 可见水印很像纸币上的水印,一般为较淡或半透明的不碍观看的图案。 不可见水印的应用范围更加广泛。不可见水印是嵌入了数字音频水印而不被人们察 觉,没有特殊的密钥就无法正确的检测水印。 ( 3 ) 按照嵌入信息的容量可以分为l 比特水印和多比特水印 1 比特水印是指嵌入的水印信息没有具体的含义,只是“有水印”和“无水印 两 种情况,这种水印只含有1 比特信息【1 4 1 。 多比特水印是指嵌入的信息具有一定的含义。如版权信息、产品的标识码、发表时 间、版权所有者姓名、地址、单位等等。相对来说,多比特水印的方案通常更具有实际 应用价值。 ( 4 ) 按照水印检测的方式可以分为盲水印f 1 5 】和非盲水印【6 1 。 盲水印是在提取数据时不需要利用原始的语音信号。从应用角度来看,盲水印有着 广泛的发展前途。如文献【1 7 】中提出了一种基于量化数字音频信号频域参数的水印嵌入 一4 一 大连理工大学硕士学位论文 算法。 非盲水印则是指在水印的检测过程中,需要未加水印的原始数据作为参考。对于这 类算法可嵌入水印的位置选择范围较大,能充分地考虑到水印的鲁棒性和隐蔽性的要 求。文献【1 8 】中提出了一种基于子波变换的水印处理方法,在数字音频信号中嵌入了一 个随机的序列,该方法在提取水印时,需要用到原始的数字音频信号。 ( 5 ) 按照水印嵌入的位置分为时域水印、变换域水印和压缩域水印 时域水印的嵌入是通过修改原始音频数据的时域采样值强度实现的。时域的方法不 需要对原始音频信号进行变换,计算简单。但由于水印要均衡于鲁棒性和透明性之间, 可选择的范围较小,而且时域算法的鲁棒性较差,尤其是对于时域平移和剪切等攻击, 同时还难以抵抗常见的信号处理攻击,如采样,滤波、有损压缩等。 变换域的算法是通过修改原始音频信号的变换域系数而将水印嵌入其中的,常见的 变换域算法有:离散小波变换( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) ;离散傅立叶变换 ( d i s c r e t ef o u r i e rt r a n s f o r m ,d f t ) t 1 9 1 ;离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ,d c t ) 【2 毗】 等。 水印的分类方法有很多,它们的区别是站在了不同的角度去分析问题,一种水印方 案常常包含了多种方法。 1 2 5 数字音频水印技术的应用 任何科研技术所要满足的条件总是建立在应用基础上的,不同的应用有时对某些性 能的要求相差很大。目前数字水印的主要应用以下七个领域:版权保护、广播监控、交 易跟踪、认证或篡改检测、拷贝控制、标注水印以及隐秘通信。 ( 1 ) 版权保护 版权保护是数字音频水印最主要的应用之一。即数字作品拥有者可用密钥产生的水 印,并将其嵌入原始数据,公开发布他的水印作品。如果发生版权纠纷,合法的版权拥 有者可以从产品中提取出水印,证明其版权,保护其权益。 ( 2 ) 广播监控 水印技术可以对识别信息进行编码,利用自身嵌入在数字作品之中的特点,不需要 利用广播信号的相关片段,通过自动在媒体中搜寻这个唯一的数字水印,便可以确切知 道这些媒体被播放的时间、次数等相关信息。 ( 3 ) 交易跟踪 交易跟踪是指利用水印记录作品的某个拷贝所经历的一个或多个交易。 变换域鲁棒数字音频水印技术的研究 ( 4 ) 认证或篡改检测 在一个已被篡改的媒体数据中伪造一个用于认证的水印是必须要防止的。在实际应 用当中,还希望能够定位篡改区域,并且区分保持内容操作( 如中等强度的m p 3 压缩) 和恶意篡改。 ( 5 ) 拷贝控制 通过数字音频水印技术,最好的方法是在不合法行为未发生之前加以制止。在互联 网上,数字作品的发布者大都是希望人们只欣赏其发布的媒体数据,却不希望它被拷贝。 那么最好的办法就是将水印嵌入到内容中。这种应用的一个典型的例子是m p 3 防拷贝 系统,即将水印信息加入m p 3 数据中,这样m p 3 播放机即可通过检测m p 3 数据中的 水印信息而判断其合法性和可拷贝性。从而保护其利益。 ( 6 ) 标注水印 即将作品的标题、注释等内容( 例如作品的说明、作者、m p 3 的歌词、订购信息和 网站连接等等) 以水印形式嵌入该作品中,这种方式安全可靠,不易丢失,且不需要额 外的带宽。 ( 7 ) 隐秘通信 水印技术用于通信具有更好的隐藏性,因为它不但隐藏了通信的内容,而且还隐藏 了通信过程的存在性,这一点在军事上有着广阔的发展空间,在战争状态下,多一条通 信方式就多一点获胜把握。 1 2 6 数字音频水印技术的评价标准 表1 1 音频信号质量评价标准 t a b 1 1 q u a l i t ye v a l u a t i o ns t a n d a r d sf o ra u d i os i g n a l 数字音频水印技术的评价标准有多种,无外乎基于主观和客观两种评价方法: 大连理工大学硕士学位论文 一是主观测试法。利用人耳的主观评价来判断算法的质量,对于音频水印技术而言, 加入水印后的音频产品与原始音频产品相比较,在听觉上应该不会有明显的差别,即嵌 入的水印不应该影响音频产品的听觉质量。最常用的主观测试法是主观平均判分法 ( m e a no p i n i o ns c o r e ,m o s ) ,该方法需要招集若干测试者,由他们对音频信号质量的好 坏进行评分,把平均分数作为对音频信号质量评价的结果。比较通用的标准是5 分制, 各档次评分标准如表1 1 所示。 主观评价会受到测试者的背景、知识、观测环境等因素的限制和影响,评价结果的 一致性较差,而且费时费力,因此在研究和开发阶段并不实用。 二是客观测试法。客观测试法可以定量评价数字音频水印的质量,占有十分重要的 地位。通常情况下,可以对不同嵌入机制的音频水印算法采用不同的客观测试方法,常 用的客观评价方法有: ( 1 ) 信噪比( s i g n a l - t o - n o i s er a t i o ,s n r ) 嵌入的水印信号作为加载到原始音频信号上的噪声来对待,通过计算信噪比来衡量 嵌入的水印信号对音频信号的影响程度。假设原始音频信号即宿主信号为x ( ,1 ) ,嵌入水 印的音频信号即隐秘信号为x w ( n ) ,则信噪比表示为: s n r = 1 0 l o g l oi 雨l 盟- i l x 2 ( 刀) i k ( 刀) 一x ( 刀) 】2 n z 0 其中,拧为音频信号的采样点数,三为音频信号的总长度,且0 刀 l ,单位为d b 。 ( 2 ) 峰值信噪比( p e a ks i g n a l - t o - n o i s er a t i o ,p s n r ) 嵌入水印信号后,通过观察其峰值信噪比也可以定量评价隐秘信号的透明性。峰值 信噪比的计算公式为 ps一10垴o|路om o 越蝴姒4 1曩5lz 善 撕 图2 1 听觉掩蔽曲线 f i g 2 i m a s k i n g c a lv eo f a u d i os i g n a l 频率( k h z ) 掩蔽效应是由入耳对声音的频率分辨机制决定的,而且有瞬时掩蔽( t e m p o r a l m a s k i n g ) 和同时掩蔽( s i m u l t a n e o u sm a s k i n g ) 之分。瞬时掩蔽是一种时域听觉现象,即不 同声音之间的掩蔽现象。同时掩蔽是指在频域发生的掩蔽现象。如果在一定频率范围内, 同时存在能量相差一定程度的一强一弱两个音频信号时,弱音不被入耳察觉,即弱音被 强音“屏蔽 掉,则较强的音称为掩蔽音,弱的音称之为被掩蔽音。基于此,有两种情 况:强声音掩蔽其后发生的声音,叫做后掩蔽或正向掩蔽;弱声音短暂地被其后产生的 强声音所掩蔽,叫做前掩蔽或反向掩蔽。一般情况下,前掩蔽发生在掩蔽音出现之前5 2 0 m s ,而后掩蔽发生在掩蔽音消失之后5 0 - - 2 0 0 m s ,如图2 2 所示。 兽6 0 蓄4 0 整2 0 图2 2 掩蔽效应曲线 f i g 2 2m a s k i n ge f f e c t i o nc t i r v e 静 靳 柚 矩 缝 n 大连理工大学硕士学位论文 ( 2 ) 人耳对声音信号的绝对相位不敏感 人耳对声音信号的相对相位敏感而对声音信号的绝对相位不是很敏感。人耳能做短 时的频率分析,对信号的周期性( 音调) 很敏感,但对信号相位感知却不灵敏。因此, 人耳听不到或感知极不灵敏的声音分量都可以视为是冗余的。 ( 3 ) 人耳对不同频率段声音的敏感程度不同 一般地,入耳能够感知到频率介于2 0 h z 到2 0 k h z 之间的音频信号,但对2 0 h z 到 6 k h z 范围内的信号最为敏感,幅度很低的信号也能被听见,而在低频区( 4 0 h z 以下) 和 高频区( 1 6 k h z 以上) ,能被入耳听见的信号幅度要高得多。对同样声压级的声音,入耳 实际感觉到的音量是随频率的变化而变化的。所以,在没有噪音的环境下,在频率音 频信号能量的坐标图上就可以绘出一条能够描述人耳听觉特性的曲线,通常称之为绝对 阈值曲线,如图2 3 所示。频带上能量值小于曲线值的声音人耳则无法察觉,而当能量 超过临界曲线时,就能够听到该声音。图2 3 中所示,a 频带的声音信号是人耳能够听 到的,而b 频带的声音信号是人耳所听不到的。 声压( 分贝) 眦0 0 5 珏l2 sl 图2 3 绝对阈值曲线 f i g 2 3 a b s o l u t et h r e s h o l dc u r v eo fa u d i os i g n a l 频率( k h z ) 根据上述得知,人耳的听觉特性为我们在数字音频信号中嵌入水印信息提供了可行 性的理论依据和现实依据。根据这一特性,就可以充分利用人耳听觉特性研究和使用合 适的方法进行水印的嵌入而不为人耳所察觉。 蚀 鳓 蛐 馋 拍 疆 曩 变换域鲁棒数字音频水印技术的研究 2 2 盲源分离简介 盲源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 【3 8 删在近几年来获得了迅速的发展,它是 神经网络学界和信号处理学界共同的研究热点领域。 假设一组源信号经过一个混合矩阵进行变换后,输出得到一组观测信号,盲源分离 需要解决的问题就是在源信号和混合矩阵均为未知的情况下,仅依靠观测信号提供的信 息确定一个变换,来恢复出各路的源信号。盲源分离的核心问题是分离矩阵的学习算法, 它是基本思想是在不会丢失信息的前提下,抽取统计独立的特征作为输入的表示。如果 混合模型为非线性,那么一般无法从混合数据中恢复出源信号。因此,本论文中只讨论 线性混合模型的情况。盲源分离可以用如下混合方程描述 x = a s( 2 1 ) 公式( 2 1 ) 中,拧维源向量s = 瞳,是,瓯r 经过一个m n 维的混合矩阵a 进行线性 变换,得到m 维观测向量x = r ,x 2 ,矗】t 。其目的就是要在a 和s 均为未知的情况下 确定一个解混合矩阵w ,使得 y = w x ( 2 2 ) 其中,y 为源信号s 的估计值,并且y 中的各个分量m 均尽可能相互独立。 实现盲源分离的算法可以分为三大类: ( 1 ) 在信号经过某种变换后,使不同信号分量之间的相依性最小化,我们把这种方 法称之为独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) ,由c o m o n 于1 9 9 5 年提 出【4 。 ( 2 ) 通过非线性传递函数对输出进行变换,使得输出分布包含在一个有限的超立方 体当中,之后熵的最大化将迫使输出尽可能在超立方体中均匀散布,我们把这类方法称 之为熵最大化方法f 4 2 】。 ( 3 ) 非线性主分量分析,是线性主分量分析方法的推广【4 3 1 。 在本文中,利用独立分量分析作为解决盲源分离问题的算法,以实现数字音频水印 技术中水印的检测和盲提取。 大连理工大学硕士学位论文 2 3 独立分量分析简介 i c a t 4 4 1 是用来解决盲源分离问题的常用方法1 4 5 闱,其核心问题是对向量y 要确定一 个对比函数矽( y ) ,定义为将y 的概率密度分布集合映射为一实值函数的算子,需要 满足以下两个条件: 一是若向量y 的元素乃改变排列位置,则函数矽( y ) 保持不变,即对于所有交换矩阵 p 恒有( p y ) = ( y ) 成立; 二是若向量y 的元素m 改变尺度,则函数矽( y ) 保持不变,即对于所有可逆对角矩阵 d 恒有( d y ) = 矽( y ) 成立; 下面列出了几种典型的i c a 算法:随机梯度算法【4 3 1 ,自然梯度算法f 4 7 】,借助独立 性等变化的自适应分离算法【4 8 】和固定点算法1 4 9 等。其中前三种算法只适合于亚高斯信号 或超高斯信号单独存在的情况,而在本文中有待分离的音频信号为超高斯信号,水印信 号为亚高斯信号。 固定点算法( 也称为f a s ti c a 算法) 是一种离线算法,它是一种快速的、数值稳定的 算法,其对比函数为 吒( w ) = 【e = 啄= 墨;i 乏 (25-b) 首先将观测向量x 进行白化处理,即令e x x t ) = i 。然后,按照下列步骤进行迭代, 依次求出解混合矩阵w 的各个分量: 利用下列迭代算法求出第一个独立的分量 f w ;= e x g ( w j x ) - e g ( w t lx ) ) w t w w 圳w ( 2 6 ) 其改进算法为 w j2 - i 娶- w j x ) ) _ 肌m g ,( w :r x ) ) _ 冈 ( 2 7 ) 【w - w i lw + l l 怕川 其中,f l = e w t x g ( w :r x ) 。在改进算法中,当= 1 时,它等同于式( 2 6 ) ,为牛顿 最优化算法;当 1 时,对应于梯度下降法。按照式( 2 6 ) 或式( 2 7 ) 进行迭代计算达到 收敛后,即得到了解混合矩阵w 中的第一个独立分量w 。; 用不同的初值按照步骤的方法迭代计算,得到第二个独立分量w :,并且对w 。 和w :进行去相关运算 一一。: it 1 w 22 w 2 一w i w l w l 1 w 2 = w :属i q 舟 最后,按照下列迭代公式计算出所有独立分量,并且一一进行去相关运算 lw,+i=p+1一wpt+ww w i w w jl 川= 川一乙w p + 1 鬯( 2 9 ) 【w p + l = w p + 1 w t + i w p + i 大连理工大学硕士学位论文 固定点算法的核心是式( 2 9 ) 中执行的压缩映射,在i c a 算法中运用压缩映射技术 逐个分离信号的思想最早由文献【5 0 】给出。在求出解混合矩阵w 之后,通过式( 2 2 ) 即可 求出源向量的估计值。 综上所述,i c a 算法由一个多维的观测信号估计出具有相互独立成分的信号,以最 少的源信号和混合矩阵的知识来获得解混合矩阵,以恢复出源信号所有的独立分量。 2 4 离散小波变换 小波变换作为一种新型的信号处理技术,适用于对非平稳信号进行分析和处理,而 音频信号正是非平稳信号。而短时傅立叶变换( s h o r t - t i m ef o y e rt r a n s f o r m ,s t f t ) 对所 有频率提供的都是均匀的时间分辨率,小波变换有效地克服了s 邛t 在处理非平稳信号 时的局限性,具有良好的局部化特性,它既能够在时域,也可以在频域局部化定位观测, 对高频提供高的时间分辨率和低的频率分辨率,对低频提供低的时间分辨率和高的频率 分辨率,这种方式与人耳的听觉分辨特性比较相似。 小波是定义在有限间隔而且其平均值为零的一种函数。假设( ,) ( 尺) ,如果( f ) 的傅里叶变换甲( w ) 满足约束条件 c 甲= c p ( 2 1 0 ) 称少( f ) 是一个基本小波,则平方可积空间函数厂( r ) l 2 ( 天) 的连续小波变换定义为 眄( 口,6 ) = ,s ( u ,v ) 为 变换域函数,s ( x ,”为空域函数,则二维离散余弦变换公式定义为: 跗= 知刖芝加。s ( n u t 尝z x 芦+ u ic o s l n v ( 乌z y 产+ 1 ) )亿26)x=oy = o s ( 掣) = 寺c ( 甜) c ( v ) s ( w ) c o s i 磊一百l ( 2 j 二 二v 二维离散余弦反变换公式定义为 s(x=和,ocv)e磐e幽cos(警nutzx+i)0v = o) c 。s ( 掣) 亿刎9 7 ,y ) = 寺c ( 甜) c ( 1 ,c ( ) c o s i 百i c o s l 掣 , - 二v 二v f 9、 其中 _ 、 c c ”i 慨i 厩n , 则u , v = 乩0 2 ,州 图像压缩过程中,d c t 变换的方块尺寸的选择与要求的图像质量、压缩比以及实现 的复杂度有关。若要求高的压缩比,则方块应该选择大一些;若减少运算的复杂程度, 则要求的方块小一些。实际使用时通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论