




已阅读5页,还剩51页未读, 继续免费阅读
(信号与信息处理专业论文)数字音频水印技术的研究和实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 随着互联网和计算机技术的普及和飞速发展,数字多媒体产品得到了广泛应用。如 何在网络环境下实施数字产品的版权保护、合法权益和信息安全,成为数字通信中亟待 解决的问题。数字水印技术的发展提供了解决这一问题的新思路。随着以m p 3 为代表的 音乐产品在网络上广泛传播,数字音频水印技术逐渐成为国内外学术界研究的热点。 本论文重点研究数字音频水印技术,并在此基础之上,给出水印图像恢复的新思路。 给出了两种基于独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 的数字音频水印方 法和一种基于码本映射的分块离散h o p f i e l d 网络的水印图像恢复方法。首先,阐述了课 题提出的意义和研究背景。其次,介绍了本论文中用到的基本理论知识。接着,给出了 两种基于i c a 的小波域数字音频水印方法。第一神方法针对数字水印算法对抗时间轴同 步攻击能力较弱,以及版权保护和音频信号感兴趣区域( r e g i o no f i n t e r e s t ,r o i ) f l j 容保护 的问题,给出了一种基于i c a 的自同步小波域多目的音频水印方法,实现了对音频信号 重要音频段和版权标识保护的双重目的。第二种方法针对多著作权版权保护、音频重要 音频段内容保护和篡改定位的问题,给出了一种基于i c a 的小波域多重和多目的音频水 印方法,该方法把音频信号的r o i 和两个图像标识嵌入到宿主信号中,实现了水印技术 的多重性和多目的性这两个重要特性,并且只需嵌入鲁棒水印而不需要嵌入脆弱水印即 可实现篡改定位的功能。最后,针对水印领域中经常遇到的版权标识遭受恶意攻击而无 法有力保护版权的问题,给出了一种基于码本映射的分块h o p f i e l d 网络的水印图像恢复 方法,该方法通过码本映射的方式解决y h o p f i e l d n j 络- 权矩阵占用空间大的问题;采用 对图像进行分块和降低相关性的方法,提高了网络对模糊图像的恢复性能。 实验结果表明,给出的两种水印方法均满足音频水印技术对透明性、鲁棒性和安全 性的要求,可以用于数字音频产品的版权保护、内容保护或篡改区域定位:给出的针对 模糊水印图像的恢复方法,改善了传统水印系统的性能,进一步达到了版权保护的目的。 关键词:音频水印;独立分量分析;版权保护;篡改定位;水印图像恢复 大连理工大学硕士学位论文 s t u d ya n di m p l e m e n t a t i o no nt h ed i g i t a la u d i ow a t e r m a r k i n g t e c h n i q u e a b s t r a c t a st h ep r e v a l e n c ea n do fr a p i dd e v e l o p m e n tc o m p u t e r sa n di n t e r n e t ,d i g i t a lm u l t i m e d i a p r o d u c th a sb e e na p p l i e dw i d e l y h o wt oc a r r yo u tc o p y r i g h tp r o t e c t i o n ,c o p y r i g h tp r o t e c t i o n a n di n f o r m a t i o ns e c u r i t yo nt h ei n t e m e th a sb e c o m eo n eo ft h eu r g e n tp r o b l e m st ob es o l v e d i nd i g i t a lc o m m u n i c a t i o n t h ed e v e l o p m e n to fd i g i t a lw a t e r m a r kt e c h n i q u eb e c o m e san o v e l w a yt os o l v et h i sp r o b l e m a sm u s i cp r o d u c t sl i k em p 3a r ew i d e l ys p r e a do nt h ei n t e r n e t , d i g i t a la u d i ow a t e r m a r k i n gt e c h n i q u eb e c o m e s a i li n t e r n a t i o n a l l yh o tt o p i ca tp r e s e n t i nt h i sp a p e r ,t h em a i nt a s kf o c u s e so nd i g i t a la u d i ow a t e r m a r k i n gs c h e m e a n dt h e n , w a t e r m a r k i n gi m a g er e s t o r a t i o ns c h e m ei sa l s op r o v i d e d ,w h i c hi s b a s e do nt h ea u d i o w a t e r m a r k i n gs c h e m e t w o k i n d so fd i g i t a la u d i ow a t e r m a r k i n gs c h e m e sb a s e do n i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) a n do n ek i n do fw a t e r m a r k i n gi m a g er e s t o r a t i o n s c h e m eb a s e do nc o d e b o o km a p p i n ga n db l o c k e dd i s c r e t eh o p f i e l dn e t w o r ka r ep r o v i d e di n t h i sp a p e r f i r s t l y ,t h em e a n i n go ft h et a s ka n dt h er e s e a r c hb a c k g r o u n da r ei n t r o d u c e d s e c o n d l y ,b a s i cb a c k g r o u n dk n o w l e d g er e l a t e di si n t r o d u c e d a f t e rt h a t ,t w ok i n d so fd i g i t a l a u d i ow a t e r m a r k i n gs c h e m e sb a s e do ni c ai nw a v e l e tt r a n s f o r m e dd o m a i na r ep r o p o s e d a i m i n ga tt h ep r o b l e m st h a tm o s te x i s t i n gd i g i t a la u d i ow a t e r m a r k i n gs c h e m e sc a nw e a k l y r e s i s tt i m e s c a l ea t t a c k ,a n dc o p y r i g h tp r o t e c t i o na n dr e g i o no fi n t e r e s t ( r o i ) o fa u d i os i g n a l p r o t e c t i o n ,am u l t i p u r p o s ed i g i t a la u d i ow a t e r m a r k i n gs c h e m ei nt h e w a v e l e tt r a n s f o r m e d d o m a i nb a s e do ni c aa n ds y n c h r o n i z a t i o ni sp r o p o s e d ,w h i c hr e a l i z e st w op u r p o s e s :r o i i m p o r t a n ta u d i os e g m e n tp r o t e c t i o na n ds i n g l ec o p y r i g h tp r o t e c t i o n a i m i n g a tm u l t i p l e c o p y r i g h t sp r o t e c t i o n ,i m p o r t a n ts e g m e n t a u d i oc o n t e n tp r o t e c t i o na n dt a m p e r e da r e a s l o c a l i z a t i o n ,am u l t i p l ea n dm u l t i p u r p o s ea u d i ow a t e r m a r k i n gs c h e m ei nt h e w a v e l e t t r a n s f o r m e dd o m a i nb a s e do ni c ai sp r o p o s e d ,w h i c he m b e d so n er o ia u d i os i g n a la n dt w o i m a g es i g n a l s i n t ot h eh o s t s i g n a l o w n i n g t w oi m p o r t a n tc h a r a c t e r s :m u l t i p l ea n d m u l t i p u r p o s e ,t h i ss c h e m ea c h i e v e st h ep u r p o s eo ft a m p e r i n gl o c a l i z a t i o no n l ye m b e d d i n g r o b u s tw a t e r m a r k i n gs i g n a l s ,b u tn o tf r a g i l ew a t e r m a r k i n gs i g n a l s a tl a s t ,a i m i n ga tt h e e f f e c t i v ec o p y r i g h tp r o t e c t i o ne v e nw h e nt h ec o p y r i g h ts y m b o l sh a v eu n d e r g o n es e r i o u s a t t a c k s ,aw a t e r m a r k i n gi m a g er e s t o r a t i o ns c h e m eb a s e do nc o d e b o o km a p p i n ga n db l o c k e d d i s c r e t eh o p f i e l dn e t w o r ki sp r o p o s e d ,w h i c hs o l v e st h el a r g es p a c ea s s u m i n gp r o b l e mo f w e i g h tm a t r i x o fh o p f i e l dn e t w o r kb yc o d e b o o km a p p i n g ,a n d e n h a n c e st h en e t w o r k i i 数字音频水印技术的研究和实现 r e s t o r a t i o np e r f o r m a n c eb yb l o c k i n gs c h e m ea n dr e d u c i n gc o r r e l a t i o no fw a t e r m a r k i n g i m a g e s e x p e r i m e n t a lr e s u l t ss h o wt h a tb o t ho ft h et w oa u d i ow a t e r m a r k i n gs c h e m e sc a l ls a t i s f y t h er e q u i r e m e n t so ft r a n s p a r e n c y , r o b u s t n e s sa n ds e c u r i t y ,a n dc a nb ea p p l i e di nc o p y r i g h t p r o t e c t i o n ,c o n t e n tp r o t e c t i o no rt a m p e r e da r e a sl o c a l i z a t i o n ;t h eb l u r r e dw a t e r m a r k i n gi m a g e r e s t o r a t i o ns c h e m ec a l li m p r o v et h ep e r f o r m a n c eo ft h et r a d i t i o n a lw a t e r m a r k i n gs y s t e ma n d a c h i e v et h ep u r p o s eo ft h ec o p y r i g h tp r o t e c t i o nm o r e e f f e c t i v e l y k e yw o r d s :a u d i ow a t e r m a r k i n g ;i n d e p e n d e n tc o m p o n e n ta n a l y s i s ;c o p y r i g h tp r o t e c t i o n ; t a m p e r e da r e a sl o c a l i z a t i o n ;w a t e r m a r k i n gi m a g er e s t o r a t i o n i i i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目: 壑豆至亟蕉丝# 丝盔耷整担垦塑眨 作者签名: 盔金 日期:塑年上月监日 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 壑蔓至叠坚# 型塑姿銎璧凌室宣些 作者签名:垄垒 日期:丝墨年竺月坚日 导师签名:蔓! 坠堕 大连理工大学硕士学位论文 1绪论 1 1 选题的意义和研究背景 随着数字多媒体技术及互联网技术的迅猛发展,使得图像、视频和音频等多种形式 的多媒体数字作品的创作、存储和传输都变得极其便利。以m p 3 为代表的网络音乐在 互联网上广泛传播得益于数字音频压缩技术的成熟。但是,因特网上肆无忌惮的复制和 传播盗版音乐制品,使得艺术作品的作者和发行者的利益受到极大损害。在这种背景下, 能够有效地实行版权保护的数字水印技术应运而生。 数字水印作为近年来出现的数字产品版权保护技术,是通过在原始媒体中嵌入秘密 信息来证实该数据的所有权归属或保证数据的完整性。 目前,数字水印技术主要涉及数字图像、视频和音频等领域。在数字水印发展之初, 人们的注意力主要集中在图像和视频上,因为与这两种水印嵌入技术相比,在数字音频 信号中嵌入水印的技术难度较大,这主要是由于人类听觉系统与视觉系统相比具有更高 的灵敏度。随着数字水印技术研究的深入,越来越多的学者将目光投向了数字音频水印 技术领域。这是因为利用听觉系统的一些特性,如掩蔽效应、听觉系统对绝对相位不敏 感等特性来嵌入水印,同样可以取得很好的效果。迄今为止,大多数数字音频水印技术 主要集中单个目的上,例如嵌入鲁棒水印实现在版权保护的目的【l 钢,嵌入脆弱水印实现 内容完整性认证的目的【8 。l l 】等。然而,随着音频水印技术的不断发展,研究出一种同时 实现多个目的的【1 2 1 7 】音频水印技术迫在眉睫。 同时,大多数的音频水印文献是讨论如何设计水印方案来抵抗各种攻击,然而音频 水印技术发展至今,没有一种方法能够在抵抗任何强度的攻击方式的基础上,包括在进 行恶意攻击( 例如剪切,篡改等) 和非恶意攻击( 例如带宽限制,信道中的噪声等) 后,仍然 能够有力地进行版权保护。原因在于,隐秘信号一旦遭受高强度的攻击,一部分水印算 法便丧失了其应有的作用。因而,如何在遭受攻击后无法利用提取的水印信息进行版权 保护的情况下,设计一种辅助系统使受损的水印信息依旧发挥它的职能成为完善数字水 印技术的一个关键。 因此,一个健全的数字水印系统需要具备如下两个部分:第一,稳健的多目的水印 系统,该系统的水印算法能够抵抗常见的非高强度的攻击;第二,良好的水印恢复系统, 该系统建立在水印系统之上,为该水印系统服务并提高该系统的抗攻击功能。本文分别 对这两种系统作了研究和实现。 数字音频水印技术的研究和实现 1 2 数字音频水印技术概述 1 2 1 数字音频水印技术的概念 数字音频水印技术隶属于信息隐藏领域,它是在不影响原始音频质量的条件下,通 过一定的算法向宿主音频信号中嵌入具有特定意义且易于提取信息的技术,达到保护产 品的版权、证明产品的真实可靠性、跟踪盗版行为或者提供产品的附加信息等目的,也 可以用来识别音乐制品的来源、版本、原作者、发行者、所有者以及合法使用者对数字 音频产品的所有权。嵌入的信息,又称作水印信号,可以是作品序列号、文字、版权标 识符、具有特定意义的图像或- 4 , 段音频等等与该数字产品有关的信息,也可以是不具 有任何意义的随机信号,用来证实待检测音频产品的存在性或完整性。 1 2 2 数字音频水印技术的分类 数字水印是嵌入到数字媒体中的信号,这个信号使人们能够建立产品所有权,辨识 购买者或数字产品的一些额外信息。按隐秘信号中的水印是否可见,可以分为可见水印 和不可见水印【1 4 】两大类。数字图像水印技术涵盖了这两大类型水印,而数字音频水印 技术则采用的是不可见水印。数字音频水印技术按照不同的标准可以分为很多类别,具 体如下:( 1 ) 按照水印抗攻击的能力可以分为脆弱水印和鲁棒水印【5 】:( 2 ) 按照嵌入信息 的容量可以分为1 比特水印【1 明和多比特水印【1 6 2 0 川;( 3 ) 按照水印的用途可以分为单目的 水印和多目的水印【1 4 1 ;( 4 ) 按照水印检测的方式可以分为盲水印嘲和非盲水印田1 ;( 5 ) 按照 水印的嵌入过程是否可逆可以分为对称水印和非对称水印:( 6 ) 按照水印嵌入的位置可以 分为时域水印【2 3 1 、压缩域水印和变换域水印【7 ,2 4 】。 1 2 3 数字音频水印技术的特征分析 数字音频水印技术必须具有如下特征: ( 1 ) 无法感知性( 透明性) 无法感知性是指向数字音频作品中嵌入数字水印,经过一系列隐藏处理,掩体对象 必须没有明显的降质现象,而嵌入对象不会引起人的感知的能力。 ( 2 ) 稳健性( 鲁棒性) 稳健性是指抗拒各种信号处理操作和恶意攻击,在掩体对象不产生明显降质的前提 下,不导致水印信息丢失的能力。需要指出的是稳健性也只是用于版权保护的水印所必 须具有的特征,而对于以保护数据完整性为目的数字水印来说,脆弱性则是其最重要的 特征。 大连理工大学硕士学位论文 ( 3 ) 确定性( 无歧义性) 确定性是指恢复出的水印或水印判决的结果应该能够确定地表明所有权,不会发生 多重所有权的纠纷。 ( 4 ) 隐藏位置的安全性 安全性是指必须将水印信息隐藏于掩体对象的内容之中,而非文件头等处,这样可 以防止因文件格式的变换而使水印遭到破坏。 ( 5 ) 不可检测性 不可检测性是指嵌入水印后的掩体对象与原始掩体对象具有一致的特性,如具有一 致的统计噪声发布等,以便使攻击者无法判断其中是否含有隐藏信息。 在上述的特点中,最基本的两个特点是稳健性和无法感知性,但这两者之间是存在 矛盾的。从嵌入的强度来看:稳健性与嵌入的强度直接相关,嵌入的强度越大,则稳健 性越好;但如果嵌入的强度过大,则会影响到无法感知性。从嵌入的位置来看,水印嵌 入到信号的高频部分无法感知性较好。因为人类的听觉系统( h u m a na u d i t o r ys y s t e m , h a s ) 对信号的低频部分较为敏感,对信号的高频部分相对来说比较迟钝。但是一般的信 号处理操作( 如滤波、有损压缩等) 通常会损伤信号的高频部分,从而又影响到水印的稳 健性。在实际的应用中应该根据不同的要求选择两者的折衷。 毫 1 2 4 数字音频水印技术的性能评估 “ 随着数字音频水印技术的发展,为了评估一个水印算法的优劣,相应地出现了一系 列的音频水印评估标准。最常用的评估标准是主观测试法,利用人耳的主观评估来判断 算法的质量,对于一个成功的音频水印技术而言,水印的嵌入不应当影响到音频产品的 听觉质量,即加入水印后的音频信号与原始的音频信号相比较在听觉上应当没有明显的 差别。一般来说,对音频信号质量的度量采用主观平均判分法( m e a no p i n i o ns c o r e , m o s ) ,即招集若干实验者,由他们对信号的好坏进行评分,求出平均值作为对音频信 号质量的评估1 2 5 1 。但是,主观评估经常受到测试者的背景知识、观测环境等其他因素的 限制和影响,评估结果的一致性较差。客观测度作为一个可以定量评估数字音频水印的 标准,在性能评估中占有十分重要的地位。通常情况下,对采用不同嵌入机制的音频水 印算法分别采用不同的客观度量方法,下面给出了几个常见的参数: ( 1 ) 信噪比( s i g n a lt on o i s er a t i o ,s n r ) :把嵌入的水印信号看作是加载到原始音频 信号上的噪声,可通过计算信噪比来衡量嵌入的水印信息对音频信号的影响程度。信噪 比的计算公式为 数字音频水印技术的研究和实现 舢( x , x ) = 1 0 - l 0 9 1 0 ( 貉 1 ) 其中,x 为原始音频信号,为隐秘信号,为音频信号的采样点数,三为音频信号 的长度。 ( 2 ) 峰值信噪i 比( p e a ks i g n a lt on o i s er a t i o ,p s n r ) :当水印信息嵌入到音频信号中之 后,通过观察其峰值信噪比可以定量地评估隐秘信号的透明性。峰值信噪比的计算公式 为 一( x , x ) = 1 0 - l o g l o ( 一 化2 ) 其中,x 为原始音频信号,x w 为隐秘信号,为音频信号的采样点数,三为音频信号 的长度。 当衡量提取出的水印信号的质量时,也可以用该参量评估提取水印信号受到噪声影 响的大小,此时的x 表示原始水印信号,表示提取的水印信号。 ( 3 ) 归一化互相关系数( n o r m a l i z e dc r o s s c o r r e l a t i o nc o e f f i c i e n t ,n c c ) :为了衡量提 取的水印信号与嵌入的水印信号之问的相关程度,一般可通过计算它们的归一化互相关 系数来判定。归一化互相关系数的计算公式为 c c r m ,访、: :! ! ! ! ! :堡! ! ! ( 1 3 ) 们“w 奶2 露箭罚羞丽 0 3 其中,w 与访分别表示嵌入的水印信号和提取的水印信号,刀为水印信号的点数, 代表水印信号的长度。 同时,当w 和访代表两个完全不同的信号时,式( 1 3 ) 也可以作为二者相关性大小的 量度。 ( 4 ) 相似系数( s i 觚l a r i 哆c o e f f i c i e n t , s c ) - 不同于归一化互相关系数,相似系数从另 外一个角度衡量提取水印信号与嵌入水印信号的相似性。相似系数计算公式为 s c c w ,访,= 学 。4 , 其中,w 表示嵌入的水印信号,访表示提取的水印信号,以为水印信号的点数, 大连理工大学硕士学位论文 代表水印长度。当w 序列是 一1 ,1 序列时,式( 1 4 ) 变为 8 c ( w ,影) = 古二。w ( 刀) 访( 刀) ( 1 5 ) ( 5 ) 归一化汉明距离( n o r m a l i z e dh a m m i n gd i s t a n c e ,m - i d ) 对于水印信号为二值序 列的情况,可以通过计算提取的水印信号与嵌入的水印信号之间的归一化汉明距离来检 测其相似性。归一化汉明距离的计算公式表示为 删m 动= 寺:以刀) o 议力) ( 1 6 ) 其中,w 表示嵌入的水印信号,访表示提取的水印信号,以为水印信号的点数, 代表水印长度,“o 一表示异或操作。 1 2 5 数字音频水印技术的发展现状 数字音频水印技术是2 0 世纪9 0 年代发展起来的- f - j 新兴技术,至今已经历了十几 年的发展,算法主要集中在时域和频域算法上:( 1 ) 时域算法中,x i a n g t 2 3 1 提出了一种在 时域中基于统计及特征提取的多比特水印方法,充分利用了直方图形状对时域缩放不敏 感的特性。在时域信号中提取了两种对时域缩放具有较强鲁棒性的特征,利用同步匹配 技术,使得该水印方法能够抵抗常见的信号处理操作。为了增强鲁棒性,e r g e l e b i 2 6 】提 ,出了一种基于伪随机序列的音频水印方法,该方法在时域中把多比特的水印信息嵌入到 每个音频子帧中,进而最大化的满足透明性和鲁棒性的要求,并且节省了运算量,容易 实现。( 2 ) 变换域算法中,w a n g t z 4 j 提出了一种基于支持向量机( s v m ) 的自适应数字音频 水印方法。该方法通过s v m 理论首先定位出嵌入区域,选取b a r k e r 作为同步码修改采 样点的统计均值,利用人类听觉掩蔽效应把水印信息嵌入到小波低频分量的统计均值 里。 从综合性能上讲,变换域的方法更加优越,本文采用的是变换域的方法。 1 3 本论文的主要研究内容及章节安排 针对数字音频产品的版权保护和内容完整性认证等问题展开研究,本论文给出了基 于独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 和奇异值分解( s i n g u l a rv a l u e d e c o m p o s i t i o n ,s v d ) 的自同步小波域多目的音频水印方法和基于独立分量分析的小波 域多重和多目的音频水印方法这两种水印方法;针对隐秘信号在遭受高强度攻击时提取 出的水印图像质量受损的问题,本论文给出了基于码本映射的分块离散h o p f i e l d 网络的 水印图像恢复方法。具体章节安排如下: 数字音频水印技术的研究和实现 第l 章对数字音频水印技术进行了概述。 第2 章介绍了文中涉及的一些基础知识和基本原理。首先,简要地介绍了离散小波 变换。其次,介绍了奇异值分解;接着,阐述了盲源分离技术的基本思想,并详细地描 述了解决盲源分离问题的常用算法:独立分量分析算法。最后,介绍了离散h o p f i e l d 网 络的相关知识。 第3 章给出了一种基于i c a 和s v d 的自同步小波域多目的音频水印方法。利用线 性混合和盲源分离技术同时实现了感兴趣音频水印信号和图像水印信号这两个鲁棒水 印信息的嵌入和提取,利用信号自身的特征实现了嵌入位置的自同步。 第4 章针对数字音频产品面临的多著作权的版权保护、重要音频段的保护和篡改区 域定位的问题,给出了一种基于i c a 的小波域多重和多目的音频水印方法。通过在音频 信号中嵌入多个鲁棒水印实现了音频信号的版权保护和篡改区域的定位,并实现了原始 音频信号中感兴趣区域的版权和音频内容的保护。 第5 章为了克服传统水印系统在遭受高强度攻击时无法有效实现版权保护的问题, 给出一种基于码本映射的分块离散h o p f i e l d 网络的水印图像恢复方法。该方法采用神经 网络中的离散h o p f i e l d 网络对水印系统接收端提取出的受攻击的模糊水印图像进行了恢 复,通过码本映射的方法减少了存储空间和网络传输时的数据量,通过对图像进行分块 和减少图像间相关性的方法增强了水印恢复系统的性能。 最后,全文进行了总结,并对数字音频水印技术今后的发展前景进行了展望。 大连理工大学硕士学位论文 2 基本知识和基本原理 2 1离散小波变换 小波变换是一种新型的信号处理技术,尤其适用于对音频这样的非平稳信号进行分 析和处理。与短时傅立叶变换( s t f t ) 对所有频率提供均匀的时间分辨率不同,小波变换 有效地克服了s t f t 在处理非平稳信号时的这种局限性,提供了很好的局部化特性,它 可在时域和频域实现局部化定位观测,对高频提供高的时间分辨率和低的频率分辨率, 对低频提供低的时间分辨率和高的频率分辨率,这与人耳的听觉分辩特性类似。 一维离散小波变换将信号分解为逼近分量( 低频分量) 和细节分量( 高频分量) ,逼近分 量又进一步被分解为逼近分量和细节分量。具体分解层数视信号长度和具体应用而定。 应用m a l l a t 塔式算法,小波分解可以表示为 x ( ,z ) - 2 2 。瞄( 畹。( 2 行一, ( 2 1 ) d k + l ( 刀) = :。臂( ,) ( 2 聆一, ( 2 2 ) 其中,d ( ,z ) ( k = 1 ,2 ,k ) 为小波细节分量系数,x ( 刀) ( 后= 1 ,2 ,k ) 为小波逼近 分量系数,妒( ,z ) = x ( n ) ,瞄( ,) 和臂( f ) 分别为高通和低通滤波器系数。每个子带包含的 样本数是其父带样本数的一半。小波变换后信号的能量主要集中在逼近分量,细节分量 所占的能量很少。 小波重构是分解的逆过程,可以用式( 2 3 ) 来表达: z 。1 ( 刀) = :。g :( ,) z ( 2 刀一,) + :。g ( ,) d ( 2 一,) ( 2 3 ) 小波分解具有多种可以选择的小波基,几种常用的基本小波2 7 1 包括:( 1 ) m o r l e t 小波; ( 2 ) m a r r 小波;( 3 ) d o g 小波;( 4 ) h a a r 小波;( 5 ) 样条小波:( 6 ) d a u b e c h i e s 小波。 2 2 奇异值分解( s v d ) 奇异值分解是一种线性代数工具【2 8 】,对于一般的矩阵a r ,不妨设m n , r a n k ( a ) = r ,奇异值分解可以表示为 a = ( u l ,u 2 ,u 朋) d i a g ( a , ,0 2 ,吒) ( v l ,v 2 ,v 。) = u a v h( 2 4 ) 数字音频水印技术的研究和实现 其中,u 和v 分别是m 阶和n 阶的正交阵。a 为非负对角阵,其主对角线元素按照 下列顺序排列,0 - 1 o - 2 q 0 ,q + l = q + 2 = = = 0 ,正交阵u 和v 的列向量 u 1 , u 2 ,u 历和v l ,v 2 ,v 。分别称为矩阵a 的奇异值q ,f - 1 ,2 ,对应的左奇异向量和 右奇异向量。 一幅图像可以被看成一个非负矩阵,而奇异值分解是针对矩阵提出来的线性代数工 具,所以被广泛应用于数字图像水印中,但在音频水印中的应用还很少。由于音频信号 是一维的,所以可将其进行升维,进而使用奇异值分解对其进行分析。本文充分利用奇 异值分解的特性,将奇异值的特性体现在感兴趣音频信号里。 2 3 盲源分离技术 2 3 1 盲源分离概述 近年来,盲源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 已经成为信号处理学界和神经网络 学界共同感兴趣的研究热点领域,并获得了迅速的发展t 2 9 。3 。 假设一组源信号经过一个混合矩阵进行变换,输出得到一组观测信号,盲源分离需 要解决的问题是在源信号和混合矩阵均为未知的情况下,仅依靠观测信号提供的信息确 定一个变换,以恢复出各路源信号。盲源分离的核心问题是分离( 解混合) 矩阵的学习算 法,它属于无监督学习,基本思想是抽取统计独立的特征作为输入的表示,而又不会丢 失信息。混合模型分为线性和非线性模型,当混合模型为非线性时,一般无法从混合数 据中恢复出源信号,除非对信号和混合模型有进一步的先验知识可以利用。因此,本论 文中只讨论线性混合模型的情况。盲源分离可以用如下混合方程描述: x = a s ( 2 5 ) 公式( 2 5 ) 所描述的内容是n 维源向量s = b ,s 29 1 9 s o t 经过一个m x n 维的混合矩阵 a 进行线性变换,得到m 维观测向量x = 五,x 2 ,】t 。盲源分离的目的是在a 和s 均 为未知的情况下确定一个解混合矩阵w ,使得 y = w x( 2 6 ) 其中,y 为源信号s 的估计值,并且y 中的各个分量均尽可能相互独立。 目前,盲源分离在数字水印技术中有着广泛的应用,一种方式是利用盲源分离算法 对信号进行特征提取;另外一种方式是作为水印提取时的一种工具,实现水印信息的盲 检测或者盲提取。本文采用的是第二种应用,来实现数字音频水印技术中水印的检测和 盲提取。 一8 一 大连理工大学硕士学位论文 2 3 2 独立分量分析( i c a ) i c a 是用来解决盲源分离问题的常用方法【3 2 1 3 4 1 ,其关键问题是对向量y 要确定一个 对比函数( ) ,) ,定义为将y 的概率密度分布集合映射为一实值函数的算子,需要满 口 巴: ( 1 ) 若向量y 的元素咒改变排列位置,则函数o ) 保持不变,即对于所有交换矩阵 p ,恒有( p y ) = ( y ) 成立; ( 2 ) 若向量y 的元素y j 改变尺度,则函数 ) 保持不变,即对于所有可逆对角矩阵 d ,恒有矽( d y ) = 矽 ) 成立。 选用不同的对比函数可以得到不同的i c a 算法。下面列出了几种典型的i c a 算法: 随机梯度算法【3 5 】,自然梯度算法,借助独立性等变化的自适应分离算法 3 7 1 和固定点算 法【3 8 - 4 2 等。其中前三种算法只适合于亚高斯信号或超高斯信号单独存在的情况,而在本 文中有待分离的音频信号为超高斯信号,水印信号为亚高斯信号,故本文采用固定点算 法( f a s t i c a ) 。 f a s t i c a 是一种离线算法,在无需自适应分离的情况下,它是一种快速的、数值稳 定的算法。该算法提出利用一个压缩映射过程逐个分离出所有的独立分量,本文采用 f a s t i c a 进行混合信号的分离。 。2 4 离散h o p f ie id 网络 2 4 1 离散h o p f i e i d 网络概述 早在2 0 世纪4 0 年代,在神经网络领域中提出了著名的m p 模型。迄今为止,神经 网络的发展已经达到上百种模型,如今已在模式识别、系统辨识、信号处理、自动控制、 组合优化、预测预估、故障诊断、专家系统以及经济管理等众多领域已经成功地解决了 许多传统数字计算机难以解决的实际问题【4 3 刖】,表现出了很好的智能特性和广阔的应用 前景。 美国加州工学院的物理学家h o p f i e l d 教授,于1 9 8 2 年发表了对神经网络发展颇具 影响的论文【4 5 1 文中提出一种单层的反馈型神经网络,这种网络称作h o p f i e l d 网络。 应用h o p f i e l d 网络解决问题的创新之处在于,它利用了“能量函数一来描述网络的 状态。在反馈网络结构满足一定条件的前提下,若按一定规则不断更新网络的状态,则 具有特定形式的能量函数将单调减小,最后达到能量的某一极小点,网络所有神经元的 状态将不再改变,此时便达到了h o p f i e l d 网络的稳定状态 4 6 , 4 7 1 。在h o p f i e l d 网络的拓扑 结构及权矩阵均一定的情况下,网络的稳定状态将与其初始状态有关。h o p f i e l d 网络是 一9 一 数字音频水印技术的研究和实现 一种能存贮若干个预先设置的稳定状态的网络。因此,若用网络的初始状态代表一种模 式,而用其稳态代表另一种模式,那么h o p f i e l d 网络便可用作模式联想。模式联想分为 自联想和互联想两大类。本文研究离散h o p f i e l d 网络在模式自联想中的作用,并将这种 自联想功能应用到数字水印技术中,实现对模糊水印图像的恢复。 2 4 2 离散h o p f i e i d 网络拓扑结构和学习算法 h o p f i e l d 神经网络有两个组成成分,即存储信息的学习规则和提取信息的动力规则。 在对称性h o p f i e l d 模型中,能量函数可以达到极小值【4 7 1 。这样,h o p f i e l d 模型不但扩展 了神经网络的理论,并且发展了神经网络的计算方法,解决了网络中神经单元数和存储 模式数量之间的关系,以及网络噪声与神经单元存储效率之间的关系。 ( 1 ) 网络拓扑结构 离散h o p f i e l d 网络是一个离散的时间系统,每一个神经元有两种状态:“+ 1 ”和“1 ”。 设网络有以个神经元,则该网络可以用权矩阵w 和阈值向量0 唯一确定,权矩阵 w = ,汪1 ,2 ,甩,= l ,2 ,甩是一个力刀的矩阵,元素表示神经元f 到j 之i 日- j 的 连接权值,并且w 是一个对称矩阵。依据w 矩阵的对角线元素是否为0 ,网络分为两 种形式:当嵋,= 0 时,则表示该网络没有自反馈:当m 。0 时,则表示网络有自反 馈。阈值向量0 = f 谚l ,i = 1 ,2 ,刀是一个刀维向量,元素2 表示节点f 的阈值。本文讨论 没有自反馈并且0 为零向量的h o p f i e l d 网络,该网络的网络拓扑结构如下图2 1 所示。 广 t j 。 f两 f 、 f 屯沙k x lx t x j x n 图2 1 h o p f i e l d 网络的拓扑结构 f i g 2 1t o p o l o g ys t r u c t u r eo fh o p f i e l dn e t w o r k 大连理工大学硕士学位论文 其中,x = 【五,再,x j ,毛】是网络的输入向量,y = 如,儿,乃,儿】是网 络的输出向量。该网络是全连接网络:每单元与其它单元均有连接,但无自连接,各神 经元为非线性单元,网络的输出与输入单元的关系如下式所示: 乃= 伊( :i 。葺) ( 2 7 ) 其中,驴( ) 为非线性函数,本文选用符号函数作为非线性函数,即9 ( ) = s g n ( ) 。 ( 2 ) 网络的学习算法 设输入样本有m 个模式,每个模式x ( 七) ,k = 1 ,2 ,m 都是一个含有力个元素的向量 x ( | | ) = k ( 七) ,而( 七) ,矗( 忌) 】1 ,向量元素薯( 七) = l 或者一l ,i = 1 ,2 ,撑。权矩阵w 的构 造步骤如下: 将权矩阵元素( 0 ) 初始化为0 ,同时,样本模式k 初始化为l : 输入第k 个模式x ( k ) ,进行各权值的更新,如式( 2 8 ) 和式( 2 9 ) 所示: c 七,= 。:而七:三:;c 2 8 , ( 七+ 1 ) = 坳骐哆+ 豫( 张f = 1 ,2 ,殇= 1 ,2 ,t ( 2 9 ) 输入第k + l 模式的样本x ( k + 1 ) ,重复步骤的计算过程,直到用完所有的样本 x ( 忌) ,k = l ,2 ,m 为止。 该方法可以写成矩阵形式: w - - ( 2 1 0 ) 离散相关联想记忆是一种自联想记忆。当输a x 时,输出y 并不是立即得到稳定的 结果,各神经元处于动态变化之中。设y ( 0 ) = x ,迭代公式如式( 2 11 ) 所示: y q + 1 ) = 缈( w y ( f ) ) ,t = 0 ,1 ,2 ,( 2 1 1 ) 其中,表示迭代的次数,y g ) = k ,儿( ,) sa * a 咒刚1 ,每次迭代求出全部输出,然 后再作下次迭代。反复使用上式,直到所有单元的状态都不再变化时,即y ( t + 1 ) = y ( f ) 时联想结束。此时网络处于某种稳定状态,该稳定状态的输出为其联想输出。 数字音频水印技术的研究和实现 2 4 3 离散h o p f i e i d 网络性能分析 离散h o p f i e l d 网络作为一个稳定的动态反馈系统,比前馈网络具有更强的稳定性能 和存储记忆能力,下面对其性能作进一步的分析。 ( 1 ) 网络的能量函数与稳定性分析 h
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025一级建造师综合提升测试卷及完整答案详解【名校卷】
- 应急安全培训校园课件
- 2024-2025学年度收银审核员测试卷及参考答案详解【达标题】
- 2025燃气职业技能鉴定考前冲刺试卷附参考答案详解AB卷
- 秋季腹泻典型临床表现与非典型症状识别
- 2024年安全员考试模拟试题附完整答案详解(夺冠)
- 水井合同(标准版)
- 信息系统项目管理师案例分析
- 2024-2025学年度环境影响评价工程师之环境影响评价相关法律法规能力提升B卷题库及答案详解【真题汇编】
- 2024年安全员考试检测卷及答案详解(网校专用)
- 2025年高考真题-化学(湖南卷) 含答案
- 植保培训活动方案
- 好教育好人生
- 头痛的中医护理查房
- 客户拜访技巧讲课件
- 软件和信息技术服务定制化开发解决方案
- 水井清污协议书
- 水利工程施工防火措施
- 2025年煤炭生产经营单位(一通三防安全管理人员)考试笔试试题(400题)附答案
- 音乐基础-乐理篇
- 塑胶地板施工合同
评论
0/150
提交评论