




已阅读5页,还剩69页未读, 继续免费阅读
(计算机应用技术专业论文)基于dft和dwt结合的音频水印算法的设计与系统实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于d h 和d 盯结舍的音频数字水印算法的设计与系统实现 摘要 随着网络技术和多媒体技术的迅猛发展,数字水印技术已经成为版权保护的一种 有效办法。音频水印是以音频为载体的水印技术,通过在音频载体中嵌入水印信息, 实现版权保护、掩蔽通信的目的。 本文就就如何向音频信号中嵌入具有不可感知性和鲁棒性水印的问题,展开了如 下研究。 本文在介绍了一般水印的概念和理论后,首先实现了两种数字音频水印算法。一 种是基于傅立叶变换的水印算法,该算法通过对音频信号进行傅立叶变换,对变换后 的傅立叶幅度系数进行量化来嵌入水印信息,算法的仿真实验表明了该算法具有较好 的不可感知性和一定的鲁棒性。另一种是基于小波变换的水印算法,该算法首先对音 颏信号迸行三层小波分解,然后通过量化小波分解的低频分量来嵌入水印,算法的仿 真实验 在讨论了上述两种算法后,本文还设计并实现了一种结合傅立叶变换和小波变换 的水印算法。该算法首先对音频信号进行三层小波分解,将得到的低频分量再进行傅 立叶变换,在变换后的幅度系数中通过量化手段来嵌入水印信息。该算法的仿真实验 很好地实现了水印的不可感知性和鲁棒性。另外,在相同条件下,通过对三种算法的 比较,证明了新的算法在不可感知性和鲁棒性上都优于前两种算法。 最后,在本文讨论的三种算法基础上,利用m a t l a b 平台设计并实现了音频水印的 应用系统。 关键词:音频水印:量化;傅立叶交换;小波变换;不可感知性;鲁棒性 作者:蒋一鸣 指导教师:徐汀荣 皇堕竺苎里竺! 婴竺! ! 坚竺! 竺! 竺塑竺! 竺堕竺皇! ! 堕! 竺! 竺! 生! 堡皇! 翌坐! 翌! 竺型竺竺! 型! 些! a b s t r a c t w i t ht h ed e v e l o p m e n to fn e t w o r kt e c h n o l o g ya n dd i g i t a lm u l t i m e d i at e c h n o l o g y , d i g i t a lw a t e r m a kh a sb e c o m eap o p u l a rt o p i ei nt h ef i e l do fd i g i t a lc o p y r i g h tp r o t e c t i o n a u d i od i g i t a lw a t e r m a r k i n gt e c h n i q u ei sak i n do fd i g i t a lw a t e r m a r k i n gt h a tt a k e st h ea u d i o s i g n a la sc a l t i e r , w i t he m b e d d i n gd a t ai n t ot h ea u d i os i g n a l ,i ti m p l e m e n t ss o m eg o a l ss u c h a sc o p y r i g h tp r o t e c t i o na n dc o v e rc o m m u n i c a t i o n t h i st h e s i sm a l r i l y o c u s e so nt h ep r o b l e mo fe m b e d d i n gs a t i s f a c t o r yr o b u s ta n di m - p e r c e p t i b l ew a t e r m a r k i n gi n t ot h ea u d i od i g i t a lp r o d u c t s m a i ni d e aa sf o l l o w s : f i r s t , a f t e ri n t r o d u c i n gg e n e r a lc o n c e p t i o no fd i g i t a lw a t e r m a r k i n g ,t h i s t h e s i s i m p l e m e n t st w oa u d i ow a t e r m a r k i n ga l g o r i t h m ,o n ei sb a s e do nd i s c r e t ef o u r i e rt r a n s f e r , w h i c he m b e d st h ew a t e r m a r ki n t ot h ea m p l i t u d eo f t h er e s u l to f d f tb yu s i n gq u a n t i z a t i o n m e t h o d t h ee x p e r i m e n t ss h o wt h a tt h ea l g o r i t h mh a sg o o di m p e r c e p t i b l ea n ds o m e r o b u s t n e s s t h eo t h e ri sb a s e do nd i s c r e t ew a v e l e tt r a n s f e r , w h i c he m b e d st h ed a t ai n t ot h e a p p r o x i m a t i o nc o e f f i c i e n t sb yu s i n gq u n n t i z a t i o nm e t h o d a n di t a l s oh a si m p e r c e p t i b l e a n dr o b u s t n e s st om a n ys i g n a lo p e r a t i o n a f t e rd i s c u s s i n gt h ea b o v ea l g o r i t h m ,w ep r o p o s e dan e wa l g o r i t h mb a s e do nb o t h d w ta n dd f t i tt r a n s f e r st h ea u d i os i g n a lu s i n gd w tf i s t l ya n dt h e nc h o o s et h el o w e s t f r e q u e n c yc o e f f i c i e n t t od f t t h e ni te m b e d sd a t ai n t oa m p l i t u d ec o e f f i c i e l l t t h e e x p e r i m e n tr e s u l ti n d i c a t e st h a tt h en e wa l g o r i t h mi si n a u d i b l ea n dr o b u s ta g a i n s tm a n y s i g n a lo p e r a t i o n i na d d i t i o n ,c o m p a r i n gw i t ht h et w oa l g o r i t h m sa b o v eu n d e rt h es a n l e c o n d i t i o n ,i tp r o v e st h a tt h en e wa l g o r i t h mi sb e t t e rt h a nt h eo t h e rt w o l a s t l y , w ed e s i g na n di m p l e m e n ta l la u d i oa p p l i c a t i o ns y s t e mu s i n gm a t l a bt o o lb a s e d o nt h ed i s c u s s i o no f t h et h r e ea l g o r i t h m s k e y w o r d s :a u d i ow a t e r m a r k i n g ;q u a n t i z a t i o n ;d f t td w t i m p e r c e p t i b l e ;r o b u s t n w r i t t e nb yj i a n gy i m i n g s u p e r v i s e db yx ut i n g - r o n g 图表目录 图2 1 回声编码水印嵌入流程图1 0 图2 2 回声编码水印提取流程图一1 1 图3 1 傅立叶变换的周期性一1 8 图3 2 单极性量化原理图1 9 图3 3 双极性量化原理图2 0 图3 4 原始音频信号波形图,2 4 图3 5 原始水印图像2 4 图3 6 含水印的音频信号2 5 图3 7 未经攻击提取的水印图像2 5 图3 8 低通滤波提取的水印2 5 图3 9 重量化提取的水印2 6 图3 1 0 m 9 3 压缩提取的水印( 1 2 8 b p s ) 2 6 图3 1 1 高斯噪声提取的水印2 6 图3 1 2 重采样提取的水印2 6 图4 ,1 小波分解树,3 2 图4 2 原始音频信号波形图3 3 图4 3 原始水印图像3 4 图4 4 嵌入水印的音频信号:3 4 图4 5 原始水印图像3 4 图4 6 低通滤波提取的水印一3 5 图4 7 重采样提取的水印3 5 图4 8 重量化提取的水印3 5 图4 9 高斯噪声提取的水印,3 5 图4 1 0 m p 3 压缩提取的水印图像3 6 图5 1 嵌入算法框架图3 7 图5 2 置乱图像3 8 图5 3 水印提取算法框图4 0 图5 4 原始音频波形图一4 2 图5 5 原始水印图像。4 2 图5 6 嵌入水印的音频信号4 2 图5 7 未经攻击提取的水印图像一4 2 图5 8 低通滤波提取的水印4 3 图5 9 重采样提取的水印图像4 3 图5 1 0 重量化提取的水印4 4 图5 11 高斯噪声提取的水印4 4 图5 1 2m p 3 压缩提取的水印4 4 图6 1 水印嵌入流程图4 9 图6 2 水印提取流程图5 0 图6 3 模块调用框图5 1 ,图6 4 系统主界面5 2 图6 5 傅立叶变换算法水印嵌入的界面一5 3 图6 6 傅立叶变换算法水印提取的界面5 3 图6 7 傅立叶变换算法水印评价的界面5 4 图6 8 小波变换算法水印嵌入的界面一5 4 图6 9 小波变换算法水印提取的界面5 5 图6 1 0 小波变换算法水印评价的界面5 5 图6 1 l 结合傅立叶变换和小波变换算法水印嵌入的界面5 6 图6 1 2 结合傅立叶变换和小波变换算法水印提取的界面5 6 图6 1 3 结合傅立叶变换和小波变换算法水印评价的界面5 7 表2 1 主观差别等级1 4 表5 1 三种算法比较4 5 表6 1 系统模块及其功能5 1 苏州大学学位论文独创性声明及使用授权声明 学位论文独创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所 取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或 撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材 料。对本文的研究作出重要贡献的个人和集体,均己在文中以明确方式标明。本人承 担本声明的法律责任。 研究生签名:稿一岛日期:塑型 学位论文使用授权声明 苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文合作部、中国 社科院文献信息情报中心有权保留本人所送交学位论文的复印件和电子文档,可以采 用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括干u 登) 论 文的全部或部分内容。论文的公布( 包括刊登) 授权苏州大学学位办办理。 研究生签名:藕岛日期:哩:空:! :! 导师签名:彳写! 囟茎日期:玉! z ;。z 基于d f 丁和d 耵结台的音频数字水印算法的设计与系统实现第一章绪论 第一章绪论 1 1 课题研究背景及意义 ? 数字多媒体技术以及互联网技术的迅猛发展使得图像、视频和音频等多种形式的 多媒体数字作品的创作、存储和传输都变得极其便利。数字多媒体的易于复制、传播 的特性,是其能够被快速传播的重要原因之一,但这一特性也会被侵权者非法利用, 因而严重损害了艺术作品的作者和发行者的知识产权( i n t e l l e c t u a lp r o p e r t yr i g h t s ) 。 目前,盗版已成为对数字化产业最大的威胁,这在相当程度上阻碍了其自身的发展。 对数字版权的所有者来说,反盗维权的要求迫在眉睫。传统的版权保护方式是在通信 网中限制某些站点的存取和对多媒体数据进行加密且严格管理密码,这种称之为“信 任系统”通过阻止未授权用户访问多媒体数据来实现版权保护。然而,一旦授权用户 非法拷贝、非法传播给其他未授权用户,这种系统对版权保护无济于事,【2 】。传统的 信息加密方法可咀加密文本信息,保证其传输的安全,效果较好,但如果要对图像、 视频和音频等多媒体信息进行加密,则基于密码学的传统加密方法就显得力不从心 可。在这种背景下,能够有效地实行版权保护的数字水印( d i e 划w a t e r m a r k i n g ) 技 术就应运而生口卜忉。 数字水印嘲是一种有效的数字产品版权保护和数据安全维护技术,是信息隐减技 术研究领域的一个重要分支。它将具有特定意义的标记( 水印) ,利用数字嵌入的方 法隐藏在数字图像、声音、文档、图书、视频等数字产品中,用以证明创作者对其作 品的所有权,并作为鉴定、起诉非法侵权的证据,同时通过对水印的检测和分析来保 证数字信息完整可靠性,从而成为知识产权保护和数字多媒体防伪的有效手段f ”。 1 2 数字水印的定义及特点 1 2 1 数字水印的定义 数字水印【”】是向保护的数字对象( 如静止图像、视频、音频等) 嵌入某些能证明 版权归属或跟踪侵权行为的信息,可以是作者的序列号、公司标志、有意义的文本等 等。与水印相近或关系密切的概念有很多从目前出现的文献中看,己经有诸如信息 隐藏、信息伪装、数字水印和数字指纹( f i n g e r p r i n t i n g ) 等概念。在某种意义上,它 们是互相重叠而且常常被不加区别地使用。这些概念的正确的定义和细微的区别可见 文献 1 3 1 。 第一章绪论 基于d 阿和d j 盯结合的音频数字水印算法的设计与系统实现 1 2 2 数字水印的主要特点 一般说来,数字水印所应具有的特征随具体应用要求的不同而有所区别,在某一 类应用中必须具备的特征可能是另一类应用中所必须避免的。本节主要讨论用于版权 保护机制的数字水印,一般认为具有版权保护功能的数字水印必须具有如下特点: 1 不可感知性 不可感知性1 0 l 包含两方面的意思,一方面指视觉上的不可见性或听觉上的不可听 性,即因嵌入水印导致图像的变化或音频的变化对观察者的视觉系统或听觉系统来讲 应该是不可察觉的,最理想的情况是水印图像与原始图像在视觉上一模一样,这是绝 大多数水印算法所应达到的要求;另一方面水印用统计方法也是不能恢复的,如对大 量的用同样方法和水印处理过的信息产品即使用统计方法也无法提取水印或确定水 印的存在。 2 鲁棒性【1 4 1 数字水印必须能够抵抗传输过程中可能受到的处理或变形,使得版权信息最终仍 能被提取出来,以证明作品的所有权。 数字水印的根本目标是通过一种不引起被保护作品感知上退化,又难以被未授权 用户删除的方法向一个数字作品中嵌入一个标记。关于这方面的鲁棒性的第一次定义 可以由留声机工业国际联盟( i f p i ) 征求音频标记技术的提案中找到。这一提案的目 的是寻求一种能够生成反盗版行为的证据,跟踪广播者和其他人对音频媒体的使用, 以及控制音频记录复制的标记方案。i f p i 的鲁棒性要求主要有以下几条: ( 1 ) 标记信息可以在宽频带滤波和处理操作之后被恢复,包括两次相继的模数 和数模转换、稳态压缩或扩张、压缩技术如m p e g 和多频带非线性振幅压缩、引入加 法或乘法噪声、使用同一系统加入一秒钟的被嵌入信号、低音、中音和高音应用中频 率能够响应1 5 分贝的失真,组延迟失真和陷波滤波组器; ( 2 ) 在不引起音频质量大幅度退化情况下,不应该存在其他方法来删除或改变 嵌入信息使其无效; ( 3 ) 如果信噪比为2 0 分贝或更高,被嵌入数据信道应具有每秒2 0 l ,, 特的带宽, 而与信号电平和信号类型,如古典音乐、流行音乐或语音等无关。 上述类似的鲁棒性要求也可以作为静态图像、视频和一般的多媒体对象的鲁棒性 要求。理论上,对于任何水印,攻击者在获得足够的信息后都可以将其擦除。但实际 上由于攻击者所得到的信息或者攻击者的计算能力的限制,擦除水印后可能难以避免 2 基于d f t 和d w t 结合的音频数字水印算法的设计与系统实现第一章绪论 对原数据的严重破坏。 一般说来,数字水印的鲁棒性主要体现在以下几个方面:首先,数字水印应该具 有抵抗一般信号处理看到稳健性。即使原始数据经过了如模数、数模转换,重新采 样,重新量化,或某种信号的增强,如图像的亮度、对比度、声音的低音和颤音等处 理,仍然要求保证水印的存在性:第二,数字水印应具有几何变换下的鲁棒性。即数 字作品中嵌入的水印应该在旋转、缩放、和剪切等几何变换下仍然能保留它所携带的 信息:第三,数字水印应该具有抵抗恶意攻击的鲁棒性。对数字水印的恶意攻击主要 包括合谋攻击和伪造,删除等操作。具体地说,对恶意攻击的鲁棒性就是指即使攻击 者获得了大量携带的数据,也不能据此在不破坏原图的情况下伪造出一个新的带水印 作品或擦除水印作品中的标记。 需要指出的是,鲁棒性也只是用于版权保护的水印所必须具有的特性,而对于以 保护数据完整性为目的的数字水印来说,脆弱性则是其重要的特征。 3 可证明性 1 0 1 水印应能为受到版权保护的信息产品的归属提供完全和可靠的证据。水印算法识 别被嵌入到保护对象中的所有者的有关信息( 如注册的用户号码、产品标志或有意义 的文字等) 并能在需要的时候将其提取出来。水印可以用来判别对象是否受到保护, 并能够监视被保护数据的传播、真伪鉴别以及非法拷贝控制1 1 5 】【1 6 1 等。这实际上是发 展水印技术的基本动力,虽然从目前的文献来看,对其研究相对少一些。就目前已经 出现的很多算法而言,攻击者完全可以破坏掉图像中的水印,或复制出一个理论上存 在的“原始图像”,这导致文件所有者不能令人信服地提供版权归属的有效证据1 7 】1 1 8 】。 因此一个好的水印算法应该能够提供完全没有争议的版权证明,在这方面还需要做很 多工作。 1 3 数字水印的分类 数字水印的分类方法【9 】多种多样,分类的出发点不同导致了分类的不同。最常见 的分类方法有以下几种。 1 3 1 按水印特性划分 按水印特性可分为可见水印和不可见水印。 可见水印( v i s i b l ew a t e r m a r k ) :是可以看见的水印,就像插入或覆盖在图像上的标 识,它与可视的纸张中的水印相似。可见水印主要用于图像,比如用来可视地标识那 第一章绪论 基于d f t 和d i e t 结合的音频数字水印算法的设计与系统宴现 些可在图像数据库中得到的或在i n t e m e t 上得到的图像的预览来防止这些图像被用于 商业用途。当然也可用于视频或者音频中,音频中就是可听水印,比如电台播放广告, 广告商为了维护自己的权益,在录音带中录入某一特殊的声音,从而根据播放的广告 中这一声音出现的次数来判断电台是否执行了合同。视频中最常见的就是有线电视的 半透明表示( 1 0 9 0 ) ,明确标识版权,防止非法使用。 不可见水印( i n v i s i b l ew a t e r m a r k ) :是一种应用更加广泛的水印,与前面的可视 水印相反,它加在图像、视频或音频中,表面上是不可察觉的,但是当发生版权纠纷 时,所有者可以从中提取出标记,从而证明该物品的所有权归属。 不可见水印又可以分为以下两种: 脆弱性水印或易碎水印( f r a g i l ew a t e r m a r k ) :当嵌入水印的载体数据被修改时, 可以通过检测手段来判定载体是否被修改或进行了何种修改。 鲁棒性水印( r o b u s tw a t e r m a r k ) :是指嵌入的水印不仅能抵抗非恶意的攻击, 而且能抵抗一定失真范围内的恶意攻击,并且一般的数据处理不影响水印的检测。 1 3 2 按水印所附载的载体数据划分 按水印所附载的载体数据,我们可以将水印划分为图像水印、音频水印、视频水 印、文本水印以及用于三维网格模型的网格水印。随着数字技术的不断发展,会有更 多的数字媒体出现,同时也会产生相应载体的水印技术。 1 3 3 按水印检测过程划分 按水印检测过程可以将水印划分为非盲水印( n o n b l i n dw a t e r m a r k ) 、半盲水印 ( s e m i n o n b l i dw a t e r m a r k ) 和盲水印( b l i n dw a t e r m a r k ) 。 非盲水印在检测过程中需要原始数据和水印的参与;半盲水印不需要原始数据, 但需要原始水印:盲水印则只需要密钥,既不需要原始数据,也不需要原始水印的参 与。 1 3 4 按水印隐藏的位置划分 按水印隐藏的位置,我们可以将其划分为时( 空) 域水印和变换域数字水印。 时( 空) 域数字水印是直接在信号空间上叠加水印,而变换域水印则包括在d c t 域、d f t 域和小波域变换上隐藏水印。 4 基于d v r 和d 盯结合的音频数字水印算法的设计与系统实现第一章绪论 1 4 音频水印算法研究现状 互联网的飞速发展和音频压缩技术的成熟使得对数字音频水印技术的需求越来 越迫切( 1 川。应该说这种技术尚处于比较初级的阶段,还有许多技术层和协议层的问题 需要进一步解决。时域水印技术相对容易实现且计算量较小,但抵抗攻击的能力较差。 频域水印技术通常利用音频掩蔽效应和扩频技术的思想,具有较强抵抗攻击的能力, 但实现较复杂。压缩域水印技术直接对压缩格式的数字音频进行操作,但简单的修改 音频压缩编码器或解码器对解压一再压缩的抵抗能力较弱,还需要提出新的思想。 基于内容的水印技术更加强调将水印信息嵌入到音频信号的重要特征上,其与h a s 相结合代表了今后水印技术的发展方向。对一维的音频信号来说,同步攻击引起的后 果是极其严重的,需要给予特别的注意。总而言之,到目前为止,还没有一种音频水 印算法是完美和真正实用的。虽然数字水印技术已取得诸多进展,但仍有许多挑战性 的研究难题等待解决,例如水印嵌入和检测的数学模型、可靠的水印恢复、水印容量 估计、最佳水印检测、信道编码在数字水印中的应用、错误概率的界限、攻击模型及 反攻击、大规模实验测试和比较、新的统计和感知模型、数字水印的新型应用、水印 系统安全性、时间空间域的同步问题等等。水印技术必须与密码学、多媒体技术、 通信理论、编码理论、心理声学、信号处理、模式识别等多个学科有效结合,才能产 生新的思路并实现可实际应用的水印系统。 1 5 本文研究主要内容 本文以现有的水印算法为理论基础,通过对音频数字水印特征和研究现状的分 析,对现有的水印算法进行改进。本文主要研究内容如下: 】。介绍了数字水印的相关知识,并研究分析了现有的音频数字水印的算法。 2 介绍了傅立叶变换以及基于快速傅立叶变换的音频数字水印算法的研究。通 过对原始信号进行分段快速傅立叶变换量化幅度来嵌入水印,然后再通过量 化后的幅度所属的区间来判断加入的水印,提取水印信息。本算法还适用于 量化相位系数的方法来n a 水印信息。 3 介绍了小波理论基础知识以及基于小波变换的音频水印算法的研究。本算法 通过离散小波变换量化小波低频分量的系数来嵌入水印。小波系数的低频分 量保留了信号的主要特征,而高频部分则代表信号的细节,将高频部分去掉 信号的主要特征仍可保留。因此,选择在低频部分嵌入水印算法有较好的鲁 第一章绪论基于u f t 和u 霄t 结合的音频数字水印算法的设计与系统实现 棒性。 4 在两种算法基础上提出一种基于混合域的音频水印算法。并通过仿真实验证 明了该算法比单独使用基于傅立叶变换的水印算法和单独使用基于小波变换 的水印算法的鲁棒性都要好。 5 通过对三种算法的讨论,使用m a t l a b 工具实现了一个音频水印应用系统。 6 基于d v r 和d w i 结合的音频数字水印算法的设计与系统实现 第二章数字音频水印技术 第二章数字音频水印技术 2 1 音频信号的数字化 音频信号的数字化【2 0 】【2 1 1 是指对模拟的声音信号进行a d 转换,使其转换为数字 信号。这种数字化产品可以被方便的复制、修改、存储和传播,因此,数字化音频的 版权保护也显得越来越重要。 数字音频有两个重要的参数:量化精度和采样频率。 采样频率是指每秒钟抽取声波幅度样本的次数,其单位为h z ( 赫兹) 。例如,c d 音频通常采用4 4 1 k h z 的采样频率,也就是每秒钟在声波曲线上采集4 4 1 0 0 个样本。 傅立叶定理表明,在单位时间内的采样点越多,录制的声音就越接近原声。我们可以 从时间概念上来理解采样频率,采样频率越高,数字音频则越接近原声波曲线,失真 也就越小。当然,高采样频率意味着其存储音频的数据量越大。采样频率的高低是根 据奈奎斯特采样定理和声音信号本身的最高频率决定的。该定理指出:采样频率不应 低于原始声音的最高频率的2 倍,这样才能把以数字表达的声音还原成原来的声音。 众所周知,人耳的响应频率范围在2 0 h z 2 0 k h z ,根据奈奎斯特采样定理,为保证声 音不失真,采样频率至少应保证不低于4 0 k h z 。此外,由于每个人的听力范围是不同 的,2 0 h z 2 0 k h z 只是一个参考范围,因而通常还要留有一定余地,所以c d 音频通常 采用4 4 1 k l - i z 的采样频率。 数字音频量化精度有8 b i tp 律量化、1 6 b i t 线性量化、2 4 b i t 线性量化、3 2 b i t 线性量 化等格式。高质量音频的量化精度通常采用1 6 b i t 以上线性量化,女1 1 w i n d o w s 可视音频 格式( w a v ) 和音频交换文件格式( a i f f ) 通常采用1 6 b i t 线性量化;较低质量音频 通常采用8 b i tu 律量化格式,这种量化方式会使信号产生一些畸变。 一般音频常用采样率有8 k h z 、9 6 瞄 z 、1 0 k h z 、1 2k h z 、1 6k h z 、2 2 5 k h z 以 及4 4 1 k h z 等形式。 2 2 人类听觉系统( h a s ) 特性 在音频信号中嵌入水印一般要利用到人类听觉系统【2 i 】( h a s ) 的某些特性,即人 的听觉生理一0 理特性,来满足嵌入水印的不可感知性( 听觉相似性) 的要求。 首先,人的听觉具有掩蔽效应。一个较弱的声音( 被掩蔽音) 的听觉感受被另一个 第二章数字音频水印技术 基于d f t 和d 1 叮结合的音频数字水印算法的设计与系统实现 较强的声音( 掩蔽音) 影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听 阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表 明,3 k h z 5 k h z 绝对闻阂值最小,即人耳对它的微弱声音最敏感;而在低频和高频 区绝对闻阈值要大得多。在8 0 0 h z 1 5 0 0 h z 范围内闻阈随频率变化最不显著,即在 这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度,使人耳能够听 见时的闻阈称为掩蔽闻闽( 或称掩蔽门限) ,被掩蔽弱音必须提高的分贝值称为掩蔽量 f 或称阈移) 。 所谓频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应,又称同时掩蔽。 这时,掩蔽声在掩蔽效应发生期间一直起作用,是一种较强的掩蔽效应。通常,频域 中的一个强音会掩蔽与之同时发声的附近的弱音,弱音离强音越近,一般越容易被掩 蔽;反之,离强音较远的弱音不容易被掩蔽。例如,一个1 0 0 0 h z 的音比另一个9 0 0 h z 的音高1 8 d b ,贝u 9 0 0 h z 的音将被1 0 0 0 h z 的音掩蔽。而若1 0 0 0 h z 的音比离它较远的另 一个1 8 0 0 h z 的音高1 8 d b ,则这两个音将同时被人耳听到。若要让1 8 0 0 h z 的音听不到, l j l 0 0 0 h z 的音要l :t 1 8 0 0 h z 的音高4 5 d b 。一般来说,低频的音容易掩蔽高频的音;在 距离强音较远处,绝对闻阈比该强音所引起的掩蔽闽值高,这时,噪声的掩蔽阈值应 取绝对闻阈。 所谓时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时,又称异时掩 蔽。异时掩蔽又分为导前掩蔽和滞后掩蔽。若掩蔽声音出现之前的一段时间内发生掩 蔽效应,则称为导前掩蔽;否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑 处理信息需要花费一定的时间,异时掩蔽也随着时问的推移很快会衰减,是一种弱掩 蔽效应。一般情况下,导前掩蔽只有5 m s 2 0 m s ,而滞后掩蔽却可以持续5 0 m s 2 0 0 m s 。 其次,人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。 第三,人耳对不同频率段声音的敏感程度不同,通常人耳可以听见2 0 h z 1 8 k h z 的信号,但对2 k h z 4 k h z 范围内的信号最为敏感,幅度很低的信号也能被听见。而 在低频区和高频区,能被人耳听见的信号幅度要高的多。即使对同样声压级的声音, 人耳实际感到的音量也是随频率而变化的。 基于o f t 和i ) p t 结合的音频数字水印算法的设计与系统实现 第二章数字音频水印技术 2 3 常见的音频水印算法 2 3 1 时域音频水印算法 时域数字音频水印算法是在时域修改信号样本达到嵌入水印的目的。比较经典的 时间域算法主要是b a s s i a ,p i t a s l 2 2 1 提出的最不重要位( l s b ) 方法和wb e n d e r t 2 ”提出 的回声隐藏( e c h oh i d i n g ) 算法。下面详细介绍一下这两种算法。 1 最不重要位( l s b ,l e a s ts i g n i f i c a n tb i t ) 方法 最不重要位方法【9 】是一种最简单的水印嵌入方法。任何形式的水印都可以转换成 一串二进制码流,而音频文件的每一个采样数据也是用二进制数来表示。这样,可以 将每一个采样值的最不重要位( 多数情况下为最低位) 用代表水印的二进制位来替换, 以达到在音频中嵌入水印的目的。如果将音频信号看作水印传输的信道,而水印看作 在信道中传输的信号,理想情况下,这种信道的容量为rb s ,则此r 为音频信号的采 样率,即在无噪声信道中,对8 k h z 采样率的信号,比特率是8 k b s ;对4 4 1 k h z 采样 率的信号,比特率是4 4 1 k b s 。 为了加大对水印攻击的难度,可以使用一段伪随机序列来控制水印嵌入的位置。 伪随机信号可以由伪随机序列发生器来产生。当伪随机序列发生器的结构固定时,不 同的初始值会产生不同的伪随机序列。这样,收发双发只要秘密共享一个初始值即密 钥而不需传送整个伪随机序列值。只要保证合法用户才能得到该密钥,则根据k e r c h o f f 法则可知水印系统是安全的。任何企图提取出秘密数据的第三方在不知道密钥的情况 下,是很难达到目的的。 最不重要位方法本身简单易实现,是最简单的水印嵌入方法;音频信号里可编码 的数据量大;采用不同加密方式分别对数据本身和嵌入过程进行加密,其安全性完全 依赖于密钥;水印嵌入和提取算法简单,速度快。但是,这种方法的最大缺点是对某 些信号处理技术比较敏感,抗干扰能力差,信道干扰、数据压缩、滤波、重采样都会 破坏水印数据,因此实用价值较小。为此,需要采用一些冗余技术对它编码,从而需 要额外的比特开销,如有的时域方法在原始数据上加入带有扩频性质的伪随机序列, 可以提高水印性能。 2 基于回声隐藏的水印算法 2 3 1 。【2 5 】 利用回声嵌入水印的算法是一种经典的音频水印算法。它利用了人类听觉系统的 特性:音频信号的时域向后掩蔽特性,即较弱的信号在强信号消失之后变得无法听见。 弱信号可以在强信号消失后的5 0 2 0 0 m s 的时间内而不被人耳察觉。声音信号引入了回 第二章数字音频水印技术 基于d f 丁和d 耵结台的音频数字水印算法的设计与系统实现 声相当于声音在真实空间中受到墙壁、家具等物体的影响而产生多径传输的效果, 足够小的多径是人耳察觉不到的。因此,回声隐藏不是将水印数据作为随机噪声嵌入 到载体数据中,而是作为载体数据的环境条件,所以对一些有损压缩具有一定的稳健 性。 嵌入算法将载体数据按一定的衰减程度,延迟一定的时间迭加到原始载体数据上 以产生回声,可以用不同的延迟时间标志水印数据的“0 ”和“1 ”。要想使水印数据 不被感知,并能以较高正确率提取处来,关键在于选取回声内核的参数。每个回声 内核有四个可以调整的参数:原始幅值、衰减率、i 偏移量及0 偏移量。偏移 量对数据隐藏的效果至关重要,需选在人耳可分辨的闽值之内。一般情况下,延迟范 围应取5 0 m s 2 0 0 m s ,大于2 0 0 m s 会影响水印的隐蔽性,小于5 0 m s 会增加水印提取的 难度。如不考虑传输过程中信号的衰减及干扰,衰减率选为0 7 。若考虑传输过程中 信号的衰减及干扰,则衰减率一般要选在0 ,8 以上。多比特信息的嵌入可以通过多次 引入回声来实现,先将载体数据分段,然后按如上所述的方法分别往各段嵌入数掘, 最后将嵌入数据后的各段信号组合起来如图2 1 所示 图21 同声编码永印嵌入流程图 水印数据的提取关键在于回声间的检测。可以应用复倒谱分析的方法:将多项柔 积运算转换为和运算,频域的乘积等同于时域的卷积。先计算回声信号的倒谱,再用 倒谱将回声从原始信号中分离出来。由于倒谱每d 秒重复一次,且代表回声的脉冲幅 值与载体信号相关度很小,所以它们很难被检测。解决这个问题的方法是利用倒谱相 关的自相关。自相关给出了信号在每一延迟信号的能量,在磊或点处会各出现一个能 量尖峰。因此确定法则就是检测在两处的能量并选择在能量更高的一个,如图22 所 示, 基于d f t 和d w t 结合的音频数字水印算法的设计与系统实现第二章数字音频水印技术 图2 2 回声编码水印提取流程图 回声算法对一些有损算法具有一定的鲁棒性。它虽然得到了较好的透明性,但没 有达到令人满意的误码率,而且信道噪声、人为篡改都会提高误码率。为此,可以使 用一些辅助技术。例如使回声内核的参数衰减率随音频信号的噪声级别变化而变 化,当音频信号较安静时,降低衰减率,反之,则增大衰减率。 3 基于扩频技术的音频水印方法【2 6 ( 2 9 1 借鉴扩频通信的思想,可以在编码音频数据流时把秘密数据分散在尽可能多的频 率谱中以达到隐藏数据的目的。 扩频通信方式有很多,常用的有直接序列扩频编码方法( d s s s ,d i r e c ts e q u e n c e s p r e a ds p e c t r u me n c o d i n g ) 。d s s s 算法中需要用一个密钥来编码和用相同的密钥来 解码。该密钥是随机噪声,理想伪随机噪声是白噪声,它在频率范围里有良好的频率 响应。密钥用来编制信息,把序列调整成扩频序列。秘密数据被载波和伪随机序列所 放大,后者有很宽的频谱,结果,数据的谱被扩散到可能的波段之中。然后,扩展后 的数据序列被弱化,并作为加性随机噪声叠加到音频源文件中。 b o n e y l 2 6 】等人提出了一种适用于音频水印的扩频方法。他们选用的是一个伪随机 序列,且为了利用h a s 的长期或短期掩蔽效应,对该序列进行若干级的滤波。为利用 h a s 的长期掩蔽效应,对每个5 1 2 点采样的重叠块,计算出它的掩蔽阈值,并近似地 采用一个l o 阶的全极点滤波器,对p n 序列进行滤波。利用短期掩蔽效应,即根据信 号相应的时变能量,对滤波后的p n 序列做加权处理。这样在音频信号能量低的地方 可削弱水印。另外,水印还要经过低通滤波,即用完全音频压缩和解压实现低通滤波, 以保证水印可抵御音频压缩。嵌入水印的高频部分,可使水印更好地从未经压缩的音 频片段中检测出来。 但压缩过程会将它去除掉。作者用“低频水印”和“误码水印”来表示水印的两 个空间成分。利用原始信息和p n 序列,采用相关性方法,则可通过假设检验将水印 提取出来。实验结果显示了该方法对m p 3 音频编码、粗糙的p c m 量化和附加噪声的鲁 棒性。 第二章数字音频水印技术基于o f t 和d w r 结合的音颗数字水印算法的设计与系统实现 2 3 2 变换域音频水印算法 音频水印技术中常使用的变换域算法包括相位编码、傅立叶变换域、离散余弦变 换域、小波域和倒谱域等。 1 相位编码 相位编码【3 0 】( p h a s ec o d i n g ) 是最为有效的编码方法之一。它充分利用了人类听 觉系统的一种特性:即人耳对绝对相位的不敏感性及对相对相位的敏感性。基于这个 特点,将代表秘密数据位的参考相位替换原音频段的绝对相位,并对其它的音频段进 行调整,以保持各段之间的相对相位不变, 当代表秘密数据的参考相位急剧变化时,会出现明显的相位离差。它不仅会影响 到秘密信息的隐蔽性,还会增加接收方译码的难度。造成相位离差的一个原因是对原 始音频信号的相位改动频率太快,因此必须使转换平缓以减小相位离差带来的音频变 形。为了使得变换平缓,数据点之间就必须留下一定间距,而这种做法导致的影响是 降低了音频嵌入的位率。另一方面,为了增强编码的抗干扰能力,应将参考相位之间 的差异最大化,因此我们选用“一z r 2 ”代替“0 ”,用“,r 2 ”代替“1 ”。 为了使相位离差的影响得以改善,需要在数据转换点之间留有一定的间隔以使转 换变得平缓,但它的缺点是减小了带宽。因此必须在数据嵌入量和嵌入效用之间取折 衷。一般说来,相位编码的信道容量为8 b p s 至u 3 2 b p s 。当载体信号是较为安静的环境, 则嵌入量更小,一般只可得至o s b p s 的信道能力。当载体信号是较为嘈杂的环境,可增 大嵌入量,得到3 2 b p s 的信道能力。 2 傅立叶变换域算法 t i l k i 和b e e x 【3 1 】提出t - - 种d f t 变换域音频水印嵌入算法,这种变换的频谱范围是 0 - - - 8 k h z 。首先对音频信号进行d f t ,然后选择其中频率范围为2 4 , - - 6 。4 k h z 的d f t 系 数进行水印嵌入,并用表示水印序列的频谱分量来替换相应的d f t 系数。文献指出选 择该频段使得水印被保存在音频信号中具有较强能量的部分。如果嵌入水印量不是很 大并且其幅度相对于当前的音频信号更小,则该技术对噪声、录音失真及磁带的颤动 都具有一定鲁棒性。 3 离散余
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 派遣人员服务协议书
- 植树挖坑承包协议书
- 果林修剪承包协议书
- 支部结对共建协议书
- 机构办学授权协议书
- 油品利润分红协议书
- 楼栋提前交付协议书
- 朋友入股公司协议书
- 楼房改造加固协议书
- 排水设施养护协议书
- 装饰、装修施工方案
- 矿井瓦斯抽采
- 施工现场安全检查记录表(周)以及详细记录
- 立法学完整版教学课件全套ppt教程
- 五年级下册科学说课课件 -1.2 沉浮与什么因素有关 |教科版 (共28张PPT)
- 流动注射分析仪常见问题解决方案.
- 《出口报关单模板》word版
- 边坡护坡检验批表格模板
- 工会会计制度——会计科目和会计报表(全)
- 马清河灌区灌溉系统的规划设计课程设计
- 《Monsters 怪兽》中英对照歌词
评论
0/150
提交评论