已阅读5页,还剩50页未读, 继续免费阅读
(电路与系统专业论文)基于盲源分离的数字音频水印技术研究[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 随着计算机和i n t e m e t 技术的迅速发展及广泛应用,多媒体数据逐渐成为人们获取 信息的重要来源。如何实施网络环境下的版权保护和信息安全,已经成为数字通信中亟 待解决的问题之一。数字水印技术作为解决这一问题的有效途径开始引起人们的普遍关 注,它通过在原始数据中嵌入能够标识作者身份的信息来证实数据的所有权或完整性。 本论文针对数字音频产品的版权保护、内容完整性认证以及篡改区域定位等问题展 开研究,给出了三种基于盲源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) n 论的数字音频水印方 法。首先,阐述了课题提出的意义和研究背景,分析了相关概念及特性,回顾了几种典 型的方法。其次,介绍了本论文中用到的基本理论知识。最后,针对不同目的,给出了 三种基于盲源分离理论的数字音频水印方法。首先,以码本映射思想和盲源分离中的独 立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 算法为基础,给出了一种时域多比特 鲁棒水印方法。其次,针对目前许多领域中需要同时对数字媒体进行版权保护和内容完 整性认证的需要,给出了一种基于盲源分离的小波域多目的数字音频水印方法。该方法 解决了多数多目的水印算法中需要考虑水印嵌入和提取顺序的问题,并且鲁棒水印信息 为多比特信息;脆弱水印可以实现内容完整性认证和音频篡改区域的定位。最后,针对 目前多数音频水印算法对时间轴缩放等同步攻击比较敏感这一问题,给出了一种基于盲 源分离的双变换域鲁棒数字音频水印方法,该方法除了对常规信号处理攻击具有较好的 鲁棒性之外,对时间轴缩放等同步攻击也具有较好的鲁棒性。 实验结果表明,三种方法均满足音频水印技术对透明性、鲁棒性和安全性的要求: 从隐秘信号中分离水印信号时不需要宿主信号的参与;鲁棒水印都属于多比特水印,结 果直观可信;另外,第二种方法中的脆弱水印还可以较为精确地定位出音频的篡改区域。 关键词:音频水印;盲源分离;版权保护;篡改定位 大连理工大学硕士学位论文 s t u d yo nt h ed i g i t a la u d i ow a t e r m a r k i n gs c h e m eb a s e do nb l i n d s o u r c es e p a r a t i o n a b s t r a c t a st h ed e v e l o p m e n ta n da p p l i c a t i o no fc o m p u t e r sa n di n t e r a c t ,m u l t i m e d i ad a t ah a s b e c o m ea ni m p o r t a n tw a yf o ri n f o r m a t i o na e q u l r e m e m h o wt oc a r r yo u tc o p y r i g h tp r o t e c t i o n a n de n s u e 也es e c u r i t yo f t h ei n f o r r n a t i o nh a sb c c o m eo n eo f t h eu r g e n tp r o b l e m st ob es o l v e d i nd i g i t a lc o m m u n i c a t i o n a sa l le f f e c t i v ew a yt os o l v et h i sp r o b l e m ,d i 【g i t a lw a t e r m a r k t e c h n i q u eh a sa t t r a c t e dm a n ya t t e n t i o n s a taw o r d , d i g i t a lw a t e r m a r k i n gi sas c h e m et oi n s e r t s o m ei n f o r m a t i o nt h a tc a nr e p r e s e n tt h ea u t h o r si d e n t i t yi n t ot h eo r i g i n a ld a t a , t ov e r i f yt h e p r o p e r t yo rt h ei n t e g r i t yo f t h e m i nt h i sp a p e r , t h r e ek i n d so fa u d i ow a t e r m a r kt e c h n i q u e sb a s e do nb l i n ds o u r c e s e p a r a t i o n ( b s s ) a r ed i s c u s s e d ,f i r s t l y ,t h em e a n i n go ft h et a s k , t h er e s e a r c hb a c k g r o u n d ,a n d t h er e l a t e dc o n c e p t sa n dc h a r a c t e r i s t i e sa r ei n t r o d u c e d s o m et y p i c a lm e t h o d sa r er e v i e w e da s w e l l s e c o n d l y ,b a s i cb a c k g r o u n dk n o w l e d g er e l a t e di si n t r o d u c e d a f t e rt h a t ,t h r e ek i n d so f b s sb a s e dd i g i t a la u d i ow a t e r m a r k i n gm e t h o d sa r ep r o p o s e d t h ei d e ao fc o d em a p p i n ga n d i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) a r eu t i l i z e dt or e a l i z eat i m ed o m a i nm u l t i - b i tr o b u s t w a t e r m a r k i n gs c h e m ei nt h ef i r s tm e t h o d a i m a tt h er e q u i r e m e n tf o rt h ea p p l i c a t i o nt h a tn e e d t op r o t e c tt h ec o p y r i g h to ft h em u l t i m e d i aa n da u t h e n t i c a t ei t ss a f e t ys i m u l t a n e o u s l y ,a w a v e l e td o m a i nm u l t i p u r p o s ew a t e r m a r k i n gs c h e m eb a s e do nb s si sg i v e ni nt h es e c o n d m e t h o d t h ee m b e d d i n go r d e ro fd i f f e r e n tw a t e r m a r k si sn ol o n g e ra l li s s u et ob ec o n s i d e r e d t h er o b u s tw a t e r m a r ki sm u l t i - b i ta n dt h ef r a g i l ew a t e r m a r kc a ng i v et h ea u t h e n t i c a t i o nr e s u l t a sw e l la st h et a m p e r e da r e a s t h et l i r dm e t h o d ad u a l d o m m nw a t e r m a r k i n gs c h e m eb a s e d o nb s s ,g i v e sas o l u t i o nt oo v e r c o m et h es e n s i t i v i t yp r o b l e mo ft i m e s c a l ea t t a c kf o rm o s t e x i s t e da u d i ow a t e r m a r k i n gs c h e m e s i ti sr o b u s ta g a i n s tb o t l lc o m m o ns i g n a lp r o c e s s i n g o p e r a t i o n sa n dt i m e s c a l ea t t a c k e x p e r i m e n t a lr e s u l t ss h o wt h a t a l lo ft h et h r e em e t h o d sc a ns a t i s f yt h er e q u i r e m e n t so f t r a n s p a r e n c y ,r o b u s t n e s sa n ds e c u r i t y ;t h ew a t e r m a r ks i g n a lc a nb ee x t r a c t e db l i n d l y ;t h e r o b u s tw a t e n n a r k sa r ea l lm u l t i b i tw a t e r m a r k s t h er e s u l ti si n t u i t i o n i s t i c ;w h a t sm o r e , t h e f r a g i l ew a t e r m a r ki nt h es e c o n dm e t h o dc a r ll o c a l i z et h et a m p e r e da r e a sp r e c i s e l y k e yw o r d s :d i g i t a lw a t e r m a r k ;b l i n ds o u r c es e p a r a t i o n = c o p y r i g h tp r o t e c t i o n : t a m p e r e da r e al o c a l i z i n g - i i i - 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:可列煮、作者签名:j 列j 、 导师签名:弓咀l z 导师签名:之! 塾1 至 j 趔上年l 月上l 臼 大连理工大学硕士学位论文 1 绪论 1 1 选题的意义和研究背景 数字化和信息化时代的到来给人们的生活带来了很大变化,提供了更多的便利。尤 其是随着计算机、通信以及网络技术的发展和普及,人们获取信息的方式和渠道也发生 了深刻变化。网络中传输的各种数字产品中都蕴含了大量价值不菲的信息,与作者创作 这些多媒体数据所花费的艰辛相比,篡改、伪造、复制和非法发布原创作品变成了一件 轻而易举的事情。任何人都可以轻而易举地创建多媒体数据的拷贝。与原始数据比较, 复制出的多媒体数据不会有任何质量上的损失,即可以完整地“克隆”多媒体数据。现 行的版权保护主要是基于传统的密码学,将文件加密成密文,使其在传输过程中不会被 非法拦截或复制,以此达到版权保护的目的。然而数字产品大量分发、易于复制的事实, 使得传统的数据加密手段愈来愈无能为力。因此,如何对这些与人们生活息息相关的数 字产品进行保护,如版权保护、信息安全、数据认证以及访问控制等,已经成为数字通 信中亟待解决的问题。 数字水印技术就是在这种情况下应运而生,并且在多媒体数据安全保护中发挥着越 来越大的作用。目前数字水印技术所涉及的类型主要有静态图像水印、视频水印和音频 水印。目前人们对前两类数字水印技术的研究相对较多,技术也相对成熟。随着数字音 频压缩技术的成熟,以r a p 3 为代表的音乐制品在网络上广泛传播,数字音频水印技术也 随之发展起来,并越来越受到人们的重视。 1 2 数字音频水印技术概述 1 2 1 数字音频水印技术的概念 数字音频水印技术就是在不影响原始音频质量的条件下,通过一定的算法向数字音 频产品中嵌入用于版权保护或内容完整性检验的一些标志性信息。这些信息可以是具有 特定意义的信息,如:作者的序列号、公司标志或有特殊意义的文本等,可以用来识别 音乐制品的来源、版本、原作者、发行者、所有者以及合法使用者对数字音频产品的所 有权。也可以是不具有任何特定含义的字符串或者是随机数,用来证实待检音频产品中 水印的存在性或完整性。尽管数字音频水印技术本身并不能直接阻止拷贝行为,或者恶 意攻击者对音频数据的篡改等操作,但是却可以通过检验水印信息来验证产品信息的所 有权或其完整性和可靠性,从而起到保护知识产权以及验证产品可靠性的作用。 基于盲源分离的数字音频水印技术研究 众所周知,人类听觉系统( n m a n a u d i t o r y s y s t e m , h a s ) 是有缺陷的检测器,听觉信 号在可被人类察觉前必须有一个最小的强度和对比级,这些最小级取决于人类听觉系统 的空间、时间和频率特征。而数字音频产品是为了满足人们听觉要求的,所以在不破坏 其使用价值的前提条件下,嵌入数字音频水印而不被察觉是有可能的。任何数字信号有 其固定的误差范围,即所谓的噪声,因为它只是模拟信号的近似值。数字音频水印的制 作过程可以看作是将水印信息作为附加噪声融合在原始音频信号中,只要附加噪声的强 度远远小于人的感觉器官能够察觉到的最小强度,水印信息就无法被感知,所有数字音 频水印技术都明确地或隐含地利用了人类听觉系统的这个特征。 1 2 2 数字音频水印技术的特性 理论上,个成功的数字音频水印算法需要具备以下一些性质【1 】: ( 1 ) 水印必须嵌入到宿主音频数据中,而不能存储于文件头或单独的文件,否则可 以很轻易地被除去或改变; ( 2 ) 水印不应对原始音频的声音质量产生可听到的失真,即应具有透明性; ( 3 ) 水印必须具有一定的鲁棒性,能抵抗宿主音频信号上的压缩、滤波、重采样、 重量化、剪切、加噪声等一般信号处理: ( 4 ) 水印应易于提取,嵌入和检测的计算量要低,以方便集成到一般电子产品中; ( 5 ) 水印算法必须具备某种同步机制,以对抗时域上的同步攻击; ( 6 ) 原则上水印的检测不应需要原始音频,即实现盲检测,因为寻找原始音频通常 比较困难: ( 7 ) 水印算法应该公开,安全性最好依赖于密钥而不是算法的秘密性。 设计一个音频水印系统使以上所有目标都达到最优很困难,有些性质如鲁棒性和透 明性之间就是互相冲突的。水印系统试图平衡这些要求,尽量使每一个都得到足够的满 足,而不显著地影响其它要求。而且不同的应用场合对这几方面的特性又会有不同的要 求。例如:在版权保护中,要求水印算法具有较高的鲁棒性,可以抵御常见的信号处理 攻击;而对于实施内容完整性认证的脆弱性水印而言,则要求水印对信号处理操作比较 敏感。与数字水印在其他媒体中的应用类似,数字音频水印的应用主要有三个:版权保 护、盗版跟踪和认证f 2 1o 】,其中版权保护是最迫切和重要的。有的水印技术还可以通过 嵌入多个水印来同时用于多种用途【1 1 - 2 6 。 1 2 3 数字音频水印技术的分类 数字音频水印技术按照不同的标准可以分为很多类别,具体地说,可进行如下所述 的分类; 大连理工大学硕士学位论文 ( 1 ) 按照水印信息的载体 按照水印信息的载体来分,数字水印技术可以分为数字视频水印、数字图像水印以 及数字音频水印。目前对于前两类水印的研究比较多,而对数字音频水印技术的研究相 对来说比较少。 ( 2 ) 按照嵌入信息的容量 按照嵌入信息的容量可以分为1 比特水印和多比特水印。 1 比特水印是指嵌入的水印信息没有具体的含义,检测结果只分为“有水印”和“无 水印”两种情况,这种水印实质上只含有l 比特的信息 1 4 , 2 0 , 2 4 】。 多比特水印是指嵌入的信息具有一定的含义。如版权信息、产品的标识码、出版时 问或者购买者的一些相关信息等。相对来说,多比特水印的方案通常更具有实际的应用 价值。 ( 3 ) 按照水印抗攻击的能力 按照水印抗攻击的能力可以分为脆弱水印【2 4 0 】和鲁棒水印 2 7 。6 1 。 脆弱水印是指一类对常见的信号处理操作比较敏感的水印。对于这类水印而言,只 要嵌入水印的信号稍作修改,嵌入其中的水印就会变化或消失。脆弱水印主要用于产品 的完整性保护,通过提取出的水印的完整性来证实产品的完整性和真实性。 与脆弱水印相比较,鲁棒水印则要求对常见的信号处理攻击具有较好的鲁棒性。 有些水印系统将鲁棒水印和脆弱水印结合起来,可以对经过了恶劣信道或被恶意处 理的信息进行恢复。用鲁棒水印进行版权认证,用脆弱水印进行完整性认证,用数字指 纹进行非法复制跟踪,是数字水印技术比较完整的应用。 ( 4 ) 按照水印检测的方式 按照水印检测的方式可以分为盲水印和非盲水印。 非盲水印也称为私有水印,是指检测时需要用到原宿主的数据,水印的检测是在分 析原始音频数据和含水印的音频数据的差别的基础上进行的,因此只能由原始作品的持 有者进行检测,而且生成的水印难以被伪造。文献 2 0 ,3 6 均为非盲水印检测算法。 盲水印也称为公有水印,是指检测时不需要用到原宿主的数据,水印的检测是独立 于原始音频数据进行的,即水印的提取只由含水印的音频信息本身决定。 另外,半盲检测水印的检测过程不需要原始音频数据,但是需要与原始音频数据相 关的信息,这些信息可能是原始音频信号嵌入水印时的某些参量,也可能是表征原始音 频作品某些特征的信息1 3 3 。 基于盲源分离的数字音频水印技术研究 ( 5 ) 按照水印的嵌入过程是否可逆 按照水印的嵌入过程是否可逆可以分为对称水印和非对称水印。 对称水印是指水印的嵌入与水印检测的过程是互逆的。如果知晓检测原理就能够轻 易的删除水印,所以检测算法是不公开的。 非对称水印是指要求公开检测算法,但却无法根据检测算法去除已嵌入的水印。目 前国外有些学者在非对称水印方面作了一些有益的探索,但切实可行的非对称水印还有 待研究。 ( 6 ) 按照水印嵌入的位置 按照水印嵌入的位置分为时域水印和变换域水印。 时域水印的嵌入是通过修改原始音频数据的时域采样值强度实现的。具有计算简 单,效率较高的优点。但是由于水印要均衡于鲁棒性和透明性之间,因而可选则的属性 范围较小,鲁棒性较差。 变换域的算法是通过修改原始音频信号的变换域系数进行水印嵌入的,常见的变换 域算法除了离散傅立叶变换( d i s c r e t ef o u r i e rt r a n s f o r m ,d f d l l 卅以外,还有离散余弦变换 ( d i s c r e t ec o s i n et r a n s f o r m ,d c t ) 2 0 , 2 l3 2 、小波变换( d i s c r e t ew a v e l e tt r a n s f o r m , d w t ) 等此外,倒谱域水印算法也属于变换域水印,目前对倒谱域水印的研究相对较少。变 换域的算法需要对原始音频数据进行变换,计算量较大,但往往会获得较好的鲁棒性, 因此变换域算法是目前研究的热点。 1 2 4 数字音频水印技术的应用 作为信息隐藏技术之一,数字音频水印技术主要应用于以下几个方面 1 , 3 7 1 b 口:版权 保护、广播监控、认证或篡改检测、指纹鉴别、拷贝控制、标注以及隐秘通信。 ( 1 ) 版权保护 一个标志作品所有权的水印被嵌入到媒体数据中,成为其不可分割的一个部分。水 印只为版权所有者所知,并且能够抵抗常规的信号处理和蓄意攻击。水印检测必须具有 较小的错误率,没有二义性,并保持尽可能小的虚警率,而水印容量即嵌入的数据量不 必很大。 ( 2 ) 广播监控 广告商付费给电台或电视台来宣传自己的产品,希望电台确实将广告依时段播出。 艺术家要求电台在播放他们作品时能够付给他们应得的版税,版权所有者希望能监控是 大连理工大学硕士学位论文 否有未授权的电台播放他们的作品。技术上可以将各不同的数字水印嵌入到各个影片或 音乐片段中,从接收到的媒体中自动搜寻这个唯一的数字水印,以便确定这些媒体被播 放的时间、次数等相关信息。 ( 3 ) 认证或篡改检测 在认证应用中,没有必要对除去水印或使之无法检测的攻击保持较强的鲁棒性,因 为这不是攻击者的兴趣所在。但是,必须防止在一个已被篡改的媒体数据中伪造一个用 于认证水印的行为。在实际应用中,还希望能够定位篡改区域,并且区分保持内容操作 r 如中等强度的m p 3 压缩) 和恶意篡改。一般来说,为了满足这些需要,嵌入容量必须 要大,并且能够实现水印的盲检测或非相关检测。 ( 4 】指纹鉴别 在版权保护、认证等应用中,对所有多媒体数据的复本,都是嵌入同一组数字水印。 然而有时候需要对不同复本嵌入不同的水印,它可以让多媒体版权拥有者或多媒体传播 者辨识该多媒体数据是不是一个合法的复本,这种应用称为指纹鉴别。 ( 5 ) 拷贝及使用控制 前面所述的几种应用,虽然可以对非法使用或非法拷贝有一定的阻碍作用,但还是 无法阻止非法复制的发生。要达到拷贝控制的要求必须和播放或录制的硬件机器设备配 合使用。例如,如果机器检测到标示禁止录制或播放的数字水印时,便会取消录制或播 放的动作。当然这种应用需要所有硬件制造厂商的配合。 ( 6 ) 标注水印 标注水印一般要求嵌入比较多的信息,例如歌曲c d 的歌诃、订购信息,网站链 接等。标注水印要求采用公开水印算法。一般来说,标注水印还需要对常规的音频信号 处理,例如中等强度的有损压缩、滤波和添加噪声等具有较好的鲁棒性,并且具有抵抗 轻微的同步攻击的能力,但并不需要抵抗恶意攻击。 ( 7 ) 隐秘通信 同数据加密技术一样,音频水印技术也可以应用于信息的隐秘通信。与数据加密相 比,水印技术用于通信具有更好的隐藏性,因为它不但隐藏了通信的内容,还隐藏了通 信过程的存在性,不易引起怀疑,从而逃过恶意的拦截,提供了非密码的安全途径。 基于盲源分离的数字音频水印技术研究 1 2 5 数字音频水印技术的基本框架 通常的数字音频水印算法包含三方面的内容1 】:水印信号的生成、水印嵌入和水印 检测或提取。在实际应用中,前两步通常作为一部分,尤其是对于水印的嵌入强度或水 印的内容与宿主信号相关的情况。图1 1 给出了数字音频水印处理系统的通用模型。 附加啤芦输入,历忑丙函习望望! ! ! ! 竺些 童塑堡要| 水印l 一音频发布 1 嵌入r 1 7 ii n t c r n e t 音频堕幽 播放广_ 图1 1 数字音频水印处理系统通用模型 f i g 1 1t h eg e n e r a lm o d e lo f t h ed i g i t a la u d i ow a t e r m a r kp r o c e s s i n gs y s t e m 1 2 6 数字音频水印技术的评价标准 一般来讲,对音频水印技术的评价标准分为主观和客观评价标准两类。 ( 1 1 主观评价标准 主观评价法即主观测试法。也就是利用人耳的主观评价来判断算法的质量,对于一 个成功的音频水印技术而言,嵌入的水印不应该影响音频产品的听觉质量。最常用的主 观测试法是主观平均判分( m e a no p i n i o ns c o r e ,m o s ) 法,该方法需要招集若干实验者, 由他们对音频信号的质量进行评分,求出平均分数作为对音频信号质量的评价结果。现 在比较通用的标准是5 分制,各档次评分标准如表1 1 所示。 表1 1 音频信号质量评价标准 t a b 1 1q u a l i t ye v a l u a t i o ns t a n d a r d sf o ra u d i os i g n a l 6 - 大连理工大学硕士学位论文 但是由于主观评价会受到测试者的背景知识、观测环境等其它因素的限制和影响, 评价结果的一致性较差,而且费时费力,因此在研究和开发阶段并不实用。 ( 2 ) 客观评价标准 客观测度作为一个可以定量评价数字音频水印的标准,在性能评价中占有十分重要 的地位。通常情况下,可以对不同嵌入机制的音频水印算法采用不同的客观度量方法, 常用的客观评价方法有: 信噪比( s i g n a l - t o - n o i s er a t i o ,s n r ) 如果把嵌入的水印信号看作是加载到原始音频信号上的噪声,则可以通过计算信噪 比来衡量嵌入的水印信号对音频信号的影响程度。假设原始音频信号即宿主信号为 x ( n ) ,嵌入水印的音频信号即隐秘信号为( 拧) ,则信噪比( 单位为d b ) 表示为 s n r = 1 0 l 0 9 1 0 z 2 ( 胛) 2 一 一l k ( ) 一x ( ”) 】2 其中,r l 为音频信号的采样点数,上为音频信号的总长度,且0 ” l 。 峰值信噪l l ( p e a ks i g n a l t o - n o i s er a t i o ,p s n r ) 在宿主信号中嵌入水印信号之后,通过观察其峰值信噪比也可以定量地评价隐秘信 号的透明性。峰值信噪比的计算公式为 p s n r = 1 0 l o g o 篓墅堕! ! ! l - i k ( 珂) 一x ( 删2 n = o ( 1 2 ) 相关系数( c o r r e l a t i o nc o e f f i c i e n t ) 为了检验提取的水印信号与嵌入的水印信号之间的相似性,可以通过计算它们的归 一化相关系数来判定。假设以,2 ) 与颤竹) 分别表示嵌入的水印信号和提取的水印信号, 为水印信号的长度,归一化相关系数的计算公式为 基于盲源分离的数字音频水印技术研究 p ( w ,仞= ,一i w ( n ) f u ( n ) ( 1 3 ) 归一化汉明距离( n o r m a l i z e d h a m m i n g d i s t a n c e ,n h d ) 对于水印信号为二进制序列的情况,可以通过计算提取的水印信号与嵌入的水印信 号之间的归一化汉明距离来检测其相似性。计算公式为 一l 户b ( w ,仞= 寺以刀) o 坝功 ( 1 4 ) 1 n = 0 其中,州力表示嵌入的水印信号,颤功表示提取的水印信号,表示水印信号的 长度,“o ”表示异或操作。 1 2 7 数字音频水印技术的发展状况 数字音频水印技术是2 0 世纪9 0 年代发展起来的一门新兴技术,至今已经历了十几 年的发展,出现了多种算法。下面将从时域和变换域两个角度,分别介绍典型的时域水 印算法一回声隐藏法和频域水印算法一相位法。 ( 1 ) 回声隐藏算法 回声隐藏法是一种有效的水印嵌入方法,它通过在音频信号的时域中加入回声来嵌 入水印信息,利用回声的不同延时表示水印不同的比特信息【3 8 1 。该方法有许多显著的优 点: 第一,嵌入操作简单,容易实现,只需要将宿主信号的一部分进彳亍复制、按比例缩 减、平移并添加到宿主信号中即可,以上过程可由式( 1 5 ) 描述 y ( 帕= x ( 吣+ a x ( n d )( 1 5 ) 第二,回声隐藏方法一般不会引起明显的噪声,特别是利用心理声学模型可以确定 一个不被人感知的最大回声延时,以达到水印不可听性的要求:第三,回声隐藏方法可 以实现粗糙同步;第四,利用回声隐藏方法嵌入水印信号可以实现盲检测。 同时,该方法也存在一些缺点: 由于自然界中许多声音本身就带有回声,这会大大地增加虚警概率。另外,该方法 在检测时利用了倒谱技术,检测过程的计算量较大。最早提出的回声隐藏方法【3 明的核心 表达式为: 大连理工大学硕士学位论文 ( ) = j ( 一) + 口万( 拧一d ) ( 1 6 1 y ( 拧) = 厅( 栉) x ( 胛) f 1 7 ) 其中,x ( 甩) 代表宿主信号,) ,伽) 代表隐秘信号,代表卷积操作,d 代表回声延时 的偏移量,其大小必须经过反复实验获得,以期获得更好的透明性。双重回声隐藏方法 的核心表达式如式( 1 8 ) 所示【柏】: h ( n ) = j ( 珂) + a ( n 一嘎) 一c a ( n d :) ( 1 8 ) 此后,又给出了一种改进的回声隐藏方法f 4 l 】,其核心表达式为: h ( n ) = a ( n ) + q a ( n 一吐) + q 万( n + d j ) 一嘞8 ( n d :) 一a 2 8 ( n + d 2 ) ( 1 9 ) 通过同时引入前向回声和后向回声的方法,可以有效地提高水印的检测率,从而提 高算法的鲁棒性。三种方法的示意图如图1 2 所示。 捌自音螽括号 笏 卜蚋一 “ ( a ) 一般的回声隐藏方法 ( a ) r e g u l a rm e t h o df o re c h o - h i d i n g 原始音频信号 日,蕾号 ( b ) 双重回声隐藏方法 ( b ) d u a le c h o - h i d i n gm e t h o d ( c ) 双向双重回声隐藏方法 ( c ) b i d i r e c t i o n a ld u a le c h o - h i d i n gm e t h o d 图1 2 各种回声隐藏方法示意图 f i g 1 2s k e t c hm a p f o rv a r i o u se c h o - h i d i n gm e t h o d s 回声隐藏方法中水印提取的通用表达式如式( 1 1 0 ) 所示 基于盲源分离的数字音频水印技术研究 c , 疗】= f - 1 0 n f ( y 即】) ) = f - 1 ( k f ( 研胛】) ) + f “( 】n f ( 厅【n 】) ) = c s n + c h n 】( 1 1 0 ) ( 2 ) 相位法 相位法1 4 2 利用了人类听觉系统对声音的绝对相位不敏感以及对相对相位敏感的特 性,使用代表水印信息的参考相位替换原始音频段的绝对相位,并对其它的音频段进行 调整,以保持各段之间的相对相位不变。相位编码的过程按照如下步骤进行:首先,将 音频序列s = s ( o ,0 i 三 分割成等长度的小段瓴( f ) 0 n ,o s f k ,其中 k = l n ;其次,对第r l 段晶( f ) 做k 点的d f t ,生成相位矩阵纯( 心) 和幅度矩阵4 | ( ) , 并且计算并存储相邻段的相位差吮+ l ( 心) = 钙什1 0 唯) 一氟( ) ,其中0 r n - i ,0 k k ; 再次,设水印序列w = w k ,0 k 鄙,w k o ,1 ) ,根据下式修改第一段的相位值 职咖 骁i 1 o k k ( 1 1 1 ) 最后,对0 s 疗 n ,利用相位差重新产生相位矩阵: 磊( w d = 九+ ( ) + 氟( ) 丸( w d = c n - , ( w 。) + 妒。( ,忱) 九一,+ ( 峨) = 矿n - 2 ( 峨) + - l ( ) ( 1 1 2 ) 并且,利用修改的相位矩阵硝如) 和原始幅度矩阵4 ( ) ,0 h n ,0 s k k 进行傅立叶 反变换( i n v e r s e d i s c r e t e f o u r i e r t r a n s f o r m ,i d f t ) ,生成含有水印的音频信号。 解码时,首先要获得含水印音频信号的同步信息,信号段的长度、d f t 变换点数都 应该为解码方所了解。具体说来,解码过程分以下三步: 在已知发送方信号段长度的情况下,将接收到的音频信号分段: 提取出第一段,对它作d f t ,计算相位值; 根据相应的阈值,对相位值进行检测,得到0 或l ,构成水印序列。 d f t 的相位成分比振幅成分对人类的感知有更大的影响,因此若在相位成分中引入 带有较高冗余度的水印,那么为了移去水印,恶意的攻击者将会给音频信号的质量带来 令人无法接受的破坏。另外,从通信理论得出的结论可以知道,相位调制对噪声信号具 有较强的鲁棒性。相位法的缺点是对绝大多数音频压缩算法敏感。 大连理工大学硕士学位论文 尽管出现了各种经典的数字音频水印算法,目前数字音频水印技术的研究仍处于发 展的初级阶段,在技术的发展过程中仍然存在着许多问题,有待进一步地研究和解决。 1 3 本论文的主要研究内容 本论文针对数字音频产品的版权保护和内容完整性认证以及篡改区域的定位等问 题展开研究,给出了基于盲源分离的多比特数字音频水印技术,基于盲源分离的小波域 多目的数字音频水印技术,以及基于盲源分离的双变换域数字音频水印技术等三种基于 盲源分离理论的数字音频水印方法。 第l 章对数字音频水印技术进行了概述。 第2 章介绍了文中涉及的一些基础知识和基本原理。首先,简要地介绍了音频信号 的特点,人耳听觉系统的感知特性。其次,简要地介绍了盲源分离的基本思想,以及解 决盲源分离问题的常用算法:独立分量分析。最后,对离散小波变换进行了简要介绍。 第3 章给出了一种基于盲源分离的多比特数字音频水印方法。利用水印检测和码本 映射的思想实现了多比特水印的嵌入和提取。 第4 章介绍了一种基于盲源分离的小波域多目的数字音频水印方法。通过在音频信 号中同时嵌入鲁棒和脆弱水印来实现音频信号的版权保护和内容完整性认证,并且可以 实现篡改区域的定位。 第5 章针对目前多数音频水印算法对时间轴缩放等同步攻击比较敏感这一问题,给 出了一种基于盲源分离的双变换域数字音频水印方法。该方法除对常规信号处理攻击具 有较好的鲁棒性以外,对时间轴缩放等同步攻击也表现出了良好的鲁棒性。 第6 章对全文进行了总结并对数字音频水印技术今后的发展前景进行了展望。 基于盲源分离的数字音频水印技术研究 2 基础知识和基本原理概述 2 1 数字音频信号的特征及人耳听觉特性 2 1 1 数字音频信号的表示 对大多数数字音频信号表示有两个重要的参数:采样量化精度和瞬态采样率。采样 精度位数的大小影响到声音质量,位数越多,音频质量越高,而需要的存储空间也越多; 位数越少,音频质量越低,需要的存储空间越少。采样率是指声音信号在从模拟信号转 换成数字信号过程中单位时间内采样的次数。 高质量的数字音频信号最流行的描述样本格式是1 6 b i t s 线性量化,如w i n d o w s 可视 音频格式( w i n d o w sa u d i ov i s u a l ,w a v ) 和音频交换文件格式( a u d i oi n t e r c h a n g ef i l e f o r m a t ,a i f f ) 。对较低质量音频信号格式是采用8 b i t s a 律或a 律的非线性量化方式。 这些量化方法使信号产生了一些畸变,在8 b i t s 律中显得更为明显。 音频信号的采样率一般为8 k h z 、9 6 k h z 、1 0 k h z 、1 2 k h z 、1 6 k h z 、2 2 0 5 k h z 和 4 4 1 k h z 。采样率影响数据隐藏量,因为它给出了可用频谱的上限,假设信号的采样频 率为8 k h z ,则引入的修改分量的频率不会超过4 乜。 本文实现的数字音频水印方法就是把数字水印嵌入在w a v 文件的p c m 数据中。 2 1 2 人耳听觉特性 ( 1 ) 人的听觉具有掩蔽效应 掩蔽效应是指当两个响度不等的声音作用于人耳时,响度较高的频率成分的存在会 影响到响度较低的频率成分的感受,使其变得不易察觉。利用掩蔽效应可以用有用声音 信号掩蔽无用的声音信号。一般来说,低音容易掩蔽高音,而高音掩蔽低音较难。掩蔽 会造成因一个声音的存在,而使另一个声音的听觉阅值上升。图2 1 为人耳听觉掩蔽曲 线,由于a 频带音频信号的能量远大于相邻频带的音频信号,因此在掩蔽曲线之下的其 它频带信号都被掩蔽起来,即使其能量已超越人耳绝对阈值曲线仍然无法被人耳察觉。 掩蔽效应是一种常见的心理声学现象,它由人耳对声音的频率分辨机制决定,而且 有同时掩蔽( s i m u l t a n e o u sm a s k i n g ) 和瞬时掩蔽( t e m p o r a lm a s k i n g ) 之分。同时掩蔽是指在 频域发生的掩蔽现象。如果在一定频率范围内,同时存在能量相差一定程度的一强一弱 两个音频信号时,弱音不被人耳察觉,即弱音被强音“屏蔽”掉,则较强的音称为掩蔽 音,弱的音称之为被掩蔽音。瞬时掩蔽是一种时域听觉现象,即不同声音之间的掩蔽现 象。这又有两种情况:强声音掩蔽其后发生的声音,叫做后掩蔽或正向掩蔽;弱声音短 大连理工大学硕士学位论文 暂地被其后产生的强声音所掩蔽,叫做前掩蔽或反向掩蔽。一般情况下,前掩蔽发生在 掩蔽音出现之前5 2 0 m s ,而后掩蔽发生在掩蔽音消失之后5 0 2 0 0 m s ,如图2 2 所示。 后掩蔽作用比前掩蔽更明显,而且掩蔽声愈强,掩蔽作用就愈大。 曼印 篓4 0 塞2 0 图2 i 听觉掩蔽曲线 f i g 2 1m a s k i n gc u r v eo f a u d i os i g n a l 图2 2 掩蔽效应曲线 f i g 2 2m a s k i n ge f f e c t i o nc u r v e ( 2 ) 入耳对声音信号的绝对相位不敏感 人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。人耳能做短时的频率 分析,对信号的周期性即音调很敏感,但对信号相位感知却不灵敏。因此,入耳昕不到 或感知极不灵敏的声音分量可以视为冗余分量。 ( 3 ) 入耳对不同频率段声音的敏感程度不同 通常入耳能感知到频率介于2 0 h z 到2 0 k h z 之间的音频信号,但对2 0 h z 到6 k h z 。 范围内的信号最为敏感,幅度很低的信号也能被听见,而在低频区( 4 0 h z 以下) 和高频区 ( 1 6 k h z 以上) ,能被人耳听见的信号幅度要高得多。即使对同样声压级的声音,人耳实 基于盲源分离的数字音频水印技术研究 际感觉到的音量也是随频率而变化的。于是,在没有噪音的环境下,在频率音频信号 能量的坐标图上可以绘出一条描述人耳听觉特性的曲线,通常称之为绝对阂值曲线,如 图2 3 所示。频带上能量值小于曲线值的声音人耳无法察觉到,只有当能量超过临界曲 线时,才能听到该声音。例如,a 频带的声音是人耳可以听到的,而b 频带的声音给人 耳的感觉却是无声的。 声压分贝 图2 3 绝对阈值曲线 f i g 2 3a b s o l u t et h r e s h o l dc u r v eo f a u d i os i g n a l 频宰 o h z ) 可以说人耳的听觉特性为在数字音频信号中嵌入水印信息提供了可行性的理论依 据和现实依据。可以充分利用入耳听觉特性,研究和使用合适的方法进行水印的嵌入。 2 2 盲源分离简介 近年来,盲源分离已经成为信号处理学界和神经网络学界共同感兴趣的研究热点领 域,并获得了迅速的发展。 假设一组源信号经过一个混合矩阵进行变换,输出得到一组观测信号,盲源分离需 要解决的问题就是在源信号和混合矩阵均为未知的情况下,仅依靠观测信号提供的信息 确定一个变换,以恢复出各路源信号。盲源分离的核心问题是分离( 解混合) 矩阵的学习 算法,它属于无监督学习,基本思想是抽取统计独立的特征作为输入的表示,而又不会 丢失信息。当混合模型为非线性时,一般无法从混合数据中恢复出源信号,除非对信号 和混合模型有进一步的先验知识可以利用。因此,本论文中只讨论线性混合模型的情况。 盲源分离可以用如下混合方程描述 x = a s ( 2 i ) 大连理工大学硕士学位论文 式( 2 】) 所描述的内容是甩维源向量s = 【置,s 2 , - - , 毛r 经过一个所x 疗维的混合矩阵a 进行线性变换,得n m 维观测向量x = 五,鼍,l r 。盲源分离的目的就是要在a 和s 均 为未知的情况下确定一个解混合矩阵w ,使得 y = w x( 2 2 ) 其中,y 为源信号s 的估计值,并且y 中的各个分量m 均尽可能相互独立。 实现盲源分离的算法可以分为三大类: ( 1 ) 信号经过变换后,使不同信号分量之间的相依性最小化,这种方法称为独立分 量分析,由c o m o n 于1 9 9 5 年提出【4 5 】
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年生态食品生产基地建设项目可行性研究报告及总结分析
- 2025年生态修复工程投资项目可行性研究报告及总结分析
- 2025年精准农业无人机使用可行性研究报告及总结分析
- 2025年社区服务型酒店项目可行性研究报告及总结分析
- 酒店租赁包天合同范本
- 2025年全国性快递物流网络优化可行性研究报告及总结分析
- 气体代售点合同范本
- 民事请律师合同范本
- 生鲜猪肉购销合同范本
- 环卫自卸运输合同范本
- 光声成像诊断肝脏疾病
- 材料科学与工程导论智慧树知到期末考试答案章节答案2024年华南理工大学
- 《春》说课课件(新)
- 癸酉本石头记
- 人文成都智慧树知到期末考试答案章节答案2024年成都师范学院
- 研学旅行主题活动设计案例
- 《因果推断实用计量方法》大学教学课件-双重差分法
- 无期限的六合公式汇编
- 先张法预应力混凝土管桩基础技术规程
- G50058爆炸危险环境电力装置设计规范新老对比
- 2023年光器件工艺工程师年终总结及下一年展望
评论
0/150
提交评论