




已阅读5页,还剩70页未读, 继续免费阅读
(通信与信息系统专业论文)用于版权保护的音频数字水印算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 随着互联网以及多媒体通讯的发展,对多媒体产品版权保护和鉴别要求越 来越强烈,而数字水印技术是解决数字版权保护问题的有效手段。目前,对静 态图像数字水印技术的研究己经日趋成熟,音频数字水印也正成为新的研究热 点。 本文在详细分析数字音频水印技术特点和需求的基础上,以直观的二值图 像作为水印信息,以音频数据为嵌入对象,从提高数字水印的不可察觉性和鲁 棒性出发,探讨了两种新的用于版权保护的数字音频盲水印方法。 一是基于离散小波变换的盲音频水印算法。在对作为水印的二值图像进行 a r n o l d 置乱处理,将其转化为一维序列后,再对原始音频信号实施分段离散小 波变换并根据离散小波变换近似分量的能量自适应确定嵌入强度,选择小波变 换近似分量的偶数点系数嵌入水印,水印嵌入的次数等于原始音频分成的段数。 水印检测不需要原始音频信号,提高了水印的工程应用价值。 二是引入了基于倒谱变换和离散余弦变换相结合的音频水印算法。算法中 对二值水印图像进行了置乱处理,增加了水印信息的安全性。将原始音频信号 分段并对每段音频数据实施倒谱变换,再对倒谱系数进行离散余弦变换,采用 量化原理将水印信息嵌入到离散余弦变换的低频系数中,保证了水印的不可感 知性以及鲁棒性。在水印检测过程中不需要原始音频信号,是一种盲水印算法。 与目前大部分文献采用的倒谱变换方法相比,本算法有更好的不可感知性及鲁 棒性。 仿真实验表明,本课题提出的两种算法具有较好的不可感知性,对一些基 本的信号处理操作具有很强的鲁棒性,并且均实现了水印的盲检测,具有很好 的实用价值。 关键字:音频水印,离散小波变换,倒谱变换,离散余弦变换 武汉理工大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to ft h ei n t e r n e ta n dm u l t i m e d i a , t h ep r o t e c t i o nf o rt h e i n t e l l e c t u a lc o p y r i g h tb e c o m e sm o r ea n dm o r eu r g e n ta n di m p o r t a n t ,m e a n w h i l e ,t h e d i g i t a lw a t e r m a r k i n gi st h ee f f e c t i v er e c a l l s t os o l v et h ei n t e l l e c t u a lc o p y r i g h t p r o b l e m s r e c e n t l y , r e s e a r c ho nt h es t i l li m a g ew a t e r m a r k i n gt e c h n o l o g yb e c o m e s m o r ea n dm o r em a t u r e d ;w h i l et h er e s e a r c ho na u d i od i g i t a lw a t e r m a r k i n gi s b e c o m i n g ah o tt o p i c w i t ht h et w o d i m e n s i o nb i n a r yi m a g ea sw a t e r m a r k i n gi n f o r m a t i o n ,t h ea u d i o d a t aa se m b e d d e dt a r g e t , o nt h eb a s i so fa n a l y z i n gt h ed i g i t a lt e c h n o l o g i c a l c h a r a c t e r i s t i ca n dd e m a n do fa u d i ow a t e r m a r k i n gi nd e t a i l ,i no r d e rt oe n h a n c et h e i m p e r c e p t i b l ea n dr o b u s to ft h ed i g i t a lw a t e r m a r k i n g ,t h i sp a p e rd i s c u s s e st w on e w d i g i t a lb l i n dw a t e r m a r k i n gm e t h o d so fa u d i of o rc o p y r i g h tp r o t e c t i o n a to n eh a n d ,t h e r ei st h ed i g i t a lb l i n dw a t e r m a r k i n ga l g o r i t h mo fa u d i ob a s e d o nd i s c r e t ew a v e l e tt r a n s f o r m f i r s t ,t h ew a t e r m a r k i n gi m a g eh a sb e e np r o c e s s e db y a r n o l dd i s o r d e rt r a n s f o r n l ,t h e nc o n v e r t e di ti n t oao n e d i m e n s i o ns e q u e n c e ;s e c o n d , t h ea u d i od a t ah a sb e e nd i v i d e da n dd i s c r e t ew a v e l e tt r a n s f o r m ;t h j r d ,d e t e r m i n et h e e m b e d d i n gs t r e n g t ho fw a t e r m a r k i n ga d a p t i v e l ya c c o r d i n gt ot h ee n e r g yo f t h ed w t a p p r o x i m a t ec o e f f i c i e n t , a n dc h o o s et h e e v e nn u m b e ro fw a v e l e tc o e f f i c i e n tt o e m b e dw a t e r m a r k i n g 啊1 et i m e so ft h ew a t e r m a r k i n gh a sb e e ne m b e d d e dr e p e a t e d l y e q u a l t ot h es e g m e n t sn u m b e ro ft h ea u d i oh a sb e e nd i v i d e d 1 1 1 ew a t e r m a r kc a l lb e e x t r a c t e dw i t h o u tt h eo r i 垂n a la u d i os i g n a l 1 1 1 i sh e l p si tt ou s ei nt h ea c t u a lp r o j e c t o nt h eo t h e rh a n d ,i td i s c u s s e st h ed i g i t a lw a t e r m a r k i n ga l g o r i t h mo fa u d i o b a s e do nc e p s t m mt r a n s f o r ma n dd i s c r e t ec o s i n et r a n s f o r m 1 1 1 ea l g o r i t h mi n c r e a s e s t h ew a t e r m a r k i n gs e c u r i t yb yd i s o r d e r i n gt h ew a t e r m a r k i n g 1 1 1 ea u d i os i g n a lh a s b e e nd i v i d e da n dc e p s t r u mt r a n s f o r m ,a n du s et h ec o e f f i c i e n to f c e p s t r u mt r a n s f o r m t od i s c r e t ec o s i n et r a n s f o r m e m b e d d i n gt h ew a t e r m a r k i n go nt h el o w - f r e q u e n c yo f t h ed i s c r e t ec o s i n et r a n s f o r mu s i n gq u a n t i z a t i o nt h e o r yi m p r o v e st h ew a t e r m a r k i n g s 武汉理工大学硕士学位论文 i m p e r c e p t i b l ea n dr o b u s t t h ew a t e r m a r k i n gc a nb ee x t r a c t e dw i t h o u tt h eo r i g i n a l a u d i o c o m p a r e dw i t ht h em e t h o d sb a s e do nc e p s t r u mt r a n s f o r mp r o p o s e di nt h e m o s tp a p e r sa tp r e s e n t , t h ea l g o r i t h mo ft h i sp a p e rh a sb e t t e r i m p e r c e p t i b l ea n d r o b u s t t h ee x p e r i m e n t a lr e s u l td e m o n s t r a t e st h a tt h ew a t e r m a r k i n gi si m p e r c e p t i b l e a n dt h ea l g o r i t h m sa r er o b u s tt om a n yb a s i cs i g n a lo p e r a t i o n s t h ew a t e r m a r kc a nb e e x t r a c t e dw i t h o u tt h eo r i g i n a la u d i o t h eb l i n dw a t e r m a r k i n gd e t e c t i o nh a sv e r y g o o dp r a c t i c a lv a l u e k e y w o r d s :a u d i ow a t e r m a r k i n g ,d i s c r e t ew a v e l e tt r a n s f o r m ,c e p s t r u mt r a n s f o r m , d i s e r e t ec o s i n et r a n s f o r m i i i 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽 我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了 谢意。 签名:盘邀日期:丝! 墨:12 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保留、送交 论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用 影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名: 主奁 导师签名: 、, 朋、2 , 4 , , , 武汉理工大学硕士学位论文 1 1 课题的研究背景 第1 章绪论 随着计算机、通信技术的迅速发展,多媒体存储和传输技术的进步使存储 和传输数字化信息成为可能,数字化产品可以方便地制作、复制、修改、存储、 传播。同时,也导致了大量非法盗版的出现,严重地损害了创作者和所有者的 知识产权( i n t e l l e c t u a lp r o p e r t yr i g h t s ) ,数字产品的知识产权保护也显得越来越 重要。在这种形势下,以信息隐藏技术为核心的数字水印( d i g i t a lw a t e r m a r k i n g ) 技术应运而生。在数字化产品中嵌入水印信息,可以实现拷贝限制、使用跟踪、 盗版确认等功能,有利于解决版权纠纷,保护数字产权合法拥有者的利益。 数字水印是一种有效的数字产品版权保护和数据安全维护技术,是信息隐 藏( i n f o r m a t i 0 1 1h i d i n g ) ( 1 j 技术研究领域中的一个重要分支。事实上,信息隐藏 技术从有隐密通信就已开始研究,但由于其特殊的用途,一直被限制在军事和 安全部门一个很小的范围内。随着计算机、多媒体技术的发展,网络通信逐步 成为人们交流信息的方式之一,对数字化产品( 如:音像作品、电子商务、电 子政务、数字图书、远程教育等) 的认证、防伪以及版权保护的需求越来越迫 切,从而产生出一门新的分支:数字水印。 数字水印技术除具有信息隐藏技术的一般特点外,还有着其固有的特点和 研究方法。例如:从信息安全的保密角度上看,如果隐藏的信息被破坏,系统 可以视为安全的,因为秘密信息并没有泄露;但在数字水印系统中,隐藏信息 的丢失即意味着版权信息的丢失,从而失去了版权保护的功能,这一系统就是 失败的。因此,数字水印技术必须具有较强的鲁棒性、安全性和不可感知性。 随着数字化音像制品的大量制作和发行,数字音频水印技术的研究和发展 越来越显得重要。一方面,可以用音频水印技术实现数字音频作品版权的保护 和认证,这是水印技术最主要的应用。它的目的是通过嵌入数据的来源信息以 及比较有代表性的版权所有者信息,从而防止其它团体对该数据宣称拥有版权。 这样水印就可以用来公正地解决所有权问题;另一方面可以用于音频作品的盗 版跟踪,它的目的是传输合法接收者的信息而不是数据来源者的信息,主要用 武汉理工大学硕士学位论文 来识别数据的单个发行拷贝。这一类应用在发行的每个拷贝中嵌入不同的水印, 通常称之为“数字指纹 ;还可以用于拷贝保护,这就要求在音频作品发行体系 中存在一个拷贝保护机制,即它不允许未授权的媒体拷贝。在开放系统中很难 实现拷贝保护,然而在封闭或私有系统中,可以用水印来说明数据的拷贝情况, 因此拷贝保护是可行的。随着艘3 、m p 4 、m p e g 、a c 3 等新一代压缩标准的 广泛应用,数字音频在因特网上呈指数级增加,对音频数据产品的保护就显得 越来越重要,音频水印领域将有较为广阔的应用前景。因此,选择数字音频水 印作为研究课题有较强的现实意义。另一方面,对发表的数字水印研究文献检 索统计,发现数字音频水印的研究文献相对于数字图像水印的研究文献要少得 多,因而较容易在数字音频水印上挖掘创新点。 1 2 相关领域国内外研究现状 1 2 1 国内外研究现状 数字时代的到来,多媒体数字世界丰富多彩,数字产品几乎影响到每一个 人的日常生活。信息媒体的数字化为信息的存取提供了极大的便利,同时也显 著地提高了信息表达的效率和准确度。计算机网络通信技术特别是互联网的蓬 勃发展,使得数据的交换和传输变成了一个相对简单且快捷的过程。人们借助 于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传达 到世界各地,在国际互联网上发布自己的作品,传递重要的信息,进行各种学 术交流和电子商务活动等等。如何保护这些与我们息息相关的数字产品,如版 权保护、信息安全、数据认证以及访问控制等等,已受到日益重视并变得迫切 需要了,因此数字水印在今天的计算机和互联网时代大有可为。 数字水印技术是近十年才发展起来的,它是信息隐藏学的一个分支。随着 国内信息化程度的提高和电子商务逐渐走向实用,数字水印技术将会拥有更加 广阔的应用前景。 鉴于信息隐藏与数字水印技术的应用前景,众多知名研究机构如麻省理工 学院的多媒体实验室、剑桥大学的多媒体实验室、i b m 数字实验室、日立、n e c 、 s o n y ,p h i l i p s 、微软等都加入到信息隐藏和数字水印技术的研究和应用并取 得了一定的成果。1 9 9 6 年5 月,第一届国际信息隐藏学术研讨会( c m w ) 在 英国剑桥牛顿研究所召开,至今该研讨会已举办了四届。另外,在i e e e 和s p i e 2 武汉理工大学硕士学位论文 等一些重要国际会议上也开辟了信息隐藏与数字水印相关的专题技术研究。此 外欧洲、北美以及其他的一些关于图像、多媒体研究方面的国际会议都有专门 的数字水印讨论组。欧洲已有几项较大的工程项目( v a 和a c t s ) 都有关于 信息隐藏与数字水印方面的专项研究。摄影光学仪器工程师学会从1 9 9 9 年开始 举办专门的“多媒体内容的安全和水印 讨论会。另外,一些组织开始考虑包 含不同标准的水印技术。拷贝保护技术工作组( c p t w g ) 出于保护d v d 碟中 视频的目的测试了水印系统。安全数字音乐主创( s d m i ) 将水印做成他们的音 乐保护系统的核心技术。1 9 9 8 年以来, e e 图像处理、 i e e e 会报、 皿e e 通信选题、匝e e 消费电子学、s p 等许多国际重要期刊都 组织了数字水印技术专刊或专题报道,如“s p i es e c u r i t ya n dw a t e r m a r k i n go f m u l t i m e d i ac o n t e n t s ,s a nj o s e ,c a ,u s a ,j a n , 1 9 9 9 是s p i e 出的专门有多媒体 信息安全与水印技术的会议文集。i e e e 也曾出过三个专集,分别为:1 9 9 8 年5 月的“i e e ej o u r n a lo ns e l e c t e da r e a so fc o m m u m c a t i o nv 0 1 16 和l9 9 9 年7 月 的“p r o c e e d i n g so ft h ei e e ev 0 1 8 7 ,i e e e 的s i g n a lp r o c e s s i n g 在2 0 0 2 年6 月出版一卷水印专集,卷名为“s p e c i a ls e c t i o no ni n f o r m a t i o i lt h e o r e t i ca s p e c t so f d 硒t a lw a t e r m a r k i n g 。 近年来,该领域研究的发展速度非常快,有些公司已推出了一些数字水印 软件产品,1 9 9 6 年2 月美国a d o b es y s t e m 公司首先在图像处理软件a d o b e p h o t o s h o l m 0 中,采用美国d i g i m a r c 公司的技术,加入了数字水印模块,起到 版权保护的功能。1 9 9 9 年2 月,五大唱片公司:博得曼、百代、索尼、环宇和 华纳联合宣布与i b m 合作,联合开发一个在因特网方便、快速、安全发布数字 视听产品的实验系统。2 0 0 1 年1 月d i g i m a r c 公司又宣布与图形艺术的业界团体 p r i n t i n gi n d u s t r i e so fa m e r i c a ( p 认) 就电子水印技术联手合作,在打印机使用 d i g i m a r c 的“m e d i ab r i d g e 电子水印技术。2 0 0 1 年7 月,富士通公司开发出 了“阶层型电子水印 技术,为其在因特网上实现电子博物馆和电子美术馆系 统“m u s e t h q u el i g h t 提供了安全保障。同时还有一些其他公司也相继推出了 在数字化图像、音频和视频作品中嵌入鲁棒水印以进行版权保护的软件产品, 如b l u e s p i k e 公司的“g i o v a n n i 数字水印系统 ,g o g n i c 公司的“a u d i o k e y m p 3 水印系统”,s i g n u mt e c h n o l o g i e s 公司的“s u r e s i g n 水印等等。 我国学术界对数字水印技术的反应也非常快,已经有相当一批有实力的科 研机构投入到这一领域的研究中来。为了促进数字水印及其他信息隐藏技术的 3 武汉理工大学硕士学位论文 研究和应用,1 9 9 9 年1 2 月,我国信息安全领域的何德全院士、周仲义院士、 蔡吉人院士与有关应用研究单位联合发起召开了我国第一届信息隐藏学术研讨 会。至今该研讨会己举办了五届。全国第二届信息隐藏学术研讨会于2 0 0 0 年6 月在北京召开;全国第三届信息隐藏学术研讨会于2 0 0 1 年9 月在西安召开;全 国第四届信息隐藏学术研讨会于2 0 0 2 年8 月在大连召开。全国第五届信息隐藏 学术研讨会于2 0 0 4 年l l 1 2 月期间在广州召开,会议由中山大学与北京电子技 术应用研究所联合承办。 2 0 0 0 年1 月,由国家“8 6 3 ”智能机专家组和中科院自动化所模式识别国家 重点实验室组织召开了数字水印学术研讨会,来自国家自然科学基金委员会、 国家信息安全测评认证中心、中国科学院、北京邮电大学、国防科技大学、清 华大学、北方工业大学、上海交通大学、天津大学、中国科技大学、北京大学、 北京理工大学、哈尔滨工业大学、中山大学、北京电子技术应用研究所等单位 的专家学者和研究人员深入讨论了数字水印的关键技术,报告了各自的研究成 果。从这些情况可以看出,我国相关学术领域的研究与世界水平相差不远,而 且有自己独特的研究思路【2 】。 1 2 2 当前研究存在的问题 由于数字音频在多媒体产品中占有较大的比重,选取数字音频水印作为研 究对象,具有较强的现实意义。 音频数字水印仍然是一个未成熟的研究领域,还有许多问题需要解决,其 理论基础依然非常薄弱,大多数水印算法还是经验性的。由于人类听觉系统 ( h a s ,h u m a na u d i t o r ys y s t e m ) 对声音变化的灵敏度要高于人类视觉系统 ( h v s ,h u m a n v i s u a ls y s t e m ) 对图像变化的灵敏度,因而在音频信号中隐藏信 息的难度相对较大【3 】,需要解决的问题还很多。 当前,数字音频水印虽然取得了一些进展,但也存在着一些问题,主要体 现在以下几个方面: ( 1 ) 数字音频水印时域算法的解决方案较少。二十世纪九十年代的音频水 印算法大多采用时域算法,如:最不重要位( l s b ) 算法、回声隐藏( e c h oh i d i n g ) 算法等。由于数字水印变换域算法研究迅速崛起而成为研究的热点,使得时域 算法研究受到了冷遇,数字音频的时域水印算法比较少。 ( 2 ) 基于小波变换的音频水印算法研究文献较多,但存在着这样或那样的 4 武汉理工大学硕士学位论文 不足。如:有些算法存在着鲁棒性较强但检测不是盲水印检测,或者不可感知 性好但鲁棒性不强等不足,没有很好地体现小波变换的优势,其研究还有进一 步的必要。 1 3 本文的主要研究内容和组织结构 本论文从数字水印技术的历史背景和研究意义出发,在对数字水印技术基 本原理深入理解的基础上,结合音频信号的特点,通过对国内外现有的音频数 字水印技术的研究和分析,提出了两种新的音频数字水印算法,并进行了仿真 实验,结果表明所提出的算法有良好的不可感知性和较强的鲁棒性。 本论文的主要研究和工作包括以下几个方面: 第1 章主要介绍了数字水印的研究背景,介绍了相关领域国内外研究现状, 并给出了本论文主要研究内容和组织结构。 第2 章首先概述了数字音频的基本概念,给出了音频数字水印技术的基本 架构,介绍了音频数字水印的特点、分类、应用以及典型的音频数字水印技术, 最后介绍了音频数字水印的常见信号处理操作及其评价标准。 第3 章提出了基于离散小波变换的自适应盲音频水印算法,并进行了仿真 实验和结果分析。该算法中对二值水印进行了置乱处理,在一定程度上增加了 水印信息的保密性;采用分段重复嵌入,降低了水印提取的误码率;将水印嵌 入到d w t 变换域近似分量的偶数点系数上,保证了水印的不可感知性;根据 d w t 近似分量的能量自适应确定嵌入强度,提高了水印的嵌入性能。仿真实验 证明,该算法对常见的信号处理攻击具有较强的鲁棒性。 第4 章提出了一种新的基于复倒谱变换和离散余弦变换相结合的盲音频数 字水印算法。该算法首先原始音频信号进行分段复倒谱变换,再对复倒谱系数 进行d c t 变换,选取d c t 变换后的低频系数,采用量化的方法嵌入水印。本 算法对作为水印的二值图象进行了a r n o l d 置乱加密处理,可以增加水印的安全 性。在水印检测过程中不需要原始音频,是一种盲水印算法。仿真实验中将本 算法与文献 4 q a 基于复倒谱的音频数字水印算法进行了比较,结果表明本算法 具有更好的不可感知性和更强的鲁棒性。 第5 章对全文的工作做了总结,并说明了进一步的研究内容以及数字水印 技术的展望。 武汉理工大学硕士学位论文 第2 章数字音频水印 2 1 数字音频的基本概念 声音是人类传递信息的主要媒体之一。而所谓声音,就是通过空气传播的 一种连续的波,也称为声波。声音的强弱体现在声波压力的大小上,音调的高 低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续 的模拟信号。声波具有普通波所具有的特性,例如反射、折射和衍射等。 音频信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是 连续的。在时间上“连续是指在一个指定的时间范围里声音信号的幅值有无 穷多个,在幅度上“连续”是指幅度的数值有无穷多个。习惯上,把在时间和 幅度上都是连续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样( s a m p l i n g ) ,由这些 特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数 值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这 种由有限个数值组成的信号就称为离散幅度信号。我们把时间和幅度都用离散 的数字表示的信号就称为数字信号,而把时间和幅度都用离散的数字表示的音 频信号称为数字音频。 音频信号转换为数字音频的第一步就是数字化,数字化实际上就是采样和 量化( q u a n t i z a t i o n ) 。连续时间的离散化通过采样来实现,就是每隔相等的一 小段时间采样一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实 现,就是把信号的强度划分成段,如果幅度的划分是等间隔的,就称为线性量 化,否则就称为非线性量化。 数字音频是一种数字化产品,它是将模拟的声音信号进行a d 转换,使其 转化为数字信号。这种数字化产品可以被方便地复制、修改、存储、传播,因 而数字音频的版权保护也显得越来越重要。 数字音频有两个重要的参数:量化精度和采样频率。 数字音频量化精度有8 b i t | l 律量化、1 6 b i t 线性量化、2 4 b i t 线性量化、3 2 b i t 线性量化等格式。高质量音频的量化精度通常采用1 6 b i t 以上线性量化,如 6 武汉理工大学硕士学位论文 w i n d o w s 可视音频格式( w a v ) 和音频交换文件格式( a 球f ) 通常采用1 6 b i t 线性量化;较低质量音频的量化精度一般采用8 b i tl a 律量化格式,这种量化方 式会使信号产生一些畸变。 一般音频的常用采样频率有8 k h z 、9 6 k h z 、1 0 k h z 、1 2 k h z 、1 6 k h z 、2 2 0 5 1 ( h z 及4 4 1 k h z 等形式。采样频率影响水印数据的隐藏量,因为它给出了可用频率 的上限。例如:信号的采样频率为8 k h z ,则引入的修改分量的频率不会超过 4 k h z 。对于大多数已有的水印来说,可用的水印空间与采样频率的增长关系通 常呈线性关系。 2 2 人类听觉特性 在音频信号中嵌入水印一般都要利用人类听觉系统( h a s ) 的某些特性, 即人的听觉生理一心理特性【5 司,来满足嵌入水印的不可感知性( 听觉相似性) 要求。h a s 特性主要有以下几个方面【4 】: ( 1 ) 人耳的绝对闻阈特性 人耳对声音能量强弱的直接感受就是听到音量的大小,也就是响度,其单 位是分贝( d b ) 。人耳的听力范围是2 0 h z - 2 0 k h z 的频率范围。但人耳对不同的 频率声音的灵敏度是不同的,也就是不同频率的声音要达到能被人耳听到的水 平所需要的强度是不一样。入耳最灵敏的频率范围是3 0 0 h z - - 6 k h z 之间,对其 它频率灵敏度较低。 实际上,当一个较强信号存在时,听觉的阈值不同于绝对阈值,在接近较 强信号频率的频率处,听觉阈值被提高,新阈值称为掩蔽阈值,当信号的响度 低于掩蔽阈值就会被掩蔽。 ( 2 ) 人耳的掩蔽效应 掩蔽效应 7 1 ( m a s k i n ge f f e e t ) 表现在强信号会掩蔽邻近频率的弱信号,掩 蔽的效果依赖掩蔽音和被掩蔽音的频域特性和时域特性。 频域掩蔽是指在掩蔽声与被掩蔽声同时作用时发生掩蔽效应,又称为同时 掩蔽。一般说来,频域中的一个强音会掩蔽与之同时发声的附近的弱音,弱音 离强音越近,一般越容易被掩蔽;反之,离强音越远的弱音不容易被掩蔽。例 如,一个1 0 0 0 h z 的音比另一个9 0 0 h z 的音高1 8 d b ,则9 0 0 h z 的音将被1 0 0 0 h z 的音掩蔽。而若1 0 0 0 h z 的音比离它较远的另一个1 8 0 0 h z 的音高1 8 d b ,则这 7 武汉理工大学硕士学位论文 两个音将被同时听到。若要想让1 8 0 0 h z 的音听不到,则1 0 0 0 h z 的音要比1 8 0 0 h z 的音高4 5 d b 。一般说来,低频的音容易掩蔽高频的音;在距离强音较远处,绝 对闻阈比该强音所引起的掩蔽阈值高,这时,噪声的掩蔽阈值应取绝对闻阈。 时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时,又称异时 掩蔽。异时掩蔽又分为导前掩蔽与滞后掩蔽。若掩蔽声音出现之前的一段时问 内发生掩蔽效应,则称为导前掩蔽:否则称为滞后掩蔽。一般情况下,导前掩 蔽只有3 - 2 0 m s ,而滞后掩蔽可持续5 0 - - - 1 0 0 m s 。 ( 3 ) 人耳的空间响应 人耳对某些高频的声音的空间感很差,辨别不了声源的方向。 ( 4 ) 人耳的相位响应 人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。 2 3 音频数字水印的基本架构 2 3 1 数字音频水印系统的基本构成要素 从信号处理的角度上看,嵌入载体对象( 音频信号) 的水印信号可以看作 是在强背景下叠加一个弱信号,只要叠加的水印信号强度低于人的听觉系统 ( h a s ) 对声音的感知门限,h a s 就无法感知到水印信号的存在。由于h a s 受空间、时间及频率特性等因素的限制,因此通过对载体对象作一定的调整, 就有可能在不引起人感知的情况下嵌入一些信息。 从数字通信的角度上看,水印嵌入可理解为在一个宽带信道( 载体对象) 上用扩频通信技术传输一个窄带信号( 水印) 。尽管水印信号具有一定的能量, 但分布到信道中任一频率上的能量是难以检测到的。而水印的译码( 检测) 则 是一个有噪信道中弱信号的检测问题。 水印有各种形式,通常可将水印定义为如下的信号w : = w l w u ) ( 2 1 ) 其中:形称为原始水印;水印信号可以是二值形式( u = o ,l 或u = - 1 ,1 ) 或 高斯噪声形式。 数字音频水印处理系统可用6 个基本要素x 、矽、k 、g 、e 、d 来表达, 其中: 8 武汉理工大学硕士学位论文 x 为所需要保护的数字产品x 的集合;形为所有可能的水印形集合;k 为 标识码( 又称的水印密钥) 的集合;g 表示密钥k 和待嵌入水印的工共同生成 水印的算法,即: g :x k 专矽,w = g ( x ,k ) ( 2 2 ) e 表示将水印形嵌入数字产品k 中的嵌入算法,即: e :x x wo x ,= e ( x o ,k ) ( 2 3 ) 这里,k 表示原始的数字信号,表示嵌入水印后得到的数字产品。d 表示 水印检测算法,即: d:xk_0,1)(2-4) 则0 嚣潞 亿5 , 这里,q 、风代表二值假设,分别表示水印的有或无。 2 3 2 水印系统的评价 为了对水印系统进行评价,可引入两个概念: ( 1 ) 感知相似性:设数字产品x ,y x ,则符号x 】,表示彳和】,具有相 同的感知形式。而符号x y 表示x 和l ,是完全不同的数字产品,或表示j ,是 相对于x 质量下降的数字产品。 感知相似性通常是以人类知觉系统的主观标准为基础的,但客观误差估计 也可以用来确定感知相似性。 ( 2 ) 水印等价性:若水印以和职满足 v ( x ,) = 1,d ( x ,) = 1 ( 2 6 ) 则称、是等价的,表示为形兰吸。 通常情况下,水印的等价性是指水印间的高度相关性。显然,相同的水印 是等价的。反之不然,等价的水印可能相差很大。 2 3 3 水印系统的基本要求 水印处理系统必须满足一些特定的要求,以便形成一套适用于版权保护和 9 武汉理工大学硕士学位论文 产品内容鉴定的值得信赖的根据,这些基本要求是: ( 1 ) 不可感知性:对于不可见水印处理系统,水印嵌入算法不应产生可感 知的数据修改,也就是添加水印后的产品必须相似于原始产品,即托。 ( 2 ) 密钥唯一性:不同密钥应产生不等价的水印,即对于任何产品x x 和彬= c ( x ,k ) ,f - 1 , 2 ,满足墨k 、。 ( 3 ) 水印有效性:在水印处理算法中,只有采用有效的水印。对于特定的 产品x x ,当且仅当存在k k 使得w = c ( x ,o ,则称水印形是有效的。 ( 4 ) 不可逆性:函数形= 6 ( x ,k ) 应该是不可逆的,即k 不能根据形和函 数g 逆推出来的。不满射的函数g 直接满足这个条件,但这在水印处理算法中 并不是必要条件。在实际应用中,不可逆意味着对于任何信号矿,很难再找到 另一个与形等价的水印信号。 ( 5 ) 产品依赖性:在相同的密钥条件下,当水印算子g 用在不同的产品时, 应该产生不同的水印信号,即对任何特定的密钥k k 和任何五,五ex ,满足 五五,彬吸,其中彬= g ( x ,k ) ,待1 , 2 。 ( 6 ) 多重水印:通常对已嵌入水印信号的产品用另一个不同的密钥再作水 印嵌入是可能的,这也往往是盗版者或侵权者在重销时可能做的工作。但在某 些场合,利用这种特性可以对产品的发布渠道进行跟踪。若 五= e ( 置小形) ,扛1 , 2 ,那么对于任何f 厅,原始水印必须在置中还能检测 出来,即d ( 五,彤) = 1 ,这里疗是一个足够大的整数,使得以k ,而且 鼍+ i x o 。 ( 7 ) 检测可靠性:肯定检测的输出必须有一个合适的最小的置信度。如果 厶是检测的虚警概率,则它满足匕 瓦,其中乃为一阈值,其取值在肚1 之间。阈值t 的选择要同 时考虑虚警概率和漏警概率,当z 减小时,其虚警概率提高而漏警概率降低; 当疋增大时,虚警概率降低而漏警概率提高。 ( 3 ) 信噪比 信噪比( s n r ,s i g n a ln o i s er a t i o n ) 可对水印算法本身引起的信号失真量 进行定量评价 2 9 , 3 0 。信噪比的定义如下: 武汉理工大学硕士学位论文 1 4 一钟 s n r = - 1 0 l o g i o 一 ( 2 1 5 ) z 1 4 1 2 其中:4 、4 分别为嵌入水印前、后的音频信号。 此外,还有水印算法采用峰值信噪比( p s n r , p o w e rs i g n a l - t o - n o i s er a t i o n ) 对信号失真量进行定量评价1 3 l 】。 ( 4 ) 相似度 相似度( s i m i l a r ) 在音频水印中也被用于水印评价p 2 3 3 1 。相似度的定义如 下: w i x w l s i m ( w ,w i ) = 一 ( 2 1 6 ) w i w , j ( 5 ) 比特错误率 比特错误率( b e r ,b i te r r o rr a t e ) 在水印评价中也有应用p 4 ,3 5 1 ,其定义如 下: 脚= 鬻枷。 协 ( 6 ) 音频处理软件 在数字音频水印中,有些音频处理软件也可用于水印评价、检测,如:c o o l e d i tp r o ,不但可以同时直观地观察嵌入水印前后音频信号的波形对比,还可对 指定采样点的波形进行放大、缩小及添加白噪声、蓝噪声等。 2 1 0 本章小结 本章主要介绍数字水印技术中水印信号的设计和产生问题、目前常见的数 字音频水印算法及特点、音频水印的评价标准及听觉系统的特性。通过了解数 字音频水印的特点、各种音频水印算法的特点及音频水印的评价标准,为研究 更鲁棒、更透明的音频水印算法打下基础。 武汉理工大学硕士学位论文 第3 章基于小波变换的自适应盲音频水印算法 3 1 引言 小波变换( w a v e l e tt r a n s f o r m ,w t ) 3 6 1 的出现,对工程技术产生了深远的 影响。由于它在时域和频域同时具有良好的局部化特性,与传统的傅立叶 ( f o u r i e r ) 变换相比,它是一个时间和频率的局部变换,能对函数或信号进行 多尺度细化分析( m u l t i s c a l ea n a l y s i s ) ,解决了傅立叶变换不能解决的许多困难 问题,从而小波变化被誉为“数学显微镜 ,目前小波变换已经被广泛的应用在 数字信号处理( d i g i t a ls i g n a lp r o c e s s i n g ,d s p ) 的领域,特别是音频以及视频的 压缩等应用1 3 7 娜1 。 文献 3 9 1 提出了基于模数运算的d w t 域数字音频水印算法,其主要思想 是:采取在小波变换域内选取低频系数较大点作为水印嵌入点,给定一个强度 因子j 对待处理的音频信号进行模2 运算,根据模运算后的余数是否与要嵌入 此位置的水印值是否相等,作为修改此位置音频值的依据。当二者相等时不作 修改,不相等时则修改音频值使其相等,从而达到嵌入水印的目的。该算法存 在一定的缺陷,当音频信号的幅度发生改变时,音频信号进行模2 运算的余数 可能会发生改变,虽然对透明性不会造成太大的影响,但会严重影响水印的鲁 棒性。 文献【4 0 】提出基于信噪比确定伸缩因子口的自适应加性音频水印算法,虽 然鲁棒性较强,但在提取水印时需要原始的数字音频信号,不是盲水印提取, 其应用受到了限制。 总结以上二者的算法的存在的局限性,确定本章研究目的如下: 一是算法应有较强的鲁棒性,较好的不可感知性,这是音频水印的基本要 求。二是提取水印应是盲提取,这是衡量水印性能的一个重要因素。 3 2 小波变换简介 小波变换的概念是由法国从事石油信号处理的工程师j m o r l e t 在1 9 7 4 年首 武汉理工大学硕士学位论文 先提出的,通过物理的直观和信号处理的实际需要经验的建立了反演公式,当 时未能得到数学家的可。正如1 8 0 7 年法国的热学工程师j b j f o u r i e r 提出任一 函数都能展开成三角函数的无穷级数的创新概念未能得到著名数学家 j l l a g r a n g e ,e s l a p l a c e 以及a m l e g e n d r e 的认可一样。幸运的是,早在七十 年代,a c a l d e r o n 表示定理的发现、h a r d y 空间的原子分解和无条件基的深入 研究为小波变换的诞生做了理论上的准备,而且j o s t r o m b e r g 还构造了历史上 非常类似于现在的小波基;1 9 8 6 年著名数学家y m e y e r 偶然构造出一个真正的 小波基,并与s m a l l a t 合作建立了构造小波基的同样方法及其多尺度分析之后, 小波分析才开始蓬勃发展起来。它与f o u r i e r 变换、窗口f o u r i e r 变换( g a b o r 变换) 相比,是一个时间和频率的局域变换,因而能有效的从信号中提取信息, 通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析( m u l t i s c a l e a n a l y s i s ) ,解决了f o u r i e r 变换不能解决的许多困难问题,从而小波变化被誉为 “数学显微镜”。 小波分析的应用是与小波分析的理论研究紧密地结合在一起地。现在,它 已经在科技信息产业领域取得了令人瞩目的成就,尤其是是图像和信号处理方 面。在小波分析的许多应用中,都可以归结为信号处理问题。现在,对于那些 随时间稳定不变的信号,处理的理想工具仍然是傅立叶分析。但是在实际应用 中的绝大多数信号是非稳定的,而特别适用于非稳定信号的工具就是小波分析。 从提取特征的角度来看,常常需要采用连续小波变换,但是在每个可能的 尺度离散点都去计算小波系数,那将会是一个非常巨大的工程,并且产生过于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年铅及铅合金材项目发展计划
- 安全培训效果评估记录课件
- Glyoxal-d2-生命科学试剂-MCE
- 2025年威海市立医院公开招聘高层次急需紧缺专业技术人才(33人)考前自测高频考点模拟试题及答案详解(典优)
- 2025广东广州市中山大学孙逸仙纪念医院肿瘤科放疗专科科研助理招聘1人考前自测高频考点模拟试题附答案详解(考试直接用)
- 小学假期安全培训记录课件
- 小学保安安全演练培训课件
- 农村电商行业农产品网络销售渠道拓展
- 安全培训效果好的词语课件
- 2025年离合器:离合器从动盘合作协议书
- 幼儿园绘本故事:《排队喽》 课件
- 林彪 军事演讲课件
- 颈脊髓损伤患者护理查房PPT
- 增员及邀约话术2-2课件
- 会计凭证考试试题
- 《冷冲压工艺与模具设计》完整版ppt课件全套教程
- 高中英语 选必B1 Unit2 Onwards and upwards 第4课时-Developing ideas 课件
- 重量法测定矿物质原始记录
- 自采商品管理流程
- 第2章 计算机中数的表示方法
- 有机化学 第十三章 有机含氮化合物
评论
0/150
提交评论