(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf_第1页
(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf_第2页
(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf_第3页
(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf_第4页
(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机软件与理论专业论文)基于复倒谱变换的数字音频水印研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着数字技术和因特网的发展,人们可以方便快捷地复制和传输 各种数字音频,其版权保护成为一个迫切需要解决的问题,数字音频 水印技术为这一问题提供了一个有效的解决手段。对复倒谱变换在数 字音频水印中的应用进行了研究,主要在以下几个方面取得了一些研 究成果: 提出了一种基于量化复倒谱变换的数字音频水印算法。它充分利 用了复倒谱变换的特征,结合定的量化方法嵌入水印,水印的提取 不需要原始音频信号,是一种盲水印算法;实验结果表明嵌入的水印 不仅具有很好的不可感知性,而且对于重采样、低通滤波、添加噪声、 重新量化、有损压缩等常见的音频攻击具有很好的稳健性。 提出了一种基于复倒谱变换的自适应音频水印算法,对音频载体 分段后结合人类听觉系统的掩蔽特性,实现了水印嵌入位置的自适应 确定;充分利用复倒谱变换的性质,在对应位置嵌入水印信号。水印 的提取不需要原始音频信号,是一种盲水印算法。实验结果表明,此 算法不仅具有很好的不可感知性,而且在重采样、低通滤波、添加噪 声、重新量化、有损压缩等常见的音频攻击后具有很好的稳健性,和 文献中基于小波和复倒谱变换的音频水印技术相比,提取水印的相关 系数有明显提高。 提出了一种基于复倒谱变换的自同步音频水印算法,在每段音频 中同时嵌入一个同步信号和水印数据。实验结果表明此算法提取同步 信号的效率很快,并对重采样、低通滤波、添加噪声、重新量化、有 损压缩等常见的音频攻击具有很好的稳健性。 关键词信息隐藏,数字音频水印,版权保护,相关系数,复倒谱 a b s t r a c t a l o n gw i t hd i g i t a lt e c h n i q u e sa n di n t e r n e t ,p e o p l e c a nc o p ya n d t r a n s m i ta l lk i n d so fd i g i t a la u d i om e d i a i ti sb e n e f i c i a lt oo u rd a i l yl i f e b u tb r i n g st ot h ep r o b l e mo fo w n e r s h i pp r o t e c t i o n a sas o l u t i o n ,d i g i t a l a u d i ow a t e r m a r k i n gi sa ne f f e c t i v em e t h o dt os o l v et h ep r o b l e m ad e e p r e s e a r c ho fd i g i t a la u d i ow a t e r m a r k i n gt e c h n o l o g yb a s e do nc o m p l e x c e p s t r u mt r a n s f o r mi sd o n ei nt h i sp a p e r t h em a i nr e s e a r c he f f o r t sa r ea s f o l l o w e d : an e wb li n dw a t e r m a r ka l g o r i t h mi nc e p s t r u md o m a i nb a s e do n q u a n t i z a t i o n i s p r o p o s e d ,w h i c hu s e s t h ec h a r a c t e r i s t i c so fc o m p l e x c e p s t r u mt r a n s f o r m ,a n d e m b e d sw a t e r m a r kb yq u a n t i z i n gm e a no f c o m p l e xc e p s t r u mc o e f f i c i e n t s t h ew a t e r m a r k sc a r lb ee x t r a c t e dw i t h o u t t h eo r i g i n a ld i g i t a la u d i os i g n a l t h ee x p e r i m e n t a lr e s u l ts h o w st h a tt h e e m b e d d e dw a t e r m a r ki s i m p e r c e p t i b i l i t ya n dr o b u s tt om a n yc o m m o n a t t a c k s ,s u c ha sn o i s ea d d i n g ,r e s a m p l i n g ,l o wp a s sf i l t e r i n g , r e - q u a n t i z a t i o na n dl o s s yc o m p r e s s i o na n ds oo n t h ep a p e ra l s op r o p o s e sa na d a p t i v ea u d i ow a t e r m a r ka l g o r i t h m b a s e do nc o m p l e xc e p s t r u mt r a n s f o i t i i w a t e r m a r ki se m b e d d e db y d i v i d i n go r i g i n a la u d i os i g n a li n t os e v e r a ls e g m e n t sa n du s i n gm a s k i n go f h u m a na u d i t o r ys y s t e m ( h a s ) a n dt h ec h a r a c t e r i s t i c so fc o m p l e x c e p s t r u mt r a n s f o r m t h ew a t e r m a r k c a nb ee m b e d d e da d a p t i v e l yi n t ot h e d i g i t a la u d i os i g n a l si nt h ew a t e r m a r k i n ga l g o r i t h m i ti sab l i n da l g o r i t h m a n dt h ee x t r a c t e dw a t e r m a r ki sw i t h o u tt h eo r i g i n a ld i g i t a la u d i os i g n a l t h ea l g o r i t h mi sn o to n l yi m p e r c e p t i b i l i t ya n dr o b u s tt om a n yc o m m o n a t t a c k s ,s u c h a sn o i s e a d d i n g ,r e s a m p l i n g ,l o wp a s sf i l t e r i n g , r e - q u a n t i z a t i o na n dl o s s yc o m p r e s s i o na n ds oo n c o m p a r e dw i t ha na u d i o d i g i t a lw a t e r m a r k i n ga l g o r i t h mb a s e do nw a v e l e tt r a n s f o r ma n dc e p s t r u m t r a n s f o r mi nt h er e f e r e n c e s ,t h ec o r r e l a t i o ni si m p r o v e ds i g n if i c a n t l y a na u d i ow a t e r m a r ka l g o r i t h mw i t hs e l f - s y n c h r o n i z a t i o nb a s e do n c o m p l e xc e p s t m md o m a i ni sp r o p o s e d ,w h i c hu s e st h ec h a r a c t e r i s t i c so f c o m p l e xc e p s t r u mt r a n s f o r m s y n c h r o n i z a t i o nc o d ei s e m b e d d e di n t o a u d i ow i t ht h ew a t e r m a r k e x t r a c te f f i c i e n c yo fs y n c h r o n o u ss i g n a la r e i m p r o v e ds i g n i f i c a n t l ya n de m b e d d e dw a t e r m a r ki sr o b u s tt os o m e c o m m o na t t c a c k s ,s u c ha sn o i s ea d d i n g ,r e s a m p l i n g ,l o wp a s sf i l t e r i n g , r e q u a n t i z a t i o na n dl o s s yc o m p r e s s i o na n ds oo n k e yw o r d si n f o r m a t i o n h i d i n g ,d i g i t a la u d i ow a t e r m a r k ,c o p y r i g h t p r o t e c t i o n ,c o r r e l a t i o n ,c o m p l e xc e p s t r u m i i i 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名: 埠 日期:砬年上月丛日 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 期:盟年l 月兰日 硕士学位论文第一章绪论 第一章绪论 随着对数字水印技术研究的深入与应用需求的增长,数字水印技术已经成为 多媒体信息安全领域中的一个研究热点。本文利用复倒谱变换作为工具对稳健数 字音频水印的几个关键技术做了深入的研究;本文的研究重点是基于复倒谱变换 的稳健性音频水印以及音频水印理论模型。在本章中,主要将回顾数字音频水印 的发展历史、应用领域及研究现状,并简单地介绍一下本文的主要工作及内容安 排。 1 1 课题研究背景 多媒体与网络技术的飞速发展,很大程度上方便了人们获取信息和交流信 息。如今人们也可以通过i n t e m e t 发布自己的作品、重要文件等内容,电子商务 则通过网络为人们提供了各种服务,但是随之也出现了很多严重问题,比如作品 侵权,恶意篡改数据。例如,数字多媒体产品的版权保护、软件产品的盗版、非 法拷贝数字文档、篡改各种数字信息等等。实际上,如果不能有效地解决对音像 制品与软件产品的盗版问题,这些问题最终将会损害生产商与消费者双方利益, 数字媒体产业与信息产业的发展也会遇到很大地障碍。因此,在充分利用i n t e m e t 便利条件的同时,又能有效地保护知识产权,已经受到人们的高度重视。 对于以上提出的这些安全问题,人们最开始是考虑利用加密方法等传统手段 来进行处理。但是传统的密码学方案存在着一定的缺陷,只能在某种程度上防止 数字化产品被非法使用。一方面,只能确保加密后的数据在传送过程不被篡改或 者窃取,一旦接收者将加密数据解密后,这种保护就不存在了;另一方面,因为 加密后的文件很难理解妨碍了数字化信息的传播。此外,在多个合法的接收者中, 如果某个泄密者将解密数据传给非法的使用者,我们也无法查到泄密者的下落。 因此,人们开始寻找新的解决办法。随着对这些问题的深入研究,一个属于数据 隐藏技术( d a t ah i d i n g ) 的范 【i 巧】数字水印技术( d i g i t a lw a t e r m a r k i n g ) 产生 了。 数字水印技术利用多媒体信息( 图像、视频、音频等) 中存在的冗余信息及人 类感知系统的特性,在不影响原内容的使用价值的前提下把额外的信息( 即水印) 隐藏到多媒体信息中。数字水印技术是- f - j 新兴的多学科交叉的应用技术,它的 研究涉及了图像、视频、音频的信号处理和通信理论、密码学、信号压缩、编码 理论和人类听觉视觉理论等多门学科,它为最终解决数字产品版权保护问题提供 硕士学位论文 第章绪论 了很好的方向。研究数字水印算法,一方面可以学习和跟踪国外的先进技术和研 究成果,另一方面也可以提高我国在知识产权保护方面的基础研究水准,完善我 国的知识产权保护体系,提高网络和通信的信息安全水平。因此,对数字水印算 法的研究,不仅具有现实的学术意义,而且具有长远的经济效益和社会效益。 1 2 国内外数字水印研究现状及水平 第一篇关于数据隐藏的文章发表- 于1 9 9 0 年f 6 】。s c n y n d e r 在1 9 9 4 年的国外图像 处理会议( i c i p ) 中明确提出数字水印的概念 7 1 。从此以后,数字水印技术引起了 各行各业的广泛关注,并且迅速成为图像处理和多媒体信息安全领域的研究热点 之一。在1 9 9 6 年,1 9 9 8 年和1 9 9 9 年,国外学术界分别召开了三届信息隐藏技术国 际研讨会,都把水印放在主要的议论话题。从1 9 9 9 年开始,国际光学工程师协会 和图像科学与技术协会每年都举办专门的“多媒体内容安全和水印讨论 会”( s e c u r i t ya n dw a t e r m a r k i n go f m u l t i m e d i ac o n t e n t s ) 。自2 0 0 2 年开始,每年举办 “国际数字水印讨论会”( i n t e r n a t i o n a lw o r k s h o po nd i g i t a lw a t e r m a r k i n g ,i w d w ) 。 此外几个有影响的国际会议( 女h i e e ei c i p 、i e e ei c a s s p 、a c mm u l t i m e d i a 等) 以及一些国际权威杂志( 女l j p r o c e e d i n g so f i e e e 、s i g n a lp r o c e s s i n g 、i e e ej o u r n a lo f s e l e c t e da r e a so nc o m m u n i c a t i o n 、c o m m u n i c a t i o n so fa c m 等1 相继出版了数字水 印的专辑。 除了理论研究以外,数字水印技术在实际应用方面也取得了巨大进展。许多 数字水印方面的专利已经被申请。目前,包括美国很多部门、研究所、实验室、 大学,也包括通信系统研究中心、麻省理工学院、剑桥大学、瑞士洛桑联邦工学 院,也包括i b m 公司w a t s o n 研究中心、微软公司剑桥研究院、朗讯公司贝尔实验 室、s o n y 公司、n e c 研究所以及荷兰菲利浦公司等【8 l 已经开始支持或开展数字水 印研究的机构。 我国对数字水印的研究比起步晚,这项技术最近几年才成为国内的研究热 点,但我国学术界的动作非常快。为了促进数字水印和信息隐藏领域的发展,我 国信息安全领域的何德全等院士与有关应用研究单位在1 9 9 9 年1 2 月联合发起召 开了我国第一届信息隐藏学术研讨会【9 j 。国家“8 6 3 ”智能机专家组和中科院自动 化所模式识别国家重点实验室在2 0 0 0 年1 月组织召开了数字水印学术研讨会 【1 0 1 ,来自国家各个部门与研究所、认证中心、很多大学的专家和学者对数字水 印的关键技术进行了深入探讨,汇报了各自的研究成果。从这次会议反应的情况 上看,我国相关学术领域的研究与世界水平相差不远,而且有自己独特的研究思 路。现在,已有大量的论文在国内外的杂志和会议上发表。2 0 0 1 年3 月,国防 科大首次将整数d c t 变换运用到数字水印技术上,其多维整数d c t 算法运算效 2 硕士学位论文第一章绪论 率高于目前的有效算法,并且采用h a s h 函数对图像的变换系数位置进行加密, 水印图像信息嵌入到i n t d c t 系数的中低频部分,极大的提高的安全性。2 0 0 3 年9 月,北京邮电大学推出了“数字水印应用系统”该系统利用小波理论和离散变 换设计新型水印算法。 数字水印技术还只是- f q 新兴的学科,总体上还处在一个发展初级阶段,在 这个阶段,研究者们的主要任务是研究设计更多,更有效的数字水印算法,为本 学科的发展积累尽可能多的有关技术经验,尽可能多的接受多媒体产业日新月异 发展需求的各种考验,从而促使数字水印技术向质变发展。 1 3 数字水印技术的分类 从不同的角度划分,数字水印主要有以下几种划分方法:按特性划分、按水 印所附载的媒体划分、按检测过程划分、按内容划分和按水印隐藏的位置划分, 下面将详细介绍这几种划分方法【1 1 1 。 ( 1 ) 按特性 从水印的特性上来讲,数字水印主要可以分为稳健( 鲁棒) 数字水印和脆弱数 字水印两种,前者主要应用于在数字作品中标记相关的著作信息,以便在必要的 时候能够检测出嵌入的水印,从而保护数字作品的权益。因此要求嵌入的水印在 经过一些常见如添加噪声等编辑处理后,仍然能够提取出来;后者主要强调对信 号改动的敏感性,能够检测水印的微小变化,根据脆弱水印的状态判断数字作品 是否被篡改过。 ( 2 ) 按检测过程 从水印检测过程来划分,有明文水印和盲水印两种,明文水印检测需要有原 始数据,稳健性比较强,但存储成本较高;盲水印虽然稳健性低于明文水印,但 检测过程不需要原始数据,存储成本低,较为实用。本文的数字水印都是盲水印。 ( 3 ) 按内容 从嵌入的水印内容来划分,可以分为有意义水印和无意义水印两种,如果嵌 入的水印本身是一个图片,或者是一段数字音频片段,则称之为有意义水印,本 文嵌入的水印是一个有信息学院字样的图片,因此属于有意义水印;如果水印只 是一个序列号,则称之为无意义水印。有意义水印可以根据视觉观察确定是否存 在水印,而无意义水印则只能通过统计决策来判断。 ( 4 ) 按水印隐藏的位置 从数字水印的隐藏位置来划分,大体可以分为时域数字水印、频域数字水印、 时频域数字水印和时间尺度域数字水印几种,直接在信号空间上加入水印信息 的为时域数字水印,在d c t 变换域的为频域数字水印,时频变换域和小波变换 硕士学位论文 第一章绪论 域上隐藏水印的分别称为时频域数字水印和时间尺度域数字水印。而实际上只 要构成一种信号变换,就可能在变换空间上隐藏水印,因此往往不局限于上述四 种,本文提到的方法就是在倒谱域中隐藏水印信息,第五章中提到的自同步音频 水印算法中,同步信号隐藏在时域,水印信息隐藏在倒谱域中。 ( 5 ) 按应用范围 按照应用范围可以分为图像水印、音频水印、视频水印、文本水印以及用于 三维网格模型的网格水印等,本文的研究对象是音频水印。 1 4 数字音频水印框架 一个完整的数字音频水印方案一般包括三个方面:水印的生成、水印的嵌入 和水印的提取或检测i l2 1 。数字水印技术实际上是通过对水印信息进行分析、对 嵌入水印信息的预处理、选择水印信息的嵌入位置、设计嵌入方法、控制嵌入调 制等几个相关技术环节进行合理组合并进行优化,来寻找满足不可感知性、安全 可靠性、稳健性等很多条件约束下的最优化设计问题。 如何创建一个好的水印嵌入算法是数字水印技术中的一个非常关键的部分。 水印的嵌入过程可以分为两部分:确定水印嵌入的位置和水印嵌入的方法。 设原始音频信号和嵌入水印的信号分别用,和l 表示,原始水印用形表示, k 为密钥集合。其中,密钥是缺省项,可以是公有的,也可以是私有的,用于水 印信息的再生。则水印的生成过程可以表示为: l = e ( i ,w ,k )公式( 1 1 ) 其具体实现如下: 图i 1 音频水印的嵌入算法框架图 水印的检测方法可以分为两类:一类是盲检测算法,另一类是非盲检测算法。 前者在检测时不需要原始数据,与原始水印,或者在检测时需要原始数据,或 原始水印w 作为参考才能提取出水印。设水印检测操作为d ,瓦为受到攻击后 的音频,则水印的盲检测过程可表示为图1 2 : 4 硕士学位论文第一章绪论 图1 2 音频水印的提取算法框架图 由图1 2 可以定义水印检测过程的通用公式为 ( 1 ) 有原始数据时:旷= d ( 瓦,i ,k ) ( 2 ) 有原始水印形时:w 一= d ( l ,w ,k ) ( 3 ) 9 6 原始信息时:矿= d ( 瓦,k ) 其中,矿表示待评估水印,d 为水印检测算法,瓦表示在传输过程中受到 攻击后的音频数据。检测水印的手段可以分为两种:一是在有原始音频信息的情 况下,一定要对嵌入水印信息做全搜索或分布假设检验等。如果信号为伪随机信 号或者是二值图像,检测水印信号的方法一般来说就是做相似度检验,求相关系 数( n c ) 。 1 5 数字音频水印技术的应用 数字水印技术的发展具有非常重要的意义,主要体现在两个方面:一个是它 的商业价值,另一个是它的学术价值。 ( 1 ) 商业价值:数字水印技术具有很大的商业价值,不仅仅体现在很多商业 领域,而且还体现在它有着广泛的商业前景。目前已经建立了许多数字水印应用 系统,包括d v d 防盗版系统、广告确认服务系统所有者鉴别系统、带内传信系 统、用于交互式电视的水印系统等。同时它还有很多存在的商业应用,例如:交 易的跟踪、所有权的证明、拷贝控制、认证、信息传输、多媒体压缩等。 ( 2 ) 学术价值:能否会给基础研究和应用研究引入新的有趣的问题是评价一 种新的技术是否具有学术价值的标准。数字水印技术是一门交叉学科,它吸引了 许多专家的眼球,这些专家大多来自通信、密码学、图像处理等领域。数字水印 技术的特殊要求能给这些领域引入了许多有趣的新的问题,因此数字水印技术具 硕士学位论文 第一章绪论 有很大的学术价值。例如,从通信角度来看,给数字水印建立模型,那么对水印 的任何攻击都可以当成噪声对待,这就给通信领域提出了如何在这种特殊情况下 增强水印信号抗噪能力的问题。 从现实应用上看,数字水印的主要应用领域有【1 3 j :版权保护、防护拷贝控 制、多播系统监视、保密通信、篡改提示、多语言电影系统和电影分级控制、注 释水印、印刷及票据防伪、完整性保护等。 由此可见,数字水印技术具有非常重要的应用意义和实用价值,与人们的 生活的很多方面相关。目前数字水印技术正处于一个快速发展和持续发展的时 期,应用领域也在迅速扩展。现在已经有很多类型的水印,比如最开始的图像水 印、音频水印,发展到现在的软件水印、视频水印、文字水印。算法研究也随之 扩展,最开始只是一些算法研究,现在已经应用到行业领域( 如数字地图的版权 保护、版权保护、数字图书的证件防伪、多媒体数据的检索、电子公文防篡改等) 。 因此可见,在很多应用领域中,数字水印技术都起到了十分重要的版权保护作用 伴随着网络和计算机的进一步发展,数字水印技术在将来的数字化产品的发展中 将变得越来越重要。 1 6 论文结构 本文主要针对音频这种载体,对数字音频水印技术进行了研究,文章的主要 结构安排如下: 第一章,介绍本文的课题背景,当前发展状况,并对数字音频水印的定义和 应用进行介绍; 第二章,介绍数字音频水印技术的基本原理及一些关键性技术,并针对当前 存在的音频水印算法进行了研究,提出了音频水印技术存在的一些问题及其发展 方向; 第三章,对倒谱变换技术进行了较为深入的阐述,分析了在水印技术中采用 倒谱变换的优越性,并介绍了使用倒谱技术的一些基本的水印算法。提出了一种 基于量化倒谱变换的音频水印算法,算法利用了复倒谱变换的特性,将系数均值 按照一定的量化方法嵌入水印,水印的提取不需要原始音频信号,是一种盲水印 算法,在此基础上,针对当前的大多数数字音频水印算法不具有自适应和自同步 的特性,分别提出了一种自适应和自同步的水印算法,其中自适应水印算法对音 频载体分段后结合人类听觉系统,充分利用复倒谱变换的性质,在对应位置嵌入 水印信号;自同步水印算法在每段音频中同时嵌入一个同步信号和水印数据,应 用一定的纠错编码技术,增强水印的安全性; 第四章,对第三章提出的三种算法分别进行了不可感知性和实验分析,经过 6 硕士学位论文第一章绪论 一些实验数据验证,说明三种算法嵌入水印后都具有很好的不可感知性,并对于 一般常见的攻击,如重量化、低通滤波、高斯白噪声、重量化、有损压缩攻击都 具有较好的稳健性,其中提出的第三个算法可以抵抗剪切攻击; 第五章,对整个论文工作进行了总结,并对数字音频水印技术进行了展望。 7 硕士学位论文 第二章数字音频水印技术 第二章数字音频水印技术 人类进入数字化时代以后,数字化音像制品和音乐制品的大量使用使得如何 解决音频数据的版权保护成为研究的热点问题。而通过在音频载体中嵌入数字水 印信息,来实现使用跟踪、盗用确认、拷贝限制等功能是解决这一问题的一个可 行而有效的途径。近年来有关音频水印方面的研究工作发展的非常迅速,尤其在 变换域的嵌入音频信息方面,因为能把信息嵌入到音频载体的敏感区域,所以对 其进行研究更具有实用价值。本章对音频水印技术的一些基础理论知识进行简要 的介绍。 2 1 声音和听觉 将数据信息嵌入到音频文件中的各种方法都要利用人类听觉系统的某些特 性人的听觉生理特性【1 4 , 1 5 】。 第一,人的听觉具有掩蔽效应。掩蔽效应是指存在一个较弱的声音信号却可 以听到的声音信号,因为存在另一个较强的声音信号的出现而变得无法听到的这 种现象。掩蔽的效果依赖于掩蔽音和被掩蔽音的时域和频域特性。 ( 1 ) 频域掩蔽 频域掩蔽是指在频域发生的掩蔽现象。若在一定频率范围内,同时存在两个 音频信号,这两个音频信号能量相差一定程度,并且一强二弱,弱的声音不容易 被人耳察觉,即被强音“掩蔽”掉,则较强的音称为掩蔽音,弱音称为被掩蔽音。 ( 2 ) 时域掩蔽 时域掩蔽包括向前掩蔽、向后掩蔽和同时掩蔽。 向前掩蔽:在出现比较强的掩蔽音之前,无法听到较弱的被掩蔽音; 向后掩蔽:在较强的掩蔽音消失后,无法听到较弱的被掩蔽音; 同时掩蔽:在一定时间内,一个比较强的声音对另一个比较弱的声音发生 了掩蔽效应。 一般来说,向前掩蔽发生在强信号消失之前5 - 2 0 m s ,向后掩蔽发生在强信 号消失后5 f f - - 2 0 0 m s 。 总体来说,频域掩蔽和时域掩蔽效应有自己的特性,也有自己的局限性,频 率掩蔽效应局限于频率域,时域掩蔽效应则局限于时间域。 第二,人的听觉系统对声音信号的绝对相位不敏感,对相对相位敏感。 第三,人的听觉系统对不同频率段的声音的敏感度不相同,通常2 0 h z - 8 硕士学位论文第二章数字音频水印技术 2 0 k h z 范围内的信号都可以被人耳听见,但人耳对2 0 h z , - 一6 k h z 范围内的信号最 敏感,幅度很低的信号也能被听见,而在低频率区和高频率区,可以被人耳听见 的声音信号幅度要高的多。即使面对相同声压级的声音,人耳能实际感觉到的音 量也是随频率而变化的。 2 2 声音信号数字化 声音是携带信息的非常重要的媒体,其中幅度和频率是声音信号的两个基本 参数,幅度指的是声波的振幅,单位分i f l , ( d b ) :频率指的是声波每秒变化的次数, 单位赫兹( h z ) 。频率小于2 0 h z 的声音信号称为亚间信号或次间信号;频率范围 在2 0 h z - - , ,2 0 k h z 的信号称为音频信号,也是人们能够听到的声音的频率范围:频 率高于2 0 k h z 的信号称为超声波,超声波和次声波人们都是无法听到的【1 6 1 。 声音信号是连续信号,具体体现在时间上和幅度上都是连续的,在一个指定 的时间范围里,声音信号的幅值有无穷多个,幅度的数值也有无穷多个,因此声 音信号是一种模拟信号,计算机要对它进行处理,就必须将模拟信号转换为二进 制数字的编码,也就是数字信号,对声音信号进行数字化,声音数字化的两个关 键步骤就是采样和量化。 采样( s a m p l i n g ) 是在某些特定的时间对模拟信号进行测量。通过采样来实现 连续时间的离散化l 】。文章中用的音频文件都是均匀采样,均匀采样是指在相等 的时间内采样一次。连续幅度的离散化通过量化来实现,所谓量化就是把信号的 轻度进行分段。包含两种量化方式,一种是线性量化,一种是非线性量化。前者 幅度的划分是等间隔的,或者幅度的划分是非等间隔的。采样的精度用位( b i t ) 来 表示,通常有6 位、1 6 位、2 4 位,w i n d o w s 下音频格式( w a v ) 和音频交换文件 格式( a i f f ) 都采用1 6 b i t 线性量化,位数越高意味着声音的质量越好,但也意味 着要求占有的存储空间越大。 目前,大多数音频的流行采样频率包括以下几个:8 k h z 、9 6 k h z 、10 k h z 、 1 2 k h z 、1 6 k h z 、2 2 0 5 k h z 和4 4 1 k h z 。数据隐藏量直接受采样频率影响,这是 因为采样率给出了可用频率的上限( 如果信号的采样频率为8 k h z ,则引入的修改 分量的频率不会超过4 k h z ) 。对于当前已经存在的大多数字水印技术来说,可用 的数据空间与采样频率的增长至少呈线性关系。 2 3 对音频水印的要求 如果要把数据信息成功的隐藏在数字音频信号中,由于音频数据载体和人耳 听觉系统本身的特性,除了满足数字音频水印框架( 如图1 1 和图1 2 ) 的基本要求 外,还应该满足以下几个方面的要求: 9 硕士学位论文 第二章数字音频水印技术 ( 1 ) 稳健性。也就意味着嵌入的水印应该能经受得住各种有意或无意的攻击。 这些主要的攻击包括添加白噪声、音频压缩、低通滤波、重采样、几何变换、统 计攻击等。 ( 2 ) 是否是盲提取。依据设计不同的数据嵌入和提取方案,有些方案可以不需 要借助于原始音频数据进行信息提取,而有些方案需要借助与原始音频数据才能 提取出水印,所以这个要求将影响方案的用途和性能,目前尽量使方案满足盲提 取。 ( 3 ) 不可感知性。数字水印必须满足把一定量的隐蔽信息嵌入到对象中去。为 了使人不易感觉到这种嵌入信息,需要合理选择嵌入方法。 ( 4 ) 嵌入数据量指标。根据用途的不同,在有些应用场合中须保证一定的嵌入 数据量。 ( 5 ) 提取误码率。音频水印方案中的一个重要指标是提取误码率低。由于一方 面存在来自物理空间的某些干扰,另一方面信道中传输的信号会发生某种衰减和 畸变,还有一些人为的因素,比如人们进行攻击。 2 4 现有的音频水印算法 典型的音频水印嵌入方法分为时域音频水印算法和变换域音频水印算法。时 域算法主要是在时域中通过修改音频采样值的最低有效位,轻微的改变音频信号 幅度的方法,在信号中嵌入一个随机序列。变换域首先对音频信号的采样数据进 行适当的变换( 即可以全局进行也可以分段进行) ,然后将水印信息嵌入到变换域 选定的系数上,最后通过相应的反变换重构出含有水印信息的媒体信号。前者方 法比较简单,但稳健性比较差,后者算法复杂,但稳健性很好,安全性高,可以 嵌入的信息量大,因此以后研究的方向主要集中在变换域的方法。 2 4 1 时域音频数字水印算法 ( 1 ) 最不重要位( l s b ) 方法 1 9 9 8 年b a s i a 等提出了在时域中通过修改数字音频信号数据的最低比特位, 轻微改变音频信号幅度的方法,在音频信号中嵌入水印。最低比特位( l s b ) 方法 是将秘密数据嵌入到载体数据中一种最为简单的方法。 参考文献【1 9 】提出了通过在时域中修改音频信号采样数据最低有效位值来 嵌入水印信号,是一种盲水印算法,也就是说在提取水印的过程中不需要原始音 频信号。该方法优点是实现简单,可以隐藏比较多的信息,水印嵌入和提取算法 简单,速度快。缺点是它对信道干扰及数据操作攻击的抵抗力很差。如果不采用 冗余技术,则水印信息很容易被噪声、重采样等攻击破坏。实际上,这种技术只 l o 硕士学位论文 第二章数字音频水印技术 是在封闭的、点对点的环境中才有用。 ( 2 ) 基于回声的水印方法 基于回声的水印算法利用了人类听觉系统的时域掩蔽特性:音频信号在时域 的向后掩蔽作用,也就是说弱信号可以在强信号消失之后5 0 - 2 0 0 m s 的作用而不 被人耳察觉。对于人耳来说,载体数据就像是从耳机里听到的声音,没有回声, 而经过回声隐藏的隐秘数据就像是从扬声器里听到的声音,由所处空间的诸如墙 壁、家具的物体产生回声。与其他方法不同,回声隐藏方法不是将秘密数据当作 随机噪声嵌入到载体数据中,而是作为载体数据的环境条件,因此对一些有损压 缩的算法具有一定的稳健性。文献【2 0 】通过在时间域向音频信号厂( f ) 上引入作为 水印的回声信号c e f ( t 一,) 来隐藏信息:通过使用不同的延时出来代表不同的信 息。缺点是对于信道噪声、人为篡改都会降低水印的正确提取率,为了改善这个 缺点,使回声内核的参数衰减率随着音频信号的噪声级别变化而变化,当音频信 号较为安静时,则降低衰减率;当音频信号较为嘈杂时,适当地增大衰减率。为 补偿信道噪声,可使用冗余和纠错编码的方法,但是这样就降低了嵌入数据量。 所以在实际操作中,必须在嵌入量及稳健性之间取折衷。 ( 3 ) 扩频方法 在编码音频数据流时,在尽可能多的频谱中把秘密数据分散,以达到隐藏数 据的目的。基于直接序列的扩频水印算法,抗噪声干扰能力强,容易实现盲检测, 但含水印的音频信号与水印随机信号之间必须达到完全同步。另外,为得到较小 的水印错误提取率,水印长度必须足够大,但这样会增加检测复杂度并增大延时。 b o n e y 等人1 2 i j 提出了另一种适用于音频水印的扩频方法。他们结合了h a s 的长期或短期掩蔽效应,利用了一个伪随机序列,并且对该序列进行若干级的滤 波。为了结合h a s 的长期掩蔽效应,计算出每个5 1 2 点采样的重叠块的掩蔽阈 值,并近似地采用一个1 0 阶的全极点滤波器,对伪随机序列进行滤波。结合短 期掩蔽效应,对滤波后的伪随机序列做加权处理,这样在音频信号能量低的地方 可削弱水印。另外,水印还要经过低通滤波,来保证水印可抵抗音频压缩攻击。 嵌入水印的高频部分,可使水印更好地从未经压缩的音频片段中检测出来,但压 缩过程会将它去除掉。实验结果显示了该方法对m p 3 音频编码、粗糙的p c m 量 化和附加噪声有一定的稳健性。 2 4 2 变换域音频数字水印算法 变换域水印技术通过修改变换域系数来隐藏水印。常用变换域方法有d f t 、 d c t 、d w t ,还有其它一些变换方法。 ( 1 ) 傅立叶变换域( d f t ) 方法 硕士学位论文第二章数字音频水印技术 d f t 方法对某一段信号频域系数的修改被扩散到该段所有的时域采样点。 而且,如果水印的频域嵌入只影响频域系数的幅度,提取水印时可以不要求水印 信号的精确同步。因为段起始位置的偏差会引起频域系数的相位发生变化,对幅 度影响不大,所以只要提取时的一段信号与嵌入时的一段信号绝大部分重合就可 以正确恢复出水印信号。将水印隐藏在低频部分有较好的稳健性;将水印隐藏在 高频部分则有更好的隐蔽性。因为人的视觉和听觉对低频更敏感,而压缩和低通 滤波会损伤更多的高频部分。t i l k j f i 等1 冽在一个交互式电视系统的开发中,提出 了一种将信息隐藏进电视伴音的方法。在2 4 k h z 到6 4 k h z 范围内的中频带傅立 叶变换系数被数字签名所代替,选择中频带是为了使数据保持在最敏感的低频范 围之外。数字签名信号相对于音频信号具有较低的幅度,且只植入到具有高能量 值的分量中,以进一步保证其不可听到。 ( 2 ) 离散余弦变换( d c t ) 方法 w a n g 2 3 】提出了在时域中对信号进行序列变换,在频域中嵌入水印的方法。 这种方法首先根据伪随机序列重新排列音频采样信号,然后对序列进行修正离散 余弦变换( m o d i f i e dd i s e r e t ec o s i n et r a n s f o r m - - - m d c t ) ,通过对m d c t 的系数进 行修改来嵌入水印,最后再进行逆变换得到嵌入水印后的音频序列。使用伪随机 序列对信号进行排列有两个优点:一是提高算法的安全性,二是可以平滑功率谱 密度。w o n g y u mk i m 等1 2 4 1 在在d c t 的基础上,嵌入同步信号,这种方法可以 定位水印的位置,并增强对同步攻击的稳健性。而且对于添加噪声、滤波等攻击 具有一定的稳健性。 ( 3 ) 小波变换域( d w t ) 方法 由于小波变换具有多分辨率、时频局部化、计算复杂度低等优点,并且 j p e g 2 0 0 0 与m p e g 4 中都采用了小波变换作为算法框架的基础,因此小波域数 字音频水印算法日益受到重视。在参考文献1 2 5 1 ,作者提出了一种基于小波变 换的水印隐藏和检测算法,把高斯白噪声作为水印信号嵌入到原始音频信号小波 变换域。用这种算法隐藏水印具有很好的隐蔽性,且能抵抗多种强干扰和常见的 信号处理操作。 ( 4 ) 倒谱域( c c t ) 水印方法 近两年研究者提出了将信息隐藏到信号倒谱域的水印算法,这些算法主要利 用了信号倒谱变换系数的不相关性,且倒谱能量主要集中在零点附近等性质。 研究表明,在声音信号中,大的倒谱系数是最容易感知的,因而要保证不可 感知性一般都将其舍去不用,仅仅修改较小的倒谱系数【2 6 j 。 ( 5 ) 相位水印方法 用相位编码( p h a s ec o d i n g ) 嵌入水印的方法是性能较好的方法之一【2 7 1 。利用 硕士学位论文第二章数字音频水印技术 人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印数据 的参考相位替换原始音频段的绝对相位,并对其他的音频段进行调整,以保持各 段之间的相对相位不变。 这种方法适合于稳健性水印,对载体信号的重采样有较强的稳健性,但对绝 大多数的音频压缩算法敏感,当代表水印数据的参考相位急剧变化时,会出现明 显的相位偏差。 2 5 音频水印的攻击及性能评价标准 2 5 1 音频的攻击与对策 归纳起来,主要可以分为普通攻击、同步攻击和安全性攻击三大类【2 8 。3 2 1 ,对 音频水印进行攻击有可能是有意的破坏,也可能是无意的破坏。 1 普通攻击 一般来说,普通攻击主要包括噪声攻击和常见的音频信号攻击,它不会明显 造成音频样本在时域上发生变化。噪声污染是信号传输过程中常见的干扰,包括 加性和乘性噪声,其中最常见的是高斯白噪声。常见的音频处理操作有m p 3 压 缩、重量化、滤波、音量增减、重量化等等。目前存在的很多算法都能够很好地 抵抗这类攻击。 2 同步攻击 目前很少有算法能够抵抗这些攻击,当发生这类攻击时,提取水印的效果都 不是很好。这类攻击主要通过破坏水印的同步性来影响水印的提取。对比普通攻 击,存在信号处理或者是一些恶意攻击操作会导致水印音频的样本在时域上发生 明显的错位。这种攻击类型主要包括以下几种: ( 1 ) 普通剪切( c r o p p i n g ) - 在对音频进行处理的过程中,一些工作者和技术人 员经常对音频信号进行大段的裁剪和拼接操作。 ( 2 ) 时间域缩放t s m ( t i m es c a l i n gm o d i f i c a t i o n ) 攻击:改变音频信号时间尺 度,但保持音调不变的攻击方法称为t s m 攻击。这种攻击方法是一种有效的攻击 手段,在正常的音频处理中是常见的操作。比如把一段长为1 1 s 的音乐,通过样 本之问的线性插值拉伸成1 2 s 后,从听觉上很难感觉不同,但却能使现有的大多 数算法不能检测出水印。 ( 3 ) 重采样( r e s a m p l i n g ) :重采样有上采样和下采样两种方式。目前的音频有 很多的采样率,为了迎合不同的硬件播放条件,或者将不同采样率的音频组合成 为同一个音频,都需要变换采样频率。例如,将一段采样率2 2 0 5 0 h z 的音频转 化成采样率为4 4 1 0 0 h z 的音频。在知道原始音频采样率的条件下,可以通过插 值恢复后再进行提取水印。因为转化的比率是固定的,所以音频样本之间的偏移 硕士学位论文 第二章数字音频水印技术 也不是很频繁。 o ) d a a d 变换f 3 3 3 5 j :携带音频的物质决定了音频信号是模拟信号还是数字 信号,就象计算机上的音频信号从声卡中输出,然后录制到磁带中,就必须经过 d a 转换过程,反之就需要经过a ,d 转换过程。 ( 5 ) 抖动攻击( j i t e r i n g ) :其运算代价很小,在时域上,每隔一百或几百个样本 点随机增加或剪切一个样本,对原始音频的质量几乎没有什么影响,但却可以使 绝大多数基于扩频技术的水印检测器失效。它主要用于对数字音频水印系统的攻 击。 3 安全性攻击 这一类攻击是很难防范的,如何抵抗这些攻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论