




已阅读5页,还剩48页未读, 继续免费阅读
(计算机应用技术专业论文)音频数字水印技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着网络和多媒体技术的广泛应用,音频数字水印技术已成为近年来的研究 热点之一,该技术通过向音频文件中嵌入秘密信息以达到版权保护、掩蔽通信等 目的。 本文介绍了数字水印的一些相关知识,描述了小波变换的基本理论,分析了 现有的一些音频数字水印技术的工作原理。在此基础上,提出了两种基于d w t 变 换域的音频数字水印技术。一种方法通过置乱技术,提高了水印的保密性:采片j b c h 编码重复嵌入,降低了水印提取的误码率:将水印嵌入到d w t 的细节分量 系数上,保证了水印的不可见性;使用量化原理嵌入水印,在提取水印时不需要 原始信号的参与,提高了算法的适用 生。仿真实验证明该算法能够有效抵御各种 常见攻击,具有很强的鲁棒性。 另一种方法提出了利用音频文件的重要特征来构造水印信息,而不是将水印 信息嵌入其中来修改这些特征。因为现有的音频数字水印技术,无论是时域还是 频域算法,大都是通过修改原始信号来达到嵌入秘密信息的目的,虽然利用了人 类的听觉模型系统,但仍不同稷度地改变了信号的感知质量。实验证明本文方法 不改变原始信号感知质量,算法简单,计算量小,曾棒往强,可实现盲检测。 最后,对本文进行了总结,对音频数字水印的发展趋势作了展望。 关键词:音频数字水印小波变换盲水印零水印 a b s t r a c t w i t ht h ed e v e l o p m e n to fi n t e r n e ta n dd i g i t a lm u l t i m e d i at e c l m o l o g y ,a u d i od i g i t a l w a t e r m a r k i n g h a sb e c o m eo n e o ft h er e s e a r c h h o t s p o t s i nr e c e n t y e a r s s e c r e t i n f o r m a t i o nc a nb ee m b e di n t oa u d i of i l e sw i t ht h e s et e c h n i q u e s ,s oa st oa c h i e v e 1 c o p y r i g h tp r o t e c t i o n a n d c o v e rc o m n m n i c a t i o n e t c ,a tf i r s t ,t h i sp a p e rd e s c r i b e ds o m e r e l a t e dk n o w l e d g ea b o u td i g i t a lw a t e r m a r k i n ga n dw a v e l e ta n a bs i sa n dt h e nf o c u s e d 0 1 1t h ep r i n c i p l e so ft h o s et e c h n i q u e s a c c o r d i n gt ot h et h e o r yp r e s e n t e da b o 、7 e i v , o k i n d so fa u d i od i g i t a lh a t e n n a r k i n gm e t h o db a s e dd w t “i e r ep r o p o s e d o n eo f h i c h r e p e a t e d l ye m b e d sw a t e r m a r k si nt h eq u a n t i z e dc o e f f i c i e n t so fd w tb yb c hc o d i n gi n o r d e rt ol o w e rt h ee r r o rr a t eo fd e t e c t i o n a n da n o t h e re m b e d sw a t e r m a r k si n t oo r i g i n a l s i g n a l sw i t h o u tm o d i f y i n g t h ea u d i od a t a e x p e r i m e n t ss h o wt h a tt h ec a p a b i l i t yo f t h e s e t w om e t h o d st or e s i s ta l lk i n d so fc o m m o na t t a c k si s e x c e l l e n t t h e y h a v e g o o d r o b u s t n e s sa n dt h eu a t e r m a r k sc a nb ee x t r a c t e dw i t h o u tt h eo r i g i n a ld a t a a tl a s t a c o n c l u s i o no ft h i s p a p e r i s g i v e n ,a n d a p r o s p e c t f o rt h ef u t u r eo fa u d i o d i g i t a l w a t e r m a r k i n gi sa l s op r e s e n t e d k e y w o r d s :a u d i od i g i t a lw a t e r m a r k i n g ;d i s c r e t e 、a 、r e l e tt r a n s f o r m ( d w t ) ; b l i n dw a t e r m a r k i n g ;z e r o w a t e r m a r k i n g 2 笙二! 堕堡 一一 第一章绪论 数字水印按术是目前信息安全技术领域的一个新方向,是一种可以在门:放的 网络环境下保护版权和认证来源及完整性的新型技术。本章主要介绍了数字水印 的研究背景、数字水印的基本特征及其应用领域,列举了本文的主要研究工作, 最后给f :| 了全文的内容安排。 1 1 数字水印问题由来 多媒体信息的数字化与传输技术的进步,尤其是因特隅技术的姒 亍,带来了 数字媒体应用的迅速增长。数字媒体有着模拟媒体不可比拟的优点:数字信号很 容易编辑:可以快速、无失真地复制;数字声音、文本、图像和视频易于通过例 络或物理系统低价高效地迅速传输和分配等,这些优点为电子图书馆、存线服务 和电子商业等先进的多媒体服务提供了广阔的发展前景。但随之而柬的剐作用则 是利用网络传输数掘文件或作品时,使有恶意的个人或团体自i j 能矗:没囱得到作 品所有者的许可下拷贝和传播有版权的数字产品。数字作品的版权所有行的合2 : 权益受到严重侵犯的同时,数字产品的合法用户很难证明自己对作品的所有权, 殳无法确认伪造和篡改的程度,凼此也就无法使硝法律武器保护自己的权菇。如 果这种现象得不到控制,那么,以数字化为特征的信息革命就会受到严重威胁, 甚至走向失败。因此更好地保护图像、文本、声音和视频等数字媒体的知t j 产权 就变得十分迫切了。 目前许多先进数字技术已被用于版权保护。例如密码技术,包括密钥加密 系统( 如r s a 系统) 。但这并不是解决问题的最好途径。首先。经过加密后的信 息,对那些没有密钥的人来说,具有不可理解性,从而限制了信息的传播范围; 其次。媒体信息经过加密后容易引起攻击者的好奇和注意,并有可能被破泽,一 旦加密文件被解密,就无任何安全性可言。数字水印技术就是在这种背景下应运 而生的。关于该技术的论述首见于t i r k e l 等人在1 9 9 3 的一篇文章。这篇文章首 先提出了电子水印( e l e c t r o n i c w a t e r m a r k ) 的说法,他们随后发表厂另篇题为“a d i g i t a lw a t e r m a r k 的文章l “,诈式提出了“数字水印”0 牝硪, :应用于图像 数7 ,水印。l t 后,研宄人掘将数字水印的概念j 】j 悖,j f ,音和视频等其他数字媒体。 数字水日? 的小在j 限制i : 钎鲥数掘的扶j ,孙j1 0 觅分利用人类听觉和视觉系 统的冗余,在数字产d i p 嵌入”,感知或不可感知的f 青息,束确定数字产品的版权 归属。由于对保护知识产权、个人隐私的不断增长的需求,以及受到使用密码加 密技术的限制这两方面的原因,数字水印技术已成为国际上学术研究及技术应用 界关注的热点, 占师! 数j 水印拙术州究 实际上,在数字水印技术之前,人们已经在关注数据隐藏和标记之类的技术。 但早期的研究重点在数据隐减上,因为当时预想的应用还没有涉及信号失真或有 意的破坏柬删除隐臧的数据等问题,所以没有考虑版权标记的鲁棒性,隐减的数 据根容易被删除,而水印算法的设计特别着重考虑鲁棒性及如何反篡改问题。 1 2 数字水印基本特征 数字水印是以可感知或不i j 感知的形式嵌入到数字多媒体产品- 1 的、用1 i 产 权保护、内容检验或提取其他信息的信号。数字水印处理技术是水印生成、嵌入、 提取和检测等过程的统称。侄数字水印系统中,隐城信息的丢失意朱管版权信息 的丢失,从而失去了版权保护的功能,那么这系统就是失9 l ! ( 的。因此数字水印 技术必须具有较强的稳健性、安全性和透明性等特点1 3 引: 1 不可感知性( 1 m p e r c e p t i b i l i t y ) 。也称透明性,是7 “f j “:l 成的水印应兰 在感觉j 二 f :可感知。对于图像来波,就是不可见,刈于音频来说,就是不能被听到,以免 影响媒体质量。同时水印应当在统计上不可感知,即攻击者难于用统计力_ f 占发现 和删除水印。 2 鲁棒性( r o b u s t n e s s ) 。也称稳健性,是指生成的水印应当具有经受各种常用 的信号处理、压缩和解压及抗攻击的能力,任何企图移动和破坏水印的操作挪将 导致媒体质量的严重破坏。 需要指出的是,鲁捧性只是用于版权保护的水印,而对于以保护数掘完整性 为目的的数字水印来l 兑,脆弱性则是其最重要的特征。 3 确定性。是指恢复出的水印或水印判决的结果应该能够确定地表明所有权, 不会发生多重所有权的纠纷。 4 计算有效性。是指水印处理算法应该比较容易用软硬件实现。尤其是水印 检测算法必须足够快以满足在产品发行网络上对多媒体数据的管理。 水印的这些特性其实是和水印所受到的攻击或信号处理紧密相联的,因为数 字水印技术本身就是种对抗性的研究领域,音频水印的特性也和它所受到的攻 击或信号处理密不可分,常见的信号处理虽然不是一种攻击,但是它也会破坏水 印信息。所以,种成熟的水印算法必须能抵抗常见的信号处理。下面列举通常 的攻击手段和信号处理方法: 1 加入噪声。包括加入高斯白噪声或者有色噪声。 2 滤波。滤波操作在声音处理中使用非常频繁。例如,增强某特定频率元 素t 或降低某一频率的元素。通常用的m p 3 播放器w i n m a p 中带有的均衡器本质 就是滤波。 3 时域重采样。这是一种比较有效的攻击手段。 第一幸绪论 3 4 多拷贝攻击。对同一个音乐作品的多个发行版本进行数值平均,利用水印 的随机性去除水印。 5 多重水印攻击。攻击者使用自己的算法在声音数据中添加水印,即使这种 操作不能破坏真f 的水印,也会造成水印标识的困难。 1 3 数字水印系统模型 水印的基本原理是嵌入某些标识数据到载体数据中作为水印,使得水印在载 体数据中不可感知并足够安全。 从信号处理的角度看,嵌入掩体对象的水印信号可以视为在强背景下迭加一 个弱信号,只要迭加的水印信号强度低于人视觉系统( h v s ) 对比度门限或听觉 系统( h a s ) 对声音的感知门限,h v s 或h a s 就无法感知到信号的存在。出于 h v s 和h a s 受空间、时i 白j 和频率特性的影响,因此,通过对掩体对象作一定的调 整,就有可能在不引起人感知的情况下嵌入些信息。 从数字通信的角度看,水印嵌入可理解为在一个宽带信道( 掩体对象) 上用 扩频通信技术传输一个窄带信号( 水印) 。尽管水印信号具有一定的能量,但分前, 到信道中任一频率上的能量是难以检测到的。水印的译码( 检测) 则是一个有噪 信道中弱信号的检测问题1 引。 水印可由多种模型构成,如随机数字序列、数字标识、文本以及图像等。从 鲁棒性和安全性考虑,常常需要对水印进行随机化和加密处理。 设,为原始信息,矽为水印信号,k 为密码,那么处理后的水印形出函数,定 义如下: 渺= f ( z ,k ) ( 1 1 ) 如果水印所有者不希望;k e p 被其他人知道,那么函数f 应该满足非可逆、单 向、非对称性。为此,应将水印算法原理设计成非对称的,或者和加密算法相结 合,如经典的d e s 算法等。二者的目的都是为了提高水印的安全性和通用性。 在水印的嵌入过程( 图1 1 ) 中,设有嵌入函数e ,原始信息1 和水印形那 么嵌入水印后的载体信息,。可表示如下: ,。= e ( ,) 其中由式( 1 一1 ) 定义。 水印提取是水印算法中很重要的步骤。 ( 1 2 ) 若将这一过程定义为提取函数d ,那 么输出的可以是一个判定水印存在与否的o - 1 决策( 图1 2 ) ,也可以是包含各种信 息的数据流,如文本、图像等( 图1 3 ) 。如果已知原始载体信息,和嵌入水印后的 载体信息0 ,则有: 啬频数7 水印技术研究 或 = d u ,) 叫,呲耻怯罴, 其中为提取出的水印,k 为密码,c 函数用于相关检测,占为决策闽值。 原始信息 r f 水 印 j 原始信息 ( 卜一3 ) 其中,图1 2 、1 3 中虚线框部分表示在提取或判断水印信号时原始信息不是 必需的。 在完整性确认应用中,必须能够精确地提取出嵌入的水印,并且通过水印的 完整性来确认多媒体数据的完整性。如果提取出的水印发生了部分的变化,最好 还能够通过水印发生变化的位置来确定原始数据被篡改的位景。 笙二皇竺笙二 对于强壮水印,它主要用于版权保护,因而很可能遭受到各种恶意攻击。嵌 入水印的数据历经这些操作后,提取出的水印通常已经面目全非t 这时就需要一 个水印检测过程,见图t 2 。通常水印检测的第一步是水印提取,然后是水印判决。 水印判决的般做法是相关性检测,即选择一个相关性判决标准,计算提取出的 水印与原始水印的相关值。如果高于判决标准,则可以基本断定被检测数据含有 指定的水印。 1 4 数字水印分类 数字水印的分类方法有很多种。分类的出发点不同导致了分类的不同,它们 之间既有联系又有区别。撮常用的分类方法包括以下几类t 6 , 7 1 : 1 按水印可见性划分 可分为可见水印( v i s i b l ew a t e r m a r k i n g ) 平g 不可见水f 0 ( 1 n v i s i b l ew a t e r m a r k i n g ) 。 可见水印是可以看见的水印,就像插入或覆盖在图像上的标识,它与可视的纸张 中的水印相似,可以理解为通常意义上的图像融合。可见水印主要用于图像。不 可见水印是一种应用更加广泛的水印,它在图像、音频或视频当中,是不可察觉 的,但当发生版权纠纷时所有者可以从中提取标记。从而证明该物品为某人所 有。本文只涉及不可见水印的研究。 2 按水印特性划分 可分为易损水印( f r a g i l ew a t e r m a r k i n g ) 羊t l 鲁棒水e p ( r o b u s tw a t e r m a r k i n g ) 。易损 水印很容易被破坏,主要用于完整性验证的应用之中,它随对象的修改而破坏, 哪怕细小的修改也会影响数字水印的提取和检测。鲁棒水印则应该经得起一般处 理操作而存留下来,其应用范围更加广泛。主要用于版权保护,是水印研究的重 点。 3 按水印隐躐位置划分 可分为时( 空) 域水印和频域水印。前者直接将水印信息嵌入到媒体信号的 时域或空间域选定的采样数据中;而后者首先对媒体信号的采样数据进行适当的 变换( 既可以全局迸行也可以分段进行) ,然后将水印信息嵌入到变换域选定的系 数上,最后通过相应的反变换恢复出含有水印信息的媒体信号。一般来说频域算 法可嵌入水印数据量大,透明性好,安全性离,但算法复杂度也高。 4 按水印检测过程划分 可分为非盲水印( n o b l i n dw a t e r m a r k i n g ) 和盲水e 1 1 ( b l i n dw a t e r m a r k i n g ) 。在提取 或检测水印的过程中,如果需要原始数据来提取水印信号,称为非盲水印算法; 如果不需要原始数据参与。可直接根据加水印后的数据提取出水印信号,则称为 盲水印算法一般来说,非盲水印比盲水印更安全但盲水印更符合所有权验证 6青频数水印技术州究 的需要,是水印算法发展的方向。 5 ,从水印来源上划分 可分为独立于媒体的水印和媒体自适应水印。独立于媒体的水印可以是事先 给定的,也可以是随机产生的;而媒体自适应水印是利用媒体的特性生成的水印。 6 从水印的公开性上划分 可分为私有水印( p r i v a l ew a t e r m a r k i n g ) 和公开水e l l ( p u b l i cw a t e r m a r k i n g ) 。私有 水印只能被特定密钥持有人读取或检测,而公开水印可以被公众提取或检测。通 常束说,公开水印的安全性和强壮性不如私有水印高,但公丌水印在声明版权信 息和预防侵权行为上无疑具有优势,是水印发展的方向之一。 7 从密钥的对称性上划分 可分为对称( s y m m e t r i c a lw a t e r m a r k i n g ) 水印算法和非对称水印f a s y m m e t r i c w a t e r m a r k i n g ) 算法p 】。前者水印嵌入与水印提取或检测过程所使用的密钥相同,后 者水印嵌入与水印提取或检测过程所使用的密钥不同。 8 按水印载体类型划分 可分为图像水印、音频水印、视频水印、文本水印以及用于三维网络模型的 网格水印等。随着数字技术的不断发展,还会有更多种类的数字媒体出现,同时 也会产生相应载体的水印技术。 1 5 数字水印应用领域 数字水印虽然只是近几年力出现,但其应用前景和应用领域1 3 5 1 将是巨大的, 总的来说,数字水印技术有以下一些主要应用领域 8 】。 1 版权保护 数字作品的所有者用密钥产生一个水印,并将其嵌入原始数据,然后公丌发 布他的水印版本作品当该作品被盗版或出现版权纠纷时所有者可利用从盗版 作品或水印作品中获取的水印信号作为依据,从而保护所有者的权益。这要求水 印必须有较好的稳健性、安全性、透明性和嵌入不可逆性。 2 图像认证 认证的目的是检测对图像数据的修改程度,可用易损水印来实现图像认证。 为便于工作检测,易损水印对某些变换( 如压缩) ,具有较低的稳健性,面对其它 变换的稳健性更低因而在所有的数字水印应用中,认证水印具有最低级别的稳 健性要求。 3 标题与注释 将作品的标题、注释等内容以水印形式嵌入该作品中。例如,一幅照片或乐 曲的制作时间和地点等。这种隐式注释不需要额外的带宽,且不易丢失。 6 笙二皇堕兰一一j 4 篡改提示 当数字作品被用于法庭、医学、新闻及商业时,常需要确定它们的内容是否 被修改、伪造或特殊处理过。为实现该目的通常将原始图像分成多个独立块,每 个块加入不同的水印。为确定其完整性,可通过检测每个数据块中的水印信号, 确定作品的完整性。与其它水印不同的是。这类水印必须是脆弱的,并且检测水 印信号时,不需要原始数据。 5 使用控制 在多媒体发行体系中,发行商希望存在种不允许未授权的媒体拷贝的机制。 一个典型的例子是d v d 防拷贝系统。1 9 9 6 年,美国电影协会( m p a a ) 、消费电 子产品制造商协会( c e m a ) 和部分计算机厂商联合成立了国际版权保护技术工作 组( c p t w g ) 来研究防止数字视频盗版。在过去几年。该协会已研制成功了d v d 防拷贝系统。1 9 9 7 年夏天,c p t w g 专门成立了数据隐藏子工作组( d h s g ) 柬评 价当前的水印技术应用于防拷贝系统的先进性和可靠性。按照d h s g 的约定,将 有两类应用水印技术的模块加入到d v d 防拷贝系统中,分别是记录控制和回放控 制。它利用水印的稳健性将拷贝管理系统( c g m s ) 数据保护起来,保证拷贝控制 比特不会被轻易除去,从而有效防止因消除有关数据而引起的非法拷贝。引入回 放控制则在于,如果盗版者成功地生成了不合内容加扰系统( c s s ) 密钥信息的非 法d v d 拷贝,出于水印仍存在于这一拷贝中,符合标准的播放机将会读出受水印 保护的拷贝控制信息并根据盘片本身的特点作出拒绝回放的判断。现今世界各大 知名公司如i b m 、n e c 、s o n y 、p h i l i p s 等,都在加速数字水印技术的研制和完 善。一个典型例子是,由索尼和菲利浦公司提出的s c m s ( s e r i a l c o p ym a n a g e m e n t s y s t e m ) 就是在磁带上加上一个布尔型标签。来控制使用者复制的次数,使用者只 能复制一次,不能多次复制,从而用这种方法来实现防止批量拷贝】。 1 6 本文工作 本课题的主要工作是研究音频信号中的数字水印技术通过对已有算法进行 分析比较,提出了自己的数字水印算法,进行了仿真实验。主要工作报告如下: 1 介绍了数字水印的相关知识和小波分析的基础理论。 2 研究分析了现有音频数字水印技术的工作原理和特点。 3 提出了一种基于d w t 的音频盲水印技术,进行了仿真,指出了要进一步 研究的内容。算法优点:使用置乱技术,提高了水印的保密性;采用b c h 编码重 复嵌入,降低了水印提取的误码率;将水印嵌入到d w t 细节分量系数上,保证了 水印的透明性;应用量化原理嵌入水印,实现了盲检测,提高了算法的适用性。 4 提出了一种基于d w t 的音频零水印技术,进行了仿真,给出了要进一步 音频数,水日j 技术州究 完善的方向。算法优点:利用音频文件重要特征构造而不是修改嵌入水印,不会 改变原始信号质量。因为现有音频数字水印技术,大都是通过修改原始信号以达 到嵌入水印的目的,虽然利用了人类听觉特性,但仍不同程度地改变了信号的感 知质量,并且运算复杂,计算量大。 5 展望了数字水印技术的发展趋势。 文章结构安排如下: 第一章主要介绍了数字水印的基础知识,包括数字水印背景、基本特征、系 统模型以及分类和应用领域。 第二章主要介绍了与音频水印技术密切相关的人类听觉特性。分析比较了现 有音频水印技术的工作原理和特点。 第三章主要介绍了在数字水印技术中应用非常广泛的小波分析理论及其特 点。 第四章提出了种基于d w t 的盲水印技术,给出了仿真实验和结果分析。 第五章提出了种基于d w t 的零水印技术,给出了仿真实验和结果分析。 第六章对全文工作进行了总结,对数字水印技术的发展趋势进行了展望。 塑兰兰鲞竺堕堑竺丝塑童塑坐型型壅些鲨 2 第二章人类的听觉特性及音频水印技术 随着i n t e r n e t 的蓬勃发展和r a p 3 技术的广泛使用,音乐制品的版权保护问题变 得异常重要。据“国际唱片业联合会( i e p i ) 认为,由于非法拷贝、盗版和免费音 乐网站,2 0 0 0 年美国的单曲唱片销售下降幅度为4 0 ,全球下降幅度为1 4 。因 此,音频水印的研究是一个迫在眉睫的问题。近年来,有关音频数字水印技术的 研究工作发展很快,尤其是在变换域音频信息的水印嵌入技术,由于其能将信息 嵌入到载体的敏感区域,使得研究更具有实用性。 2 1 人类听觉特性 在音频文件中嵌入数掘的各种方法都要利用人类听觉系统的某些特性,即人 的听觉生理心理特性。使用这些特性是为了满足水印的不可感知性( 听觉 相似性) 的要求。 首先,人的听觉具有掩蔽效应。掩蔽效应是指个较弱但可以听到的声音由 于另外一个较强的声音的出现丽变得无法听到的现象。掩蔽的效果依赖于掩蔽音 和被掩蔽音的时域和频域特性。因而掩蔽可分为频域掩蔽和时域掩蔽。 频域掩蔽指在频域发生的掩蔽现象。如果在一定频率范围内。同时存在能量 相差一定程度的一强一弱二个音频信号,弱音不被人耳察觉。即被强音“掩蔽” 掉,则较强的音称为掩蔽音,弱音称为被掩蔽音。把一个纯音调作为目标,如果 它的声压级低于绝对闽值( 安静时的昕阈值) ,是昕不见的。由于一个较强信号的 存在。听觉闽值不同于安静时的阈值在接近较强信号频率的频率处,听觉阕值 被提高,新阈值称为掩蔽阈值,当新的声压级低于掩蔽阈值时,它被掩蔽。一个 掩蔽音的掩蔽阈值依赖于频率、声压级,以及掩蔽和被掩蔽信号的纯音或噪音特 性。用一个宽带的噪音掩蔽一个纯音比用一个纯音掩蔽个宽带的噪音要容易。 而且,信号频率愈高就愈易被掩蔽。 时域掩蔽包括向前掩蔽和向后掩蔽。向前掩蔽是指较强的掩蔽音出现之前较 弱的被掩蔽音无法听到,向后掩蔽是指较强的掩蔽音消失后较弱的被掩蔽音无法 听到。一般,向前掩蔽发生在掩蔽音出现前5 2 0 m s ,向后掩蔽发生在掩蔽音消失 后5 0 2 0 0 m s 。 频域和时域掩蔽效应有各自的特性及局限,频率掩蔽效应局限在频率域而时 域掩蔽效应则局限在时间域。 其次,人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。 第三,人耳对不同频率段声音的敏感程度不同。通常人耳可以听见 2 0 h z 1 8 k h z 的信号,但对2 k h z - 4 k h z 范围内的信号最为敏感,幅度很低的信号 上 童塑夔兰查型垫苎! ! 篁一一 也能被听见,而在低频区和高频区,能被人耳听见的信号幅度要高的多。即使对 同样声压级的声音,入耳实际感觉到的音量也是随频率而变化的。 2 2 声音信号数字化 声音是携带信息的极其重要的媒体。声音的种类繁多,如人类的话音、乐器 发出的声音、机器产生的声音以及自然界中存在的各种声音。这些声音既有许多 共同特征,又有各自的特性。从物理学的角度看,声音是通过空气传播的一种连 续的波,叫声波,声音的强弱体现在声波压力的大小上,音调的高低体现在声音 的频率上。对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类 信号称为复合信号。而单一频率的信号称为分量信号。声音信号的一个重要参数 就是带宽,它用来描述组成复合信号的频率范围,如高保真声音的频率范围为1 0 h z 一2 0 0 0 0 h z ,它的带宽约为2 0 k h z ,而视频信号的带宽是6 m h z 。 声音信号的两个基本参数是频率和幅度。人们把频率献几h z 到2 0 h z 的声音 信号称为亚间信号或次间信号:频率范围为2 0 h z 一2 0 k h z 的信号称为音频信号;高 于2 0 k h z 的信号通常称为超音频信号或超声波信号。一般说来,入的听觉器官能 感知的声音频率大约在2 0 2 0 0 0 0 h z 之间即人们只能听到前面所介绍的音频信号, 超声波和次生波都昕不到。人类在这个频率范围内可感知的声音幅度大约在 o 一1 2 0 d b 之问【”1 。 入的发音器官发出的声音频率大约是8 0 h z 3 4 0 0 h z ,但人说话的信号频率通常 为3 0 0 3 0 0 0 h z ,人们把在这种频率范围的信号称为话音信号,或者叫语音信号。 关于语音信号的编码、识别、分析、合成有一门单独的学科研究。语音信号虽然 与音频信号本质上相同,但它们各有特点,不可混淆。本文所研究的声音信号特 指音频信号。 声音是典型的连续信号,不仅在时间上是连续的而且在幅度上也是连续的。 在时削上连续是指在一个指定的肘间范围里声音信号的幅值有无穷多个,在靖值 上连续是指幅度的数值有无穷多个。这种时间和幅值都连续的信号称为模拟信号。 计算机是无法对模拟信号进行处理的,计算机只能处理时间上和幅度上都有限的 信号,也就是数字信号。要对声音信号进行计算机处理,就必须对声音信号进行 数字化,数字化实际上就是采样和置化。 连续时间的离散化通过采样来实现【3 6 】。在某些特定的时刻对模拟信号进行测 量叫做采样( s a m p l i n g ) 。每隔相等的时间采样一次,这种采样称为均匀采样,本文 使用的音频文件都是均匀采样。连续幅度的离散化通过量化柬实现,即把信号的 强度分段,如果幅度的划分是等间隔的,就称为线性量化,否则为非线性量化。 采样的精度样本的大小使用声音样本的位数( b i t s ) 表示它反映度量声音波型 1 0 笙= 里叁耋竺堕箜垫竺塑童燮型型兰坚鳖茎 幅度的精度,通常有6 位、1 6 位、2 4 位。w i n d o w s 可视音频格式( w a v ) 和音频交 换文件格式( a i f f ) 都采用1 6 b i t 线性量化。样本位数的大小影响到声音的质量,位 数越多声音质量越好,需要的存储空划也越多;反之,声音质量越低,需要的存 储空问越少。 一般音频的流行采样频率包括8 k h z 、9 6 k h z 、1 0 k h z 、1 2 k h z 、1 6 k h z 、 2 2 0 5 k h z 和4 4 1 k h z 。采样频率影n 向数据隐藏量,因为它给出了可用频谱的上瞅 ( 如果信号的采样频率为8 k h z ,则引入的修改分量的频率不会超过4 k h z ) a 刈j : 大多数已有的数字水印技术而言,可用的数掘空间与采样频率的增长至少基线性 关系。 在因特网上和各种机器上运行的声音文件格式很多,目前比较流行的,f | 以w a y ( w a v e f o r m ) 、a u ( a u d i o ) 、a i i f ( a u d i oi n t e r c h a n g e a b l ef i l ef o r n l a t ) 、s n d ( s o u n d ) 为扩展的文件格式。w a y 格式主要用在p c 机上,a u 主要用在u n i x 工作站- l :,a i f l 和s n d 主要用在节果机和s g i 工作站上。另外,现在广泛流行于网上的有m p 3 格 式。它是m p e g 1 标准的第三层,由于m p 3 本身是熵编码,无法直接得到声音 矗 号的原始幅度值,也就无法直接做信号处理。本文所 j 的声音文件格j l = - 卉f j 址 w i n d o w s 系统采用的波形声音文件存储格式,w a v 的文件格,义有不f q 的数抛编f f j 方式,其中最为常用的是p c m ( p u l s e c o d em o d u l a t i o n ) 格式,即脉冲编码调制。 本文所用声音格式即p c m 编码格式。 2 3 音频数字水印要求 要想成功地在数字音频媒体中隐减数据,须关注以下几方面的要求 3 ”: 1 对数据变换处理操作的稳健性 水印本身应能经受得住各种有意或无意的攻击。典型的攻击有添加噪声、数 据压缩、滤波、重采样、几何变换、统计攻击等等。 2 听觉相似性 数字水印是在掩体对象中嵌入一定数量的掩蔽信息,为使得第三方不易察觉 这种嵌入信息,需谨慎选择嵌入方法。使嵌入信息前后视觉或听觉上不产生可感 知的变化。 3 是否需要原始数据进行信息提取 根掘数据嵌入和提取方案的不同设计,有些方案可以不需要借助于原始数掘 进行信息提取,这一性能将影响方案的用途和性能。 4 数据提取误码率 数据提取误码率也是音频水印方案中的一个重要技术指标。因为一方面存在 来自物理空i e j 的干扰,另一方而在信道中传输的信号会发生褒减和畸变,再加上 上堂塑墼! 查型垫查翌! 壅 人为的数据变换和攻击,都会使数据提取误码率增加a 5 嵌入数据量指标 根据用途的不同在有些应用场合中须保证一定的嵌入数据量,如利用音频 载体进行隐蔽通信。 2 4 研究现状 对音频水印技术的研究最早见于1 9 9 6 年,b e n d e r 等在文献【1 3 】中提出了l s b 编码、回声编码、扩频编码和相位编码等四种算法;b o n e y 等将c o x 方案1 1 5 1 应 用到音频信号中,对算法进行了改进,这些算法都属于时空域算法。其后,又有 研究者提出了变换域算法。实验证明变换域算法的计算量虽然较时域算法犬,但 是变换域算法的稳健性强,抗干扰和抗恶意攻击的能力也较时域算法要好。 2 4 1 最不重要位方法 最不重要位方法( l s b l e s a ts i g n i f i c a n tb i t ) 是一种最简单的嵌入方法,任何形式 的水印都可以转换成串二进制码流,音频文件的每一个采样数据也是用二进制 数来表示。这样,可以将每一贪采样值的最不重要位( 多数情况下为最低位) ,用 代表水印的二进制位替换,以达到在音频信号中嵌入水印的目的。如果将音频信 号看作水印传输的信道,而水印看作在信道中传输的信号。理想情况下,这种信 道的容量为l k b p s 每l k h z 。即在无噪声信道中,对8 k h z 采样率的信号,比特率 是8 k b p ;对4 4 1 k h z 采样率的信号,比特率是4 4 1 k b p s 。伴随这种大信道容量的 是可闻噪声的引入,这种噪声的影响效果和音频信号的内容宜接相关。比如,如 果音频信号是体育比赛的现场直播,那么其中人群产生的噪声会掩蔽低比特编码 噪声;而如果音频信号是几乎没有背景噪声的音乐演奏,则低比特编码噪声就会 被昕到。 为了增强水印抗攻击的程度,可以使用一段伪随机序列来控制水印嵌入的位 置1 3 j 。伪随机信号可以由伪随机序列发生器来产生。当伪随机序列发生器的结构固 定时,不同的初始值会产生不同的伪随机序列。这样在收发双方只需要秘密地传 送一介初始值( 作为密钥) 而不需要传送整个伪随机序列值。只要保证含法用户 才能得到该密钥,则根据k e r c h o f f 法则可知水印系统是安全的。任何企图提取出 秘密数据的第三方在不知道密钥的情况下,不可能达到目的。 最不重要位方法本身简单易实现:音频信号里可编码的数据量大 采用不同 加密方式分别对数据本身和嵌入过程进行加密,其安全性完全依赖于密钥:水印 嵌入和提取算法简单,速度快。但是,这种方法的最大缺陷是对信号处理的稳健 性很差。如果水印嵌入时不采用冗余技术,信道干扰、数据压缩、滤波、重采样、 塑= 三皇茎些堕堑竺丝塑童塑查型业窒丝些坚 时域缩放等都可以破坏水印信息。采取冗余技术会使水印系统速率降低一至二个 数量级。在应用中,最不重要位方法只用于封闭的数字到数字的环境下。 为了提高稳健性,可将水印嵌入到音频信号的较高位。但这样带来的结果是 大大降低了数据隐藏的隐蔽性。为了改善这点,可以在嵌入过程中根据信号的 能量进行数据嵌入位的选择,这种方法对平均能量比较高的音频样本更有效。 2 4 2 扩展频谱方法 借鉴扩频通信的思想,可以把秘密数据分散在尽可能多的频率谱分量- 1 1 以达 到隐藏数据的目的。其优点是,即使某些频率存在二f 二扰,也不会影l 响数据的接收。 扩频通信方式有很多,常用的有直序扩频编码方法( d i r e c ts e q u e n c es p r e a d s p e c t r u me n c o d i n g ,d e s s ) 。d e s s 算法中采用伪随机噪声作密钥,理想伪随机噪 声是白噪声,它在频率范围罩有良好的频率响应。密钥用来把序列调整成扩频系 列。秘密数掘被载波和伪随机序列放大,数掘的频潴被扩敝到u j 能的波段之r 1 ,。 然后将扩展后的数据序列弱化,作为加性随机噪声叠加到音频文件r | j 类似j :加 上宽带噪声。提取方法是嵌入方法的逆操作1 1 3 1 。 另一种扩谱方法是直接将衰减的伪随机序列加到音频序列上,如果要嵌入多 比特,可以用不同的水印比特乘以伪随机序列加到音频序列的不同位置上。检测 提取时计算载体数据与伪随机序列的相关系数,如果载体数掘未经嵌入水印,相 关系数期望为0 当伪随机序列长度较大时,相关系数以概率1 取值在0 附近:而 如果载体数据是经过嵌入水印的相关系数与水印数据、嵌入强度有关,可以通 过相关系数恢复出水印。为了提高稳健性或隐蔽性,伪随机序列在迭加莳可以经过 低通或带通处理f 1 。 下面给出一个使用d s s s 方法的音频数字水印的例子,水印嵌入的步骤如下: l 、设水印序列为p ,其长度为上:p = p ,0 f qp , 一l ,+ 1 ) 2 、设切普( c h i p ) 速率为c r ,使用c r = c 对p 进行比特重复( 过采样) ,形成 调制信号:q = p ,其中( f 1 ) c + l 蔓k i x c 3 、设有一伪随机m 序列,将n l 序列的元素出 0 。1 映射为 + l ,1 ,得到新 的序列m = 珊。,0 女s 三c m 。 一1 ,+ l ,使用m 。对调制信号c 。扩频。生成扩频水 印信号:u = q ,其中o 女s l c 4 、设待嵌入水印的音频信号为s ,其长度为三一c :s = s 。,0 k l c ,利用 下式得到嵌入水印后的信号s :s = s :,0 k l c ) ,其中j := 乩+ 。 童塑墼兰查堡垫查婴壅一一一 水印检测的过程跟上述步骤相反。需要用到原始的音频信号s 、同样的i t i 序 列和切普速率c 。 2 4 3 相位编码方法 用相位编码( p h a s ec o d i n g ) 嵌入水印的方法是性能较好的方法之一1 1 3 1 j 。它充 分和用了人类听觉系统( t 4 a s ) 的特性,即人耳对声音的相对相位敏感,而对绝对相 位不敏感。基于这个特点,可以用水印信息调制声音信号的绝对相位,而相对相 位尽量保持不变。 相位编码的一个缺陷是:当水印信息的相位急剧变化时,会出现i j 月显的州位 离差( p h a s ed i s p e r s i o n ) ,影响水印信息的隐秘性。造成相位离差的一个原因是用水 印信息的相位代管原始相位带来了变形,另一个原因是对原始音频信号的相位改 动频率太快,因此必须尽量使转换平缓以减小相位离差带来的音频变形。为了使 得变换平缓,数据点之间必须留有一定的问距,但它的缺点是降低了信道容量。 另方面,为了增强抗干扰能力,应将水印相位之问的差异最大化,因此通常选 用“一2 ”代替0 ,用“吖2 ”代替l 。因此,必须在数据嵌入量和嵌入效果之阳j 进行折衷。 具体地说,先将声音信号分段,每段作k 点的d f t ,设第t 段的相位为 o ( ,) ,女= 1 , 2 ,k ,相对相位o ( ,) = o ( t + 1 ,) 一中( f ,) 。根据水印信号的值改 变第一段的绝对相位,例如将隐躐“0 ”的位簧的相位用“州2 ”代替、隐减“1 ” 的位置的相位用“一州2 ”代替。中保持不变,也就是说根掘修改过的初始相位 和相位差重新构建声音信号的相位,对修改后的频谱作i d f t 就得到含水印的信 号。 提取水印时,首先要获得含水印音频信号的同步信息、信号段的长度和d f t 变换点数。具体来说,分以下三步: 1 在已知发送方信号段长度的情况下,将接收到的音频信号分段。 2 提取出第段,对它作d f t ,计算相位值。 3 根据相应的阈值,对相位值进行检测,得到0 或1 值,构成水印序列。 2 4 4 回声法 回声法的基本思想是通过引入回声将水印信息隐藏到载体数据中 1 3 , 1 7 。它利 用了人类听觉系统的另一种特性:声音信号在时域的后掩蔽作用,即入耳对跟在 强信号之后的弱信号是不敏感的。声音信号引入了回声,相当于声音在真实空间 中受到墙壁、家具等物体的影响而产生多径传输的效果,足够小的多径延迟是人 1 4 笙三翌壅塑堕堂楚丝塑造塑查型鲨壅丝垫一上 耳察觉不到的。因此,回声隐藏不是将水印数据作为随机噪声嵌入到载体数据中- 而是作为载体数据的环境条件,所以对一些有损压缩具有一定的稳健性a 嵌入算法将载体数据按一定的衰减程度,延迟一定的时间迭加到原始载体数 据上以产生回声,可以用不同的延迟时间标志水印数掘的“0 ”和“1 ”。要想使水 印数据不被怀疑,并能以较高的正确率提取出来,关键在于选取回声内核的参数。 每一个回声内核有四个可调整的参数:原始幅值、衰减率、“l ”偏移量及“0 ”偏 移量。偏移量对数据隐簸的效果至关重要,须选在人耳可分辨的阈值之内。一般 情况下,延迟范围应取5 0 m s 2 0 0 m s ,大于2 0 0 m s 会影响水印的隐蔽性,小于5 0 m s 会增加水印提取的难度。如不考虑传输过程中信号的衰减及于扰,衰减率选在0 7 。 若考虑传输过程中信号的衰减及干扰,则衰减率一般要选在o 8 以上。多比特信息 的嵌入可以通过多次引入回声来实现,先将载体数据分段,然后按如上所述的方 法分别往各段嵌入数据最后将嵌入数据后的各段信号组合起束,如图2 1 。 图2 1 声编码水印嵌入流程圈 水印数据提取的关键在于回声蒯距的检测。可以应用倒谱分析的方法:将多 项乘积运算转换为和运算,频域的乘积等同于时域的卷积。先计算回声信号的倒 谱,再用倒谱将回声从原始信号中分离出来。因为倒谱每6 秒重复一次,且代表 回声的脉冲幅值与载体信号相关度很小,所以它们很难被检测。解决这个问题的 方法是利用倒谱的自相关。自相关给出了信号在每一延迟信号的能量,在坑或反处 会各出现一个能量尖峰。因此确定法则就是检测在两处的能量并选择能量更高的 一个,见图2 2 。 图2 2 同声编码水印提取流程圈 回声算法对一些有损算法具有一定的鲁棒性。它虽然得到了较好的透明性, 但并没有达到令人满意的误码率,而且信道噪声、人为篡改都会提高误码率。为 此,可以使用一些辅助技术。例如使回声内核
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统编版五年级语文下册期末专项复习(积累运用与课文理解)卷(含答案)
- 工业园区规划与环保设计
- 工业机器人市场现状及未来趋势
- 工业安全与设备维护培训
- 工业污染源的监测与防治技术探索
- 工业自动化中智能硬件的角色与影响
- 工业废热回收与利用技术
- 工业自动化中的数据安全与隐私保护
- 工业机器人操作与维护的实践技巧
- 工业级智能机房的设计与施工流程
- 保险学(第五版)习题库答案
- DB33-T 2329-2021农田面源污染控制氮磷生态拦截沟渠系统建设规范
- 2017高考理综全国卷及答案
- 脑肠轴与情绪行为课件
- 保洁常用工具和设备一览表
- 广告效果测评整本书课件完整版电子教案全套课件最全教学教程ppt(最新)
- 拉萨市基本养老保险参保人员登记表
- 《农药经营许可培训班》考试试卷
- DB32∕T 4170-2021 城市轨道交通车辆基地上盖综合利用防火设计标准
- 《湖北省中小学生命安全教育课程标准》
- (完整)初中物理电学中常见的列方程计算归类
评论
0/150
提交评论