




已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)基于离散小波变换的音频数字水印算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工程大学硕士学位论文 摘要 随着网络技术和多媒体技术的发展,数字水印技术成为数字产品版权保 护的行之有效的方法。音频水印技术是应用于音频领域的水印技术,该技术 通过向音频文件中嵌入秘密信息,以达到版权保护和掩蔽通信的目的。本文 针对音频文件的版权保护问题展开对音频水印的研究。 数字水印技术是近几年发展起来的一种知识产权的保护手段。随着全球 信息化程度的提高和电子商务逐渐走向实用,对知识产权保护的要求迫在眉 睫,数字水印技术正是在这种背景下提出的。数字音频水印是数字水印的一 类。针对数字音频水印的研究,国内外提出了各种各样的算法,但是关于音 频水印问题的研究较少。本文首先在原有的基于离散小波变换的加性水印算 法的基础上,提出了一种自适应的音频水印算法,可以自动调整水印的嵌入 量,从而使嵌入的水印更加隐蔽,算法的鲁棒性更好;其次,研究了音频水 印的盲检测问题,由于混沌系统具有良好的伪随机特性、轨道的不可预测性、 对初始状态及控制参数的敏感性等一系列特性,使其在密码学、通信学等方 面的应用成为研究的热点。本论文在引入混沌理论的基础上,对水印嵌入问 题和水印提取时的盲检测问题进行了新方法的探索。 关键词:数字音频水印:混沌序列;离散小波变换;模数运算;盲检测 哈尔滨工程大学硕士学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to fd i g i t a lm u l t i m e d i at e c h n o l o g y , d i g i t a lw a t e r m a r k h a sb 眦cap o p u l a rt o p i ci nt h ef i e l do fd i g i t a lc o p y r i g h tp r o t e c t i o n a u d i o d i g i t a lw a t e r m a r k i n gt e c h n i q u ei sa p p l i c a t i o no nt h ea u d i of i e l d 。喇t hs u c h t e c h n i q u ew ec a ne m b e ds e c r e di n f o r m a t i o ni n t oa u d i of i l e s , s o a st o g e t c o p y r i g h t 弘眦翻6 0 n - a n d s e c r e do m m u u l c a t i o n e t c t h i sp a p e rf o c u so nt h e a u d i od i g n a lw a t e r m a r k i n gt e c h n i q u ei no r d e rt op r o t e c ta u d i o 丘l c l sc o p y r i g h t 。 d i g i t a lw a t e r m a r kt e c h n o l o g y i sam e t h o do f k n o w l e d g e c o p y r i g h tp r o t e c t i o n i nr e c e n ty e a r w i t ht h ei n c r e m e n to ft h eg _ l o b a li n f o r m a t i z a t i o nd e g r e ea n dt h e u t i l i t yo f e c t h er e q u e s to f t h ek n o w l e d g ec o p y r i g h tp r o t e c t i o ni ss t a r eu si nt h e f a c e s ot h ed i g i t a lw a t e r m a r ki sp u tf o r w a r d d i g i t a la u d i ow a t e r m a r ki sas o r to f d i g i t a lw a t a m a f f k t h e r ea 砖al o to fa r i t h m e t i cb o l hh e r ea n db r o a da g a i n s tt h e i n v e s t i g a t i o no fd i g i t a la u d i ow a t e r m a r k i nt h i sp a p e r , f w s t , p u tf o r w a r dt h e s e l fa d a p t i n ga u d i od i g i t a lw a t e r m a r ka r i t h m e t i cu n d e rt h ea d d i t i v i t yw a t e r m a r k a r i t h m e t i cb a s i so fd w t i tm a k e st h ei n s e r tw a t e r m a r km o r es e c r e da n d a r i t h m e t i cr o b u s t n e s ss t r o n g e r s e c o n d , b e c a u s et h ec h a o ss y s t e mh a st h e s p e c i a l i t yo fb e t t e rf a k er a n d o m , p a t hc a n n o tf o r e c a s t , s e n s i t i v i t yo f i n i t i a ls t a t e a n dc o n t r o l l i n gp a r a m e t e r & i th a sb e e na b r o a da p p i i c a t e di n t oc r y p t o g r a p h ya n d c o m m u n i c a t i o n s i nt h i sp a p e r 9i n v e s t i g a t et h eb l i n dd e t e c t i o ni nt h ew a t e r m a r k i n s e r ta n dp i c ku pb a s i so nc h a o st h e o r y k e y w o r d s :d i g i t a la u d i o 刚l e i m 卸r l 【;c h a o sl i s t ;d w t ;m o d u l u so p e r a t i o n 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体已 经公开发表的作品成果。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签字) :立巡 日期:聊年 月吾口日 哈尔滨工程大学硕士学位论文 第1 章绪论 1 。1 研究的目的和意义 1 1 1 概述 随着信息时代的到来,特别是i n m e t 的普及,信息安全保护问题日益 突出。同时随着人们知识产权意识的不断增强,防盗版、维护版权问题也促 使人们追求更新更高的信息安全技术传统的信息安全技术均是以密码学理 论为基础,而这种技术已不能适应目前信息时代的要求。首先,无论采用传 统的密钥系统还是公钥系统,其保护方式都是控制文件的存取。但随着计算 机处理能力的快速提高,这种通过不断增加密钥长度来提高密级的办法越来 越不安全;另外,随着多媒体技术的发展,数字化和经过信息压缩的数字产 品越来越多,比如一些声像制品。这类声像数据实际上就是一些数字信号, 如果对这类数据也采用密码加密方式,则其本身的信号属性就会受损;另外, 这种加密方法无法防止声像数据在解密之后被非法拷贝。 1 1 2 水印技术的应用领域 最初提出数字水印的目的是为了保护数字作品的版权,然而随着数字水 印技术的发展,人们发现了它更多更广的应用,而且有一些是当初人们根本 没有预料到的。尽管信息隐藏技术起源于保密通信,但近几年来,由于互联 网技术、多媒体存储和传输技术的迅猛发展,数字水印技术及其应用已成为 信息隐藏技术研究的重点。目前数字水印技术的应用主要包括以下几个方面: 1 ) 版权保护 随着互联网和电子商务的迅猛发展,互联网上的多媒体产品数量急剧膨 胀,数字化多媒体产品可通过下载方式从网上直接购买。但是如何防止购买 者对其非法复制和传播,如何有效地保护这些数字产品的版权就成为一个非 常重要的问题,也是数字水印技术研究的主要动力。显然,这种应用应对常 见的数据处理和攻击具有很高的鲁棒性。此外,还需要考虑其它一些要求, 比如水印必须明确没有歧义,并且在其他人嵌入另外的水印以后,仍然能够 判断出正确的产品所有权。 哈尔滨工程大学硕士学位论文 2 ) 非法复制追踪 数字水印还可用于监视和追踪数字产品的非法复制,这种应用通常称作 。指纹”,如同每个人都有不同的指纹一样,它也很类似于软件产品的序列 号,即在每个发行的拷贝中嵌入不同的水印。因为单个加入水印的拷贝会遭 受“共谋攻击”,即破解者会利用不同的攻击手段攻击同一件作品,从攻击 的结果推断水印的嵌入方式和水印包含的信息,所以嵌入的水印必须被设计 成共谋安全的。在一些应用场合,例如,在因特网上用特定的网络搜索器搜 索盗版图像,。指纹”的提取必须要简单快捷。 3 ) 防止非法复制 要有效地保护版权就应采取有效的技术手段,使非授权者不能对数字产 品进行非法拷贝。一种方法就是在数字产品中嵌入反映拷贝状态的水印。例 如,可把这种水印嵌入d v d 中,一个应用例子是d v d 系统,拷贝信息以嵌入水 印的形式包含在数据中。具有防拷贝功能的d v d 播放器不允许播放和拷贝含有 类似禁止拷贝水印信息的数据。对含有允许拷贝一次水印的数据只能拷贝一 次而不能多次拷贝。 4 ) 图像认证 、 认证的目的是检测对数据的修改。常用的图像认证要求,若检测出的水 印出现降质或水印不存在,即可说明伪造。所以图像认证可以用“脆弱性水 印”来实现,便于嵌入和检测。脆弱性水印对某些交换,如压缩,具有较低 的鲁棒性,而对其他变换的鲁棒性更低。因而在所有的数字水印应用中,认 证水印具有最低级别的鲁棒性要求 5 ) 电子商务中的网页保护和票据防伪 , 近几年来,各种各样的网站如雨后春笋般不断涌现,随之而来的网页内 容的篡改和非法盗用问题也日益突出。在网页中加入合适的水印也许将成为 保护网页、防止非法篡改和盗用的一种有效手段。随着高质量复制设备的出 现和电子商务的兴起,票据防伪技术也在不断发展。显然,电子商务中各种 电子票据的有效防伪是十分重要的。电子票据的水印技术将在今后得到更多 的研究“1 2 哈尔滨工程大学硕士学位论文 1 1 3 论文选题的背景和意义 、 随着i n t e r n e t 和信息技术的发展,越来越多的数字多媒体信息通过网络 进行传播,与传统的模拟媒体相比,数字媒体的编辑、复制和传播都很方便, 它一方面促进了社会的进步与发展,另一方面正是这些优点突出了版权问题。 由于数字多媒体信息很容易被未经授权的用户复制,且采用传统密码方法并 不能完全解决这一问题。数字水印技术正是一种应运而生的信息隐藏技术, 它通过特定的水印算法把版权信息嵌入在数字产品中,教嵌入的可以是一段 文字、标识、序列号等等,人们无法从表面上感知水印的存在,只有专用的 检测仪器或计算机软件才可以检测出隐藏的数字水印,从而达到了保护数字 作品的所有者利益的目的,并促进了数字产品的开发与使用。 在数字产品中,音频数字产品的版权保护也显得越来越重要,因为随着 数字化音像制品和音乐制品的大量制作与发行,一个令人关注的突出问题是 网上下载音乐对传统c d 业的巨大冲击。网上公司提供压缩、转换和播放软件, 使公众得以廉价或免费获得大量高质量音乐节目。这就迫使工业界、学术界 联手寻求保护知识产权的有效方案,在合法产品中嵌入水印,以达到阻止在 非法装置上播放及控制复制的目的。 1 2 国内外研究现状 数字水印技术是目前信息安全技术领域的一个崭新的方向是一种可以 在开放的信息环境下保护版权和认证来源及完整性的新型技术由于它是一 种应用于开放信息环境中的多媒体数字产品的隐蔽技术,为解决版权保护、 来源认证、篡改认证、网上发行、用户跟踪等一系列问题提供了一个全新的 技术方案,因而在数字产品的知识产权保护、隐蔽标识、篡改提示、隐蔽通 信和防伪等方面具有十分广闼的应用前景。目前国际上已支持或开展数字水 印技术研究的机构既有政府部门,也有大学与知名企业,他们包括美国空军 研究院、德国国家信息技术中心、日本n t t 信息与通信系统研究中心、麻省理 工学院、贝尔实验室、荷兰菲利普公司等等。并且有些公司已经推出了数字 水印的软件,如d i g i m a r cc o r p o r a t i o n 等等” 早期的数字水印算法研究主要是集中在空间域,水印信息直接加载在图 像数据上,这种方法的特点是抵抗图像的几何变形、噪声和图像压缩的能力 3 哈尔滨工程大学硕士学位论文 较差。但空间域算法的计算速度快,隐藏的信息量大。近期的研究主要集中 在变换域( 如离散傅立叶交换d f t ,离散余弦变换d c t ,离散小波变换d 霄t ) 中实 现。在变换域中嵌入水印,信号能量可以扩展到空间域所有像素上,有利于 保证水印的不可见性,同时变换域的方法可以与现有的数据压缩标准兼容, 例如,基于d c r 的方法可以与j p e g 压缩方法兼容,基于d w t 的方法可以与 j p e g 2 0 0 0 兼容等等。从目前的情况看,大多数的研究工作更关注变换域算法 研究。 学术界对音频水印的研究也正在深入,最早的音频水印技术研究始于一 1 9 9 6 年,b e n d e r 等“1 提出了l s b 编码、回声编码、扩频编码和相位编码等四种 算法,b o n e y 等嘲将c o x 方案应用到音频信号中,取得了很好的实验结果。其 后,又有研究者对上述几种算法进行了改进与完善,但现有技术距真正有效 保护知识产权的目标仍有距离。音频水印技术存在的一个问题是嵌入信息量 明显低于图像水印所能达到的水平,另外由于h a s ( 人类听觉系统模型) 远比 l a w s ( 人类视觉系统模型) 灵敏,在音频信号中嵌入微弱水印就有可能被感知。 因此如何更充分地利用h a s 就成了改善水印隐蔽性与稳健性,增大嵌入强度和 提高检测效率的一个关键,这也是目前音频水印技术研究的主要问题。 i 3 论文的安排 数字水印技术的研究特点在于它横跨图像信息处理、多媒体技术、模式 识别、密码学,数字通讯等多个领域。与密码学类似,数字水印也是一个对 抗性的研究领域。正因为有水印攻击的存在,才有水印研究的不断深入。另 外为了实现数字水印的标准化,必须对各种水印算法进行安全性测试。水印 测试者既要熟悉水印算法也要熟悉水印攻击算法,而且还要从水印算法的理 论入手进行水印信息量和鲁棒性的定量分析。围绕这一目的,论文的第一章 主要介绍研究的目的和意义以及国内外的研究现状。第二章主要介绍数字水 印的基本特征、原理,归纳数字水印系统的基本框架,概括性地介绍了目前 常见的数字水印算法重点研究音频数字水印技术,介绍人类听觉特性,音 频数字水印的原理及要求,对音频水印技术进行回顾与分类总结,对比、分 析现有的音频水印算法与技术,建立音频数字水印技术相关理论的知识框架。 第三章研究小波分析在数字水印技术中的应用,探讨音频领域中数字水印技 4 哈尔滨工程大学硕士学位论文 术的相关理论基础。介绍了钮心忻等提出的著名的基于小波变换的音频数字 水印隐藏与检测算法,并提出了一种改进的基于小波变换的自适应音频数 字水印算法,进行了一些测试与实验,改进后的算法具有良好的鲁棒性,并 且嵌入水印后的音频信号没有引起人耳所感知到的品质变化。算法能抵抗常 见的信号处理和音频压缩编码第四章利用混沌理论,采用模数运算对音频 信号的盲水印嵌入算法进行了深入的研究。最后对全文的工作进行了总结并 提出了进一步的研究方向。 哈尔滨工程大学硕士学位论文 第2 章数字水印技术 2 1 数字水印的特点与分类 数字水印就是指嵌入到被保护对象( 如静止图像) 能够证明其版权归属的 数字信息,可以是作者的姓名、序列号、公司标志等等。 数字水印技术有着其固有的特点与研究方法。例如,从信息安全保密角 度而言,( 音频、视频) 中的某些隐藏的信息如果被破坏掉,系统可以视为安 全的,因为秘密信息并未泄漏,但是,在数字水印系统中,隐藏信息的丢失 意味着版权信息的丢失,从而失去了版权保护的功能。因此数字水印系统必 须具有较强的鲁棒性、安全性、透明性”。 透明性( 隐藏性) :经过一系列隐藏处理,目标数据必须没有明显的降质现 象,隐藏的数据无法人为的看见或听见。 , 鲁棒性:指抗拒各种处理操作和恶意攻击而不会导致水印信息丢失的能 力。所谓的操作包括:传输过程中的信道噪声、滤波、增强、有损压缩、几何 变换、d a 或a d 转换等等。所谓的攻击包括:篡改、伪造、去除水印等等。数 字水印起源于信息隐藏技术,这一点可以从它的隐藏性要求得到证实。 安全性:指将水印信息隐藏于目标数据的内容之内,而非文件头等处,防 止因格式转换而遭到破坏。 无歧义性:恢复出的水印或水印判决的结果应该能够确定地表明所有权, 不会发生多重所有权的纠纷。 通用性:好的水印算法适用于多种文件格式和媒体格式。通用性在某种程 度上意味着易用性。 数字水印技术并不等同于信息隐藏技术,两者的区别在于对鲁棒性的要 求上。信息隐藏的鲁棒性要求可以降低,也就是说在数据经过改动后允许隐 藏信息的丢失,信息隐藏主要是关注隐藏信息的检测,而数字水印主要关注 被盗版者擦除的可能性数字水印必须能在一定限度内承受各种攻击而留存 下来,这样才能实现有意义的版权保护。 数字水印技术的分类方法有很多种,分类的出发点不同导致了分类的不 同,它们之间既有联系又有区别。常见的分类方法有下列几种叫“: 6 哈尔滨工程大学硕士学位论文 1 ) 按特性划分 按水印的特性可以将数字水印分为鲁棒数字水印和脆弱数字水印两种。 鲁棒数字水印主要用于在数字作品中标识著作权信息,如作者、作品序号等 等,它要求嵌入的水印能够承受各种常用的编辑处理:脆弱水印主要用于完整 性保护,与鲁棒水印的要求相反,脆弱水印必须对信号的改动非常敏感,人 们根据脆弱水印的状态就可以判断数据是否被篡改过。 2 ) 按水印所附载的媒体划分 按水印所附载的媒体,可以将数字水印划分为图像水印、音频水印、视 频水印、文本水印等等。随着数字技术的发展,会有更多的数字媒体出现, 同时也会产生相应的水印技术。 3 ) 按检测过程划分 按水印的检测过程可以将数字水印划分为明文水印和盲水印。明文水印 在检测过程中需要原始数据,而盲水印的检测只需要密钥,不需要原始数据。 一般来说,明文水印的鲁棒性较强,但其应用受到存储成本的限铜。 4 ) 按内容划分 按数字水印的内容可将数字水印分为有意义水印和无意义水印。有意义 水印是指水印本身也是某个数字图像( 如商标图案) 或数字音频片段的编码; 无意义水印则只对应于一个序列号。有意义水印的优势在于,如果由于受到 攻击或其他原因致使解码后的水印破损,人们仍然可以通过视觉确认是否有 水印。但对无意义水印来说,如果解码后的水印序列有若干码元错误,则只 能通过统计决策来确定信号中是否含有水印。 5 ) 按用途划分 按水印的用途,我们可以将数字水印划分为票据防伪水印、版权保护水 印、篡改提示水印和隐藏标识水印。 票据防伪水印是一类比较特殊的水印,主要用于打印票据和电子票据的 防伪。一般来说,伪币的制造者不可能对票据图像进行过多的修改,所以, 诸如尺度变换等信号编辑操作是不用考虑的。但另一方面,人们必须考虑到 票据破损、图像模糊等情形,而且考虑到快速检测的要求,用于票据防伪的 数字水印算法不能太复杂。版权标识水印是目前研究得最多的一类数字水印 技术。数字作品既是商品又是知识作品,这种双重性决定了版权标识水印主 7 哈尔滨工程大学硕士学位论文 要强调隐蔽性和鲁棒性,而对数据量的要求相对较小 篡改提示水印是一种脆弱水印,其目的是标识宿主信号的完整性和真实 性。 隐蔽标识水印的目的是将保密数据的重要标注隐藏起来,限制非法用户 对保密数据的使用。 6 ) 按水印隐藏的位置划分 按数字水印隐藏的位置划分,我们可以将其分为空( 时) 间域数字水印和 变换域数字水印。 空( 时) 间域数字水印是直接在信号空间上叠加水印信息,而变换域数字 水印则是在i ) c t 变换域、小波变换域上叠加水印。 随着数字水印技术的发展,各种水印算法层出不穷,水印的隐藏位置也 不再局限于以上几种。应该说,只要构成一种信号变换,就能在其变换空间 隐藏水印 2 2 数字水印的原理 2 2 1 数字水印的基本框架 从图像处理的角度来看,嵌入水印信号可以视为在强背景下叠加一个弱 信号,只要叠加的水印信号强度低于 i v s ( 人类视觉系统) 的对比门限,h v s 就 无法感到信号的存在。对比度门限受视觉系统空间、时间和频率特性的影响。 因此,通过对原始图像做一定的调整,有可能在不改变视觉效果的情况下嵌 入一些信息。从数字通信的角度看,水印可理解为在一个宽带信道( 载体图像) 上用扩频技术传输一个窄带信号( 水印信号) 。尽管水印信号具有一定的能量, 但分布到信道中任一频率上的能量是难以检测到的。水印的检测就相当于是 一个有噪声信道中弱信号的检测问题。 下面就以数字水印在多媒体数字产品的版权保护中的应用为例,介绍数 字水印的基本框架。尽管数字水印有多种形式,我们可以将水印信号统一表 示成 矿= t 国( j | ) f 癌k j i ) u , k e 矿4 其中矿。表示维数d 为的水印域,d = l ,2 ,3 ,分别针对声音、静态图像和 视频水印。水印信号可以是二进制形式或者高斯白噪声形式,其幅值相对于 8 哈尔滨工程大学硕士学位论文 要保护的数字产品的幅值而言应该是很小的。 通用水印框架( g w f ) 可用六元组( r ,矿,j 【,g ,六d ) “1 表示,其中: 。猿示要被保护的数字产品j 的集合。 降喔水印信号集合。 石是水印密钥空间。 g 表示用密钥与要加水印的数字产品产生水印的水印生成算法 g :x x k 专形 形= g ( z ,j 【) ( 2 - 1 ) 善是在数字产品局中加入水印的水印嵌入算法 x x w x k 专xx = q o ) ( 2 - 2 ) d 为水印检测算法 , d x x k 呻 o ,1 ( 2 - 3 ) 其中x 为待检测数字产品,k 为水印检测密钥,霄为提取出的水叩信号。有时水 印检测的结果并不是提取出水印信号,而是一个判定水印是否存在的二值决 策,即 n 郴朋= 怯揣名z , c “, 这种方法通过提取出的水印与原始水印的相关性检测确定水印的存在与 否,它是创建有效水印框架的一种简便方法 2 2 - 2 数字水印算法的主要技术 数字水印技术主要是利用载体数字文件本身的冗余实现的,最主要的是 要解决以下几个问题: 1 ) 嵌入水印的位置 嵌入位置的选择有两个意义:首先,适当的嵌入位置可以保证水印嵌入后 的载体的保真度,并能提高数据的嵌入量,比如在图像水印领域,人们经常 选择纹理较丰富的位置或者图像经历d c l 、d w i 等变换后的较大系数上,并且 经常选择在高频系数上嵌入水印,因为人眼对于低频的分辨率要更敏感,若 在低频系数上嵌入水印,较容易被察觉;其次,适当的嵌入位置选择可以提 高水印的抗攻击能力和鲁棒性,选择水印的位置是必须要遵循一定规律的, 如果这种规律自我保护性能差,很容易被发现,那么水印就变得容易被破坏, 9 哈尔滨工程大学硕士学位论文 敌手如果发现了水印的嵌入位置,就有可能从这些位置上的数字信息中获得 水印,从而使得水印的保护功能失效,另外,适当的水印嵌入位置可以使得 水印在和载体经历相同的变换后仍然能够较完整的存在并能被检测出来。比 如嵌入在变换域系数上的水印,也就是半脆弱水印和鲁棒水印。 2 ) 嵌入水印的类型 嵌入到载体中的水印可以是图片、声音片段或者一个特定规则的数字序 列( 如伪随机序列) ,上述这些都可以看作是一组二进制的数码流。一般而言, 在实际应用中,水印需要包含版权拥有者和使用者的信息,并且这些信息大 部分是加密的,原始的水印经过某种加密算法形成密文水印后,再进行嵌入, 可以防止攻击者通过某种方式提取出水印后获得真实的水印。 3 ) 嵌入水印的方法 当水印和嵌入位置均选定之后,就要运用一定的方法将水印嵌入到指定 的位置,目前常用的水印嵌入方法大多是将水印信号看作加性噪声,利用一 定的加权系数将密文水印的信号叠加到指定的嵌入位置的数据上。一般而言, 由于嵌入水印仅仅在一定范围内改变了原始载体数据某些点的值,并没有改 变其结构,所以原始载体的大小不会发生变化。 4 ) 检测水印的方法 根据数字水印的嵌入算法可以得到相应的检测算法,检测可以分为盲检 测和非盲检测。盲检测不需要原始的载体,一般需要利用嵌入水印后数据之 间的统计特性和一些数值特点,盲检测算法的实现有赖于一种特殊算法的嵌 入方法,是目前水印领域研究的难点之一;非盲检测需要借助原始载体,通 过比较嵌入前后载体数据的关系获得提取水印必须的相关信息。显然,非盲 检测比盲检测有更高的可靠性,可以获得更低的虚警概率,算法的复杂度更 小、速度更快,但是在实际应用中由于需要借助原始载体数据,显然没有盲 检测方便,而且在诸如视频流的检测时由于原始数据量巨大而几乎不可能借 助原始数据。 2 2 3 水印的嵌入过程 典型的数字水印系统一般包括水印的生成、水印的嵌入和水印的提取 检测三个部分。 哈尔滨工程大学硕士学位论文 图2 1 为水印信号的嵌入模型,其功能是完成将水印信号加入原始数据 中:图2 2 为水印信号的提取模型,负责从水印数据中提取出水印信号;图 2 3 为水印信号的检测模型,用以判断某一数据中是否含有指定的水印信号。 图2 2 和图2 3 中的虚框部分表示在提取或判断水印信号时原始数据不是必 要的。 田2 1 承印信号嵌入 圈2 j 水印信号检一 1 ) 水印生成 水印生成算法g 应保证水印唯一性、有效性、不可逆性等属性。水印信 号一般是由伪随机数发生器生成的,且利用密钥进行加密。 2 ) 水印嵌入 一 嵌入算法善要考虑到水印的不可感知性和鲁棒性。嵌入过程把数字水印 1 l 哈尔滨工程大学硕士学位论文 信号w = w ) 嵌入到产品j ,o ;缸。( 七) 中,一般水印嵌入规则可描述为 k ( d z x o ( 七) 0 _ i l ( 七) o 似七) ( 2 - 5 ) 其中。为某种叠加操作,目= w 成为水印嵌入掩码。最简单的水印 嵌入规则为 , j 0 ( 七) = x o ) + 删七) ( 加法规则) j 0 ( 七) = x 。( k x l + a w ( k ) ) ( 乘法规则) x 。( j ) = x o ( 七弘“雠 ( 指数规则) ( 2 6 ) ( 2 - 7 ) ( 2 二8 ) 变量j 指采样强度幅度( 空域时域) 或是变换系数大小( 变换域) 。根 据对水印的可觉察程度的不同要求,参数口在各种数据采样中可能不同。 3 ) 水印检测 通常水印检测的第一步是水印提取,然后是水印判决。水印判决的通常 做法是相关性检测。选择一个相关性判决标准,计算提出的水印与指定的水 印的相关值,如果相关值足够高,则可以基本判定被检测数据中含有水印。 水印检测算法应具有良好的可靠性和计算效率,绝大多数检测过程都不涉及 未加入水印的原产品( 称盲水印) 。水印检测器d 可能会发生两类错误: i 类错误:数据中不存在水印,检测结果为存在水印( 正向错误) 。 类错误:数据中存在水印,检测结果为不存在水印( 负向错误) 。 上述错误发生的概率分别称为虚警概率和漏报概率。一般来说,当虚警 概率变得很小时( 圪- - 0 ) ,漏报概率会相应变大( 匕,一1 ) ,反之亦然。 。在g w f 中,属于同一拥有者的产品的所有水印被以相同私钥产生。该密 钥也用来检测分发网络中存在的任何可疑产品的水印,这由一个自动检索过 程s 实现。水印检测的精度水平由检测的提供者选择,可以分为两种情况: ( 1 ) 低精度检测:该情况下,虚警比较频繁,而漏报概率很小。在检测结果 为肯定的情况下,需要进一步查明水印的存在或证明版权。 ( 2 ) 高精度检测:该情况下,2 一o ,且检测器提供高可靠度的肯定检测。这 种检测结果甚至可以在法庭上作为合法所有权的强有力证据。但同时它也提 高了漏报概率,且检测对有意或无意的攻击缺乏鲁棒性。 2 3 音频数字水印技术 随着数字化音像制品和音乐制品的大量制作和发行,音频数据的版权保 哈尔滨工程大学硕士学位论文 护也显得越来越重要。通过在音频载体中嵌入水印信息,可以实现拷贝限制、 使用跟踪、盗用确认等功能。近年来,有关音频数字水印技术的研究工作发 展很快,尤其在变换域音频信息的数据嵌入技术,由于它能将信息嵌入到载 体的敏感区域,使得研究更具实用性。 音频水印技术正是利用语音本身固有的特点,把数字作品的版权等信息 嵌入到音频作品中,以达到对音频数字产品的版权进行保护的目的。因此有 必要了解语音的基础知识,以及经常使用的语音处理方法,对于设计好的音 频水印方案有着重要的指导意义,特别有利于提高水印方法的鲁棒性和隐蔽 性。如果能够很好地利用语音的各种处理方法,可以设计出对各种处理方法 具有鲁棒性的音频数字水印方案。 2 3 1 音频文件格式 对高质量数字音频的描述样本最流行的格式是1 6 比特线性量化,如: w m d o w s 中的w a v 格式音频文件和a i f f 音频交换文件格式。另一种对较低 质量声音的流行版本是采用8 比特u 律的对数分度。这些量化方法使信号产 生了一些畸变,在8 比特l i 律中显得更为明显。 一般声音的流行采样频率包括8 k h z ,9 6 k h z ,1 0 k h z ,1 2 k i - i z ,1 6 k h z , 2 2 0 5 k h z 和4 4 1 k h z 。采样频率影响数据隐藏,因为它给出了可用频谱的上 限( 如果信号的采样频率为8 k i - i z ,则引入的修改分量的频率不会超过4 k h z ) 对于大多数已有的数据隐藏技术而言,可用的数据空间与采样频率的增长至 少呈线性关系。m p 3 音乐风靡全球,深得人们的喜爱。m p 3 文件是一个广泛 应用的音频格式。如果我们要对m p 3 音乐进行版权保护,可以将m p 3 音乐 声音文件转化为w a v e 声音文件,将水印信息嵌入到w a v e 声音文件,再 将w a v e 声音文件转化为m p 3 音乐声音文件。这要求水印是鲁棒的,因为 从w a v e 声音文件转化为m p 3 音乐文件是一个有损压缩的过程。 2 3 2 语音信号数字化 模拟语音信号是幅度随时间而变的一维信号,它的频率范围一般是2 0 2 0 k h z 。语音信号的数字化是指将模拟语音信号变为时间和幅度均为离散的数 字信号。模拟语音信号数字化必须经过抽样和量化两个步骤。抽样是将时间 哈尔滨工程大学硕士学位论文 上连续的语音信号毛( f ) 离散化成一个样本序列x ( 帕= x o ( n t ) ,t 为抽样周 期:而量化则是将该序列的样本幅度再离散化,从而得到时间和幅度都为离 散值的数字语音信号。语音信号数字化框图如所示: 田2 4 语音敦孚化的一般框圈 音频信号的数字化是指对模拟的声音信号进行a d 转换,使其转化为数字 信号。这过程有两个重要的参数:量化精度和瞬态采样速率。 ? 对高质量音频的量化方式最流行的格式是1 6 b i t 线性量化,如w i n d o w s 可 视音频格式( w a v ) 和音频交换文件格式( a i f f ) 。另一种较低质量音频的量化方 式一般采用8 b i tl j 律量化,这些量化方法会使信号产生一些畸变。 一般音频的常用采样频率包括8 k h z 、9 6 k h z 、l o k h z 、1 2 k h z 、1 6 k h z 、 2 2 0 5 k h z 和4 4 1 0 k h z 。采样频率影响水印数据的隐藏量,因为它给出了可用 频谱的上限( 如果信号的采样频率为8 k h z ,则引入的修改分量的频率不会超过 4 k h z ) 。对于大多数已有的水印技术而言,可用的数据空间与采样频率的增长 至少呈现线性关系。, 。 最后需要考虑的是由有损和可感知压缩算法( 如m p e g - a u d i o 压缩算法 村引起的变化。这些变化彻底改变了信号的数据结构。它们仅仅保留了听 者能感觉到的特性部分,也就是说,它听起来与原来的相似,但是在最小平 方意义上完全不同。数据隐藏的速率依赖于信号的采样率和声音编码的类型 以及具体的水印算法。 语 音 输 入 反 传 混 分 输 a 析- 或 + 成 叠 转 处 存 处 滤 换 理理 波 储 田2 j 语音信号处毫系统框圈 1 4 呈 l 滑 转 o 滤 换 波 语 音 输 出 哈尔滨工程大学硕士学位论文 2 3 3 语音信号的预处理 在对语音信号进行分析和处理之前,必须先进行信号的预处理。除了前 面讲到的数字化之外,还包括放大及增益控制、反混叠滤波、预加重等。在 需要语音输出的地方还要进行数模转换( d a ) 和起平滑作用的模拟低通滤 波( 即平滑滤波) 下图给出了一般语音数字分析和处理的系统框图。 , a d 转换前的反混叠滤波器的作用有两个;一是抑制电源干扰;二是抑 制输入信号中各频率分量中频率分量超出正2 的所有分量( z 为信号采样频 率) ,防止混叠干扰。因此,反混叠滤波器必须为带通滤波器,其上、下截止 频率分别为厶和无。对于目前大多数语音编码器,厶= 3 4 0 0 i - i z ,兀2 们 1 0 0 h z ,。- 8 k h z 。d a 转换后面的低通滤波器用于平滑重构语音波形的高 次谐波。 预加重处理是在a d 转换后面加一个6 d b 倍频程的提升高频率特性的 预加重数字滤波器,目的是提升高频部分,使语音信号的频谱变得平坦,便 于进行频谱分析或者声道参数分析。 2 3 4 语音信号的时频域分析 语音的时域分析是最早对语音信号进行分析的方法,也是应用最广泛的 一种方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基 本的参数分析及用于语音的分割、预处理和分类等等。这种分析方法的特点 是:表示语音信号比较直观、物理意义明确;实现比较简单,运算量少;可 以得到语音的一些重要参数;采用示波器等通用设备,使用较为简单容易。 1 ) 语音信号的短时平稳特性 语音信号是时变信号,所以它是一个非稳态过程。但是,在一个短时间 范围内其特性基本保持不变即相对稳定的,因而可以将其看作是一个准稳态 过程。这就是语音信号的。短时平稳”特性。所以对语音的分析和处理都必 须建立在这一特性基础上,即对语音信号进行“短时分析”,将语音信号分为 一段一段来分析,每一段称为一“帧”,一帧的长度一般取为1 0 3 0 m s 。 2 ) 语音的短时能量、幅度和跨零数分析 ( 1 ) 短时平均能量 短时平均能量定义如下:定义以行为标志的某帧语音信号的短时平均能量 哈尔滨工程大学硕士学位论文 e 。为 e = 口( 呐呱万一呐】2 = x ( m ) w ( n - m ) j 1 ( 2 9 ) 其中,“疗) 是语音信号分帧所采用的窗函数,一般窗函数可以采用直角窗 删= 姑姑。 亿 这时,短时平均能量e 为 e = x 2 ( 旧 ( 2 1 1 ) 若令h ( n ) = w 2 ( 力,则上式可以写成 e = x 2 ( 埘) ( 行一砷= 工2 ( 帕坂力 ( 2 1 2 ) 上式表明,窗口加权的短时能量相当于将。语音平方”信号通过一个线性滤 波器的输出,该滤波器的单位冲击响应为以力,如图2 6 所示为短时平均能 量的方框图,或者采用海明窗: 似功;o s 4 - o 4 6 c o s 为,o s n n 一1 ( 2 - 1 3 ) i o 4 其他 采用不同的窗函数得到的结果不同,直角窗的频谱平滑性较好,但是波 形细节丢失,而海明窗则反之。 短时平均能量分析的作用有如下三个: a 给出了区分清音段和浊音段语音的基础,通常e 撕 e 册; b 大致定出浊音语音变为清音语音的时刻,或者反之; c 对于高质量语音( 高信噪比) ,能区分有无语音。 7 2 短对平均能量的方框圈 ( 2 ) 短时平均幅度函数 短时平均幅度函数肘。定义如下 1 6 哈尔滨工程大学硕士学位论文 厶= i x ( 聊h 加z 一埘) = k ( 撑) | + 以力( 2 - 1 4 ) 其实现框图如2 7 所示: 围2 7 短时平均度的方框田 ( 3 ) 短时平均跨零数 j 跨零是指信号通过零值。对于离散时间序列,跨零指的是取样值改变符 号。跨零数是每秒内信号值通过零值的次数。对于离散时间序列,跨零数是 每个样本改变符号的次数。语音信号序列x ( 而的短时平均跨零数乙定义为: 乙= l s 印b ( 功卜s 弘b ( 坍一1 ) 】“门一砷 i 曲 = | s g n b ( 刀) 卜s g n b ( 孵一1 ) 1 似以) ( 2 1 5 ) 这里,s 驴【】是符号函数,以疗) 是如下窗口函数: 实现框图如2 8 所示 以力: 去,o 如- l ( 2 - 1 6 ) l o ,其他 3 ) 短时自相关函数, 一 对于确定性信号序列,自相关函数r ( k ) 定义为 r ( 七) = x ( ,村) x ( 所+ d ( 2 - 1 7 ) 对于随机信号序列或者周期信号序列,自相关函数定义为 置( 七) = 陆啬x ( 坍) 砌件七) ( 2 - 1 8 ) n - - h 0 2 n - t 、7 - l 兰、7 、 1 7 o , 回, 里曼 日 哈尔滨工程大学硕士学位论文 自相关函数置( 七) 具有如下性质: 如果序列的周期为p ,则其自相关函数的周期也为p ,即: 露( 七) = r ( k + 户) ( 2 1 9 ) 自相关函数为偶函数,即置( 七) = 盖( - k ) ; k = 0 时,自相关函数具有最大值,即忸( 七) l = r ( o ) ;, 对确定信号,且( o ) 等于能量,对随机或周期信号,置( 0 ) 等于平均功率。 因此,可以说自相关函数是一个特殊的能量,而且它是表示周期性的一 种有效方法。 短时自相关函数定义为 蜀( = x ( m ) w ( n - m ) x ( m + k ) w ( n - m d ( 2 - 2 0 ) l q 由于是偶函数所以有 毛( 的= 五。( _ d = x ( m ) x ( m - k ) w ( n m ) w ( n m 一七) ( 2 - 2 1 ) 舡- t o 如果定义入( 力= w ( n ) w ( n + k ) ,则上式可以写成 焉( d = x ( 砷x ( 册一七) 以( 玎一神= k 功地一七) 1 h a , o ( 2 - 2 2 ) - 。 上式说明语音短时自相关函数可视为序列哟x ( n 一七) 通过冲激响应为0 ) 的数字滤波器的输出,其实现框图如下所示。 , 兄( 幻 圈2 ,短时自相关函最框圈 2 3 5 人类听觉系统o t a s ) 人耳的机理相当复杂。它就像一个频率分析仪,能够探测到从l o h z 到 2 0 0 0 0h z 的声音。描述人类听觉系统的感知特性一般从下面三个方面来分析: 响度、音高和掩蔽效应 1 ) 对响度的感知 哈尔滨工程大学硕士学位论文 声音的响度即声音的强弱。在物理上,声音的响度使用客观测量单位来 度量,即声压单位d y n c d ,( 达因平方厘米) 或声强单位w l c m 2 ( 瓦特平方厘 米) 。在心理上,主观感觉的声音强弱使用响度级“方( p h o n ) ”或“宋( s o n e ) ” 来度量。这两种感知声音强弱的计量单位是完全不同的两个概念,但它们之 间又有一定的联系。 当声音弱到人耳刚刚可以听见时,称此时的声音强度为“听阈”。例如, l i d l z 纯音的声强达到1 0 “w c f f 时,入耳刚能听见,此时的客观响度级定义 为o d b 声强级,而主观响度级定义为零方。另一种极端的情况是声音强到是入 耳感到疼痛,我们称这个阈值为“痛阈”。例如,当频率为l k h z 的纯音声强 达到1 2 0 d b 左右时,入耳感到疼痛,此时主观响度级为1 2 0 方。实验表明,“听 阈”和“痛阈”都随频率变化。 人耳对不同频率的敏感程度有差别,其中对2 1 d l z 一4 k h z 范围的信号最为敏 感,幅值很低的信号都能被人耳听到。而在低频区和高频区,能被人耳听到 的信号幅值要高得多。 音频信号主要包括电话质量话音、宽频话音和宽频声音。这些音频信号 的频率范围分别是:电话质量话音3 0 0 - - 3 4 0 0 h z 宽频话音5 0 - 7 0 0 0 h z ,高质量的 宽频声音2 0 - 2 0 0 0 0 h z 。 2 ) 对高音的感知 客观上用频率f 来表示声音的音高,单位为h z 而主观感觉的音高单位则 是“m e l ( 美) ”。它们也是两个不同又有联系的概念,主观音高与客观音高的 关系可用下式表示 1 i e l = l o o o l 0 9 2 ( 1 + f ) 人耳对响度的感知
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年咨询服务行业数字化咨询服务前景研究报告
- 2025年化妆品行业个性化化妆品定制服务市场前景研究报告
- 2025年医疗健康行业远程医疗服务市场前景报告
- 巴中市2025四川巴中市财政投资评审中心招聘编外辅助性岗位专业技术人员1人笔试历年参考题库附带答案详解
- 压力容器取证培训课件
- 夏县2025山西运城夏县引进高素质青年人才25人笔试历年参考题库附带答案详解
- 国家事业单位招聘2025商务部中国国际电子商务中心招聘1人笔试历年参考题库附带答案详解
- 国家事业单位招聘2025中国健康传媒集团招聘8人笔试历年参考题库附带答案详解
- 商洛市2025陕西商洛学院审计处人员招聘考试1人笔试历年参考题库附带答案详解
- 北京市2025中国地质调查局发展研究中心招聘12人(第二批)笔试历年参考题库附带答案详解
- 美术微课课题立项申报书
- 中药饮片处方用名和调剂给付规定
- 公共部门人力资源管理全套PPT完整教学课件
- 吉林大学地质学兴城实习报告
- 中学生必需把握的3500个常用汉字
- 通过模拟实验探究膜的透性 说课课件
- 化工自动化控制仪表作业安全操作资格培训教材课件
- 造纸培训制浆造纸培训造纸纸病分析处理(“毛布”文档)共112张
- DB37-T 4457-2021企业开办工作指引
- 中科大中级有机化学实验讲义
- 干部任免审批表(空白)【电子版】
评论
0/150
提交评论