(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf_第1页
(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf_第2页
(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf_第3页
(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf_第4页
(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(电路与系统专业论文)基于变换域的数字音频水印技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i i ii ii i i ii ii iii i iii il | y 1912 8 4 9 中文摘要 数字音频水印技术是数字水印技术中的一个重要分支,它在数字 音频版权保护、语音保密通信等方面有广泛应用价值,并对未来数字 化发展具有重要的意义。本文在现有理论的基础上,着重研究变换域 的数字音频水印技术,给出了三种数字音频水印相关算法。论文所做 的工作和主要成果如下: 1 ) 对目前国内外几种典型的音频水印算法进行了阐述与分析,总 结了各自的特点,并作归纳比较。 2 ) 提出了一种基于混沌理论加密水印的复倒谱域自适应双重音 频水印算法。该方法采用l o g i s t i c 混沌映射产生混沌序列并转 换成二值图像与原始水印图像异或运算来实现水印加密,以增 强水印的安全性。另外,采用两幅不同的图片作为水印信号, 在嵌入一个水印图片之后按照嵌入流程再嵌入一次。实验结果 表明,该算法在双重水印嵌入情况下具有较好的不可感知性和 较强的鲁棒性。 3 ) 提出了一种基于离散余弦变换的音频水印嵌入算法以及基于 小波包分解的水印检测算法。采用声音片段作为水印信号,利 用离散余弦变换对原始音频进行处理,提取能量高的低频系数 来进行嵌入。引入加高斯白噪声的音频,利用基于小波包分解 后的特征提取检测方法,在检测过程中分别与原始音频和嵌入 水印后的音频作比较分析。实验表明采用小波包分解音频并进 行能量特征提取,能有效地实现声音水印的检测。 4 ) 提出了一种基于改进后的小波变换的抗剪切音频水印算法。该 算法最大的优点是利用水印序号的嵌入来弥补剪切攻击所造 成的水印信息的丢失。实验表明,每嵌入一个水印元素之前嵌 入一组水印序号的二进制序列组,能有效地降低剪切攻击损 害。 关键词:数字音频,水印,鲁棒性,变换域,同步攻击 a b s t r a c t d i g i t a la u d i ow a t e r m a r k i n gt e c h n o l o g yi sa ni m p o r t a n t b r a n c ho fd i g i t a lw a t e r m a r k i n gt e c h n o l o g y ,a n di th a sb e e n a p p l i e da n dv a l u e dw i d e l yi nt h ef i e l d so fc o p y r i g h tp r o t e c t i o n , p r i v a t ev o i c ec o m m u n i c a t i o n e t c ,a n dh a sas i g n i f i c a n c et o t h ed e v e l o p m e n to ff u t u r ed i g i t i z a t i o n b a s e do nt h ee x i s t i n g t h e o r i e s ,a i m i n ga tr e s e a r c h i n gd i g i t a la u d i ow a t e r m a r k i n g t e c h n o l o g yi nt h et r a n s f o r md o m a i n ,t h r e ed i g i t a la u d i o w a t e r m a r k i n ga l g o r i t h m sa r es h o w e d w h a tp a p e rd oa n dr e s e a r c h a r et h ef o ll o w i n gr e s p e c t s : 1 ) s e v e r a lt y p i c a lo fa u d i ow a t e r m a r k i n ga l g o r i t h m sa th o m e a n da b r o a da r ei n t r o d u c e da n da n a l y z e d ,t h e ns u m m a r iz e a n dc o m p a r et h e i rd if f e r e n c e s 2 ) aa d a p t i v ed o u b l ed i g i t a la u d i ow a t e r m a r k i n ga l g o r i t h m b a s e do nc h a o st h e o r yi nc o m p l e xc e p s t r u misp r o p o s e d as t r i n go fc h a o t i cs e q u e n c ep r o d u c e db yt h el o g i s t i c c h a o sm a p p i n gi sc h a n g e dt oab i n a r yi m a g e ,a n dt h e nx o r w i t ht h ep r i m i t i v ew a t e r m a r ki m a g e ,s ot h a tt h ew a t e r m a r k ise n c r y p t e d ,a n dt h es e c u r it yw il lb ee n h a n c e d i n i a d d i t i o n ,w i t ht w od i f f e r e n tp i c t u r e sa st h ew a t e r m a r k , e m b e d d i n gp r o c e s sn e e d sd o m t w ic e ,t h a tis ,t h es e c o n d e m b e d d i n gp r o c e s si s ak i n do f a t t a c kf o r t h ef i r s t e m b e d d i n gp r o c e s s t h er e s u l t ss h o wt h a tt h i sa l g o r i t h m c a ns h o wap r e f e r a b l ei m p e r c e p t i b l ea n dr o b u s t n e s s 3 ) as p e e c hw a t e r m a r k i n ga l g o r i t h mb a s e do nd i s c r e t ec o s i n e t r a n s f o r ma n daw a t e r m a r kd e t e c t i o na l g o r i t h mb a s e do n w a v e l e tp a c k e td e c o m p o s i t i o na r ep r o p o s e d w i t har a n g e o fv o i c ea sa w a t e r m a r k ,t h ep r i m i t i v e a u d i oi s t r a n s f o r m e db yd c t ,t h e nt h ew a t e r m a r kise m b e d d e di nt h e l o w - f r e q u e n c yc o e f f i c i e n t st h a tc o n t a i nh i g he n e r g y b a s e do nw a v e l e t p a c k e td e c o m p o s i t i o n o ff e a t u r e e x t r a c ti o nm e t h o d ,ap ie c eo fa u d i oa d d e db yg a u s sw h it e n o i s ei su s e dt oc o m p a r ew i t ht h ep r i m i t i v ea u d i oa n dt h e e m b e d d e da u d i o t h er e s u l t so fe x p e r i m e n ts h o wt h a t f e a t u r ee x t r a c ti o na l g o r i t h mb a s e do nw a v e l e tp a c k e t d e c o m p o s i t i o n c a na c h i e v et h ew a t e r m a r kd e t e c t i o n e f f e c t i v e l y 4 ) p r o p o s i n gac u t r e s i s t i n ga u d i ow a t e r m a r k i n ga l g o r i t h m b a s e do ni m p r o v e dw a v e l e tt r a n s f o r m t h eb e s ta d v a n t a g e o ft h i sa l g o r i t h mi su s i n gw a t e r m a r ks e r i a ln u m b e rt o r e m e d yt h el o s sq fw a t e r m a r km e s s a g et h a tc a u s e db y a t t a c ko fc u t ti n g t h er e s u l t sf r o me x p e r i m e n t sa n d i v si m u l a ti o np r o v et h a ti tc a nr e d u c et h ed a m a g eb yc u t ti n g a t t a c km o r ee f f e c t i v e l yi ft h eb i n a r ys e q u e n c e sg r o u po f w a t e r m a r ks e r i a ln u m b e rise m b e d d e db e f o r eaw a t e r m a r k e l e m e n t k e yw o r d s :d i g i t a la u d i o ,w a t e r m a r k ,r o b u s t n e s s ,t r a n s f o r m d o m a i n , s y n c h r o n i z a ti o na t t a c k v 目录 中文摘要i a b s t r a c t 1 l i 第一章绪论1 1 1 数字音频水印的研究背景及意义1 1 1 1 课题产生背景。1 1 1 2 课题意义2 1 2 数字音频水印的研究现状及存在问题3 1 2 1 研究现状3 1 2 2 存在问题4 1 3 本文的主要内容及结构安排6 第二章数字音频水印技术概述8 2 1 基本理论8 2 1 1 数字音频水印8 2 1 2 心理声学模型8 2 1 3 人耳掩蔽效应9 2 2 数字音频水印常见算法1o 2 2 1 时域算法1o 2 2 2 变换域算法1 l 2 2 3 混合算法1 2 2 3 数字音频水印评价指标j 13 2 3 1 主要评估性能。l3 2 3 2 主要评估参数1 4 2 4 同步问题16 2 4 1 同步的含义1 6 2 4 2 同步攻击问题的现状1 6 第三章基于混沌的复倒谱域自适应双重音频水印算法1 8 3 1 引言- 18 3 2 基础理论18 3 2 1 混沌理论18 3 2 2 复倒谱变换( c c e p s ) 的定义及特性1 9 3 3 计算方法1 9 3 3 1 水印的预处理1 9 3 3 2 嵌入帧的选取2 0 3 3 3 水印的嵌入2l 3 3 4 水印的提取2 3 3 4 实验结果与分析2 3 3 4 1 水印的不可感知性2 3 3 4 2 水印的鲁棒性2 4 3 5 本章小结2 6 第四章基于离散余弦变换的音频水印及检测算法2 7 4 1 引言2 7 4 2 基础理论2 7 4 2 1 离散余弦变换2 7 4 2 2 小波包变换2 8 4 3 水印嵌入及检测方法3 0 4 3 1 水印嵌入3 0 4 3 2 水印检测3 4 4 4 实验结果与分析3 5 4 5 本章小结3 7 第五章基于改进小波变换的抗剪切音频水印算法3 9 5 1 引言3 9 5 2 基础理论3 9 5 2 1 小波分解与重构3 9 5 2 2a r n o l d 变换4 l 5 3 算法实现4 2 5 3 1 水印处理4 2 5 3 2 水印嵌入。4 3 5 3 3 水印攻击:4 5 5 4 结果与分析4 6 5 5 本章小结4 8 第六章总结与展望4 9 参考文献5 2 攻读硕士学位期间发表论文情况5 9 致谢? 6 0 基于变换域的数字音频水印技术研究 第一章绪论 1 1 数字音频水印的研究背景及意义 1 1 1 课题产生背景 信息技术的发展目标是为了让人们更快捷方便地获取知识和信 息。在日新月异的当今,信息技术的飞速发展人们深有感触一足不出 户即可买到想要的东西,这就是信息技术及互联网的普及所带来的好 处。网络上歌曲成千上万,应有尽有,强大的搜索引擎能快速地找到 人们想听的音乐,但随之而来的负面效果也很明显。在这不断地上传、 复制、下载等过程中,并没有严格的法律法规控制,数字化信息的知 识产权问题逐显弊端,版权人并不能有力地证明其他人的非法拷贝和 修改。例如2 0 1 0 年2 月出现的“谷歌事件”,正是涉及到数字音频等 信息的非法链接及复制问题,而引起的法律纷争。因此,如何可行而 有效地保护数字化信息的知识产权和版权成为网络环境下越来越亟 待解决和改进的信息安全问题。 为了跟踪侵权行为并提供法律保护的证据,人们尝试将秘密信息 隐藏于普通文件中再散发出去,通常被称为信息隐藏或者信息伪装 【1 】。与信息隐藏有着密切关系的就是数字水印技术。 数字水印技术是一种将特制的、已处理的版权信息( 包括文本, 声音,图片等) ,利用可行的算法隐藏在数字图像、声音、视频等多 媒体数据中,以起到版权保护、保密通信以及数据文件的真伪辨别和 硕士学位论文 产品标识等作用【2 - 5 1 。数字水印系统的结构图如图1 1 所示。数字音频 水印技术是针对数字音频版权保护而逐渐发展起来并被广泛应用的 一种新技术。数字音频水印的载体是数字音频或语音,水印信息可以 是任何数字内容。 1 1 2 课题意义 ( 不可感知)( 可感知) 鲁 性鲁棒性脆弱性 再t 嬲逆转 图1 1 数字水印系统结构图 目标 件 近年来,i n t e r n e t 和数字化技术的飞速发展为人们的信息交流提 供方便的同时,也带来了越来越严重的版权保护危机。如果解决不好 版权保护问题,足以影响多媒体信息产业的发展,也会对法律界、文 艺界、商界各个领域造成一定的影响。所以,数字音频水印技术的发 展是社会发展的需要。通过一定的算法和信息处理方法将能标志版权 者信息的数字内容嵌入到版权者的数字音频或语音中,即使被非法复 制、篡改或盗版传播的情况下,也可以利用特殊算法来检测水印信息, 从而保护版权者的合法权益。因此,数字音频水印技术在解决版权保 护问题上具有重大而深远的意义。 另外,水印技术也是信息隐藏的一个重要方面。在秘密通信中, 数字音频水印技术发挥着重要作用。与图像水印不同,语音水印必须 考虑到音频信号特点以及心理声学模型( 特别是人类听觉特性) ,正 是利用人耳的听觉特性,人们可以将某些秘密语音或加密文件( 目标 信息) 通过信息隐藏技术嵌入到数字音频( 伪装信息) 中,从而实现 保密通信,防止秘密被窃听或监控而导致外泄。即使数字音频被人截 获,在无法得知算法和密钥的情况下,也是无从获得真正的目标语音 信息的。这是一种新型的语音防窃听手段,对信息安全通信发展具有 积极的作用。 1 2 数字音频水印的研究现状及存在问题 1 2 1 研究现状 数字音频水印基础理论研究已逐步成熟,目前所广泛被认可的研 究方向主要有变换域算法的改进、白适应问题、抗同步攻击问题等。 其中水印的预处理方法主要是为了提高水印的安全性,对于算法的鲁 棒性并没有很大的影响。近几年,基于不同研究重点的论文和成果很 多。李淑云【6 】等人对数字音频水印技术在目前的信息安全领域的发展 及科学应用作了较为详细全面的概括和总结,为后续研究者们提供了 较好的参考。季智【7 1 等人则概述了目前最主要的几种针对数字水印的 攻击模式,并做了相应的对策分析。在此基础上,刘九纠8 】等人提出 了两种抵抗同步攻击的算法,基于均值量化的同步算法和基于奇异值 硕士学位论文 分解的双声道水印算法。胡金燕【9 】等人提出一种基于神经网络的小波 域算法,并从实验结果上论证了算法的智能性,具有较好的自适应性。 提高算法的自适应性,即是调和水印嵌入后的不可感知性,让水印信 号能根据音频特征和人耳听觉特性进行嵌入,所以基于人耳听觉特性 的自适应算法目前有大量的研究论文,如冯涛【1 0 】等人和桑鹤平【l l 】等人 都提出了基于听觉特性掩蔽效应的自适应水印算法,前者先估算音频 频域能量值,然后根据听觉特性选择能量适当的频段嵌入水印,后者 则是计算出音频的掩蔽阈值,选择低于掩蔽门限值的位置来嵌入,从 而达到很好的不可感知性。w a l e e dh 和y i q i n gl i n 【1 2 1 提出了一种基于 多重置换的自适应同步水印算法,将水印图片进行多重置换已达到足 够的安全性,并加入同步码来提高水印提取的准确性。此外,关于数 字音频水印技术所涉及的理论基础有大量的文献可供参考,各自出发 点和侧重点也不尽相同,这取决于数字音频水印算法评价指标的选 择。 1 2 2 存在问题 自1 9 9 0 年数字图像水印技术的提出,逐步推进了数字音频水印 技术的发展。到目前,经过近十年的发展,数字音频水印的研究已经 贯穿了信息安全、密码学、信号处理、通信系统、数字媒体设计等多 个领域,并且有许多优秀的科研成果产生,甚至有许多申请专利并投 入市场应用等。然而,在如此大好的形势之下,数字音频水印的发展 仍然面临很多的问题和挑战【1 3 - 1 5 1 。 基于变换域的数字音频水印技术研究 ( 1 ) 理论研究有待创新 如今,数字音频水印方面的研究成果纷繁复杂,理论研究成果 在“量上已是不计其数,但是并没有到达“质”的飞跃。例如,从 数字水印载体音频本身的特征上说,涵盖了语音学、信息学等多个 领域的理论,大多数研究结果显示,数字音频水印的数学建模和信息 隐藏容量分析方面的理论都不够完整统一,并且很多都是大同小异。 人们不能用科学实用的方法去准确地刻画载体音频的隐藏水印信息 的容量,不能准确地将人类听觉特征与水印隐藏量的关系进行量化分 析等等。 ( 2 ) 数字音频水印的检测存在弊端 在大多数软件工程中,更多的软件工作者更看重的是软件开发过 程,而实际上在软件生产周期中,软件测试扮演者举足轻重的角色。 数字水印系统也是如此,人们更多的精力集中于如何将水印嵌入音频 中,完美地隐藏起来,而疏忽了对音频中是否含有水印的检测工作, 并且如果水印信息被发现或被毁坏要如何消除或恢复。目前,有部分 研究者开始关注并卓有成效,但是普遍适应性还较差。 ( 3 ) 数字音频水印嵌入算法设计有待突破 尽管数字音频水印较数字图像水印技术起步晚,近几年的发展也 是非常快的,除了将应用到数字图像水印中的算法借鉴引用到音频水 印算法中,人们还结合音频与人类听觉特性研究出了更适合于音频特 征的水印嵌入算法。至今,大部分的算法尚没有体现很好的鲁棒性, 以及鲁棒性与不可感知性之间的平衡。另外,在算法的抗同步攻击问 硕士学位论文 题上,算法结构也没有考虑严谨,这也是需要突破的地方。 1 3 本文的主要内容及结构安排 。 本论文主要致力于研究以下三个方面的内容:第一部分,介绍目 前常用的几种水印嵌入算法,并对其进行了分析和比较;第二部分, 给出了两种变换域水印算法,即基于混沌原理的复倒谱域双重音频水 印算法、基于离散余弦变换和小波包分解的语音水印检测算法;第三 部分,针对音频水印的同步攻击问题,提出一种新的抗同步攻击的水 印算法。在m a t l a b7 0 软件平台上,本文对所给出的算法进行了仿 真实验,并用以论证算法的正确性及可靠性。 本文的结构安排如下: 第一章,阐述了数字水印技术、数字音频水印技术的概念及研究 意义,综述了其研究现状,并简要介绍了本论文的主要工作及各章节 的安排。 第二章,介绍目前国内外的几种主流水印嵌入算法,分析比较了 各种方法的优缺点。 第三章,采用混沌原理对水印图片信息进行加密,然后在复倒谱 域嵌入。对嵌入水印后的音频进行滤波、重采样、剪切等一系列攻击 处理,并得出相应的实验结果来检验算法的鲁棒性。 第四章,以语音信号作为水印,经过预处理后将其嵌入在原始载 体音频的离散余弦变换域中,再利用小波包分解原理分解含水印的音 频并通过提取相应的特征值来实现水印的检测。 基于变换域的数字音频水印技术研究 第五章,针对剪切攻击问题,以水印序号和水印图片共同组成水 印信息,采用一种改进的小波变换算法来实现水印嵌入,并通过实验 仿真来验证算法的抗剪切性能。 第六章,总结和展望。针对全文所采用的算法结构进行归纳总结, 并提出相应的改进方案。 硕士学位论文 2 1 基本理论 第二章数字音频水印技术概述 2 1 1 数字音频水印 数字音频水印技术是以数字音频( 语音) 为载体,为了保护版权 或者保密通信防止窃听,将能代表所有者版权信息或者通信的目标文 件以文本、图片、声音等数字对象的方式按照一定的算法嵌入载体音 频中的过程 1 6 - 1 9 】。数字音频水印模型如图2 1 所示。 原始音频 2 1 2 心理声学模型 图2 1 数字音频水印模型 人的听觉系统是一个具有复杂功能又极其灵敏的接收器,同时它 又能选择性地接收外界的声音,并加以分析判断【2 0 1 。但是这些复杂又 精细的过程都是跟人类大脑的作用密切相关的,所以人耳听觉特性涉 及生理声学和心理声学多方面的问题。据统计,人耳能感知的声音频 率范围约为1 6 h z 1 6 k h z ,根据年龄段不同,青年人上限可至2 0k h z , 老年人则只有1 0 k h z ,如图2 2 所示,曲线直观上地表示出安静环境 基于变换域的数字音频水印技术研究 下人耳听觉的频率特征2 1 1 。由图2 2 可以看出,人耳对频率范围大约 在2k h z 4 5k h z 这一频段的声音存在“低谷 ,即频率高于或者低于 此频率范围,人耳的听觉灵敏度会逐渐下降。声音是客观存在的,但 是由于人类的主观感知与客观的实际并不是一致,所以现代音频技术 中常采用符合心理声学特征的感知模型,如m p e g 1 心理声学模型 笙 1 o 2 1 3 人耳掩蔽效应 图2 2 人类听阈曲线 人类听觉中存在一种现象,即当两个强度不同的声音同时存在 时,弱声音会受到强声音的干扰或阻碍,也就是弱声音被强声音掩盖, 这就是听觉掩蔽效应【2 1 。 在时间上相邻的两个声音之间发生的掩蔽效应称为时域掩蔽,下 文中提及的回声隐藏技术就是利用了时域掩蔽效应【2 1 。时域掩蔽包括 前掩蔽和后掩蔽,又称为超前掩蔽和滞后掩蔽。前掩蔽指的是在强声 音到达之前弱声音已经被掩盖而不可闻,其间间隔很短,一般在 3 m s 2 0 m s 以内【2 1 1 。后掩蔽则是指在强声音到达之后弱声音不可被听 硕士学位论文 见,其间间隔比前掩蔽要大些,一般在5 0 m s 1 0 0 m s 以内【2 1 1 。这些现 象都是跟大脑处理信息需要一定时间有关。 频域掩蔽指的是,当两个音频信号在同一时刻出现,并且它们的 频率相近,则较强的信号会使较弱的信号不可被听见。这种掩蔽在高 质量的音频编码中经常被采用。 2 2 数字音频水印常见算法 从水印嵌入的域上来看,基于原始音频嵌入的音频水印可分为时 间域水印和变换域水印两种。 2 2 1 时域算法 1 9 9 6 年,w b e n d e r 等人提出了最低有效位的思想。最低有效位 即是指最不重要位,在音频信号的采样值中,存在一定量的最不重要 信息。此方法的主要思想就是把水印信息和载体音频信号分别看成两 个比特流序列,在水印嵌入过程中,用水印信息的二进制位来替换载 体音频信号的最低有效位,从而达到水印隐藏的目的。这种方法在经 过很多学者的研究在算法上有了一定的改进【2 2 】。 同年,w b e n d e r 和d g r u h l 等人提出了回声隐藏法【2 3 1 。从物理学 角度讲,声音在遇到障碍物之后反射,会形成回声,将回声引入数字 信号概念模型得到的表达式如下式2 1 所示: y n 】= s n 】+ 五木s n m 】( 2 1 ) 其中y n 】是携带回声的语音信号,s n 】是原始的语音信号,入则为 1 0 基于变换域的数字音频水印技术研究 回声的幅值,m 为延时参量。如文中2 1 3 所提到的,回声隐藏思想 正是在人类听觉系统的时域滞后掩蔽性的基础上提出的,通过将需隐 藏的信息嵌入到已引入回声的音频信号中来实现。表2 1 列出了时域 两种主要算法的比较结果。 表2 1常见时域主要算法的比较 分 不可 类 算法感知鲁棒性 嵌入算法复 性 量杂度 最低较差,容易被滤波、量化、压缩、噪 有效较好声、重采样等一般的信号处理攻击并较大 容易实 时位法 破坏 现 域 对随机噪声、滤波、重采样和有损压 算 回声 法 缩等具有较好的鲁棒性;但很容易被 隐藏较好较大较高 法 检测出来,人为篡改均会降低水印提 取的准确率 2 2 2 变换域算法 在信号处理方法中,为了更加准确地分析出某些信号的特征参数, 经常对信号进行一些变换运算,比如傅里叶变换( f f t ) 、离散傅里 叶变换( d f t ) 、离散小波变换( d w t ) 、离散余弦变换( d c t ) 、复倒谱变 换( c c e p s ) 等【2 1 。这些变换为信号分析提供了很大的发展空间,于是 数字水印技术里也越来越关注变换域算法的研究。将信号通过变换运 算得到相应的频域信号,然后选择相应的频域信号里的适当频段系 数,对其加以适当的修改来实现水印数据的嵌入。一般而言,信号在 变换域里存在低、中、高三种区域系数,在水印嵌入时选择中频系数, 因为高频系数不稳定,很容易遭到破坏;而低频系数的不可感知性较 差,对其的修改会影响原始音频的感知效果。当然,最终选择取决于 硕士学位论文 不同的变换运算所体现出来的频域特征。为了保障水印算法的鲁棒性 和不可感知性,根据嵌入强度来改动低中频系数是可行的方法。对于 以上几种变换运算的数学原理及模型,下文在具体的算法改进和研究 中将做详细介绍。表2 2 列出了常见几种变换域方法的算法特点,并 进行了归纳比较 2 4 - 2 8 】。 表2 2 主要几种变换域方法的特点比较 不可 嵌入算法复杂 分类算法感知鲁棒性 量度 性 d f t 域 好 具有一定的稳健性,但跟嵌入 较小较易实现 方法区域频段的选取关联很大 透明性好,能平滑功率谱密度, d c t 域 较好但稳健性随所选频段系数而有较大较简单 变 方法 所不同 换 具有多分辨率特点,很适合音 域 d 玎 较好频信号的处理方法,较强的健较大较大 算 域方法 法 壮性 能将卷积特征信号转换成加性 c c e p s 很好 线性特征,且复倒谱系数的不 较大 计算较复 域方法相关性很好,具有较好的鲁棒 杂 性 2 2 3 混合算法 基于以上几种变换运算的单独域算法现己存在很多。近几年,算 法的鲁棒性与感知性的平衡矛盾困扰很多研究学者,于是人们开始在 混合域寻找出路。例如将d c t 域算法和d w t 域算法相结合,使水 印隐藏的更加深层不被感知【2 9 】;采用小波变换( d w t ) 与复倒谱变换 ( c c e p s ) 相结合,在小波变换的基础上将水印嵌入,再将重构后的音 频信号进行复倒谱变换,从而实现水印的盲检测和提取3 0 】;a l i a 1 h a j 3 1 】等人则提出了将奇异值分解( s v d ) 算法与小波变换相结合, 1 2 基于变换域的数字音频水印技术研究 从而实现稳健水印的嵌入,都是为提高水印的鲁棒性和不可感知性。 2 3 数字音频水印评价指标 2 3 1 主要评估性能 一般而言,一个成功的数字音频水印应该满足以下几个主要要求 3 2 - 3 5 : 1 ) 稳健性也称鲁棒性。从实际应用角度讲,稳健性是考量一个 水印算法的最主要的因素。它是指水印在经过压缩、滤波、重 量化、剪切等信号处理或攻击之后能够检测出水印的能力。 2 ) 不可感知性也称透明性。相比图像水印,对音频信号嵌入水 印,类似于加入噪声,所以从听觉上没有被感知的水印系统是 符合实际需求的,也就是说,水印的嵌入不应该影响到原始载 体音频的听觉质量,这是数字音频水印系统必须考虑的方面。 3 ) 数据嵌入量也叫数据容量,是指在某单位时间范围内所能够 嵌入的水印信息量。对音频而言,数据嵌入量是指一秒钟的传 输过程中所包含的水印比特数。而在实际应用中,这个参量一 般取决于具体的算法、参数的选择及原始音频的类型等因素。 4 ) 算法复杂度不言而喻,这个参量是从水印嵌入的效率上分析 的。嵌入算法的计算是否容易实现,直接影响到该水印系统的 安全性,而且它和具体的实际应用密切相关。 除了以上几点主要要求之外,还包括水印的误码率、重建后的音 频质量、水印的检测、盲检测或明检测等多个方面。但是,在诸多要 硕士学位论文 求里,大多数的要求是处于矛盾又统一的三角平衡关系,如图2 3 所 示,鲁棒性、不可感知性及数据量之间的三角平衡关系。例如,如果 增加水印信号的强度,即数据量,通常会让稳健性受损,而一旦稳健 性降低,音频质量肯定也会受到很大的冲击。因此,通常认为,一个 完美的数字音频水印系统是要在尽量达到以上要求的基础上,寻求各 个要求之间的平衡点,从而协调矛盾。 鲁棒性 。数据量一雩鬻 图2 3 鲁棒性、不可感知性及数据量之间的三角平衡关系 2 3 2 主要评估参数 舒侬= 。t 。g r 品 c 2 2 , 基于变换域的数字音频水印技术研究 2 ) 相关系数,即n c ( n o r m a l i z e dc o r r e l a t i o n ) :这个参数是在对水印系 统进行一定的信号处理或攻击后,为了体现提取的水印信号与原 始水印信号之间的相似性而采用的。如果w m 是指原始水印信号, w m 2 代表提取后的水印信号,其计算公式如式( 2 3 ) 所示: n c = 譬堕里 ( 2 - 3 ) 乙w m i 。w m i 除以上两种主要的评测参数之外,还包括主观上的评测方法。一 般而言都采用w l r t h n 在1 9 8 6 年提出的主观平均判分法( m e a n o p i n i o ns c o r e ,m o s ) ,所得的分值称为m o s 值3 8 1 。其具体方法是: 将原始音频、加水印后的音频以及原始音频的其他格式音乐文件,分 别给5 1 0 个人盲听,即在不知道所听音乐为何种的情况下,参照完 全没有处理的原始音频,按照表2 3 所示的分数情况来给所听的音频 进行打分,分值在1 0 5 0 之间,以此来评测。 表2 3 主观听觉m o s 值描述情况对照表 : m o s 值描述 1 o 非常刺耳 2 0 刺耳 3 0轻微刺耳 4 0可感觉但不刺耳 5 0不可感觉 从上述描述来看,此种方法具有较强的主观因素,因此并不能作 为很好的判断手段。此外,还包括误码率( b e r ) 、峰值信噪l l ( p s n r ) 竺 寸0 l 硕士学位论文 2 4 同步问题 2 4 1 同步的含义 在数字音频水印技术中的同步问题有两种解释:从数字水印的检 测角度讲,可理解为标识水印信号特征区域以及与原始音频信号同步 传输的同步标记;从攻击角度讲,则解释为在遭受攻击后,水印信号 相对于原嵌入位置所产生的偏移或缺失,即水印信号与音频在时间轴 上的不同步。 同步标记指的是利用同步码、扩频码、穷举检索、语音信号特征 参型3 9 】等方案来标识水印信号在原始音频中所嵌入的特征区域,有利 于水印信号的检测,确定其起始位置并予以提取。而在以上几种同步 标记信号方案中,利用通信技术中的同步码方法是最优最广泛应用 的。 同步攻击是指对嵌入水印后的音频进行剪切、重采样、滤波、时 间收缩、加噪等攻击后,致使音频在传输过程中出现不同步情况或者 信息偏移或缺失情况【4 0 】。目前,同步攻击问题已成为数字音频水印技 术中重要的研究方向。 2 4 2 同步攻击问题的现状 由于同步攻击对时间轴性质的音频信号会引起严重的同步错误, 越来越多的研究者开始关注同步算法的研究与改进。张国武【3 9 1 等人提 出了一种基于小波变换的同步音频水印改进算法,该算法在时域嵌入 基于变换域的数字音频水印技术研究 同步码信号,再对已分帧的音频信号进行小波分解,将量化后的水印 序列嵌入到小波高频分量中,通过调整量化步长的值来平衡水印的稳 健性和不可感知性的矛盾。针对时间同步问题,王峰 4 0 1 等人提出了一 种新的抗同步攻击的盲音频水印方案,该方案利用音频的恒定物理量 刊邻域数据值之和的大小来作为同步标记,在d c t 域结合掩蔽 特性来嵌入图像水印信号,并对嵌入水印后的音频进行了一系列的时 间同步攻击,实验结果表明该方法具有较强的鲁棒性。刘海燕【4 1 1 等人 提出了一种抗随机剪切的小波域音频水印算法,该算法将原始音频按 帧进行离散小波变换,提取小波低频系数并计算绝对平均值,然后用 相应的绝对平均值与低频系数比较来嵌入水印信号。李燕犁4 2 1 等人根 据语音参数模型,采用基于h i l b e r t h u a n g 变换的基音周期检测方法 实现基音脉冲点的精确定位,从而来确定水印嵌入的位置,这样不需 要用到额外处理的同步码信号,并且可以实现水印信号的自同步性 能。针对m p 3 压缩的攻击问题,王向i g h t 4 3 l 等人提出了一种基于混合 域的抗m p 3 压缩算法,该算法在抗m p 3 压缩上表现出较好的鲁棒性, 但是不能权衡其他攻击所造成的损害。为了提高水印嵌入的智能性和 稳健性,人工神经网络方法也越来越受到研究者们的关注,m a h a c 【删 等人基于神经网络和心理声学模型,提出了一种小波域的盲水印算 法,利用神经网络模型提高了水印嵌入的自适应性,心理声学模型的 应用则保证了水印嵌入后的不可感知性,与小波域算法的结合使得整 个算法的抗同步攻击性得到了有效地提高。 硕士学位论文 第三章基于混沌的复倒谱域自适应双重音频水印算法 3 1 引言 第二章介绍了几种典型的水印算法,并对其分别进行了实验分析。 这些算法在近几年的理论研究上起到了积极的促进作用,但是经过许 多的实际应用验证发现这些算法的安全性和鲁棒性还存在一定的不 足。目前,关于数字水印的多重嵌入问题的研究较少,大部分的水印 方案中,水印的嵌入位置由算法确定,第二次水印的嵌入可能会使第 一次嵌入的水印遭到破坏4 5 1 。以往,在数字图像水印技术中,经常利 用混沌映射产生随机序列来作为嵌入载体图像中的水印信号m 】,本章 节将在以往研究的基础上,采用混沌序列对水印图片进行加密以提高 水印的安全性,并在复倒谱域按照相同方法前后两次嵌入不同内容的 水印图片,不仅标识了版权者多种信息,而且验证了算法的鲁棒性。 3 2 基础理论 3 2 1 混沌理论 混沌是发生在一个确定系统中的伪随机运动。l o g i s t i c 混沌映射 是一类被广泛研究的动力系统,定义如式( 3 1 ) 所示: x k “= u x 七( 1 一) ( 3 1 ) 其中u 称为l o g i s t i c 参数,且o u 4 ,x k ( o ,1 ) 。当3 5 6 9 9 4 5 e t l l ,则此段作为嵌入帧,否则,弃 之不用,即不做任何改动。 3 3 3 水印的嵌入 基于3 2 节中的理论,先将原始音频和原始水印进行预处理,按 照图3 3 完成水印的嵌入过程,具体的嵌入步骤如下: 蔓茎 剖 ;震耋茎赣嚣 混沌序列 产生机制 原始水印 l o g i s t i c 混 沌序列 复倒谱变换l 。均值调制i 、l 逆复倒谱变换 卜刊卜刊 ( c c e p s ) i 7 嵌入l7 i ( i c c e p s ) 加密后 的水印 含水印 的音频 图3 3 水印嵌入流程原理图 1 ) 先将水印信息转化为二进制码流,用w m l ,w m 2 表示水印l 和水 印2 ,将其定义为w m = w m ( i ) 1 w m ( i ) e ( 0 ,1 ) ,o i k ) ,其中k 为水印 信息二进制码流的长度。降维后与同样降维处理的同样大小的 l o g i s t i c 混沌序列( x o = o 3 2 5 ,u = 3 9 为密钥) 进行加密,生成新的二 硕士学位论文 值水印序列用于嵌入。 2 ) 将原始音频分为帧长为n 的若干帧,其中帧长n 视为第二个密钥。 3 ) 根据3 3 2 节所示选取嵌入帧x ( n j ) ,x ( n j ) 表示选定的第j 帧的第 n 个采样点,其中n = l ,2 ,3 mj = 1 ,2 ,3 l ,l 为选定后的帧数。 水印信号一定的情况下,分段能量阈值e t l l 可以选的相对大些,从 而获得较好的鲁棒性。 4 ) 对选定帧x ( n j ) 做复倒谱变换,用c ( n j ) 表示第j 帧音频的第1 3 个倒 谱系数,n = l ,2 ,3 mj = 1 ,2 ,3 l ;并求各帧的复倒谱系数均值 c i 。 5 ) 利用统计均值调制法嵌入水印1 : 若w m ( i ) = l ,且如果c i t h c ( 刀,歹) = c ( n ,j ) 一( 刀l c p ) 一q ( 3 - 5 ) 式中t h 为嵌入调制阈值,c p 为每一个嵌入帧的复倒谱系数平均值, q 为嵌入因子。大量实验证明嵌入阈值的选取对水印的不可感知性和 鲁棒性是有一定影响的,因此本文将阈值不仅作为嵌入判断条件,并 且参与了均值调制。此步骤结束即是完成了第一重水印的嵌入过程。 6 ) 重复步骤( 3 ) 至( 5 ) ,进行水印2 的嵌入; 7 ) 完成步骤( 6 ) 后即实现了第二重水印的嵌入,然后对已经嵌入双重 基于变换域的数字音频水印技术研究 水印的复倒谱系数进行逆倒谱变换( i c c e p s ) ,从而得到含多重水 印

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论