(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(电路与系统专业论文)混沌密钥在AVS音频数字水印中的应用研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着互联网以及多媒体通讯的发展,对多媒体产品版权保护和鉴别要求越来 越强烈,而数字水印技术是解决数字版权保护问题的有效手段。目前,对静态图 像数字水印技术的研究己经日趋成熟,音频数字水印也正成为新的研究热点。 音频数字水印技术是通过一定的算法加入标记,标记可以是有意义的伪随机 序列,有意义的二值图像等,并对其检测和提取,混沌系统由于具有良好的伪随 机特性、对初始值及控制参数的敏感性等系列特性,广泛应用于信息隐藏,通信 系统、密码学等领域 本论文研究和实现了两种基于混沌密钥的a v s 音频m d c t 域的数字水印嵌 入和提取算法:将混沌映射模型和初始参数作为密钥生成混沌序列直接作为水印 信号嵌入;利用6 4 x 6 4 二值图像经过混沌序列加密生成数字水印,以有效地改 善水印结构及增强保密性。同时利用模2 数值运算实现了音频水印的盲检测 采用m a t l a b 7 1 开发工具,以a v s 标准的编解码程序作为实验平台,对上述 所有的方法进行了验证,仿真实验结果表明,本论文的算法具有较强的鲁棒性和 不可感知性,水印嵌入容量大,提取水印时不需要原始音频信号的参与,并且对 重采样、滤波、量化、a v s 压缩、解压缩等攻击具有较强的稳健性,是可行的 数字音频水印算法。可以根据具体需求,用于a v s 数字音频作品的版权保护。 关键字:音频数字水印,版权保护,a v s - p 3 ,混沌密钥 a 8 譬r r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to ft h ei n t e m e ta n dm u l t i m e d i a , t h ep r o t e c t i o nf o rt h e i n t e l l e c t u a lc o p y r i g h tb e c o m e sm o r ea n dm o r eu r g e n ta n di m p o r t a n t , m e a n w h i l e ,t h e d i g i t a lw a t e m m s k i n gi s t h ee f f e c t i v em e a n st os l o v et h ei n t e l l e c t u a l c o p y r i 曲t p r o b l e m s r e c e n t l y , r e s e a r c ho nt h es t i l li m a g ew a t e r m a r k i n gt e c h n o l o g yb e c o m e s m o r ea n dm o r em a t u r e d ;w h i l et h er e s e a r c ho na u d i od i g i t a lw a t e r m a r k i n gi s b e c o m i n gah o tt o p i c a u d i od i g i t a lw a t e r m a r k i n ge m b e d st h ew a t e r m a r kw i t hc e r t a i na l g o r i t h m , t h e w a t e r m a r kc a l lb et h ep s e u d or a n d o ms e q u e n c e s ,t h e nd e t e c ta n de x t r a c tt h e w a t e r m a r k t h ew a t e r m a r k e dm e d i 扎t h ec h a o t i cs e q u e n c eh a ss o m eg o o d c h 缸a c t c f i s t i c s s u c ha st h er a n d o m n e s s ,t h es e n s i t i v e n e s st ot h ei n i t i a lv a l u ea n dt h e c o n t r o lp a n a m e t e l , e a s i n e s st og e n e r a t e ,t h u s , t l l e ya r cw i d e l yu s e di nt h ef i e l do ft h e i n f o r m a t i o nh i d i n g , c o m m u n i c a t i o ns y s t e ma n de n c r y p t i o n t 1 1 i st h c s i ss t u d i e sa n dr e a l i z e st h et w ok i n d so fe m b e d d e da n de x t r a c t i o n a l g o r i t h m sb a s e do i lc h a o t i ck e y si nt h ea v sa u d i om d c td o m a i n t h ec h a o t i c s e q u e n c ec a nb eu s e da st h ew a t e r m a r k i n gu s i n gt h ei n i t i a lv a l u ea n dp a r a m e t e ra s s e c r e tk e y s ,m o l o o v e l - , a6 4 x 6 4i m a g ec a l 3b ee n g l 加) t e dw i t ht h ec h a o t i cs e q u e n c et o i m p r o v et h ed i g i t a lw a t e r m a r k i n gs t r u c t m _ ea n di n c r e a s et h ee n c r y p t i o n m e a n w h i l e , t h et h e s i sr e a l i z e st h eb l i n dd e t c c t i o l lw i t hm o d u l e2d a t ao p e r a t i o n t h ea l g o r i t h mi sv a l i d a t e dw i t hm a t a l a b 7 1u s i n gt h ea v ss t a n d a r de n c o d i n ga n d d e c o d i n gs o f l w a r c t b es i m u l a t i o nr e s u l t ss h o wt h er o b u s t n e s sa n di m p e r e e l v e n e s so f t h ew a t e r m a r k i n g , m o r e o v e r , i t 锄b ee m b e d d e dw i 也h i g hc a p a c i t yu s i n gb l i n d d e t e c t i o n m c a n w h i 【l e , i tc a nk e e pt h eg o o dp r o p e r t ya f t e rt h ef i l t e r , r e s a m p l e , r e q u a n t i z a t i o n , a n dt h ea v se n c o d i n ga n dd e c o d i n ga t t a c k s i ti sp o s s i b l et op r o t e c t t h e a v sa u d i o c o p y r i g h ta c c o r d i n gt ot h es p e c i f i cr e q u i r e m e n t s k e yw o r d s :a u d i od i g i t a lw a t e r m a r k i n g ;c o p y r i g h tp r o t e c t i o n ;a v s - p 3 ;c h a o t i ck e y 第1 章绪论 1 1 论文的研究意义 第1 章绪论 数字音视频编解码技术标准工作组【”( 简称a v si 作组) 由国家信息产业 部科学技术司于2 0 0 2 年6 月批准成立。工作组的任务是:面向我国的信息产业 需求,联合国内企业和科研机构,制( 修) 订数字音视频的压缩、解压缩、处理 和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解码技术, 服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互 联网宽带流媒体等重大信息产业应用。a v $ 音频描述了高质量音频编码表示方 法,及其高质量音频信号解码方法,称为先进音视频编码( a v s ) 用于高分辨 率数字广播、商密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒 体业务 a v s 标准包括系统、视频、音频、数字版权管理1 2 j 等四个主要技术标准和一 致性测试等支撑标准在2 0 0 3 年1 2 月1 8 1 9 日举行第七次会议上,工作组完成了 a v s 标准的第一部分( 系统) 和第二部分( 视频) 的草案最终稿( f e d ) 。2 0 0 4 年度第一季度( 第8 次全体会议) 正式开始“数字版权管理与保护”标准的制定。 2 0 0 5 年初( 第1 2 次全体会议) 完成了第三部分( 音频) 草案。2 0 0 6 年2 月2 2 日, 数字音视频编解码技术标准工作组( a v s 工作组) 收到国家标准化管理委员会发 给信息产业部科技司的通知,信息技术先进音视频编码第2 部分:视频已经 通过国家批准,成为国标,国家标准号g b t 2 0 0 9 0 2 - 2 0 0 6 ,于2 0 0 6 年3 月lb 起实 施。至此,数字电视乃至数字化音视频产业共性最强的基础标准一锤定音,我国 叶一五”期间重点培育数字化音视频产业已经有标可循。a v s 最直接的产业化成 果是未来1 0 年我国需要的数亿颗解码芯片,最直接效益是每年节省数十亿美元的 专利费 数字水印是一种有效的数字产品版权保护和数据安全维护技术,是信息隐藏 技术研究领域的一个重要分支它将具有特定意义的标记( 水印) ,这个标记可以 是作者的序列号、公司标志、有特殊意义的文本,图像、声音等,然后利用数字 嵌入的方法隐藏在数字图像,声音、文档、图书,视频等数字产品中以此来证 第l 章绪论 明创作者对其作品的所有权,并将其作为鉴定、起诉非法侵权的证据,同时通过 对水印的检测和分析来保证数字信息的完整和可靠性,从而成为知识产权保护和 数字多媒体防伪的有效手段。 近年来,利用混沌映射模型p - 6 , 2 9 - 3 1 l 实现数字永印、信息隐藏和掩蔽通讯, 成为信息隐藏领域的一个重要研究方向。只要给定混沌动力系统的初始条件,其 运动轨迹经过闺值化处理,就可以得到混沌序列。混沌序列是实际应用中所需要 的。因为它既有可控的低通特性又具有良好的相关特性。例如,l o g i s t i c , c h e b y s h e v 方程等产生的混沌序列。混沌序列的主要优点如下: ( 1 ) 容易产生,通过改变混沌系统的参数及初始值可以得到数量巨大的序列, 并且序列长度是任意的。 ( 2 ) 保密性强,因为混沌序列没有周期,类似于一个随机的过程,具有宽带特 性,特别是可以利用时空混沌特性增强抗破译、抗干扰能力、具有很强的 鲁棒性等。 ( 3 ) 具有高容量的动态存储能力。 ( 4 ) 混沌序列的产生和复制很方便,只要给出一个混沌迭代公式和一个初值, 就能产生一个混沌序列。 ( 5 ) 具有低功率和宽频谱特性。 ( 6 ) 设备成本低。 以上的优点是其它序列所没有的,也正是这些特点,使得混沌序列在一些场 合得到了广泛的应用。混沌密钥在a v s 音频的应用和研究是涉及信号处理和密 码学、通信理论、编码理论,信号压缩和人类感官感觉理论等高度相交的一个研 究领域。混沌数字水印的应用,能够适应未来信息战的需要,具有广大的发展前 景也具有一定的挑战性。 音频数字水印技术1 7 侧就是利用数字音频信号中的冗余信息,在不影响原始 音频质量的条件下向其中嵌入具有特定意义且易于提取的信息的过程。利用混沌 系统产生的混淹信号作为数字水印信息,并在交换域中有选择她嵌入水印,再经 逆变换得到水印信息该算法具有较强的透明性和鲁棒性,水印检测结果准确, 对给定的几种攻击有抵抗性由于混沌信号具有类噪声、宽频谱等特性,因此弓i 入混沌信号,使得水印产品的安全性得到进一步提高。 2 第1 章绪论 本论文以a v s 数字音频为研究对象,目的是为了形成一个完整的音频数字 水印版权保护机制,同时,这些研究成果同样适用于其它的a v s 音视频标准的 数字媒体类型,希望能促进版权保护的研究和a v s 标准的进展。其次。对多媒 体通信的发展会有很大的促进作用。数字化技术的发展,计算机、通信和广播电 视三个原本各自独立的领域相互渗透和融合,形成了多媒体技术,多媒体技术的 应用与发展,又反过来进一步加速了这三个领域的融合,使数字多媒体通信成为 通讯技术发展的主要方向。数字多媒体通信的发展一方面依赖于网络能传输高质 量的多媒体内容,另外一方面就是多媒体内容合法性的保障,即网络安全和网络 q o s 的支持。数字版权保护是网络安全中的重要研究内容,它的发展和成熟将决 定着多媒体通信网络的用户数目。 当前,大多数水印技术的研究集中在静态图像上,在音频方面的研究刚刚起 步,但关手数字音频的版权保护阮删无疑是未来数字水印技术最重要的应用方 向。特别是对于目前研究热门的a v s 标准,研究和实现与a v s 标准的音频码流, 以及a v s 编解码器相结合的数字水印技术,显然会在数字信息方面有很大价值。 1 2 音频数字水印的特征和应用领域 1 2 1 音频数字水印的概念和特征 数字水印技术,从狭义上来讲是将一些特定信息,按照某种方式植入宿主信 息中。当宿主信息在网络传播或其它状态下被非法复制从而产生版权纠纷或信息 被非法篡改时,通过相应的算法提取出该数字水印,从而验证版权的归属或宿主 信息的完整性,确保著作权人的合法利益以及鉴别信息的真伪宿主信息可以是 任何一种数字媒体,如图像、音频、视频或一股性的电子文档等。数字水印是嵌 入在数字产品中的数字信号,水印的存在要以不破坏原数据的欣赏价值、使用价 值为原则 数字水印技术有其固有的特点和研究方法下面简要给出数字水印一些常见 的特性: ( 1 )鲁棒性:指在经历多种无意或有意的信号处理过程后,数字水印仍能持完 整或仍能被准确鉴别可能的信号处理过程包括信道噪声、滤波、二次采 第l 章绪论 样、位移、幅度变化丛及有损压缩编码等。对于本文研究的音频数据,还 存在一些特有的处理和攻击方法,必须保证水印方案对这些处理和攻击的 鲁棒性在媒体数据上的任何处理,只要没有将数据破坏到失去使用价值 的缝步,都应该不会破坏所嵌入的水印。 不可感知性:水印的存在不应使所保护的媒体数据出现明显干扰或质量下 降。不可感知性与信息容量之间存在着矛盾,随着水印信息量的增加,作 品的质量必然下降,因为从一定意义上说,水印信息相对于原始信息,本 身就属于噪声。 安全性:安全性测试主要是对破解水印算法的时间及复杂性进行评估,以 此作为水印安全性的指标。如果不知道水印密钥,哪怕是知道水印嵌入和 提取算法,也不能够检测、修改或者删除水印。 密钥唯一性:不同的密钥应当产生不等价的水印。 不可逆性:密钥不能够通过水印信息和水印算法逆推出来,这就意味着对 于任何水印信号,很难找到其他有效水印与其等价。 产品依赖性:在相同的密钥条件下,当水印算法用在不同的产品时,应该 产生不同的水印信号。即对特定的密钥和载体生成特定水印信息。 音频水印首先具有上述数字水印的一般特征,其次。还有以下一些特殊的性 ( 1 )实时处理性,水印嵌入和提取应该具有低复杂度。 ( 2 ) 随机检测性 与a v s 音频编码标准相结合音频数据由于其数据量极大,在存储、传播中首 先要对其进行压缩,现在最常用的音频压缩编码标准是m p e g - 1 , ,m p e g - 2 、 m p e g 4 和a v s 。如果是在压缩音频中嵌入水印,很显然要与音频的压缩编码标 准相结合,如果是在原始音频中嵌入水印,由于水印嵌入是利用音频的冗余数据 来携带信息,而音频压缩编码则需要去除音频中的冗余数据,如果不考虑音频压 缩编码标准两盲目地嵌入本印,烈嵌入的水印缀可铯在编码过程中就完全丢失 了 4 圆 卿圆 第l 章绪论 1 2 2 音频数字水印的分类和应用 通常对于音频水印,有如下的分类: ( 1 )按载体类型分:基于原始音频方案和基于压缩音频方案。基于原始音频的 水印算法是对未经编码的音频流数据直接进行处理,在原始音频数据的时 空域或变换域中嵌入水印。基于压缩音频的水印算法则与某种音频压缩标 准,如常见的m p e g - 1 、m p e g - 2 、m p e g - 4 和a v s 相结合,在编码音频数 据中嵌入水印。本文重点讨论基于a v s 的音频水印。 ( 2 ) 按嵌入域分:空域方案和变换域方案。空域方法是用待嵌入的信息替换载 体信息的冗余部分。变换域方法是在宿主信号的某个变换域,如m d c t 域 或d 厂r 域中嵌入信息,变换域方法的优点在于: 在变换域中嵌入的信号能量可以分布到空域的所有数据上; 变换域中,人的感知系统的某些掩盖特性更方便地结合到编码过程中; 变换域方法可以与音频压缩标准兼容,这一优点使它利用在a v s 音频水 印应用中尤其突出。 ( 3 ) 按水印特性分:鲁棒水印方案和脆弱水印方案。鲁棒水印在经受各种有意 和无意的攻击之后,仍然能够有效检测或提取;脆弱水印则对于信号的改 动比较敏感,主要用于篡改提示。在本论文中,主要针对鲁棒水印进行讨 论。因此,必须考虑在音频上的各种可能的攻击处理,才能实现较好的水 印方案。 ( 4 ) 按检测时是否需要原始宿主信号分;盲水印( b l i n dw a t e r m a r k ) 方案和非盲 水印方案。原则上讲,使用原始宿主信号,更有利于检测和提取信息。但 是,检测时用到的原始宿主信号容易暴露给恶意的攻击者。而且,在某些 应用中,并不能获得原始的宿主信号即使能够获得原始宿主信号,但是 由于数据量巨大,要使用原始宿主信号也是不现实的。本论文中主要研究 和实现盲音频水印技术 ( 5 ) 按密钥分:对称水印( s y m m e t r i cw a t e r m a r k ) 方案和非对称水印( a s y m m 曲i c w a t e r m a r k ) 方案若嵌入和提取采用相同的密钥,则称为对称水印,否则 为非对称水印或公钥水印( p u b l i ck e yw a t e r m a r k ) ( 6 ) 按水印的可见性分:可见水印方案和不可见水印方案。 第1 章绪论 在2 0 世纪8 0 年代,索尼和菲利浦公司首次提出了数字媒体版权保护的方案 s c m s ( s e r i a lc o p ym a n a g e m e n ts y s t e m ) 。数字水印技术也是在继数字隐藏技术之 后提出的一种数字媒体版权保护方案,发展到现在它的应用领域已经不局限于版 权保护,而且各国研究者也在这些方面散出了杰出的贡献。其本身钓应用领域包 括如下: ( 1 ) 数字作品的版权保护 ( 2 ) 商务交易中的票据防伪 ( 3 ) 数据完整性保护 ( 4 ) 隐藏数据标识 ( 5 ) 数据隐藏 ( 6 ) 内容保护 ( 7 ) 法庭认证 ( 8 ) 使用控制 1 2 3 音频数字水印的常见攻击 对于音频数字水印,常见的攻击1 1 9 2 2 2 4 1 手段和信号处理方法有: ( 1 ) 加入嗓声:可以加入高斯白噪声或者有色噪声。 ( 2 ) 剪切:对于静音做非常小的剪切,并不能影响声音和视频的质量,但是对 于要求同步性的水印是一个有效的攻击。 ( 3 ) 滤波:滤波操作非常频繁的应用于声音和视频中,例如,增强某一特定频 率元素。降低某一频搴的元素。我们通鬻愿的m p 3 搔放器w i n a m p 中带有 的均衡器本质就是滤波。 ( 4 ) 时域重采样;是一种比较有效的攻击手段 ( 5 ) a v s 压缩编码:利用a v s 音频编码器对声音信号进行压缩,也是一种有效 的攻击水印和压缩是一对矛盾,对添加水印的一个重要的要求就是所加 的水印是不可被感知的。而压缩的作用就是把这种冗余的信息去掉。a v s 压缩算法的效率比较高,它充分利用了可定量分析的人类听觉模型,把人 耳听不到的信息( 感知冗余信息) 和被掩蔽的声音信号去掉了,而这正是某 些水印算法加入水印的位置。因此,a v s 压缩算法对水印检测的影响较大 6 第1 章绪论 案。 本论文研究的主要内容是基于压缩音频条件下的不可见的鲁棒的盲水印方 1 3 音频水印研究现状和进展 作为音频数字水印信号,必需具备如下特性:( 1 ) 听觉不可觉察性;( 2 ) 密 钥k 唯一性;( 3 ) 数字水印的不可逆性;( 4 3 数字水印的鲁棒性。 目前文献 1 5 勰3 3 j 刀中采用的数字水印信号多种多样,具体可归纳如下:( 1 ) 伪随机序列;( 2 ) 高斯自噪声序列;( 3 ) 有特定含义的数字水印信号;( 4 ) 有意 义的二值图像作为数字水印信号;( 5 ) 将图像调制分解,系数作为数字水印信号; ( 6 ) 采用自相似特性的图像作为水印信号。 其中最常用的方法是采用伪随机序列作为数字水印信号,伪随机序列具有类 似自噪声的性质,但又具有周期性和规律性,可以人为的加以产生和复制,由于 移位寄存器的输出是由初始状态和反馈逻辑直接决定的,而且任取一段输出不可 能预测其它的输出,因此常选用m 序列或m 序列,g o l d 序列等作为数字水印信 号。m 、g o l d 序列自相关性好,但互相关性却不够好,因此不利于水印的正确检 测,且m 序列和g o l d 序列的产生的数量有限,不能用于大规模的应用。传统的 伪随机数水印产生技术嵌入作者版权信息的方法,不具备随机序列对初值的敏感 性,因此可能被伪造 混沌映射产生的混沌序列的自相关和互相关特性都较好,而且用作数字水印 信号还具有三个明显的优势:一是易于产生,仅需采用一维混沌映射,如l o g i s t i c 、 k e n t 、c h e b y s h e v 映射等等,方程简单,水印信号生成速度快;二是数量众多, 混沌系统模型不同,参数和初值的选择不同即可得到互相关性为0 的序列,可满 足数字水印信号大规模应用的需求量:三是保密性好,如果不知道混沌模型及相 关参数,几乎不可能破译,因此混沌数字水印信号具有不可逆性。因此,混沌序 列是最适合用作数字水印信号的序列,为增强水印的鲁棒性,可以在嵌入水印过 程中引入扩频通信原理由混沌序列特性表明,可被应用于a v s 音视频多媒体数 据数字水印系统中的水印信号。 早期的音频水印算法一般直接在音频的时域上嵌入信息。时域上嵌入的好处 是比较直观、计算复杂度较低,但是水印的稳健性和不可察觉性的矛盾难以解决。 7 第1 章绪论 相对于时域嵌入,交换域嵌入是目前研究的热点。这主要是因为变换域嵌入可以 把水印能量扩散到多个样本信息上,改善了水印的稳健性和不可察觉性。此外, 在变换域嵌入具有更大的灵活性。通过选取适当的交换域,可以提取出代表音频 本质特征的系数,如可以在音频的低频系数上嵌入达到提高稳健性的目的。可以 在中频系数上嵌入达到半脆弱水印的目的,也可以在高频系数上嵌入达到脆弱水 印的目的。而时域上的嵌入只能通过改变嵌入强度来达到稳健性和不可察觉性的 目的。也有一些基于音频压缩域( 如m p 3 域) 的算法研究,但由于在压缩域已经滤 掉了音频信号的大部分冗余信息,且水印编码与解码系统过于复杂,所以这方面 的研究进展并不是太大。 剑桥大学p e t i t c o l a s 等【4 s l 提出了一种叫做”m p 3 s t e g o ”的水印技术。m p 3 s t e g o 在压缩过程中将水印信息隐藏进m p 3 文件,隐藏过程发生在第三层编码的核心。 这种方法鲁棒性较差,作者承认任何攻击者可以通过解压比特流再重新压缩来除 去隐藏的水印信息。另一方面,m p 3 s t e g o 实际上并没有在压缩域上自接植入水 印,被处理的对象是p c m 数据,水印是在压缩过程中被植入的,因此很耗时。 q i a o 等 4 9 1 提出了两种将水印自接嵌入到m p e g 音频流中的方法:第一个将 水印嵌入到m p e g 音频流的比例因子( s c a l ef a c t o r s ) 中:第二个将水印嵌入到 m p e g 编码的样本数据中。比例因子是使样本完全利用量化范围的乘数,共6 3 个级别( 0 6 2 ) 。当比例因子级别增加时声音增强,减小时声音变弱。实验表明比 例因子级别小的改变( 如增加或减少1 ) 不会被人感觉到,第一个方法的根据就在 于此。水印嵌入过程非常简单,就是把比例因子与相应的水印比特位相加。另一 个方法的基本思想是把水印比特序列加到编码样本序列上,可是,这些编码样本 对改变是非常敏感的。实验表明,如果把每个编码样本加l 或减l ,引入的失真 就很容易被人耳检测到。为了解决这个问题,作者引入了一个尺度参数s p ;在 每s p 个样本上,随机选择l 或2 个样本来嵌入水印。选择一个好的尺度参数可 以使失真最小,实验也验证了这一点。 x u 等 s o l 提出在压缩格式音频未完全解压缩状态下基于音频掩蔽效应自适应 地嵌入数字水印使用这种方法,水印与音频内容高度相关并且植入速度会非常 快 k o u k o p o u l o s 等【5 1 1 提出一种直接作用到m p 3 压缩域上的盲检测音频水印技 s 第l 章绪论 术。该算法把水印放置在压缩文件的比例因子域而不是直接嵌入到音频数据中, 这样就克服了p c m 数据域上算法不能抵抗压缩,再压缩攻击的缺点。该算法既 可用于版权保护也可用于认证,其最大特点在于证明版权不是简单通过检测嵌入 的水印数据本身,而是使盗舨者知道要提取出水印在计算上几乎是不可能的。需 要说明的是该算法不能抵抗解压缩再重新压缩的处理,但实际上盗版者通常不会 这样做,因为会引起音频听觉质量的严重下降。 其它的压缩域算法还有以下几种:文献l 明在m p e ga u d i ol a y e r2 压缩过程 中嵌入水印;文献【5 3 】在矢量量化过程中植入水印;文献f 5 町将水印直接嵌入到 s i g m a d e l m 调制比特流中;文献i s s l 在m p e o a a c 压缩过程中通过修改压缩系 数来植入水印;文献【蚓中的水印植入方法类似予m p 3s t e g o0 上直接植入水印, 被处理的对象是p c m 数据,水印是在压缩过程中被植入的,因此很耗时。 扩频水印方案5 7 - 5 9 也是流行的水印嵌入策略之一,目前已经得到了比较深入 的研究。该方案的主要思想是在音频中嵌入伪随机序列( p s e u d o - n o i s es e q u e n c e ) , 然后通过计算水印音频与随机序列的相关值来检测水印,最大长度序列是最常见 的伪随机序列,俗称m 序列。 音频水印主要常用的变换有离散余弦变换( d c l ) 、离散傅利叶变换( d f t ) 【6 l j 、离散小波变换( d w t ) 1 ,q 、改进离散余弦变换( m d c t ) t 6 3 巧习。目前对d c t 、 d f t 、d w t 等变换域的研究已经比较深入,而m d c t 变换作为一种新颖而有效 的时频分析工具也成为了研究的热点。 目前,对数字水印1 3 2 卅领域的研究主要集中在水印算法的设计上,大致可分 三类;其一是水印生成技术,利用混沌密钥研究如何产生一个与作者和作品直接 有关的信息( 一般是一个随机信号) ;其二是水印嵌入技术,研究如何在空域、变 换域、混合域等利用对称密钥或公开密钥实现把水印嵌入到原始载体信息中,得 到隐秘载体嵌入水印信息而获得好的水印特性;其三是水印检测,提取技术, 水印检测、提取算法利用相应的密钥从隐蔽载体中检测或恢复出水印,没有解密 密钥,攻击者经难从隐秘载体中发现和修改水印本论文主要针对基于混沌密钥 的a v s 音频数字水印算法的研究和实现。具体的系统框图如图l 一1 所示。主要研 究如何有效地从含水印载体中提取出水印信息( 或检测到水印的存在) 。 9 第1 章绪论 水印的嵌入 水印的提取 求印的判定 图1 1a v s 音频数字水印的系统框图 1 4 本论文研究内容 本论文针对a v s 音频信号的特点,在充分理解多媒体数字水印原理的基础 上,同时深刻理解a v s 音频编解码原理的基础上,展开对a v s 音频数字水印 的研究。 简单地介绍了音频数字水印的技术的典型特征、分类、特点、应用领域和国 内外的研究现状,并简单的阐述a v s p 3 标准中的编解码基本原理。 研究对混淹序列在数字水印中应用的相关特性,与当前流行的伪随机序列 m 、g o l d 序列进行比较,研究混沌映射生成数字水印的特点和优点。 研究如何实现混沌密钥在a v s 音频数字水印的嵌入、提取和检测,同时对所 生成的a v s 音频数字水印的攻击算法进行研究,所有的算法必须协调a v s 音频 数字水印的稳健性与不可见性之间的矛盾。 采用m a t l a b7 1 为开发工具,以a v s 标准的编解码程序( a v 3v e r s i o n l o ) 作为实验平台,用m a t l a b 编程。结合音频数字水印的特点以及混沌序列的优势 将混沌密钥引入a v s 标准编解码流中,实现了数字水印的嵌入,提取以及性能的 评估,同时能够抵抗有关攻击。 1 0 第2 章a v s p 3 编解码基本原理 第2 章a v s p 3 编解码的基本原理 2 1a v s p 3 音频立体声编码标准的基本框图 a v s 音频专家组在制订标准时最主要的目标就是在基本解决知识产权问题 的前提下,制订具有国际先进水平的中国音频编,解码技术标准,使a v s 音频编 解码技术的综合技术指标( 包括编码效率、复杂度和延迟等) 基本达到或超过 m p e ga a c 编码技术。 a v s 音频编码器支持8 9 6 k h z 采样的单双声道p c m 音频信号作为输入信 号,编码器编码后的输出码率为1 6 9 6 k b p s c h a n n e l ,在6 4 k b p s c h a n n e l 编码时可 以实现接近透明的音质,编码后的文件可以压缩到原来的1 1 0 1 1 6 。 a v s 音频立体声标准编码框图如图2 1 所示。 l 输入时间信号 石磊翮, 整数时频变换 量化 t 一 后量化方极坐标 立体声编码 二二 上下文位平面 编码 比 特 流 格 式 器 a v sa u d i o 编码音频漉 图2 - 1a v s 音频编码器框图 输入的时间信号是经过心理声学模型处理过的p c m 数据,p c m 数据经过长, 短窗判决、整数时频变换、s p s c 立体声编码、量化、c b c ( c o n t e x t - d e p e n d e n t b i t p l a n ec o d i n g ) 编码后打包成符合a v s 音频标准的比特流输出 n 第2 章a v s - p 3 编解码基本原理 2 2 长短窗判决 a v s 音频标准在编码端推荐一种基于能量与不可预测度的两极窗判决法,其 主要原理为:把输入的一帧音频信号划分为若干个子块,首先在时域内进行第一 级判决,简单分析子块能量的变换情况,满足特定条件后才进行第二步的不可预 测度判决,具有基于能量判决简单和基于不可预测度判决准确的优点,同时该方 法克服了基于能量判决不准确和基于不可预测度计算复杂的缺点,从而在迅速确 定瞬变信号的同时减少了误判。 2 3 整数时频变换 2 3 1 模块描述 a v s 音频专家组在制订标准时考虑到和m p e g 音频保持同步以及以后的无 损压缩扩展,选定整数m d c t ( i n t m d c t ) 作为分析滤波器。i n t m d c t 变换可用来 实现无损音频编码( 1 0 s s l e s sa u d i oc o d i n g ) 或混合感知和无损音频编 马( c o m b i n e d p e r c e p t u a la n dl o s s l e s sa u d i oc o d i n g ) ,它继承了m d c l 变换的所有重要特性:临界 采样( c r i t i c a ls a m p l i n g ) 、数据块叠加( o v e r l a p p i n go f b l o c k s ) 、优良的频域表示音频 信号,对整数点的输入信号经过正向i n t m d c t 和反向i n t i m d c t ( i n t l m d c t ) 后 可以没有误差地完全重构。 a v s 的主要算法还是利用i n t m d c 了而不是用现在比较时兴的小波( w a v e l e t ) 技术。这是因为i n t m d c t 对于蕴含丰富音调的音频来说差不多是最优化的转换 方法。况且小波技术也不是万能的,它所能提供的在时间、频率分辨率方面的平 衡性对于音频数据来说并不是任何时候都处理得很好。 a v s 使用5 0 重叠的i n t m i ) c t j ( e 为时频转换。i n t m d c t 是对m d c t 的一种可 逆整数近似以下给出一种m d c i 和反向m d c t ( m c 砷的实现方法。i n t m d c t 和i n t l m d c t 即由此方法实现。在下文中,为帧长,也即样本块中新样本的数目, 长变换窗日寸为2 0 4 8 ,短变换窗日寸为2 5 6 。 第2 章a v s p 3 编解码基本原理 m d c t 定义为: z 一居誓啡h 伽壁丛号等垫业肼- 0 一1 ( 2 1 ) 帧长为1 0 2 4 或1 2 8 x f m ) :m d c t 频谱系数 册: 频谱系数索引 并: 输入序列 七: 样本索引 ,( 七) :s i n e 窗函数,a v s 所采用的一种特别的窗函数,其公式如下: 啡) 咖氅磐 k - 2 n 一1 ( 2 _ 2 ) 、7 4 7一一 其中是窗口长度。 m t d c r 定义为。 删一啡) 后鬟刖c o s 堕堡警业,2 n 一- ( 2 - - 3 ) i n t i m d c t 采用多个提升矩阵相乘的算法实现,先根据i m d c t 的对称性转换 成i d c t - 1 v 变换【4 4 蜘,i d c t - i v 变换通过矩阵相乘实现 4 6 4 7 嘴。( 譬捌2 刭& 捌00 ”训k z ) i ( i 与s * 廿q 叫, 式中c 譬代表交换长度为的m c r 矩阵,k 。、k :、k ,分别是通过c 茄:计算 得到,h 1 、h 2 ,h 3 是正切函数或者正弦函数所构成的矩阵,p 是排列矩阵,这个 算法所需要的乘加次数非常多,而其实现整型的方法是在每个矩阵相乘后取整。 a v s 采用的类似于m p e g - 2a a c 中的m d c t 变换,而i n t m d c t 是对m d c t 的一种可逆整数近似。包括2 种块长为了防止m i ) c 了变换过程中产生的块效 应,消除时域混迭,获得完全可重构的特性,m d c r 变换采用了5 0 重叠的窗 函数。对于通常的稳态信号,为获得编码效率,采用变换长度较长的长窗= 第2 章a v s p 3 编解码基本原理 2 0 4 8 ,而对于频谱变化迅速的突发信号。为了减小量化失真扩散的“预回声”失真, 将会切换至窗长为n = 2 5 6 的短窗。对于长、短窗相邻时的m d c r 变换,为了保 证长、短窗之间的平稳过渡,窗函数| l 例有一个过渡切换的过程。实际情况中存 在几种可能的窗口重叠方式。最简单的窗口重叠方式就是相同长度窗口5 0 重 叠,以2 0 4 8 和2 0 4 8 重叠为例,如图2 - 2 所示。 n - 4 93 ,4 厂 、“? 7j j 一一、 ,k ? 。1 7 莘 5 , 一 , j。j 图2 - 2 相同长度窗口重叠示例 ( 注:a v s 支持的窗口大小可以包含1 8 1 9 2 个采样点,但必须是2 的幂次) 窗型切换的关键是要求稳态及瞬态信号特性的判断准确度,不准确的切换可 能造成编码效率下降( 稳态信号误判为瞬态信号) 或者出现预回声失真( 瞬态信 号误判为稳态信号) 。a v s 除了判断信号的瞬态特性外,还充分利用前后掩蔽 效应( 即时间掩蔽) ,对p c m 信号加高通滤波,通过与心理声学模型计算的预 回声门限和后回声门限比较决定窗型。 2 3 3 通过d c t i v 实现m d c t 和i m d c t 为实现i n t m d c t ,m d a 嘞m i d c r 被分成两步实现。 ( 1 ) 窗运算( 2 ) 离散余弦变换一第四型( d c t - i v ) 图2 - 3 给出以上两步运算的图示 1 4 第2 章a v s - p 3 编解码基本原理 脚 x ( n w - t ) 卸蚴 x ( n - 1 ) 卸n ) x ( n + n r 2 - i ) 州+ n x ( 2 n - t ) x 凹 x t a v 2 - 1 ) x i i 姒2 ) 图2 - 3 通过窗运算和i v i i ) c t - i v 实现m d c t 和i m d c t m d c t 中的窗运算计算如下; ( x 工( 譬等- + l - 七k ) ) 一( s i n 3 a 吒k lji 式中 盖) 隅纠 q 。( 篆剥。鼍产 i m d c t s b 的反向窗运算计算如下 ( x 黜州一c o s a k s m o ”i f 裂毛) 七一了n 一1 ( 2 - 5 ) 七一i n 一1 ( 2 - 6 ) 七一i n 一1 t m d c t 中的重叠相加( o v c d a p - a d d ) 已经包含在反向窗运算中 d c t - w 定义为 删居) 瞄坐訾业 胁叱肌 此式中是变换的长度。 反向d c r - 定义为: 州- 魔川c o s 学 k - o , , n - 1 ( 2 - 7 ) ( 2 8 ) ( 2 - 9 ) 第2 章a v s p 3 编解码基本原理 事实上反向d 和d 是恒等变换。 计算m d c t 系数需要相邻两次窗运算的输出序列。假设x ,x ( n - 1 ) y g 前一 次窗运算的输出序列,工m 声仨d 为当前窗运算输出序列。m d c r 系数可由 对以下长度为的序列进行d c r - i v n : 叫( + ,2 1 ) , ( + 2 2 ) ,畸t ( ) ,叫t ( 一1 ) ,吖f ( 一2 ) ,吖( 2 ) 此序列由前一次窗运算输出序列的后半段和当前窗运算输出序列的前半段构成。 序列中样本被乘以。1 并被反序。当前窗运算输出序列的后半段被存储起来供下次 d c r - i v 运算使用。图2 4 给出由窗运算和d c t - i v 实现m d c t 的示意图。 图2 4 由窗运算和d c t - i v 实现m d 嘶;意图 i m d c t 是硼d c t 的逆过程。m d c t 系数经由反畸j d c t - i v 运算,与i 相乘和 反序,其输出序列的后半段被存储起来以供下次反向窗运算使用。其输出序列的 前半段和存储序列经由反向窗运算得出b a d c t 的输出序列。图2 5 给出由反向 d 口i v 和反向窗运算实现i m d c t 的示意图。 i 一竺! 竺:! 竺一一上一竺竺二竺竺l :竺竺一j 图2 - 5 由反向d 和反向窗运算实现i m d c 砺;意图 第2 章a v s - p 3 编解码基本原理 2 as p s c 立体声编码 s p s c ( s q u a r ep o l a rs t e r e oc o d i n g ) 是一种比较高效的立体声编码方法,当左, 右两个声道有比较强的相关往时。采用s p s c 能够带来比较大的编码增益。其主 要原理为当左右两个声道有比较强的相关性时,一个声道传大值信号,而另一 个声道传两个声道的差值信号,编码端的s p s c 模块和解码端相对应的重建模块 构成无损交换对。 2 5 c b c 熵编码 c b c ( c o n t e x t - d e p e n d e n tb i t p l a n ec o d i n g ) 是一种高效的量化熵编码方法,具有 精细颗粒可调( f i n eg r a i ns c a l a b i l i t y ) 特征,可调步长为lk b p s ,编码速率可从1 6 9 6 k b p s 连续可调。音频解码器可以根据解码端解码能力,在低于编码比特率下解 a v s 编码码流。当解码速率从编码速率到较低比特速率时,解码音乐信号的音质 从高到低逐级衰减。c b c 编码效率要优于m p e ga a c 中的哈夫曼编码,在“ k b p s c h a n n d 编码时,c b c 5 f 均编码比特数较m p e ga a c 中的哈夫曼编码节省约 6 。为了满足不同的应用需* 。a v

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论