（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-14 格式：PDF 页数：60 大小：3.05MB 积分：0 举报 版权申诉

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf_第2页

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf_第3页

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf_第4页

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf_第5页

已阅读5页，还剩55页未读，继续免费阅读

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要随着互联网的快速发展，越来越多的视频媒体在网上被存储并传输。数字媒体的拷贝在视觉质量上与原始媒体基本相同，这给盗版提供了便利。数字水印是一种有效的数字版权保护技术，其基本思想是将水印信号嵌入到原始数字媒体信号中。在本文中，研究分析了视频数字水印的基本原理和主要技术思想。介绍了 m p e g - 4 视频压缩标准，分析了压缩域视频水印的性能要求和典型算法。提出了一种新的m p e g 一4 视频水印方案。为达到抗共谋攻击的效果，该方案利用d c t 直流系数将视频划分为几个场景，依据场景特征来嵌入水印。利用扩频提高了水印的安全性。引入流控制机制，保证了嵌入水印的视频数据量不会大于原始视频的数据量。利用了人类视觉系统的视觉掩蔽效应，增强了水印强度和不可感知性。采用漂移补偿技术，消除了因嵌入水印和运动补偿而带来的视觉失真。实验结果表明，水印方案在鲁棒性、不可感知性、时间复杂性和随机检测性上均取得了良好的效果。关键词：m p e g - 4 ：视频数字水印；抗共谋攻击；漂移补偿 a b s t r a c t d u et ot h er a p i dd e v e l o p m e n to ft h ei n t e r n e t ，m o r ea n dm o r ed i g i t a lm e d i u m a r es t o r e da n dt r a n s m i t t e do nt h ei n t e r n e t t h ev i s u a lq u a l i t yo fac o p e dd i g i t a lm e d i a i st h es a m ea st h e o r i g i n a l m e d i a t h i sm a k e sp i r a t i n gv e r ye a s y d i g i t a l w a t e r m a r k i n gi sa i le f f e c t i v et e c h n i q u ef o rp r o t e c t i n gd i g i t a lc o p y r i g h t i t sb a s i ci d e a i se m b e d d i n gi m p e r c e p t i b l ew a t e r m a r k i n gs i g n a li n t ot h eo r i g i n a ld i g i t a lm e d i a i nt h i sp a p e r ，b a s i ct h o u g h t sa n dm a i nt e c h n i q u e so fv i d e od i g i t a lw a t e r m a r k i n g a r es t u d i e d m p e g - 4v i d e oc o m p r e s s i o ns t a n d a r d ，p e r f o r m a n c er e q u i r e m e n t sa n d t y p i c a la l g o r i t h m sa r ei n t r o d u c e da n dd i s c u s s e d an e wm p e g - 4c o m p r e s s e dv i d e o w a t e r m a r k i n gs c h e m e i s p r o p o s e d i nt h i sp a p e r t oa c c o m p l i s ht h ea b l i t yo f c o l l u s i o nr e s i s t a n c e ，t h es c h e m eu t i l i z e sd c td i r e c tc u r r e n tc o e f f i c i e n t st od i v i d e v i d e oi n t os e v e r a ls c e n e s w a t e r m a r k sa r ee m b e d d e da c c o r d i n gt of e a t u r e so fs c e n e s s p r e a ds p e c t r u mt e c h n o l o g yi su s e dt oi m p r o v et h es e c u r i t yo fw a t e r m a r ks e q u e n c e s b i t - r a t ec o n t r o li su s e dt om a k es u r et h a tw a t e r m a r k e dv i d e ow i l ln o tb i g g e rt h a nt h e o r i g i n a lv i d e oi nd a t aq u a n t i t y t oe n h a n c et h ei m p e r c e p t i b i l i t ya n ds t r e n g t ho f w a t e r m a r k , v i s u a lm a s k i n gi sa p p l i e d t oa v o i dt h ev i s u a ld e g r a d a t i o nc a u s e db y w a t e r m a r ke m b e d d i n ga n dm o t i o nc o m p e n s a t i o n , ad r i f tc o m p e n s a t i o nm e c h a n i s mi s e m p l o y e d e x p e r i r n e n t a lr e s u l t ss h o wt h a tt h es c h e m eh a sg o o dr o b u s t n e s sa n d i m p e r c e p t i b i l i t y , a n dp e r f o r m sw e l li nt e m p o r a lc o m p l e x i t ya n dr a n d o md e t e c t i o n k e yw o r d s ：m p e g 4 ；v i d e ow a t e r m a r k i n g ；c o l l u s i o nr e s i s t a n c e ；d r i f tc o m p e n s a t i o n 南开大学学位论文版权使用授权书本人完全了解南开大学关于收集、保存、使用学位论文的规定，同意如下各项内容：按照学校要求提交学位论文的印刷本和电子版本；学校有权保存学位论文的印刷本和电子版，并采用影印、缩印、扫描、数字化或其它手段保存论文；学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务；学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版；在不以赢利为目的的前提下，学校可以适当复制论文的部分或全部内容用于学术活动。学位论文作者签名：年月日经指导教师同意，本学位论文属于保密，在年解密后适用本授权书。指导教师签名：学位论文作者签名：解密时间：年月日各密级的最长保密年限及书写格式规定如下：南开大学学位论文原创性声明本人郑重声明：所呈交的学位论文，是本人在导师指导下，进行研究工作所取得的成果。除文中已经注明引用的内容外，本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体，均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名：年月日第一章概述第一章概述 1 1 数字水印研究背景及意义由于互联网和多媒体技术的飞速发展，越来越多的数字媒体在网络上被复制和传播。数字媒体文件不会因为经历复制的过程而在质量上有所下降。这一特点在为广大用户提供可靠的服务质量的同时，也为非法盗版提供了便利条件。数字水印作为一种有效的数字版权保护技术，正是在这种情况下应运而生。数字水印是信息隐藏技术的一个发展分支。信息隐藏【l 2 ( i n f o r m a t i o nh i d i n g ) 技术的研究是近年来信息技术研究领域的一个新兴方向，它作为隐蔽通信和知识产权保护等的主要手段，正得到广泛应用。信息隐藏技术与传统的密码技术【3 】有着密切的联系，同时也有所区别。密码技术主要是研究如何将机密信息进行特殊编码，以形成不可识别的密文进行传递。而信息隐藏技术则主要研究如何将某一机密信息隐藏于另一公开信息中，然后通过公开信息的传输来传递机密信息。信息隐藏技术也会借助密码，对要隐藏的信息进行加密之后再进行传播，这样就能进一步增强对信息的保护。图1 1 信息隐藏的通用模型从信息隐藏的角度看，待隐藏的信息可被称为秘密信息( s e c r e tm e s s a g e ) ，它可以是版权信息或是秘密数据；而公开的信息则称为载体信息( c o v e r 第一章概述 m e s s a g e ) ，可以是图像、视频、文本、音频、软件等。信息的隐藏一般由密钥 ( k e y ) 来控制，通过嵌入算法( e m b e d d i n ga l g o r i t h m ) 将秘密信息隐藏于载体信息中，而载体则可以通过通信信道( c o m m u n i c a t i o nc h a n n e l ) 正常传递。在接收端，检测器( d e t e c t o r ) 利用密钥从载体信息中解码出秘密信息。在数字媒体保护的问题上，密码学只解决了安全传递和访问控制，但是数据一旦被解密后，其内容就可以随意的被拷贝、传播，这给媒体内容制造商造成了巨大损失，从而制约着数字多媒体的进一步推广和应用。而数字水印作为一种新兴的有着良好应用前景的数字媒体保护技术，日益成为了商业界和学术界共同关注的热点。国际上也成立了相应的专门机构，如拷贝保护技术工作组 ( c p t w c 弓c o p yp r o t e c t i o nt e c h n i q u ew o r k i n gg r o u p ) 和安全数字音乐创始( s d m i ， s e c u r ed i g i t a lm u s i ci n i t i a t i v e ) ，致力于基于d v d 的视频版权保护研究和音频的版权版护研究。数字水印是各项研究中的核心关键技术。数字水印【4 5 6 ( d i g i t a lw a t e r m a r k i n g ) 技术的基本思想是将水印信息嵌入到多媒体数据( 如图像、声音、视频信号等) 中，与其融为一体，同时不影响多媒体数据的视听效果。并且水印信息在随多媒体数据经过传播和一定程度的变换及加工后，仍可以部分或全部地从多媒体数据中恢复并提取出来，以达到版权保护的作用。一般地，数字水印应具有安全性( 嵌入在宿主数据中的水印是不可删除的，且能够提供完全的版权证据) 、鲁棒性( 水印对有意或无意的图像操作与失真具有一定的抵抗力) 以及不可觉察性( 水印对人的感觉器官应是不可觉察的，或者说是透明的) 、保真性( 加入水印后，并不会损害原来的媒体内容价值) 。数字水印除了可以证明版权的归属，还能够用于监视被保护数据的传播，鉴别数据的真伪以及识别非法拷贝等，这些都是版权保护的主要内容：当然，数字水印作为古老的信息隐藏技术的新兴分支，能够实现秘密通信和标志隐含等传统功能，在军事领域很有应用价值。新兴的数字水印技术与古老的信息隐藏和数据加密技术的发展与融合为信息安全技术的发展提供了新的方向。目前从国际上来看，数字水印技术还主要以研究为主，虽然出现了一些数字版权管理产品【7 门】，但是由于缺乏核心技术和完备的理论支撑，在应用上还存在很多问题。伴随着数字产品的普及，电子商务和电子政务的兴起，版权保护和信息安全问题势必要从根本上予以解决。这就对数字水印技术在理论和应用上的进一步发展提出了要求和挑战。 2 第一章概述 1 2 数字水印研究的发展和现状从2 0 世纪9 0 年代起，数字水印逐渐成为国际学术界关注的热点。在知名的国际组织及会议和一些国际权威杂志上，关于数字水印的论文也层出不穷。到目前为止，数字水印的研究领域包括了图像水印 9 1 0 tm1 2 1 3 1 、视频水印 1 4 ， 1 5 ，1 6 1 7 1 、音频水刚1 8 1 9 1 、文本水印m2 1 1 、软件水印【2 2 】和三维网格数据水印等方面。图像作为传统而普遍的多媒体数据，成为最早的研究对象，大部分的水印研究和论文都集中在图像水印的研究上。图像水印的研究经历了较长时间，吸引了众多学者，各种理论都先后发展并日趋成熟，为数字水印的其他研究领域也提供了很多值得借鉴的成果。近年来，由于视频应用的普及，视频水印也越来越受到人们的关注。视频可以看成时空域上的连续图像序列，在某种意义上与图像水印的原理非常类似，许多图像水印的研究结果可以直接应用于视频水印上。但两者的一个显著差别在于数据量的大小，图像是平面二元的，而视频比图像多了一个时间元，水印方案的设计必须考虑到这一因素。数字水印在研究方法上，借鉴和移植了数学，通信和控制等多学科的理论。从通信理论入手，采用了通信理论模型2 3 】进行研究，将水印信号视为嵌入到宿主信号的噪声，还提出了带有边信息的通信水印模型【2 4 】。特别是扩频通信理论【2 5 2 6 ，2 刀的引入，使水印的鲁棒性大为提高。从控制论的角度入手，提出了与人类视觉特性相结合的感知模型【2 8 2 9 t3 0 3 1 】，以模型为依据对嵌入水印的区域和强度进行有针对性地选择，在增强水印强度的基础上，最大程度的减少视觉失真。控制理论中的自适应【3 2 3 3 】方法也帮助研究人员提出了更加灵活和具有鲁棒性的水印算法。矢量量化 3 4 】的方法也被用于提高水印算法的鲁棒性。数字水印的理论基础研究主要包括水印算法的鲁棒性、水印容量的测定方法等方面。水印容量的分析对水印技术的发展相当重要，因为这是水印的一个基本属性，需要结合信息论，通信和编码等理论，作进一步深入的研究。自从数字水印诞生之日起，对数字水印的攻击和反攻击的研究就从未停止过。所谓攻击，就是采用各种手段使得水印检测失效，不能正确的监测到水印的存在，或误认水印的存在。攻击既有可能是一般的无意的编辑操作如剪切，过滤，压缩等，也可能是恶意的如共谋攻击、二意性攻击，拷贝攻击等。水印攻击与反攻击的研究有益于寻求更具鲁棒性的水印算法，也有利于检验水印算法在现实中的应用。 3 第一章概述从应用的角度看，多媒体信息安全【3 5 】是数字水印的主要应用领域。典型的安全问题是安全传递、访问控制和版权保护。利用成熟的密码学理论只能解决安全传递和访问控制，无法抑制非法传播。从目前数字多媒体的传播方式看，主要是基于i n t e r n e t 的单播和多播方式。基于多播的数字多媒体应用己经或即将广泛使用，如视频会议、付费电视、视频点播、数字影院、传播股票信息等等，因为多播方式节省了大量的带宽，减轻了服务器的负荷，是一种经济高效的传播方式。多播系统【3 6 t3 7 】的是当前研究的一个新热点，尤其是安全体系的研究，其中一个很重要的方面就是版权保护和信息安全。结合密码学和数字水印可以提供有效的版权保护方案。目前提出将标志版权的水印信息嵌入到数字多媒体内容中，在多播系统中，针对不同的用户，嵌入不同的水印。当发现违法使用和非法发布时，不仅可以根据提取出的水印信息解决版权纠纷，还能追查到数据的非法发布者。 1 3 论文主要工作和内容安排视频数字水印是在图像数字水印的基础上发展而来的，因此本文对数字水印从整体上进行了分析，讨论了数字水印的分类和特点。由于视频水印自身的特性和其与压缩编码标准的紧密结合，对m p e g - 4 视频压缩标准进行了简要介绍。分析了视频水印的典型算法和技术思想，提出了一种新型的视频水印方案，并给出了相关试验结果。论文的具体组织结构如下：第一章：视频水印研究的背景及意义，国内外研究的现状，指出本文的主要工作与内容安排。第二章：讨论了视频水印的特征和分类，介绍了对视频水印的各种攻击方式，指出了视频数字水印技术所面临的技术挑战。总结了视频数字水印的主要模式和技术思想。第三章：介绍了m p e g - 4 压缩标准，m p e g - 4 视频数据组织结构和编解码系统结构，以及形状编码、纹理编码和运动补偿等技术。第四章：分析了m p e g 4 给水印技术带来的新的技术要求，分析了几种典型的m p e g - 4 水印算法。在此基础上，提出了一种新的水印方案，使用了场景划分，扩频编码，位流控制，视觉掩蔽，漂移补偿等技术。在实验部分，对算法进行了攻击测试，对不可感知性、鲁棒性、时间复杂性、随机检测性等性能 4 第一章概述均进行了评估。第五章：总结全文，并指出视频数字水印技术的发展方向与趋势。 5 第二章视频水印技术综述第二章视频水印技术综述 2 1 视频数字水印的特征数字视频水印首先应该具有数字水印的一般特征，其中包括：安全性：在版权保护中，要确保嵌入信息的保密性。要达到保密性的要求，就要在嵌入和提取水印过程中使用密钥。如果不知道水印密钥，即使知道水印嵌入和提取算法以及密码算法，也无法破译水印的真正内容。这符合密码学中著名的k e r c h o f f 准则，即应该假设对手知道加密数据的方法，数据的安全性必须仅依赖密钥的选择。为了使基于数字水印的数字媒体版权保护系统在网络环境下能起到版权保护作用，系统的设计必须遵守k e r c h o f f 准则。可靠性：水印检测应该是可靠的，虚警概率( f a l s ep o s i t i v ep r o b a b i l i t y ，在未嵌入水印的情况下错误检测到水印的概率) 和漏检概率( f a l s en e g a t i v e p r o b a b i l i 够，在嵌入水印的情况下错误认为不存在水印的概率) 应尽可能低。鲁棒性：一个数字水印应该能够承受各种不同的攻击，包括各种有意的( 如共谋攻击或二意攻击) 或无意的( 压缩、滤波、模数数模转换、扫描、各种几何变换等等) 攻击。不可感知性：数字媒体中嵌入的水印应该是视觉上不易察觉的，不会因为嵌入水印而降低媒体的视觉质量，从而破坏或降低其商业价值。对于视频水印而言，还有一些特殊的要求，如：实时处理性：由于视频数据量较大，水印嵌入和提取的算法应该具有较低的复杂度。对于特殊的应用场合，如审计追踪，每个接收端都必须提取水印，则水印提取应该相对地复杂度较低。如果是为不同接收者嵌入身份标识，水印处理在大量的视频序列上进行，而水印提取只是在出现版权冲突时才进行。这时，为了抵御尽可能多的攻击，水印提取可能比较复杂，而水印嵌入应该复杂度较低。随机检测性：可以在视频的任何位置，在短时间内( 不超过几秒钟) 检测出水印。随机检测性比实时性具有更严格的要求：如果一个水印方案能够进行实时处理，但是只能从视频的开始位置按播放顺序一步步检测出水印，则不具有随 6 第二章视频水印技术综述机检测性；如果跳转到视频的任何一个位置，均能够在很短时间内检测出水印，则具有随机检测性。与视频编码标准的兼容性：视频数据由于其数据量很大，在存储、传输过程中通常先要对其进行压缩，现在最常用的视频数据压缩编码标准是m p e g 1 ， m p e g 2 和m p e g 4 。如果是在压缩视频码流中嵌入水印，很显然应该与视频的压缩编码标准相结合；如果是在原始视频数据中嵌入水印，由于水印嵌入是利用视频的冗余数据来携带信息，而视频压缩编码的目的是为了去除视频中的冗余数据，如果不考虑视频压缩编码标准而盲目地嵌入水印，则嵌入的水印很可能在编码过程中就完全丢失了。 2 2 视频数字水印的分类对于数字视频水印技术，可作如下分类： ( 1 ) 按载体类型分为基于原始视频( u n c o m p r e s s e dv i d e o ) 的水印方法和基于压缩视频( c o m p r e s s e dv i d e o ) 的水印方法。基于原始视频的水印算法【3 8 ，3 9 1 ，是对未经压缩编码的原始视频数据直接进行处理，在原始视频数据中嵌入水印。基于压缩视频的水印算法【加“1 1 ，则与某种视频压缩标准，如常见的m p e g 1 ， m p e g 2 或m p e g 4 相结合，在压缩视频中嵌入水印。 ( 2 ) 按嵌入域分类：可分为空域方法及变换域( 频域) 方法。空域方法主要是用待嵌入的信息替换载体信息中的冗余部分，一种简单的替换方法就是用待嵌入的信息位替换载体中的一些最低有效位( l s b ，l e a s ts i g n i f i c a n tb i t ) ，只有知道隐藏信息的嵌入位置才能提取信息。此类方法较简单，但鲁棒性较差。变换域方法【4 2 4 3 ，4 5 】则是在宿主信号的某个变换域，如d c t 域或小波域中嵌入信息，其优点是：嵌入的信号能量可以分布到空域中的所有像素上；可以更方便地将人类感知系统的某些掩蔽特性结合到水印嵌入过程中；可与视频压缩标准兼容等盘莹守o ( 3 ) 按密钥类型分类：若嵌入和提取采用相同密钥，则称其为对称水印 ( s y m m e t r i cw a t e n n a r k ) ；否则称为非对称水印【4 64 7 ( ( a s y r n m e t r i cw a t e r m a r k ) ，也称为公钥水印( p u b l i ck e yw a t e r m a r k ) 。 ( 4 ) 按检测对于原始宿主信号的依赖性分为盲提取水印方案和非盲提取水印方案。若检测时需要原始宿主信号，则称为非盲提取水印( o b l i v i o u s 7 第二章视频水印技术综述 w a t e r m a r k i n g ) ，否则称为盲提取水印【4 8 ( b l i n dw a t e r m a r k i n g ) 。使用原始的宿主信号，更有利于检测和提取信息。但是，检测时用到的原始宿主信号容易暴露给恶意的攻击者。而且，在某些应用中，并不能获得原始的宿主信号。对于视频来说，由于数据量巨大，要使用原始的宿主信号也是不现实的。因此，目前主要研究的是盲提取视频水印技术。 ( 5 ) 按水印特性分为鲁棒水印和易碎水印两类。鲁棒水印 4 9 锹5 1 】对各种常见的图像处理方法都具备鲁棒性，主要用于版权保护；脆弱水印【5 2 ，5 3 , 州对任何图像变换或处理都非常敏感，半脆弱水印则对某些特定的图像处理方法有鲁棒性而对其它的处理不具备鲁棒性，主要可用于篡改提示或真伪鉴别。脆弱水印和半脆弱水印都属于易碎水印。本论文主要研究鲁棒视频水印。此外，视频水印技术还可以按用途和内容分类，在此不再赘述。 2 3 视频数字水印的主要攻击方法对于视频水印，存在一些特殊的处理和攻击方法，必须保证水印方案对这些处理和攻击的鲁棒性。对于视频信号的任何处理，只要没有将视频数据破坏到失去使用价值的地步，都不应该破坏所嵌入的水印。针对视频信号的各种攻击和处理手段有： 2 3 1 无意的攻击、无意攻击是指含水印的视频在使用过程中不可避免地受到诸如有损压缩，噪声处理等正常操作的影响i ( 1 ) m p e g 压缩：m p e g 压缩是广泛用于视频压缩的算法，有损压缩的数据失真主要由量化引起。 ( 2 ) 视频增强处理攻击：滤波：线性和非线性滤波器。包括中值滤波，高斯滤波，均值滤波。颜色和亮度的增强：对图像进行锐化；对比度增强；亮度及颜色的变化。噪声攻击：对视频添加噪声，包括椒盐噪声，高斯噪声以及其他噪声。 ( 3 ) 帧删除、帧插入、帧重组等视频编辑处理。 ( 4 ) 几何变形：旋转：一般小角度的旋转不会改变视频的商业价值，但是可能导致水印无 8 第二章视频水印技术综述法被检测到。尺度变换：各种视频制式，如4 ：3 ，1 6 ：9 等等，诸如此类的尺度变换也会影响水印信息的正确提取。 2 3 2 有意的攻击有意攻击是指为了去除水印而采取的各种处理方法【5 5 5 6 5 7 5 8 】，此种攻击往往是恶意的。h a r t u n g 等将水印攻击分为四类：简单攻击、检测失效攻击、混淆攻击和删除攻击。对于单个视频帧，针对静态图像的攻击一般来说仍然有效；对于连续的帧，攻击者多采用统计攻击方法：统计平均( a v e r a g i n g ) 攻击和统计共谋( c o l l u s i o n ) 攻击，它们都属于删除攻击这一类。平均攻击是对局部连续的帧求平均以消除水印，这种攻击对于在各帧中嵌入随机的、统计独立的水印这一类方案比较有效。在共谋攻击中，从单个的帧中估计出水印，并在不同的场景中求平均以取得较好的精确度，接着从每帧中减去估计的水印，这种攻击对于在所有帧中嵌入相同的水印这一类方案比较有效。因此，必须考虑视频信号可能面临的各种攻击处理，在此基础上实现一个较好的水印方案。 o r a c l e 攻击：攻击者可以不断地对加有水印的图像做小的修改，直到水印解码器无法测出水印为止，以此来删除水印。 2 4 视频数字水印的主要模式和技术思想 2 4 1 视频数字水印的主要模式从水印嵌入的时机来看，大致有三种模式：方蹇一嵌入方寨三方蹇二 i 酗防压缩码流方案一怒取方橐三方蠢：图2 1 视频水印嵌入和提取的三种模式 9 第二章视频水印技术综述嵌入方案一( 前置式，编码前) ：将水印信息直接嵌入到原始视频数据中，形成含水印的原始视频信息，然后进行m p e g 视频编码。虽然这种方案可以充分利用各种静止图象数字水印技术和策略，也不会影响标准m p e g 编解码器的使用，但水印信息的引入通常会导致整体码流信息的增加，而经过m p e g 编解码处理，可能会造成部分水印信息的丢失，为水印的提取和检测带来诸多不利因素。这种嵌入方案的最大优点就是计算复杂度低、易于实现。在这种嵌入方式中，多数算法是从图像水印技术推广而来的。嵌入方案二( 中置式，编码中) ：水印嵌入在编码阶段的离散余弦变换( d c t ) 的直流系数( d c ) 中( 量化后、预测前) 此类方案的优点是水印仅嵌入在d c t 系数中；易设计出抗多种攻击的水印；可通过自适应机制依据人的视觉特性进行调制，在得到较好的主观视觉质量的同时得到较强的抗攻击能力。缺点是对于己压缩的视频，有一个完全解码和再编码的过程，且嵌入水印后的视频数据量往往会增大。嵌入方案三( 后置式，编码后) ：水印直接嵌入在m p e g 4 压缩比特流中。优点是不需完全解码和再编码的过程，对整体视频信号的影响较小。缺点是：视频系统对视频压缩码率的约束将限制水印的嵌入量；水印的嵌入可能造成对视频解码系统中运动补偿环路的不良影响：该类算法设计具有一定的复杂度。 2 4 2 视频数字水印的主要技术思想数字视频水印是一个相当新的研究领域，它的发展在很大程度上得益于静态图像水印技术。现有的文献中提出了很多种算法，主要思想大致可以分成三类。最简单和直接的方法是将视频看作是图像的连续的序列，再使用静态图像的水印算法。另一种观点是考虑用时间维来设计新的鲁棒视频水印算法。还有一种思路是将视频流看作是一些根据一定的视频压缩标准压缩的数据，并且压缩标准的一些特征能用来获得有效的水印算法。每种方法优缺点如表2 1 所示。表2 1 视频水印的主要技术思想主要思想优点缺点从图像到视频继承静态图像水印的成果计算量大考虑时间元素有较好的鲁棒性计算量大利用压缩标准算法简单，实时性好须与视频格式相结合 1 0 第二章视频水印技术综述 242 1 引用静态图像水印算法早期的数字水印研究，主要集中在静态图像领域，出现了很多有效的算法和结论。当对视频这一新的领域进行研究时很容易想到把先前的研究成果移植并应用。这样。研究者将视频看作是静态图像的连续序列，并将原有的静态图像水印方案应用于视频水印。对于视频水印，最简单的方法是，在视频的每一帧中，按规定的速率嵌入相同的水印。检测时，在每一帧中检测是否存在水印。如果视频中嵌入了水印，在检测器的响应中能够观测到一个规则的脉冲口目。然而，这个方案没有有效载荷。通过检测器只能知道是否有指定的水印嵌入，而不能提取出任何隐藏信息。另一方面，宿主数据的尺寸远远大于单个的静态图像。因此希望在大量的宿主信号中隐臧更多的水印信息，提高视频水印的有效载荷。在视频的每一帧中嵌入独立的多比特水印能很好地解决这个问题”。然而，应该注意到，有效载荷的增加是以鲁棒性的降低为代价的。下面介绍一个经典的由图像水印技术演化而来的视频水印方案：差分能量水印( d e w ，d i f f e r e n t i a le n e r g y 聃e r f n a r k s ) 方案p 最先是为静态图像设计的，应用于视频时，水印被嵌入到m p e g 视频流的i 帧中。其基本思路是，在压缩数据流中，有选择地丢弃高频d c t 系数。嵌入过程如图22 所示。圈22d e w 水印嵌入过程根据算法的密钥，对视频帧8 8 像素块进行伪随机置乱，完全打乱了像素块之间的统计特性，也就是说，破坏了相邻块的相关性。然后将得到的置乱的帧分成n 个8 x 8 块。通过引入块的上半部( a 区) 和下半部( b 区) 的高频d c t 系数之间的能量差，在每一个8 x 8 块中嵌入1 比特信息。这就是该方案称差分能量水印的原因。为了引入能量差，对每个8 8 块进行d c t 变换，然后用质量因子q ，阱对 d c t 系数按标准j p e g 量化过程进行量化。得到的系数分成两部分，并根据以第二章视频水印技术综述下等式计算每个区域的高频能量： n 2 一- 1 e ( c ，z ，) = ( 钆】口脚) 2 ( 2 1 ) b = o 其中s ( c ) = i 0 ，6 3 ) l ( i c ) ) ，这里b 6 是第b 个块中z i g - z a g 扫描排序的第i 个d c t 系数，指示用量化因子q 麟进行预量化，c 是一个给定的分离点位置。所嵌入比特值作为么区和召区之间的能量差值e = d 。一d 。的标记。通过将相关的d c t 系数置为0 ，来消除所有在彳区或雪区的分离点c 以后的能量值。最后，进行逆d c t 变换，获得加入水印的视频帧。检测时，计算能量差，根据差值d 来决定被嵌入的比特值。该算法已经被大大改进，以使分离点c 适应1 1 个8 8 块的具体内容，得到较好的能量差值d 。 2 4 2 2 考虑时间元素将视频看作独立静态图像的连续序列，主要缺点是没有很好地考虑时间的因素。而时间因素的有无恰恰是静态的图像与动态的视频最大的不同点。很多研究者致力于研究通过人类视觉模型( i - i v s ) 的特性，比如频率掩蔽、亮度掩蔽和照度掩蔽，来降低静态图像水印对视觉的影响。但这些都只是单独作用于每一帧，属于空域掩蔽。在视频中，不仅要考虑空域掩蔽，还必须考虑人眼对时间的敏感性，应用时域掩耐2 9 1 。有一些方法整合了时间维。例如，时间小波分解能够用来分离视频静态和动态的部分 3 0 】，这样，水印能够嵌入在不同部分，并分别受到保护。也有人提出观点将视频信号看作是三维信号。用三维d f t 作为视频信号的表述方法【删。将视频视作三维信号并不十分准确，因为两个空间维和一个时间维不是同类的。这种考虑和计算的代价阻碍了这方面工作的进一步展开。然而，这种方法在一些特定的情况下仍然是较好的选择。例如，在医学成像过程中，扫描器的不同片段可以视作视频的不同帧。扩频技术( s p r e a ds p e c t r u m ) 的引入对于视频信号时间维的处理提供了新的思路。在视频水印的处理过程中，有人把视频信号作为一维信号来对待【3 9 】。这样的信号可以通过如图2 3 所示的简单的线扫描的方法来获得。 1 2 第二章视频水印技术综述图23 视频流的线性扫描令序列n ( j ) 一1 ，1 ) ，j e n 代表所嵌入的水印信息。通过一个扩展因子盯，序列根据以下公式进行扩频： b ( i ) = 口( ) ，+ c r ! i ( u 十1 ) + c r ，fe n( 2 2 ) 扩频操作增加了水印信息的冗余度，在视频信号的c r 个像素点上嵌入1 比特的信息。而后，得到的序列6 倒通过一个可调因子2 ( i ) 0 局部放大，并且通过一个伪随机二值序列p ( i ) ( 一1 ，+ 1 ，j n 进行调制。最后，扩频水印“f ) 被添加到经过线扫描而形成的视频信号“f ) 上，得到嵌入了水印的视频信号v 。( f ) 。因此，整个嵌入过程可用如下等式来描述： v w ( z ) = v o ) + 州f ) = v ( i ) + 丑( 1 ) + b ( i ) + p ( o ，i n t 3j 可调因子丑u ) 可以根据视频信号的局部特性，比如人类视觉模型( h v s ) 的空域和时域掩蔽来调整，或者为一常量。检测时，通过简单的相关性运算可以恢复水印信号。然而，为了减少水印和视频信号之间的色度亮度干扰，对视频信号进行高通滤波，产生滤波水印信号v 。( f ) ，这样，视频信号的主要部分被分离并去除。第二步是解调。滤波水印信号与嵌入水印时用到的伪随机序列p ( i ) 相乘并且对每一个比特求一个总和。对第，个比特，相关系数s ( 门由以下等式给出：第二章视频水印技术综述 s 0 3 = 艄木 = 删木们+ 渤毒御木蚴幸艄= + ( 2 4 ) i = j s c ri = j ”c r诘产“ 相关系数由两部分。和：组成。由伪随机序列p ( f ) 的特性可知。将趋近于0 ，滤波的主要目的是当。减少到o ，保持：不变。因此，相关系数变为： s ( j ) 2 p ( f ) 2 宰z ( i ) 事b ( i ) = a ( j ) 枣木m e a n ( a ( i ) ) ( 2 5 ) i = j + ” 因而，隐藏的比特可以由s ( f ) 的正负号直接给出。该方案给出一个非常灵活的框架，能够作为一个制定更加有效的视频水印方案的基础。 2 4 2 3 利用视频压缩格式多数视频以压缩格式存放和传播，因此人们开始在水印处理时考虑m p e g 编码标准。这种思路就是将视频数据认为是一些经过特定的视频压缩标准压缩得到的数据。因此，有些算法提出，水印应该直接嵌入压缩视频流。在压缩视频流中加水印可以看作是在压缩域的视频编辑 4 0 1 ，因此带来了一些新的问题。在游程编码中就可以嵌入水印，一些研究在这方面作了探索 6 l 】。应用前述的扩频技术方案，使水印能够直接嵌入到m p e g 视频流的d c t 非零系数上【8 1 。要考虑的第一个问题是，如何确保水印嵌入不会增加输出比特率。事实上，没有什么能够保证嵌入水印后跟嵌入水印前的d c t 系数游程编码后会有相同的比特数。一种简单的策略是只在不需要增加比特数的d c t 系数上加水印，来进行编码。要考虑的第二点是防止水印带来的失真逐帧传播。我们知道，m p e g 标准依赖于运动预测技术，因而，任何的失真都有可能传播给邻近的帧。由于这种失真信号的累积，可能导致视频质量下降。在这种情况下，进行运动补偿成为必要。还可以利用运动补偿，在视频流的运动向量里隐藏水印【6 2 】。运动向量的各个部分能够根据要隐藏的比特，以一定的规则进行量化。例如，当要隐藏的比特值等于0 ，运动向量的水平部分可以量化为一个偶数值，否则量化为奇数值。m p e g 视频帧是以不同的方式编码的。内部帧( i 帧) 基本上以j p e g 图像压缩标准进行压缩，而预测帧( b 帧和p 帧) 则是由视频中其他帧来预测的。因此，可以根据不同帧的特点来嵌入水印【4 2 1 。在压缩视频流中直接嵌入水印通常允许进行实时处理。一般来说，压缩视 1 4 第二章视频水印技术综述频水印可以直接与视频编码和解码器相结合，通过利用视频数据压缩的基本原理，如去空域冗余的d c t 、量化和熵编码技术，去时域冗余的运动估计和运动补偿技术，利用编码数据的特性，水印的嵌入和提取处理可以比较简单，能够实现水印嵌入和提取的实时处理。然而，水印是依靠视频格式的，格式的转换在有些情况下会导致水印的丢失。要实现一个在鲁棒性、安全性和水印嵌入量等方面达到均衡的水印系统，要求水印设计者必须熟悉和掌握视频编码解码器的工作流程，并且能够充分利用人类视觉系统模型。主要需要解决水印处理的复杂度、水印的鲁棒性和不可感知性、水印的随机检测等关键技术和问题。 2 5 本章小结本章分析了视频水印的特点，分类和各种可能遇到的攻击方式。恶意或非恶意的视频处理都可能更改水印信号，因此，水印的鲁棒性是水印研究的重点。当然，要做到能抵御所有攻击方式是不可能的，实际应用中往往必须根据不同的应用场合和主要性能要求，有针对性地实现一定程度的鲁棒性。对于视频，基于时间域的统计攻击是应该重点考虑的。实时性也是视频水印的必然要求。最后，本文分析了视频水印技术研究的主要技术思想，即将静态图像水印算法推广到视频，或者考虑应用时间元素，或者将水印算法与视频压缩格式相结合。并结合技术思想分析了典型的设计方案。 1 5 第三章m p e g - 4 压缩标准简介第三章m p e g - 4 压缩标准简介从上世纪9 0 年代前后，国际上先后制订了h 2 6 1 h 2 6 3 以及m p e g 1 2 等众多国际标准，覆盖了从低码率需求的可视电话，可视会议到高码率需求的数字演播室、高清电视等应用领域。而m p e g 4 标准第2 版本的带宽几乎囊括了以前制订的所有国际标准的带宽，也就是说，m p e g 4 可应用于上述各领域。由于m p e g 4 的应用范围如此广泛，不同的应用的要求又有很大的差别，为此在m p e g 4 标准岣3 弘6 5 j 中通过定义类( p r o f i l e ) 、级( l e v e l ) 、算法( a l g o r i t h m ) 和工具( t 0 0 1 ) 四层结构来描述m p e g 4 在某一具体应用中的编码方案，工具被定义为通过m p e g 4 语法描述语言( m s d l ) 得到的一种方法，例如如何进行运动估计或轮廓描述，m p e g - 4 为编码视音频对象提供的大量而有效的工具：算法则被定义为可提供一个或多个功能的工具集合。例如m p e g 1 音频，m p e g 1 视频或m p e g 2 系统等等。类被定义为解决特定编码或功能需求的标准方法，用于确定m p e g 一4 元素工具和算法如何配置，组合为一个压缩器或解压器，以完成特定的应用。m p e g - 4 包含视频、音频、图形、场景描述、m p e g j 与对象描述六大类，每个类下面又分为一个或多个级，这种分级的方法与m p e g 2 类似。采用这样的分层结构有许多好处，标准并不规定一个具体的编码和解码过程，在具体应用中只需根据标准的规定组织该应用的层，搭配相应的工具和算法就能运用到某一具体的应用，并且所产生的码流能被其他的应用所回放。其次，随着技术的发展，许多新的有效的编码工具可以方便地以算法或工具的形式添加到标准中。 3 1 m p e g - 4 视频数据的组织结构 m p e g - 4 视频的数据结构有如下层次： 1 6 第三章m p e g - 4 压缩标准简介、；d s ( 猁c a c e ( v s ) v s lv ! 融、1 k v i t k 毙) 0 巧e a i ( v o ) v o i v o ： n v i d e o0 嘶a 瞳脚酬触v o l jv o l ) n v k i c oo b j m 纠薯a 簟 v o p ) v o l p - ,v o i 陛- t v o p x v o p i v o p ( v o p ) 、- - 一- - ，、- 一。， l a y e rll 直y e r 2 图3 1 肝e g 一4 数据层次结构图 3 1 1 视频对象视频对象( v o ，v i d e oo b j e c t ) 是可视场景中景物的抽象描述，从用户的角度，它代表画面中任何有意义的物理实体。视频对象是m p e g 4 中编码的独立单位。场景由一个或多个视频对象组成。每个视频对象的形状、运动和纹理用其相关的时间和空间信息给出。v o 的生存期为一个片段( s e s s i o n ) 。m p e g 4 采用视频对象来表示图像内容，可以组合己有的视频对象来生成复合的视频对象，并由此生成视频场景，允许对视频对象的数据灵活地多路合成与同步，以便选择合适的网络来传输这些对象数据。在接受端允许用户在场景中对视频对象进行交互操作。 3 1 2 视频对象平面 m p e g - 4 引入了视频对象平面( v o p , v i d e oo b j e c tp l a n e ) 的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的v o p ( 在h 2 6 1 h 2 6 3 及 m p e g 1 2 中，被处理的图像总是矩形) ，每个v o p 定义场景中特定的视频内容。各个v o p 的形状和位置可随帧变化。属

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf

文档简介

温馨提示

最新文档

评论

（计算机软件与理论专业论文）基于mpeg4的视频数字水印技术研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档