三维立体视频数字水印技术的编程实现毕业设计.doc_第1页
三维立体视频数字水印技术的编程实现毕业设计.doc_第2页
三维立体视频数字水印技术的编程实现毕业设计.doc_第3页
三维立体视频数字水印技术的编程实现毕业设计.doc_第4页
三维立体视频数字水印技术的编程实现毕业设计.doc_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京交通大学毕业设计(论文)开题报告三维立体视频数字水印技术的编程实现毕业设计题 目: 三维立体视频数字水印技术的编程实现 学院:计算机专业:计算机科学与技术 学生姓名:* 学号:* 文献综述:水印自1993年被提出以来,由于其在信息安全和经济上的重要地位,科研机构、著名大学和商业集团都积极参与或投资支持此方面的研究。美国的Dig marc公司率先推出了第一个商用数字水印软件,而后又以插件形式将该软件集成到Adobe公司的Photoshop和Corel Draw图像处理软件中。Alpha公司是专门从事计算机图形学、图像处理、计算机视觉等专业软件开发的企业,其开发的数字水印产品EIKONAmark比较好地解决了多次图像水印问题,可以添加50个以上不同的水印。国内在这一领域的研究起步虽然稍晚一些,但目前的水平和国际领先机构的水平相差不远。国内很多的大学和研究所都在研究数字水印的相关技术,如中科院自动化所、哈尔滨工业大学、中山大学、北京交通大学、湖南大学、北京邮电大学等。国际学术界陆续发表了许多关于数字水印技术方面的文章。几个有影响的国际会议(如IEEE ICIP、IEEE ISCAS、ACM Multimedia等)以及一些国际权威学术期刊(如IEEE、Elsevier、SPIE、Springer等)相继出版了数字水印的专辑。1996年5月,国际第一届信息隐藏学术讨论会(International Information HidingWorkshop, IHW)6在英国剑桥牛顿研究所召开,至今该研讨会已举办了九届。在1999年第三届信息隐藏国际学术研讨会上,数字水印成为主旋律,全部33篇文章中有18篇是关于数字水印的研究。在国际图像处理大会(ICIP)上,还开辟了两个关于数字水印的专题讨论。我国于1999年12月11日,由北京电子技术应用研究所组织,召开了第一届信息隐藏学术研讨会(CIHW),至今已成功举办了十届,很大程度推进了国内水印技术的研究与发展。另外,数字水印技术也引起了政府和其他一些机构的兴趣并得到了广泛的支持。欧洲的TAILSMAN计划在视频产品中加入水印,OCTALIS项目的目标是建立具有版权保护功能的机制,CERTIMARK 项目则专门研究水印技术。国际标准化组织也在数字水印领域表现了极大的兴趣,如JPEG2000和MPEG4 都结合了水印技术。美国国会通过了Digital Millenium Copyright Act (DMCA)法令,旨在保护数字内容所有者的知识产权,认为任何窃取行为都是违法的。 此设计的基本研究方法基于下图 光场渲染技术: 光场渲染LFR(IBR的技术代表):基 于 光 场的方法用原始图像去构建影像视图。在LFR中,一束光线设定为(u0,v0,s0,t0),其中(u0,v0)和(s0,t0)是该光线与两平行平面,即相机(uv)平面和焦平面(st),的交点。由于平面是离散化的,所以有限数量的光线会被记录下来。 如果所有在焦平面上的离散点都连接到相机平面上的一个点,就产生了一个图像(二维 光 场阵列)。事实上,这是因为图像在那一点成为了相机架的剪切视角投影。光 场的四维表示也可以被理解为一个二维图像阵列.如图: 在LFR中,当需要从初始相机位置生成可视图时,主要有两种插值方法,即最小相邻插值和双线性插值。在基于最小相邻插值的LFR中,虚拟视图的每个像素强度值由 距离最近的相机的像素密度产生。另一方面,在双线性插值方法中,每个渲染像素的强度值是由一定数量的邻近相机像素数的加权总和得到的。1. 水印嵌入: 该建议方法通过利用以下公式把水印嵌入到每一个光 场 板的图像中:2. 水印的提取 提取算法从含水印载体中提取出128比特认证信息并恢复载体图像,用恢复出的载体图像作为MD5函数的输入,重新得到一个128比特序列,如果这新产生的128比特序列和提取算法恢复出来的128比特认证信息完全匹配,则认证成功,并认为恢复出的载体就是原始载体;否则认证失败,表明含水印载体遭受了篡改. 随着数字化技术和网络的飞速发展,图像、音频、视频等形式的多媒体数字作品都能以数字形式获得,对其拷贝非常容易,从而也会被侵权者非法利用。目前,盗版已成为数字化产品的最大威胁,而这极有可能会损害音乐、书籍、电影和软件等出版业的发展,对数字媒体版权所有者来说,反盗维权迫在眉睫,而数字作品的版权保护不仅仅是一个立法的问题,也是一个技术的问题。传统加密方法对多媒体内容的保护和完整性认证具有一定的局限性。首先,加密方法只用在通信的信道中,一旦被解密,则 信息就完全变成明文;另外,密码学中的完整性认证是通过数字签名方式实现的,它并不是直接嵌到多媒体信息之中,因此无法察觉信息在经过加密系统之后的再次传播与内容的改变。所以,此设计基于以上研究方法专门针对三维立体视频水印技术对其进行了编程实现.三维立体视频数字水印技术作为三维立体视频加密技术的补充,在视频信息的版权保护与完整性认证方面得到了迅猛的发展。三维立体视频数字水印利用数字作品中普遍存在的冗余数据与随机性把版权信息嵌入在三维数字作品本身,从而起到保护三维立体视频数字作品版权的一种技术。三维立体视频数字水印可以标识和验证出多视角视频的作者、所有者、发行者或授权消费者的信息,还可追溯数字作品的非法分发,是目前进行三维数字作品版权保护的一种较为有效的技术手段。最初提出三维立体视频数字水印目的是为了保护版权,然而随着三维立体视频数字水印技术的发展,其应用领域更加广阔。主要参考文献:1.翁韶伟.Research on High-Capacity Reversible Watermarking for Digital ImagesM.北京:北京交通大学计算机学院 ,2009 年6 月.120页2. Evlambios E. Apostolidis (a) and Georgios A. Triantafyllidis (b).FREE-VIEW TV WATERMARK SELECTION BASED ON THE DISTRIBUTION CHARACTERISTICSJ.Image Processing, 2006 IEEE International Conference on,2006年,10期:1405页至1408页3. 胡孔明 于瀛洁 张之江.基于 光 场的渲染技术研究J.微计算机应用,2008年,2期:22页至27页.4. Marc Levoy and Pat Hanrahan.Light Field RenderingM.stanford university:Computer Science Department,1996年.12页5. Alper Koz Cevahir Cigla and A. Aydn Alatan Member.Watermarking of Free-view VideoJ. TRANSACTIONS ON IMAGE PROCESSING,2010年,7期:1785页至1797页6. Aljoscha Smolic Karsten Mueller.Coding Algorithms for 3DTVA SurveyJ.光学学报,2007年,17卷:1606页至1621页7. Dinu Coltuc.On Stereo Embedding by Reversible WatermarkingJ. Signals, Circuits and Systems,2007年,7期:1页至4页8. Alper Koz Cevahir Cigla and A. Aydn Alatan.Watermarking of Free-view VideoJ. TRANSACTIONS ON IMAGE PROCESSING,2010年,18卷:1785页至1797页9. 杨义先、钮心忻.数字水印理论与技术M.北京:高等教育出版社,200210. 杨榆.信息隐藏与数字水印实验教程M.北京:国防工业出版社,2010研究方案:理论基础:光场渲染、水印嵌入、水印提取研究方法:在编码端,首先将水印数据W以完全可逆的形式嵌入到载体X中,满足一般水印技术的不可感知性和同载体的不可分离性;然后经过光场渲染将加载了水印的原图片渲染为多视角视频,渲染后的视频对原水印做了保留并且渲染的图片也应为包含了水印的图片,在水印提取阶段,从载体XR中完整而精确地提取出嵌入的水印W(即提取出来的水印WR与嵌入的水印W完全相同),同时完整而精确地恢复出原始载体X(即恢复出的载体XR与原始载体X完全相同)。研究步骤:1 获取图像源的编程实现。2 对图像源进行水印嵌入的编程实现。3 对图像源进行光场渲染后的编程实现,要求进行光场渲染后的图像也可以从中正确提取水印。4 对水印进行提取的编程实现。预期成果:对三维自由视角视频数字水印进行嵌入、生成并提取。毕业设计(论文)进度安排:序号毕业设计(论文)各阶段内容时间安排备注1对导师指定资料仔细研读,确定毕业设计的框架3月上中旬2对毕业设计各个功能模块进行编程实现3月下旬至4月中旬3对程序进行测试并对其进行完善修改4月下旬4开始写毕设论文5月5进行答辩6月指导教师意见:指导教师签名: 审核日期: 年 月 日北京交通大学毕业设计(论文)三维立体视频数字水印技术的编程实现中文摘要在自由视角电视(FTV)条件下,用户可以在任意三维位置互动地控制看点,并生成一个动态场景的新视角。新的视角可能会被录制和滥用。在很多排它性权利的管理方法中,可视数据的版权问题可以通过在图像和视频内容中嵌入隐藏的不易察觉的信息(水印)的办法来解决。但是,这种方法不同于普通的水印技术,因为在FTV中水印不仅能阻止常见的视频处理和多视点视频处理操作,而且也能够很容易地从一个生成的任意视角视频中提取出来。本论文针对基于光场渲染技术进行了深入探讨,在此基础上实现了一个功能完备的MFC展示平台,借助MFC平台实现了三维立体视频水印,主要研究内容包括:1)光场渲染(LFR).2)水印嵌入.提出了一种方法,该方法通过利用固定公式把水印嵌入到每一个光场板的图像中.3)水印的检测和提取.4)结合本研究所正在进行的数字水印科研项目,采用Visual C+60,结合Open cv和MFC实现了三维立体视频数字水印展示窗口,窗口包括水印嵌入,图像渲染,水印渲染和检测等功能。关键词:可逆数字水印 光场 渲染 三维立体视频Three-dimensional videoProgramming of digital watermarking technologyAbstractIn Free-View Television (FTV), the user can interactively control the viewpoint and generate new arbitrary views of a dynamic scene from any 3D position. The new views might be recorded and misused. Therefore the problem of copyright and copy protection in FTV should be solved.Among many alternative rights management methods, the copyright problem for visual data can be approached by means of embedding hidden imperceptible information, called watermark, into the image and video content. But this approach differs from the simple watermarking technique, since watermark in FTV should not only be resistant to common video processing and multi-view video processing operations, it should also be easily extracted from a generated video of an arbitrary view. This thesis focuses on light field rendering technique based on in-depth discussions, on this basis to achieve a fully functional platform MFC, MFC platform with a three-dimensional video watermarking. Its main contents include:朗读显示对应的拉丁字符的拼音字典1. Light Field Rendering (LFR).2. Watermark embedding. Proposed a method by using a fixed formula for the watermark embedded in a light field plate of each image.3. Watermark detection and extraction.4. In light of the ongoing research of digital watermarking research projects, using Visual C + +6.0, MFC with Opencv, and realized three-dimensional video display window of watermarking, the window including the watermark embedding, image rendering, rendering and watermark detection.Key words:Reversible watermarking Light Field RenderingThree-dimensional videoiii北京交通大学毕业设计(论文)目录中文摘要iAbstractii第1章 绪论11.1 课题研究背景及研究现状11.2 课题研究目的和意义421.3 课题发展趋势331.4 课题主要应用领域44第二章 软件开发平台及编程模式52.1 开发平台的选择52.2 Microsoft Visual Studio 2010及编程模式简介62.2.1 Opencv与MFC72.2.2 Microsoft Visual Studio 2010下Opencv环境的建立7第三章 三维立体视频空间域水印的方案及结果分析133.1 视频数字水印概述143.1.1 数字视频水印的性能要求与特征153.1.2 数字视频水印的分类173.2 基于原始视频的水印213.2.1 Alper Koz的水印方案213.2.2 基于原始视频的水印嵌入方案 243.2.3 基于原始视频的水印检测方案253.2.4 水印的公钥提取263.2.5 原始视频水印方案仿真273.3 数字水印设计的基本要求273.4 本课题数字水印的实验结果以及分析283.4.1 透明性检测283.4.2 鲁棒性检测303.5 本章小结31第四章 三维立体视频基于图像渲染的实现及结果分析324.1 FTV系统结构 324.1.1 多路视频信号的采集与获取334.1.2 数据编码压缩及传输 334.1.3 接收显示终端344.2 FTV的实现方法354.2.1 基于图像的建模与渲染354.2.2 Light field rendering 374.2.3 LFR的渲染算法的实现流程图及分析404.3 本课题渲染的实验结果和分析424.4 本章小结45第五章 基于MFC三维立体视频水印技术的编程实现465.1 水印的嵌入465.2 对于任意视角的图片渲染和水印渲染475.3 水印的检测495.4 本章小结50致 谢51参考文献52附 录54外文原文54外文翻译66源程序代码76北京交通大学毕业设计(论文) 第 98 页第1章 绪论 三维立体视频数字水印是基于光场渲染领域的水印技术之一。下面介绍一下该论文的研究背景、目的和意义及研究现状、发展趋势以及主要应用领域。1.1 课题研究背景及研究现状杨榆.信息隐藏与数字水印实验教程M.北京:国防工业出版社,2010年随着多媒体技术和计算机网络技术的迅速发展,特别是 Internet 的日益普及,数字图像、音频、视频等数字媒体得到了广泛的应用,数据的存取、交换和传输变成了一个相对简单和快捷的过程。借助于计算机和 Internet,人们可以方便地使用和传输重要数据信息,进行各种学术交流和电子商务活动。数字化的多媒体信息具有质量高、易于存储、加工和复制的优点。数字多媒体信息存储和传输技术的进步,使存储和传输数字化信息非常方便,计算机网络技术在给人们利用这些资源带来便利的同时,网络信息安全领域也提出了新的问题。由此引发的盗版问题和版权保护已成为日益严重的社会问题。数字产品知识产权保护等方面问题的解决就显得尤为迫切,由此数字水印技术应运而生,并且在数字产品知识产权保护方面起到了越来越重要的作用。数字水印技术的基本思想是在原始媒体数据中,如音频、视频、图像等,隐藏具有一定意义的附加信息作为标记,这些信息与原始数据紧密结合,并随之一起被传输。在接收端,通过计算机水印信号被提取出来用于各种目的,由于它在版权保护、真伪鉴别、秘密通信和隐含标注等领域有着广泛的应用前景,因此已经成为一个非常重要的研究领域。数字水印被视做抵抗多媒体盗版的“最后一道防线”。因此从水印技术自身来说,它具有广泛的应用前景和巨大的经济价值。在现实生活中,这些应用为数字水印的发展提供了动力,当然不同的应用需求对数字水印的特性有不同的要求。1.2 课题研究目的和意义4目前,数字水印算法研究存在的主要问题有以下几个方面:(1)从理论的角度来讲,目前数字水印算法研究的基本理论和基本思路,还缺少非常成功的理论指导,尤其是易损数字水印算法研究,可以说是刚刚起步,基本理论和基本框架都还处于探讨阶段。对于鲁棒性数字水印算法的研究,尽管现在比较公认是基于通讯的思路,然而这些思路仍然还有很多不完善的地方,还存在很多需要解决而目前仍没有解决或无法解决的问题。(2)从算法可应用的角度来讲,虽然已有商业化的水印系统出现,但目前针对各种各样的应用的研究还远未成熟,许多问题如真伪鉴别、版权证明、网络快速自动验证以及应用于音频、视频等方面仍然需要比较完美的解决方案。(3)还没有统一的数字水印算法评价标准。因而无法公正地评价和比较当前提出的各种水印算法的性能。尽管己有测试水印鲁棒性的软件,但要科学地比较算法的优劣还需要做非常深入的研究。而水印的不可见性只是一个十分模糊的主观感觉,因此为了衡量算法的性能,有必要建立一种与视觉特性相匹配的客观标准。(4)大量的攻击方法。更多的比数字水印算法提出速度还要快的攻击方法的出现,抑制了数字水印技术的实际应用。(5)还没有非常成功的模型能够很好地描述数字水印技术的能量问题。尽管现在存在几种思路来研究数字水印技术的能量问题,然而,这些方法都有它相对的局限性。使用PSNR方式来研究数字水印能量问题,由于PSNR本身并不能很好地描述人体视觉、听觉特性,所以无法很好地研究数字水印能量问题。使用人类视觉、听觉特性,则存在很难确定好的视觉、听觉模型来描述人类视觉、听觉特性的问题。用信息论的方法来研究数字水印能量问题,则存在各种攻击信道模型不确定的问题。而这些攻击信道模型不确定,就根本无法正确地用信息论的方法来研究能量问题。当前,对数字图像水印技术的研究很多,但大多数水印算法都是以灰度图像作为原始载体图像,而在实际应用中彩色图像占据主导地位,因此,研究彩色图像的数字水印技术更加具有现实意义。本文水印算法的研究和设计针对真彩色图像的版权保护和篡改检测,对目前现有的图像数字水印算法进行分析,完成一套可行的鲁棒水印和半脆弱水印的彩色图像双数字水印方案,从而实现三维立体视频水印技术的编程。 1.3 课题发展趋势3 三维立体视频数字水印技术是一个新兴而有广阔前景的研究领域,目前其研究和应用已经取得了很大的进展和成果,但还有许多尚未触及的研究课题,现有的技术也需要改进和提高。数字水印技术今后的发展方向主要体现在以下几个方面: (1)基本原理研究。目前对三维立体视频数字水印技术的研究尚处于初级阶段,其基本理论有待于进一步研究进行修改和完善,包括数字水印的理论模型、结构、嵌入和提取策略等。 (2)算法分析。 (3)评估标准研究。包括对水印性能的评估标准和水印的标准化等。 (4)公钥数字水印系统。 (5)数字水印代理(Agent)。 (6)面向其他数字媒体的数字水印技术。如针对矢量图和动画等媒体的数字水印技术。1.4 课题主要应用领域4(1) 版权保护(2)内容认证(3) 指纹跟踪(4)电视节目监视(5) 视频音频延时自动校正(6)信号源传输安全检测第二章 软件开发平台及编程模式在软件的设计与开发中,软件开发平台及编程模式是关键,下面介绍一下开发平台的选择、Microsoft Visual Studio 2010及编程模式。2.1 开发平台的选择在Windows环境下,目前比较流行的可视化开发工具主要有:Visual C+、Visual Basic、C+ Builder、Delphi、Power Builder及JBuilder等。而本软件采用Microsoft Visual Studio 2010作为开发工具,并使用OPENCV作为本软件的基本架构。采用Microsoft Visual Studio 2010来进行图像编程的主要原因是,与Java和C#等现代编程语言相比,Microsoft Visual Studio 2010在程序运行的效率、内存使用的可控性和编程的灵活性上具有优势。图像处理需要处理大量的图像数据,经常使用复杂、费时的算法,因此图像处理程序的效率非常重要。Microsoft Visual Studio 2010代码被编译成汇编语言,可以直接在处理器上运行,效率很高。而Java被编译成字节码,C#被编译成中间语言,都是不能在处理器上执行的,必须经过Java虚拟机或.NET通用语言运行时的JIT编译之后才能执行,因此效率较低。故从运行效率的角度看,采用Microsoft Visual Studio 2010进行图像编程比较合适。对庞大的图像数据进行处理时需要使用大量的内存,而计算机的物理内存容量往往是有限的,因此需要有效地控制内存的使用。C+直接控制内存的分配和释放,这虽繁琐,且扩大了编程的负担,但却能有效地控制内存的使用。Java和C#引进了垃圾收集机制,将开发人员从内存管理的繁杂任务中解放出来,不再需要直接控制内存的分配和释放。但是,无效内存的收集和释放只能周期性地进行,难以达到有效地使用内存。同样的运算,使用Java和C#所需的内存比使用Microsoft Visual Studio 2010所需的内存要多,即内存的使用率较低。所以,从内存的使用效率来看,采用Microsoft Visual Studio 2010进行图像处理编程更合适。Microsoft Visual Studio 2010中大量使用指针,使得编程的灵活性很高,这虽然增加了程序出错的可能性,但是便于程序员施展编程技巧来提高程序的效率。Java完全取消了指针,C#极大地限制了指针的使用,这都限制了程序员施展技巧。因此,使用Microsoft Visual Studio 2010进行图像处理编程具有更大的灵活性。而在以C+为核心语言的可视化编程工具中,Microsoft Visual Studio 2010以其自身许多优异的特性而获得了最为广泛的应用。鉴于以上原因,本设计使用Microsoft Visual Studio 2010作为软件的开发平台。2.2 Microsoft Visual Studio 2010及编程模式简介 Stefan Katzenbeisser,Fabien A.P.Petitcolas.北京:人民邮电出版社,2001年计算机图形学是一个最令人振奋且发展迅速的计算机领域。在计算机发展的初期,人们就开始从事计算机图形的开发。后来,随着计算机软硬件和计算机图形学的高度发展,人们发现复杂的数据以视觉的形式表现出来是最容易理解的,因而三维图形得以迅猛发展,于是产生了OpenCV等三维图形工具软件。OpenCV的全称是:Open Source Computer Vision Library,Intel公司支持的开源计算机视觉库,采用c/c+编写,可以运行在linux/windows/mac等操作系统上。Opencv还提供了python、ruby、matlab以及其他语言的接口。 随着C 语言的普及和应用面的越来越广, 相应的Microsoft Visual Studio 2010 中的基本类库MFC 的应用也逐渐得到人们的认可。它能为用户提供大量的预先编好的类及支持代码。这些类封装了大量的标准的Windows 编程中的使用的处理函数和数据,做到了简化编程工作。2.2.1 Opencv与MFC Opencv是计算机视觉自由软件的宝库。但是,由于历史的原因它的软件主要采用类似DOS操作系统的命令行方式,使用十分不便,这也影响了它的推广。如果能将它应用到VC+文档结构中就好了。Opencv程序在MFC中实现的方法通常是采用CvvImage类,这个类的成员函数DrawToHDC可将位图整体经缩放后显示到视图窗口中,解决了位图的显示问题,也就解决了OpenCV在MFC中的使用问题。但是,也有两个致命的弱点,一是显示方式不合图像处理使用习惯,二是位图必须采用CvvImage类。显示方面,虽然已经能够察看图像,但当位图与窗口的长宽比不一致时会造成图像失真,这是浏览器的显示习惯,并不适用于图像处理应用。图像采集与处理的使用习惯是显示比例1:1,图像未经缩放,显示画面可按窗口大小进行裁剪并可使用滚动条选择显示部位。数据结构方面,采用CvvImage类以后程序中所有位图必须修改成这个类,这对于利用大量OpenCV现成软件来说是十分不方便的。显然,在VC+文档结构中使用OpenCV,其关键还是在于OpenCV位图在MFC中的显示。因此,有必要先比较一下两者的位图结构,然后寻找新的解决方法。2.2.2 Microsoft Visual Studio 2010下Opencv环境的建立1.首先是下载VS2010并安装,这里不作赘述;(安装目录:D:Program FilesMicrosoft Visual Studio 10.0)2.下载并安装Opencv(安装目录为D:Program FilesOpenCV2.1) 注意将路径添加至Path中图2- 13.下载并安装CMake,下载版本为Windows(Win32 Installer),安装目录为D:Program FilesCMake 2.84.运行cmake-gui(D:Program FilesCMake 2.8bin),设置路径为Opencv安装路径(本文档假定安装位置为:D:Program FilesOpenCV2.1),并创建子目录D:Program FilesOpenCV2.1vs2010,用于存放编译结果。将数据填入指定文本框中图2- 25.点击“Configure”,在弹出对话框中选中Visual Studio 10.0;单选框中选项选择程序默认的;然后点击Finish;程序会自动完成“Configure Done”;6.然后点击“configure”,接着点击“Generate”。程序完成“Generate Done”。图2- 37.完成以上步骤后,将在D:Program FilesOpenCV2.1|vs2010目录下生成OpenCV.sln的VC Solution File,接着请用vs2010打开OpenCV.sln,完成以下操作:图2- 47.1在Debug下,选择“解决方案资源管理器”下的“解决方Opencv”,点击右键,运行“重新生成解决方案”,若编译无错,在选择“INSTALL”项目,运行“生成”。图2- 57.2在Release下,选择“解决方案资源管理器”下的“解决方Opencv”,点击右键,运行“重新生成解决方案”,若编译无错,在选择“INSTALL”项目,运行“生成”。图2- 6此时,Opencv的*d.dll文件(for debug)和*.dll文件(for release)将出现在D:Program FilesOpenCV2.1vs2010bin目录中;Opencv的*ad-lib文件(for debug)和*.lib文件(for release)将出现在D:Program FilesOpenCV2.1vs2010lib目录;头文件*.h出现在D:Program FilesOpenCV2.1vs2010includeopencv中。 可以被VS C+ 2010调用的Opencv动态库生成完毕8.配置Windows环境变量Path D:Program FilesOpenCV2.1vs2010bin图2- 78.接下来的工作很重要:要将Opencv和VS2010配置好,必须先创建一个工程:注意 没有创建工程是不能进行配置的。在包含目录下添加D:Program FilesOpenCV2.1vs2010includeopencv在库目录下添加D:Program FilesOpenCV2.1vs2010lib;为项目的Debug配置增加依赖的库:cxcore210d.lib cv210d.lib highgui210d.lib ml210d.lib cvaux210d.lib为项目的Release配置增加依赖的库:cxcore210.lib cv210.lib highgui210.lib ml210.lib cvaux210.lib第三章 三维立体视频空间域水印的方案及结果分析 所谓数字水印技术,就是将数字水印嵌于一个宿主载体中,但不被觉察到或不易被注意到,而且不影响宿主载体的知觉效果和使用价值,它可以是图像、声音、文字、符号和数字等一切可以作为标记和标识的信息。数字水印技术实际利用了数字产品的信息冗余性,把与多媒体内容相关或不相关的一些标识信息直接嵌入多媒体内容中,通过对水印的检测和分析保证数字信息的完整可靠性,从而成为知识产权和数字多媒体防伪的有效手段。通常,可以定义水印为如下的信号: 式3- 1其中,M为水印序列的长度,O代表值域。实际上,水印不仅可以为一维序列,也可以是二维阵列,甚至是三维或高维信号,这通常要根据载体对象的维数来确定,如音频对应一维,静止图像对应二维,动态图像对应三维。常见的水印信号值域多为二值形式,如O=0,l,o=-l,l,O=-r,r等。检测器和嵌入器是数字水印系统所包含的两大部分。嵌入器最少包括两个输入:一个是准备进行水印嵌入的作品,称为载体作品:另一个是对原始信息进行一系列变换后让其作为准备嵌入的水印信号。载体作品含有水印的最后结果就是水印嵌入器的输出结果,这种含有水印的载体多用于进行传输。水印检测器则将那些含有水印的载体作品作为输入。大部分检测器都在尽可能检测出水印是否存在,如果有水印,则输出原始嵌入的水印。水印系统包括嵌入器和检测器。其基本系统框架可以描述为如下图:图3- 1数字水印处理系统基本框架 3.1 视频数字水印概述杨义先、钮心忻.数字水印理论与技术M.北京:高等教育出版社,2002年在自由视点视频的实际应用中,电视台或视频提供商需要向电视终端传输多路视频,用户通过接收端接收并可以自由选择观看的视点,系统接收端 根据用户的视点相应的渲染出新的场景出来。因此,FTV中的水印算法应该对于对任意视点渲染出的场景都有效。常规的水印检测算法只是对原有的视频图像上进行保护,无法从渲染所生成的新的场景中检测出水印,因此必须考虑新的解决方案。 3.1.1 数字视频水印的性能要求与特征视频是由一帧帧图像序列组成的,因此,视频和静止图像有相类似的地方。把静止图像水印技术直接应用于视频水印是显而易见的,但是视频水印和静止图像水印又有一些重要差异。某些图像水印算法可直接用于视频水印中,甚至有人将视频水印和图像水印两者结合或者等同考虑。实际上,视频序列与静止图像之间存在着一定区别,使得视频水印除了应具有图像水印的一般特点外,还必须具有下列独特要求。1. 由于视频信息量大,因而水印提取过程不应该用到原始视频信息,即需要实现数字视频水印的盲检测。2. 虽然视频信号空间非常大,但视频水印经常有实时或接近实时的要求。与静止图像水印相比,降低水印算法的复杂度要求更重要,必须提出简单易行的算法。3. 由于视频是由一系列相关的静止图像联合而成,所以视频水印应能抵抗帧 删除、帧插入、帧重组等视频编辑处理,以及统计平均和统计共谋等特有的攻击。统计平均攻击是对局部连续的帧 求平均,以消除水印。这种攻击对于在各帧中 嵌入随机的、统计独立的水印的方案比较有效。在统计共谋攻击中,从单帧中 估计出水印,并在不同的场景中求平均以取得较好的精确度,接着从每帧中减去估计的水印。这种估计对于在所有帧中 嵌入相同水印的方案比较有效。4. 要与视频编码标准相结合。视频数据由于其数据量极大,在存储、传播中通常先要对其进行压缩,现在最常用的视频数据压缩编码标准是MPEG-1/2/4。如果是在压缩视频中嵌入水印,很显然要与视频压缩编码标准相结合;如果是在原始视频中嵌入水印,由于水印嵌入是利用视频的冗余数据来携带信息,视频压缩编码则需要除去视频中的冗余数据,因此不考虑视频压缩编码标准而盲目地嵌入水印,则嵌入的水印很可能在编码过程中丢失。5. 视频信息作为大容量、结构复杂、信息压缩等特征的载体,调整给定水印的信息和宿主信号的信息之间的比率,变得越来越不重要。6. 可用信号空间的不同。对于静止图像,信号空间非常有限,这就促使人们常常利用HVS模型,使嵌入水印达到可视门限而不影响图像质量。而对视频来说,由于时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,在某些情况下甚至不能像静止图像那样充分的使用基于HVS的模型,同时由于MPEG视频编码器和译码器中的运动补偿模式,因此在嵌入I帧时 导致的一些失真也会破坏相邻的P和B帧。这种因水印而导致的视觉失真更难以控制。基于以上差异,视频水印除了具有难以觉察性和鲁棒性外,还有以下特征。1. 复杂度。在某些应用中,水印嵌入和检测的复杂度是不对称的。水印嵌入应当复杂,以抵抗各种可能的攻击,而水印提取和检测基于实时应用应当简单。2. 压缩域处理。视频数据通常以压缩的格式存储。在以VOD服务器为代表的环境中,基于复杂度要求,更易将水印加入压缩后的视频码流中。如果解码后加入水印再进行编码,计算量将相当大。3. 恒定码率。加入水印不应该增加视频流码率。3.1.2 数字视频水印的分类杨义先.数字水印基础教程M.北京:人民邮电出版社,2007年对图像水印的分类方法原则上也可以推广到对视频水印的分类。按嵌入策略,可把视频水印分为空间域和变换域两种;按水印特性,可分为鲁棒性水印、脆弱性水印和半脆弱性水印;按嵌入位置,可分为在未压缩域中嵌入、在视频编码器嵌入和视频码流中嵌入;按水印的嵌入与提取是否与视频的内容相关,可分为与视频内容无关的第一代视频水印和基于内容的第二代视频水印方案;按视频载体采用的压缩编码标准,可分为基于MPEG-1和MPEG-2标准的视频水印、基于MPEG-4标准的视频水印和基于其他压缩标准的视频水印。但是通过分析现在有的数字视频编解码系统,根据嵌入码流 类型的不同可将视频水印方案分为如图所示的三类。图3- 2 水印嵌入1. 基于原始视频的水印方案此类方案将水印信息直接嵌入到原始图像码流中,形成含水印的原始视频信息,然后进行MPEG-2视频编码。这类方案可以充分利用多种用于静止图像的数字水印技术和策略,同时不影响现有标准MPEG-2编解码器的使用。但水印信息的引入会导致整体码流 信息的增加,而经过MPEG-2编解码处理以及水印信息的再编码后,可能会造成部分水印信息的丢失。此类方案的优缺点如下。优点是:水印嵌入方法多(原则上图像水印方案均可应用于此)、算法成熟、有鲁棒性水印和脆弱性水印等,可用于多种目的。缺点是:经过视频编码处理后,会造成部分水印信息丢失,给水印的提取和检测带来不便,增加数据比特率;经MPEG-2压缩后会丢失水印;降低视频质量;对于已压缩的视频需先解码,嵌入水印后,再重新编码,算法运算量大,效率低,防攻击能力差。现在已经有一些新兴视频水印,他们增强了防攻击能力,具有智能特性。按照水印嵌入域的不同,此类水印又可分成空域水印和变换域水印两种方案。(1) 空域水印空域水印是指直接将水印嵌入在原始视频数据中,一般是嵌入在亮度分量上,也有的是嵌入在色度分量中。空域水印的优点是复杂度低,计算简单,但鲁棒性和不可感知性较之变换域水印要差些。(2) 变换域水印这种方法一般是将视频流看成一个三维信号,水印嵌入在三维变换域中。常用的变换域有DCT/DFT/DWT、分形域、哈达玛 变换域等。 三维变换的一个缺点是运算量大。当然,随着处理器速度的提高,在实时性要求不大高的情况下是可以满足速度要求的。2. 基于视频编码的水印方案此类方案中,一般是通过修改编码阶段的DCT域中的量化系数,结合人类视觉特性嵌入水印。水印的嵌入和提取过程是在视频编解码器中进行,适用于可以直接介入视频编码过程的情况。例如,采用自己的编码器,对摄像头捕捉的原始视频流进行编码。这一方案虽然增加了引入水印算法的局限性,一旦水印信息嵌入到编码 码流中,在上述的编解码过程后可能对视频信号质量产生不良影响,但是由于该法案一般是通过调制DCT或量化之后的系数完成信息嵌入过程,因此便于通过自适应的机制分配隐藏信息到视频信号中,并依据人的视觉特性进行调制,在得到较好的主观视觉质量的同时得到较强的抗攻击能力。此类方案的优点是水印仅嵌入在DCT洗漱中,不会增加数据比特率;容易设计出抗多种攻击的水印。缺点是会降低视频的质量,因为一般他也有一个解码、嵌入、再编码的过程;存在误差积累,嵌入的水印数据量低,没有成熟的三维时空视觉隐蔽模型。3. 基于压缩视频的水印方案直接将水印信息嵌入到MPEG-2压缩码流中,适用于不能直接介入视频编码过程、只能得到编码视频流的场合。例如,在第三方制作的编码视频流中嵌入版权信息。这种方案最大的优点在于不需完全解码和再编码的过程,对视频信号造成的影响较小,提高了水印嵌入和提取的效率。但视频系统对视频压缩码率的约束将限制作为水印的嵌入信息量,同时可能对运动补偿环路产生影响,为抵消这一影响采取措施会明显增加算法的复杂度。此外,嵌入水印的强度还收视频解码误差的约束,嵌入后的效果可能有可觉察的变化。基于压缩视频的水印设计策略受相应视频压缩算法和视频编码标准的限制(如恒定码率的约束等),因此算法设计具有一定的难度。该类视频水印算法应具备的基本条件包括:(1) 水印信息的嵌入不能影响视频码流的正常解码和显示;(2) 嵌入水印的视频码流 仍满足原始码流的码率约束条件;(3) 内嵌水印再 体现视觉不易察觉性的同时,能够抗有损压缩编码。上面介绍的视频水印都是基于帧的视频水印方案。实际应用中,非法使用者常常并不使用整幅图像(帧),而只是剪切图像(帧)中某些有意义的对象来 非法使用。由此,产生了一种新的基于对象的视频水印思想。为了进一步提高视频压缩的效率,人们还提出了基于对象的视频压缩算法,如MPEG-4。它是一种高效的基于对象的视频压缩标准,有着广泛的应用前景,例如移动通信中的声像业务、网络环境下的多媒体数据的集成以及交互式多媒体服务等。本课题的基本原理是基于原始视频的水印,下面简单介绍一下 此设计思想。3.2 基于原始视频的水印本节将介绍一种基于原始视频帧的扩频水印方案,它使用二值图像作为水印信息,采用每帧索引的办法,并且利用 帧 间 统计相关性来嵌入水印,使之能够很好地抵抗针对视频水印的攻击(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论