可解决深度冲突的3D字幕的添加方法_熊俊.doc_第1页
可解决深度冲突的3D字幕的添加方法_熊俊.doc_第2页
可解决深度冲突的3D字幕的添加方法_熊俊.doc_第3页
可解决深度冲突的3D字幕的添加方法_熊俊.doc_第4页
可解决深度冲突的3D字幕的添加方法_熊俊.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

可解决深度冲突的3D字幕的添加方法 本文得到上海市科委(资助号:08dz1500108)及国家863科技支撑计划(合同号:2011BAH08B01)资助。熊俊1,周军1,汤毅2(1.上海交通大学 图像通信与网络工程研究所,上海 200240;2.上海文广科技集团,上海,200072)摘 要:本文提出了一种3D字幕的混合插入方法,即插入的字幕既能产生立体效果,又能融入到真实的场景中。将字幕以一定的负视差分别添加到左右视图中,并根据场景的深度情况来确认景物与3D字幕的遮挡关系,解决3D图像中字幕与图像深度混乱的问题,让字幕与场景虚实结合,能达到更真实的立体观看效果。关键词: 3D字幕;视差;增强实现【中图分类号】TN948;TN949.13 【文献标识码】AA solution of depth cue conflict optimization for inserting 3D subtitlesXiong Jun1, Zhou Jun1, Tang Yi2(1.Institute of Image Communication, Shanghai Jiao Tong University, Shanghai 200240, China;2.Shanghai Media and Technology Group, Shanghai 200072, China)Abstract: This paper presents a solution for inserting 3D subtitles in a 3D video. This subtitles could not only produce three-dimensional effect, but also be introduced in a real situation. Author inserts subtitles in left and right images with a certain negative parallax, and confirms the occlusion between subtitles and object according to their depth information to override their depth cue conflicts. Aligning 3D subtitles and real objects could achieve high quality stereo effect.Key words: 3D subtitles; disparity; augmented reality1引言随着3D显示技术的飞速发展与日益进步,市场上出现了越来越多的3D电视、3D显示器、3D投影机等3D显示设备1,而3D照片、3D游戏、3D视频的渐渐普及也体现了3D显示技术已成为现代显示技术的必然趋势。在3D图像显示技术不断发展和成熟的同时,3D内容插入技术也迫切需要革新。这里的插入的内容2是指为了丰富观看者需要在图像中插入的字幕、菜单、图标3等。拿字幕来说,传统的2D字幕只是将字幕覆盖在图像上,而对于3D图像,在3D视频的播放过程中,立体图像会不断的有景深的变化,如果像2D视频一样直接将字幕显示在银屏上,那么随着视频的播放,观看者在观看时往往会很难同时看清图像和字幕,因为人眼视觉的双目会聚与焦点会产生不一致4,并且长时间观看会产生视觉疲劳问题,所以在插入3D字幕时一定要考虑立体图像的深度变化。考虑到观看者观看字幕的习惯与图像深度变化等因素,本文提出了一种3D字幕的混合插入技术,将字幕以3D的显示效果添加到立体图像中,并根据场景的情况来确认景物与3D字幕的遮挡关系,解决3D图像中字幕与图像深度混乱的问题,能达到更好的立体观看效果。23D字幕添加技术分析在二维视频上插入字幕,只是简单的将其覆盖到图像上,已添加的字幕在视觉上遮挡住了原始图像中的物体,所以字幕会相对于图像上的其他物体显得隔观看者更近。而3D视频是基于立体视觉系统的,为人的双眼提供了一个立体图像对,这个立体图像对中相同物体位置的视差会在人脑中产生一定的深度。在这种情况下,仅仅在左图和右图上叠加字幕是不够的,因为这时的立体图像具有深度信息,它们的深度不仅通过视觉遮挡来反映,而且与左右图像的视差有关。因此,当在3D图像上插入字幕时,要确认字幕和景物的遮挡关系来保证视差和遮挡关系的一致性。为了达到这个目标,有必要知道图像中不同景物的深度。当字幕的深度小于图像的深度时,字幕隔观看者更近,这时字幕会遮挡住图像;当字幕的深度小于图像的深度时,图像隔观看者更近,这时字幕会被图像遮挡住。因此,为了得到一个合适插入的3D字幕,必须要知道图像的深度信息。现有的立体字幕主要是将字幕直接放置在立体图像的最前面,字幕自始自终浮现在银幕前,并没有考虑到立体图像内容的景深变化,会形成位于屏幕上的字幕遮挡住了浮现在屏幕之前图像的情况,观众很难同时看到字幕和内容,并且观众同时观看立体图像和字幕时,眼睛聚焦不断的改变,会感到累甚至头昏眼花,没有解决视觉疲劳问题,所以立体图像强烈的纵深感是添加3D字幕时必须考虑的因素。文献5提出了一种3D视频中立体字幕叠加技术,该方法将3D字幕以立体图像对最大的负视差添加到立体视频中,使得字幕一直遮挡住图像,浮现在图像之前,相对于图像离人眼最近。这样即能将字幕以3D的形式显示在屏幕之前,同时也解决了3D字幕会对立体图像的内容造成干扰的问题。但是考虑到在播放过程中图像会出现浮现在眼前的特效,如果此时字幕依然出现在图像之前,将会非常严重的影响观众的观看;另外字幕的深度随着场景深度的变化不断变化,会容易出现字幕变化不连贯的现象;最后,人们习惯了观看大小和位置固定的字幕,如果字幕在视频中有太多的变化,会有宣兵夺主的感觉,所以这种3D字幕的添加方法也有很多弊端。本文在3D视频中插入3D字幕是立体实现和增强实现两个过程。在立体实现中,将字幕以一个确定的负视差插入到左右视图中,以前景的立体效果显示在观看者的眼前;在增强实现中,将字幕融入到场景中,字幕与景物的遮挡关系会根据场景的深度变化,从而解除字幕与场景深度混乱的问题,达到字幕与场景虚实结合的效果。3实现过程本文在3D视频中插入3D字幕的方法可以理解成是立体实现和增强实现两个过程,如图1所示。立体实现是将字幕以3D形式显示在观看者眼前,字幕会立体的浮现在屏幕之外;增强实现是为了将虚拟的3D字幕融入到真实的场景中,考虑到场景的深度不断的变化,通过比较场景与字幕的深度,来得出字幕与场景相互遮挡的关系,然后根据这个遮挡关系对图像进行修复,从而解决字幕和场景深度混乱的问题。图13D字幕的实现流程3.1立体实现所谓3D字幕,就是在播放3D视频的过程中,字幕也以立体的形式显示出来,与传统的2D字幕不同,2D字幕只是将字幕覆盖在图像上面,这样字幕自始自终都固定在屏幕上,因此为了实现3D字幕,不只是将字幕简单的覆盖在图像上,而需要考虑字幕浮出屏幕的深度问题。3D图像的深度由立体图像对中同一物体的视差所决定,所以为了让字幕以立体的形式浮现在显示屏上,需要将字幕以一定的视差添加到立体图像对上。公式1、2以相似三角形的关系显示了图2(1)中正视差与深度的关系,公式3、4显示了图2(2)中负视差与深度的关系,图中的红色圆形为物体在人眼中显示的实际深度位置:式中b为左右眼的距离,d为左右两幅图的视差值大小,R为每个单位距离上像素的个数,h为人眼与显示屏的距离,x为物体会出现在显示屏之外深度的距离。 (1) (2) (3) (4) (1)正视差情况 (2)负视差情况图2正视差和负视差时的深度情况由公式1-4,以及图2可以看出,左右立体视图上具有正视差的场景会以远景的形式出现,在人眼观看时会呈现在屏幕的后方,而左右立体视图上具有负视差的场景会以近景的形式出现,在人眼观看时呈现在屏幕的前方,而零视差的场景就会直接显示在显示屏上面。因此,我们添加3D字幕,为了让字幕能够浮现在屏幕之前,需要将同样的字幕以一定的负视差分别添加到立体图像对中,即左图中的字幕相对于右图中的字幕会在水平方向偏右。不过视差管理要求考虑长时间观看3D可能引发人体不良反应,因此视差的容许范围很小,比如好莱坞的3D电影负视差时画面水平方向的2%以内6。所以将字幕以一定负视差添加到左右立体视图上去能够得到浮现在屏幕之外的3D字幕。 (1)立体实现红蓝图 (2)立体实现后的视差图图33D字幕的立体实现图与视差图图3为3D字幕立体实现后的效果图和视差图,当字幕以一定的负视差添加时,字幕会以前景的效果显示出来,如图3(1)所示。但是由图3(2)可以看出,在字幕区域里,灰度值较小的字幕遮挡住了灰度值较大的景物,这种不正常的遮挡现象会造成观看时本来位于景物后面的字幕会到图像前面来,造成观看时视觉混淆,戴上立体眼镜看图3(1),就会发现本该位于木柱和蜻蜓翅膀后面的字幕反而遮挡住了这些景物,所以为了达到更好的观看效果,仅仅对字幕进行立体实现不够的,需要正确的处理字幕和场景的相互遮挡关系。3.2 增强实现增强实现是将虚拟的物体叠加到真实的场景中,让虚拟的物体与真实的场景共同存在。在3D字幕的增强实现中,虚拟的3D字幕将会被插入到图像的场景中。文献7阐述了遮挡和视差的关联性,以及观看者在获得场景的深度信息时怎样防止它们的不一致性。融合虚拟和真实的物体需要一个理想的环境,文献8的研究表明了视觉的效果与物体的相对深度有关,观看者往往对在显示屏附近的深度很敏感,而这种敏感随着物体在重建在显示屏前或后而减少。所以要想将3D字幕融入到立体图像中,需要解决字幕与图像场景相互遮挡的问题。图4与深度的关系图图4为结合公式(2)、(4)所得的视差与深度的关系图,如图所示,视差与深度成正相关关系,当字幕的深度小于图像的深度,离人眼更近时,字幕会遮挡住图像,而反过来,当字幕的深度大于图像,图像离人眼更近时,图像会遮挡住字幕。再结合公式2、4与图4,当左右视图同一场景具有正视差时,深度大小与正视差大小呈正相关关系,而当左右立体视图中的同一场景为负视差时,深度大小与负视差的大小呈反相关关系,所以字幕与图像场景的相互遮挡问题可以由比较它们的深度问题归结为比较它们的视差问题。因为我们将左右字幕以负视差分别添加到左右视图上,所以负视差比字幕视差宽的场景会遮挡住字幕,负视差比字幕视差窄的场景会被字幕遮挡。3.2.1 基于SAD算法的立体匹配获得校准的视差图本文在添加3D字幕时的以一个确定的值来作为负视差,所以我们需要得到左右视图中场景的视差值来与字幕的视差值进行对比,本文中利用了SAD算法来得到立体图像对的视差图。SAD算法是以左目图像的源匹配点为中心,定义一个窗口,统计其窗口的灰度值的和,然后再右目图像中逐步计算其左右窗口的灰度和的差值,最后搜索到的差值最小的区域的中心像素即为匹配点。由SAD匹配算法得到的视差图可能含有一些需要被消除的孤立的噪声,如图5(2)中的白点。为了消除这些噪声,我们用中值滤波来处理这些噪声。中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。所以中值滤波将只会影响那些噪声的像素点,并将它们改成正确的,而原本正确的像素点依然正确。图5为未进行滤波和进行了滤波的视差图的比较。在使用中值滤波时,相对大的窗口选择会使图像内容变的更连贯,所以对于插入的3D字幕来说,为了使字幕在场景中的遮挡关系具有连贯性,往往选择比较大的窗口进行中值滤波。 (1)测试图 (2)视差图 (3)滤波后的视差图图5测试图、视差图、与滤波后的视差图图5(1)、(2)、(3)分别为原始的测试图、由SAD算法的到的视差图、经过中值滤波后的视差图。经过滤波后的视差图中景物的灰度值变化连贯,适合添加3D字幕,保证字幕与景物遮挡关系的连贯性。3.2.2 去除被遮挡字幕的图像修复图像修复是指对受到损坏的图像进行修复或者去除图像中的多余物体9。图像修复者需要采取最恰当的方法恢复图像的原始状态,同时保证图像达到最理想的艺术效果。本文根据上面得到的滤波后的视差图,将场景视差值与字幕的视差值进行对比,然后对已添加立体字幕的左右图像对进行图像修复。结合公式(2)、(4)与图4,可以得到视差与深度的关系,字幕会遮挡住深度大于它的场景,也就是字幕会遮挡住视差值大于字幕视差的场景。对已经进行字幕立体实现的图像以原始视差图为基准进行视差值的搜索,对于景物遮挡住字幕的区域需要进行图像修复,以让景物遮挡住字幕。这里本文将所需修复的区域用原图的像素点来替代,得到结果图。 (1)图像修复后的红蓝图 (2)图像修复的视差图图6去字幕后的图片与视差图图6为去字幕后的红蓝效果图与它的视差图,图6(1)为对图3(1)进行增强实现的效果,在图中,部分字幕被场景中蜻蜓的翅膀和木柱所遮挡住,而在它的视差图图6(2)中,蜻蜓翅膀和木柱的灰度值较大,它们遮挡住了字幕,而字幕遮挡住了灰度值最小的背景。经过去除遮挡字幕的图像修复,在图中字幕区域里,字幕与场景的灰度值都呈现了正常的遮挡关系,没有错误遮挡的现象。4 实验结果图7是通过本文介绍的方法添加3D字幕的的实验结果左右双目图。图6(1)为图7的红蓝立体图。图中蜻蜓的翅膀和木桩的负视差绝对值大于字幕的负视差绝对值,据图4可得它们相对于字幕隔观看者更近,所以翅膀和木桩会遮挡住字幕。戴上3D眼镜观看图6(1),除了会看到字幕的立体效果外,还能看到蜻蜓和木桩遮挡住字幕,位于字幕前的立体效果。图7本实验的左右双目图5 总结本文提出了一种在3D图像中插入立体字幕的新的方法。首先将字幕以一定的负视差添加到左右视图上,使字幕产生立体效果,然后考虑到遮挡和视差的关系是避免视觉不适的关键因素,通过对比3D字幕的视差与景物的视差,确定字幕与景物的遮挡关系,并进行图像修复,将3D字幕融入到图像的场景中,得到字幕与场景虚实结合的图像。这种插入3D字幕的技术还可以用于在3D电视中插入图标、菜单等内容,能够有利于观众更真实的观看显示的3D效果。参考文献:1中关村在线.未来是3D时代?细数3D技术的发展EB/OL. 2012年4月1日. /175/1759743.html .2 L. Blond, D. Doyen, T. Borel. 3D Stereo Rendering Challenges and TechniquesC/Proc. 44th Conference on Information Sciences and Systems. Princeton,March,17-19,2010.3 Juan Antonio Rodrigo, David Jimnez,Jos Manuel Menndez. Real-Time 3-D HDTV Depth Cue Conflict OptimizatioC/Proc. IEEE International Conference on Consumer Electronics. Berlin,2011.4 王爱华,王琼华.光栅式自由立体显示器概述J.现代显示,2009(10):14-17.5 梁丽,禇晶辉,张小佩,李英敏.一种3D视频中立体字幕叠加技术J.电视技术,2011(20):32-34.6 奕悦.3D电视踏上征途EB/OL.2012年4月1日

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论