（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-21 格式：PDF 页数：68 大小：3.80MB 积分：0 举报 版权申诉

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf_第2页

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf_第3页

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf_第4页

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf_第5页

已阅读5页，还剩63页未读，继续免费阅读

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

适用于数字电影的视频编码量化策略的研究专业：通信与信息系统姓名：马少立导师：黄继武教授，梁凡副教授摘要 a v s 视频标准是我国自己制订的数字视频编码标准，与其他视频编码标准相比具有高效和算法复杂度低等特点。论文的主要工作是以a v s 作为基础，针对数字电影的特点，对视频编码量化策略进行研究。论文前三章介绍了当前视频的需求和应用环境，介绍了国内外数字电影发展历程，分析了数字电影的特点，并比较详细的介绍了a v s 视频标准。论文第四章提出了基于视觉特性的量化策略，即根据人眼注意力的局部集中性，构造一个局部可调的量化参数的框架，在一个基准量化参数q p 0 上，适当的进行些调整，加上一个可变的量化参数q 只，这使得对于每一帧图像来说，在码率保持一定的情况下，使得图像的中央部分质量好于边缘的质量，而且越接近于中央的质量越好。论文第五章提出了基于视频内容的量化策略。引入了图像活跃性的概念，对视频的高频能量进行统计后分段，根据宏块高频能量值得出量化参数q 只，对第四章得出的量化参数进行进一步调整。实验结果表明，这种量化策略比基于视觉特性的量化策略效果要好。最后论文进行总结和展望。关键词：a v s 数字电影量化参数视觉特性视频内容 q u a n t i z a t i o nm e t h o d si nv i d e oc o d i n gf o rd i g i t a l c i n e m a m a j o r ： c o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m n a i n e ：m as h a o l i s u p e r v i s o r ：p r o f h u a n gj i w u , a s s o c i a t ep r o f l a n gf a n a b s tr a c t a v sv i d e os t a n d a r di sd e v e l o p e db yt h ea u d i oa n dv i d e oc o d i n gs t a n d a r d w o r k i n gg r o u po fc h i n a c o m p a r e dw i 血o t h e rv i d e cs t a n d a r d s a v sh a sh i g h e r e f f i c i e n c ya n d l o w e rc o m p l e x i t y b a s e do nt h e e x i s t i n ga v sp r o f i l e a n dt h e p r o p e r t i e so fv i d e os e q u e n c e so fd i g i t a lc i n e m a ，w ep r o p o s et w on e wq u a n t i z a f i o n m e t h o d sa n da c h i e v eb e t t e rs u b j e c tp e r f o r m a n c e sw i t ha l m o s tt h es a m eb i t - r a t e s t h ef i r s tt h r e ec h a p t e r so ft h i st h e s i si n t r o d u c e st h en e e d sa n da p p l i c a t i o n so f v i d e oc o d i n g ，t h ef e a t u r e sa n dd e v e l o p m e n to fd i g i t a lc i n e m a , a n dt h ea v sv i d e o s t a n d a r d i nc h a p t e r4w ep r e s e n tan e wq u a n t i z a t i o nm e t h o db a s e do nt h ec h a r a c t e r i s t i c s o fh u m a nv i s i o n s i n c eh u m a no b s e r v e r st e n dt of o c u sm o r eo nt h ec e n t r a lp a r to fa v i d e of r a m e 也en e wq u a n t i z a t i o nm e t h o dc o n s t r u c t s1 0 c a l a d a p t i v eq u a n t i z a t o n p a r a m e t e r s b yu s i n g as t a n d a r dq u a n t i z a t i o np a r a m e t e rq p 0a n dav a r i a b l e q u a n t i z a f i o np a r a m e t e r a q p l ，w ea r ea b l et oa c h i e v eb e t t e rv i s u a lq u a l i t yf o rt h e c e n t r a lp a r t so fv i d e of r a m e s ，w i t ht h eb i t r a t e sa l m o s tt h es a l t l ea s r e g u l a r q u a n t i z a t i o nm e t h o d su s i n gc o n s t a n tq u a n t i z a t i o np a r a m e t e r s c h a p t e r5p r o p o s e sa n o t h e rq u a n t i z a t i o nm e t h o db a s e do nt h ev i d e oc o n t e n t s c o n s i d e r i n gd i f f e r e n tv i d e oc o n t e n t s a c t i v i t i e s ，w es e g m e n tt h eh i 曲- f r e q u e n c y e n e r g i e sa c c o r d i n gt ot h e i rs t a t i s t i c s av a r i a b l eq u a n t i z a t i o np a r a m e t e ra q p 2r e s u l t s a n dw o r k st o g e t h e rw i t ht h eq u a n t i z a f i o np a r a m e t e r so b t a i n e di nt h ep r e v i o u sc h a p t e r a n a l y s i sa n ds i m u l a t i o ns h o wt h a tt h en e wm e t h o df t l r t h e re n h a n c e sv i s u a lq u a l i 饥 c o m p a r e dw i t ht h em e t h o di nc h a p t e r4 i nc h a p t e r6w ec o n c l u d et h et h e s i s ，s u m m a r i z i n gt h er e s u l t sa n db r i n g i n g f o r w a r dt h ep o s s i b l er e s e a r c ht o p i c si nf u t t t r e k e yw o r d s ：a v s ，d i g i t a lc i n e m a ，q u a n f i z a t i o n p a r a m e t e r , v i s u a l c h a r a c t e r i s t i c s ， v i d e oc o n t e n t 1 1 1 第1 章绪论 1 1 引言第1 章绪论随着上个世纪七十年代大规模和超大规模电路技术、数字信号处理技术、计算机技术和通信技术的跨越式飞速发展，人类对信息的处理也迅速的从模拟领域进入数字领域，从本地的单机处理进入网络交互式处理，从简单的文本信息处理进入多媒体处理。因此2 1 世纪被形象地称为信息时代、数字时代和多媒体时代。多媒体信息包括文字、声音、图像和视频等方面的信息，其中视频又是多媒体信息最重要的组成部分。视频信息具有直观、形象、准确和应用广泛的特定，使得视频信息很容易的被人类接受。统计数据表明，人类接受的信息大约 7 0 来自视觉。与文本、语言和数据相比，视频具有无比巨大的信息容量，视频的存储、传输和处理带来极大的困难，因此，视频压缩编码技术是多媒体技术的关键。 1 2 选题的意义随着数字技术的高速发展，数字视频应用也越来越多样化、复杂化。应用范围包括从用于移动产品上的超低码率视频到高清晰度电视( h d t v ) 和数字影院( d i g i t a lc i n e m a ) ，其中数字电影是今后一个很重要的发展方向。数字电影对画面图像质量要求非常高。3 5 m m 电影画面分辨率的要求最高达到4 0 9 6 x 3 1 1 2 像素，红、蓝、绿三色的各以1 4 b i t 进行取样，每格画面的数据量高达5 0 m b ，每一帧数据量相当于电视的2 5 倍，而数字电影的放映速度一般是每秒钟2 4 3 0 帧，每秒数据量高达8 0 g b 1 5 0 g b ，一部电影按两个小时计算，数据量高达4 t b 。如果以容量为5 g 的d v d 光盘来存储，需要多达8 0 0 张光盘。如果用现在的千兆以太网来传输，即使在理想状态下，传输一部数字电影也需要2 个多小时。表1 - 1 给出了数字电影的一些数据量。表卜1 数字电影数据量 f t a m es i z eo h ef r a m e o h es e c o n do n em i n u t et w oh o u r s g b i f f s d e p t h( b y t e )( m b )( g b )( t b ) 1 2 8 0 1 0 2 4 2 4 b i to i x e l s 3 ，9 3 2 ，1 6 0 9 4 3 75 6 60 6 8 0 7 5 3 0 b i to i x e l s 4 ，9 1 5 ，2 0 0 1 1 7 9 6 7 0 80 8 5 0 9 4 3 6 b i tp i x e l s 5 ，8 9 8 ，2 4 0 1 4 1 5 68 4 91 0 21 1 3 1 9 2 0 1 0 8 0 2 4 b i tp i x e l s 6 ，2 2 0 ，8 0 0 1 4 9 3 08 9 61 0 71 1 9 3 0 b i tp i x e l s 7 ，7 7 6 ，0 0 0 1 8 6 6 21 1 2 01 3 4 1 4 9 3 6 b i tp i x e l s 9 ，3 3 1 ，2 0 0 2 2 3 9 51 3 4 41 6 11 7 9 3 0 0 0 1 5 0 0 2 4 b i tp i x e l s 1 3 ，5 0 0 ，0 0 0 3 2 4 0 01 9 4 42 _ 3 3 2 4 9 3 0 b i tp i x e l s 1 6 ，8 7 5 ，0 0 0 4 0 5 0 02 4 _ 3 0 2 ，9 2 3 2 4 3 6 b i tp i x e l s 2 0 ，2 5 0 ，0 0 0 4 8 6 0 02 9 ，1 63 5 03 8 9 4 0 0 0 2 0 0 0 2 4 b i tp i x e l s 2 4 ，0 0 0 ，0 0 0 5 7 6 0 03 4 5 64 1 5 4 6 1 3 0 b i tp i x e l s 3 0 ，0 0 0 ，0 0 0 7 2 0 0 04 3 2 05 1 85 7 6 3 6 b i tp i x e l s 3 6 ，0 0 0 ，0 0 0 8 6 4 0 0 5 1 8 46 2 2 6 9 1 视频压缩编码可分为有失真压缩和无失真压缩两大类。由于数字电影对重建视频图像的质量( 尤其是主观质量) 要求非常高，采用有失真压缩会导致信息损失，影晌观众的视觉效果。采用无失真压缩，不会造成信息的损失，但是压缩率低。到底采用那种压缩方案比较适合呢? 遗憾的是，目前世界上还没有一种通用的标准，各国还在讨论探索中。 m p e g 一2 是用于s d t v h d t v 视频压缩编码的国际标准。m p e g 一2 标准十分灵活，有大量的软硬件和其他实用技术支持和维护。但是m p e g 一2 受自身动态范围、解象率和色度的限制，以及m p e g 2 与“电视”有太密切的联系，把它用作真正的“电影级质量”标准不是很合适，不易被接受。其他压缩方案正在讨论中，包括m p e g 一4 ，m o t i o n j p e g 和多种无损失压缩系统1 ，2 ，3 1 。 a v s 标准是我国制定的压缩编码标准。a v s 视频标准的编码效率比 m p e g - 2 要高两倍，尤其对高清晰度图像，编码效率更高，而且它的复杂度也比h 2 6 4 要低。因此，将a v s 标准应用于数字电影有很大的可行性】。 2 第1 章绪论 1 3 论文的工作和成果众所周知，数字视频压缩过程中的信息损失是由量化造成的。数字电影对重建视频图像的主观质量要求非常高。本文针对数字电影的特点，以a v s 视频标准为基础，对量化进行研究，提出了新的量化策略，并进行了实验和分析。论文的主要工作和成果如下： 1 提出基于视觉特性的量化策略。数字电影的分辨率非常高，它的最低分辨率是1 9 2 0 1 0 8 8 ，最高分辨率是4 0 9 6 x 3 1 1 2 。数字电影一般在电影院放映，银幕比较大，人的注意力主要集中在银幕的中间而忽略的银幕的边缘。根据上述特点，论文提出了一个量化参数的固定框架，在基准量化参数g 喝的基础上加上一个可变的量化参数( 嵋。对于每一帧图像来说，在码率保持一定的情况下，使得图像的中央部分质量好于边缘的质量，而且越接近于中央的质量越好。 2 提出基于图像内容的量化策略。上面的方法存在一些不足，框架比较呆板，在图像变化比较剧烈的地方，效果不是很好，有时会出现比较模糊和方块效应。为了解决这些问题，本文引入了图像活跃性的概念。图像活跃性跟视频图像的高频信息密切相关，一般来说图像活跃性越大，高频信息越丰富，图像内容也就越丰富，变化也就越剧烈。基于图像内容的量化策略是根据每一个宏块高频能量值对每一个宏块计算量化参数q 只，从而进一步调整量化。 1 4 论文安排论文安排如下：第1 章绪论，主要介绍当前视频应用需求和环境；分析数字电影的一些特点；指出根据这些设计出可变长量化方法。第2 章数字电影概述，比较详细的介绍国内外数字电影的发展历史和情况，详细的介绍了美国d c 2 8 工作组的情况和负责的工作以及数字电影的一些要求。第3 章视频编码标准和a v s 标准的简介，简单的介绍的当前世界上应用最广的几种视频编码标准m p e g 的区别，比较详细的介绍我国自己制订的视频中山大学硕士学位论文编码标准的情况和特点。第4 章基于视觉特性的量化策略，分析数字电影的一些特性和主观上人眼的视觉情况，以及当前一些码率控制算法的不足，提出了一种基于视觉特性的量化策略，并且对实验结果进行分析。第5 章基于视频内容的量化策略，在第4 章的基础上做进一步改进，基于视频内容，根据宏块的能量值，适当的调整量化参数。第6 章总结，对论文的内容进行总结以及对论文的展望。 4 第2 章数字电影概述 2 1 电影的发展电影是科学技术经过长时间的发展达到一定阶段的产物1 6 】【7 1 。十七世纪，牛顿首次发现了反映在人的视网膜上的形象不会立即消失这一重要现象。1 8 2 4 年，英国人彼得马克罗格特公他的“视觉暂留”理论，指出人眼在观看运动中的形象时，每个形象都在消失后仍在视网膜上滞留不到一秒的时间。之后，随着照相技术、洗印技术和胶卷的发明，1 8 9 5 年法国的卢米埃尔兄弟制造出能将影像放映在白色幕布上的电影机，真正的电影终告问世。早期的电影比较简单，只有视觉运动的组合而没有听觉运动的组合，只有黑白两色而没有其他颜色。给电影增加声音和彩色的尝试几乎是在无声黑白电影问世后立即开始的。最初给电影配音的方法有三大类：音乐伴奏、音响效果和真人配音，全都采用临场方式。由于技术上的困难，常出现音画配合不准确的笑话。彩色电影在其原始阶段也是采用人工操作的方式。在无声电影时期，许多故事片采用给某一场景涂上单色的方式来加强情绪效果。如把夜景涂成蓝色，恐怖场面涂成红色等。到2 0 世纪2 0 一3 0 年代，电子管的出现使无声电影真正变成了有声电影；三色的彩色系统问世使黑白电影变成真正的彩色电影。随后的日子里，电影成为人类文化生活中不可少的精神享受，电影技术得到了长足的发展。可惜好景不长，随着电视的出现，去电影院看电影的越来越少，这种情况一直持续到上世纪8 0 年代末9 0 年代初。9 0 年代初，随着数字技术在电影领域的广泛应用，电影经历了从无声、有声，到彩色，终于进入数字时代。我们叫做数字电影。何谓数字电影，根据我国暂行的数字电影技术要求中提到，数字电影就是指以数字技术和设备摄制、制作、存储的故事片、纪录片、美术片、专题片以及体育、文艺节目和广告等，通过卫星、光纤、磁盘、光盘等物理媒体传送，将符合本技术要求的数字信号还原成影像与声音，放映在银幕上的影视作品。 2 1 1 数字技术应用于电影声音八十年代初，数字音频产品c d 开始进入家庭，稍后，数字磁带录音机d a t 也进入了家庭。从而推动了观众对高品质声音的迫切需求，使电影技术工作者不得不考虑影院观众提高影片声音的呼声，于是8 0 年代末，开始将数字音频技术应用于电影音响。从8 9 年到9 3 年，世界上先后出现了8 重电影数字立体声，但逐渐成熟并得以生存发展下来的只用s r d 、d t s 和s d d s 三种，在世界数字声影片市场上大约各占4 0 、4 0 和2 0 的份额。由于各有优势，三种数字立体声一直三足鼎立。数字立体声的推出，使影院音响有更好的清晰度，更大动态范围，更宽的频带，特别是分离度的提高，更增强了临场感，更具有震撼力。声音参与影片的艺术创作，它所占的比重相当大的，国内在影片声音的投入一般占总投资的3 ，最多占到1 2 ：国外则在2 5 3 5 。只要声音方面下功夫，影片会实现很好的艺术效果。 2 1 2 计算机技术、数字技术应用电影影片技术创作和制作技术 1 9 9 3 年，美国政府开始实施“国家信息基础设施计划”( n i i ) 一一即我们称之为信息高速公路计划。这一计划成功地带动了将数字技术。计算机技术应用于电影画面的处理，其标志是影片侏罗纪公园所带来的轰动。为此，电影界称1 9 9 3 年夏天为“好莱坞数字之夏”。数字技术的引入，极大地丰富了艺术家的创作手段，使电影的感染力和震撼力达到前所未有的水平，一扫“夕阳工业”的困境。目前在美国大约有9 0 的电影或多或少地采用了数字技术、计算机技术在单片中所占比例越来越大。 1 9 9 4 年以前，其他国家对数字技术、计算机技术在电影中的应用，基本上采观望态度。1 9 9 4 年后，各国已看清数字技术对电影的巨大推动作用，进而纷纷引进获开发自己的加工基地。现在英国、日本、法国、德国以及澳大利亚和香港等许多国家和地区都已经建立了自己的高清晰度数字电影加工基地。特别应指出的是，每种新媒体的出现都会引起阵谁代替谁的议论。然后随着时间的推移，“代替”的预言都没有实现，实现的反而是这些技术的相互交汇、渗透。电影在数字技术、计算机技术面前，非但没有被淘汰出局，反而成为其他媒体发展的动力。在美国，传统的视频节目制作公司都纷纷增加数字电影制第2 章数字电影概述作能力，而新建的数字电影加工中心都具有输出胶片电影、h t v 各种格式的能力。高清晰数字已经在1 9 9 9 年开播，美国现行电视节目中有7 0 是用胶片做原始载体的。针对高清晰电视的开播，美国电影电视技术学会专门组织柯达、c b s 、 a b c 等公司实验，结论认为3 5 m m 胶片仍然是高清晰电视满意的载体。所以考虑到高清晰摄像机的昂贵价格和美国强大的电影生产能力，以3 5 m m 胶片为载体的节目仍然是高清晰电视的主要节目源。在优秀的影片中，特级往往能起到画龙点睛的作用。数字技术、计算机技术使我们的电影特技制作更加容易，创作出的影像更加栩栩如生。它可以将新影片作旧，也可以将旧的翻新；它可以着色、合成或消除画面中不必要部分，它可以改变天气气氛，也可以更改人物造型等等。总之，它能够有效的、快捷的、随心所愿制作特技。现在计算机实际上已经成为制作特技所需的非常精密、有效和奇妙的工具。最近几年，建立在计算机技术基础上的非线性编辑系统不仅日益广泛地应用于电视领域，而且也越来越多地应用于电影的后期编辑制作。它由于不受时间顺序限制，可随意剪辑，而且不损失信息，因此最大的好处是快捷。非线性编辑系统在提高影片艺术质量、提高效率、缩短制作周期、降低成本等方面都能起到非常好的作用。除了画面、声音和非线性编辑，计算机技术的应用也渗透到电影业的各个环节中。现代的洗片、印片、配光等后期制作设备，都应用了现代计算机技术，使洗印水平有了很大提高。 2 1 3 计算机技术在电影事业中的其他应用计算机技术应用于电影发信、交易，主要是利用因特网，非常经济快捷。各个单位应在网上都拥有自己的网址，制作、发行、反映单位、影院都利用因特网，建立主页，进行电影宣传，提供影片发行反映信息，以及进行交易。国际上已有广泛应用，国内许多单位也已经使用，但是发展的速度不是令人很满意。计算机技术还广泛应用于现代影院，自动化管理、计算机售票、自动化反映以及安全报警自动化均离不开计算机。计算机技术、信息技术在电影后期销售市场开发方面占有重要地位。还有，利用因特网和卫星技术开办电视电影点播，也是拓展电影市场的重要手段之一。 7 中山大学硕士学位论文 2 2 国内数字电影的发展我国电影市场比世界潮流虽有滞后，但近年来也相对萎缩，电影观众人次也在下降，电影行业大多举步为艰。原因之一就是电影生产手段落后，缺乏新的创作手段，使电影在视觉上与听觉上缺乏感染力与冲击力，难以吸引观众。积极稳妥引入数字技术、计算机技术是发展我国电影一个势在必行的重要课题。 2 2 1 声音数字技术引入我国，首先是在声音领域。我国影院立体声的起步是在a 型模拟立体声的基础上发展起来的，这为发展s r d 数字声提供了条件。其他两种数字声制式也相继在国内影院出现。我国数字立体声影院到目前已有1 0 0 家左右。在数字声制作上，北影厂首先引进四套美国硬盘工作站，j k s 主控联锁系统，自动调音推子系统以及s r d 数字录音设备，并生产出了第一部国产影片鸦片战争，产生了轰动效应。在一代天骄成吉思汗的制作中，又充分发挥了5 1 声道的特点，层次丰富，环境声逼真。该片凭借s r d 数字立体声荣获华表技术奖、长春国际电影节奖，同时也打动了外国人，在美国获得费城电影节大奖。八一和上海厂也陆续完成了录音系统的数字声改造，并为扩展d t s 和s d d s 数字声留了接口，预计不久将有多部数字立体声影片面市。 2 2 2 电影画面电影画面的数字制作技术所需费用大，启动投资高，但大量使用数字技术的阿甘正传、真实的谎言、勇敢人的游戏、泰坦尼克号等影片确实给观众耳目一新的感觉。这些影片使我国一度沉寂的影院又重新热闹起来：同时促使国内亿万观众对电影高科技的追求也提高到一个新的水平。在这种情况下保护我国民族电影，提高我们的制片水平，是中国的电影工作者和科技工作者所面临的新的挑战，也给我国电影发展带来了新的机遇。我国电影画面的数字制作尚在实验阶段。童影和华铁公司完成的儿童科幻片疯狂的兔子，有近百个数字动画镜头，做了初步尝试。第2 章数字电影概述 2 3 数字电影技术虽然数字电影技术从9 0 年代初以来得到蓬勃发展，但是还存在许多问题，制定出数字电影的标准还需要一定的时间。为了解决这个问题，美国电影电视工程协会( s m p t e ) 从2 0 0 0 年起积极组建工作组和研讨组，多次召开研讨会，研究数字电影急需解决大问题，探讨和制定数字电影大标准。其中的d c 2 8 相当活跃，其宗旨是实现电影发行反映的全面数字化，完全取代现今的3 5 m m 影片发行放映系统。为了使研究的课题尽量简单化，d c 2 8 仅研究、制定发行和反映方面的标准，不考虑制片和后期制作方面的标准。数字电影是一个复杂的系统，其子系统也相互影响。图2 - 1 简明地表示了在视觉信号流程中各系统之间的相互关系。图中的母版信号源输出口与播发环节的输入口直接相连也是有可能的。音频信号就功能而言视频信号相同。图2 - l 数字电影视频信号简化流程图 9 口口口口口口口口口口球卑盆末匠糖碾罄缸盎离野鼬帅础亲举籁骧簌 |(蛊鼎晡) 毯岖 8 n o o 擦垛蛙醯 t 曲n u 盆酶啦一u 口集$ ”n u 口擎垛掌媒忙寸n u 岛婿醴 1 h u o 鹾对一h u 凸馏固刚刚回莲稚瓣魄 r 蜒鬟噼审搴审h 蓁霹蝣 il 1 凹翥嚣 = 张 k 螺楼颦罢鞋辎繇转垂嗣道 g 蜘耳悻迎婢k 螺犀奠鲁譬地棼靶司巅孵球扭千千千千团柿鬟量! 三= ! 二= ! 三= ! i t 霄霄率搴圈南曲曲豳 0 弟2 苹数字电影概述下面简单的介绍d c 2 8 八个工作组主要的负责的工作整个d c 2 8 的功能结构图如图2 - 2 所示【8 1 。 d c 2 81 一指导和系统研究组，其主要任务是针对整个大系统进行指导和管理。 d c 2 82 一母版( m a s t e r i n g ) 研究组。母版是成像过程的起点。d c 2 8 2 是处理视觉图像。母版的目标是使消费者在数字影院观看的画面质量应等于或优于目前制片厂在鉴定室标准条件下放映校正拷贝的画面质量。已经规定有两种母版形式：胶片影像型( f i l mc e n t r i c ) 和数据影像型( d a t a c e n t r i c ) 。数字电影院的出发点均为数字源母版( d s m ，d i g i t a l s o u r c em a s t e r ) 。在胶片影像型的情况下必须首先转换为数字型才能获得d s m 。d s m 有两个层次：数字底片( 击g i t a ln e g a t i v e ) 层代表准确拍摄的素材文件；校正层( c o r r e c t i o n l a y e r ) 包含所有调整数据，如关于彩色、场景、格玛( 反差) 、机位等参数的校正数据。数字电影发行母版( d c d m ，d i g i t a lc i n e m ad i s t r i b u t i o nm a s t e r ) 由d s m 衍生。图2 3 表示其流程。d c d m 是直接向影院发送并由影院映出的文件，它是 d c 2 8 最重要的产品。 d c d m 的技术规格须用一组标准层描述。其规格标准应包括彩色空间、位深( b i t d e p t h ) 、像素尺寸、画幅频率、传输协议及放映压缩引擎的物理接口等。影像的解像率不同，这些层面也不同。该研究组的建议为：彩色空间：须确定一套新的基色，彩色空间应包含人眼能看见的所有色彩 ( d s m 也应适用此彩色空间) 。位深：每种基色均由对数量化级数1 2 比特描述，须设定由线性向对数制的转换。全带宽彩色：每个像素均由三色值( r 、g 、b ) 描述，不再进行彩色的次级( 副载波级) 采样。画幅频率：必须包括2 4 幅秒这种频率。其它画幅频率( 包括1 2 、1 6 、2 5 、 3 0 、4 8 、5 0 、6 0 、7 2 ) 也可以成为整个系统的一部分，但数字影院应用的主要画幅频率是2 4 和4 8 。文件协议：以文件格式为基础，具有展开能力，在所有场合均使用d p x 格式。中山大学硕士学位论文像素尺寸：这是一个困难且有争议的问题，至今尚未取得共识。规定了几套数据组合方式。在画格中按一定格式组合数据方式的数目即代表宏像素块 ( m e g a p i x e l s ) 的数目，例如数据组合方式d c d m5 5 d 代表1 5 3 6 x 3 6 8 0 像素，约含5 5 个宏像素块。关于这个问题的讨论仍在继续。图2 - 3 数字电影影像数据流程图 d c 2 83 一压缩研究组。数字电影处理系统同其他图像系统的显著区别在于数据量巨大。这是因对图像质量的高要求决定的。每一格3 5 m m 电影画面分辨率的上限要求达到 4 0 9 6 3 11 2 像素，红、绿蓝三色各以1 4 bi t 进行取样，再依照电影胶片的感光特性换算成密度值，每格画面的数据量高达5 0 m b 。影片每格画面的像素量几乎是一帧电视画面的2 5 倍。影片的正常反映速度是2 4 格秒，每秒钟的电影数据量可达到7 0 g b 。由于电影数字化后数据量非常大，因此研究对数字电影的压缩方法是至关重要的，它关系到整个系统的性能。 d c 2 8 3 明确了以下几项对数字电影视频压缩子系统的关键要求：视觉质量无损一原始未压缩影像与己压缩影像的放映应无区别。支持各种分辨率的影像一高、低分辨率( 空间分辨率及每个像素的比特数) 的影像应均能得到支持。传输兼容性一与可预见的所有传输机制兼容。向下兼容性一压缩技术的发展应与原先安装的无压缩电路兼容，以免硬件报废及发行商重复投资。数字电影压缩研究组不考虑现场实况转播的压缩与解压缩问题。 d c 2 8 4 一有条件接收( c a ，c o n d i t i o n a la c c e s s ) 研究组有条件接收子系统可根据合同要求准许合法发行商存取影片内容，防止未经授权的人士存取或误用电影内容。在研究了保护影片内容的各种方法如实体第2 章数字电影概述存取控制、数字媒体加密及动用法律手段之后，c a 研究组建议采用加密法并同时考虑对合法存取的检测。 d c 2 8 5 一传输和发送研究组 d c 2 8 5 在未预先规定传输方式前提下研究了由影片内容拥有者或发行商向影院发送数字电影信息的问题，强调传输方式的多样性。也就是说，无论采用何种方式，如将d c d m 通过地面数据通讯网、卫星发行系统或像常规电影拷贝一样采用快件递送的方式设计的传输和发送模式皆可行。 d c 2 8 6 一音频研究组音频研究组的工作范围包括数字电影工艺中与音频有关的全部业务。该研究组着眼于常规后期制作的编辑和混录作业( 目前大多用数字方法) 完成之后、延伸至影院还音系统传送声音的过程。按常规混录方法即在配音阶段制作好的声迹输入该系统的部件中，数字源音频母版( d s m a ，即“混录声带”) 经过适当的调整之后，成为数字电影发行音频母版音( d c d m a ) 。然后，为传输的目的将d c d m a 压缩、加密、打包、输入数字影院的储存器，进行必要的拆包、解密、解压缩。当获得节目拥有者提供的有条件接收数字密钥后，d c d m a 重新组成透明拷贝，为影院的还音做好准备。 d c 2 8 7 一影院系统研究组影院系统研究组的工作是从系统的发展前途着眼，研究数字影院的运作和维护方面的各种需要，以及系统部件的相互可操作性和扩展能力方面的相关问题。 d c 2 8 ，8 一放映研究组主要负责数字电影的放映过程。第3 章a v s 视频编码标准数字音视频产业目前广泛采用的信源编码标准是m p e g 2 。由于种种原因，我国在制定数字电视标准时，信源编码标准主要考虑使用m p e g 2 标准。然而现在这并非是一个最好的选择。因为m p e g - 2 技术标准是1 9 9 4 年完成的，近 1 0 年的技术进步使得m p e g 一2 的技术越来越落后，人们现在已经难以接受 m p e g 一2 的编码效率。信息产业部科学技术司于2 0 0 2 年6 月批准成立数字音视频编解码技术标准工作组( 简称a v s 工作组) 。该工作组的任务是：面向我国的信息产业需求，联合国内企业和科研机构，制( 修) 订数字音视频的压缩、解压缩、处理和表示等共性技术标准，为数字音视频设备与系统提供高效经济的编解码技术，服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。与国际上的信源编码标准相比，a v s 标准具有很多的优势。首先，从最新国际标准的制定来说，由于需要平衡各方利益，编码系统中含有不少作用并不明显的模块，大大增加了系统的复杂性和实现成本。我国自主制定的a v s 标准几乎不需要考虑这些因素，可以做得更好；其次，国际标准的知识产权授权问题能否被市场所接受，是影响新技术标准被产业化的重要因素，在这方面a v s ，标准具有自主知识产权，可摆脱知识产权的羁绊；再次，我国在m p e g 一2 标准上的开发和运营投入与发达国家相比，相对较少，采用a v s 新标准，历史包袱较少。最重要的是，拥有自主知识产权的a v s 标准，在技术和性能上处于国际先进水平，如果抓住机遇，我国在技术一专利一标准一芯片一系统一产业这个产业链条中，就有可能占有全面的主动权，为我国的音视频设备制造业、广播电视运营业和文化产业从技术源头上奠定基础1 1 4 i 。图3 - 1a v s 的视频编码模块“” a v s 编码标准整个技术框架如图3 - 1 所示，包括八大技术模块：变换、量化、帧内预测、变长编码、环滤波器和帧间预测、熵编码器、场编码1 5 , 1 6 , 1 7 1 。 3 1 变换和量化 a v s 标准中变换的单元是8 8 的样本块，变换系数进行标量量化。a v s 变换与量化只需要1 6 位操作，即适合于1 6 位d s p 或其他软件方式的快速实现，也适合a s i c 的优化实现，a v s 的整数变换克服了m p e ( 3 4a v c h 2 6 4 之前所有视频压缩编码国际标准中采用的8 x 8d c t 变换存在失配的固有问题。而 m p e g 4a v c h 2 6 4 所采用的4 x 4 整数变换在高分辨率的视频图像上的去相关性能不及8 x 8 的变换有效。下面简单的说说a v s 的变换过程，它采用了一个中间的变换矩阵。对残差矩阵的元素n 进行如下运算，得到j ；2 ， h ，= r 。 7 2 6 f ，j = o ，1 ，7 其中h ，是日矩阵的元素对矩阵日进行垂直变换，得到日 h 7 = 丁日第3 章a v s 视频编码标准其中：，一 8 对日的系数左移3 位再减去4 ，得到日” 对h 进行水平变换，得到变换系数c o e f f m a t r i x 一一l c o e f f m a t r i x = h ”( 丁 ) 量化是针对变换系数进行的，量化过程就是以某个量化参数去除变换系数。量化参数的大小称为量化精度，量化参数越小，量化精度就越细，包含的信息越多，但所需的传输频带越高。不同的变换系数对人类视觉感应的重要性是不同的，因此编码器根据视觉感应准则，对一个8 x 8 的变换块中的6 4 个变换系数采用不同的量化精度，以保证尽可能多地包含特定的空间频率信息，又使量化精度不超过需要。在变换系数中，低频系数对视觉感应的重要性较高，因此分配的量化精度较细；高频系数对视觉感应的重要性较低，分配的量化精度较粗，通常情况下，一个变换块中的大多数高频系数量化后都会变为零。下面讲讲a v s 的量化过程：亮度量化参数和色度量化参数的取值范围是o 6 3 ，共6 4 级量化参数。如果是当前块是亮度块，则量化参数则q p 等于c u r r e n t q p ，如果当前块是色度块，则量化参数q p 则必须通过查表来求得。变换系数c o e f f m a t r i x 是通过以下公式来转换为量化系数q u a n t c o e f f m a t r i x 的，其中w c o e f f m a t r i x 的元素 q u a n t c o e f f m a t r i x i ，】- ( 讹 s h i f t t a b l e ( q p ) 一2 删“卜1 ) + d e q u a n t t a b l e ( q p ) i ，= 0 , 1 ，7 ( 3 - 1 ) 一一 4 0 o 4 4 0 0 4 _ 一一，0 6 o 2 9 9 2 o 6 _ 一一，一 8 8 8 8 8 8 8 8 9 2 o 6 6 0 2 9 一一，一 o 4 4 o 0 4 4 o ，一o o 一 o 9 6 2 2 6 9 o 一一一1 中山大学硕士学位论文 3 2 帧内预测 a v s 的帧内预测技术与m p e g - 4a v c h 2 6 4 帧内预测相似，用相邻块的像素预测当前块，采用代表空间域纹理方向的多种预测模式。a v s 亮度和色度帧内预测都是以8 x 8 块为单位。亮度块采用5 种预测模式，色度块采用4 种预测模式，而这4 种模式中又有3 种和亮度块的预测模式相同。在编码质量相当的前提下，a v s 采用较少的预测模式，使方案更加简洁、实现的复杂度大为降低。 3 3 熵编码 a v s 熵编码采用自适应变长编码技术。在a v s 熵编码过程中，所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。采用指数哥伦布码的优势在于：一方面，它的硬件复杂度比较低，可以根据闭合公式解析码字，无需查表；另一方面，它可以根据编码元素的概率分布灵活地确定以k 阶指数哥伦布码编码，如果k 选得恰当，则编码效率可以逼近信息熵。对预测残差的块变换系数，经扫描形成( 1 e v e l 、r i m ) 对串，l e v e l 、r u n 不是独立事件，而存在着很强的相关性，在a v s 中l e v e l 、l u l l 采用二维联合编码，并根据当前l e v e l 、n l r t 的不同概率分布趋势，自适应改变指数哥伦布码的阶数。 3 4 帧间预测帧间运动补偿编码是混合编码技术框架中最重要的部分之一。a v s 标准采用了1 6 x 1 6 ，1 6 x 8 ，8 x 1 6 和8 x 8 的块模式进行运动补偿，能更好地刻画物体运动，提高运动搜索的准确性。 a v s 和m p e g 一4a v c h 2 6 4 都采用了1 4 像素精度的运动补偿技术。 m p e g 4a v c h 2 6 4 采用6 抽头滤波器进行半像素插值并采用双线性滤波器进行1 4 像素插值。而a v s 采用了不同的4 抽头滤波器进行半像素插值和1 4 像素插值，在不降低性能的情况下减少插值所需要的参考像素点，减小了数据存取带宽需求，这在高分辨率视频压缩应用中是非常有意义的。第3 章a v s 视频编码标准在传统的视频编码标准( m p e g 一1 ，m p e g 。2 ，m p e g 一4 ，h 2 6 1 ，h 2 6 3 等) 中，b 帧都只有一个前向参考帧与一个后向参考帧，p 帧则只有一个前向参考帧。最新的m p e g 4 a v c h 2 6 4 标准充分地利用视频序列的时域相关性，允许 p 帧和b 帧最多可以有3 1 个参考帧。多帧参考技术在提高压缩效率的同时也将极大地增加存储空间与数据存取的开销。a v s 中p 帧可以利用至多2 帧的前向参考帧，而b 帧仍采用前后各一个参考帧，其参考帧存储空间与数据存取的开销并不比传统视频编码的标准大，而恰恰是充分利用了必须预留的资源。 a v s 的b 帧的双向预测使用了直接模式( d i r e c tm o d e ) 、对称模式( s y m m e t r i c m o d e ) 和跳过模式( s k i pm o d e ) 。使用对称模式时，码流只需要传送前向运动矢量，后向运动矢量可由前向运动矢量导出，从而节省后向运动矢量的编码开销。对于直接模式，当前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量导出，无需传输运动矢量，因此也可以节省运动矢量的编码开销。跳过模式宏块只需要传输模式类型，不需要传输运动矢量、预测残差系数等信息。 3 5 环路滤波环路滤波是为了去除的方块效应，另外环路滤波还可以提高预测的准确性，从而提高编码效率。每个8 x 8 亮度块之间的边界有个“边界强度”b s ，色度块的边界强度用对应位置亮度块边界的b s 代替。如果b s 等于0 则不要对边界滤波，否则根据局部样本值的特性和b s 值对边界滤波。 3 6 小结总的来说，a v s 具有以下的特点： 1 ) 高效比m p e g 一2 编码效率高2 倍，尤其是对高清晰图象更是高效，达到3 倍。与h 2 6 4 编

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）适用于数字电影的视频编码量化策略的研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档