




已阅读5页,还剩70页未读, 继续免费阅读
(通信与信息系统专业论文)dvd视频解码器的实现与错误掩蔽算法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 i 随着计算机的不断发展,数字电影正逐渐走进千家万户。从以 一“咄 m p e g l 为核心技术的v c d ,到现在基于m p e g 2 的d v d 。与v c d 相比,d v d 具有更高画质、更高等优点,它必将取代以往的v c d 。 随着d v d 的广泛应用,d v d 视频解码系统在我们生活中越来越重 要。 由于盘片损坏,或者网络传输中的错误,在实际情况下,送到解 码器的码流会存在比特错误。而d v d 采用m p e g 2 技术,对错误很 敏感。即使是一个比特的错误也可能会严重影响画面质量笨文分析 j 了错误比特出现的不同位置对画面质量的影响,给出了切实可行的错 误检测方法,并且对错误掩蔽技术进行了研究。错误掩蔽技术在编、 解码中都有其应用。本文主要针对应用于解码器中的后处理技术,它 不依赖附加的编码信息,是比较富有挑战性的难题,也是比较重要的 错误掩蔽技术。本文根据受损块四周的块存在运动矢量信息,给出了 基于空域和时域的混合掩蔽方法;对于无运动矢量块,分析了多种方 法对不同图像的处理效果,并提出了基于d c t 域的错误掩蔽算法和 基于匹配点的错误掩蔽算法。 同时本文结合d i r e c t s h o w 的设计难点,给出了d v d 视频解码滤 波器的实现方法。 关键字:d v d ,解码滤波器,d i r e c t s h o w ,错误掩蔽 摘要 a b s t r a c t w 池t h ed e v e l o p m e n to fc o m p u t e r , d i g i t a lf i l mi s p o p u l a r c o m p a r e dw i t ht h e v c d ,i tr e l a t e sc l o s e l y t o m a n ya d v a n c e dt e c h n o l o g i e s s u c ha s d i g i t a ls i g n a l p r o c e s s i n g ,v i d e oc o m p r e s s i o n a n dn e t w o r k i t r e p r e s e n t sa b r a n dn e w c o n c e p t o f d a t a s t o r a g ea n dm a n i p u l a t i o n b e c a u s eo ft h ed a m a g eo fd i s c ,a n dt h ee r r o ro c c u r r i n gi nn e t w o r k ,t h em e d i a s t r e a mi ss e n dt ov i d e od e c o d e r d v du s e sm p e g 2 ,s oi ti ss e n s i t i v et oe r r o ri nt h e s t r e a m e v e no n eb i te r r o rw i l lh u r tt h es t e a ms e r i o u s l y w ea n a l y z ee r r o ri n f e c t i o nt o p i c t u r e a n dg i v eap r a c t i c a b l em e t h o di ne r r o rd e t e c t i o n t h et e c h n i q u e so fe r r o r c o n t r o la n dc o n c e a l m e n ti s n e c e s s a r y t ot h i sv i d e o e n c o d i n g a n d d e c o d i n g a p p l i c a t i o n s t h ep o s t p r o c e s s i n gt e c h n i q u e sc a r lb ea p p l i e di na n yc i r c u m s t a n c e s ,i t d o n t d e p a n d o no v e r h e a do fe n c o d i n gi n f o r m a t i o n ,s ot h e p o s t p r o c e s s i n g e r r o r c o n c e a l m e n ti sd i f f c u l ta n d i m p o r t a n t t o a n ya p p l i c a t i o n s ai n t e r f r a m e e r r o r c o n c e a l m e n t a l g o r i t h m b a s e do nm o t i o ne s t i m a t i o ni sp r o p o s e di nt h i sd i s s e r t a t i o n ,t h e m o t i o nv e c t o r sa n dc o d i n gm o d ec a nb er e b u i l t ,i tc a nb ea p p l i e di na n yf r a m em o d e s a n dm a c r o b l o c km o d e s l ni n t r a - f r a m ep o s t p r o c e s s i n ge r r o rc o n c e a l m e n t t e c h n i q u e si n t h i sd i s s e r t a t i o n ,i n t e r p o l a t i n gp i x e lv a l u e sw i t h i nad a m a g e dm a c r o b l o c kf r o mi t sf o u r 1 - p i x e l - w i d e b o u n d a r i e sa n d i n t r o d u c i n g t h et e x t u r ei n f o r m a t i o nf r o mi t sf o u r a d j a c e n tb l o c k sc a ni m p r o v et h eq u a l i t yo f r e c o n s t r u c t e di m a g e i ft h ep i c t u r ew i t h e r r o rh a sn o ta n ym o t i o nv e c t o r ,w ec a n n o tu s et h i sm e t h o d i ti sv e r yh a r da n du s e f u l w o r k w ec o m p a r e ds e v e r a lm e t h o da n do f f e rs p e c i a le r r o rc o n c e a l m e n tb a s e do n d c ta n ds p e c i a le r r o rc o n c e a l m e n tb a s e do nm a t c h p o i n t s i nt h i st h e s i s ,w ea l s og i v et h em e t h o do fh o wt ob u i l dad v dv i d e od e c o d e n k e y w o r d s :d v d ,d e c o d er f i l t e 5d i r e c t s h o w , e r r o rr e s i l i e n t ,e r r o rc o n c e a l m e n t , 浙江大学硕士论文学位 第一章绪论 数字电影在很多地方也被叫做数字视频,但鉴于大多数视频文件播放的同时 都有同步音频输出,所以数字电影的叫法应该更确切些。数字电影应用广泛, 它不仅是传统电影、电视的补充载体,还可以应用于课件制作、产品演示节目、 多媒体编程、网络视频节目广播等方面。所以有人说数字电影的发展给了计算机 第二次生命。 1 1 数字电影的简介 为什么会出现数字电影呢? 让我们先看看原始视频播放的数据流程:系统每 秒显示2 9 9 7 帧,即当你看这一段视频时,所看到的大约是每秒2 7 6 m b ( 6 4 0 x 4 8 0 2 9 9 7 3 ) 的原始数据闪烁,并且这不包括声音。如果要想在计算机上播 放一个“原始的”全尺寸的视频文件,电脑不得不从硬盘驱动器上以每秒3 2 m b 的速度将数据搬到屏幕上,即使现今的计算机可以达到这个速率也极大地占用了 宝贵地c p u 处理时间,同时他也要求极高的i o 处理速度。而数字电影的魔力就 是其灵巧而且高效的数据压缩和解压缩模式,将数据量减少在易于控制的速率。 1 1 1 数字电影的压缩方法 目前使用最多的视频文件压缩方案有m i c r o s o f t 公司的v i d e of o rw i n d o w s 、 a p p l e 公司的q u i c k t i m e f o rw i n d o w s 以及目前正在飞速发展的m p e g l 、m p e g 2 压缩方案。从根本上来看v i d e of o rw i n d o w s 、q u i c k t i m e 、m p e g 的目的都是尽 可能有效的压缩庞大的视频文件,使其占用较小的存储空间,并保持图象质量的 前提下以较快的速度解压和回放。m p g e l 能为当今多媒体个人电脑提供较好的 视频图象。不过用此方式压缩的视频图象在回放时对硬件要求相对较高,但随着 高速c p u 和图形加速卡的迅速普及,软解压回放成为了绝对的主流。m p e g 2 标 准在d v d ( 数码多用途碟d i g t a l v e r s a t i l ed i s c ) 上的实施将为多媒体个人电脑带 来一场数字视频的革命,鲜艳细腻的视频图象、高保真的音响效果加上d v d 海 量的存储能力,其前景一片光明。 1 1 2 数字电影的常见格式 1 v i d e of o rw i n d o w s 和a c t i v e m o v i e 浙江大学硕士论文学位 w i n d o w s3 x 和w i n d o w s9 x 使用的标准视频软件是v i d e of o rw i n d o w s 。所 使用的文件称为“音频视频交错文件( a u d i o v i d e oi n t e r l e a v e d ) ”,其扩展名为 a v i 。顾名思义,a v i 格式文件是将视频和音频信号混合交错的储存在一起。原 始( 未压缩) 的a v i 文件是将整个视频流中的每一幅图像逐幅记录,信息量大 得惊人。譬如用视频捕捉卡来将一段来自摄像机或电视的视频信号捕捉为标准 的p a l 视频格式短短几秒钟文件体积就将超过io m ! v i d e of o rw i n d o w s 作为 w i n d o w s 操作系统标准组成部分,是一种可扩展的视频体系,其采用的主要压缩 方式有c i n e p a k 、i n d e o 和r l e 等。a c t i v e m o v i e 是扩展v f w ( v i d e o f o rw i n d o w s ) 文件格式的一种a c t i v e x 模块,对于使用w i n d o w s9 5o s r 2 以上视窗操作系统 的用户,由于系统内置了a e t i v e m o v i e ,因此可方便地高质量播放包括m p g 、d a t 、 q t 和m o v 等格式的视频文件。 2 q u i c k t i m e q u i c k t i m e 是a p p l e 计算机公司于1 9 9 1 年出版的数字视频格式标准,其使用 的数字视频文件的扩展名为m o v ,q u i c k t i m e 原是m a c i n t o s h 系列计算机使用的 一种视频软件,随着大量原本运行在m a c i n t o s h 上的多媒体软件向p c w i n d o w s 环境的移植,导致了q u i c k t i m e 视频文件的流行。 3 m p e g ( 运动图像专家组m o v i n gp i c t u r e e x p e r f sg r o u p s ) 使用m p e g 方法可以用于压缩全运动视频图象,即成为目前多媒体电脑上全 屏幕活动视频标准文件:m p g 文件。m p g 格式文件在1 0 2 4 7 8 6 的分辩率下可 以用每秒2 5 帧( p a l 制式) 或3 0 帧( n t s c 制式) 的速率同步播放1 2 8 0 0 0 种 颜色的全运动视频图象和c d 音乐伴音,并且其文件大小仅为a v i 文件的六分之 一。1 9 9 3 年推出的m p e g 2 压缩技术,采用可变速率( v b rv a r i a b l eb i tr a t e ) 技术,能够根据动态画面的复杂程度,适时改变数据传输率获得较好的编码效果, 目前使用的d v d 就是采用了这种技术。m p e g 4 支持用于通信、访问和数字视 听数据处理的新方法( 特别是基于内容的) 。考虑到低损耗、高性能技术提供的机 会和面临迅速扩展的多媒体数据库的挑战,m p e g - 4 将提供灵活的框架和开放的 工具集,这些工具将支持一些新型的和常规的功能。由于快速发展的技术使得工 具软件的下载极为便利,因此这种方式极具吸引力。 4 v i d e oc d 和k a r a o k ec d 该种格式的数据文件的扩展名为d a t ,其结构与m p g 格式基本相同,播放 是也需要一定硬件的支持,标准v c d 图象的分辩率只有3 5 2 * 2 4 0 大小,于a v i 或m o v 格式视频相差无几,由于v c d 的帧率要高得多,加上有c d 音质的伴 音,所以整体的观看效果要比前者好得多。 5 d v d d v d 可以说是c d 、l d 及v c d 的替代产品,这是按照m p e g 2 标准制作的高清晰 2 浙江大学硕士论文学位 画面( 水平分辩率可达5 4 0 线) 高品质音响( 杜比a c 一3 音效处理、4 8 k 声音采 样频率) ,的存储介质,与v c d 简单的比较,7 c d 单张盘片只能容纳7 4 分钟的相当 于录相带的低质量双声道的动态数据,而d v d 单张盘片可容纳两个小时以上的 高清晰全动态视频数据,支持6 声道环绕音响,通过附加的数据轨道能实现多种 语言的配音和字幕,并且具有更强的究错能力。由于采用了m p e g 2 数据存储的新 标准,它能够提供更好的画质,更大的压缩比。d v d 技术集计算机技术、光学记 录技术和影视技术等为一体,其目的是满足人们对大存储容量、高性能的存储媒 体的需求。d v d 光盘不仅已在音视频领域内得到了广泛应用,而且将会带动出 版、广播、通信、w w w 等行业的发展。 6s v c d 、d v c d s v c d 是英文“s u p e rv c d ”的缩写,它采用m p e g 一2 编码及解压缩技术, 拥有4 声道或双立体声,图像分辨率为4 8 0 + 5 7 6 ,水平清晰度达350 线。s v c d 标准是在我国国家有关权威部门参与指导下,由中国录制设备标准化委员会与国 内1 0 家最具有实力的影碟机生产厂家兴同制订的,它是电子行业第一个由中国 人自己研究制定的产品标准。这标准的公布意味着未来在d v d 的版权中将有 中国的一席之地。该标准还得到了索尼、松下、j v c 和飞利浦等跨国公司的支 持。被有人称为“中国版权,国际标准”。 近来,市场上还出现了一种名为“d 、,c d ”的影碟,并以“d v d + v c d ”的 面目出现。由于这些碟片是碟片是打着“d v c d ”的容量是v c d 的两倍的旗号 出现在市场上,因此,一些人对此产生了兴趣。d v c d 其实是一种高密度光碟, 为cd 改进型产品,但其物理格式已不同于cd ,用ce 头光可以读取,也就是 说:品质较好的vcd 机才可以播放。dv c d 的特点是:用一张光碟可以储存 90 分钟左右的电影,其图像和伴音采用i v peg1 方式压缩,清晰度和音质同 vcd 一样。但是因为d v c d 碟没有统一的标准,d v c d 碟其实是一种没有行 业标准,没有国家标准,更谈不上是国际标准的音像产品。 1 1 3d v d 的优点 d v d 比之v c d 是一种质的飞跃,d v d 诞生把家庭视听领域带到了一个崭 新的境界。我们可以看看究竟是哪些方面让d v d 能如此光彩。 1 高存储量 从外表上看,d v d 盘与普通的c d 没什么两样,光盘直径均为1 2 0 m m ,但 c d 光盘的容量为6 8 0 m b ,仅能存放7 4 分钟v h s 质量的动态视频图像。而d v d 盘能存储的信息量却是相当惊人的,单面单层d v d 记录层具有4 7 g b 容量,若 以接近于广播级电视图像质量需要的平均数据率4 6 9 m b p s 播放,能够存放1 3 3 浙江大学硕士论文学位 分2 0 秒的整部电影。双面双层光盘的容量高达1 7 g b ,可以容纳4 部电影于单 张光盘上。这就要求在d v d 中采用更先进的技术手段来提高信息记录密度,从 而增加盘的容量。如此巨大的容量不要说普通的电脑数据,就连高清晰的图象影 像、高保真的音效,d v d 盘也可以毫不费力的存储下来。 2 高清晰度 由于d v d 采用国际通用的活动图像m p e g i i 解压缩标准,要比以往的v h s ( 视频信号) 或m p e g i 标准要清晰的多。v h s 和我们目前常用的v c d ( m p e g i 压缩标准) 的解析度小于5 0 0 线,而m p e gi i 轻而易举的将其提升至5 0 0 1 0 0 0 线,几乎可以和电影相媲美,远非现在的v c d 效果能比的了的,同时它与l d 相比也有过之而无不及。d v d 的画面已经彻底的消除了马赛克、锯蝮等现象, 如果你仔细观察屏幕上影象就会发现,取而代之的是一个一个很微小的点,由此 达到的清晰度是相当高的。此外,d v d 还具有多结局( 欣赏不同的多种故事情节 发展) 、多角度( 从9 个角度观看图像) 、变焦( z o o m ) 和父母控制( 切去儿童不宜观 看的画面) 等新功能。画面的长宽比有3 种方式可选择:全景扫描、4 :3 普通屏幕 和1 6 :9 宽屏幕方式。 3 高保真音效 在音效上,d v d 也有惊人的表现。d v d 具有8 ( 7 1 ) 个独立的音频码流,足 以实现数字环绕三维高保真音响效果。d v d 标准规定:对于n t s c 电视制式( 例 如美国、日本地区) 强制规定采用杜比a c 一3 和或线性p c m 音频系统;对于p a l 电视制式( 例如欧洲和中国地区) 强制规定采用m p e g 音频格式和或线性p c m 音频系统。杜比a c 一3 是一种全数字化音频编码技术,它同以往的h i f i 立体声 和d o l b ys u r r o u n d 不同,是全新的一种声音技术,它提供6 个完全独立的 声道,除了5 个全频带的声道外,还有一个效果声道,用来表现如爆炸声等特殊 效果,俗称o 1 声道。在a c 一3 的帮助下,我们不但可以听到分离度相当高的 声音,还可以明显的感觉到电影那身临其境的三维效果。此时的音效比c d 音效 还要略胜一筹。不过要想达到此效果,你的硬件配置要够硬,除了6 个杜比认证 的全频带音箱外,还要有a c 一3 解码器、a c 一3 功放、a c 一3 线材、a c 一3 等。 4 强大的兼容性 为了能使d v d 兼容c d 、v c d 、s v c d 等等,d v d 采用了两大核心技术一 机芯和解码芯片。而机芯负责e v e 碟片的转动,放置在最合适的位置,通过d v d 激光完成信号读取。目前,d v d 的信号读取方案常见的有四种:最在由t o s h i b a 提出的单激光头单聚焦镜双聚焦点方案,p i o n n e r 的单激光头双波长激束方案, s o n y 的双激光头双聚焦镜方案。解码芯片负责将激光头读取的信号进行解码处 理,形象地讲,是将d v d 碟片上的信号重新解压复原。解码芯片质量的高低, 直接影响到清晰度高不高,音频处理是否1 0 0 全数字化等很多因素。解码应该 4 浙江大学硕士论文学位 同时进行视频解码和音频解码,丽声3 d 音效,杜比a c 3 ,d t s ,都属于音频解 码范围。使用机芯和解码芯片技术,d v d 视盘机、d v d 唱机和d v d r o m r r a m 均可播放c d 唱盘;d v d 视盘机和d v d r o m ,i i ,i i 心d 均能回放 v c d 盘;d v d - - r o m r r a m 也可读取c d r o m 盘。 5 稳定的可靠性 为了确保数据读取可靠性,d v d 采用r s - - p c ( r e e ds o l o m o np r o d u c tc o d e ) 纠错编码方式和8 1 6 信号调制方式。纠错码( e c o 块长为1 6 个记录扇区长度 ( 3 8 6 8 8 个字节) ,对应光道上8 2 5 3 4 4 m m 长度;若原始误码率为1 0 3 ,经纠错后, 误码率可小于1 0 一2 0 ,远远低于计算机所需的误码率1 0 1 2 。为了有效地防止 软件被复制,在美国活动图像协会( m o t i o np i c t u r ea s s o c i a t i o no f a m e r i c a ) 的积极 参预下,于1 9 9 6 年7 月同东芝、索尼等1 2 家家电与计算机公司就d v d 软件版 权与防盗版问题达成一致协议。1 9 9 6 年1 0 月,由各方组成的d v d 技术联合会 公布了d v d 软件和硬件采用的乱码技术以及按6 大地区区域码分区发行软件的 措施,实现了软件著作权保护与可靠使用。 1 2d v d 播放器的现状 现在,这种有着无可比拟优越性的d v d 也可以在电脑上直接播放了。和看 v c d 一样,在电脑上看d v d 也有软硬两种方法,“硬”方法是利用d v d 硬解 压卡进行m p e g 2 解压缩。硬解压画面细腻清晰,音效也令人满意,只是需要购 买一块并不便宜的m p e g 2 解压卡。随着c p u 和图形加速卡速度的提升,使d v d 软解压成为了可能,在p i ic p u 和专门为d v d 优化过的显示卡的驱动下,软解 压已可以有和硬解压一样的效果,软解压代替硬解压已是大势所趋。常见的d v d 软解压软件有p o w e r d v d 、x i n g d v d 和刚刚上市的超级解霸2 0 0 0 ) ) 。其中, 由台湾迅连科技公司出品的p o w e r d v d ,可以说是目前最好的d v d 解压软件了。 它具备了高清晰度m p e g 2 视频解码能力,分辩率在7 2 0 * 4 8 0 。在音频方面,支 持5 1 声道杜比a c 3 解码技术,可提供较完美的音响效果。p o w e r d v d 完全支 持d v dn a v i g a t i o n 指令集,包括视角切换、多种语言字幕、交互式选择菜单几 影片内容分级控制等等。同时支持键盘和鼠标操作,及3 2 k h z 、4 4 1 k h z 、4 8 k h z 的声音采样频率。在同类软件中p o w e r d v d 对硬件的要求也相对较低。在 p i i 2 3 3 ,3 2 m 内存,支持d i r e e t d r a w 的普通加速卡的机器上可以达到比较好的 效果。p o w e r d v d 的设置简单直观,启动完成后,点击标有锤子的图标就进入了 设置界面。 但是现有的d v d 播放器也存在些不足,如纠错能力不强。下面就是 p o w e r d v d 对一个有错误序列的解码效果: 浙江大学硕士论文学位 1 3 本文的硪究内容 由于误码、丢包的存在,实际的通信系统不可避免的对传输的信号引入失真。 编码视频对误码高度敏感,失真的传播与扩散使得很低的误码率导致解码厝视频 图象质量的严重下降。另外,由于各种原因,在中阑大部分人常会遇到生产质缀 较茇的v c d 、d v d 盘片,因此在播放过程中常有驱动器死锁或播放软件关闭的 情况发生,任何一歙播放软件对硬件方面的死锁都不会有太好的解决办法,这些 可通过纠锚技术减少软粹方面出现的问题。 1 3 1 文章内容安捐 本文奁第二章主要奔缁了d v d 煞数据格式,d v d - - v i d e o 静d v d 鹃蓬缩编码技 本。第三鬻分绍了d i r e c t s h o w 系绞结构以及d i r e c t s h o 嚣缝主要缎建f i l t e r 的 性缓和使用方法,以及在d i r e c t s h o w 中秀发d v d 的援敖系统的过程。第西睾镑 对播放器戏震予网络中的实际壤况,分据了网络环壤中的s 对视频失冀的影 响,以及错误发生饿置对图像失真蛇不阉影响。第蠹章介绍了几类镄误撼薮技术, 提出对于不同帧采取不同的镶误掩蔽算法,并且比较了不同错误掩薮搜术在 m p e g 2 码流中应用的效果。第六章矜析了对于i 帧的各种空域掩蔽算法的效果。 5 浙江大学硕士论文学位 1 3 2 本文的主要贡献 分析d v d 视频的结构 给出了d i r e c t s h o w 的开发方法 实现了d v d 视频解码器 讨论了传输信道对编码视频的影响以及视频的q o s 和质量评价方法 以m p e g 编码视频流为例分析了失真掩蔽的编解码方案。 分别分析了有b ,p 帧和i 帧错误掩蔽方法。 比较了多种空域掩蔽方法应用于i 帧恢复的效果。 提出了有效的空域掩蔽算法。 7 浙江大学硕士学位论文 第二章d v d 存储格式 随着数字时代的到来,各种数字存储媒体在广播电视、多媒体应用中所占的 比重也越来越大,其中光学存储器件c d 和d v d 尤为引人注目。这里主要介绍这 一家族中的最新成员d v d 。 通常所说的d v d ( d i g i t a lv e r s a t i l ed i s c 数字通用光盘或d i g i t a lv i d e o d is c 数字视频光盘) 实际上包括d v d - - r o m ,d v d - - v i d e o ,d v d - - a u d i o ,d v d r ( r e c o r d a b l e ) 和d v d r 埘五种。因此,将d v d 理解为数字通用光盘更合适。 其中,d v d r o m 用于存储电脑资料、数据库、游戏和教育软件及其它多媒体电 子出版物,并作为p c 机的外设;d v d - - v i d e o 记录视频图像、影片( 包括视频、 声音、字幕予图) ,可用于各种动画与静态画面的播放、卡拉0 k 和家庭影院,娱 乐用d v d 影碟片就是它的一个重要应用领域;d v d - - a u d i o 是专门用于对声音和 音乐节目的存放的;后两种是从其可擦重写功能上划分的,d v d r 是次写光 盘,又常称为d v d - - w o ( w r i t eo n c e ) ;d v d - - r a m 是可擦重写式,大都为相变型 光盘,反复擦写次数可达i 0 0 万次以上。本文这里的d v d 播放器就是用于播放 d v d 影碟片。 2 1d v d 的压缩编码技术 下面以d v d - - v i d e o 为例来说明d v d 的视音频压缩、编码技术,其所要记录 的内容包括视频、声音和字幕子图三部分,由于各自信号的不同特点,处理方式 也不尽相同( 见表1 1 1 ) 。但总的原则是:在固定的d v d 总容量下,通过压缩 码率的有效控制和数据资源的最优分配,来得到最佳的画面和声音质量。 表1 1 _ 1d v d v i d e o 的视频、声音和字幕予图编码的有关参数 视频声音子画面字幕 f编码方法 m p e g - 2a c 一3 原图 j l 可变固定压缩率编码v b r c b rv b r c b rv b r ! 码率控制可以不必困难 码率范围1 l o m b p s 3 8 4 k b p so 3 m b p s l 典型平均码率 4 m b p s3 8 4 k b p sl o o k b p s 2 1 1 视频编码 d v d 技术采用m p e g - - 2 变比特率v b r ( v a r i a b l eb i tr a t e ) 对视频信号进 浙江大学硕士学位论文 行压缩编码,达到m p m l ( m a i np r o f i l e m a i nl e v e l ) 的4 :2 :0 。 在m p e g 一2 中有三种帧:帧内帧i 帧( i n t r af r a m e ) ,预测帧p 帧( p r e d i c a t e d f r a m e ) 和双向帧b 帧( b i d i r e c t i o n a lf r a m e ) 。i 帧包含了表达画面中的每个 像素的编码信息,携带有最多的视频数据,是组成图像组g o p ( g r o u po f p i c t u r e s ) 的基础:p ,b 帧又常被称为非帧内帧,它们主要包含了当前帧和1 或2 个参考画面间的运动差异,用于表示此差异的比特数要比i 帧编码所需要的 少得多,因此,p ,b 帧的编码数据量远远小于i 帧,由这三种帧组成一个叫做 图像组g o p 的帧序列。 在m p e g - - 2m p m l 中通常是一个长度为1 5 的g o p :i b b p b b p b b - p b b p b b i ( 长度1 5 表示在两个i 帧间有1 5 帧) 。 2 1 2声音编码 声音部分采用固定码率c b r ( c o n s t a n tb i tr a t e ) 进行压缩编码,抽样频 率可达4 4 8 k h z ,而m p e g l 对声音的抽样频率只有4 4 i k h z 。同时,l p c m ( l i n e a rp u l s ec o d em o d u l a t i o n ) 线性脉冲编码调制方法可以使其音响系统声 道数达8 路,不仅能录制立体声伴音,还可实现8 种语言配音和3 2 种文字字幕。 d v d - - v i d e o 可以传送多数据流的d o l b y 数字( a c 一3 ) 5 i 通道立体声,即 5 个声音信号通道再加1 个低音扩音器,能够使最多8 个独立的语言轨和视频一 起传送,数字声音比特流可以通过7 种不同的声音方式编码: 单声道 左右立体声 左一中一右 单环绕的左右立体声 左右环绕的左右立体声 单环绕的左一中一右 木左右环绕的左一中一右 有低音效果的限带宽子低音轨( 即“5 1 ”中的“1 ”) 可以加入到以上 任意一个通道中。 d v d 还支持有外语配音的多语言版本,当然这时候需要独立的音乐和对话 轨。为了适应家庭影院效果,一般还要对声音做平衡、降噪和限峰处理。 2 1 3 字幕子图 字幕子图也是d v d 编码的部分,它主要包括字幕及在片头、片尾出现的其 他文本说明,它们可能是单色的,也可以是彩色的,甚至是多种艺术或特技效果, 所以,这部分的编码数据会由于内容复杂程度的变化而有很大的差异,同时,其 总数据量相对于视、音频编码来说都极小,且没有严格的实时要求,因此,一般 9 浙江大学硕士学位论文 总是在视频编码前运用游长编码r l c ( r u n n i n gl e n g t hc o d i n g ) 压缩技术对其 进行软件编码,而将余下的绝大多数确定空间用于对d v d 的最主要部分一一视频 图像的压缩编码处理。 综上叙述,一个典型的4 7 g b 的单层d v d 盘片能够存放1 3 2 分钟、3 种语言、 4 种文字字幕的影视节目。 2 2 d v d 盘片中的数据存储结构 2 2 1 盘片的组织结构 d v d 盘片由引入区、数据区、引出区三部分组成。作为盘片的逻辑数据结构, 从“卷空间结构”看,它分为卷标文件系统头和d v d 视频区或其它d v d 数据区。 对d v d 视盘只有卷标文件系统头和d v d 视频区。其它d v d 数据区应用于非d v d 视频,如音频。d v d 视频区的结构包含视频管理器( v m g ) 结构、视频标题集( v t s ) 结构和这两部分均包含的供实际显示的视频对象集( v o b s ) 结构。 2 2 2 视频区结构 d v d 视频区包含d v d 视盘的实际数据的区域,由视频管理器( v m g ) 和视频标 题集( v t s ) 两部分组成。这两部分均包含供实际显示的视频对象集( v o b s ) 。 ( 1 ) v m g 结构 v m g 包含所有视频标题集( v t s s ) 的内容和信息表,由称为视频管理器信息 ( v m g i ) 的控制数据、视频管理器选单的视频对象集( v m g v o b s ) 、视频管理信 息备份( g i b u p ) 数据组成。v m g 相当于v c d s v c d 的专用数据轨迹。 ( 2 ) v t s 结构 v t s 是供实际显示的一个视频节目,每个v t s 由视频标题集信息( v t s i ) 、 视频标题集选单的视频对象集( v t s m v o b s ) 、视频标题集节目的视频对象集 ( v t s t t r o b s ) 和视频标题集信息备份( v t s i b u p ) 组成。v t s 相当于v c d s v c d 轨迹。 ( 3 ) 视频对象集( v o b s ) 结构 v o b s 是视频对象( v o b ) 的集合,由视频、音频、子图像及有关导弓i 控制数 据组成。v o b s 由一个或多个v o b 组成。v o b 由一个或多个视频胞( c e l l ) 组成。 v o b 由v o b i d 序号识别。胞由一个或多个视频对象单元( v o b u ) 组成。胞由 v o b j d 和c j d 序号识别。v o b - i d 和c _ i d 序号在数据搜索信息( d s i ) 和节目 链信息( p g c i ) 中描述。d s i 以小包形式在n v p c k 中,p g c i 在v m i 和v t s i 中。 i o 浙江大学硕士学位论文 v o l 3 u 由导引包( n v p c k ) 开始,包括视频包( v - p c k ) 、音频包( a p c k ) 、子 图像包( s p p c k ) 的1 5 个包组成。它包含整数个图像组( g o p ) 数据。图2 2 1 表示盘片和v 2 g 及v t s 结构例,其中所有v o b 为连续块记录。图中v o bi d n s 表示v o b s 的v o b i d 序号,c i d n s 表示v o b 内的c e l l _ i d 序号。 图22 jd v d 盘片,v m g 结构v t s 结构 2 2 3 显示结构 d v d 视盘显示结构可由一个个标题节目( t i t l e ) 和构成该标题节目的节目链 ( p r o g r a mc h a i n ,p g c ) 来说明,即标题节目由节目链组成。 2 2 3 1 标题结构 一个标题( t i t l e ) 至少由一个节目链p g c 组成,而一个节目链至少有一个 胞。每个标题节目都有一个入口p g c 。一个标题可以有1 个或多个节目链。为此, 标题按p g c 分为3 种类型。 ( 1 ) 个顺序p g c 标题:仅由一个p g c 构成,而且节目段( p g ) 是顺序播放的。 ( 2 ) 一个随机p g c 标题:仅由一个p g c 构成,而且节目段( p g ) 是随机或无序 播放的。 ( 3 ) 多个p g 3 标题:有串型结构、分支结构、块结构3 种。串型结构:多个p g c 按从小到大的序号顺序排列和播放。分支结构:从一个p g c n 播放结束后,可以 分支到p g c n + i ,p g c n + 2 ,等多个p g c 之一。块结构:由一组多个并列p g 3 组成 浙江大学硕士学位论丈 的块,如父母块。 2 2 3 2p g c 结构 ( 1 ) p g c 组成 p g 3 在物理上由节目链信息( p g c i ) 和相应的v o b s ( 若干v o b 的集合) 两部 分数据组成,但是这两部分数据不是相连接的一条物理轨迹。 p g c i 包含前置命令区、显示控制块和后置命令区。显示控制块包含:该p g c 播放时g o b s 中相应g o b 的胞( c e l l ) 的播放顺序信息、每个胞的开始地址、以 及胞和v o b u 静止方式;胞命令;p g 播放方式( 随机、无序、循环播放) ;p g c 静止时间。 p g c 的v o b s 由多个v o b 组成,根据节目场景又可分成多个节目段( p g ) , 每个p g 由整数个胞组成,如图2 2 2 所示。 图2 2 2p o c 结构 ( 2 ) 4 种p g c 根据p g 3 所在的不同区域和作用,p g c 分4 种:首先播放p 6 c ( h p _ p g c ) , 在v m g 中描述,执行盘片初始自动读取:视频管理选单p g c ( v m g m _ p g c ) ,在v m g 中描述,用于播放视频管理选单,为所有7 t s 所用;视频标题集选单p g c ( v t s mp g c ) ,在每个v t s 的开头描述,用于播放视频标题集菜单,为v t s 的 所有标题节目( t i t l e ) 所用;标题节目p g c ( t t p g c ) ,在每个v t s 中描述, 用于播放标题节目。 ( 3 ) 节目段p g ( p r o g r a m ) p g 是p g c i 中定义的一组胞。一个p g 3 有1 9 9 个节目段p g ,而每个p g 由l 、9 9 个胞组成。没有p g 的p g 3 称为哑巴p g c 。除了随机无序显示的p g c ,所有其它 p g 3 中的所有p g 均可以作为p t t 播放:而随机无序显示的p g c 中只有第一个 p g 可为p t t 播放。 ( 4 ) p g c 的播放 播放p g c 的胞有连续播放和非连续播放两种。连续播放的p 6 c 胞有连续排列 的逻辑扇区;非连续播放的p 6 c 胞有非连续排列的逻辑扇区。播放p g c 的p g , 有顺序播放、随机播放和无序播放3 种。顺序播放是按p g 连续排列的顺序进行 播;随机播放是每次从p g 中随机选择播放,有的p g 有可能被选择多次播放; 浙江大学硕士学位论文 无序播放( s h u f f l e d ) 每次只能从未播放过的p g 中随机选择一个播放。 2 2 4 实现多路径和无接逢播放的数据结构 d v d 可以进行多路径播放,如电影的不同语言的片头说明和不同剪辑版本、 或父母管理不同等级、或多视角等,如图2 2 3 所示。 片失语占避明 父母酱埋等越 多越角 图2 2 3 一个多路径播放的例子 对有的播放还可以通过v o b 交织的方法实现多路径无接逢播放。但p g c 之间 不能保证无接缝显示,在一个p g c 内可以保证无接缝显示。为了实现多路径无接 缝播放,将视频对象( v o b ) 组织成不同的单元“块”,如v o b 块、p g c 块、胞 块等。块有连续块和交织块之分。构成交织块的成分是提供无接缝显示选择的并 列内容。 ( 1 ) v o b 块 v o b 块由一个或多个v o b 构成。一个v o b 构成的块为连续块,块内逻辑扇区 是顺序连续排列的;两个或两个以上v a b 交织排列构成的块为交织块,并以两个 或两个以上路径进行无接缝播放。 交织的结构:将每个v o b 分成数目相等的交织单元i l v u ( i n t e r l e a v eu n i t ) , 每个交织单元按v o b 的顺序相互交替排列起来。如果交织块有m 个v o b ,每个v o b 分为n 个i c v u ,其交织排列如图所示。每一个i c v u 由整数个v o b u 组成。 图2 2 4 交织排列 对交织块中v a b 的读取,是按照p g c i 规定的路径从其一个i c v u 的头开始, 读完该i c v u 后,再跳过其它不要求读的v o b 的i c v u ,到同一个v o b 的下一个i c v u 继续顺序读取。从盘片上读取的数据放入轨迹缓冲器,通过设置适当的缓冲量就 可以保证不问断地向解码器提供数据;在一定缓冲量的条件下,通过适当设置 i c v u 的大小,就可使跳跃所需时间保持在无接缝播放所允许的范围。 ( 2 ) p g c 块与父母块 p g c 块由一组并列的p g c 组成。如果p g c 间的v o b 是交织的,就可实现p g c 的无接缝播放。父母管理等级所应用的“父母块”就是p g c 块,块内并列可选的 浙江大学硕士学位论文 p g c 最多为1 6 个。 ( 3 ) 胞块( c e i lb l o c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽科技学院助管助教岗位招聘42人考试模拟试题及答案解析
- 2025福建泛达海洋工程有限责任公司招聘4人笔试参考题库附答案解析
- 2025年湖南岳阳市云溪区公开选调回乡教师2人考试模拟试题及答案解析
- 2025四川绵阳市公交远航汽车服务有限责任公司招聘市场部工作人员等岗位2人考试参考题库附答案解析
- 2025浙江嘉兴市质量技术检验检测有限公司生产操作一线岗位招聘7人笔试模拟试题及答案解析
- 2025云南省楚雄州禄丰市人民检察院招聘聘用制书记员(2人)考试模拟试题及答案解析
- 2025广东清远市连山壮族瑶族自治县民政和退役军人事务局招聘政府专项工作聘员1人笔试参考题库附答案解析
- 2025云南省怒江州福贡县人民检察院招聘合同制辅助人员(2人)考试模拟试题及答案解析
- 土方运输合同及安全责任协议模板
- 2025榆林实验幼儿园招聘笔试备考题库及答案解析
- 老年人合理用药培训
- 《国有企业采购管理规范》解读
- 2025届山东省德州一中高三毕业班第三次统测物理试题含解析
- 小学形容词副词单选题200道及答案(完整版)
- 抖音账号运营的工作计划
- 2025届辽宁省辽南协作校高一物理第二学期期末考试试题含解析
- 建筑地基处理技术规范DBJ-T 15-38-2019
- 中国律师学 课件 陈卫东 第1-9章 律师制度的产生和发展-律师的管理
- 《燃煤火力发电企业设备检修导则》
- (2024年)物联网车联网
- 胖东来服务管理手册
评论
0/150
提交评论