(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf_第1页
(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf_第2页
(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf_第3页
(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf_第4页
(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(微电子学与固体电子学专业论文)mpeg多媒体格式研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 随着多媒体业务的发展,各种各样的多媒体格式在网上流行,但是没有一种通用 的多媒体格式,同时随着数字电视的普及,运动图象国际标准m p e g 一2 得到了广泛 的普及,m p e g 系列多媒体格式的研究成为了当今多媒体研究的热点。 目前国内的m p e g 系列媒体格式的研究已经在m p e g - - 1 、m p e g 一2 、m p e g - - 4 和m p e g 一7 这些标准上广泛开展,对m p e g - - 2 的研究已经快接近成熟,对m p e g 一4 和m p e g 一7 的研究正如火如荼的开展。d v d 可以说是m p e g 一2 的一个主要的 应用,同时m p e g 一2 也广泛应用在数据广播和数字电视上。虽然d v d 的编码格式 符合m p e g 一2 的p s 流标准,但是d v d 的节目不能直接应用于数据广播和数字电视, 因为d v d 节目的格式中的音频是a c 3 音频,而数据广播和数字电视中应用的m p e g 一2 节目的音频必须是m p 系列的音频,在它们的应用中m p e g 一2 的标准节目源格 式是m p e g - - 2 的t s 流。但是d v d 多媒体节目源转换为e g 一2 的t s 流节日源 的程序现在国内还没有。 本文通过对m p e g 媒体格式和相关的a v i 、d v d 、v c d 、a c 一3 等音频、视频 格式的研究,对比m p e g 一2 和v c d 、d v d 媒体文件格式,找出它们之间的异同点, 提出了一些解决以上问题的方法: 1 ) 在m p e g - - 2 的视频和m p 2 的音频合成m p e g 一2 的t s 流的过程中,创造性 的提出了一种自适用的软件复用的方法,用此方法在d v d 格式媒体文件转换为 m p e g - - 2 的t s 流媒体文件的程序中实现了m p e g 一2 的视频和m p 2 音频的复用。 2 ) 提出了一种d v d 格式媒体文件转换为m p e g - - 2 的t s 流媒体文件的方法并 用软件实现。软件实现中先按d v d 标准将d v d 分解为m p e g 一2 的视频和a c 一3 的音频,接下来按照a c 一3 标准完成a c 一3 音频的解码,将a c 一3 音频解码为p c m 码,然后依照m p e g 一2 音频的编码标准将p c m 码编码压缩为m p 2 的音频,最后将 m p e g - - 2 的视频和m p 2 的音频合成为m p e g 一2 的t s 流。 3 、提出了一种方法将v c d 转换为m p e g - - 2 的p s 流并且用软件实现。 4 1 设计的软件用v c + + 实现,界面友好,可操作性强。 经软解压播放软件和机顶盒的测试证明,本软件转换出的节目源能适用于各种播 放器,软件运行的效率适中。 关键词:m p e g - - 2 d v dv c da c 一3转换 华中科技大学硕士学位论文 a b s t r a c t w i t l lt h eg r o w t ho fm u l t i m e d i as e r v i c e a j lk i n d so fm e d i af o t r e a t sa r ep o p u l a r i z e do n t h ei n t e m e t b t i tn o n eo ft h e s ef o r m a t sa r ea l l p u r p o s e ,w i t ht h ew i d e s p r e a do fd t v m p e oi su s e di nm a n yf i e l d sa n di th a sb e e nt 1 1 eh o tp o ti nm u l t i m e d i af i e l d n o wt h e r ea r em a n yr c s e a r c h e so nt h em p e gs e r i e s m 呼e g - 1 、m 口e g 2 、 佃e g - 4 、 m p e g 7a n d m e g 2 1 t h er e s e a r c ho nm 呼e g la n dm p e g - 2h a sb e e nd e v e l o p e d e x t e n s i v e l ya n d h a sb e e na p p l i e di nv a r i o u sf i e l d sa n dt h e r ea r em a n yr e s e a r c hf i e l d si n m p e g 4a n dm p e g 7 n l em a i na p p l i c a t i o no fn 【p e g 一2i sd v d a n di tw a su s e di nd a t a b r o a d c a s ta n dd t va tt h es a n l et i m e a l t h o u g h 也ef o r m a to fd v dc o m p l i e dw i t ht h ep ss t a n d a r d so fm p e g - 2 ,b u ti t s a u d i of o r m a to fa c 3i sd i f i e r e n tt ot h ea u d i of o r m a to f 口e g - 2i nd a t ab r o a d c a s ta n d d t v t h ed v d p r o g r a mc a n n o t b eu s e di nd a t ab r o a d c a s ta n dd t v d i r e c t l y a sw ek n o w , t h e r ea r en o tt o o lt oc o n v e r td v d p r o g r a m t ot ss t r e a mf o r m a to f m p e g - 2 i nt h i sp a d e rw es t u d i e df i l ef o r m a t so f a v i 、d v d 、v c d 、a c 一3a n dm p e g 2a n d c o m p a r e d m e d i af o r m a to f m p e ( 卜2w i t hv c da n dd v da n ds o m er e s u l t sw a so b t a i n e d : 1 ) a na d a p t e dm u l t i p l e x i n ga l g o r i t h mi sp r o p o s e d ,w h i c hc a nm u l t i p l e xt h ev i d e oa n d a u d i oe l e m e n tp r o g r a ms t r e a mi n t oa t r a n s p o r ts t r e a i no f 田e g 一2p e r f e c t l ya n de f f e c t i v e l y as o f t w a r eb a s e do nt h i sa l g o r i t h mi sd e v e l o p e d a n di tr e a l i z e dt h em u l t i p l e xo f v i d e oa n d a u d i os t r e a m 2 、am e t h o dt h a tt r a n s f o r md p r o g r a mt oat r a n s p o r ts t r e a n lp r o g r a mo fm p e g - 2 w a s p r e s e n t e da n d w 鼬r e a l i z e db ys o f t w a r e w ed em u l t i p l e x e dd v d i n t om p e g 一2v i d e o a n da c 一3a u d i o w bd e c o d e dt h ea c 3a u d i ot oap c ma u d i o ,n e x tt h ea u d i oo f p c mw a s , c o d e d 、v i t l lt h ef o r m a to f 口2a n d i o 。i nt h ee n dt h e 田e g 2v i d e oa n d t h em p 2a u d i ow a s m u l t i p l e x e d t oa t r a n s p o r ts t r e a m o f 呼e g - 2 3 1am e t h o dt r a n s f o r m i n gav c dm e d i af i l et oap r o g r a ms t l - c s n lo fm p e g - 2w a s p r e s e n t e da n d r e a l i z e db ys o t t w a r e 4 11 1 l es o t s , r a r ec o m p i l i n ge n v i r o n m e n ti sv c + + n l ei n t e r f a c et h a th u m a n i n t e r a c t c o m p u t e r i sf i n ea n d p r o g r a mo p e r a t i o n i sc o n v e n i e n t b ym et e s to fm e d i ap l a ys o f t w a r ea n ds e t t l e _ t o p _ b o xt h i s s o f t w a r ec a nb ea p p l i e dt o v a r i o u se n v i r o n m e n ta n dr u n n i n ge f f o r ti sf i n e k e y w o r d s :m p e g 一2 d v dv c da c 一3t r a n s f o r m u 华中科技大学硕士学位论文 1 1 引言 1 绪论 高速发展的通信技术正对当今的世界上产生越来越太的影响,经济领域、国防领 域以及社会生活的各个方面都在发生深刻的变化,当今世界己步入信息时代。人们对 信息的需求急剧增加促成了信息社会功能的显著变化。近年来,作为信息革命重要发 展方向的多媒体技术的研究取得了飞速的进步,并在实际工作中得到了广泛的应用。 多媒体技术是将数据、文字、声音、音乐、动画、视频、图像等信息媒体综合于 一体,通过计算机进行数字化处理、以实现用一种传输系统处理多种媒体信息的新型 信息技术 1 】。作为多媒体技术核心的视频技术、音频技术、信息压缩和解压技术、图 像技术、离密度存储技术等日臻完善。多媒体硬件系统、操作系统平台、窗口系统、 多媒体创作工具等正日趋成熟。多媒体技术在各项工作中的应用越来越普遍。从办公、 文字处理、财务管理到字幕、动画、音视频前期摄制、后期制作、编辑、绘画特技等 许多方面都由于多媒体技术的广泛采用而发生了深刻的变革( 2 j 。 多媒体的基本特征是具有生动逼真的音响效果、色彩鲜艳的动态视频、灵活便捷 的交互手段。 1 1 1 多媒体技术有以下特征 1 ) 数字化:数字化是指多种媒体信息都是以数字方式存储,只有以数字化方式、 才能用计算机对这些信息进行处理,并使这些信息按照一定的结构存储起来,实现人 机的交互。多媒体技术的核心在于声音和图像的数字化处理,特别是近年来发展较快 的立体声音乐和动态视频的数字化处理。它主要受益于大规模集成电路的发展。 2 ) 实时性:具备实时随机存取的非线性功能。 3 ) 交互性:是指人机交互,即在播放多媒体节目时、人工能够干预、控制节目 播放过程。 4 、集成性:是指将多媒体有机地综合、做到“图、文、声”一体化a 1 1 2 多媒体研究涉及到的技术难题 1 1 数据压缩 在多媒体系统中,由于涉及的各种媒体信息主要是非常规数据类型,如图形、图 象、视频和音频等,这些数据所需要的存储空间是十分巨大和惊人的。在目前所谓的 多媒体计算机( m p c ) 配置中,所用光盘一般为6 0 0 m b ,d v d 光盘为3 g b 左右【3 】 华中科技大学硕士学位论文 ( 单层盘) ,而硬盘一般在6 0 g 左右;在通信网络上,以太网设计速率为1 0 0 0 m 位, 秒,实际仅能达到其一半以下的水平,大多数远程通信网络的光纤网还有待进一步的 发展,而最经济最常用的电话网数据传输速率才有1 2 0 0 - - - 9 6 0 0 b p s 。因此,为了使多 媒体达到实用水平,除了采用新技术手段增加存储空间和通信带宽外,对数据进行有 效压缩将是多媒体发展中必须要解决的最关键的技术之一。 然而,值得庆幸的是经过4 0 多年的数据压缩研究,从p c m 编码理论开始,到现 今成为多媒体数据压缩标准的j p e g 、m p e g 、v c d 和d v d 已经产生了各种各样针 对不同用途的压缩算法、压缩手段和实现这些算法的大规模集成电路或计算机软件, 并逐渐趋于成熟,走向市场和应用。但研究还未停止,人们还在继续寻找更加有效的 压缩算法,以及更快更好的软硬件实现方法。 2 ) 多媒体数据的模型、组织与管理 数据的组织和管理是任何信息系统首当其冲要解决的核心问题。在现代信息社会 中,计算机在我们面前堆起了一座座数据大山,但常常苦于没有从这些数据中获取有 用信息的方便工具和手段。多媒体的引入,更加剧了这种状况的恶化。 数据量大、种类繁多、关系复杂、超介质性等是多媒体数据的基本特征。以什么 样的数据模型表达和模拟这些多媒体信息空间? 如何组织存储这些数据? 如何管理 这些数据? 如何操纵和查询这些数据? 这是传统数据库系统的能力和方式方法难以 胜任的。目前,人们利用面向对象( o o :o b j e c t o r i e n t e d ) 方法和机制开发了新一代 面向对象数据库系统( o o d b :o b j e c t o r i e n t e d d a t a b a s e ) ,结合超媒体( h y p e r m e d i a ) 技术的应用,为多媒体信息的建模、组织和管理提供了非常有效的方法。与此同时, 市场上也出现了多媒体数据库管理系统。但是o o d b 和多媒体数据库的研究还很不 成熟,与实际复杂数据的管理和应用要求仍有较大的差距。因而,功能强大的多媒体 数据库研究仍是多媒体领域研究的重中之重。 3 1 多媒体信息的展现与交互 在传统的计算机应用中,因为大多数都采用文本媒体,所以对信息的表达仅仅限 于“显示( d i s p l a y ) ”。在未来的多媒体环境下,各种媒体并存,视觉、听觉、触觉、 味觉和嗅觉媒体信息的综合与合成,就不能仅仅用“显示”完成媒体的表现了。各种 媒体的时空安排和效应,相互之间的同步和合成效果,相互作用的解释和描述等都是 表达信息时必须考虑的问题。有关信息的这种表达问题统称为“展现( p r e s e n t a t i o n ) ”。 时至今日,尽管影视声响技术广泛应用,但多媒体的时空合成、同步效果、可视化、 可听化以及灵活的交互方法等仍是多媒体领域需要研究和解决的棘手问题。 4 ) 多媒体通信与分布处理 多媒体通信对多媒体产业的发展、普及和应用有着举足轻重的作用,构成了整个 产业发展的关键和瓶颈。在现行使用的通信网络中,如电话网、广播电视网和计算机 华中科技大学硕士学位论文 网络,其传输性能都不能很好地满足多媒体数据数字化通信的需求。从某些意义上讲, 现行的数据通信设施和能力严重地制约着多媒体信息产业的发展,因而,多媒体通信 一直被作为整个产业的基础技术来对待。当然,渴望真正解决多媒体通信问题的根本 方法,就是有待于当今叫得最响且正在紧锣密鼓实施的“信息高速公路”的最终实现。 宽带综合业务数字网( b - - i s d n ) 是目前解决这个问题的一个比较完整的方法,其中 a t m ( 异步传输模式) 是近年来在研究和开发上的一个重要成果。 多媒体的分布处理是一个十分重要的研究课题。因为要想广泛地实现信息共享, 计算机网及其在网络上的分布式与协作操作就不可避免。多媒体空间的合理分布和有 效的协作操作将极大地缩小个体与群体、局部与全球的工作差距。超越时空限制,充 分利用信息,协同合作,相互交流,节约大量的时间和经费等是多媒体信息分布的基 本目标。分布式体系结构研究,多媒体的通信、交换和协作操作是目前多媒体工作的 重点,且还有诸多艰难的路程要走。 5 ) 多媒体的软硬件平台 软件和硬件平台是实现任何系统的物质基础,多媒体系统也不例外。所谓多媒体 软硬件平台实际是由开发和应用多媒体系统的各种技术和各类设备组成的有效开发 环境。硬件平台主要指的是支撑多媒体系统的各种机器和设备,而软件平台主要指的 是支持多媒体系统运行和开发的各类软件和开发工具。 在硬件研究和开发方面,数字视频交换卡d v i 和c d i 作为最早的两个典型的视 频多媒体接口具有里程碑的意义。但随着硬件技术的飞速发展,各类成熟且广泛应用 的多媒体接口卡件与播放和采集设备不断更新换代,为多媒体的发展奠定了坚实的基 础。但在硬件的一体化与集成方面仍然还有许多重要的任务有待完成。 在软件方面,与硬件相比就显得相差甚远。不管是支撑多媒体系统的系统软件, 还是管理和开发软件,以及多媒体的应用软件都在能力和数量上还难以满足多媒体飞 速发展的需要。多媒体软件的缺乏,一直是制约多媒体产业发展的瓶颈问题,已成为 多媒体研究和开发关键问题。 价虚拟现实技术 所谓虚拟现实,就是采用计算机技术生成一个逼真的视觉、听觉、触觉及味觉等 感观世界,用户可以直接用人的技能和智慧对这个生成的虚拟实体进行考察和操纵。 这个概念包含三层含义:首先,虚拟现实是用计算机生成的一个逼真的实体,“逼真” 就是要达到三维视觉、听觉和触觉等效果;其次,用户可以通过人的自然技能( 五官 与四肢) 与这个环境进行交互;最后,虚拟现实往往要借助一些三维传感技术为用户 提供一个逼真的操作环境。由此可见,虚拟现实是多媒体发展的更高境界,具有更高 层次的集成性和交互性,成为多媒体技术研究中十分活跃的一个领域。 虚拟现实是一种多技术多学科相互渗透和集成的技术,研究难度非常大。但由于 华中科技大学硕士学位论文 它是多媒体应用的高级境界,且应用前景十分看好,而且某些方面的应用甚至远远地 超过了这种技术本身的研究价值,这就促使虚拟现实的研究逐年热了起来。虚拟现实 研究和应用仅仅才是起步,还有更远更长的路要走。 7 ) 多媒体应用开发 任何技术发展的目的都是为了普及和应用,并试图从中获得巨大的社会与经济效 益,多媒体也是如此。多媒体的应用已遍及各个领域,尤其在教育训练、信息服务、 数据通信、娱乐、大众媒体传播、广告等方面已显示出强劲的势头。在应用开发方面, 最受限制的是缺少一个定义完整的应用开发方法学。采用传统的软件开发方法在多媒 体应用领域中成功的很少。多媒体应用的开发会使些采用不同问题解决方法的人集 中到一起,包括计算机人员、音乐创作人员、影视制作人同、心理学与艺术研究人员 等,他们的工作方法和思维模式差异较大。对参与项目管理的人员来讲,研究和推出 一个适应多媒体应用开发的方法学是极为重要的。 从上述多媒体研究的技术难题的几个方面我们看到,要推动多媒体技术的向前发 展,这些难题都必须解决,至于比较难的数据压缩问题,人们已经进行了多年的研究, 已经研究出多种多媒体数据压缩标准。本课题的主要任务是研究m p e g 标准,并设 计相应的算法用软件实现v c d 、d v d 标准的媒体文件向m p e g - 2 标准的媒体文件的 转换。 1 2 多媒体编码技术发展的特点及方向 多媒体编码是信源编码的一种,它包括音频、视频、音视频外的其他媒体编码和 相应的系统层编码。信源编码的目的是减少数据量同时减少数据的差错率,多媒体编 码的目的也是一样的。 1 8 3 5 年的奠尔斯电码是信源编码的最初的原型,从那以后人们发明了多种信源编 码,主要有脉冲编码调制p c m 、自适用差分脉冲编码调制a d p c m 、时间和空间自抽 样编码s p a t i a la n dt e m p o r a ls u b s a m p l i n gc o d i n g 、熵编码e n t r o p yc o d i n g 、预测编码 p r e d i c a t i v ec o d i n g 4 1 、变换编码t r a n s f o r mc o d i n g 、矢量量化v e t o rq u a n t i z a t i o n 、子代编 码s u b b a n dc o d i n g 、小波编码w a v e l e tc o d i n g 、分形编码f i a e t a lc o d i n g 等。多媒体编码 和信源编码所用到的编码方式差不多,主要分为音频编码和视频编码,在形成系统层 编码时还涉及到一些信道编码。 多媒体编码技术发展到今天,已经深入到社会生活的各个方面,但是人们还在寻 找更新、更好的编码以提高媒体数据压缩率,减小媒体数据的失真率,提高媒体数据 的纠错能力。现在多媒体编码技术发展的主要特点及方向是: 1 ) 音频编码的主要发展方向是满足人们对数字音频的越来越高的要求,保持音频 华中科技大学硕士学位论文 的高保真度,尽量使数字音频向统一格式和流媒体的方向发展,发现新的编码方法, 提高压缩效率,使数字音频向无线传输的实时点播方向发展。音频编码从使用单一 编码方式发展到几种编码方式联合使用,这方面有码激线性预测编码,t d a c 编码等。 采用了了人类对不同频率声音有不同敏感度的- 1 5 理声学模型,编码时使得音频数据 的压缩效率大大提高。数字音频从单、双声道向5 1 声道甚至是7 1 声道发展,编 码时采用多声道联合编码。 2 ) 视频编码为了提高视频表现的细节而努力。视频编码的发展方向主要是提商 压缩效率,发展新的编码方法,减少压缩后的数据量,提高数据的传输速率以便适用 于更多的应用领域。从单一编码模式向多种编码模式联合使用的方向发展,人们已 经在视频编码中采用了分层编码的方法,使得对不同的要求可以采用不同的编解码:亨 式,取得不同的编解码精度和不同的视觉效果。压缩方法也从以前的基于统计冗余 度和熵编码的压缩编码模式发展到基于内容的压缩编码方式【5 】。发展视频的多种色 度格式,丰富视频颜色的表现力。 3 ) 系统层编码的发展方向是从基于固定数字存储媒体到流媒体的方式转变。并 且从多种媒体的格式向通用的媒体格式的方向发展。 1 3 当前研究热点 计算机网络发展起来以后,多媒体方面课题的研究就已经广泛开展。多媒体当前 的研究热点主要集中在以下几方面: 1 ) 多媒体编码技术的研究,主要研究开发新的有高压缩率的无损或有损编码方 法; 2 ) 多媒体应用开发,随着数字电视和视频点播技术的发展,现在各国都在抓紧 多媒体的应用开发的研究; 3 ) 虚拟现实技术,虚拟现实技术是多媒体应用的高级境界,在游戏领域和它的 相关领域有相当大的发展空间; 4 ) 多媒体软硬件平台的开发,多媒体软硬件平台是多媒体软件开发和应用多媒 体系统的各种技术和各类设备组成的有效开发环境。一旦多媒体的软硬件平台的性能 很优异,则在多媒体的应用开发中可以起到事半功倍的效果; 5 1 多媒体通信和交互的研究,多媒体通信和交互一直是多媒体研究的一个热点, 因为多媒体本身就是随着计算机和i n t e r a c t 的发展而发展起来的,而计算机和i n t e m e t 一直在不断地向前发展,所以多媒体通信和交互必定是多媒体研究的一个热点; 6 ) 分布式多媒体及多媒体存储管理的研究,这是关系到多媒体能否快速发展的 一个关键问题,因为只有提供大量的多媒体节目供人们欣赏,这样多媒体才有更大的 _ 。_ v _ _ 。1 。- _ _ 。_ _ _ 。- - _ _ - - _ _ _ _ _ _ _ 。_ _ _ _ _ _ _ _ _ 。_ _ _ - _ _ _ _ _ _ _ - - _ _ _ _ _ _ _ _ - - _ _ _ _ _ _ _ _ _ - - _ _ _ - _ _ _ _ _ _ _ - 一 华中科技大学硕士学位论文 市场空间,而多媒体节日的存储管理和分布式管理是一个最为关键的问题: 7 ) 多媒体信息的展现和交互的研究,现在人们越来越喜欢自己制做喜欢的节目, 同时希望通过多媒体和别人进行交流,这就涉及到多媒体信息的展现和交互。这方面 的课题和虚拟现实技术有一定的相关性; 1 4 本课题研究的主要内容 由于历史原因现在还存在着多种媒体格式,有时人们为了看不同内容的媒体节目 不得不装载多种媒体播放器,这就对使用者提出了较高的要求,但是使用者往往希望 播放器的功能比较简单,并且能播放不同的媒体类型,方便人们的使用,为了解决这 些问题人们已经设计了多种不同的媒体转换软件,也进行了一些理论上的研刭q ,但 是还有一些媒体类型之间的格式转换没有相应的软件,本课题研究的内容就是为了解 决其中一些问题,它主要包括以下几个方面: 1 ) 学习a v i 格式,了解a v i 格式文件的组织结构; 2 ) 熟悉v c d 格式,弄清v c d 格式文件的组织形式; 3 1 研究d v d 格式媒体文件,弄清楚d v d 格式文件的组织形式; 4 ) 弄清楚m p e g 2 的t s 流和p s 流格式媒体文件的组织形式; 5 ) 寻找v c d 格式媒体文件转化为m p e g 一2 的p s 流格式媒体文件的方法并编制 程序实现这种转化; 6 1 寻找d v d 格式媒体文件转化为m p e g 2 的t s 流格式媒体文件的方法并编写 程序实现这种转化。 6 华中科技大学硕士学位论文 2 各种编码技术及它们的适用领域 由于世界各国的经济发展不平衡和生活习惯的不同,所以存在多种的媒体文件格 式,并且他们的应用领域也各不相同,下面分别进行介绍: 2 1 v c d 、d v d 编码技术 v c d 和d v d 都是属于c d ,只不过v c d 是存储视频的c d ,d v d 是数字通用 光盘。因此,我们先来了解c d 标准。 c d 标准的整个概貌可以用图2 - 1 来表示。 图2 - 1c d 标准之间的关系 光盘存储技术自七十年代以来,得到迅速的发展。尤其是p h i l i p s 和s o n y 联合于 1 9 8 2 年制定了与音响系统配套的、存储音乐节目的激光唱盘( c d - d a :c o m p a c t d i s c d i g i t a la u d i o ) 红皮书( r e db o o k ) 标准后,相继在1 9 8 5 年制定了与计算机配套 的只读存储器激光盘( c d r o m :c o m p a c td i s c r e a do n l ym e m o r y ) 标准和在1 9 8 8 年制定的c d r o m x a ( e x t e n d e da r c h i t e c t u r e ) 标准,用于存储多媒体信息,称为黄 皮书( y e l l o w b o o k ) 标准;在1 9 8 6 年制定了用于存储影视节目的、模拟电视信号用 华中科技大学硕士学位论文 数字控制的激光电视光盘( v i d e od i s c ) 蓝皮书( b l u eb o o k ) 标准;在1 9 8 7 年制定 了用于存储多媒体信息并交互表达音频、视频、文字、数据的交互式光盘( c d - i : c o m p a c td i s c i n t e r a c t i v e ) 绿皮书( g r e e nb o o k ) 标准;1 9 9 2 年开始制定用于多媒体 c d r o m 出版系统的可读、写小型光盘系统( c d r :c o m p a c t d i s c r e c o r d a b l es y s t e m ) 橙皮书标准,其中b o o k l 定义了可擦除重写磁光盘( c d m o :c o m p a c td i s c m a g n e t o o p t i c a l ) ,b o o k 2 定义了可写一次而多次读出磁光盘( c d - w o r m :c o m p a c t d i s c - w r i t e 0 r i c e r e a d m a n y t i m e s ) :1 9 9 3 年制定了用于存储影视节目的、采用c d r o m x a 数 据格式的视频光盘( v c d :v i d e o c d ) 白皮书( w h i t eb o o k ) 标准口j 。另外,还有1 9 8 7 年在r e db o o k 基础上建立的c d - d a 系统国际标准i e c9 0 8 ;1 9 8 8 年的卷及文件结构 国际标准( c d r o m 的附加标准) i s o9 6 6 0 ;1 9 8 9 年在y e l l o wb o o k 基础上建立的 c d r o m 数据交换国际标准i s o i e c1 0 1 4 9 。 标准的制定使国际上光盘技术在视听和计算机市场得到极大的发展,特别是 c d r o m 驱动器在1 9 9 7 年销售量达到5 8 5 8 4 3 万台,其数据传输率为1 5 0 k b p s 的1 2 倍。但是,c d r o m 技术已发展到近于它的极限高度,其速度和记录密度都不能满足 视听和计算机发展的需要,因而需要寻求一种新的光盘系统。 国际上发达国家,如美国、日本等,用户宁愿采用模拟l d ( l a s e rd i s c ) 影碟机 而不愿购买m p e g 1 压缩的数字v c d ,因为l d 图像质量高于v c d 。由于v c d 机和盘片价格适合于中国广大用户的购买力,而且可以看到比v h s 略高的图像质量, 加上v c d 机只是c d 机与m p e g - i 解码器的组合,中国人掌握着v c d 解码技术, 易于形成产业,医此只有中国成了世界上最大的v c d 生产和消费市场。这种在特定 条件下形成的过渡型市场,会随着中国市场大屏幕彩色电视机、环绕声音响设各、节 目源的发展,过渡到世界大同的方向。与此同时,影视专业领域对v c d 也提出了要 求:其一是将m p e g 1 画质变为m p e g - 2 画质;其二是单面盘片的节目存储时间长度 由7 4 分钟变为1 3 5 分钟,以满足9 4 影视节目需要;其三是声音由2 路单声变为5 1 路数字声,语言3 5 种。 针对计算机及视听工业界未来对高速、大容量光盘的需求,面对影视界对v - c d 的意见和要求,世界上各大公司展开了高密度记录c d 的研究。经过几年的探索,s o n y 和p h i l i p s 于1 9 9 4 年1 0 月发布了高密度多媒体光盘( m m c d :h i g h d e n s i t ym u l t i m e d i a c o m p a c t d i s c ) ,m m c d 提出了标准c d r o m 容量为6 4 0 m b ,双层标准c d - r o m 为 1 3 g b ,单层高密度c d 为3 7 g b ,双层高密度和标准密度c d 为4 3 g b ,双层高密 度c d - r o m 为7 4 g b 。 东芝、松下、日立、汤姆森于1 9 9 5 年1 月发布了超密度光盘( s d :s u p e r d e n s i t y ) , 规定单层s d c d 容量为5 g b ,双层s d c d 为9 g b ,双面s d c d 为1 8 g b 。 两种方案互不相让,在美国电脑业与影视业的帮助下,双方于1 9 9 5 年9 月达成 华中科技大学硕士学位论文 制定统一规格的合作协议,并于1 9 9 5 年1 2 月8 日在s o n y 、p h i l i p s 、东芝、松下、 日立、j v c 、三菱、时代华纳、先锋9 大公司参加下,就下一代通用光盘d v d ( d i g i t a l v e r s a t i l ed i s c s ) 的统一规格达成协议。所谓通用是指在d v d 中,包含了从音频到视 频、从只读到可重写的全部光盘产品线在内,也称为数字多功能光盘。 d v d 标准是d v d 产品所必须达到的特性的集合 8 i ,以保证符合d v d 统一标准 的任何系统之间的互换性。d v d 标准的制定为d v d 产品迅速发展奠定了技术基础, 自1 9 9 6 年1 1 月1 日松下推出世界上第一台d v d 播放机以来,日美欧各大消费类电 子公司、电脑公司、影视公司和集成电路制造商纷纷推出自己的d v d 相关产品或样 机。 在制作前对视频的采集,是以可变比特率及m p e g - 2 标准对源素材进行编码的过 程;音频的采集,是以d v d v i d e o 格式及d o l b ya c 3 5 1 或线性p c m 或m p e g 2 音 频进行编码的过程。其中,对于双通道视频,p a l 制音频格式为线性p c m 或m p e g 2 , n t s c 制音频格式为线性p c m 或d o l b ya c 3 5 1 :对于多通道内容,p a l 制为d o l b y a c 一3 5 1 或m p e g - 2 ,n t s c 制为d o l b y a c 3 5 1 。 菜单或按键作为d v d v i d e o 作品内容执行的指导,采用图形软件包设计菜单,对 p a l 制菜单为7 2 0 x5 7 6 象素分辨率的2 4 b i t s 图,n t s c 制菜单为7 2 0 x4 8 0 象素分辨 率。子画面是用普通图形软件包制作的、叠加在视频或静止图形上的简单画面,其显 示格式符合c c i r6 0 1 标准:n t s c 制为7 2 0x4 8 0 ;p a l 制为7 2 0x5 7 6 。 编辑是根据d v d 技术要求,对各个环节和包括视频、音频、静止图形、子画面 等素材在内的编辑,并对其路径导向进行设计。生成数据流,是通过视频、音频、子 画面和导向性数据的混合来制作d v d - v i d e o 信息的过程。生成数据流后,硬盘中会 建立一套磁盘映象d v d 文件,该文件在进行最后的格式化步骤之前,完成模拟过程。 如果要对作品进行打印,在打印之前必须要确认作品内容,模拟是对d v d 素材在硬 盘映象中的编码、格式化、混合及写作等已经完成的步骤进行的确认。生成源盘的过 程,是将硬盘映象转换到数字线性磁带( d l t ) 或d v d r 上的过程。 由此可见,d v d 产品制作流程采用了m p e g 2 可变比特率视频编码技术;d o l b y a c 3 5 1 环绕声音频编码技术;d v d 刻录技术:d v d 盘片制作技术。与此相对应, d v d 影碟机采用的是m p e g 2 视频解码技术,以此技术生产了m p e g 2 解码芯片 虚拟d o l b y 环绕声( v i r t u a ld o l b ys u r r o u n d ) 技术;读取解码数据的d v d 驱动技 术。 因此,v c d 机和盘片价格适合于对图象要求不高的,购买力比较低的消费群体, d v d 适于对图象和语音有比较高的要求的消费者,同时也适用于专业性要求较强的 影视界。 华中科技大学硕士学位论文 2 2a v i 编码技术 a v i ( a u d i o v i d e oi n t e r l e a v e ) 是一种音频视像交插记录的数字视频文件格式。1 9 9 2 年初m i c r o s o f t 公司推出了a v i 技术及其应用软件v f w ( v i d e of o rw m d o w s ) 。在a v i 文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。这种按交替 方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得 到连续的信息。构成一个a v i 文件的主要参数包括视像参数、伴音参数和压缩参数等。 2 2 1 视像参数 1 ) 视窗尺寸( v i d e os i z e ) :根据不同的应用要求,a v i 的视窗大小或分辨率可按 4 :3 的比例或随意调整:大到全屏6 4 0 x 4 8 0 ,小到1 6 0 x 1 2 0 甚至更低。窗口越大,视 频文件的数据量越大。 2 ) 帧率( f r a m e sp e rs e c o n d ) :帧率也可以调整,而且与数据量成正比。不同的 帧率会产生不同的画面连续效果。 2 2 2 伴音参数 在a v i 文件中,视像和伴音是分别存储的,因此可以把一段视频中的视像与另一 段视频中的伴音组合在一起。a v i 文件与w a v 文件密切相关,因为w a v 文件是a v i 文件中伴音信号的来源。伴音的基本参数也即w a v 文件格式的参数。 2 2 3 其他参数 1 1 视像与伴音的交织参数( i n t e r l a c ea u d i oe v e r yx f r a m e s ) a v i 格式中每x 帧交织存储的音频信号,也即伴音和视像交替的频率x 是可调 参数,x 的最小值是一帧,即每个视频帧与音频数据交织组织,这是c d - - r o m 上使 用的默认值 9 j 。交织参数越小,回放a v i 文件时读到内存中的数据流越少,回放越容 易连续。因此,如果a v i 文件的存储平台的数据传输率较大,则交错参数可设置得高 一些。当a v i 文件存储在硬盘上时,也即从硬盘上读a v i 文件进行播放时,可以使 用大一些的交织频率,如几帧,甚至1 秒。 2 1 同步控制( s y n c h r o n i z a t i o n ) 在a v i 文件中,视像和伴音是同步得很好的。但在多媒体计算机( m p c ) 中回 放a v i 文件时则有可能出现视像和伴音不同步的现象。 自从m i c r o s o f t 公司公布a v i 文件格式以后,a v i 文件格式作为一种基本的视音 频媒体文件的存储格式与m i c r o s o f t 的w m d o w s 操作系统一起得到了广泛的应用,获 得了广大用户的认同。当要在两种其他的音视频格式之间进行格式转换时一般将音视 频数据先转换为a v i 格式,然后由a v i 格式转化为另外一种格式,当然也有的时候 1 0 华中科技大学硕士学位论文 并不是音视频都要转换。 2 3m p e g 1 编码技术 m p e g l 编码标准制定于1 9 9 2 年,可适用于不同带宽的设备,如c d - - r o m 、 v i d e o - - c d 、c d i 。它的目的是把2 2 l m b i t s 的n t s c 图像压缩到1 2 m b i t s ,压 缩率为2 0 0 :i 。这是图像压缩的工业认可标准。它可针对s i f 标准分辨率( 对于n t s c 制为3 5 2 2 4 0 :对于p a l 制为3 5 2 2 8 8 ) 的图像进行压缩,传输速率为1 5 m b i t s s , 每秒播放3 0 帧,具有c d 音质,质量级别基本与v h s ( 广播级录像带) 相当。m p e g l 的编码速率最高可达4 - - 5 m b i t s s ,但随着速率的提高,其解码后的图像质量有 所降低。 应用m p e g 一1 的v c d 作为价格低廉的影像播放设备,得到广泛的应用和普及。 m p e g 一1 也被用于数字电话网络上的视频传输,如非对称数字用户线路( a d s l ) ,视 频点播f v o d ) ,以及教育网络等。 【p e g l 编码技术包括系统层编码技术和压缩层编码技术两个部分【l ,系统层 编码技术以后用到的时候再讨论,现在先讨论压缩层编码技术。压缩层编码技术分为 视频编码技术和音频编码技术。 2 3 1 视频编码技术 m p e g - - 1 视频中定义的编码能获得较高的压缩比,并且能保持较高的图象质量, 由于在编码过程中不保存象素的精确值,因而算法是有损的。究竟使用哪种压缩技术 需要在高图象质量和高压缩比之间作出折衷,因为质量和压缩比是一对矛盾。压缩时, 还要满足对编码数据流进行随机存取这一要求。高压缩率不能光靠帧间编码来获得, 然而,随机存取这一要求可以用纯粹的帧内编码来满足。因此,这就需要在帧内编码 和帧间编码之间、在递归时间冗余性压缩和非递归冗余性压缩之间很好地权衡。 为了获得高压缩比,可采用多种技术。首先,为信号选择一恰当的空间分辨率, 这一点与m p e g 一1 视频没有关系( 如s i f 标准分辨率,对于n t s c 制为3 5 2 x 2 4 0 , 对于p a l 制为3 5 2 x 2 8 8 ) ;然后,算法使用基于块的运动补偿来缩减时域冗余性,利 用运动补偿根据先前图象对当前图象进行不定期预测,或根据将来图象对当前图象进 行定期预测,或根据先前图象和将来图象对当前图象进行差值预测i l “。为每个1 6 x 1 6 ( 象素行) 区域图象定义运动向量;接着使用离散余弦变换( d c t ) 对差分信号 ( 即预测误差) 进行进一步压缩,从而消除空间相关性,之后对上述结果进行量化处 理,以便丢弃一些不重要的信息,这一过程是不可逆的;最后把运动向量和d c t 合 并,并用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论