(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf_第1页
(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf_第2页
(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf_第3页
(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf_第4页
(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(通信与信息系统专业论文)mpeg系统在磁卡式数字摄录机中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 摘要 m p e g 系列标准是应用于活动图像领域的视频及其伴音压缩编码国际标准, 由国际组织i s o 和i e c 所组建的活动图像专家组( m o v i n g p i c t u r e e x p e r t sg r o u p ) 制定。目前m p e g l 、m p e g 2 的发展比较成熟,而且应用也比较广泛:m p e g 4 是1 9 9 9 年提出的具有更强大功能的、可以支持更多应用的标准,在未来的多媒 体应用中,将得到更广泛的应用。 本课题研究“m p e g 系统在磁卡式数字摄录机中的应用”,是将m p e g 系列 标准的应用引入到磁卡式数字摄录机中( 当前的数字摄录机使用的是不同于 m p e g 的d v 标准) ,在计算机上软件模拟实现数字摄录机的录放功能。 本论文完成了如下三方面的内容: 1 磁卡式数字摄录机摄录功能中的m p e g 2 系统编码器模块。将m p e g 4 视频码流和g 7 2 6 音频码流复用成m p e g 2 的p s 系统码流,p s 系统码 流不仅要依据m p e g 2 系统部分标准,而且要求在实现的具体算法上更 适合于磁卡式存储器的特点。论文第三章第二节完成这一部分。 2 磁卡式数字摄录机所有播放功能的实现。完成依据用户的“功能操作信 息”分析管理文件,得到需要播放的文件及该文件开始播放的目标帧的 位置,并对该文件进行“音、视频解复用”操作。论文第三章第三节完 成这一部分。 3 m p e g l m p e g 2 到m p e g 4 视频转码的研究。分析m p e g l m p e g 2 与 m p e g 4 视频标准的异同,研究实现转码的方案。视频转码的研究不仅 是研究“m p e g 系统在磁卡式数字摄录机中应用”的延伸,也是多媒体 技术领域里一个全新的研究课题。论文的第四章完成这一部分。 课题中开发的磁卡式数字摄录机软件系统不仅成功的应用了m p e g 2 , m p e g 4 标准,而且很好的实现了数字摄录机的各种功能,具有很强的交互性。 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 a b s t r a c t m p e gs t a n d a r d s ,t h ei n t e r n a t i o n a lc o d i n gs t a n d a r d so fm o v i n gp i c t u r e sa n d a s s o c i a t e da u d i o ,a r ec o n s t i t u t e db ym o v i n gp i c t u r ee x p e r t sg r o u pw h i c hi s s u p p o r t e db yi s oa n di e c i n t e r n a t i o n a lo r g a n i z a t i o n s n o w a d a y s ,t h ed e v e l o p m e n t a n da p p l i c a t i o no nm p e g la n dm p e g 2a r em a t u r e a n dm p e g 4w h i c hw a sp u t f o r w a r di n1 9 9 9 ,w i l lb eb r o u g h ti n t om o r ea n dm o r em u l t i m e d i aa p p l i c a t i o n sb e c a u s e o f i t sm o r e p o w e r f u n c t i o n w h a ti sr e s e a r c h e di nt h i st h e s i si st h a ta p p l y i n gm p e gs t a n d a r d st od i g i t a l v i d e oc a m e r a ( d v c ) u s i n gc a r dm e m o r y a l lt h ew o r kh a sb e e n d o n ei sa st h ef o l l o w i n g : 1 r e a l i z et h em p e g 2s y s t e me n c o d e ro ft h ed v cs o f t w a r es y s t e m t h i s m p e g 2 s y s t e m e n c o d e r p a c k s m p e g 4v i d e os t r e a ma n dg 7 2 6a u d i os t r e a m i n t ot h em p e g 2 p r o g r a ms t r e a m ( p s ) t h e d e t a i lo ft h i sp a r ti si ns e c t i o n2 , c h a p t e r 3 2 r e a l i z et h ea l lp l a y i n gf u n c t i o n so ft h ed v c s o f t w a r es y s t e m i no r d e rt o c o m p l e t et h ep l a y i n gf u n c t i o n s ,s e a r c h i n gt h et a r g e tf r a m e ,w h i c hi s t h e b e g i n n i n gp l a y i n g f l a m eo ft h ev i d e os t r e a m ,i st h em o s t i m p o r t a n tq u e s t i o n m a tm u s t b er e s o l v e da tf i r s t a n dt h e nd e c o d et h ep ss t r e a mf r o m t h e t a r g e t f r a m eb ym p e g 2s y s t e md e c o d e nt h ed e t a i lo ft h ep a r ti si ns e c t i o n3 , c h a p t e r 3 3 r e s e a r c ht h ev i d e o t r a n s c o d i n g f r o mm p e g i m p e g 2t om p e g 4 d i s c u s s i n gt h es i m i l a r i t i e s a n dd i f f e r e n c e sb e t w e e nm p e g l m p e g 2a n d m p e g 4v i d e os t a n d a r d sa n dr e s e a r c h i n gt r a n s c o d i n gs c h e m e t h ed e t a i lo f t h e p a r ti si nc h a p t e r 4 t h es o f t w a r es y s t e mf o rd v co ft h i st h e s i sn o to n l yu s e sm p e g 2a n dm p e g 4 s t a n d a r d s s u c c e s s f u l l y , b u t a l s or e a l i z e sa l l r e c o r d i n g a n d p l a y i n g i n t e r a c t i v e f u n c t i o n s 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字撮录机中的应用 第一章引言 第一节多媒体技术及多媒体应用 1 1 1 多媒体数据 “媒体( m e d i a ) ”一词,从广义上讲可以理解为“信息的表达形式或手段”, 如文字、图形、图像、声音、视频、动画等。“多媒体( m u l t i m e d i a ) ”不仅仅是信 息的多种表达形式的集合,而且要求这些“信息的多种表达形式”在“内容上彼 此关联”。 因此,“多媒体数据”是指由内容上相互关联的文字、图形、图像、声音、 视频、动画等多种信息表达形式的数据所形成的复合数据。 多媒体数据的主要特点是信息表达形式的多样性、集成性和交互性。“多样 性”即是指“信息的多种表达形式”;“集成性”是指“内容上彼此关联”的多种 媒体的集合;“交互性”是指多媒体数据需要向用户提供更加有效控制和使用信 息的手段,这也为应用开辟了更加广阔的领域。 1 。1 2 多媒体相关技术 随着数字技术的发展,以及互联网、移动通信、数码娱乐产品等应用技术的 飞速发展,人们也对多媒体应用不断提出新的需求,例如对多媒体数据内容的交 互性操作,多媒体数据在一定质量条件下的高压缩率,以适应网络上的传输等。 多媒体应用的前提就是多媒体相关技术的快速发展。 多媒体技术包括多媒体信息的数字化、多媒体数据的压缩、多媒体数据的传 输、多媒体数据的存储等。由于多媒体信息非常庞大,压缩前的数据不便于传输、 存储,这就使多媒体数据的压缩就成为了一个非常必要而且核心的技术。 音频数据和视频数据是多媒体数据中占大比重的数据,数据的压缩也主要是 针对这两种数据。又由于视频数据量比音频数据量大得多,压缩技术也复杂得多, 所以视频数据压缩成为了多媒体压缩技术的一个重点。 1 1 3 多媒体技术的应用 多媒体技术和计算机技术的发展,推动了多媒体技术的应用。多媒体系统的 应用不仅涉及到通信和计算机的各应用领域,也涉及到了广播电视系统、出版、 3 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 商业广告、文化娱乐等领域或行业。可以预言,充满魅力的多媒体业务将在未来 的信息社会中扮演越来越重要的角色。 多媒体技术在通信领域的应用主要有可视电话、会议电视、移动多媒体通信 ( 如彩信m m s ) 、视频点播( v o d ) 等,它们使通信越来越便捷和生动。 多媒体技术在计算机领域的应用主要有多媒体计算机、三维图形图像、动画 设计与制作( f l a s h 等) 、多媒体数据库等,它们使计算机的应用延伸到了各个行 业。 多媒体技术在文化娱乐领域的应用主要有v c d 、d v d 、电子游戏、数码相 机、数字摄录机等,它们使人们的文化生活越来越丰富多彩。 1 2 1 概述 第二节多媒体数据压缩标准 目前得到广泛应用的多媒体数据压缩标准有两大系列,即h 系列和m p e g 系列。h 系列主要应用在通信领域,由国际通讯联盟组织( i t u t ) 制定:m p e g 系列主要应用在活动图像领域,由国际组织i s o 和i e c 所组建的活动图像专家 组( m o v i n g p i c t u r ee x p e r t sg r o u p ) 制定。 多媒体数据压缩各个标准的发展又具有一定的相关性,它们的发展历程可由 图1 。1 表示: 1 2 。2h 系列标准 图1 1 多媒体数据压缩标准发展历程 h 系列标准主要有h 2 6 1 、h 2 6 3 等。 h 2 6 1 主要应用于电视电话和会议电视( h 3 2 0 、h 3 2 3 系统) ,压缩编码后的 4 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 速率是p x 6 4 k b p s ( 1 0 = 1 - 3 0 ) ,p = l 或2 时适用于可视电话,p 6 时适用于较高图 像质量的会议电视;h 2 6 3 应用于低码率的电视电话和会议电视( h 3 2 3 、h _ 3 2 4 系统) ,压缩编码后的速率低于6 4 k b p s 。 1 2 3m p e g 系列标准 l v i _ p e g 系列标准主要有m p e g l 、m p e g 2 、m p e g 4 等。这些标准都由音频、 视频和系统三部分构成。 堡塑! 垦堕缠塑厦塑垄圣塑! 二! ! ! 塑! ! 塞里壹! ! 垫塑皇皇塑:塞堕堕鏖鱼垫 ( h d t v ) 就采用的m p e g 2 标准。m p e g l 、m p e g 2 是目前发展比较成熟标准, 当前的许多多媒体应用都以这两种标准为基础,许多媒体资源也都是这两种标准 的格式。 m p e g 4 是运动图像专家组在1 9 9 9 年公布的标准,制定这一标准的目标是提 供更有效的压缩、更广泛的交互、更通用的传输接1 2 1 ,它的关键特征是面向音视 频内容中的对象,它的预期应用是音视频的压缩存储、检索、流式传输和无线传 输等。多媒体数据经这一标准压缩编码后的速率是5 k b p s - 1 0 m b p s ,能支持目前 的标准尚未全面支持的那些应用,例如移动通信中的声像业务、与其它多媒体数 据( 如计算机的图形、图像) 的集成和基于对象( 内容) 的交互式多媒体技术等。 作为一种新出现的并将得到广泛应用的多媒体数据压缩标准,m p e g 4 越来越得 到相关领域内研究的重视。 第三节流行、时尚的多媒体技术应用数字摄录机 数字摄录机,又称数字摄像机或数码摄像机,是目前比较流行、时尚的消费 性小家电电子产品。由于数字摄录机采用了c c d 作为记录图像的光敏介质,而 c c d 是通过光照的不同引起的电荷分布的不同来记录被摄物体的视觉特征,所 以数字摄录机拍摄的图像可以直接输入到计算机中,无需购买胶卷,并且拍摄时 可以随时看到拍摄效果,不满意可以立即重拍,从而比传统相机拥有节约成本、 数字化方便、减少误拍等多项优势。数字摄录机不仅可以摄录一个静态场景( 即 有数码相机的功能) ,更可以将你感兴趣的一段动态场景摄录成一个节目。 5 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 1 数字摄录机的构成 从多媒体系统的角度看数字摄录机的构成,可由图i - 2 中的虚线左边的部分 表示: 图i - 2 数字摄录机的构成 图中“摄像头”和“麦克风”接收视频和音频信号,并将这些信号数字化 后传入数字摄录机的“c p u 中央处理单元”;“显示器”和“扬声器”是播放( 回 放) 摄录节目的视频和音频的显示部件;“磁盒式存储器”和“磁卡式存储器” 是数字摄录机的存储设备;“功能操作键盘”是用户操作的界面;“c p u 中央处 理单元”是数字摄录机完成各项功能的核心部件,它根据“功能操作键盘”的操 作指令,完成对从“摄像头”和“麦克风”来的数字信息的压缩编码和对从存储 器来的数据的解码。 2 数字摄录机的发展趋势 数字摄录机的发展趋势是小型化、轻量化、高清晰化。“高清晰化”要求数 字摄录机中采用更先进的多媒体数据压缩算法;“小型化”和“轻量化”要求数 字摄录机体积越来越小,同时重量越来越轻。存储器技术的发展,使得数字摄录 机的“小型化”和“轻量化”成为现实。 3 数字摄录机的存储器 数字摄录机主要有两类存储器,即磁盒式存储器和磁卡式存储器。 磁盒式存储器的容量较大,体积仅火柴盒般大小,一般可以摄录6 0 分钟到 9 0 分钟的节目内容。当摄录机使用磁盒式存储器时,堡垦扭丕箕焦显一旦y 塑主 压缩标准,它直接将d c t 压缩后的视躯塑呈焦量查熊型垡垒:b 一臻有运始e 偿 鲤篁鲨! 逝坠壁垒土塑塑塑堕垡堕量墼壹! 亘坠望堇! ! 丝堡旦量盐篡垫担垄堡! 翅国! 二至逝丞! 亟通过旦丛整丝唇在电视扭土搔放e 。目前的摄录机般都有磁盒 6 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 式存储器。 磁卡式存储器容量比磁盒式存储器小得多,一般只有几十兆或几百兆,不同 的数字摄录机开发商所使用的磁卡式存储器有不同,如s o n y 使用的是m e m o r y s t i c k ( 记忆棒) ,夏普使用的是s m a r t m e d i a c a r d ( 聪明卡) ,松下、i v c 使用的s d m e m o r yc a r d ( s d 卡) 等,它们的形状各异,但体积都比磁盒式存储器小得多。由 于这种磁卡式存储器的容量较小,使用这种存储器时,对多媒体数据的压缩需要 采用与d v 不同的方法,需要采用具有更高压缩率的数字压缩标准,如m p e g 。 这种磁卡式存储器可以通过u s b 接口与计算机相连接,如图1 - 2 所示。并不是 所有的摄录机中都有这样的存储器。 第四节课题准备和课题任务 1 4 1 课题的准备工作和前期调研 在对市场上的数字摄录机进行调研之后发现,目前对数字摄录机中采用的 d v 数字压缩标准的研究和应用已经比较成熟。但由于这种压缩方法仅仅对视频 数字信号进行了d c t 编码,其压缩率并不是很高,所以经这种数字压缩标准压 缩后的数据量较大,并不适合存储到磁卡式存储器上。 由于磁卡式存储器体积更小,满足了消费者对数字摄录机“小型化”、“轻量 化”和使用方便的要求。同时u s b 接口是一种非常通用的接口,当磁卡式存储 器通过u s b 接口与计算机相连接时,计算机对该存储器上数据的操作就如同对 计算机硬盘上的数据进行操作一般方便,特别适合于需要通过计算机,对摄录的 节目( 内容) 进行后期处理的应用。因此磁卡式存储器越来越受到数字摄录机使 用者的青睐。 因此数字摄录机使用磁卡式存储器时采用怎样的数字压缩方法,也越来越受 到技术研究领域的关注。 1 磁卡式存储器的选择 目前市场上存在各式各样的磁卡式存储器,如s o n y 使用的m e m o r ys t i c k ( 记忆棒) ,夏普使用的s m a r t m e d i a c a r d ( 聪明卡) ,松下、j v c 使用的s d m e m o r y c a r d ( s d 卡1 等,各种存储卡都有自己的特点。 s d 卡是s d a ( s da s s o c i a t i o n ,成立于2 0 0 0 年) 和与其合作的开发商( 如松 下) 一起研究开发的。其重量只有2 克、厚度是2 1 毫米,体积和邮票一样,并 7 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 具有如下特点:记忆体含百万容量、快速的传送数据以及对音乐、电影和其它商 业数据的高度拷贝保护。 由于s d 卡既可以使用到数字摄录机中,亦可以通过u s b 接口作为与计算 机相连的移动存储器,就像现在得到广泛应用的u 盘、u s b 活动硬盘一样,因 此课题中选用s d 卡作为数字摄录机的磁卡式存储器。 2 数字压缩标准的选择 m p e g 系列标准是专门针对活动图像及其伴音制定的标准,也是视频技术领 域里的主流标准。查堡壁垄竖m ! 曼鱼丕型签壅堡塑墼主堡墨垫堡旦壁塞查堡 器时使用的数字压缩方法。 音频、视频、系统各部分采用的具体标准如下: 音频部分采用g 7 2 6 标准。d v 标准中要求音频具有极高的保真度,一 般采用p c m 方式处理音频数据,采用c t 7 2 6 压缩后的音频数据量是采 用p c m 压缩后的数据量的几分之一,同时其压缩算法更简单一些,能 保证较高的声音保真度。 视频部分采用m p e g 4 视频标准。m p e g 4 视频压缩率比d v 标准的压缩 率大得多,同时作为新制定的而又充满活力的标准,必将成为未来多媒 体技术应用领域数字压缩标准的主流,因此将m p e g 4 视频技术应用到 数字摄录机中也是一种学术上的研究和探讨。 系统部分采用m p e g 2 系统标准。m p e g 2 标准是目前发展比较成熟并得 到广泛应用的标准,本课题采用m p e g 2 系统标准将g 7 2 6 音频和 m p e g 4 视频复用( 或打包p a c k ) 成p s ( p r o g r a ms t r e a m ) 系统码流。 3 开发环境的选择 本课题研究m p e g 标准在磁卡式数字摄录机中的应用,由于是对m p e g 标 准系统在磁卡式数字摄录机中应用的探讨性研究,课题中选择在计算机上软件模 蓝l 塞现的友式! 鎏搓亘丝丕旦塾查塑耋昼墼兰堡墨垫塑堡堡堡塑:婴堕堡里塑至 究周期也不用太长,在研究生期间就可以完成。所以课题的开发环境是w i n d o w s 操作系统,软件编程使用m i c m s o t l v i s u a lc h6 0 由于对磁卡式存储器的选择是采用s d 卡,s d 卡可以作为计算机的移动存 储器,在课题研究过程中,可以定义计算机硬盘上的某一存储区域来模拟s d 卡。 8 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 1 4 2 课题的任务 本课题名为“m p e g 系统在磁卡式数字摄录机中的应用”,在数字摄录机系 统构成中,研究与“c p u 中央处理单元”、“功能操作键盘”和“s d 卡”相关的 部分,如图1 3 中的灰色矩形框所示: 图1 - 3 课题研究涉及的数字摄录机构成部分 本课题是用软件模拟的方式实现,将图1 3 中的“c u p 处理单元”细化成 各个软件模块,可以得到图l 一4 ,灰色矩形框模块是课题中需要完成的模块。 图1 - 4 课题中的软件模块 本课题项目组由两名成员组成,由于考虑到工作量、完成的时间以及本实验 室的研究方向,对图i - 4 作如下两点说明: 9 北京邮电大学硕士研究生论文- - m p e g 系统在磁卡式数字摄录机中的应用 课题中没有对“m p e g 4 视频压缩”和“6 7 2 6 音频压缩”模块进行研究 和开发。在课题进行之前,利用实验室现成的m p e g 4 编码器和g 7 2 6 编码器得到视频文件和音频文件,在课题进行中直接使用m p e g 4 视频 文件和g 7 2 6 音频文件进行其他模块的研究和开发。 课题中重点研究视频部分。 本论文完成课题的如下几个部分: 磁卡式数字摄录机摄录功能( r e c o r d ) 中的n i p e g 2 系统编码器。将 m p e g 4 视频码流和6 7 2 6 音频码流复用( 或打包p a c k ) 成m p e g 2 的 p s ( p r o g r a ms t r e a m ) 系统码流,p s 系统码流不仅要依据m p e g 2 系统 部分标准,而且要求在实现的具体算法上更适合于磁卡式存储器的特 点。论文第三章第二节完成这一部分。 磁卡式数字摄录机播放( p l a y ) 功能的实现。课题中需要实现的播放功 能如图1 5 所示。播放功能的实现需要:1 、根据“功能操作信息分 析管理文件”,得到需要播放的文件及该文件开始播放的目标帧的位置; 2 、对该文件进行“音、视频解复用”操作;3 、后面的音、视频解码显 示部分由同项目组的其他同学完成。论文第三章第三节中对各个播放功 能有具体的叙述。 图1 - 5 课题中需要实现的播放功能 m p e g l m p e g 2 到m p e g 4 视频转码的研究。对这一部分的研究是基于 当前众多的视频技术应用都是依据m p e g l 僻e g 2 视频部分标准,包括 数字摄录机中的一些应用( 如现有的一些磁卡式数字摄录机视频部分就 是采用的m p e g l m p e g 2 ) ,因而目前的很多媒体资源都是 m p e g l m p e g 2 格式。而随着技术的发展,m p e g 弭将得到更广泛的应 用,要对已有的媒体资源进行更好的应用,转码的研究就成为一种需要。 论文的第四章完成这一部分。 1 0 韭京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 第二章课题中相关标准的介绍 第一节m p e g i m p e g 2 m p e g 4 2 1 1 视频数据的一些基本概念 图2 - 1 视频数据的构成 1 视频序列、图像组 视频数据比特流中最高的语法结构就是视频序列,由一系列运动图像帧构 成。视频数据流总是从视频序列头信息数据开始。 图像组由多帧运动图像帧构成,是视频序列的子集。它总是以i 帧开始,是 有助于对视频序列进行随机操作的数据单元。 2 图像帧及帧类型 图像帧是视频数据流的基本编码单元,一帧图像由一个亮度矩阵( y ) 和两 个色度矩阵( c b 和c r ) 构成。帧的类型有i 帧、p 帧和b 帧。 i 帧是帧内编码帧,仅使用自身信息进行编码。对视频序列随机解码某一帧, 总是从该帧之前离该帧最近的i 帧开始解码。 p 帧是预测编码帧,以参考帧( 该帧之前的i 帧或p 帧) 为基础,使用运动 补偿预测进行编码,同时该帧又是后面预测编码帧的参考帧。 b 帧是双向预测编码帧,也称内插帧,以两个参考帧( 与该帧相邻的两个i 帧或p 帧) 为基础,使用运动补偿预测进行编码,但b 帧不能作为参考帧。 3 宏块( m b ) 和块( b l o c k ) 宏块由图像帧中一个1 6 x1 6 象素矩阵组成;块是8 8 的矩阵数据。所以如 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 果是4 :2 :0 或4 :1 :1 的图像取样格式时,一个宏块由四个亮度矩阵和两个色度矩阵 构成。 2 1 2m p e g l 视频部分标准 m p e g l 视频码流的层次结构如图2 2 所示。每一层的码流都由头信息 ( h e a d e r ) 和数据部分构成。头信息中指示了该层数据的公共信息,如序列头信 息中包含了图像( p i c t u r e ) 的分辨率、帧率、量化表等信息。 m p e g l 视频部分标准对每一层头信息和数据内容进行了语义的规定,称为 “视频比特流语法”。m p e o l 视频码流即是符合m p e g l 视频标准语义的二进制 码流。 图像序列层 图像组层( g o 融 图像层( p i c t u r e ) : 条层( s l i c e ) 宏块层( m b ) : 块层( b l o c k ) : 图2 2m p e g 2 码流层次结构 2 1 3 m p e g 2 视频部分及系统部分标准 m p e ( 3 2 视频部分标准在m p e g l 视频部分标准的基础上,扩展了一些头信 息,这些扩展信息使m p e g 2 视频码流可以得到更广法的应用。m p e 0 2 视频码 流的层次结构也如图2 2 所示。 m p e g 2 系统部分标准定义了两种系统码流,一是传送流( t s ) ,另一个是 节目流( p s ) ,这是两种不同的复用( 或打包p a c k ) 音、视频码流的方法。 p s 流中是将音、视频基本比特流按应用的需要打成长度不同的包( 音频包 里仅含有音频数据,视频包里仅含有视频数据) ,然后直接将所有的音频包和视 频包按照一定的方法排列在一起,就形成了p s 流。 t s 流首先同样是将音、视频基本比特流按应用的需要打成长度不同的包, 1 2 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 然后将所有的包( 连同包头信息) 都看成数据,再将这些数据分成等长度的段 重新打成长度固定的包,并加上新的包头( t s 包头) ,就形成了t s 流。 2 1 4m p e g 4 视频部分标准 与m p e g l m p e g 2 样,m p e g 4 的视频码流也采用分层码流结构,在码流 的最底下两层也是宏块层和块层。但是。为了实现基于内容的功能,m p e g 4 引 入了视频对象平面v o p 的概念,如图2 3 所示( 图中最底下的两层,即宏块层 和块组层没有画出) 。按照这一概念,输入视频序列的每一帧都可以分割成许多 任意形状的图像区域( 视频对象平面) ,每块区域内可以包含特定的图像或感兴 趣的视频内容。与m p e g l 2 标准中的视频输入格式相比,m p e g 4 的视频输入不 再局限于矩形区域,而且每块区域都可以动态变化。 坞v s 一刚 嗅诌嘞 o 懒b j e 蝴c tl e , e z ) 嗅w 嗍 兵审撕 。弱罱r 一。百茹广 图2 3m p e g 4 的视频码流层次结构图 v o p 是m p e g 4 最基本的表征对象内容的单位,属于同一对象的连续的v o p 成为视频对象v o 。同一v o 所有v o p 的形状、纹理、运动信息编码为单独的 视频对象层v o l 。同时,在视频对象层的编码比特流中还应包括在接收端重建 不同v o l 的相关信息( 如不同的对象如何组合、各个对象在空间域和时间域的 位置等,即m p e g 4 层系统中的场景描述信息) 。v o l 结构的输入视频可通过分 1 3 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 割的方法获得。如果原始的输入视频序列没有分解为任意形状的v o l ,那么编 码结构就退化为只处理具有标准矩形形状的一层,这时的处理方法与m p e g l 2 标准相似。因此,m p e g 4 中基于内容的方法可以看作是m p e g l 2 编码方法在处 理任意形状的视频输入序列时的逻辑扩展。 m p e g 4 视频可以支持基于内容的更强大的功能,如高效压缩,基于内容的 数据表示方式,基于内容的交互( 操作、编辑、访问等) ,基于内容的分级扩展 ( 空间域分级、时间域分级) 。这一特点为用户的交互控制提供了最基本的机制。 m p e g 4 标准将众多的多媒体应用集成于一个框架之内,旨在为更多应用的实现 提供标准的算法和工具。 第二节g 7 2 6 现有的音频编码标准主要有g 7 1 1 、g 7 2 6 、g 7 2 8 、g 7 2 9 、g 7 2 3 1 等,这些都 是i t u t 制定的关于音频的标准,它们分别采用的压缩算法和数据速率如表2 - 1 所示。 表2 1i t u 关于话音编码的系列标准 g 7 2 6 标准中将6 4 k b p s 的p c m ( 8 0 0 0 h z 抽样的音频信号,每个样值编码 8 b i t ) 作为输入数据,采用a d p c m 算法,将每个样值与前一样值的差值编码为 2 b i t 、3 b i t 、4 b i t 或5 b i t ,编码后数据速率分别为1 6 k b p s 、2 4 k b p s 、3 2 k b p s 、4 0 k b p s 。 g 7 2 6 编码器和解码器分别如图2 - 4 和图2 - 5 所示。 1 4 北京邮电大学硕士研究生论文- - m p e g 系统在磁卡式数字摄录机中的应用 图2 _ 4g 7 2 6 编码器 图2 - 5g 7 2 6 解码器 第三节s d _ i d e os p e c 讯c a t i o n s 1 0 2 3 1 概述 s dv i d e os p e c i f i c a t i o n1 0 是s d a ( s da s s o c i a t i o n ) 制定的s d 卡标准的一部 分。s dv i d e os p e c i f i c a t i o n1 0 中定义了s d 卡上存储多媒体数据流的新的格式, 即s d _ v i d e o 格式。 课题中研究“m p e g 系统在磁卡式数字摄录机中的应用”,由于选择了s d 卡作为数字摄录机的磁卡式存储器,在软件研究开发整个系统的过程中,除了依 据m p e g 标准系统,s d v i d e os p e c i f i c a t i o n1 0 也是课题依据的一个重要标准。 1 5 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 2 3 2s d 卡上的数据存储格式一s d _ _ v i d e o s d 卡上的数据存储格式如图2 - 6 所示。图中用黑线加重的矩形框表示s d 卡上存储数据的目录结构:灰色的矩形框表示各个对应目录路径下的数据文件。 s d _ v i d e o 数据格式中定义了两类文件,即管理文件( m a n a g e m e n tf i l e ) 和 媒体数据文件( m e d i ao b j e c td a t af i l e ) 。图2 - 6 中,浅灰色矩形框表示了管理文 件,深灰色矩形框表示了媒体数据文件。这些文件中最核心的还是媒体数据文件 ( m o d ) ,各个管理文件记录了相应的m o d 文件的信息。 图2 - 6s d _ v i d e o 数据存储格式 s d d e o 格式主要有两类路径,一是管理文件路径( m g ri n f o ) ,其中包 括m a n a g e m e n td a t af i l e 、p r o g r a mm a n a g e rf i l e 和p l a y l i s tm a n a g e rf i l e 。 m a n a g e m e n td a t af i l e 、p r o g r a mm a n a g e rf i l e 中记录了s d 卡上所有媒体数据内 容的全局信息,而p l a y l i s tm a n a g e r f i l e 中则记录了用户自己编辑的p l a y l i s t 的信 息。 二是节目文件路径( p r g 0 0 1 ,p r c r x x x ) 。s d 卡上可以记录多个节目 ( p r o g r a m ) ,每个节目有唯一的序号标识,目录名称p r g x x x 中后三位x x x 即是 节目的序号标识。一个节目又由多个m o d 构成,同样每个m o d 也有唯一标识, 由文件名m o v n n n m o d 中的1 1 1 1 1 1 表示。一个节目和一个m o d 的内容由用户操 作“功能界面”定义的。在节目文件路径下,除了多个m o d 文件,还包括该节 目的管理文件p r o g r a mi n f o r m a t i o nf i l e ,以及每个m o d 文件对应的管理文件 m o i 。 1 6 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 2 3 。3 s dv i d e o 的管理文件 s d _ v i d e o 中的管理文件记录了相应的p r o g r a m 或m o d 的信息,这些信息 是数字摄录机进行各种播放功能时查找、定位开始播放的目标帧( t a r g e tf r a m e ) 的依据。下面介绍三个重要的管理文件。 1 p r g x 】( ) 【p g i 节目信息文件( p r o g r a mi n f o r m a t i o nf i l e ) ,是在摄录过程中伴随着每个节目 ( p r o g r a m ) 生成的信息文件。每个p r g x x x 文件夹都包含有一个p r g x x x p g i 文件,它记录着与整个节目( p r o g r a r n ) 有关的信息,例如整个节目的时间长度、它 所包括的m o d 文件的个数等。另外,在p r g x x x p g i 中记录着整个节目的标志 位( m a r k e r ) 的信息,在实现前进跳跃式播放( f o r w a r ds k i pp l a y b a c k ) 和后退跳跃 式播放( r e v e r s es k i pp l a y b a c k ) 功能时需要用到这些信息。 2 m o v x x x m o l 媒体数据信息文件( m e d i ao b j e c ti n f o r m a t i o nf i l e ) ,是在摄录过程中伴随着 m o d 文件生成的管理信息文件,每一个m o i 文件对应一个m o d 文件,记录着有 关这个m o d 文件的信息,如m o d 文件的时间长度、音频数据和视频数据的压 缩格式等。每个m o i 文件中还保存着m o d u _ i n f o ( 记录一个m o d u 的相关信 息) 和t s ei n f o ( 记录进行时间搜索的相关信息) 两个重要信息,用于快速定位 开始播放的目标帧。这两个重要的信息结构如下表所示: 表2 - 2m o d ui n f o 结构 表2 - 3t s e j n f o 结构 1 7 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 3 p l s r 一- m g r p l a y l i s t 管理文僻:( p a y i s t m a n a g e r f i l e ) ,是伴随着生成( c r e a t e ) 、编辑( e d i t ) 和删除( d e l e t e ) p l a y l i s t 的过程而生成,并且可以不断更新的有关p l a y l i s t 的信 息。s d 卡上只有一个p l s tm o r 文件。它包含有一个或者多个p l s t j n f o 信 息单元,记录着每个p l a y l i s t 所包括的p i n a ms e c t i o n 的个数以及每个p r o g r a m s e c t i o n 的起始位置和结束位置等。p l s t a n r o 的数据结构如下表所示。 n u m p r g l d p r g s e c t i o n t b p r g s e c t i o n1 # o b j e c t l ol 该p r g s e c l i o n 的p r o g r a m 的序号 s t a r t p o s i 该p r g s e c t i o n 的p r o g 惜m 的起始时间 e n d p o s f 该p r 9 s e c 廿o n 的p r o g r a m 的结束时间 p r g s e c t i o nn # o b j e c t l dl 该p r g s e c l i o n 的p m g 旧m 的序号 s t a r t p o s l 该p r g s e c u o n 的p r o g r a m 的起始时间 e n d p o s l 该p r g s e c t i o n 的p r o g r a m 的结束时间 表2 - 4p l s t _ i n f o 结构 2 3 4s d - v i d e o 的媒体文件一m o d m o d 文件是s d v i d e o 数据文件中最核心的文件,它是由用户通过“功能 操作界面”定义的一段视频序列,如图2 - 7 所示。一个m o d 文件由多个媒体数 据单元( m e d i ao b j e c td a t a 叫廿- m o d u ) 构成,一个m o d u 对应一个图像 组的概念,是s d _ v i d e o 格式中进行随机操作( 寻找目标帧) 的单元。 图2 - 7 视频序列和m o d 文件 1 8 北京邮电大学硕士研究生论文m p e g 系统在磁卡式数字摄录机中的应用 一个p a c k ,即一个数据包,由包头信息( h e a d e r ) 和包数据( d a t a ) 构成。 依据m p e g 2 系统部分标准,一个p a c k 可由n ( n 1 ) 个p a c k e t 构成,每个p a c k e t 也由p a c k e t 头和数据部分( 音频和视频数据) 构成,如图2 - 8 所示。 m p e g 2 的p s 玛流: 一个p a c k 的结椅 一个p a c k e t 的结构 图2 - 8m p e g 2 的p s 码流结构 s d _ v i d e o 格式中规定一个p a c k 仅包含一个p a c k e t ,所以上图中一个p a c k 的结构可以简化为图2 - 9 所示。 、o l o m 7 f p a c k - h e a d e rp a c k e t _ h e a d e r v i d e oo r a u d i od a t a 图2 - 9s o - d e o 中的一个p a c k 的结构 这样的打包音、视频基本码流方式( 即将音、视频码流打包成如图2 - 9 所示 的p a c k ) ,虽然在一定程度上打包效率( 即一个p a c k 中的音频或视频数据字节 数与整个p a c k 字节数的比值) 不是很高,但这样的结构即符合了国际标准 ( m p e g 2 系统部分标准) ,又方便了对音频或视频数据进行搜索( 在这样的p a c k 构成的系统流中,只要定位了一个p a c k 的头信息位置,就可以很快的得到该p a c k 中数据的所有信息) 。 1 p a c k 的类型 依据m p e g 2 系统部分标准,s d _ v i d e o 中针对当前的应用,定义了四种p a c k 的类型,如表2 5 所示。 , s dv i d e o 中规定m o d 文件中必须有vp c k ,可以有ap c k 、pp c k 和 tp c k ;如果m o d 文件中含有vp c k 、ap c k 、tp c k 三者中两类及两个以 上类型的p a c k ,则m o d 文件的第一个p a c k 一定是p - p c k 。课题中主要涉及了 vp c k 、a j c k 帮p j c k 。 1 9 北京邮电大学硕士研究生论文- - m p e g 系统在磁卡式数字摄录机中的应用 表2 - 5s d v i d e o 中p a c k 的类型 2 、,_ p c k 在s dv i d e o 中,定义一个vp c k 中所包含的视频数据必须小于或等于一 个图像帧的数据。由于图像帧有i 帧、b 帧、p 帧三种类型,所以每一帧的数据 量也很不相同。因而每个v j c k 的长度也因每一帧而不同,对于i 帧而言,由 于对其进行的是帧内编码,该帧的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论