




已阅读5页,还剩52页未读, 继续免费阅读
(信号与信息处理专业论文)mpeg2到avs视频转码关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东南大学学位论文独创性声月删辫 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 劲l 办j l jx 。 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印 件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:麴! 裹趁导师签名: 摘要 摘要 m p e g 一2 到a v s 视频转码关键技术研究 目前国际上主流的视频编码标准有i s o i e c 的m p e g 系列,i t u t 的h 2 6 l 系列。a v s ( a u d i o v i d e oc o d i n gs t a n d a r d ) 是具有中国自主知识产权,并根据中国音视频产业的需求,针对高 分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通信、互联网宽带流媒体等重 大信息产业应用而提出的信源编码标准。但是目前在推广a v s 的过程中,还存在a v s 内容源 偏少的问题,这个问题严重阻碍了a v s 的产业化推广。所以,本文的研究工作就是围绕m p e g 一2 视频到a v s 视频的转码技术展开。 本文首先介绍了m p e g 一2 和a v s 视频编码的关键技术,在研究对比了m p e g 一2 和a v s 视频 标准的异同后,对现在的视频转码技术进行了简单描述,并根据m p e g 一2 和a v s 的不同点,提 出适合m p e g 一2 到a v s 的视频转码结构。 在图像变换域,图像的能量分布反映了图像的纹理特征。根据这一特点,本文针对m p e g 一2 到a v s 视频转码的帧内编码过程,根据能够反应图像纹理特征的m p e g 一2 宏块的变换域d c t 系 数分布,来对a v s 帧内预测模式进行选择。实验证明,本文的方法相比原来根据率失真大小 遍历全部预测模式的方法而言,在峰值信噪比略有降低的基础上,转码时间降低了5 5 6 5 。 本文在m p e g 一2 到a v s 视频转码的帧间编码过程中,也采用了m p e g 端解码时得到的信息 对a v s 帧问预测模式进行选择,大大降低了a v s 端p 、b 帧的编码时间。在本文中,进一步地 分析了前面提出算法的不足,并在统计比较数据的基础上,精减了帧间编码时进行帧内编码 模式遍历的次数,进一步地降低了p 、b 帧的转码时间,并且图像质量没有明显的变化。实验 证明,本文的方法与级联方法以及其他同类的算法进行比较,在峰值信噪比略有降低,比特 率略有增加的基础上,可以取得很好的实时性转码效果。 本文最后对完成的工作与成果做了总结,并对下一步的工作进行了展望。 关键词:m p e g 2 ;a v s ;转码;帧内预测;帧间预测 a b s t r a c t a b s t r a c t c u l t e n t l y ,t h ei n t e m a t i o n a lm a i n s t r e 锄v i d e oc o d i n gs t a i l d 绷d si n c l u d ei s o i e cm p e gs e r i e s a n di t u th 2 6 xs e e ss t a l l d a r d s a v s ( a u d i ov i d e oc o d i n gs t a i l d a r d ) i st h es o u r c ec o d i n g s 协d a r d s 谢mc h i n e s ep r o p r i e t a r yi n t e i i e c t u a lp r o p e r t yr i g h t s ,i ti sp r o p o s e dt os a t i s 匆t h ed e m a n d s o ft h ei n f o m a t i o ni i l d u s t r y ,a n ds i g i l i f i c 肌ti n f o m l a t i o na p p l i c a t i o n sf i e l d sw h i c hi n c l u d e h i 曲- r e s o l u t i o nd i g i t a lb r o a d c a s t ,l l i 曲一d e n s 时1 2 l s e 卜d 谱t a ls t o r a g em e d i a ,研r e l e s sb r o a d - b a n d m u l t i m e d i ac o m m u l l i c a t i o na n di n t e m e tb r o a d - b a l l ds n a mm e d i ae t c h o w e v e r i nt t l ep r o c e s so f p e o m o t i i 培a v s ,t h e r ee x i t st 1 1 ep r o b l e mo fs h o n a g eo na v sc o n t e n t s ,m i sp r o b l e mp r o v e sas e r i o u s h i n d r a n c et ot h ea v si n d u s 托a l i z t i o np r o m o t i o n t h e r e f o r e ,t h er e s e a r c hw o r ko ft h i sp a p e ri st os t u d y t h et m s c o d i n gt e c h n i q u e 矗o mm p e g 2v i d e ot oa 、厂sv i d e o f i r s t l y jt h ek e vv i d e oc o d i n gt e c h n o l o g i e so fm p e g 2a n da v sa r ei n n o d u c e di nt h i sp a p e r o nt h eb a s i so fc o m p a r i s o no fm p e g 2v i d e oa n da v sv i d e os t a i l d a r d ,w ei n t m d u c et h ec u r r e n t 仃m s c o d i n gt e c h n o l o g yb d e n y a n dt h e n ,w ep r o p o s eat 啪s c o d i n gs t m c t u r eo fm p e g - 2 v i d e ot o a 、厂sv i d e oa c c o r d i n go nt h e i rd i 镌r e n c e i ni m a g e 仃a n s f o n n a t i o nd o m a i n ,t l l ee n e 联wd i s t r i b u t i o nr e n e c t st h ei i l l a g et e x n i r ef e a n l r e w m c hc o n t a i n sm eo r i e n t a t i o nr e l a t i v i 付a m o n gm a c r o b l o c k s i i lt h i sp a p e r ,a i m i n ga tt h e i r 灯a - f r 锄ec o d i n go fm p e g 2t 0a v s 乜a 1 1 s c o d i n gp r o c e d u r e ,w ec h o o s et h ei n t r ap r e d i c t i o nm o d e i na v sc o d i n gb a s e do nt h ed i s t r i b m i o no fd c tc o e 伍c i e n t so fm p e g 2m a c r o b l o c ki i l 仃a i l s f o 肌a t i o nd o m a i n w m c hr e n e c ti m a g et e x t u r ef e a n l r e t h ee x p e r i m e mr e s u l t ss h o wt 1 1 a t , c o m p a r e d 诵t hm eo r i g i n a lm e t h o do ft r a v e r s i n ga l lo ft h ep r e d i c t i o nm o d e sa c c o r d i l l gt ot h er d ( r a t ed i s t o i r t i o n ) v a l u e ,o u rm e t h o dc a nr e d u c e55 6 5 o ft h e 仃a n s c o d i n gt i m e ,a tt | l es 锄et i m e , t h ed e c r e a s eo fp s n r ( p e a ks i 跚a 1n o i s er a ! t i o ) i sl i m i t e d i nt h i sp a p e r an e wa l g o r i t h mf o rt h ei m e r - f r a m ee n c o d i n go fm p e g 2t oa v st 啪s c o d e ri s p r o p o s e da c c o r d i n gt ot h ep r i n c i p l eo ft h ei n 仃at r a n s c o d i n g b a s e do n t h ea n a l y s i so fs t a t i s t i c a ld a 饥 t | l en u m b e ro ft i m e so ni n t r a c o d i n gm o d ei ni m e r - 仃锄ec o d i n 2i sr e d u c e d ,a 1 1 dt h e n ,t h epa n db f r a m et r a n s c o d i n gt i m ei sr e d u c e d a tt h es a m et i m e ,t h ei m a g eq u a l i t yo n l yh a sal i t t l ed r o p t h e e x p e r i m e n tr e s u l t ss h o wt h a t c o m p a r e d 诵t l lt h ec a u s c a d e dm e m o da i l do t h e rs i i l l i l a ra l g o r i t l u n s ,o u r p r o p o s e da l g o t h mc a no b t a i no b v i o u sr e d u c t i o ni i l 仃a n s c o d i n gt i m e 诵t l lt h ec o s to fas l i g h t d e c r e a s ei np s n r 锄das l i mi n c r e a s ei nb i tr a t e i i lt l l ee n do ft h ep a p e r ac o n c l u s i o ni sm a d et oc o n c l u d et h e 、o d ( a n dp r o d u c t i o n ,a sw e ha s t l l ep r o p e c tf o rt h e 如t u r e 、o r k k e y w o r d :m p e g - 2 ;a 、厂s ;t r a n s c o d e ;i m r a - p r e d i c t i o n ;i n t e r - 】,r e d i c t i o n 目录 目录 摘要i a b s t 隐c t i l 目录i i i 第一章绪论1 1 1 课题的研究背景和意义1 1 2 数字视频编码标准现状。l 1 3 国内外视频转码技术研究现状一4 1 4 本文的主要研究内容5 1 5 论文结构5 第二章m p e g - 2 和a v s 视频编码及转码关键技术6 2 1m p e g - 2 标准6 2 1 1m p e g - 2 视频压缩技术6 2 1 2m p e g 2 解码过程9 2 2a v s 标;准1o 2 2 1a v s 视频编码的基本框架1 0 2 2 2 a v s 视频标准的关键技术1 0 2 3m p e g 2 和a v s 视频编码标准对比1 3 2 4 数字视频转码技术介绍l4 2 4 1 比特率转换14 2 4 2 分辨率转换15 2 4 3 不同编码标准的转换1 6 2 54 、结1 ; 第三章m p e g 2 到a v s 的帧内转码算法1 7 3 1m p e g - 2 到a v s 的帧内转码17 3 2d c t 系数帧内预测模式选择算法1 9 3 3 帧内算法实验结果2 0 3 4 本章总结2 4 第四章m p e g 2 到a v s 的帧间转码算法2 5 4 1 帧间模式选择快速算法介绍2 5 4 2m p e g 一2 到a v s 转码帧间转码算法2 8 4 3 算法改进3 4 4 4 实验结果及分析3 9 4 5 _ 、 砉4 1 第五章帧内帧间转码的整体实现4 2 5 1m p e g - 2 到a v s 转码的整体实现4 2 5 2 月、l 砉4 4 第六章总结和展望4 5 致谢4 6 参考文献4 7 发表论文和科研情况说明4 9 i i i 第一章绪论 1 1 课题的研究背景和意义 第一章绪论 最近十几年来,随着人们对的数字视频的各个方面需求越来越高,相应的各种编解码技术的发展也突 飞猛进,取得了很大的进展。国际标准化组织( i s o ) 国际电工委员会( i e c ) 和国际电信联盟( i t u ) 分别成立 了数字视频技术专家组,对数字视频压缩算法进行了深入研究,并先后制定了一系列的数字多媒体压缩编 码标准。从9 0 年代的m p e g 一1 ,肝e g 一2 和h 2 6 3 标准到现在的新一代音视频标准,如m p e g 一4 ( p a r t2 ) 、 h 2 6 4 ,以及我国国家视频标准a v s p 2 ,各种新的编码技术在其中得到了应用,极大地提高了视频压缩的 性能。 上述这些标准已经在不同的领域中得到了广泛的应用。实用中的编解码器通常仅兼容一种标准,甚至 仅符合某一标准的某一框架( p r o f i1 e ) 和级别( l e v e l ) 。这是由于各种标准所采用的编码语法和编码技术存 在差异,因此不同标准,相同标准不同框架和级别的编解码器有时也无法兼容,不同的应用系统也不便直 接交互和共享视频码流资源。由此,从上世纪末各种视频标准之间的转码技术研究成为许多学者的研究热 点。 a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) 是我国具有自主产权的音视频编码标准,是由国家信息产业 部科学技术司联合国内从事数字音视频编解码技术研究的科研机构和企业,根据我国音视频产业的需求, 针对高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通信、互联网宽带流媒体等重大信息 产业应用而提出的信源编码标准。其中,a v s 标准的第二部分( 视频部分) 已经在2 0 0 6 年2 月被正式批准 为国家标准。但是目前在推广a v s 的过程中,对于运营商来说,还存在a v s 内容源偏少,对一般用户需要 更换解码终端的问题,这严重阻碍了a v s 的产业化推广。所以,针对这些问题,很多学者开始研究由其他 标准过渡到a v s 的转码问题,如m p e g 一2 标准在以往得到了极广泛的应用,实现m p e g 一2 到a v s 的转码,可 以利用m p e g 一2 广大的内容源,以解决a v s 的内容源偏少的问题。通过a v s 与m p e g 一2 之间的转码,还可以 让各种应用系统和用户暂时不需要更换终端,只需添加一个转码芯片,就可以支持a v s ,这样很好的减少 了企业和用户的再次投资,对a v s 的推广具有很大的意义。 1 2 数字视频编码标准现状 现在的数字视频标准主要有两部分,一是肝e g 系列标准,另一个是h 2 6 x 系列标准。这两个系列标准 几乎构成了现在视频标准的全部,所以在视频压缩应用方面具有一定得垄断地位。而我国的a v s 音视频标 准就是为了打破两大标准的垄断,降低专利费用,促进我国相关电子产业的发展而制定的。 ( 1 ) m p e g 系列标准 m p e g 系列标准是国际标准化组织( i s o ) 和国际电工委员会( i e c ) 制定的关于活动图像的编码标准。 其中有视音频编码标准m p e g l ( 1 9 9 2 ) 和m p e g 一2 ( 1 9 9 4 ) 、基于视听媒体对象的多媒体编码标准m p e g 一4 ( 1 9 9 9 年) 、多媒体内容描述标准m p e g 一7 ( 2 0 0 1 ) 、多媒体框架标准m p e g 一2 1 。目前,m p e g 系列国际标准已经成 为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生 了深远影响。 国际标准化组织的活动图像专家组( i p e g ) 在1 9 9 1 年1 1 月提出了i s o i e c1 1 1 7 2 标准草案,通称为m p e g 一1 标准。该标准于1 9 9 2 年儿月通过,1 9 9 3 年8 月公布。它是为工业级标准而设计的,可适用于不同带宽的设 备,如c d r o m 、v i d e o - c d 等。m p e g 一1 直接针对1 2 m b p s 的标准数据流压缩率,其基本算法对于每秒2 4 3 0 逐行描帧,分辨率3 6 0 2 8 0 ,运动图像有很好压缩效果。m p e g 一1 标准视频编码部分的基本算法与h 2 6 x 系列的h 2 6 l 、h 2 6 3 相似,也采用了运动补偿的帧间预测、二维d c t 、v l c 游程编码等措施,此外还引入了 帧内帧( i ) 、预测帧( p ) 、双向预测帧( b ) 和直流帧( d ) 等概念,进一步提高了编码效率。但随着速 率的提高,解码后图像质量较差,并且它没有定义用于对额外数据流进行编码的格式,因此这种机制未被 广泛采用。 在m p e g 一1 的基础上,1 9 9 5 年出台的m p e g 一2 ( i s 0 i e c1 3 8 1 8 ) ,在提高图像分辨率、兼容数字电视等 方面做了一些改进。m p e g 一2 追求的是c c i r 6 0 1 建议的图像质量,即为d v b 、h d t v 和d v d 等制定的3 m b p s 1 东南大学硕士学位论文 1 0 m b p s 的运动图像及其伴音的编码标准。在m p e g 一2 中,它的运动矢量的精度为半像素,在编码运算中区 分“帧”和“场”,并引入了编码的可分级性技术。同时,由于m p e g 一2 的出色性能表现,它已能适用于h d t v , 具体技术在第2 章进行阐述。 m p e g 专家组继成功定义了m p e g 一1 和m p e g 一2 之后,于1 9 9 4 年开始制定全新的m p e g 一4 标准。m p e g 一4 标准将 众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,用于 实现音视频( a u d i ov i s u a l ) 数据的有效编码及更为灵活的存取。m p e g 一4 试图达到两个目标:一是低比特 率下的多媒体通信;二是多工业的多媒体通信的综合。据此目标m p e g 一4 引入了a v ( a u d i o v i s u a lo b j e c t s ) 对象,使得更多的交互操作成为可能。m p e g 一4 视频格式大大优于m p e g 一1 与肝e g 一2 :视频质量与分辨率高, 而数据率相对较低。主要的原因在于m p e g 一4 采用了a c e ( 高级译码效率) 技术,它是一套首次使用于m p e g 一4 的编码运算规则。另外,由于m p e g 一1 和m p e g 一2 标准均为高层媒体的表示与结构标准,其交互性及灵活性 较低。而计算机网络具有很高的灵活性和交互性,但它遵循的标准却与m p e g 标准不兼容。肝e g 一4 的制订有 效地促进了三网的融合晗儿引。 网络应用最重要的目标之一就是进行多媒体通信。而其中的关键就是多媒体信息的检索和访问,这样 m p e g 一7 就应运而生了。m p e g 一7 的目标就是对日渐庞大的图像、声音信息的管理和迅速搜索。m p e g 一7 将对各 种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。 其正式的称谓是“多媒体内容描述接口”。其实m p e g 一7 为图像检索标准,m p e g 2 1 为交互式多媒体通信框架, 这两个并非图像压缩标准。 ( 2 ) h 2 6 x 系列标准 h 2 6 x 系列标准是由国际电信联盟( i t u ) 制定的视频编解码标准,包括h 2 6 1 、h 2 6 2 、h 2 6 3 ,h 2 6 4 等。 h 2 6 1 是国际电信联盟制定的第一个视频编码标准,它的输出码率是p x 6 4 k b i t s ,主要应用于i s d n ( i n t e g r a t e ds e r v i c e sd i g i t a ln e t w o r k ) 、a t m ( a s y n c h r o n o u st r a n s f e rm o d e ) 等宽带信道上实时地传 输卢音和图像信息。 h 2 6 2 相当于m p e g 标准系列中的m p e g 一2 ,它是由i t u 与i s o i e c 联合开发的,目前这个标准已经成 功应用在d v d 、数字广播、数字电视等诸多领域。 h 2 6 3 是为了满足低速率视频通信的应用需要而制定的,适于在速率低于6 4 k b i t s 的信道上传输视频 数据。h 2 6 3 算法所用的基本结构来自h 2 6 1 ,并在h 2 6 l 的基础上做了许多重要改进。h 2 6 3 + 以及h 2 6 3 抖 是h 2 6 3 的后继版本,是对h 2 6 3 的不断改进和完善。 h 2 6 4 h 1 标准是i s 0 的活动图像专家组( 肝e g ) 和1 1 1 j 的视频编码专家组( v c e g ) 组成的联合视频专家 组( j v t ) 共同推进的视频压缩技术。h 2 6 4 从2 0 0 1 年开始制定,2 0 0 3 年3 月形成最终标准草案。该标准 在i t u 标准中称为h 2 6 4 ,而在i s o i e c 中被称为m p e g 一4 的第1 0 部分一先进视频编码( a v c ) 。 ( 3 ) 我国音视频标准a v s a v s 是我国具有自主知识产权的第二代音视频编码标准,是由国家信息产业部科学技术司联合国内从 事数字音视频编解码技术研究的科研机构和企业,根据我国音视频产业的需求,针对高分辨率数字广播、 高密度激光数字存储媒体、无线宽带多媒体通信、互联网宽带流媒体等重大信息产业应用而提出的信源编 码标准。 a v s 标准原来包括9 个部分。后又加入了移动语音和音频,总体如表1 1 表1 1a v s 标准构成 编号 名称 第l 部分系统 第2 部分 视频 第3 部分音频 第4 部分一致性测试 第5 部分参考软件 第6 部分数字媒体版权管理 第7 部分 移动视频 2 第一章绪论 第8 部分在i p 网络上传输a v s 第9 部分a v s 文件格式 第1 0 部分移动语音和音频 其中,a v s 标准的第二部分( 视频部分) 已经在2 0 0 6 年2 月被正式批准为国家标准。主要针对数字 地面电视广播、有线电视等高清晰度数字电视广播、宽带视频业务、实时通信业务( 视频会议和可视电话 等) 和高密度存储媒体应用等。 我国制定a v s 音视频标准,是由于中国作为一个消费电子产品的生产和消费大国,完全应该利用可以 自主控制的技术形成自主信源编码标准,来应对我国每年为生产电子产品而必须缴纳大量专利费的困境。 另一方面,根据我国研究机构积极参与国际标准m p e g 一4 、a v c h 2 6 4 的经验来看,我国国内的研究团队已 经具备制定自主信源编码标准的能力。这样,我国在选择数字电视标准时,更能发挥后发优势,有利于产 业全面发展、有利于形成具有国际影响的音视频编码标准。2 0 0 2 年工作组成立的时候,确定a v s 为国家标 准,同时也在积极努力跟国际上的标准组织进行合作,把它变成一个国际标准。从技术上来讲,相比现存 的标准,a v s 标准压缩效率高,整个技术方案实现复杂度低、技术方案的知识产权比较清晰,这是这个标 准的三大特点。基于这个标准,可以极大地促进国内的音视频产业以及国际的数字媒体产业的发展旧1 。 从2 0 0 2 年1 2 月9 日,信息产业部科学技术司正式发出关于成立“数字音视频编解码技术标准工作组” 的通知,并确定该工作组的任务是:面向我国的信息产业需求,联合国内企业和科研机构,制( 修) 订 数字音视频的压缩、解压缩、处理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解 码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体 等重大信息产业应用。a v s 的进程正不断地发展着,见下表: 表1 2a v s 标准计划进度表5 1 ( a ) 先进音视频编码 a v s 部分国家标准计划号小组草案 工作组草最终草案标准送审标准报批国家标准 ( d ) 案( c d )( f c d )稿( f d )稿( f d s )( g b ) a v s 卜p 1 ( 系统一广播)2 0 0 513 0 4 一t 一3 3 92 0 0 3 1 0 2 0 0 3 1 22 0 0 6 1 02 0 0 7 0 3 2 0 0 8 1 0 a v s 卜p 2 ( 视频一基准)2 0 0 3 2 2 6 5 一t 一3 3 92 0 0 3 1 0 2 0 0 3 1 22 0 0 4 42 0 0 4 8 2 0 0 6 2 a v s 卜p 2 ( 视频一增强)2 0 0 3 2 2 6 5 一t 一3 3 92 0 0 5 9 2 0 0 6 3 a v s l 一p 2 ( 视频一力日强)2 0 0 8 0 5 4 9 一t 一4 6 9 2 0 0 8 1 l ( 要求2 0 0 9 完成) a v s 卜p 3 ( 音频一双声道)2 0 0 5l3 0 5 一t 一3 3 92 0 0 4 1 22 0 0 5 32 0 0 5 1 22 0 0 6 4 a v s l p 3 ( 音频一5 1 )2 0 0 513 0 5 一t 一3 3 92 0 0 5 92 0 0 5 1 2 2 0 0 5 1 22 0 0 6 4 a v s 卜p 4 ( 一致性测试)2 0 0 51 3 0 6 一t 一3 3 92 0 0 6 9 2 0 0 6 1 22 0 0 7 32 0 0 8 0 9 ( p 2 基准)( p 2 基准)( p 2 基准) a v s 卜p 5 ( 参考软件) 2 0 0 5l3 0 7 一t 一3 3 92 0 0 7 62 0 0 8 0 9 ( p 2 基准) a v s l 一p 6 ( d r m )2 0 0 513 0 8 一t 一3 3 92 0 0 5 32 0 0 5 1 2 2 0 0 6 1 22 0 0 7 0 32 0 0 8 1 2 a v s 卜p 6 ( 家庭网络档) 2 0 0 7 1 22 0 0 8 32 0 0 8 92 0 0 8 1 2 a v s 卜p 6 ( 数字音视频安 2 0 0 8 92 0 0 8 1 2 全接口) a v s 卜p 7 ( 移动视频) 2 0 0 5 1 3 0 9 一t 一3 3 92 0 0 4 62 0 0 4 92 0 0 4 1 22 0 0 6 42 0 0 6 8 a v s l 一p 8 1 ( 系统一i p )2 0 0 7 4 5 5 4 一t 一4 6 92 0 0 5 32 0 0 5 92 0 0 5 1 22 0 0 8 1 2 a v s l 一p 8 2 ( 系统一i p )2 0 0 7 4 5 5 4 一t 一4 6 92 0 0 6 1 2 0 0 6 32 0 0 7 62 0 0 8 1 2 a v s 卜p 9 1 ( 文竹格式)2 0 0 7 4 5 5 5 一t 一4 6 92 0 0 5 3 2 0 0 5 92 0 0 5 1 22 0 0 8 1 2 a v s 卜p 9 2 ( 文件格式)2 0 0 7 4 5 5 5 一t 一4 6 92 0 0 6 12 0 0 6 32 0 0 7 92 0 0 8 1 2 a v s 卜p 1 0 ( 移动语音与2 0 0 8 0 5 4 8 一t 一4 6 92 0 0 7 0 3 2 0 0 8 0 9 2 0 0 8 1 2 3 东南大学硕七学位论文 音频编码)( 要求2 0 1 0 完成) a v s 卜p 1 1 ( 同步文本)t b d 2 0 0 9 6 a v s 卜p 1 2 ( 综合媒体)t b d ( b ) 安防监控( a v s s ) a v s 部分 国家标准计小组草案工作组最终草标准送标准报国家标准 划号( 肋)草案案( f c d )审稿批稿 ( g b ) ( c d ) ( f d )( f d s ) a v s s p 1 ( 系统) a v s s p 2 ( 视频) 2 0 0 7 1 2 2 0 0 8 0 3 ( v 1 0 ) a v s s p 3 ( 音步页) 2 0 0 8 0 3 2 0 0 9 0 32 0 0 9 0 6 a v s s p 4 ( ;i 全)2 0 0 8 0 6 2 0 0 8 0 92 0 0 9 0 3 ( v 1 o )( v 1 0 ) 说明:l 、斜体字代表延迟;2 、t b d 代表尚未确定; a v s 标准第二部分( 视频部分) 的具体内容我们将在下面的章节里进行详细介绍。 1 3 国内外视频转码技术研究现状 转换编码可以定义为将视频从一种格式转换成另一种格式的再处理过程,如图1 1 所示。格式包括不 同编码标准( 又称语法转码) ,码率,分辨率等内容。早期的转换编码技术主要着眼于编码流的比特率变 换,以在不同的带宽网络上进行很好的传输。 转码器 s o u r e s t r e 锄 分辨率r l 比特率r l 标准s l o u t s t r e 锄 分辨率r 2 比特率r 2 标准s 2 图1 1 转码器示意图 码率转换是为适应不同的带宽要求,比如数字广播和网络传输,保证数字广播中特定级别之间的兼容 性,尽可能地节省带宽;分辨率转换又分为时间分辨率和空间分辨率转码,也可以是为适应带宽的要求, 不过主要是针对用户解码器的一些限制,比如处理能力、存储能力以及显示器格式限制等:语法转码主要 是由于输入码流和终端所支持的码流所遵循的视频编码标准不同,保证异类网络间信息交流,要求进行协 议层的语法转换,或为保证接收机的兼容性,也需要进行码流句法的转换怕l 。 早在1 9 9 4 年,国外对转换编码的研究就已经开始。在1 9 9 4 年i e e e 的i c i p 会议上,a e 1 e f t h e r i a d i s 提出了使用拉格朗日方法对d c t 高频系数截除进行率失真优化的方法,完成了m p e g 一2 编码视频流码率变 换。此后,对转换编码器的结构、码率控制算法以及分辨率等的研究广泛的展开。 1 9 9 8 年,b j o r kn i k l a s 和c h r i s t o p o u l o sc h a r 订a o s 在文献 8 中对基于h 2 6 3 标准的视频编码流的 转码研究中,对低分辨率图像重新编码使用的运动矢量从4 个运动矢量中选择一个,第一次涉及到视频编 码流的空间分辨率技术。 随后,随着不同标准的制定和不同应用系统的推广,转换编码技术也不断的发展。文献 9 1 1 , 阐述了m p e g 一2 到m p e g 一4 或h 2 6 4 a v c 的转码,可以将肝e g 一2 的视频内容转码为m p e g 一4 或h 2 6 4 a v c 等 其他编码的格式,从而满足网络多媒体应用的要求;文献 1 2 中,对h 2 6 4 到m p e g 一2 的转码,通过根据 不同m b 模式映射,动态地改变搜索范围窗口,来达到人人减少转码时间的目的,并相比级联转码只有稍 微的p s n r ( p o w e rs i g n a 卜t o n o i s er a t i o ) 降低;为了在获得最优的视觉质量的同时,满足比特率要求, 4 箜二童堡丝 转码时的r a t e - c o n t r 0 1 问题也是转码时有时需要考虑的。文献 1 3 对m p e g 一2 到m p e g 一4 转码时的 r a t e c o n t r 0 1 进行了研究,并利用频域复杂性估计方案来进行自适应的更改编码参数,来实现m p e g 一2 到 m p e g 一4 低的目标比特率。 但是,现在由其他标准转码到a v s 的研究还不是很多。虽然h 2 6 4 和a v s 的运用了相同的编码框架, 而且两标准中都运用整数d c t 变换、帧内预测、子像素运动估计等关键技术引,可以参考一些关于h 2 6 4 转码相关的算法,来实现a v s 的转码。但是,a v s 和h 2 6 4 毕竟还存在着许多不同之处,现在针对h 2 6 4 的转码算法,不是很适合a v s 。另一方面,针对a v s 的算法还不是很多,而且转码性能方面在转码时间和 信噪比、比特率方面存在着矛盾。所以,我们在对m p e g 一2 到a v s 转码时,还需要提出有针对性的算法, 以使得m p e g - 2 到a v s 转码在不降低序列主观质量,并且不过多增加视频流比特率的前提下,具有更好的 实时性。 1 4 本文的主要研究内容 本文在研究对比了m p e g 一2 和a v s 标准的异同后,本文包括的工作有: ( 1 ) 分析 i p e g 一2 和a v s 的关键技术,以及现在的转码技术,并根据m p e g 一2 和a v s 的不同点,提出适合 1 i l p e g 一2 到a v s 的转码结构。 由于归e g 一2 与a v s 视频编码标准的采取的关键技术差异性,如船e g 一2 采用浮点d c t 变换,运动估计 的精度为半像素,而a v s 视频编码标准采用整数d c l 变换,并采用了更精确的运动估计,四分之一像素精 度,使得 l p e g 一2 到a v s 的转码需要采用从像素域进行。 ( 2 ) 研究m p e g 一2 和a v s 帧内转码的算法 m p e g 一2 帧内编码只采用了基于d c 的差值预测,而a v s 利用宏块的空间相关性,采用了基于空间相关 的帧内预测,大大提高了帧内编码的压缩效率。由于m p e g 一2 和a v s 帧内编码方式的不同,我们不能直接 采用肝e g 一2 帧内编码的信息,来对a v s 的i 帧进行帧内编码。 a v s 的帧内预测需要根据率失真大小遍历全部预测模式,因此需要提出快速算法使帧内转码的时间降 低。 ( 3 ) 研究m p e g 一2 和a v s 帧间转码的算法 作为新一代的视频编码标准,a v s 采用了许多与m p e g 一2 不同的新技术,运动估计不但更精确于m p e g 一2 , 像素插值的计算方法也跟m p e g 一2 不一样。m p e g 一2 仅采用双线性插值二分之一像素值,a v s 二分之一像素 值位置采用四拍滤波器进行插值,四分之一像素位置采用四拍滤波器或线性插值。而且,m p e g 一2 的参考帧 仅限于一帧,而a v s 可以拥有两帧的参考帧,增加了运动估计找到最佳估计的可能性,但同时也增加了运 动估计与补偿的复杂度。 因此,在对p 、b 帧的转码分析的基础上,需要提出m p e g 一2 到a v s 帧间转码在转码时预测a v s 再编码 时的帧间预测类型的算法,减少遍历各种帧间预测模式的选择,以有效地减少p 、b 帧的转码时间,增加 转码的实时性。 1 5 论文结构 本文共分为六章,各章的内容安排如下: 第1 章介绍了本文的研究背景和意义,对现存的数字视频编解码标准、国内外转码技术研究现状进 行了简单介绍,并阐述了本文的主要研究内容。 第2 章对m p e g 一2 和a v s 标准的关键技术及现在的有关转码技术和问题的研究进行了介绍分析,并 对m p e g 一2 和a v s 视频编码标准的主要技术进行了对比。 第3 章根据m p e g 一2 解码端的块d c t 信息,提出了m p e g 一2 到a v s 的帧内转码算法。 第4 章通过理论分析和统计研究,提出了m p e g 一2 到a v s 的帧间转码算法。 第5 章根据m p e g 一2 和a v s 的异同点,提出了m p e g 一2 到a v s 的转码结构,对本文的中的m p e g 一2 到 a v s 转码进行了整体实现。 第6 章对本文进行了总结,并提出了以后的研究方向。 5 东南大学硕士学位论文 第二章肝e g 一2 和a v s 视频编码及转码关键技术 2 1m p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师资格证综合素质考试真题汇编
- 2025年计算机三级数据库技术设计与应用题及答案
- 2025年智能制造专业课程考试试卷及答案
- 福建省2025福建海事局招聘事业编制工作人员2人笔试历年参考题库附带答案详解
- 小学六年级科学课放大镜观察设计
- 施工现场安全操作规范详解
- 武义县2025年浙江金华武义县市场监督管理局招聘1人笔试历年参考题库附带答案详解
- 广州市2025广东越秀区审计局招聘行政辅助人员1人20250223笔试历年参考题库附带答案详解
- 2019版建筑工程师考题与解答
- 一年级语文拼音知识点梳理与课堂练习
- 2025文具用品采购合同范本格式
- 树木学试题及答案北林
- 电气检修生产安全培训课件
- 财政补贴政策在促进农村电商发展的扶持效果可行性分析报告
- 2025第三季度作风建设党课以忠诚廉洁担当的政治品格奋力书写高质量发展新答卷
- 《2025新版检验检测机构管理评审报告》
- 2025劳动教育考试试题及答案
- 江苏省南通市如皋市2025-2026学年高三上学期开学考试数学试卷
- 宠物急救标准化流程
- 2025届广东广州地铁集团有限公司校园招聘笔试参考题库附带答案详解(10套)
- 三甲级综合医院全科室岗位说明书汇编(专业完整模板)
评论
0/150
提交评论