版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字电视原理第4章 数字图像紧缩编码的国际规范第4章 数字图像紧缩编码的国际规范 前面我们讨论了数字图像数据紧缩的必要性、能够性和可行性。讨论了数字图像压缩的根本原理,但是从软硬件如何实现,从工程上如何实现还未展开讨论。要做到工程实现,还有许许多多地技术问题。第4章 数字图像紧缩编码的国际规范 首先,制定规范的问题。 为了使先进的图像数据紧缩技术和高性能的数字图像处置技术获得更广泛的运用,必需对图像紧缩编码技术建立一个能在全世界范围通用的规范规范。第4章 数字图像紧缩编码的国际规范实现规范化的目的: 处置后的数据信号才干在一样性能目的和一样容量的数据网络中传送或储存设备中储存; 世界各国设备消
2、费厂家的产品才具有兼容性和通用性; 才干投入大批量开发消费,大幅度降低产品本钱,才干使图像数据紧缩技术得到迅速应用和推行。实现图像紧缩编码技术规范化的国际组织 国际规范化组织(ISO) 国际电报咨询委员会(CCITT) 国际电工委员会(IEC) 结合图片专家组(JPEG) 活动图像专家组(MPEG) 常见数字图像紧缩编码的规范一,H.261规范、H.264规范、H.263建议;二,MPEG1、MPEG2、MPEG4、 MPEG7、MPEG21;三,JPEG、 JPEG2000;四,我国拥有自主知识产权的AVS; 规范产生的背景传输的信道; 规范的运用场所; 规范的编码、解码的过程; 图像数据的
3、组织; 规范的特点及相互比较;常见数字图像紧缩编码的国际规范 H261规范,通常称为p64规范。主要用于可视和电视会议的声像业务,已于1990年由CCITT完成并经过。 JPEG规范,其目的是对静止彩色图片实现数据紧缩,主要用于卫星图片的传输与储存,图像文献资料处置与储存,新闻图片、彩色印刷图片的传输与储存等,此规范于1991年由JPEG完成并经过。 常见数字图像紧缩编码的国际规范 MPEG规范的目的是对高质量全彩色活动图像实现紧缩规范化,使经过紧缩和解码复原后的图像质量到达广播电视的质量目的,同时要求对伴音的声音数据进展紧缩处置和传输。该规范已于1992年完成并经过,目前已有MPEG1、MP
4、EG2、MPEG4、MPEG7、MPEG21、H26I及H264等多种规范。 41 H261规范 411 H261规范的由来与用途 H261规范方案的开发目的是利用CCITT(Consultative Committee on International Telephone and Telegraph)引荐的综合业务数据网络(ISDN)一次群即基群通道,来实现可视和电视会议数字图像信号的实时传送。 在当时的条件下,互联网和光纤通讯还没有开展到现代的程度,实现图像数据的传输还得依托传统的通讯网,语音通讯信道的带宽还不能满足图像数据的实时传输的要求,为此将多路语音通讯话路并行运用。传统的语音通讯信
5、道的特点: 一次群通道容量(北欧规范)为2048kbs,包含32路数字信号,每路数字信号的数据位率为 2048kbs3264kbs,此数值称为根本通道位率,以B表示。 起初,CCITT引荐图像紧缩规范为 m384kbs, m15。 传统的语音通讯信道的特点: 384kbs是来自6B=664kbs=384kbs,称为H0通道。当m5时,那么数据位率为 m384kbs5H056B1920kbs,这相当于30路数字的最高位率。 由于选384kbs位率作为起点太高,于1988年CCITT经过了p64kbs ( p=1,2,30 )视音频编码规范。最后,又把p扩展到32,故紧缩后的最高位率不应超越326
6、4kbs。这实践上又达到了数据综合业务网络(ISDN)一次群的最高位率,约为2Mbs。该规范于1990年完成,并由CCITT正式引荐为H261规范,简称p64规范。 国际电报咨询委员会CCITT于1985年开场制定H261规范,这个建议主要针对会议电视、可视等运用,且当时思索到H261规范面临世界上两种不同电视的扫描行数与帧数的规范,即52530和62525两种互不兼容的规范问题, CCITT为H261找出一种通用的中间格式CIF(Common Intermediate Format),这样一来,62525和52530都可以经过预处置和后处置模块转换到CIF或从CIF转换而来。 1会议电视 会
7、议电视是经过电信网络将远在各地的多个会议点衔接起来,以互送声音和图像的方式召开会议的一种通讯方式。该方式还可传送文件和图表及计算机数据文件,使远在各地的与会者好似在同一个会议室开会。会议电视不仅可用于开会,还可运用在远程教育、远程医疗诊断及远程监控等许多领域中。会议电视既节约时间和资金,又大大提高了工作效率。2可视 1964年美国贝尔实验室首先研制胜利Picturephone I型,以后日本、法国等国家先后研制出可视,但由于这些可视均采用模拟传输方式,占用频带宽,传输本钱高,很长一段时间未能得到开展。 20世纪80年代以来,图像紧缩编码技术的快速开展,同时促进了可视的安康开展。1986年美国I
8、BM公司研制成在PSTN网上传送黑白静止图像的可视机,日本也相继研制胜利此类的可视机,并于1988年制定了日本TTC电报技术委员会规范。继MPEG1及MPEG2紧缩编码标准发布之后,于1995年11月ITU发布了低数码率视频编码的H263建议。它是能将图像信号紧缩到64kbs以内数码率的紧缩编码方案,使可视在共用交换网(PSTN)中传输成为能够。符合H263建议的可视已进入商用。2可视 在互联网已进入家家户户的今天,利用PC机进行紧缩编码及显示终端组成的可视也已进入市场QQ视频,能完成图像及声音紧缩编解码及复用功能的单片集成电路曾经消费,这无疑为可视的普及发明了极好的条件。 3综合业务数字网(
9、ISDN) ISDN(综合业务数字网)又称“一线通业务,它把多种数字业务综合在一个网内处置并传输。 ISDN分为两种方式, 窄带NISDN,为2Mbs以下,通常上网速率到达128kbs。 宽带BISDN,为2Mbs以上。BISDN将以一致的交换与传输方式支持网内从遥控遥测几bs到高明晰度电视HDTV100Mbs150Mbs的业务,并且用光纤传输替代了现有的主干线电缆传输。 3综合业务数字网(ISDN) ISDN可把、数据、可视、会议电视等综合在一个通讯网内实现,凡参与了这个网的用户,都可实现只用一对线衔接不同的终端进展不同类型的业务通讯,简言之,BISDN就是多业务便利数字化终端挪动终端互换性
10、费用低。 3综合业务数字网(ISDN) H261主要用于ISDN综合业务数字网上进展电视会议传输,当p1或2时,只支持QCIF(Quarter Common Intermediate Format)格式。64kbs中图像为40kbs,余下的给声音。对于CIF格式,一幅图像的有效像素点按几何位置分为12个块组,每块组分33个宏块,每个宏块包含4个亮度块及色差各1个,每块那么由88的像素组成。CIF和QCIF最大帧率为30实践是29.97帧秒,即最高图像速率30000100129.9730。当每像素为8bit时,码率分别为36.5Mbs和9.1Mbs,在64Kb/s或2.048Mbs上传输,必需紧
11、缩。留意计算412 H26l图像亮色信号像素与子像块 H261规范图像层次构造 H261规范CIF格式规定了图像亮度信号每行352个像素,纵向为288个像素;而色差Cb、Cr的纵横像素数分别为亮度的一半,如图41所示。QCIF各参数为CIF的一半。图41 CIF格式亮度与色度取样H261规范图像层次构造 实践图像数据的组织 QCIF各参数为CIF的一半。同一格式其帧率和比特率64kbits为基准并非是固定的,后者的量正比于前者。在H261规范中,把一幅帧图像数据分为四个层次构造:帧层、块组层、宏块层和块层。假设选用CIF格式,那么一帧图像包含12个块组,横向2个,纵向6个;选QCIF,一帧含3
12、个纵向的块组。这种H261规范图像的层次构造如图42所示。(两个色差分别为一个宏块) 图42 H261规范图像的亮度层次构造4. 1. 3 H261的CIF宏块特点与数据构造 H261的CIF一个宏块包括4个亮度像块和色差各1个像块,共6个像块。在宏块中亮度与色差在同一像区时,由于Y像块数目为色差的4倍,故一个亮度像块的面积是一个色度的14,相反一个色差像素的面积是亮度的4倍。H261的CIF宏块构造如图43所示,该图的构造对其他规范的宏块也有借鉴意义。亮度 色度图43 H261的CIF宏块构造相当于420的采样格式第n行4:2:2第n1行 4:0:0图43 H.261的CIF宏块构造YUVY
13、宏块是运动估值和运动补偿的根本单位,也是视频处置及编辑的根本单位。H261(p64khjs)数据构造如图44所示。图44 H.261p64kb/s数据构造H.261数据构造阐明:1帧标题包括起始码,编码格式CIF/QCIF帧编号及其它信息,20bit fixed length。2块组GOB:Groups of Block标题包括块组起始码,块组位置编号及其它信息。3第三行的宏块标题包括宏块地址、帧内帧间标志、量化步长、能否有环路滤波消除运动补偿的高频噪声、能否有运动估值及其它附加信息。4第四行为块层构造,包含DCT变换系数、编码的码流,最后是一个块终了的定长码End of Block。构成一幅
14、图像详细的码流即数据流由复用编码器完成。至于CCITT H.261编码器构造框图如图45所示。图45 H261编码器构造框图量化滤波器运动估计运动补偿帧内,帧间选择缓冲存储器信道编码414 H261运动补偿范围与H263根本特点 运动补偿(MC)单元是使帧间差最小,运动估计(ME)的任务过程是从当前输入图像中取一个宏块如1616亮度像素面积并在其上一帧编码图像中搜索,搜索的大小在程度和垂直方向上都是15个像素数。通常只对亮度信号作ME,但MC既要对亮度,也要对色度亮度像素位移的一半,即矢量的长度减半进展。处理方法是:鉴于MC的过程仅仅是逼近,尤其是高频成分对新编码的图像数据匹配很差,所以在MC
15、后面用一个空间滤波器Loop Filter,它是一个低通滤波器,其作用是去掉匹配很差的分量,可以按宏块切入或切出,它只在检测到非零MV时才切入。414 H261运动补偿范围与 H263根本特点 运动补偿(MC)单元是使帧间差最小,运动估计(ME)的任务过程是从当前输入图像中取一个宏块如1616亮度像素面积并在其上一帧编码图像中搜索,搜索的大小在程度和垂直方向上都是15个像素数。通常只对亮度信号作ME,但MC既要对亮度,也要对色度亮度像素位移的一半,即矢量的长度减半进展。处理方法是:鉴于MC的过程仅仅是逼近,尤其是高频成分对新编码的图像数据匹配很差,所以在MC后面用一个空间滤波器Loop Fil
16、ter,它是一个低通滤波器,其作用是去掉匹配很差的分量,可以按宏块切入或切出,它只在检测到非零MV时才切入。42 JPEG规范 彩色图像编码规范化任务是由国际规范化组织(ISO)开场制定的,其目的是用现有的64kbs通讯网络来传送满足一定要求的规范静止数字图像信号。把每个彩色像素用1比特的数据表达时,应能获得足够理想的彩色图像质量。于是,1986年ISO组织与CCITT结合组成了结合图片专家组JPEG(Joint Photographic Experts Group),研讨延续色调包括灰度和彩色的静止图像紧缩算法的国际规范(1987年又参与了国际电工委员会IEC),JPEG规范于1992年正式
17、经过。在JPEG的努力下,该规范已运用到彩色、彩色印刷及新闻图片等静止图像的紧缩与传输。42 JPEG规范 按照JPEG引荐的规范,包括以下两种根本压缩算法: (1)以离散余弦变换(DCT)为根底的有损紧缩算法,即不可逆的紧缩方式,其紧缩比较高,是JPEG规范及其他许多规范的根底,运用最广。 (2)以二维差值预测脉冲编码(DPCM)为根底的可逆紧缩编码方式,该方式解码后能完全准确地恢复原图像采样值,其紧缩比低于有损紧缩方式的紧缩比。42 JPEG规范JPEG还包括多种任务方式: (1)顺序方式。在该方式中每一个图像分量按从左到右、从上到下的顺序被扫描,一次扫描完成编码。实践运用中最多的是有损紧
18、缩的顺序方式。 42 JPEG规范 (2)累进方式。该方式中的每一幅图像的编码要经过多次扫描才干完成,因此为到达累进的目的,在量化器的输出端即熵编码前添加一个足够大的图像缓冲区,用于存储量化后DCT系数,这些系数在多次扫描中分批地编码,即第一次扫描只对主要系数进展一次粗紧缩编码,接纳端可以在较短的时间内重建一幅质量较低的可识别图像。在随后的扫描中再传送添加信息即细节信息,进而可重建一幅质量更高的图像,以此不断累进,直到到达称心的图像质量为止。42 JPEG规范 (3)可分级方式。分级编码方式是对原始图像空间分辨率分成多个分辨率进展锥形的编码,其程度方向和垂直方向分辨率的下降以2的倍数改动。在信
19、道传送速率慢、接纳端显示器分辨率不高的情况下,只需进展低分辨率图像解码,就不用进展高分辨率解码。可见,该方式与累进方式一样,适宜因特网的动态带宽传输不同质量图像的编码特点。 42 JPEG规范421 JPEG的有损顺序紧缩编码方案 图46所示的就是一个基于DCT的JPEG有损顺序紧缩编解码系统框图。图46 JPEG有损顺序紧缩编解码系统框图42 JPEG规范JPEG编解码算法主要有以下几个主要步骤: 第一步:DCT变换。输入端把符合JPEG编码规范的亮度数字信号和两个色差数字信号分别有顺序地分成88像素块之后,送入DCT变换器中,目的是消除空间冗余。在进展DCT变换之前,将R、G、B信号按JP
20、EG规范的信号计算公式导出亮度信号和色差信号,计算公式为: 由于色差信号有正有负,故先将电平上移50,即各加0.5,目的是使Cr和Cb值均为正值。这样,数字化后的Y、Cr,和Cb,均在0255之间,便于降低传输码率。解码端再下移50(相当于128级电平),即可恢复出原有的色差信号。 第二步:量化。利用人眼的视觉特性设计量化表,JPEG规范为此在大量的实验和视觉统计的基础上,引荐了亮度信号和色度信号两种量化表,分别如表42和表43所示。表42 亮度量化表Q(u,v) 表43色度量化表Q(u,v)第三步:Z形扫描与熵编码。 结合例题进展分析422 基于DCT的量化例【3一l】,设一个亮度大小为88
21、的块图像信号,其取样值f(x,y)为:利用下式对f(x,y)实施DCT变换。得到大小为88的频率信号F(u,v)为:利用亮度量化表Q(u,v)表42 1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399uv 留意取整式中 表示小于x的最大整数,而且上述公式舍入到最接近的整数。例如: round(816)round(05)1; round(716)round(04375)0
22、 round(815)round(0533)1; round(715)round(0466)0423 基于DCT的游程编码 所谓游程长度编码是指一个码可以同时表示码的值和前面有几个零,这样就发扬“之字型(或称Z型)读出的优点。由于“之字型读出,出现连零的时机比较多,特别到最后,假设都是零,在读到最后一个数后,只要给出“块终了EOB(End of Block)码,就可以终了输出,因此节省了很多码率。 按照前面的例题有:其游程编码的顺序为(39,3,2,1,1,1,0,0,0,0,0,1,EOB),解码端收到EOB后自动补0,直到补足64个系数为止。 在实施可变长操作时,也可以表示为39,3,2,
23、1,1,1,50,1,520。 250,30,20,10,10,15,1EOB图48 RLC码字的构成4. 3 MPEG1规范 随着数字技术与计算机技术的开展,计算机网络的开展,迫切需求把计算机系统与广播电视结合起来建立一个包括各种终端在内的一致的信息网络,即多媒体网络。 H.261是基于线路交换的, MPEG主要是基于互联网的。 1 9 9 2年完成了紧缩码率达1.0 Mbs1.5 Mbs的MPEG-1规范方案, 1 9 9 3年初提出的紧缩码率在4 Mbsl 0M bs的MPEG-2规范。4. 3 MPEG1规范 MPEG-1规范的目的主要包括以下几个方面: (1)在声像质量上高于电视或电
24、视会议的声像质量,至少应到达V H S录像机或CD-ROM的放像质量。 (2)紧缩后的数据量能存储在光盘、数字录音带或可改写光盘等媒体中。 (3)紧缩后的数据率与目前的计算机网络传输码率相匹配,即以1.2 Mbs为宜。 (4)在通讯网络上该规范能顺应多种通讯网络的传输。 (5)该规范充分思索到更广泛的运用领域,例如电子图像出版物、电子图像双向传送、电子图像编辑及双向电子图像通讯等。 规范产生的背景传输的信道H.261 PSTN(ISDN) p64kb/sp:13264kb/s2.048Mb/sMPEG-1 方便计算机处置 互联网传输 多种通讯网络 1Mb/s1.5Mb/s (1.2Mb/s)规
25、范的运用场所H.261 MPEG1低质量视频,可视 视频会议图像格式: CIF、QCIF 非隔行 352288 30/s中等质量视频, VCD或CD-ROM 会议电视、远程医疗图像格式: CIF 352288 25/s SIF 352240 30/s两者具有一样的象素速率 留意:象素速率、码率、紧缩率、编码率的计算规范的编码、解码的过程;H.261 MPEG1DCT,量化,熵编码游程编码,运动补偿预测编码MPEG1是在H.261根底上开展起来的编码方法根本一样,主要区别在于将图像帧分为I、P、B帧,对于不同的图像帧采用不同的紧缩处置方法,进一步提高紧缩比。图像数据的组织H.261 MPEG1运
26、动图像序列层帧组层帧层块组层宏块层块层帧层块组层宏块层块层与H.261规范类似规范的特点及相互比较 MPEG1规范是在H.261规范根底上开展起来的,在很多方面存在类似的地方。详细的差别见前面的内容。4. 3 MPEG1规范表47 MPEG一1的两种图像编码格式 图像格式SIFCIF扫描参数525行60场2:1,4:3625行50场2:1,4:3亮度有效像素数240行帧,352像素行288行帧,352像素行色度有效像素数120行帧,176像素行144行帧,176像素行像素速率38016 M像素s编码率0316 bit像素8比特量化后的码率304128 MbS光盘中每帧字节数5千字节帧6千字节帧
27、表48 CCIR601、MPEG-1和H.261视频格式比较CCIR601MPEG-1H.261FormatPALNTSCSIFCIFQCIFFrames/s25/I30/I25/P30/P29.97/PLines/frameY576480288240288144Cr Cb28824014412014472Pixels/lineY720360352176Cr Cb36018017688IInterleave Scanning , PProgressive Scanning4. 3 MPEG1规范由表47可见,MPEG一1有如下特点: (1)像素速率: 30帧每秒的格式为(352240+2176
28、120)303.8016M像素每秒; 25帧每秒的格式为 (352288+2176144)253.8016M像素每秒。两者具有一样的像素速率。4. 3 MPEG1规范 (2)8 bit量化后的码率:像素速率8 bit象素3.8016M像素每秒8 bit象素30.4128 Mbs。假设在计算机网络中传输,按照网络传输容量为1.2 Mbs计算,那么必需的紧缩比为30.128Mbs1.2Mbs=25.2。这是理想的紧缩比,思索到实践情况需加辅助信息,故紧缩比应更高。 (3)编码率:它代表经过编码后平均每个像素所用的比特数,阐明了紧缩的程度。编码率等于传输码率像素速率1.2 Mbs3.8016 M像素
29、每秒0.316bit像素。即量化后的每像素用8bit编码,而经紧缩后每个像素仅用0.316bit编码。 4.4 MPEG2规范441 MPEG2规范根本特征 MPEG2是对MPEG1规范的承继和发展。 MPEG2规范开场于1990年,全称为“活动图像及有关声音信息的通用编码,该规范完成于1993年底, 4.4 MPEG2规范MPEG2规范的特点: 系统部分处理多个视频、音频和数据根本码流的组合问题,产生两种用于不同环境下的码流:节目码流和传送码流。节目码流是由打包的根本码流组合而成,并共享同一个时基信号,用于误码相对较小的环境,且节目码流的包可变也相对较长。传送包是将时基相互独立的打包的根本码
30、流组合成单一的码流,适用于误码较多的环境,传送包长度固定188byte。 按明晰度将图像分为4个等级,同时按运用的工具和方法不同分5种处置类型。4.4 MPEG2规范MPEG2的型与级 它充分思索了各种运用的不同要求,同时也巧妙地处理了特殊性与通用性的问题。详细实现时, MPEG一2规定了4种输入图像格式,称为级(Level) “级定义了从有限明晰度的VCD图像质量到高明晰度的HDTV图像质量,即提供了灵敏的信源编码格式。此外,MPEG一2还规定了不同的紧缩处置方法,称为型或档次“Profile。 ProfileLevel简 单Simple主 类MainSN RScalableSpatialS
31、calable高 类High高级19201920108030 19201l5225420I,P,B80MbS422,420 I,P,B100MbS高1440级14401152251440108030420I,P,B60MbS420I,P,B60MbS422,420 I,P,B80MbS主级72057625 72048029.97420I,P15MbSSPML420I,P,B15MbSMPML420I,P,B15MbSSNPML422,420 I,P,B20MbSHPML低级 35228829.97420I,P,B4MbS420I,P,B4MbS 表49 MPEG一2系统构造 主要档次主要等级(
32、MPM L)涉及的正是数字常规电视,其适用价值最大。低等级相当于ITUT的H261的CIF或MPEG一1的SIF,主要等级和常规电视相对应,高1440等级粗略地与每扫描行1440样点的HDTV对应,高等级大体上与每扫描行1920取样点的HDTV对应。在MPEG一2系统构造中,较高档次的编码除运用较低档次的编码工具外,还运用了一些较低档次没有运用的附加工具。因此,较高档次的编码器除能解码本档次编码的图像外,还能解码用较低档次编码的图像,即MPEG一2的“档之间具有向下兼容性。 2区分场和帧 在MPEG2编码中为了更好地处置隔行扫描的电视信号,分别设置了“按帧编码和“按场编码两种方式,并相应地对运
33、动补偿也作了扩展。这样,常规隔行电视图像的紧缩编码与单纯的按帧编码相比,其效率显著提高。例如在某些场所,场间运动补偿能够比帧间运动补偿好,而在另外一些场所那么相反。类似地,在某些场所,用于场数据的DCT的质量比用于帧数据的DCT的质量能够有所改良。可见MPEG2对于场帧运动补偿和场帧DCT进行选择(自顺应或非自顺应)就成为改良图像质量的一个关键措施之一。3. 可分级性 同一档次的不同级别间的图像分辨率和视频码率相差甚大。为坚持解码器向下兼容性,MPEG一2采用了信噪比可分级性和空间可分级性两种分级编码技术。信噪比可分级性表示可分级改动DCT系数的量化步长;空间可分级性利用对像素的抽取和内插来实
34、现不同级别的转换,如1440HDTV信号按MPEG一2紧缩编码后的数据流分成两个子集,对优先权高的子集解码后即可获得常规电视质量的图像(主要档主要级,15Mbits码率),相当于SDTV图像;而对两个子集一同解码才干获得1440HDTV电视质量的图像。上述过程可用表示图413来说明。图41 3 向下兼容的MPEG一2解码表示图 MPEG一2的主要特点表如今运用的灵敏性。根据运用需求将图像分成“级与“类 ,它的级包括空域分级、时域分级、SNR分级和数据分流。 空域分级:用于实现不同大小图像的兼容传送; 时域分级:主要用于不同帧频图像的传送; SNR分级:主要用于实现不同质量的视频效力兼容; 数据
35、分流:将有关解码的重要信息,例如控制信息,运动矢量,DCT低频分量等放在一同,占用部分频带以较高的性噪比发射,以保证接纳。而在另外的频带中放置相对次要的数据,以较低些的能量发射,从而降低总的发射功率。MPEG-2与MPEG-1比较 MPEG-1规范是针对CIF图像格式的,MPEG-2与MPEG-1相比,它支持图像格式符合CCIR.601建议支持逐行扫描,也支持隔行扫描和16:9的宽高比,它充分思索了各种运用的不同要求,规定了不同的紧缩处置方法即“型以及编码器输入端不同的信源图像格式即“级,处理了特殊性和通用性的问题,它包含了HDTV的规范,使其运用更加灵敏,更加广泛;在一个系统码流中可以有多个
36、视频信道; MPEG-2向下兼容,MPEG-1是MPEG-2的一个子集,任何MPEG-2的解码器可以解MPEG-1的码流;MPEG-2支持多种图像预测方式,可以采用分级搜索方法进展运动补偿;MPEG-2分别设置了“按帧编码和“按场编码两种方式,其编码效率得到提高;MPEG-2采用了性噪比可分级性和空间可分级性两种分级编码技术,以满足不同传输带宽和不同用户的需求;支持不同的彩色图像采样格式,支持8bit的图像也可支持10bit的图像。 在图像数据流组织方面, MPEG-2中有两类数据码率,传送数据流和节目数据流,用于不同的场合。节目码流中小包的长度相对较长且不固定,适合用于相对无误差的环境。传输
37、码流是在传输流的根底上复用而成的,传输流中的包长度固定为188字节,适宜于在有误差的环境中传送。 4. 5 MPEG4的根本内容4. 5. 1 MPEG4的根本特点 MPEG1和MPEG2已得到广泛运用,但仍需求一个用于表述、集成和变换音视频信息的标准,如在固定的宽带系统及挪动通讯窄带系统中的运用。 MPEG一4规范化任务始于:1 9 9 3年9月,初衷是制定一个码率在6 4 k b p s以下的通用的视频编码规范,其主要目的是低码率视像通讯。八大功能:(1)基于内容的操作和位流的编辑;(2)基于内容的多媒体数据的访问工具;(3)基于内容的可分级性;(4)自然合成数据的混合编码;(5)多个并发
38、数据流的编码;(6)改良编码效率;(7)甚低码率下时轴访问的改良;(8)紧缩数据在过失环境下的坚韧性。MPEG一4与以往的MPEGl2规范最主要区别于:(1)MPEG4的数据描画是基于内容的或者说是基于对象的编码机制,类似于软件领域中的“面向过程的言语。(2)MPEG4是一个开放的系统,它支持传统的规范又不排斥新规范。从运用层面来看,MPEG4包括了传统的方式访问数据库。(3)MPEG4支持多种类的A V信息:自然的或合成的;二维的或三维的;单频谱的或多频谱的;实时的或非实时的,等等。MPEG4所提供的新功能包括: (1)具有对于称之为音像对象的混合媒体数据的高效编码才干。这些混合媒体数据包括
39、:视频图像、图形、文本、音频、言语的数据。 (2)用合成的文本组合的混合媒体对象来产生多媒体信息表现的才干。 (3)紧缩数据在噪声信道传输中恢复过失的坚韧性。 (4)对恣意视频对象进展编码的才干,即不要求分块的编码图像是矩形,每块区域内可以包含特定图像或感兴趣的视频内容即视频对象平面VOP( Video Object Plane)。VOP不再是MPEG12传统的矩形编码,编码器对任不测形的VOP编码时,VOP被限定在一个长、宽均为1 6整数倍的窗口内,同时保证VOP窗门中非VOP的宏块数最少,如VOP宏块,规范的矩形帧可以以为是VOP的特例。 (5)在网络信道传输所提供的适宜于特有对象性质的业
40、务质量下音像对象数据的复用和同步。 (6)在接纳端具有进展音像场景交互的才干。 MPEG一4所支持的这些功能使其有着广泛应用,诸如从交互式挪动可视、交互式家庭商店、无线可视监控到基于内容的多媒体数据库的查询、搜索、索引、检索及互联网上多媒体表现以致数字广播、DVD接纳等。一个能支持各种不同的功能和各种各样的运用的规范是非常复杂的,特别指出MPEG4是表现多媒体的一种工具,而不是详细编码算法的一种规范。 MPEG4由4大要素构成: (1)语法:它是一种可扩展的言语,允许选择、描画工具规范以及框架的下载。 (2)工具:它是一种特殊的方法。MPEG4不仅提供了视频编码的规范化工具,也提供了音频、图形
41、和文本编码的规范化工具。 (3)算法:是实现一个或多种功能的工具的集合。 (4)框架:是适用于特殊运用的一个或多个算法。452 MPEG4精细可分级编码与流媒 体技术 精细可分级编码FGS( Fine Granular Scalability)是MPEG4提供的一种质量可分级编码技术。MPEG4 FGS编码方法将视频序列编码成两个码流:根本层码流和加强层码流,根本层采用传统的视频编码技术编码,生成一个码率比较低的码流,根本层码流传输必需是正确的;加强层码流采用位平面(BitPlane)技术编码源图像和根本层重构之间的差值。 通常的视频紧缩可以分为可扩展和不可扩展的紧缩。其中不可扩展的紧缩只生成
42、一个位流Bit-stream;而可扩展的紧缩生成多个子位流Sub-stream,其中一个位流是根本位流,它可以独立解码,输出粗糙质量的视频序列;其他的子位流那么起质量加强的作用;一切的子位流一同复原出最好质量的视频序列。相应地,仅有部分的子位流必须包括根本位流,那么输出的视频在图像质量,或者大小,或者帧速率上较差,这三个方面构成了压缩在质量信噪比SNR空间和时间上的扩展性编码。流媒体技术与多媒体技术流媒体技术: 媒体在因特网/局域网中播放时,所采用的流式传输方式不是媒体的方式。边下载,边播放。 而流式传输方式那么要将整个多媒体文件经过特殊的紧缩方式分成一个个紧缩包,由视频效力器向用户计算机实时
43、延续地传送。用户不用像采用下载方式那样等到整个文件全部下载终了(需求本地硬盘),而是只需经过几秒或几十秒的启动延时(在客户端的内存中开辟一个缓冲区)即可在用户的计算机内利用解压设备对紧缩的多媒体文件解压后进展播放和观看,而剩余部分将在后台的效力器内继续下载。多媒体技术: 单独说多媒体是没有意义的,它是一个描画词,不是一个名词。 信息的载体媒体 多种媒体的方式文本、图形、图像、动画、音频、视频等等 多媒体通讯的特征综合性、交互性、同步性 4. 7 MPEG规范编码特点 MPEG视频定义了三类图像:I帧、P帧、B帧;一个GOP通常为1215帧,将其分成三类。 I帧帧内编码帧,通常是变换场景后的第一
44、帧,作为预测基准的独立帧,该帧仅利用本帧内部的相关性采取帧内紧缩算法,诸如DCT之类紧缩,实现中等程度的紧缩编码,它不包含运动矢量的信息,它是P帧和B帧的参考帧。 I帧编码质量的好坏直接影响到整个GOP的重建。 紧缩后每个象素占用12bit。(152kbit/帧) P帧前向预测编码帧,它用前边最近的I帧或P帧作为参考帧,进展帧间差值预测紧缩编码运动补偿预测编码,该帧同时进展帧内和帧间预测编码,编码率较低。 (80kbit/帧) B帧双向预测编码帧,该帧即以前帧I帧或P帧为参考,又以后帧P帧为参考进展预测编码双向运动补偿预测编码,即B帧可以采用帧内、前向、后向或双向4种紧缩编码技术,其压缩程度最
45、高。(23kbit/帧) 按紧缩比的高低排序:B帧、P帧、I帧 152380823576kbit12帧为一组 57612251.2MbpsI1B2B3P4B5B6P7前向预测后向预测图420 MPEG编码帧的构造方式 I B B P B B P I P B B P B B1 2 3 4 5 6 7 1 4 2 3 7 5 6显示顺序传送顺序图421 MPEG视频码流(帧)显示顺序与传送顺序 一个图像组中各类帧的紧缩、传送和解压(码) 、显示顺序是不同的,编解码顺序与画面显示顺序不同。图像需求经过重新排序缓冲器再显示。图42 2 MPEG一2紧缩编码原理框图图423 一个MPEG解码原理图4.1
46、0 先进音视频编码规范(AVS) AVS规范是系列标准的简称,其中心是把数字视频和音频数据紧缩为原来的,几非常之一甚至百分之一以下。数字音视频编解码技术规范任务组(简称AVS T作组)由中国国家信息产业部科学技术司于2002年6月同意成立。4.10 先进音视频编码规范(AVS) 任务组的义务是:面向我国的信息产业需求,结合国内企业和科研机构,制(修)订数字音视频的紧缩、解紧缩、处置和表示等共性技术规范,为数字音视频设备与系统提供高效经济的编解码技术,效力于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等艰苦信息产业运用。表4-1 5 AVS与其他主要规范的技术参
47、数对比编码工具AVSH.264MPEG-2帧内编码41 01 AVS视频编解码的主要内容 AVS视频中具有特征性的中心技术包括:整数变换、量化、帧内预测、14精度的像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。 AVS规范中视频解码过程的根本处置单元是宏块。一个宏块包括1 6l 6的亮度样值块和对应的色度样值块,宏块可进一步划分到最小88的样本块来进展预测,共有4种用于运动补偿的宏块划分l 61 6、1 68、81 6、88,如图42 9所示。013210001881616168816图429 AVS中4种用于运动补偿的宏块划分 AVS中的变换以88样本块为根本单元,变换系
48、数采用标量量化。整数变换、标量量化计算及其逆过程可以完全经过整数运算实现,比原先的浮点运算能有效提高计算速度,也有利于硬件实现实时系统;同时由于是整数变换,运算结果准确度高,不存在浮点运算及取整,因此可以有效地防止反变换误匹配问题,即消除了编码器与解码器之间的失配景象。 AVS规范对于帧内编码块亮度系数、帧间编码块亮度系数和色度系数分别定义了多个变长码表。根据解析所得语法元素的值,经过查变长码码表可以得到量化系数值(Level)和量化系数游程(Run)。解码得到一个系数值和游程后,下一个解码量化系数所参考的码表将根据前一个解码量化系数值进展选择。 在预测方面,AVS同样支持多帧参考,但其P帧或
49、B帧最多可有两个参考帧图像。对于亮度块和色度块的帧内预测,AVS分别定义了5种和1种方式不运用88以下的方式,是由于这些方式对编码性能的影响极小。与H.264规范类似,AVS在编码Intra图像时可以用帧内预测,帧内预测运用空间预测方式消除图像间的冗余,帧间预测运用基于块的运动矢量消除图像间的冗余,帧间预测有如图42 9所示的4种方式,其预测运动矢量的精度到达14像素(H2 6 4支持到达18像素精度)。 在亮度解码时,首先进展12样本和14样本的插值,然后根据运动矢量得到相应的参考样本;色度样本插值运用对应亮度块的运动矢量,利用被插值样本周围的4个整数样本值进展线性插值。至于14像素样本值的
50、获得可以分两步:第一步是由多个整数点像素样本值经过FIR滤波器输出得到部分12像素精度插值,再利用得到的12像素值继续经过一样的FIR滤波器得到余下的l2像素值;第二步是利用12像素值进展双向线性插值得到14像素值。在低分辨率挪动运用中,AVS帧间预测只需P帧类型,与MPEG4H2 6 4的Baseline Profile一样,性能也相当。 AVS采用自顺应环路滤波,即以宏块为单位,根据块边境两侧块类型确定边境强度,采取不同滤波策略,消除边境上产生的失真景象。在解码器中,去块滤波器在重建和显示宏块之前发生作用,根据宏块以及宏块中88亮度块的运动矢量,求得边境滤波强度,再由块程度或垂直边境两侧样
51、本点求得块边境阈值,根据两者关系,确定能否进展滤波以及滤波的方式。去块滤波可以使边境变得平滑,提高在高紧缩比下解码图像的视觉效果。当前帧参考帧重构帧运动估计运动补偿坏路滤波帧内预测变量、量化熵编码反变换反量化帧内方式选择帧内帧间图430 AVS编码器框图 输入视频序列依次进展I帧、P帧和B帧编码,I帧编码采用帧内方式,其预测方式有5种,选择最佳的一种方式进展帧内预测。P帧编码采用帧间模式,根据先前已编码的参考帧(可以是I帧或P帧)进行帧间预测。B帧根据先前已编码帧,可以有3种模式进展预测,即跳过方式、直接方式和双向预测模式,预测值与当前帧的差值构成残差信号,其残差经过变换、量化以后,再经过熵编码器进展编码。这个过程中,视频在空间域、时间域以及统计上的冗余信息得到了有效的去除,大大提高了紧缩比,成为AVS编码码流。 设置环路滤波之目的是去块效应(或去马赛克)滤波,由于图像中由于运动补偿、变换及量化产生的虚伪边境可以被平滑,降低图像块效应,提高了客观视觉效果。此外,滤波后的帧用于后续帧的运动补偿预测,从而防止了虚伪边境误差积累,导致图像质量的进一步下降。关于AVS的熵解码。变长编解码技术在现代多媒体技术中得到广泛的运
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年山水渠施工合同(1篇)
- 2025 网络基础之体育馆网络的网络体育健身指导网络案例课件
- 统编版语文四年级下册第一单元 质量调研卷(含答案)
- 信息系统战略的制定和实施
- 2026年及未来5年市场数据中国盐酸氨溴索葡萄糖注射液行业发展运行现状及发展趋势预测报告
- 2025 高中信息技术数据与计算之计算思维在城市土壤污染数据监测分析中的应用课件
- 2026年及未来5年市场数据中国环保装饰市场供需格局及未来发展趋势报告
- 2025人工智能知识工程指南
- 智慧种植解决方案:技术创新与产业应用
- 牛羊高效养殖技术全攻略
- 保卫科部门绩效考核标准
- 《食品安全监测与风险评估》课件
- 硫磺购销合同协议
- 课件:《习近平新时代中国特色社会主义思想学习纲要(2023年版)》第八章 中华人民共和国的成立与中国社会主义建设道路的探索
- 《明清中国版图的奠定与面临的挑战》单元教学设计- 近代前夜的盛世与危机
- 人员退休欢送会34
- DB21T 2385-2014 玉米高产耕层土壤改良技术规程
- 2024年全国中学生生物学联赛试题含答案
- 大学生心理健康与发展学习通超星期末考试答案章节答案2024年
- 五年级下册劳动教案完整版
- ISO28000:2022供应链安全管理体系
评论
0/150
提交评论