版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章数字视频编码基础光与色
4.1视觉与图像
4.2视频4.3视频信号的数字化
4.4视频编码
4.5学习目标知识目标:了解光与色、视觉与图像的基本概念,掌握视频信息和视频信号的特点以及视频信号的数字化方法,熟悉视频编码的方案体系和分类,为学习视频压缩编码技术打好基础。技能目标:了解数字摄录机的结构组成和工作原理,掌握将素材从DV转录至电脑上的方法。典型设备:DV(数字摄录机)随着生活水平的提高,越来越多的家庭拥有了DV机。“DV”是英文“DigitalVideo”的缩写,直译为“数字视频”。它包含两层含义。一是指消费类数字视频的一种标准。除了DV格式之外还有MICROMV格式以及专业级的DVCAM和DVCPRO格式。另一方面是指用数字信号来记录影像数据的摄录机—数码摄像机,简称DV机。本书所提及的DV就是指数码摄像机。目前,社会上流行的家用摄像机按规格来划分可以分为三类,一类是VHS方式的摄录一体机,这一类中的VHS-C、S-VHS、S-VHS-C等具有一定的互换性。第二类是8mm摄录一体机,高带8mm摄录一体机也属于这一类。第三类是数字式摄录一体机,即DV格式的摄录机,如图4-1所示。DV摄录机是将微小型摄像机和录像机机芯组合在一起,制成摄像、录像一体的轻小型高档精密家用电子产品。图4-1DV机外观它的基本功能是将图像和声音信号记录到磁带上,即拍即录,还可重复摄录,使用非常方便。摄录一体机具有使用的磁带小巧,记录容量极大,便于更换,即录即放,反复记录的特点。摄录后还可以进行编辑合成(配音,添加字幕等),综合成本比照相机还低。图4-2数字摄录机方框图摄像机部分主要由镜头、滤光器、CCD图像传感器、取样保持电路、信号处理电路、编码电路、同步信号发生器、自动控制电路、CCD驱动脉冲发生器的寻像器等部分构成。录像机部分由音频、视频信号处理电路、伺服电路、系统控制电路等部分构成。此外,还有为摄像和录像两部分供电的稳压电源,为寻像器和视频电路提供显示信息和叠加字幕的字符信号发生器,为使用交流电及用普通彩电作监视器而配备的交流适配器。4.1光与色4.1.1光的特性与度量眼睛感知的图像是通过光波传递的,人眼所看到的颜色是“色源”的一定光谱成分作用于人眼的视觉刺激效果,可分为来自发光体的色(光源色)和非发光体的物体色(表面色)两种。大部分自然景物的颜色取决于它在特定光源照射下不透明物体所反射或者透明、半透明物体透射的光谱成分,也就是说取决于照明光源的光谱以及景物的反射或透射的物理性质。对于大多数图像信息系统来说,成像设备将物体的光像转变成相应的电信号,系统在对电信号经过某些处理和传输后再由显像设备重现光像。因此光的特性直接影响到图像的质量和视觉效果,这里有必要首先简要介绍光和光源的一些基本特性和光的度量。图4-3电磁波波谱与适用的传感器颜色波长范围/nm颜色波长范围/nm红620~780绿500~530橙590~620青470~500黄560~590蓝430~470黄绿530~560紫380~430表4-1 光谱颜色的波长范围4.1.2色彩色彩(colorfulness)是光的属性,是光投射在物体上的结果,没有光就没有颜色。物体包含与光谱中某个波长的光相对应的原子,这些原子吸收或削减了光谱中相应波长的光,而反射或传送了其他部分,被反射出的光的颜色就是人们所看到的物体的颜色。色彩的属性主要包括亮度、色调和色饱和度。亮度(luminance)也叫光亮度,是光作用于人眼时所引起的明亮程度的感觉,是色彩明暗深浅的程度,又叫亮值或色阶。它代表光的能量强弱,由色光光波的振幅(辐射功率)及人眼视敏度特性决定,是指物体表面色彩反射出的光量。色调(hue)也叫色相或色品,形容色彩本身,如红、黄、蓝、绿等,都是色调。它是指颜色的外观,用于区别颜色的名称或颜色的种类,是视觉系统对一个区域呈现的颜色的感觉。色调由作用到人眼的入射光波长(频率)成分决定。色饱和度(saturation)又称色纯度,是色彩的纯洁性,即色彩的纯粹程度。它可以用来区别颜色明暗的程度。完全饱和的颜色是指没有掺入白光所呈现的颜色,掺入其他色光的颜色不仅饱和度下降,而且连色调也会改变。越接近标准色,其纯度越高,饱和度越高。饱和度(纯度)在视觉上表现为色彩的鲜艳、鲜明。4.2视觉与图像4.2.1视觉现象光线是人们能看到物体的必要条件。在光线到达视网膜的视觉细胞之前,光线要通过角膜、水状体、虹膜、水晶体、玻璃体。光线到达视网膜后,大脑依据色彩、形式、纵深和位移4种基本视觉信号以极快的速度对光线进行理解并作出相应反应,我们称之为视觉现象。视觉的基本功能是感受外界的光刺激,表现为对光波的感受性以及对亮和暗的适应性;还具有分辨两个在空间上有一定距离的刺激物的能力(即空间分辨率);同时还能觉察光刺激在时间上的起伏(即时间分辨率)。此外,人眼接受外界的光刺激并不是固定的、被动的,而是动态的。光线作用于人眼,人眼也能主动地对准和扫描刺激物,从而在这个过程中形成清晰的视觉,接受外界丰富的信息,并在此基础上形成更复杂的图形和空间知觉。视觉对不同波长光的灵敏度称为光谱灵敏度。在可见光谱范围内杆状体和锥状体的光谱灵敏度是不同的,它们分别对应于光谱光效率函数的暗视觉曲线和明视觉曲线。进入人眼的光需要有一定数量才会产生感觉(即光亮感和颜色感),此外,人眼的灵敏度能适应完全不同的光照情况,称为人眼的适应性。1.亮度与对比度人眼所能感觉的亮度范围很宽,但眼睛并不能同时感受这样大的范围。在眼睛适应了某一环境亮度后,引起黑与白的感觉所对应的亮度范围就有了一定的限度。人眼的主观感觉并不由绝对亮度决定,这种视觉特性给图像技术的实现带来了方便和可能性。一方面无需重现原始景物的真实亮度分布而只要保持其亮度对比的正确,这样就可以选择容易实现的显示器件,特别是解决了显示高温和高亮度物体的困难。另一方面可以忽略人眼不能觉察的亮度差别,减少传输和处理它们的代价。通常把“从黑到白”的对比范围,即景物或图像的最大亮度与最小亮度的比值(即反差)称为对比度C(contrast)。它是图像特征的重要参数之一,常用来衡量被观察物体或图像的清晰程度。人眼可感受的对比度在适当的平均亮度下为1
000∶1,平均亮度很低时只有10∶1。除光源外,自然界各种物体的亮度取决于它所反射的光的强弱,在相同的光照下则决定于它所具有的反射系数。大部分景物的对比度不超过100。2.颜色的辨别颜色分为非彩色和彩色两类。非彩色指黑色、白色以及黑白之间深浅不同的灰色,也称为黑白系列。颜色有亮度或明度、色调、色饱和度三个心理属性。色调是彩色最重要的特征,以色光中占优势的主波长(即色调波长)光的颜色决定。色饱和度是颜色的鲜艳程度,反映颜色被白光冲淡的情况,也称为纯度;色光中含的白光越少饱和度就越高,色饱和度取决于色光的各分光偏离色调波长的性质。非彩色只有亮度的差别,没有色调和饱和度的概念。人类眼睛可以分辨出约128种不同的色调。以谱色光刺激时,一般情况下一定的波长会呈现一定的颜色,但是除了572nm、503nm、478nm三种波长的颜色不随光强发生变化外,其他的波长随着光强度的增大,颜色的感觉会略向红色或蓝色方向变化。人眼能分辨的色调数目随着颜色的亮度和饱和度的变化而改变,饱和度减小以及亮度过大或过小都会使色调分辨力下降。实验结果表明黄色的饱和度可以区分4级,而红色则多达25级。人眼可以分辨的颜色约有一万多种,而在美术和印刷上经常使用的颜色才不过几千种。4.2.2图像1.图像的三要素(1)像素(Pixel)(2)图像分辨率(ImageResolution)显示器(显像管)的分辨率是指显示器屏幕上的像素量,表示显示器分辨率的方法两种。①信息总量法②计点数/线数法(3)颜色深度位图中各像素的颜色信息用若干数据位来表示,这些数据的个数称为图像的颜色深度(或图像深度)。颜色深度决定了位图中出现的最大颜色数。目前图像的颜色深度有以下几种,即1、4、8、16、24、32。例如:若图像的颜色深度为1,表明位图中每个像素只有一个颜色位,也就是只能表示两种颜色,即黑或白,这种图像称为单色图像。若图像的颜色深度为4,则每个像素有4个颜色位,可以表示16种颜色。若图像的颜色深度为24,位图中每个像素有24个颜色位,可包含1
677万(224=16
777
216)种不同的颜色,这种图像称为真彩色图像。2.数字图像的类型图形(矢量图)和图像(位图)又称为静图,这是相对于动画和视频图像来说的,是两个既有区别又有密切联系的概念,它们有各自的特点和适用范围,并在一定的条件下可以互相转化。将模拟图像转化成由一系列离散数据(二进制数)来表示的图像称为数字图像。(1)位图图像(2)矢量图形3.数字图像的质量数字图像质量的高低,主要取决于图像输入、输出设备的状况。其中输入设备性能的高低,如数码相机的CCD、镜头质量、分辨率、色位数、存储媒体大小等,是影响图像信息源质量的最根本因素。输出设备(如显示器、打印机等)性能的高低直接决定图像输出质量的好坏。此外,显示设备的状况,直接影响图像的显示质量。假设有一张分辨率为1
024×768像素、色彩数为16M的图片,若以85Hz的屏幕刷新速度完美地显示出来,至少得要有一台行频在70kHz或以上、视频宽度在95MHz左右的显示器和一块显存在4MB以上的显示卡。如果显示器或显示卡不能满足以上要求,这幅图像只能在降低视频或低色彩的情况下显示。4.数字图像的基本指标(1)DPIDPI(DotPerInch):是指各类输出设备每英寸上所产生的像素数,一般用来表示输出设备(如打印机、绘图仪等)的分辨率,即设备分辨率。一台激光打印机的设备分辨率在600~1
200dpi之间,数值越高,效果越好。(2)PPIPPI(PixelPerInch):指每英寸的像素数,它一般用于衡量图像输入设备(如数码相机)的分辨率的高低,反映了图像中储存信息量的多少,它决定了图像的根本质量。(3)位(Bit)与颜色(Color)在图像处理过程中,颜色由数字“位(Bit)”来实现,它们之间的关系是:颜色数=2n,其中n为所占的位数。人们平常所说的真彩色,即为16位显示模式,65
536(64k)种颜色(216=65
536);真彩色图像为24位显示模式下能处理1
677万(16M)种颜色(224=16
777
216)。5.数字图像格式(1)JPEG(2)GIF(3)BMP(4)TIFF(5)PNG6.数字图像格式的选择储存各种不同的图像时,可以根据图像本身的应用情况,选择不同的文件存储格式,以达到既保证图像质量,又不浪费计算机存储空间的目的。下面,给出几种数字图像格式的应用情况,如表4-4所示。应用情况推荐使用格式可以使用格式推荐分辨率/dpi视频显示幻灯片JPEGJPEGBMP800×600/72计算机桌面BMPBMPJPEG1
024×768/72网络传播GIFGIFJPEGPDFPNG640×480/72个人数字相册JPEGJPEGBMP800×600/72印刷表现专业印刷输出TIFFTIFFJPEGPSD300以上表4-4 数字图像格式推荐表4.3视频在了解了图像以及图像的一些特点之后,我们就比较容易理解视频以及视频信号的特点了。视频是由许多幅按时间序列构成的连续图像,每一幅图像称为一帧(Frame)。视频记录的是来自光源辐射光或场景中的反射光经平面投影后的光强度随时间变化的信号,可以认为是一个图像序列,由于每一帧的图像内容可能不同,故这个图像序列看起来就是活动图像了。例如电视信号就是一种最常见的视频信号。当人眼观看视频信号时,不仅受人类视觉系统空间频率响应的影响,需要有一定的空间分辨率,而且也受视觉系统时间频率响应的影响,需要保证图像的连续性。人类视觉系统的这种时空频率响应影响着人们对视觉质量的评价。视频信息是多媒体信息中最重要的一种信息,当视频信息与语音信息、图像信息、文本等有机结合在一起时构成了多媒体信息。视频信号有模拟视频信号与数字视频信号之分。当模拟视频信号数字化之后,便得到数字视频或数字序列图像,数字化是视频压缩编码的基础。一般来说,用于显示的视频信号通常都是模拟视频信号,如电视信号,而用于计算、处理的通常是数字视频信息,因为数字信号要比模拟信号更适合于计算机处理。但数字视频的数据量是非常惊人的,按照ITU-R601标准4∶2∶2格式的PAL制数字化视频信号,每帧数据量为720×576×8×2≈6.64Mbit,每秒数据量为6.64×25≈165Mbit。因此一片600Mbit的CD-ROM只能存储727帧左右的视频图像信号,或者说可以存储大约29s左右的数字电视节目。如果存储更高分辨率的高清数字电视信号,那存储时间就更短了,大约只有几秒钟。4.3.1视频信号的获取和显示除了人眼可以感受视频信息之外,获取视频信号的最主要工具是视频摄像机,它以确定的时间间隔逐帧捕获图像。在视频摄像机里有一种类似于人眼中锥状体和杆状体一样的感光器件,我们称之为光电传感器。当摄像机只有一个光电传感器,而且对光频谱吸收函数类似于视觉系统的相对亮度效率函数时,所采集的是灰度图像。当摄像机有三个分别对三基色响应的光电传感器时,采集到的是彩色图像。如果光电传感器的频率响应范围在可见光之外,如红外线波段,X光波段,则摄像机采集的视频信号不能被人眼所观察,而只能作为某种特殊用途,如夜间的红外摄影、X光摄像等。当视频摄像机的输出为模拟视频信号时(不经过A/D转换),称为模拟摄像机,当输出为数字视频信号时,称为数字摄像机。由于数字化的优越性和通信环境数字化的进展,数字摄像机的出现打破了多年来模拟摄像机一统天下的局面,并且其发展的势头非常之快,数字摄像机必将逐步取代模拟摄像机。为了保证视频信号能在模拟电视上显示,数字摄像机通常继续保留模拟复合视频信号输出。按照摄像机感光表面传感器材料的不同,通常有两种类型的摄像机:一类就是我们常见的基于半导体器件的CCD(Charge-CoupledDevices)阵列或CMOS阵列摄像机;另一类是曾经广泛使用的基于视像管的摄像机,如光导摄像机、氧化铅光电导摄像机等。数字摄像机最典型的代表是DV标准的数字视频摄像机,它通过将CCD转换光信号得到的视频信号进行A/D转换,转换成数字视频信号,然后再经过数字信号处理、数据压缩,最终可输出经压缩的数字视频信号(如压缩比为3∶l~5∶1)。这种数字摄像输出的图像质量较高,水平清晰度可达540线,已接近广播级模拟摄像机指标的下限。而家用录像系统(VHS)的模拟录像格式(8mm录像带)和S-VHS格式的图像的水平清晰度分别为240线和400线。4.3.2视频信息和信号特点1.直观性2.确定性3.高效性4.广泛性5.高带宽性4.3.3模拟视频1.模拟视频信号普通广播电视信号是一种典型的模拟视频信号。电视摄像机通过电子扫描将时间、空间函数所描述的景物进行光电转换后,得到单一的时间函数的电信号,其电平的高低对应于景物亮度的大小,即用一个电信号来表征景物。这种电视信号称为模拟电视信号,其特点是信号在时间和幅度上都是连续变化的。对模拟电视信号进行的视频处理技术(如校正、调制、滤波、录制、编辑、合成等)称为模拟视频技术。在电视接收机中,通过显示器进行电光转换,产生为人眼所接受的“模拟”信号的光图像。2.视频光栅扫描模拟电视系统采用光栅扫描方式,所谓光栅扫描是指在一定的时间间隔内电子束(或光束)以从左到右、从上到下的方式扫描采集荧光屏表面(或感光表面)。若时间间隔为一帧图像的时间,则获得或显示的是一帧图像;若时间间隔为一场图像的时间,则获得或显示的是一场图像;在电视系统中,两场图像为一帧。扫描方式通常有逐行扫描和隔行扫描。(1)逐行扫描图4-4逐行扫描方式(2)隔行扫描图4-5隔行扫描方式(3)光栅特性光栅扫描的基本参数是帧频fp(每秒取样的帧数)和每帧扫描行数n,它们分别对应于光栅扫描的时间分辨率和空间垂直方向分辨率。3.模拟视频信号表示经行场扫描得到的一维连续时间行场信号如图4-6所示。它包括图像信号、行同步信号、行消隐信号、场同步信号、场消隐信号、槽脉冲和前后均衡脉冲。在图4-6中,横坐标表示时间,纵坐标表示信号电平;12.5%以下为白电平,12.5%~75%之间为灰度电平,75%以上为黑电平。消隐信号确保回扫轨迹不可见,同步脉冲确保扫描过程同步,槽脉冲确保同步的连续性。图4-6模拟视频信号视频信号的基本参数主要有:清晰度、分解力、宽高比、行频、场频和帧频等。图像的清晰度是人眼感觉到的图像细节的清晰程度,它与每帧的扫描行数、电视系统传输图像细节的能力、观察者的视力和图像的对比度等有关。图像的分解力是系统本身分解像素的能力。电视系统的分解力分为垂直分解力和水平分解力。垂直分解力定义为沿图像垂直方向上能分解像素的能力,水平分解力定义为沿图像水平方向上能分解像素的能力。宽高比是一帧图像的宽度和高度之比。帧频越高,图像闪烁就越小,但传输所需的带宽就越大。4.模拟电视系统(1)模拟电视系统标准(2)复合视频信号相关参数PALNTSCSECAM帧频(帧/秒)2529.9725场频(场/秒)5059.9450每帧行数(行/帧)625525625有效行数(行/帧)576480576行频(行/秒)156251575015625行周期(μs)6463.564有效扫描时间(μs)5253.552行消隐时间(μs)121012场周期(ms)2016.720场消隐时间(μs)161213231568图像宽高比4∶34∶34∶3彩色分量YUVYIQYUV亮度带宽(MHz)5.0,5.54.26.0色度带宽(MHz)1.3(U,V)1.6(D)0.6(Q)1.0(U,V)复合信号带宽(MHz)8.06.08.0彩色副载波(MHz)4.433.584.25(Db),4.41(Dr)音频副载波(MHz)5.5,6.04.56.5色度调制方式QAMQAMFM表4-5 模拟电视系统标准的主要技术指标图4-7模拟电视系统复合视频信号频谱4.3.4数字视频数字视频是指用二进制数字表示的视频信号,数字视频既可直接来源于数字摄像机(例如CCD摄像机等),也可将模拟视频信号经过数字化处理变成数字视频信号。模拟视频信号经过数字化处理后,就变成由一帧帧数字图像组成的图像序列,即数字视频信号。每帧图像由N行、每行M个像素组成,即每帧图像共有M×N个像素。利用人眼的视觉惰性,每秒连续播放30帧(帧频fp)以上,就能给人以较好的连续运动景物的感觉。每个像素Nb用比特表示,数字视频信号的信息传输速率为M×N×fp×Nb。例如,PAL制彩色数字视频信号用RGB分量(Nb=3×8=24bit)表示时,帧频fp=25(每秒25帧),M=576(每帧576行),N=720(每行720像素点),其信息传输速率为720×576×25×24≈249Mbit/s。1.数字视频的特点由于模拟视频的特性,它在传输、存储和交互等方面具有很大的局限性。例如,在普通模拟电视中,只有频道选择等简单功能;在盒式磁带录像机(VCR)中,只能进行快速搜索和慢速重放等操作;模拟视频的录制、存储非常不方便,且多次录制、存储时噪声积累严重;传输时所叠加的噪声(即使很小)很难消除和分开;对信道的线性特性要求较高,放大器的非线性会产生波形畸变;随着传输距离的增加,噪声积累越来越大,使模拟视频信号的传输质量恶化;微分增益、微分相位失真会带来彩色失真等等。与模拟视频相比,数字视频具有很多优点:便于传输和交换,便于多媒体通信,便于存储、处理和加密,无噪声积累,差错可控制,可通过压缩编码来减低数码率,便于设备的小型化,信噪比高,稳定可靠,交互能力强等。随着数字电路和微电子技术的进步,特别是超大规模集成电路的快速发展,使得数字视频的优点变得越来越突出,应用越来越广泛。例如,高清晰度电视(HDTV)、多媒体、视频会议、移动视频、监视控制、医疗设备、航空航天、军事、教育、电影等。目前,数字视频用于桌面和掌上技术已经成熟,已成为消费电子产业的支柱,例如数字电视、数码照相机和数码摄像机等。数字视频将会给计算机、通信和消费电子等产业带来一种革命性的变化。2.数字视频的存储格式格式简介主要功能及特点AVI英文全称为AudioVideoInterleaved即音频视频交错格式。于1992年由Microsoft公司推出可以将视频和音频交织在一起进行同步播放。图像质量好,可以跨多个平台使用。文件过于庞大,由于压缩标准不统一,该格式在不同版本的Windows媒体播放器中不兼容MOV美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer支持包括AppleMacOS、MicrosoftWindows95/98/2000/XP在内的所有主流计算机系统平台,有较高的压缩比率和较完美的视频清晰度RMRealNetworks公司所制定的音频视频压缩规范称为RealMedia用户可以使用RealPlayer或RealOnePlayer对符合RealMedia技术规范的网络音频/视频资源进行实况转播,并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。使用RealPlayer或RealOnePlayer播放器可以在不下载音频/视频内容的条件下实现在线播放MPEG英文全称为MovingPictureExpertGroup,即运动图像专家组格式,常用的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准。目前MPEG格式有3个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段采用了有损压缩方法减少运动图像中的冗余信息。即压缩方法依据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200∶1)MPEG-1制定于1992年,它是针对1.5Mbit/s以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准也就是通常所说的VCD制作格式。使用MPEG-1的压缩算法,可以把一部120min长的电影压缩到1.2GB左右大小。这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等表4-6 常用视频格式介绍格式简介主要功能及特点MPEG-2制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率这种格式主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用。使用MPEG-2的压缩算法,可以把一部120min长的电影压缩到4~8GB的大小。这种视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.mlv及DVD光盘上的.vob文件等MPEG-4制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量能够保存接近于DVD画质的小体积视频文件。这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。这种视频格式的文件扩展名包括.asf、.mov和DivXAVI等DV-AVIDV的英文全称是DigitalVideoFormat,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据它可以通过计算机的IEEE1394端口传输视频数据到计算机,也可以将计算机中编辑好的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式DivXDivX格式是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即通常所说的DVDrip格式DivX采用了MPEG-4的压缩算法,同时又综合了MPEG-4与MP3各方面的技术。DivX是对DVD盘片的视频图像进行高质量压缩,利用MP3或AC-3对音频进行压缩,然后再将视频与音频合成,并加上相应的外挂字幕文件而形成的视频格式。DivX画质接近DVD,并且文件大小只有DVD的数分之一;DivX对计算机的硬件要求不高,一般300MHz\64MB内存\8MB显存的设备就可以流畅播放续表名称功能转换格式操作系统WinMPGVideoConvert多功能视频格式转换可以将AVI格式转换成MPEG-1/MPEG-2/DVD/VCD/SVCD/DivX等视频格式,而且还可以将ASF和WMV等视频格式转换成AVI及MPEG-4格式WindowsXP/NT/2000/9XZealotAIIVideoConverter多功能视频格式转换将AVI转换成nAVI/MPEG-1/MPEG-2/DVD/VCD/SVCD/WMV/ASF视频文件和将MPEG转换成AVI/DivX/WMV/ASF格式WindowsXP/NT/2000/9XAVSVideo
Converter多功能视频格式转换将需要转换的AVI/MPG/MPEG-1/MPEG-2/VOB(DVD)/DAT(VCD)/WMV/ASF等格式转换成AVI、MPEG、WMV、RM和VCD格式WindowsXP/NT/2000/9X网络多媒体梦工场2004RM格式转换将VCD(.dat)、DVD(.vob)、.MPG和.WAV等视频格式转换成.RM格式WindowsXP/NT/2000/9XRMConverterRM格式转换将AVI与MPEG格式视频文件直接转换成RM格式WindowsXP/NT/2000/9XAVIto
DivXDivX格式转换将AVI/MPEG/MPG/MOV/QT等格式的视频文件转换成DivX格式WindowsXP/NT/2000/9X豪杰视频通DVD格式转换可以将DVD向VCD进行视频转换,将DVD视频转换成MPEG-4/AVI/RM等视频格式。将DVD视频转换成GIF动画文件及进行其他的视频格式(如.MPG、.MPEG、.DAT和.AVI等)向RM视频格式及GIF动画格式的转换表4-7 常用的视频格式转换软件4.4视频信号的数字化数字视频有很多优点,它不仅可直接进行随机存储,而且检索方便,在复制和传输过程中都不会造成质量下降,很容易进行非线性编辑。与图像一样,视频信号必须从模拟量转化为数字量以后才能够被处理、存储或传输。视频信号的数字化过程与音频信号数字化过程类似,包括图像中像素位置的离散化(采样)、所得采样值的离散化(量化)以及PCM编码3个过程。首先通过扫描的方式把三维视频信号转化为一维随时间变化的信号,即将图像分成若干帧。对于每一帧图像,在垂直方向上分成若干行。经过上述取样的图像,只是在空间上被离散成了像素(样本)的阵列。但是,必须将每个样本的灰度值或色彩转化为有限个离散值(量化),并赋予不同的码字,才能完成数字化。4.4.1A/D变换器中的舍入法量化图4-8A/D变换器中的四舍五入量化示意图输入范围U(t)(V)比较器输出123量化后的输出Vq(t)(V)0≤U(t)<0.500000.5≤U(t)<1.500111.5≤U(t)<2.501122.5≤U(t)<31113表4-8 舍入法量化的输入输出关系4.4.2并串型A/D变换器在并型A/D变换器中,为了获得8位量化输出,需要28−1=255个比较器,如果再增加一位,就要再增加255个比较器,一个10位并型A/D变换器约有4万个元件,要制作这种A/D变换器就需要超大规模的集成电路,因此,并型A/D变换器除了可满足广播电视A/D变换要求高速度以及高精度之外,从加工技术难易程度以及价格方面来考虑,它并不是一个理想的方案。视频A/D变换器中还可采用的另一种方案是并串型A/D变换器,它既保证了工作速度又大大减少了比较器的个数。下面介绍其工作原理。图4-9是并串A/D变换器的原理框架图。它由两个位数较少的(n=4bit)并型A/D变换器串联而成,结果是输出n=8bit的数字信号,现在结合图4-10所示的波形分几步进行分析。图4-9并串型A/D变换器总框图图4-10波形图4.4.3PCM编码器A/D变换器中的PCM编码器,普遍利用异或门和或门来组成编码器,其特点是利用量化器各层输出不是“0”就是“1”的相关性,用异或门来判别相邻两层是否有0与1差别,将异或门的输出送到对应于该电平的或门中去。图4-11是利用此方法组成的PCM编码器。设n=3bit,则有23−1=7个比较器。为判别相邻两层的差别,各异或门的两个输入端分别接到相邻比较器的输出端上,而异或门的输出端又分别接到对应的或门输入端上。图4-11PCM编码器示意图十进制数二进制数22
2120十进制数二进制数22
21
2000004l001001510120l06110301l7lll表4-9 真值表数字电视中用的A/D变换器,一般具有如下特点。(1)抽样频率高。全信号编码时,若fs=4fsc(PAL),Ts=56ns;分量编码时,fs为13.5MHz。为在一个Ts内完成抽样、量化和编码3个操作,对器件和电路都提出了高速要求,因此在广播级中一般采用并行A/D变换器。(2)量化比特数高。取n=8bit,即M=28=256级,若采用并行A/D变换器就需28−1=255个比较器,如采用并串型A/D变换器,则比较器为2×(24−1)=30只。4.4.4D/A变换器用于高频高速的D/A变换器可分为3类:R-2R型、加权电流切换型和电流相加型。这3类D/A变换器的特点如下。(1)R-2R型T型电阻网络D/A变换器:此类D/A变换器用电阻与晶体管构成恒流源,其元件特性偏差会对精度有影响,位数越高影响越大,但它所需恒流源个数较少。(2)加权电流切换型D/A变换器:由于一对电流源与开关对应于一位,各电流源的比例必须正确,位数越高精度要求也越高。(3)电流相加型D/A变换器:各电流的偏差对精度的影响比T型的要小,但要构成一个nbit的D/A变换器,就要有(2n−1)个电流开关,所以电路规模较大。这3类D/A变换器,根据其优缺点适用于各种不同场合,例如,R-2R型在一般的数字化设备中用得较多,加权型可用于获得电子束偏转D/A变换器中,电流相加型适用于精度要求高的D/A变换器中。图4-12电流相加型D/A变换器(n=4)数字输入Vi接通的开关数输出模拟电压Vo20→121→122→223→3S11S2~S32S4~S74S8~S158RI=20·IR2RI=21·IR4RI=22·IR8RI=23·IR表4-10 图4-12中的输入输出关系4.5视频编码视频编码的目的是要减少视频序列的码率,以能够在给定的通信信道上传输视频信息。在信道传输过程中,彩色视频信号的编码分为复合编码和分量编码。复合编码是最简单最原始的方法,它是将整个彩色电视信号(模拟)直接进行PCM编码,不管视频信号采用哪种色彩空间表示,也不管有什么信号分量,总之将它们全部转化为一个数字表示。这种方法技术上比较简单,但存在不少缺点:信号之间经常会产生串扰,并且不能根据实际情况缩小带宽。分量编码是对信号中亮度分量Y和色差分量CB、CR(或三基色R、G、B)分别进行PCM编码,如图4-13所示。由于分量编码的图像质量高,且分量编码后的信号便于3种电视制式(NTSC、PAL、SECAM)之间进行节目交换,因此,分量编码得到了广泛的应用。这是目前几乎所有的数字视频系统均采用分量编码的原因。后来又出现了一种分量编码和复合编码的折衷方案:分离电视信号S-Video编码。S-Video信号使用单独的两条信号电缆分别传输亮度信号和色差信号(Y/C),减少亮度信号和色差信号之间的交叉干扰。为了经济地使用信道,节省频率资源,要对视频信号进行高效率的压缩编码。其目的是在保证图像质量的前提下,设法降低数码率、压缩频带、节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学生培训心肺复苏课件
- 小学信息技术教学中编程思维与创造力培养课题报告教学研究课题报告
- 物流中心设计与运营规范(标准版)
- 基于云计算的远程教育平台架构设计课题报告教学研究课题报告
- 山东高速集团有限公司2025年下半年校园招聘备考题库及答案详解一套
- 2026年山东省日照市单招职业倾向性考试题库新版
- 2026山东烟台黄金职业学院招聘备考题库及答案1套
- 财务审计操作指南(标准版)
- 2026年广东科贸职业学院单招职业倾向性考试题库新版
- 巧家县茂租镇卫生院2025年招聘编外护理人员备考题库及答案详解参考
- 股东代为出资协议书
- 财务部门的年度目标与计划
- 消防管道拆除合同协议
- 四川省森林资源规划设计调查技术细则
- 银行外包服务管理应急预案
- DB13T 5885-2024地表基质调查规范(1∶50 000)
- 2025年度演出合同知识产权保护范本
- 青少年交通安全法规
- 区块链智能合约开发实战教程
- 2025年校长考试题库及答案
- 口腔进修申请书
评论
0/150
提交评论