版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多媒体视频信息处理第1页,共93页,2022年,5月20日,13点56分,星期二5.1 视频基础知识 5.1.1 视频的定义人类接受的信息70%来自视觉, 其中活动图像是信息量最丰富、直观、生动、具体的一种承载信息的媒体。视频(Video)就其本质而言,实际上就是其内容随时间变化的一组动态图像(25或30帧/秒),所以视频又叫作运动图像或活动图像。 从数学角度描述,视频指随时间变化的图像,或称为时变图像。时变图像是一种时-空(颜色)密度模式(spatial-temporal intensity pattern),可以表示为s(x,y,t),其中(x,y)是空间变量,t是时间变量。 第2页,共9
2、3页,2022年,5月20日,13点56分,星期二 视频信号具有以下特点: 内容随时间而变化伴随有与画面动作同步的声音(伴音) 图像与视频是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。此外,两者的信源方式不同,图像的输入要靠扫描仪、数字照相机等设备;而视频的输入只能是电视接收机、摄象机、录象机、影碟机以及可以输出连续图像信号的设备。 第3页,共93页,2022年,5月20日,13点56分,星期二5.1.2 视频的分类 按照处理方式的不同,视频分为模拟视频和数字视频。模拟视频(Analog Video)模拟视频是一种用于传输图像和声音的并且随时
3、间连续变化的电信号。早期视频的记录、存储和传输都是采用模拟方式,例如:我们在电视上所见到的视频图像是以一种模拟电信号的形式来记录的,并依靠模拟调幅的手段在空间传播,再用盒式磁带录像机将其作为模拟信号存放在磁带上。 第4页,共93页,2022年,5月20日,13点56分,星期二 传统的模拟信号处理设备 直接广播卫星(DBS) 第5页,共93页,2022年,5月20日,13点56分,星期二 模拟视频具有以下特点: 以模拟电信号的形式来记录 依靠模拟调幅的手段在空间传播 使用盒式磁带录象机将视频作为模拟信号存放在磁带上 传统上,视频都以模拟方式进行存贮和传送,然而模拟视频不适合网络传输,在传输效率方
4、面先天不足,而且图像随时间和频道的衰减较大,不便于分类、检索和编辑。 第6页,共93页,2022年,5月20日,13点56分,星期二数字视频(Digital Video-DV) 要使计算机能够对视频进行处理,必须把视频源-即来自与电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号,转换成计算机要求的数字视频形式并存放在磁盘上,这个过程称为视频的数字化过程(包括采样、量化和编码)。 数字视频克服了模拟视频的局限性,这是因为数字视频可以大大降低视频的传输和存贮费用、增加交互性(数字视频可通过光纤等介质高速随机读取)及带来精确再现真实情景的稳定图像。 如今,数字视频的应用已经非常广泛,并带来一个
5、全新的应用局面。首先,包括直接广播卫星(DBS)、有线电视、数字电视在内的各种通信应用均需要采用数字视频。其次,一些消费产品,如VCD和DVD,数字式便携摄像机,都是以MPEG视频压缩为基础的。 第7页,共93页,2022年,5月20日,13点56分,星期二5.1.3 数字化视频的优点视频信号数字化后,就能做到模拟视频信号所无法实现的事情。它的主要优点有: 适合于网络应用 在网络环境中,视频信息可以很方便地实现资源的共享,通过网络线、光纤,数字信号可以很方便地从资源中心传到办公室和家中。视频数字信号可以长距离传输而不会产生任何不良影响,而模拟信号在传输过程中会有信号损失。再现性好 模拟信号由于
6、是连续变化的,所以不管复制时采用的精确度多高,失真总是不可避免的,经过多次复制以后,误差就很大。数字视频可以不失真地进行无限次拷贝,其抗干扰能力是模拟图像无法比拟的。它不会因存储、传输和复制而产生图像质量的退化,从而能够准确地再现图像。 第8页,共93页,2022年,5月20日,13点56分,星期二便于计算机编辑处理模拟信号只能简单调整亮度、对比度和颜色等,极大地限制了处理手段和应用范围。而数字视频信号可以传送到计算机内进行存储、处理,很容易进行创造性地编辑与合成,并进行动态交互。 数字视频的缺陷是处理速度慢,所需的数据存储空间大,从而使数字图像的处理成本增高。通过对数字视频的压缩,这样可以节
7、省大量的存储空间,光盘技术的应用也使得大量视频信息的存储成为可能。 第9页,共93页,2022年,5月20日,13点56分,星期二5.1.4 视频的应用领域广播电视 地面、卫星电视广播 有线电视(CATV:Community Antenna TV ) 数字视频广播(Digital Video Broadcast) 交互式电视(ITV:Interactive TV ) 高清晰度电视(HDTV) 通信 可视电话(Videophone ) 视频会议(Videoconferencing ) 视频点播(VOD:Video On Demand ) 视频数据库 第10页,共93页,2022年,5月20日,1
8、3点56分,星期二个人娱乐录象节目 VCD(Video Compact Disk) DVD(Digital Versatile Disk) 电视购物 家庭摄象 视频游戏 5.2 电视信号及其标准 5.2.1 彩色电视信号制式电视信号是视频处理的重要信息源。电视信号的标准也称为电视的制式。目前各国的电视制式不尽相同,不同制式之间的主要区别在于不同的刷新速度、颜色编码系统和传送频率等。目前世界上常用的电视制式有中国、欧洲使用的PAL制,美国、日本使用的NTSC制及法国等国所使用的SECAM制。 第11页,共93页,2022年,5月20日,13点56分,星期二NTSC制 NTSC(National
9、Television Standard Committe)是美国国家电视系统委员会在1953年制定的一种兼容的彩色电视制式,是目前常用的视频标准,在美国、日本和其他国家广为使用。它定义了彩色电视机对于所接受的电视信号的解码方式、色彩的处理方式、屏幕的扫描频率。NTSC制规定水平扫描线有625条,以每秒30帧速率传送。NTSC采用隔行扫描方式,每一帧画面由两次扫描完成,每一次扫描画出一个场需要1/60秒,两个场构成一帧。 第12页,共93页,2022年,5月20日,13点56分,星期二PAL制PAL(Phase Alternate Lock)是联邦德国1962年制定的一种兼容电视制式。PAL意指
10、“相位逐行交变”,我国和大部分西欧国家都使用这种制式。PAL制规定水平扫描625行、每秒25帧 、隔行扫描、每场需要1/50秒。 SECAM SECAM(Sequential Color and Memory)称为顺序传送彩色与存储,是用于法国、俄罗斯及几个东欧国家的彩色电视制式。但基本技术及广播方式与NTSC和PAL有很大的区别。 不同制式的电视机只能接收和处理其对应制式的电视信号。也有多制式或全制式的电视机,这为处理和转换不同制式的电视信号提供了极大的方便。全制式电视机可在各国各地区使用,而多制式电视机一般为指定范围的国家生产。 第13页,共93页,2022年,5月20日,13点56分,星
11、期二 表5-1 三种彩色电视制式的主要技术指标 TV制式NTSC PALSECAM帧频(Hz)302525行/帧525625625亮度带宽(MHz)4.26.06.0彩色幅载波(Hz)3.584.434.25声音载波(MHz)4.56.56.5第14页,共93页,2022年,5月20日,13点56分,星期二5.2.2 电视视频信号的扫描方式电视摄像机的作用就是将视频图像转换为电信号。任何时刻,电信号只有1个值,即是一维的。但视频图像通常是二维的,将二维视频图像转换为一维电信号是通过光栅扫描实现的。扫描方式主要有逐行扫描和隔行扫描两种。隔行扫描行的集合称为场。因此,一帧由两个场组成。逐行扫描有以
12、下优点:图像垂直清晰度高,空间处理效果好,有利于电视转换和制式转换,能改善视频压缩效率,等等。其缺点是:数码率高,行扫描频率增高,硬件难度加大。目前的电视系统大都采用隔行扫描,因为隔行扫描能节省频带,且硬件实现简单。但逐行扫描能获得更好的图像质量和更高的清晰度,不过这是以增加带宽和成本为代价的。 第15页,共93页,2022年,5月20日,13点56分,星期二 奇数场 偶数场 一帧 第16页,共93页,2022年,5月20日,13点56分,星期二5.2.3 YUV与RGB彩色模型YUV模型 在PAL彩色电视制式中采用YUV模型来表示彩色图像。其是Y表示亮度,U,V用来表示色差,是构成彩色的两个
13、分量。与此类似,在NTSC彩色电视制式中使用YIQ模型,其中的Y表示亮度,I,Q是两个彩色分量。YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。由于Y、U、V是独立的,所以可以对这些单色图分别进行编码。采用YUV模型的优点之一是亮度信号和色差信号是分离的,容易使彩色电视系统与只对亮度敏感的黑白电视机亮度信号兼容。 第17页,共93页,2022年,5月20日,13点56分,星期二PAL彩色电视制式中采用YUV模型来表示彩色图像YUV第18页,共93页,2022年,5月20日,13点56分,星
14、期二RGB模型RGB分别代表红(Red)、绿(Green)、蓝(Blue)三种基本颜色。电视机和计算机显示器使用的阴极射线管(Cathode Ray Tube,CRT)是一个有源物体。CRT使用3个电子枪分别产生红、绿和蓝三种波长的光(RGB三种电子束),分别产生并以相对强度轰击CRT的荧光涂层屏幕以产生颜色。并以各种不同的相对强度综合起来产生颜色。组合这三种光波以产生特定颜色称为相加混色,或称为RGB相加模型。相加混色是计算机应用中定义颜色的基本方法。 第19页,共93页,2022年,5月20日,13点56分,星期二 CRT显示器采用RGB彩色模型 A-阴极 B-导电涂层 C-阳极 D-荧光
15、屏 E-电子束 F-荫罩板 第20页,共93页,2022年,5月20日,13点56分,星期二YUV与RGB彩色空间变换 由于所有的显示器都采用RGB值来驱动,这就要求在显示每个像素之前,需要把YUV彩色分量值转换成RGB值。这种转换需要花费一定的计算时间。这是一个在设计软硬件视频处理系统要综合考虑的问题。 在考虑人的视觉系统和阴极射线管(CRT)的非线性特性之后,RGB和YUV的对应关系可以近似地用下面的方程式表示: Y = 0.299R + 0.587G + 0.114B U = - 0.169R - 0.331G + 0.5B V = 0.500R - 0.419G - 0.081B 第2
16、1页,共93页,2022年,5月20日,13点56分,星期二或者写成矩阵的形式: 5.2.4 彩色电视的信号类型 电视频道传送的电视信号主要包括亮度信号、色度信号、复合同步信号和伴音信号,这些信号或者可通过频率域,或者可通过时间域相互分离出来。电视接收机能够将所接收到的高频电视信号还原成视频信号和低频伴音信号,并能够在其荧光屏上重现图像,在其扬声器上重现伴音。 第22页,共93页,2022年,5月20日,13点56分,星期二 根据不同的信号源,电视接收机的输入、输出信号有三种类型:高频或射频信号 为了能够在空中传播电视信号,必须把视频全电视信号调制成高频或射频(RFRadio Frequenc
17、y)信号,每个信号占用一个频道,这样才能在空中同时传播多路电视节目而不会导致混乱。PAL制每个频道占用8MHz的带宽;NTSC制每个频道的带宽为4MHz。有线电视CATV(Cable Television)的工作方式类似,只是它通过电缆而不是通过空中传播电视信号。电视机在接收到某一频道的高频信号后,要把全电视信号从高频信号中解调出来,才能在屏幕上重现视频图像。 第23页,共93页,2022年,5月20日,13点56分,星期二复合视频信号 为便于电视信号远距传输,必须把三个分量信号以及同步信号复合成一个信号,然后才进行传输。复合视频信号定义为包括亮度和色度的单路模拟信号,也即从全电视信号中分离出
18、伴音后的视频信号,这时的色度信号是间插在亮度信号的高端。由于复合视频的亮度和色度是间插在一起的,在信号重放时很难恢复完全一致的色彩。这种信号一般可通过电缆输入或输出到家用录像机上,其信号带宽较窄,一般只有240线左右的水平分解率。早期的电视机都只有天线输入端口,较新型的电视机才备有复合视频输入和输出端(Video In,Video Out),也即可以直接输入和输出解调后的视频信号。视频信号已不包含高频分量,处理起来相对简单一些,因此计算机的视频卡一般都采用复合视频输入端口获取视频信号。由于视频信号中已不包含伴音,故一般与视频输入、输出端口配套的还有音频输入、输出端口,以便同步传输伴音。 第24
19、页,共93页,2022年,5月20日,13点56分,星期二图7-7 复合视频线及接口第25页,共93页,2022年,5月20日,13点56分,星期二分量视频信号与SVideo为保证视频信号质量,近距离时可用分量视频信号(component video signal)传输, 分量信号是指每个基色分量( R,G,B 或 Y,U,V )作为独立的电视信号传输。计算机输出的VGA视频信号,即为分量形式的视频信号。 SVideo 是一种两分量的视频信号,它把亮度和色度信号分成两路独立的模拟信号,用两路导线分别传输并可以分别记录在模拟磁带的两路磁轨上。这种信号不仅其亮度和色度都具有较宽的带宽,而且由于亮度
20、和色度分开传输,可以减少其互相干扰,水平分解率可达420线。与复合视频信号相比,SVideo可以更好地重现色彩。 第26页,共93页,2022年,5月20日,13点56分,星期二图7-8 S-VIDEO视频线及接口第27页,共93页,2022年,5月20日,13点56分,星期二5.3 视频的数字化过程要让计算机处理视频信息,首先要解决的是视频数字化的问题。视频数字化是将模拟视频信号经模数转换和彩色空间变换转为计算机可处理的数字信号,与音频信号数字化类似,计算机也要对输入的模拟视频信息进行采样与量化,并经编码使其变成数字化图像。 第28页,共93页,2022年,5月20日,13点56分,星期二5
21、.3.1 视频信号的采样对视频采样的基本要求 对视频信号进行采样时必须满足三个方面的要求。 要满足采样定理。对于PAL制电视信号。视频带宽为6MHz,按照CCIR601建议,亮度信号的采样频率为13.5MHz ,色度信号为6.75MHz。 采样频率必须是行频的整数倍。这样可以保证每行有整数个取样点,同时要使得每行取样点数目一样多,具有正交结构,便于数据处理。 要满足两种扫描制式。 数字视频信号的采样频率和格式现行的扫描制式主要有625行/50场和525行/60场两种,它们的行频分别为15625Hz和15734.265Hz。ITU(国际电信联盟)建议的分量编码标准的亮度抽样频率为13.5兆赫,这
22、恰好是上述两种行频的整数倍。按照国际现行电视制式,亮度信号最大带宽是6MHz。根据奈奎斯特抽样定理,抽样频率至少要大于2612MHz,因此取13.5MHz也是合适的。 第29页,共93页,2022年,5月20日,13点56分,星期二数字视频的采样格式 根据电视信号的特征,亮度信号的带宽是色度信号带宽的两倍。因此其数字化时对信号的色差分量的采样率低于对亮度分量的采样率。如果用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别有4:1:1、4:2:2和4:4:4三种。 电视图像既是空间的函数,也是时间的函数,而且又是隔行扫描式,所以其采样方式比扫描仪扫描图像的方式要复杂得多。分量采样
23、时采到的是隔行样本点,要把隔行样本组合成逐行样本,然后进行样本点的量化,YUV到RGB色彩空间的转换等等,最后才能得到数字视频数据。 第30页,共93页,2022年,5月20日,13点56分,星期二4:2:2采样格式模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三
24、个模数转换器对三个分量分别进行数字化,最后再转换成RGB空间。 第31页,共93页,2022年,5月20日,13点56分,星期二 4:2:2采样格式 图7-13 4:2:2采样格式示意第32页,共93页,2022年,5月20日,13点56分,星期二 为了在PAL、NTSC和 SECAM电视制式之间确定共同的数字化参数,国家无线电咨询委员会(CCIR)制定了广播级质量的数字电视编码标准,称为CCIR 601标准(现在的ITU-R标准)。在该标准中,对采样频率、采样结构、色彩空间转换等都作了严格的规定。根据实验,人眼对颜色的敏感程度远不如对亮度信号那么灵敏,所以色度信号的取样频率可以比亮度信号的取
25、样频率低,以减少数字视频的数据量。ITU-R建议使用了4:2:2采样结构。所谓“4:2:2”是指色度信号取亮度信号取样频率的一半。即此时信号是用一个亮度分量,两个色度分量来表达的。 第33页,共93页,2022年,5月20日,13点56分,星期二 根据ITU推荐的采样率,可计算出在不同的采样格式下数字视频的数据量: 由表中看出,未压缩的数字视频数据量十分巨大,对于目前的计算机和网络存储或传输都是不现实的,因此在多媒体中应用数字视频的关键问题是数字视频的压缩技术。 采样格式(Y:U:V)数据量(Mbyte/s)4:2:2274:4:440第34页,共93页,2022年,5月20日,13点56分,
26、星期二5.3.2 量化 采样过程是把模拟信号变成了时间上离散的脉冲信号,量化过程则是进行幅度上的离散化处理。因此在时间轴的任意一点上量化后的信号电平与原模拟信号电平之间在大多数情况下总是存在有一定的误差,量化所引入的误差是不可避免的同时也是不可逆的,由于信号的随机性这种误差大小也是随机的,这种表现类似于随机噪声效果,具有相当宽度的频谱,因此我们又把量化误差称为量化噪声。但量化误差与噪声是有本质的区别的。 如果视频信号量化比特率为8Bit,信号就有个量化值。若最大信号正好用足比特的话,小于1/256的信号就只能当零处理了。而且每二个相邻数字的差距也必需大于1/256才能分得开,当二个原来不同的数
27、值用同一个二进制值来表示时,实际数值与记录数值之差就成为量化噪声。所以,比特率已决定了整个系统的理想状态下的最小噪声、动态范围和信噪比,模拟信号在理想状态是没有这种限制的。亮度信号用比特量化,灰度等级最多只有256个,如果RGB三个色度信号都用比特量化,就可以获得25625625616777216,即近17万种色彩。 第35页,共93页,2022年,5月20日,13点56分,星期二 5比特量化有32个灰度等级 8比特量化有256个灰度等级 第36页,共93页,2022年,5月20日,13点56分,星期二 量化比特率愈高,层次就分得愈细,但数据量也成倍上升。每增加一个比特,数据量就翻一翻,例如播
28、放机视频量化位数多为10比特,灰度等级达到1024个,然而数据量是比特量化的倍。量化的过程是不可逆的,这是因为量化本身给信号带来的损伤是不可弥补的。量化时比特数选取过小则不足以反映出图像的细节,比特数选取过大则会产生庞大的数码率,从而占用大量的频带,给传输带来困难。有一种方法可以用小比特数量化而获得大比特数量化时的效果。降低量化误差的方法最直接的就是增加量化级数减小最小量化间隔,但由此带来码率的增加从而要求更大的处理带宽,一般现在的视频信号均采用8比特、10比特,在信号质量要求较高的情况下采用12比特量化。 第37页,共93页,2022年,5月20日,13点56分,星期二 正如模拟音频信号传输
29、过程中采用不均匀量化一样。在视频信号的量化过程中也可以采用不均匀量化方式,即将模拟信号先进行对数变换,其目的是让变化量大的地方变化小,让变化量小的地方变化大,然后,再进行普通的8比特量化,经传输后再恢复出来的模拟信号可以通过指数变换予以还原,此时,信号传输的效果类似于12比特量化的效果。 第38页,共93页,2022年,5月20日,13点56分,星期二5.3.3 视频信号的压缩与编码 抽样、量化后的信号转换成数字符号才能进行传输,这一过程称为编码。视频压缩编码的理论基础是信息论。信息压缩就是从时间域、空间域两方面去除冗余信息,将可推知的确定信息去掉。 在通信理论中,编码分为信源编码和信道编码两
30、大类。所谓信源编码是指将信号源中多余的信息除去,形成一个适合用来传输的信号。为了抑制信道噪声对信号的干扰,往往还需要对信号进行再编码,使接收端能够检测或纠正数据在信道传输过程引起的错误,这称为信道编码。 视频编码技术主要包括MPEG与H.261标准,编码技术主要分成帧内编码和帧间编码。前者用于去掉图像的空间冗余信息,后者用于去除图像的时间冗余信息。 第39页,共93页,2022年,5月20日,13点56分,星期二5.3.4 数字视频DV格式数字视频(Digital Video-DV)是定义压缩图像和声音数据记录及回放过程的标准。DV格式是一种国际通用的数字视频标准,是由10余家公司共同制定的标
31、准。 DV格式具有如下视频特点: 高清晰度,水平分辨率可达500线; 宽色度带宽,还原色彩绚丽的图像;第40页,共93页,2022年,5月20日,13点56分,星期二 当前有三种常用DV格式:miniDV、DVCPro和DVCam。miniDV 最常见,通常是家用摄像机使用的格式。DVCPro和DVCam为专业格式。DV格式数字摄像机对视频采用 4:1:1数字分量采样标准,8比特量化,基于离散余弦变量DCT的5:1帧内压缩,数据传输率为24.948 Mbps对音频信号采用两种PCM脉冲调制编码方式 :一是采样频率48kHz、16比特量化的双声道立体声方式。另一种是采样频率为32kHz、12比特
32、量化的四声道方式,这种方式可方便后期编辑中的配音配乐。 第41页,共93页,2022年,5月20日,13点56分,星期二 目前 DV 格式数字摄录机,其记录图像的水平分辨率为500线。在记录过程中,亮度信号Y与两个色差信号 U、V,三者不在同一频带传输并分别记录,避免了相互串扰和影响。此外,视频和音频信号在输出时先要进入数字存储器,然后以新的时间码标准输出,这样就消除了使用模拟机常见的图像抖动、扭曲等时间码误差,使图像和声音更加稳定。使用数字存储器还能有效的进行信号失落补偿,消除模拟机播放录像时常见的“雪花”现象。同时,由于对声音的处理采用了与音乐 CD 和数字录音带相同的编码方式,所以图像清
33、晰度高、色彩还原逼真、音响效果好。 第42页,共93页,2022年,5月20日,13点56分,星期二5.4基于多媒体计算机的视频处理系统 在多媒体计算机系统中,视频处理一般是借助于一些相关的硬件和软件,在计算机上对输入的视频信号进行接收、采集、传输、压缩、存储、编辑、显示、回放等多种处理。视频信号主要是指来自电视机、录/放像机、摄像机等视频设备的信号,也可以是来自影碟机的影视节目。 第43页,共93页,2022年,5月20日,13点56分,星期二5.4.1 数字视频系统的组成 从硬件平台的角度分析,一个视频采集系统要包括视频采集设备、视频信号源设备、大容量存储设备、以及配置有相应视频处理软件的
34、高性能计算机系统。 提供模拟视频输出的设备有录像机、电视机 、影碟机等;对模拟视频信号进行采集、量化和编码的设备由视频采集卡来完成;最后,由计算机接收和记录编码后的数字视频数据。在这一过程中起主要作用的是视频采集卡,它不仅提供接口以连接模拟视频设备和计算机,而且具有把模拟信号转换成数字数据的功能。 第44页,共93页,2022年,5月20日,13点56分,星期二5.4.2 视频采集卡的工作原理 视频采集卡是一个安装在计算机扩展槽上的一个硬卡。它可以汇集多种视频源的信息,如电视、影碟、录像机和摄像机的视频信息,对被捕捉和采集到的画面进行数字化、冻结、存储、输出及其他处理操作,如编辑、修整、裁剪、
35、按比例绘制、像素显示调整、缩放功能等。视频卡为多媒体视频处理提供了强有力的硬件支持。 视频采集卡的工作原理如图5-1所示 。视频卡一般具有多种视频接口,可接收来自摄像机 、录像机、VCD机等多种视频信号,通过视频软件可选择所需的视频源。 第45页,共93页,2022年,5月20日,13点56分,星期二 从彩色摄像机、录像机或其他视频信号源得到的彩色电视信号 ,经视频接口送入视频采集卡,信号首先经过A/D转换,然后送到多制式数字解码器进行解码 。模数转换器(ADC)又是一个视频解码器,其任务是对视频信号解码和数字化 。采用不同的颜色空间可选择不同的视频输入解码器芯片。 图5-1 视频卡的工作原理
36、框图 第46页,共93页,2022年,5月20日,13点56分,星期二 经ADC解码后得到的YUV信号格式。当以4:2:2格式采样时 ,每4个连续的采样点中取4个亮度Y、2个色差U、2个色差V的样本值,共8个样本值。YUV信号经过转换可变成RGB信号。 RGB信号然后被送入视频处理芯片,对其进行剪裁,变化等处理。视频处理芯片是用于视频捕获、播放、显示用的专用控制芯片,主要功能可分为PC总线接口、视频输入剪裁、变化比例、与VGA信号同步 、色键控制以及对帧存储器VRAM的读写和刷新控制。 视频信息可实时地存到VRAM中,计算机可以通过视频处理器对帧存储器的内容进行读写操作 ,帧存储器的视频像素信
37、息读到计算机后 ,通过编程可以实现各种算法,完成视频图像的编辑与处理。 第47页,共93页,2022年,5月20日,13点56分,星期二 视频采集卡主要有两种控制方式把视频信号与VGA 信号叠加显示 ,即色键方式和窗口方式。视频输出的RGB信号与VGA显示卡引过来的RGB信号是完全同步的,用适当的方法交替切换两路信号,即可实现两路输出的叠加 。上述两种RGB信号经过 DAC(数模转换器)转换变成模拟信号 ,并在显示器的窗口中显示。 由于视频信息量巨大,如果直接存储,会占用大量的存储空间 。以电视图像为例 ,电视上一秒钟的画面 ,其实是由几十幅连续所组成的 ,如果直接将这些视频信息存储起来,至少
38、也要十几MB的容量 。所以视频卡又提供了对视频数字信号的压缩功能 ,并以压缩的图像文件格式进行存储 。当在计算机上播放视频图像时还得经过解压缩过程,使其还原成图像信息才能播放。 第48页,共93页,2022年,5月20日,13点56分,星期二5.4.3 视频采集卡的性能指标根据不同的应用、不同的适用环境和不同的技术指标,目前有多种规格的视频采集卡。可以归纳出以PC机为硬件环境的视频采集卡的主要功能和技术指标: 接口 视频采集卡的接口包括视频与PC机的接口和与模拟视频设备的接口。目前PC 视频采集卡通常采用32位的PCI总线接口,它插到PC机主板的扩展槽中,以实现采集卡与PC机的通信与数据传输。
39、 视频采集卡至少要具有一个复合视频接口(Video In)以便与模拟视频设备相连。高性能的采集卡一般具有一个复合视频接口和一个SVideo接口。一般的采集卡都支持PAL和NTSC两种电视制式。 第49页,共93页,2022年,5月20日,13点56分,星期二 视频采集卡如果不具备电视天线接口和音频输入接口,就不能用视频采集卡直接采集电视射频信号,同时也不能直接采集到模拟视频中的伴音信号。要采集伴音,PC机上必需要装有声卡,视频采集卡通过PC机上的声卡获取数字化的伴音并把伴音与采集到的数字视频同步到一起。 一般而言, 视频采集卡有单工卡和双工卡两种。单工卡只提供视频输入接口,双工卡还提供输出接口
40、。如果只需在PC机上编辑数字化视频,单工卡就可以了。若想把数字化编辑过后的影像拷贝到录像带上,就需要双工卡。 第50页,共93页,2022年,5月20日,13点56分,星期二具有多种接口的视频采集卡与视频源的连接第51页,共93页,2022年,5月20日,13点56分,星期二实时压缩功能 由于模拟视频输入端可以提供不间断的信息源,视频采集卡要采集模拟视频序列中的每帧图像,并在采集下一帧图像之前把这些数据传入PC系统。因此,实现实时采集的关键是每一帧所需的处理时间。如果每帧视频图像的处理时间超过相邻两帧之间的相隔时间,则要出现数据的丢失,也即丢帧现象。采集卡都是把获取的视频序列先进行压缩处理,然
41、后再存入硬盘,也就是说视频序列的获取和压缩是在一起完成的,免除了再次进行压缩处理的不便。不同档次的采集卡具有不同质量的采集压缩性能。 大多数视频采集卡都具备硬件压缩的功能,在采集视频信号时首先在卡上对视频信号进行压缩,然后再通过接口把压缩的视频数据传送到主机上。视频采集卡采用帧内压缩的算法把数字化的视频存储成AVI文件,高性能的视频采集卡还能直接把采集到的数字视频数据实时压缩成MPEG格式的文件。 第52页,共93页,2022年,5月20日,13点56分,星期二 视频捕获卡一般都采用专业级的专用芯片来处理视频的压缩,例如:intel的i750。同时由于图像采集要处理大量数据(分钟的AVI文件大
42、约占30MB空间),所以对计算机硬件平台的要求也较高。如果用软件的方式进行数据压缩,则对计算机的性能有很高的要求,否则抓取的画面及播放画面的速度便会受到相应的影响。采集分辨率及帧频 视频采集卡按照其用途可以分为广播级视频采集卡,专业级视频采集卡,民用级视频采集卡。他们的区别主要是采集的图像指标不同。 广播级视频采集卡属高档设备,主要用于电视台制作节目。广播级视频采集卡的最高采集分辨率一般720576(CCIR推荐值),PAL制,每秒25帧 ;或分辨率为 640480,NTSC制,每秒30帧。最小压缩比一般在4:1以内。这一类产品的特点是采集的图像分辨率高,视频信噪比高,缺点是视频文件庞大,每分
43、钟数据量至少为200MB。 第53页,共93页,2022年,5月20日,13点56分,星期二 专业级视频采集卡比广播级视频采集卡的性能稍微低一些,分辨率两者是相同的 ,但压缩比稍微大一些,其最小压缩比一般在6:1以内,输入输出接口为AV复合端子与S端子,此类产品适用于广告、多媒体节目制作及多媒体软件开发。 民用级的视频采集卡的动态分辨率一般最大为384288,PAL制式,帧频为每秒25帧。 驱动和应用程序 视频采集卡一般都配有硬件驱动程序以实现PC机对采集卡的控制和数据通信。根据不同的采集卡所要求的操作系统环境,各有不同的驱动程序。采集卡只有在正确安装了驱动程序以后才能正常工作。也可以采用通用
44、的软件,例如数字视频编辑软件Adobe Premiere。 第54页,共93页,2022年,5月20日,13点56分,星期二5.4.4 视频设备及其连接 视频信号源及设备 摄像机、录像机等设备都带有复合视频输出端口,有的带有分量视频输出端口。由于视频采集卡提供复合视频输入和分量视频输入口,因此只要具有复合视频输出或SVideo输出端口的设备都可以为采集卡提供视频信号源,把这些输出端口与采集卡相应的视频输入端口相连就可实现信号的连接。 视频的质量在很大程度上取决于模拟视频信号源的质量及视频采集卡的性能。根据不同的模拟视频信号源应分别选择相应的设备。摄像机可以实时获取动态实景。获取的实景可以记录在
45、与摄像机配套的磁录像带上,也可以直接通过摄像机的输出端口输出,有的摄像机还具有播放功能,可以播放其录像带上的信号并通过输出端口输出。磁带录像机及录像带是提供模拟视频信号源的最常用设备。不同档次和规格的录像机对使用的磁带有不同的要求,如VHS的磁带仅适用于VHS录像机。 第55页,共93页,2022年,5月20日,13点56分,星期二视频设备与PC的连接 准备好了模拟视频信号源及其相应的设备,剩下的工作就是把模拟视频设备与PC机上的采集卡相连接。模拟设备与采集卡的连接包括模拟设备视频输出端口与采集卡视频输入端口的连接,以及模拟设备的音频输出端口与MPC声卡的音频输入端口的连接。 如果采集卡只具有
46、视频输入端口而没有伴音输入端口 ,要同步采集模拟信号中的伴音,必须使用带声卡的计算机,通过声卡来采集同步伴音。 视频采集卡有两种视频输入接口,要注意它们之间的区别,一种是具有标准复合视频输入接口(RCA,俗称莲花接口),标准视频信号在输出时要进行编码,将信号压缩后输出,接收时还要进行解码。这样会损失一些信号。还有一种是S视频输入接口(S-Video)。由于S视频信号不需要进行编码、解码,所以没有信号损失,因此使用SVideo端口可以获取更好的图像质量。 第56页,共93页,2022年,5月20日,13点56分,星期二兼有复合视频接口和S-Video接口的视频卡S-video电缆线及接口 复合视
47、频插头 第57页,共93页,2022年,5月20日,13点56分,星期二视频采集的过程采集视频的过程主要包括如下几个步骤: 设置音频和视频源,把视频源外设的视像输出与采集卡相连、音频输出与MPC声卡相连。 准备好MPC系统环境,如硬盘的优化、显示设置、关闭其他进程等。 启动采集程序,预览采集信号,设置采集参数。启动信号源,然后进行采集。 播放采集的数据,如果丢帧严重可修改采集参数或进一步优化采集环境,然后重新采集。 由于信号源是不间断地送往采集卡的视频输入端口的,可根据需要,对采集的原始数据进行简单的编辑。如剪切掉起始和结尾处无用的视频序列,剪切掉中间部分无用的视频序列等,以减少数据所占的硬盘
48、空间。 第58页,共93页,2022年,5月20日,13点56分,星期二5.4.4 数字视频的输出 数字视频的输出是数字视频采集的逆过程,也即把数字视频文件转换成模拟视频信号输出到电视机上进行显示,或输出到录像机记录到磁带上,这需要专门的设备来完成数字数据到模拟信号之间的转换。根据不同的应用和需要,这种转换设备也有多种。目前已有集模拟视频采集与输出于一体的视频卡,可以与录像机等设备相连,提供高质量的模拟视频信号采集和输出。这种设备可以用于专业级的视频采集、编辑及输出。 第59页,共93页,2022年,5月20日,13点56分,星期二5.5 其他功能的视频卡5.5.1 视频输出卡-TV Code
49、r 经过计算机加工处理的视频数据以视频文件的格式进行存储和交流,但不能以录像带的形式进行传播或者直接在电视机上收看。视频输出卡的功能是将计算机显示卡输出的VGA信号转换为标准的视频信号,以PAL和NTSC两种制式输出,从而可在电视上观看计算机显示器上的画面,或将其通过录像机录制到录像带上 。对计算机的VGA显示卡输出的以RGB形式表示的视频数据进行编码 ,将其转换成可供录象机和电视机输入和显示的复合视频信号的接口卡叫视频输出卡或编码卡(TVCoder)。 TVCoder 的功能是把计算机显示器上显示的内容实时地转换为模拟视频信号并输出到电视机或录像机上,这对于多媒体演示和多媒体教育培训有很大帮
50、助。还可以把多媒体演示的内容记录到磁带上。 第60页,共93页,2022年,5月20日,13点56分,星期二TVCoder具有以下几种接口:VGA输入端口:TVCoder的输入信号取自于PC机的VGA显示输出端。输出制式开关:TVCoder支持NTSC和PAL制式输出,由制式选择开关可选择所需的输出信号的制式。 模拟输出端口:TVCoder 可提供复合视频输出,两分量的SVideo输出以及三分量RGB输出。Video和SVideo输出可与具有相应视频输入端口的电视或录像机相连;RGB输出可以与RGB显示器或其他具有RGB输入端口的设备,如投影仪等相接。 VGA输出:由于TVCoder要占用计算
51、机主机的VGA输出端口,因此它还提供一个VGA输出端口以便与计算机的显示器连接。 第61页,共93页,2022年,5月20日,13点56分,星期二5.5.2 MPEG卡 MPEG是能将大量视频信息进行压缩的国际标准。在该标准的支持下,一套74分钟的完整录像画面以及具有CD音质的音频信号,只要一张CD光盘即可存储。由于MPEG将活动的图像与声音信号一体存储,因此大大提高了播放质量。 MPEG卡实际上分为两类:MPEG压缩卡和解压卡。MPEG压缩卡用于将视频影像压缩成MPEG的格式。它首先将模拟音视频信号数字化,然后按MPEG标准的压缩算法分别对数字音视频信号进行压缩编码,产生一个码率约为1.5m
52、 bit/s的MPEG复合音视频码流,最后再转变为.mpg格式的文件储存在硬盘上。根据所支持的信号输入方式,MPEG压缩设备可分为专业型和普及型;专业型MPEG压缩卡可以支持YUV、SVideo和复合视频等多种输入。它们一般还带有数字滤波预处理和专业分量型录像机控制等功能。预处理功能除了能减小视频信号中的噪声外,还可限制视频信号的动态范围,使信号更容易压缩,有效地降低了压缩算法引起的压缩失真,可大大提高图像的主观清晰度。 第62页,共93页,2022年,5月20日,13点56分,星期二 MPEG解压卡是采用硬件方式将压缩后的VCD影碟数据解压后进行回放。当计算机将CD-ROM内的数据传送到MP
53、EG卡上时,通过卡上的MPEG解码器,将已压缩的数据进行解压。品质较好的MPEG卡可播放每秒30帧的电影画面,速度和NTSC制式一样。有些MPEG卡还提供了视频输出端口(Video Out)和音频输出端口(Audio Out),可以将VCD画面播放到大屏幕彩色电视机上或其他录象设备上,具备了视频输出卡的功能。 第63页,共93页,2022年,5月20日,13点56分,星期二 MPEG编码卡 第64页,共93页,2022年,5月20日,13点56分,星期二5.5.3 电视接收卡电视卡(TV TUNER)从工作原理上看相当于一台数字式电视机。它首先将从天线接收下来的射频信号变换成视频信号,然后经A
54、/D转换器变为数字信号,再经变换电路变为RGB数字信号,最后通过D/A转换变为模拟RGB信号送显示器上显示。因为电视卡采用逐行扫描方式,加上计算机显示点距小,分辨率高,所以整个电视图像看上去清晰稳定,完全可以与电视机媲美。电视卡的硬件部分是电视频道的选台电路,在MPC上安装此卡后,允许用户在MPC上用遥控器或鼠标进行操作,对电视频道进行选择。不同的电视卡所能选择的频道数量各异,一般能达到100个左右。有些TV TUNER卡配有声音输出的接口,以供用户连接到音箱或转接到声卡的输入口。除频道选择之外,电视接收卡还可以进行频道预设、亮度及音量调节、彩色调整等。 第65页,共93页,2022年,5月2
55、0日,13点56分,星期二 外置式(左)与内置式(右)电视卡 第66页,共93页,2022年,5月20日,13点56分,星期二5.5.4 视频卡的发展趋势 系统集成是现代技术的主要趋势,多媒体本身就是技术集成的产物。近年来,多媒 体视频硬件主要在两个领域发展。第一是与网络通信技术结合,由视频采集卡附加网络 通信卡构成的多媒体视频会议、S可视电话、视频邮件、多媒体通信终端等。基于宽带多媒体通信网络的交互式电视(ITV)、点播电视(VOD)以及远程教育系统、远程医疗诊断系统、远程电子图书馆等新技术正在普及实施,通过交互电视的机顶盒(STB)实现网络浏览、电视购物、收看VOD节目等,最终走向电视、电
56、脑与电信的三电合一的目的。 第67页,共93页,2022年,5月20日,13点56分,星期二 第二方面是与影视制作技术结合,构成集压缩/解压缩、合成输出、特技效果为一体的影视制作非线形编辑系统。视频处理硬件最终将从高档系统的选件转变为标准系统的组件。 从技术上看,电子器件的集成度越来越高;从应用角度看,综合处理多媒体功 能的需求越来越普遍,因此“集成到芯片中,设计在主板上”将会是新一代视频/图像处理硬件的发展趋势。 第68页,共93页,2022年,5月20日,13点56分,星期二5.6 视频文件的类型 5.6.1 AVI文件 AVI(Audio Video Interleave)是一种音频视像
57、交插记录的数字视频文件格式。1992年初微软公司推出了AVI技术及其应用软件VFW(Video for Windows)。在AVI文件中,运动图像和伴音数据是以交织的方式存储 ,并独立于硬件设备。这种按交替方式组织音频和视像数据,可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。 AVI文件结构不仅解决了音频和视频的同步问题,而且具有通用和开放的特点 。它可以在任何Windows环境下工作,而且还具有扩展环境的功能。用户可以开发自己的AVI视频文件 ,在Windows环境下可随时调用。 第69页,共93页,2022年,5月20日,13点56分,星期二 AVI一般采用帧内有损压缩,可以用
58、一般的视频编辑软件如 Adobe Premiere进行再编辑和处理。 在AVI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备 。这种音频和视像的交织组织方式与传统的电影相似 ,在电影中包含图像信息的帧顺序显示,同时伴音声道也同步播放。 5.6.2 MOV文件 Apple公司在其生产的Macintosh机也推出了相应的视频格式 ,即 Movie digital video 的文件格式,其文件以MOV为后缀 ,相应的视频应用软件为 Apples QuickTime for Macintosh。随着大量原本运行在Macintosh上的多媒体软件向PC/Windows环境的移植,导致了
59、QuickTime视频文件的流行。同时Apple公司也推出了适用于PC机的视频应用软件Apples QuickTime for Windows,因此在MPC机上也可以播放MOV视频文件。 第70页,共93页,2022年,5月20日,13点56分,星期二 MOV格式的视频文件可以采用不压缩或压缩的方式,其压缩算法包括 Cinepak、Intel Indeo Video R3.2 和Video编码。其中Cinepak和Intel Indeo Video R3.2算法的应用和效果与AVI格式中的应用和效果类似。而Video格式编码适合于采集和压缩模拟视频,支持16位图像深度的帧内压缩和帧间压缩,帧率
60、可达每秒10帧以上。 QuickTime还采用了一种称为 QuickTime VR的虚拟现实(VR,Virtual Reality)技术 ,用户只需通过鼠标或键盘,就可以观察某一地点周围360度的景象 ,或者从空间任何角度观察某一物体。 QuickTime以其领先的多媒体技术和跨平台特性 、较小的存储空间要求 、技术的独立性以及系统的高度开放性,目前已成为数字媒体软件技术领域的事实上的工业标准 。国际标准化组织(ISO)最近选择QuickTime文件格式作为开发MPEG4规范的统一数字媒体存储格式。 第71页,共93页,2022年,5月20日,13点56分,星期二5.6.3 MEPG文件-MP
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国科学院深海科学与工程研究所2025年招聘备考题库(十七)深潜技术研究室招聘ROV软件工程师及参考答案详解1套
- 2025年深圳市龙岗区卫生健康局下属事业单位招聘9人备考题库有答案详解
- 2025年民生银行沈阳分行社会招聘备考题库带答案详解
- 城管外包合同范本
- 商场提点合同范本
- 培训就业合同范本
- 墙体修缮合同范本
- 抵押协议转让合同
- 搅拌投资合同范本
- 教师解约合同协议
- TCECS10270-2023混凝土抑温抗裂防水剂
- 【语 文】第19课《大雁归来》课件 2025-2026学年统编版语文七年级上册
- 2025辽宁葫芦岛市总工会招聘工会社会工作者5人笔试考试参考题库及答案解析
- 印刷消防应急预案(3篇)
- 餐饮签协议合同范本
- 空调维修施工方案
- 2025河南洛阳市瀍河区区属国有企业招聘14人笔试考试备考题库及答案解析
- 医德医风行风培训
- 2025-2026学年小学美术人教版 四年级上册期末练习卷及答案
- 辽宁省名校联盟2025-2026学年高三上学期12月考试物理试卷
- 2025广东肇庆市鼎湖区人民武装部招聘民兵专职教练员8人备考题库带答案解析
评论
0/150
提交评论