下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、论非线性编辑系统中的视音频处理 摘要:非线性编辑系统是以计算机为操作平台的电视节目后期编辑制作设备,随着计算机技术的飞速发展,非线性编辑系统已广泛应用于电视节目的制作。本文介绍了非线性编辑系统中的视音频处理系统的组成及其工作原理。 关键词:非线性编辑;线性编辑;视频卡;视频压缩;采样频率;压缩比 一、非线性编辑的概要 20世纪末,科学技术和艺术的关系越来越密切,科学技术媒介被广泛的引入艺术实践领域,信息时代的数字技术作为一种媒介机制与艺术相结合,其中非线性编辑技术尤以其低成本、高效率、高质量和效果变换无穷的优点迅速进入了电影、电视、网络等传播领域。
2、 非线性编辑是针对线性编辑而言的,在传统的电视节目制作中,节目的制作和编辑是在编辑机上进行的。编辑机一般是由一台放像机和一台录像机组成,编辑人员在放像机中选择一段需要的素材,然后把这段素材录制到录像机中的磁带上,然后再搜索下一个镜头,接着再进行记录工作,之后重复以上的操作,直到把所有需要的素材按照节目要求全部顺序记录下来。 用磁带记录画面是顺序的,所以无法在已有的画面之间插入别的画面,也无法删除不需要的画面,除非把这之后的画面全部重新录制一遍,插入所需的画面,最后再把之前复制的画面接上,这种编辑方式就叫做线性编辑,它给编辑人员带来很多的限制,编辑效率非常的低下。 非线性编辑则是应用计算机图像技
3、术,在计算机中对各种原始素材进行各种编辑操作,并将最终结果输出到计算机硬盘、磁带、录像带等记录介质上这一系列完整的工作过程。所有的原始素材是被数字化后才存储到计算机硬盘上的,信息存储的位置都是并列平行的,所以与原始素材输入到计算机时间的先后顺序没有关系。于是,我们就可以对存储在硬盘上的数字化音视频素材进行随意的排列组合,并可进行各种修改。这样,非线性编辑的优势就体现出来了,工作效率也提高了很多。编辑人员现在所要做的就是如何去创作他的作品,如何发挥他的想象力,再也不用受线性编辑的限制了。 任何非线性编辑的工作流程,都可以简单地看成输入、编辑、输出这样三个步骤。当然由于不同软件功能的差异,其使用流
4、程还可以进一步细化。以大洋D3-Edit为例,其使用流程主要分成如下5个步骤。 1素材采集与导入;采集就是利用大洋D3-Edit,将模拟视频、音频信号转换成数字信号存储到计算机硬盘中,或者将外部的数字视频存储到计算机硬盘中,成为可以处理的素材。导入主要是把其他视频、图片、声音等导入到大洋D3-Edit的素材库中。 2素材剪辑:素材剪辑就是在原始素材中选取所需的各个小片段,然后按照时间顺序组成不同新的素材的过程。 3特技处理:对于视频素材,特技处理大概分为转场、特效、合成叠加等。对于音频素材,特技处理分为转场、特效等。令人震撼的画面效果,就是在这一过程中产生的。而非线性编辑软件功能的强弱,往往也
5、是体现在这方面。配合某些硬件,大洋D3-Edit还能够实现特技播放。 4字幕制作:字幕是节目中非常重要的部分,它包括文字和图形两个方面。大洋D3-Edit中制作字幕很方便,可以实现各种预期达到的效果,并且还有大量的模板可以选择。 5输出与生成;节目编辑完成后,就可以输出回录到录像带上;也可以生成视频文件,保存到移动硬盘上、发布到网上、刻录VCD和DVD等。 由此可见,音视频素材的采集与输入是整个非线性编辑流程的第一步,也是至关重要的第一步。没有对素材优良的采集编码,就谈不上好的非编系统,下面我们就来详细深入地研究音视频输入系统。 二、非线性编辑系统中的视频处理 首先,我们来说说人的视觉特性。人
6、眼是依靠视网膜上光敏细胞一杆状细胞和锥状细胞获得了彩色视觉,人眼仅对电磁波谱中的可见光区波长从380nm到780nm敏感,人眼对亮度的敏感程度比对颜色的敏感程度高。 了解了人的视觉特性后,我们再来研究视频信号。一般评价和描述视频信号的好坏,就会提到一些指标,如分辨率、帧速率和色彩数等参数。分辨率就是画面的精密度,它反映了画面的清晰度。分辨率为384×288的电视图像与分辨率为384×576的电视图像的画面质量有明显的区别。电视节目后期制作中,要求图像分辨率为720×576或768×576PAL制。帧速率是指每秒钟刷新的画面的帧数,也可以理解为画面处理器每
7、秒钟能够刷新几次。PAL制电视节目的帧速率为25fps帧每秒:制作多媒体光盘出版物时一般选15fps的帧速率。电影和NTSC制式电视的帧速率分别为24fps和3029.97fps。色彩数就是屏幕上最多显示多少种颜色的总数。描述每一像素的字节数决定了最多可同屏显示多少种颜色,一般为256色、65536色和16777216色即真彩色。色彩数越多,能表现的彩色层次越丰富。 视音频采集卡是非线性编辑系统的“引擎”,在非线性编辑系统中起着举足轻重的作用,它直接决定着整个系统的性能。它主要有以下功能:完成视、音频信号的AD、DA转换,即进行视频、音频信号的采集、压缩解压缩和最后的输出等功能,也称这类卡为视
8、音频处理卡。视音频处理卡是模拟信号与数字信号的分水岭,所有模拟视音频信号在此经过AD变换后,每一段素材都成为了一个视频文件存放在硬盘阵列中,供计算机进行数字域的处理。需要输出的视音频数码流经过DA变换成为可供记录或直播的视音频信号。视音频处理卡上包括模拟信号接口如复合、分量、S-VIDEO,已涵盖现有模拟电视系统的所有接口形式,也包括像IEEE-1394和SDI这样的数字接口。 视频处理卡是非线性编辑系统产品的决定性部件。一套非线性编辑系统所能达到何种程度的视频质量,与视频处理卡的性能密切相关。压缩与解压缩是视频处理卡的核心内容。在数字视频信号不能被有效而高质量地压缩时,非线性编辑都是在昂贵的
9、工作站上实现的。因为庞大的数字视频数据量使苹果机和普通Pc机都不堪重负,不能正常处理数码率高达216Mbs的无压缩数字分量视频信号或者142Mbs的无压缩数字复合数字视频信号,从而无法胜任无压缩数字视频信号的非线性编辑工作。然而,随着数字图像压缩技术的发展,各种图像压缩算法日臻成熟,使得在苹果机和Pc机上进行视频非线性编辑成为了现实,这些图像压缩算法是实现相对廉价的视频非线性编辑的关键所在。而视频处理卡正是采用这样的压缩算法。只不过它把压缩程序集成在硬件中。目前,国内外的非线性编辑系统,大都是采用Motion-JPEG算法。Motion-JPEG可以理解为活动图像的JPEG压缩,Motion-
10、JPEG基于静态图像压缩格式JPEG,对活动图像进行实时的帧内压缩,帧内压缩有一个好处就是可以精确的定位每一帧图像,这一点非常适合非线性编辑,在编辑过程中,可以随机存取任意一帧图 像,对于帧编辑十分理想。Motion-JPEG采用DCT编码技术。由于这种算法不太复杂,可以用很小的压缩比2:1进行全帧采集,从而实现广播级指标所要求的无损压缩。若采用广播级指标进行2:1压缩,经过压缩的数字视频信号其数码率仍有108Mbs分量视频或71Mbs复合视频。Motion-JPEG的压缩和解压缩是对称的,可以由相
11、同的硬件和软件来实现,这对压缩解压电路实现高度集成化有帮助。由于这种算法不太复杂,可以用很小的压缩比2:1进行全帧采集,从而实现广播级指标所要求的无损压缩。 Motion-JPEG的压缩过程如图1大概由5个主要部分组成: 色抽样:在视频处理器中处理的是分量信号YUV,因此输入的信号不是分量信号,需要进行转换,亮度信号Y、色度信号UV各用8比特表示,每个采样共用24比特。信号转换后,亮度信号直接进入DCT编码器中,而色度信号需要进行再抽样、同步,然后进入DCT编码器,这个过程是个有损失的过程,有些信息丢失后无法还原。色度抽样时,处理U分量的同时,丢失V分量;处理V分量时,丢失U分量,这样减少了数
12、据量,本来需要24比特来表示一个抽样,现在只用16比特8比特的亮度信号,8比特的色度信号,这就是常说的4:2:2Y:U:V。不同的厂家可能有不同的处理方法,有的会提高压缩比,有的可能不做处理,而采用24比特的无损信号。色度抽样完成后,色度信号与亮度信号输入到DCT变换器中,DCT变换器的作用主要是用频率变换来表示图像。 DCT:分量信号的图像进入DCT变换器中,每帧被分割成许多8*8像素的正方形,一幅图像可以分割成几千个这样的正方形,DCT变换器对这些正方形进行分析,计算出其灰度变化,然后用频率表示其灰度值,比如大块图形或轮廓变化不大的部分用低频表示,对边缘或细节这样变化大的部分用高频表示,D
13、CT变换器对所有正方形分析完后,在对下一幅图像进行分析。从DCT变换器输出的亮色信号使用频率来表示的,进入下一个过程一量化。 量化:量化过程决定了整个压缩过程的压缩程度,可以采用有损压缩或无损压缩,一旦进行有损压缩,丢失的信息无法还原。Motion-TPEG一般采用2:1的压缩比,在回放时,可以达到无压缩时的视觉效果。根据对人类视觉系统的分析,人眼对亮度和色度的敏感程度不同,在辨别一幅图形时,亮度信号对人眼的刺激更为重要,而色度信号在损失90的情况下,人眼仍然可以分辨出图形。数字视频压缩技术参考了人眼的这个特点,对色度信号进行压缩,来得到较高的压缩比。量化级数是量化的重要参数,其范围从0到25
14、5,级数越大,图像信息丢失越多,图像质量越差,可以得到较高的压缩比。量化级数与每帧的数据量成反比,级数大,每帧图像的数据量小,反之亦然。通过量化,把图像的频率数据根据量化转换成一系列的数,记录了图像的信息。 零记数:量化过程产生一个数组,通过计算数组中的零的个数,来帮助在传输过程中判断数组的尾端。这个过程多采用RLErun-length encoding算法。 霍夫曼编码:霍夫曼编码是DCT编码的最后一步,对数据进行冗余计算,把多余的信息去掉,传递更少的数据。霍夫曼编码得到的结果,就是存储到计算机磁盘上的数据。如果要看视频影象,将这些数据解码,然后通过数字模拟转换,得到模拟的视频信号,又可以在监视器上浏览或记录在录像带上了。 从硬件构成的角度看,视音频采集卡可分为单通道和双通道两种。这里通道的意思是指在内部视频混合器之前的独立的视频回放通道。目前绝大多数的非线性编辑系统使用的都是M-JPEG算法,因此可分为只有一个M-JPEG Codec编解码器的单通道系统和有两个M-JPEG Codec的双通道系统。单通道系统只能对一路视频信号进行压缩记录和解压回放,这就意味着系统肯定无法完成多层画面的实时处理。双通道系统由于可以完成两路视频信号的解压回放,再与系统内部其他处理单元相配合,就可以完成两路活动画面的实时混合处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四川大学华西第二医院招聘外聘门诊医师历年真题汇编带答案解析
- 2026年设备监理师之设备工程监理基础及相关知识考试题库200道附答案【b卷】
- 中共南部县委组织部关于2025年南部县党政机关公开考调工作人员(16人)备考题库带答案解析
- 2026奇瑞汽车博士校园招聘历年真题汇编附答案解析
- 2025下半年四川宜宾市高县事业单位考核招聘37人备考题库附答案解析
- 2025内蒙古呼和浩特经开区物业管理集团有限公司招聘工作人员4人模拟试卷附答案解析
- 2026陕西省面向重庆大学招录选调生历年真题汇编带答案解析
- 2025中铁上海设计院集团有限公司招聘8人笔试模拟试卷带答案解析
- 2025大兴区第十批公益性岗位招聘3人参考题库带答案解析
- 2025河南洛阳理思实验学校高中部招聘骨干教师(储备)历年真题库附答案解析
- 2025年广西普法考试(一)及答案
- 7月电子商务四级测试题与参考答案
- 2025年中国华电集团有限公司总部部门招聘12人考试参考试题及答案解析
- 一顶温暖的帽子课件
- 2024年Q1起重机指挥模拟练习题及答案
- 小学冬季安全教育课件
- 交通道路安全法 课件
- 七年级语文阅读理解高分技巧
- 汽车租赁公司安全生产管理制度
- 电子信息工程专业职业发展规划
- 2026年辽宁医药职业学院单招职业倾向性测试题库附答案
评论
0/150
提交评论