《现代大学计算机基础》课件第8章_第1页
《现代大学计算机基础》课件第8章_第2页
《现代大学计算机基础》课件第8章_第3页
《现代大学计算机基础》课件第8章_第4页
《现代大学计算机基础》课件第8章_第5页
已阅读5页,还剩188页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章多媒体信息技术8.1梦幻帝国—多媒体技术概论

8.2音像王国的基石—多媒体技术基础

8.3创建媒体帝国的利刃—经典媒体处理工具

8.1梦幻帝国—多媒体技术概论

8.1.1多媒体和多媒体技术

1.什么是多媒体(Multimedia)

媒体又称媒介、媒质,它的英文是medium(单数)和media(复数)的复合词,指的是用于分发信息和展现信息的手段、方法、工具、设备或装置。

多媒体指将文字、声音、图形、图像、视频等多种媒体集成进计算机,使信息表现声、图、文并茂。

2.什么是多媒体技术

多媒体技术是指以数字化为基础,能够对多种媒体信息进行采集、加工处理、存储和传递,并能使各种媒体信息之间建立起逻辑联系,集成为一个具有良好交互性的系统技术。8.1.2多媒体技术的基本特性

多媒体技术除信息载体的多样化以外,还具有以下的关键特性:

(1)集成性。采用了数字信号,可以综合处理文字、声音、图形、动画、图像、视频等多种信息,并将这些不同类型的信息有机地结合在一起。

(2)交互性。信息以超媒体结构进行组织,可以方便地实现人机交互。换言之,人可以按照自己的思维习惯、按照自己的意愿主动地选择和接受信息,拟定观看内容的路径。

(3)智能性。提供了易于操作、十分友好的界面,使计算机更直观、更方便、更亲切、更人性化。

(4)易扩展性。可方便地与各种外部设备挂接,实现数据交换、监视控制等多种功能。此外,采用数字化信息有效地解决了数据在处理传输过程中的失真问题。

8.1.3多媒体技术的应用与发展

1.多媒体技术的应用

多媒体技术集文字、声音、图像、视频、通信等多项技术于一体,采用计算机的数字记录和传输传送方式,对各种媒体进行处理,具有广泛的用途。

(1)教育与培训。

世界各国的教育学家们正努力研究用先进的多媒体技术改进教学与培训。以多媒体计算机为核心的现代教育技术使教学手段丰富多彩,使计算机辅助教学(CAI)如虎添翼。实践已证明,多媒体教学系统有如下效果:①学习效果好;②说服力强;③教学信息的集成使教学内容丰富,信息量大;④各种媒体与计算机结合可以使人类的感官与想象力相互配合,产生前所未有的思维空间与创造资源。

(2)桌面出版(DesktopPublishing)与办公自动化。

桌面出版物主要包括表格、布告、宣传品、市场图表、蓝图及商品图等。多媒体技术为办公室增加了控制信息的能力和充分表达思想的机会,许多应用程序都是为提高工作人员的工作效率而设计的,从而产生了许多新型的办公自动化系统。由于采用了先进的数字影像和多媒体计算机技术,把文件扫描仪、图文传真机、文件资料微缩系统等和通信网络等现代化办公设备综合管理起来,将构成全新的办公自动化系统。

(3)多媒体通信。

在通信工程中的多媒体终端和多媒体通信也是多媒体技术的重要应用领域之一。当前计算机网络已在人类社会进步中发挥着重大作用。随着“信息高速公路”开通,电子邮件已被普遍采用。多媒体通信有着极其广泛的内容,对人类生活、学习和工作将产生深刻影响的当属信息点播(InformationDemand)和计算机协同工作CSCW系统(ComputerSupportedCooperativeWork)。

信息点播有桌上多媒体通信系统和交互电视ITV。通过桌上多媒体通信系统,人们可以远距离点播所需信息,而交互式电视和传统电视不同之处在于用户在电视机前可对电视台节目库中的信息按需选取,即用户主动与电视进行交互式获取信息。计算机协同工作CSCW是指在计算机支持的环境中,一个群体协同工作以完成一项共同的任务,其应用于工业产品的协同设计制造、远程会诊、不同地域位置的同行们进行学术交流、师生间的协同式学习等。

多媒体计算机+电视+网络将形成一个极大的多媒体通信环境,它不仅改变了信息传递的面貌,带来通信技术的大变革,而且计算机的交互性、通信的分布性和多媒体的现实性相结合,构成了继电报、电话、传真之后的第四代通信手段,向社会提供全新的信息服务。

(4)多媒体电子出版物。

国家新闻出版署对电子出版物定义为“电子出版物,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。”该定义明确了电子出版物的重要特点。电子出版物的内容可分为电子图书、辞书手册、文档资料、报刊杂志、教育培训、娱乐游戏、宣传广告、信息咨询、简报等,许多作品是多种类型的混合。电子出版物的特点主要表现在集成性和交互性,即使用媒体种类多、表现力强、信息的检索和使用方式更加灵活方便,特别是信息的交互性不仅能向读者提供信息,而且能接收读者的反馈。电子出版物的出版形式有电子网络出版和单行电子书刊两大类。

电子网络出版是以数据库和通信网络为基础的新出版形式,在计算机管理和控制下,向读者提供网络联机服务、传真出版、电子报刊、电子邮件、教学及影视等多种服务。而单行电子书刊载体有软磁盘(FD)、只读光盘(CD-ROM)、交互式光盘(CD-I)、图文光盘(CD-G)、照片光盘(Photo-D)、集成电路卡(IC)和新闻出版者认定的其他载体。

(5)多媒体声光艺术品的创作。

专业的声光艺术作品包括影片剪接、文本编排、音响、画面等特殊效果的制作等。

专业艺术家也可以通过多媒体系统的帮助增进其作品的品质,MIDI的数字乐器合成接口可以让设计者利用音乐器材、键盘等合成音响输入,然后进行剪接、编辑、制作出许多特殊效果。

电视工作者可以用媒体系统制作电视节目,美术工作者可以制作卡通和动画的特殊效果。制作的节目存储到VCD视频光盘上,不仅便于保存,图像质量好,价格也已为人们所接受。应用多媒体技术具有以下意义:

(1)使计算机可以处理人类生活中最直接、最普遍的信息,从而使得计算机应用领域及功能得到了极大的扩展。

(2)使计算机系统的人机交互界面和手段更加友好和方便,非专业人员也可以方便地使用和操作计算机。

(3)多媒体技术使音像技术、计算机技术和通信技术三大信息处理技术紧密地结合起来,为信息处理技术发展奠定了新的基石。

多媒体技术发展已经有多年的历史了,到目前为止,声音、视频、图像压缩方面的基础技术已逐步成熟,并形成了产品进入市场,现在热门的技术如模式识别、MPEG压缩技术、虚拟现实技术正在逐步走向成熟,相信不久也会进入市场。

2.多媒体技术的发展趋势

伴随着社会信息化步伐的加快,特别是近年来兴起的全球范围“信息高速公路”热潮的推动,多媒体的发展和应用前景将更加广阔。

(1)分布式、网络化、协同工作的多媒体系统。在当前形式下,有线电视网、通信网和因特网这三网正在日趋统一,各种多媒体系统尤其是基于网络的多媒体系统,如可视电话系统、点播系统、电子商务、远程教学和医疗等将会得到迅速发展。一个多点分布、网络连接、协同工作的信息资源环境正在日益完善和成熟。

(2)三电(电信、电脑、电器)通过多媒体数字技术将相互渗透融合。多媒体技术的进一步发展将会充分地体现出多领域应用的特点,各种多媒体技术手段将不仅仅是科研工作的工具,而且还可以是生产管理的工具、生活娱乐的方式。如欣赏声像图书馆的各种资料、阅读电子杂志、向综合信息中心咨询、电子购物等。另外,还可以采用多媒体信息形式的远程通信,在这种状态下,虽然相距遥远,但其交谈和合作的感受却如同相聚一室。

(3)以用户为中心,充分发展交互多媒体和智能多媒体技术与设备。对于未来的多媒体系统,人类可用日常的感知和表达技能与其进行自然的交互,系统本身不仅能主动感知用户的意图,而且还可以根据用户的需求做出相应的反应,系统本身会具有越来越高的智能性。8.1.4多媒体系统平台

1.什么是多媒体计算机系统

多媒体计算机系统是能对文本、声音、图形、图像等多种媒体进行获取、编辑、存储、处理、加工和表现(输出)的一种计算机系统,包括多媒体硬件系统、多媒体操作系统、媒体处理系统工具和用户应用软件。

(1)多媒体硬件系统:该系统包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。其中,最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片和板卡、光盘驱动器等。

(2)多媒体操作系统:或称为多媒体核心系统(Multimediakernelsystem),具有实时任务调度、多媒体数据转换、多媒体设备的驱动和同步控制,以及图形界面管理等。

(3)媒体处理系统工具:或称为多媒体系统开发工具软件,是多媒体系统的重要组成部分。

(4)用户应用软件:根据多媒体系统终端用户要求而定制的应用软件,或面向某一领域的用户应用软件系统,是面向大规模用户的系统产品。

2.多媒体系统构成

(1)专门设计的多媒体计算机系统。

(2)普通PC机+声卡等多媒体配件=多媒体个人计算机MPC(MultimediaPersonalComputer),如图8.1所示。图8.1多媒体个人计算机

8.2音像王国的基石—多媒体技术基础

8.2.1音频信息处理

1.声音的物理特征

声音一般可通过连续的波形来表示,波形的最大位移也就是振幅反映音量(音高、响度或强度)。波形中连续两个波峰或波谷之间的时间距离称为周期,周期的倒数称为频率。频率用Hz(赫兹)表示,用来反映声音的音调。另外,由于不同材质,不同的环境,所产生的声音所伴随的泛音也不同,所以也就产生了声音的音色特征。响度的大小决定于发声体振动的振幅,音调的高低决定于发声体振动的频率,音色的不同取决于不同的泛音,每一种乐器、不同的人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音决定了其不同的音色,使人能辨别出是不同的乐器甚至不同的人发出的声音。

人的发音器官发出的声音频段在80Hz到3400Hz之间,人说话的信号频率范围为300~3000Hz,有的人将该频段的信号称为语音信号。音质是指声音的品质,主要是衡量声音的上述三方面是否达到一定的水准。即相对于某一频率或频段的音高是否具有一定的强度,并且在要求的频率范围内、同一音量下,各频点的幅度是否均匀、均衡、饱满,频率响应曲线是否平直,声音的音准是否准确,既忠实地呈现了音源频率或成分的原来面目,频率的畸变和相移又符合要求。声音的泛音适中,谐波较丰富,听起来音色就优美动听。

2.音频

1)音频等级

音频(Audio)是指频率在20Hz~20kHz范围内的可听声音,是多媒体信息中的一种媒体类型—听觉类媒体。目前多媒体计算机中的音频主要有波形音频、CD音频和MIDI音乐三种形式(这三种形式全部都是数字音频,因为计算机所能处理的只有数字信号,所以只能以数字化的方式存储音频数据,如果是模拟式的声音,要首先经过抽样、量化和压缩编码等过程形成数字化音频,再由计算机进行存储及其他操作等)。反映数字化音频的质量的因素由采样频率、量化位数和声道数3个参数决定。声道数是指记录声音时,如果每次生成1个声波的数据,称为单声道;每次生成2个声波数据,称为双声道(立体声);每次生成2个以上声波数据,称为多声道(环绕立体声)。

数字音频等级如表8-1所示。表8-1数字音频等级

2)声音的数字化和编码

计算机处理音频信号之前,必须将模拟的声音信号数字化,产生数字音频,具体过程包括采样、量化、编码。图8.2所示为模拟声音信号数字化过程。图8.2模拟声音信号数字化过程如图8.2(b)所示,采样是每间隔一段时间读取一次声音信号幅度,使声音信号在时间上被离散化。

采样频率:指将模拟声音波形数字化时,每秒钟所抽取声波幅度样本的次数,其计算单位是kHz(千赫兹)。一般来讲,采样频率越高声音失真越小,用于存储数字音频的数据量也越大。

奈奎斯特(Nyquist)采样定律:采样频率应大于等于声音信号最高频率的两倍,就能把以数字表达的声音还原成原来的声音。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz;高质量声音采样频率为44.1kHz。量化:就是把采样得到的声音信号幅度转换为数字值,是声音信号在幅度上被离散化,如图8.2(c)所示,量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和

16位。

编码:音频数据压缩编码的方法有多种,可分为无损压缩和有损压缩两大类。无损压缩主要包含各种熵编码;而有损压缩则可分为波形编码、参数编码、感知编码和同时利用多种技术的混合编码,图8.3给出了音频数据压缩编码的主要方法。图8.3音频数据压缩方法分类波形编码是在模拟音频数字化(抽样和量化)的过程中,根据人耳的听觉特性进行编码,并使编码后的音频信号与原始信号的波形尽可能匹配,实现数据的压缩。

参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,且对这些信息编码,最后在输出端合成原始信号。

混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可在较低的码率上得到较高的音质。

音频采样的数据量由两方面因素决定:

(1)音质因素:由采样频率、量化位数和声道数3个参数决定。

(2)时间因素:采样时间越长,数据量越大。

3.音频卡

多媒体计算机系统中都有音频信号处理功能,但实现方法各不相同。美国苹果公司的Macintosh计算机一开始就被设计成具有音频处理能力的多媒体计算机,而使用Windows平台的PC系列机,起初没有声音处理能力,而是通过扩充一个专门的音频处理部件—音频卡来实现其声音处理的。

音频卡的功能:

(1)录制和播放数字声音文件;

(2)控制音量和混音效果;

(3)声音文件的压缩与解压缩;

(4)MIDI接口与音乐合成。

音频卡的组成和外围接口连接如图8.4、图8.5所示。图8.4音频卡的组成框图图8.5音频卡的外围接口连接示意图有的音频卡不再提供Line-Out插孔,一些新的音频卡产品追求功能的简单和较好的音效,所以简化了原来声卡上的MIDI和游戏杆功能,使之成为专门的声音处理部件。

4.音频采集

在Windows2000系统中,提供了录音参数的选择设置功能,其中的音质选择分为CD音质、电话质量、收音质量和DefaultQuality四种,还可以选择不同的采样频率、位宽和声道。为了防止录音过程中出现失真,可通过“音量控制”对话框来检测、调节进入计算机的音源强度。WindowsXP的录音机只能录60s的音频数据,可以借助专业的音频处理软件进行音频录入,不但能够提供不限时长的录入功能,还可以使用不同的编码进行压缩存储。获取音频数据的另外一个方法是从不同的多媒体产品中直接抓取音轨信息,转换并压缩成自己所需的音频格式。一般的音频工具软件都具有直接抓取音乐CD的能力,而另一些软件则可以从更多媒体格式中抓取音轨。

音频编辑一般包括音频内容剪切、合成以及音质和效果的编辑等方面。

(1)多音轨(MultipleTracks);

(2)切边(Trimming);

(3)拼接和组合(SplicingandAssembly;

(4)音量调节(VolumeAdjustments);

(5)格式转换(FormatConversion);

(6)重采样或降低采样率(ResamplingorDownsampling);

(7)渐出和渐隐(Fade-insandFade-outs);

(8)均衡(Equalization);

(9)时间拉伸(TimeStretching);

(10)数字信号处理(DigitalSignalProcessing,DSP)。

5.MIDI

MIDI是MusicalInstrumentDigitalInterface的缩写,译为乐器数字化接口。它规定了电子乐器和多媒体计算机之间进行连接的硬件及数据通信协议,是多媒体计算机所支持的又一种声音产生方法—MIDI方法。

MIDI格式的数字化文件可以看做是乐谱的数字化描述,它记录的是乐器的种类,音阶的高低、长短、强弱、速度等因素,这些被称为MIDI消息,存储为MIDI文件。当需要播放时,从相应的MIDI文件中读出MIDI消息,通过音乐合成器产生相应的声音波形,经过放大后,再由扬声器输出。因为MIDI文件保存的是一系列由MIDI消息组成的“乐谱”,因此MIDI的播放音质是与设备有关的。两台MIDI设备之间可以通过接口发送信息而进行相互通信。一台MIDI设备可以有1~3个端口:

(1) MIDIIn接口—接收来自其他MIDI设备上的MIDI信息。

(2) MIDIOut接口—用来输出本设备生成的MIDI信息。

(3) MIDIThru接口—将从MIDIIn端口传来的信息发送到另一台相连的MIDI设备上。

在进行MIDI通信时,用户可以通过标准的MIDI电缆来相互连接各端口。MIDI电缆由一根屏蔽的双绞线和两端带有插入式的5针D型插头组成,如图8.6所示。图8.6MIDI电缆

MIDI设备还可以配备电子键盘、合成器、音序器(MIDI软件)以及扬声器或音箱等。多媒体计算机与MIDI设备的连接方法如图8.7所示。图8.7多媒体计算机与MIDI设备的连接

MIDI软件(音序器)是用于记录、编辑和播放MIDI文件的一种软件,其作用相当于是MIDI乐器的一台多轨磁带录音机。

声卡播放MIDI音乐最常用的方法有两种,就是FM合成与波表合成。FM是运用声音振荡的原理对MIDI进行合成处理的,但由于技术本身的局限,加上这类声卡大多采用廉价的YAMAHAOPI系列芯片,效果较差。波表(WaveTable)合成的效果较好,它是将各种真实乐器所能发出的所有声音(包括各个音域、声调)录制下来,存储在声卡的ROM中,称为硬波表,播放时,根据MIDI文件记录的乐曲信息向波表发出指令,从表格中逐一找出对应的声音信息,经过合成、加工后回放出来。由于波表采用的是真实乐器的采样,所以效果自然要好于FM。从技术上讲,创作MIDI音乐的过程与将现有的音频数字化的过程完全不同。如果把数字化音频比成位图图像,那么MIDI就可以类比为矢量图形。为了制作MIDI音乐,需要按图8.7的示意构成系统,即多媒体计算机中的声卡需要带一个声音合成器,还要一个作曲软件及一个MIDI键盘,这样才具备创作MIDI乐谱的基础条件。乐谱创作软件能够录制、编辑、打印MIDI乐谱,并播放MIDI音乐。另外,一些乐谱创作软件还能对乐谱进行量化来调节节拍的不一致问题。MIDI编辑中很重要的是选择MIDI乐器,MIDI标准规定了不同的演奏乐器,用0到127之间的编号加以区分。目前,MIDI是为多媒体项目创建原始音乐素材的最佳途径,使用MIDI能够带来您所希望得到的灵活性和创新。手机彩玲就是通过MIDI制作的。

Musitek公司开发的SmartSore软件不仅是一个乐谱创作软件,而且可以用来扫描识别乐谱。SmartSore的基本思想与文字的OCR技术类似:首先通过扫描仪,将乐谱以图像的方式扫描成数字图像,注意扫描参数的选择与设置,分辨率一般选择150~300dpi,图像类型为黑白二值或OCR,扫描后的图片以TIF格式存储;然后通过乐谱识别功能识别出可编辑的数字乐谱,并进行校对、编辑。识别完成后会提示将识别的结果保存为SmartScore专用格式的 .enf文件。

6.MIDI和数字音频的比较

MIDI数据本身并非数字化的声音,它只是利用数字形式对乐谱的速记符号。MIDI文件比数字音频文件尺寸更小,MIDI文档的大小与播放质量完全无关。由于MIDI文件非常小,可以嵌入到网页中,因此下载和播放要比相当的数字音频速度快。在有些情况下,如果使用的MIDI声源质量很高,MIDI将会比数字音频文件听起来更好。MIDI数据是完全可编辑的,可对MIDI音乐的音符、音高、输出设备等很小的乐谱单元作精确编辑和修改。MIDI数据是与设备有关,MIDI音乐文件制作的声音也依赖于特定的回放设备。数字音频与播放设备无关,需要较大的数据存储空间。由于MIDI数据并不表示实际的声音,而是音乐设备的声音,因此只要MIDI的播放设备与制作MIDI时使用的设备不一样,就无法保证播放的最佳效果。采用MIDI无法表示语音信号。

采用数字音频还有两个经常起决定性作用的原因:

(1) Macintosh和Windows平台为数字音频提供了更多的应用软件和系统支持。

(2)创建数字音频的准备和编程并不需要具备音乐理论的专业知识,但是处理MIDI数据不但需要了解音频制作,而且需要对音乐乐谱、键盘和音符有所了解。

7.相关工具介绍

(1)音频制作软件。

音频制作软件主要完成MIDI乐谱的制作、编辑等功能。常见的有CakewalkSonar、LogicAudio、BandinaBox、GuitarPro等。

①CakewalkSonar:具备MIDI、音频、音源(合成器)的一体化制作能力。

②LogicAudio:提供多项高级MIDI和音频的录制和编辑、专业品质的采样音源(EXS24)和模拟合成器(ESI)。

③BandinaBox:“傻瓜式”MIDI制作软件,适合于缺乏系统的作曲、配器训练、非专业、要求不高的电脑音乐爱好者和入门者选用。④GuitarPro:MIDI制作、吉他六线谱、BASS四线谱绘制、打印软件。在用MIDI制作吉他、BASS等弹拨乐器的滑音、推弦等方面,具有绝对的优势。这款软件操作简单、容易上手,可作为计算机音乐、MIDI制作时的辅助软件来使用。

(2)音频处理类软件。

音频处理类软件主要完成对数字音频的录音采集、剪辑、效果处理以及格式转换等功能。常见的有CoolEditPro、SoundForge、Samplitude、T-RackS、Nuendo、VegasAudio、WaveLab、UleadAudioEditor等。①CoolEditPro

可以在普通声卡上同时处理64轨的音频信号,具有极丰富的音频处理效果,并能进行实时预览和多轨音频的混缩合成,是个人音乐工作室的音频处理首选

软件。

②SoundForge:一款音频录制、处理软件。

③Samplitude:专业级别的多轨音频录制、处理、混缩软件,支持24bit、96kHz的高采样率,支持无限轨超级缩混,更重要的是采用了精确独特的内部算法。

④T-RackS:一款处理成品音频的音频修饰类软件,可以将“粗制滥造”的音频修饰的焕然一新,极具专业水准。⑤Nuendo:一款集MIDI、音频、混音等功能于一体的音乐软件,支持视频5.1环绕立体声的制作,功能强大,品质超群。

⑥VegasAudio:一款多轨音频处理软件。该软件操作简便,极易上手。

此外,音乐制作、音频处理类软件还有很多,比如自动伴奏(编曲)软件、鼓机软件、打谱软件、舞曲软件、音色采样软件、音色拼接软件、识别、转换软件等。

(3)音频剪辑软件。

音频剪辑软件主要用在裁剪空白和拼接组合等方面,主要的处理方法与文本内容处理类似,即使用选择(定义区域)、复制(或剪裁)、粘贴的基本方法。操作过程为,先用不同的方法选择一段要复制或裁剪的音频,然后选中主菜单Edit的Cut或Copy进行剪切或复制。最后,选定要粘贴的准确位置,再选择Edit菜单中的Paste完成粘贴工作。

(4)放大、缩减、去噪类软件。

该类工具软件用于对数字音频的播放效果进行处理。当需要缩放音量时,首先选定一段音频,然后选择Effect菜单中的Amplify命令,适当调整音量放大百分数,就可以实现音量的放大与减小。去噪是通过拖动滚动条来实现的,范围为1%~100%。数值越小表示去噪越精细;调整到100%,则表示把选定的一段音频静音。

(5)渐变效果处理软件。

淡入、淡出是数字音频处理最常见的效果,它是通过音量的逐渐增强和逐渐减小来实现的。当需要对某段音频添加渐变效果时,可首先选定这段音频,然后打开Effect菜单中的Fade菜单项,选择(淡入、淡出)或自定义一种渐变效果,同时选择、调整渐变关系,就可得到满意的渐变效果。

(6)其他效果处理。

在AudioEditor中提供了比如Reverse(反向)、Invert(倒转波形)、Speed(调整音频播放速度)、Echo(回声效果)以及DirectXAudio和AudioEffectDMO等效果处理功能。其中,DirectXAudio包含了一组由SONY和Cakewalk提供的约40多种不同效果,而AudioEffectDMO则包含了微软提供的9种效果。

(7)声音格式转换。

声音格式转换指在编辑过程中,对音频采样参数的改变。AudioEditor中提供了这种改变声音采样参数的功能。当需要时可以选择Edit菜单中的ConvertTo命令,通过在ConvertTo对话框中选择合适的采样参数来实现声音格式的改变。

(8)合并与混合处理。

合并是指将不同的单声道信息合并成时间上重叠的多声道音频,最后可用一个多声道文件保存。合并的对象必须是对两个单声道的音频文件。混合是将两个文件的声音混合成一个文件,混合前文件为单声道,混合后的文件仍然是单声道。混合时需要调节音量比例。

8.音频编/解码详述

数字音频信息的压缩主要是依据音频信息自身的相关性以及人耳对音频信息的听觉冗余度。音频信息在编码技术中通常分成两类来处理,分别是语音和音乐,各自采用的技术有差异。现代声码器的一个重要的课题是,如何把语音和音乐的编码融合起来。

1)语音编码

语音编码技术又分为三类:波形编码、参数编码以及混合编码(圴属于无损压缩)。波形编码:波形编码是在时域上进行处理,力图使重建的语音波形保持原始语音信号的形状,它将语音信号作为一般的波形信号来处理,具有适应能力强、话音质量好等优点,缺点是压缩比偏低。该类编码的技术主要有非线性量化技术、时域自适应差分编码和量化技术。非线性量化技术利用语音信号小幅度出现的概率大而大幅度出现的概率小的特点,通过为小信号分配小的量化阶,为大信号分配大的量化阶来减少总量化误差。我们最常用的G.711标准用的就是这个技术。自适应差分编码是利用过去的语音来预测当前的语音,只对它们的差进行编码,从而大大减少了编码数据的动态范围,节省了码率。自适应量化技术是根据量化数据的动态范围来动态调整量阶,使得量阶与量化数据相匹配。G.726标准中应用了这两项技术,G.722标准把语音分成高、低两个子带,然后在每个子带中分别应用这两项技术。

参数编码:利用语音信息产生的数学模型,提取语音信号的特征参量,并按照模型参数重构音频信号。它只能收敛到模型约束的最好质量上,力图使重建语音信号具有尽可能高的可懂性,而重建信号的波形与原始语音信号的波形相比可能会有相当大的差别。这种编码技术的优点是压缩比高,但重建音频信号的质量较差、自然度低,适用于窄带信道的语音通信,如军事通信、航空通信等。美国的军方标准LPC-10就是从语音信号中提取出来反射系数、增益、基音周期、清/浊音标志等参数进行编码的。MPEG-4标准中的HVXC声码器用的也是参数编码技术,当它在无声信号片段时,激励信号与CELP(码激励线性预测编码)相似,都是通过一个码本索引和通过幅度信息描述;在发声信号片段时则应用了谐波综合,它是将基音和谐音的正弦振荡按照传输的基频进行综合。混合编码:将上述两种编码方法结合起来,采用混合编码的方法,可以在较低的数码率上得到较高的音质。它的基本原理是合成分析法,将综合滤波器引入编码器,与分析器相结合,在编码器中将激励输入综合滤波器产生与译码器端完全一致的合成语音,然后将合成语音与原始语音相比较(波形编码思想),根据均方误差最小原则,求得最佳的激励信号,然后把激励信号以及分析出来的综合滤波器编码送给解码端。这种得到综合滤波器和最佳激励的过程称为分析(得到语音参数);用激励和综合滤波器合成语音的过程称为综合。由此我们可以看出,CELP编码把参数编码和波形编码的优点结合在了一起,使得用较低码率产生较好的音质成为可能。通过设计不同的码本和码本搜索技术,产生了很多编码标准,目前我们通信中用到的大多数语音编码器都采用了混合编码技术。例如,在互联网上的G.723.1和G.729标准,在GSM上的EFR、HR标准,在3GPP2上的EVRC、QCELP标准,在3GPP上的AMR-NB/WB标准等等。

2)音乐编码

音乐编码主要有自适应变换编码(频域编码)、心理声学模型和熵编码等技术(均属于有损压缩)。

自适应变换编码:利用正交变换,把时域音频信号变换到另一个域,由于去相关的结果,变换域系数的能量集中在一个较小的范围,所以对变换域系数最佳量化后,可以实现码率的压缩。理论上的最佳量化很难达到,通常采用自适应比特分配和自适应量化技术来对频域数据进行量化。在MPEGlayer3和AAC标准及DolbyAC-3标准中都使用了改进的余弦变换(MDCT);在ITUG.722.1标准中则用的是重叠调制变换(MLT)。本质上它们都是余弦变换的改进。心理声学模型:其基本思想是对信息量加以压缩,同时使失真尽可能不被觉察出来,利用人耳的掩蔽效应就可以达到此目的,即较弱的声音会被同时存在的较强的声音所掩盖,使得人耳无法听到。在音频压缩编码中。利用掩蔽效应,就可以通过给不同频率处的信号分量分配以不同的量化比特数的方法来控制量化噪声,使得噪声的能量低于掩蔽阈值,从而使得人耳感觉不到量化过程的存在。在MPEGlayer2、3和AAC标准及DolbyAC-3标准中都采用了心理声学模型,在目前的高质量音频标准中,心理声学模型是一个最有效的算法模型。熵编码:根据信息论的原理,可以找到最佳数据压缩编码的方法,数据压缩的理论极限是信息熵。如果要求编码过程中不丢失信息量,即要求保存信息熵,这种信息保存编码叫熵编码,它是根据信息出现概率的分布特性而进行的,是一种无损数据压缩编码。常用的有霍夫曼编码和算术编码。在MPEGlayer1、2、3和AAC标准及ITUG.722.1标准中都使用了霍夫曼编码;在MPEG4BSAC工具中则使用了效率更高的算术编码。

3)数字音频编码的主要应用

对数字音频信息的编码进行压缩的目的,是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量:

①比特率;

②主观/客观的语音质量;

③计算复杂度和对存储器的要求;

④延迟;

⑤对于通道误码的灵敏度;

⑥信号的带宽。由于不同的应用,人们对数字音频信息的要求是不同的,并且在选择数字音频信息编码所采用的技术时也需要了解人们对音频信息的各种应用。目前数字音频信息处理技术主要应用于以下几个方面:

(1)消费电子类数字音响设备。CD唱机、数字磁带录音机(DAT)、MP3播放机以及MD(MiniDisc)唱机已经广泛地应用了数字音频技术。

(2)广播节目制作系统。在声音节目制作系统,如录音、声音处理加工、记录存储、非线性编辑等环节使用了数字调音台、数字音频工作站等数字音频设备。

(3)多媒体应用。在多媒体上的应用体现在VCD、DVD、多媒体计算机以及Internet。VCD采用MPEG-1编码格式记录声音和图像;DVD-Audio格式支持多种不同的编码方式和记录参数,可选的编码方式包括无损的MLP、DSD、DolbyAC-3、MPEG2-layer2Audio等,而且是可扩充的、开放的,并可以应用未来的编码技术;Internet上采用MP3的音频格式传输声音,以提高下载能力。

(4)广播电视数字化。在广播电视和数字音频广播系统中,声音编码采用MUSICAM编码方法,符合MPEG-1Layer1高级音频编码。如当今的数字电视采用的音频标准就是DolbyAC-3和MPEG-layer2。

(5)通信系统。在通信系统中,必须对音频进行压缩。传统的PSTN电话中采用的是G.711和G.726的标准;GSM移动通信采用的是GSMHR/FR/EFR标准;CDMA移动通信采用的是3GPP2EVRC、QCELP8k、QCELP16k、4GV标准;WCDMA第3代移动通信采用的是3GPPAMR-NB、AMR-WB标准。另外在IPTV和移动流媒体中,采用的是AMR-WB+和AAC的标准。总之,根据应用场合的不同,可以将数字音频编码分为如下两种编码:

语音编码:针对语音信号进行的编码,主要应用于实时语音通信中减少语音信号的数据量。典型的编码标准有ITU-TG.711、G.722、G.723.1、G.729;GSMHR、FR、EFR;3GPPAMR-NB、AMR-WB;3GPP2QCELP8k、QCELP13k、EVRC、4GV-NB等。

音频编码:针对频率范围较宽的音频信号进行的编码,主要应用于数字广播和数字电视广播、消费电子产品、音频信息的存储和下载等。典型的编码有MPEG1/MPEG2的layer1、2、3和MPEG4AAC的音频编码。还有最新的ITU-TG.722.1、3GPPAMR-WB+ 和3GPP24GV-WB,它们在低码率上的音频表现也很不错。

4)音频编码标准发展现状

(1)语音编码标准发展现状。

国际电信联盟(ITU)主要负责研究和制定与通信相关的标准,作为主要通信业务的电话通信业务中使用的语音编码标准均是由ITU负责完成的。其中用于固定网络电话业务使用的语音编码标准如ITU-TG.711等主要在ITU-TSG15完成,并广泛应用于全球的电话通信系统之中。随着Internet网络及其应用的快速发展,在2005年到2008年研究期内,ITU-T将研究和制定变速率语音编码标准的工作转移到主要负责研究和制定多媒体通信系统、终端标准SG16中。在欧洲、北美、中国和日本的电话网络中通用的语音编码器是8位对数量化器(相应于64 kb/s的比特率)。该量化器所采用的技术在1972年由CCITT(ITU-T的前身)标准化为G.711。

在1983年,CCIT规定了32Kb/s的语音编码标准G.721,其目标是在通用电话网络上的应用(标准修正后称为G.726)。这个编码器价格虽低但却提供了高质量的语音。

至于数字蜂窝电话的语音编码标准,在欧洲,TCH-HS是欧洲电信标准研究所(ETSI)的一部分,由他们负责制定数字蜂窝标准。在北美,这项工作是由电信工业联盟(TIA)负责执行。在日本,由无线系统开发和研究中心(称为RCR)组织这些标准化的工作。此外,国际海事卫星协会(Inmarsat)是管理地球上同步通信卫星的组织,也已经制定了一系列的卫星电话应用标准。

(2)音频编码标准发展现状。

音频编码标准主要由ISO的MPEG组来完成。MPEG1是世界上第一个高保真音频数据压缩标准。MPEG1是针对最多两声道的音频而开发的。但随着技术的不断进步和生活水准的不断提高,有的立体声形式已经不能满足听众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。目前有两种主要的多声道编码方案:MUSICAM环绕声和DolbyAC-3。MPEG2音频编码标准采用的就是MUSICAM环绕声方案,它是MPEG2音频编码的核心,是基于人耳听觉感知特性的子带编码算法。而美国的HDTV伴音则采用的是DolbyAC-3方案。MPEG2规定了两种音频压缩编码算法,一种称为MPEG2后向兼容多声道音频编码标准,简称MPEG2BC;另一种称为高级音频编码标准,简称MPEG2AAC,因为它与MPEG1不兼容,也称MPEGNBC。

MPEG4的目标是提供未来的交互多媒体应用,它具有高度的灵活性和可扩展性。与以前的音频标准相比,MPEG4增加了许多新的关于合成内容及场景描述等领域的工作。MPEG4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,并在诸多领域内给予高度的灵活性。具有我国自主知识产权的广晟数码数字音频编/解码算法(简称广晟数码音频技术,DRATM),是可以同时支持立体声和多声道环绕声的数字音频编/解码技术。其算法的特点是采用自适应时频分块(ATFT)方法实现对音频信号的最优分解,进行自适应量化和熵编码。另外,由多家研究所、大学组成的中国音视频编码技术委员会(AVS)目前正在研究制定AVS第2部分音频标准,并已经申请了部分专利。AVS音频标准的指导原则是:在基本解决知识产权问题的前提下,制定具有国际先进水平的中国音频编码/解码标准,使AVS音频编码的综合技术指标基本达到或超过MPEGAAC编码技术的指标。目前正在开展移动部分AVS-M的音频标准制定工作。

(3)常见的音频文件格式。

RIFF(ResourceInterchangeFileFormat,资源交换文件格式)是在多媒体编程接口的规范,.wave文件是其中的一种格式。波形文件由许多不同类型的文件构造块组成,其中最主要的两个文件构造块是格式块(FormatChunk)和声音数据块(SoundDataChunk),格式块包含有描述波形的重要参数,例如采样频率和样本精度等;声音数据块则包含有实际的波形声音数据。

★WAVE(扩展名为WAV):该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。★MOD(扩展名MOD、ST3、XT、S3M、FAR、669等):该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确、音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐淘汰,目前只有MOD迷及一些游戏程序中尚在使用。

★MPEG-3(扩展名MP3):现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。

★RealAudio(扩展名RA):这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。★CreativeMusicalFormat(扩展名CMF):Creative公司的专用音乐格式,和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。

★CDAudio音乐CD(扩展名CDA):唱片采用的格式,又叫“红皮书”格式,记录的是波形流,绝对的纯正、HIFI。但缺点是无法编辑,文件长度太大。★MIDI(扩展名MID):目前最成熟的音乐格式,实际上已经成为一种产业标准,其科学性、兼容性、复杂程度等各方面当然远远超过本文前面介绍的所有标准(除交响乐CD、UnplugCD外,其他CD往往都是利用MIDI制作出来的),它的GeneralMIDI就是最常见的通行标准。作为音乐工业的数据通信标准,MIDI能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果,而且文件的长度非常小。总之,如果有专业的音源设备,那么要听同一首曲子的HIFI程度依次是:

原声乐器演奏→MIDI→CD唱片→MOD→所谓声卡上的MIDI→CMF,而MP3及RA要看它的节目源是采用MIDI、CD还是MOD了。

另外,在多媒体材料中,存储声音信息的文件格式也是需要认识的,共有WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干种。★WAV文件:Microsoft公司的音频文件格式,它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样,可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。MicrosoftSoundSystem软件SoundFinder可以转换AIFSND和VOD文件到WAV格式。

★VOC文件:Creative公司波形音频文件格式,也是声霸卡(soundblaster)使用的音频文件格式。每个VOC文件由文件头块(headerblock)和音频数据块(datablock)组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据静音标识、终止标志及扩展块等。★MIDI文件:MusicalInstrumentDigitalInterface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,以规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符定时和多达16个通道的乐器定义,每个音符包括键通道号、持续时间音量和力度等信息。所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。

★RMI文件:Microsoft公司的MIDI文件格式,它可以包括图片标记和文本。★PCM文件:模拟音频信号经模/数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR程序为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。

★AIF文件:Apple计算机的音频文件格式。Windows的Convert工具同样可以把AIF格式的文件换成Microsoft的WAV格式的文件。

5)数字音频编码技术的发展趋势

(1)语音编码技术的发展趋势。

经过多年的努力,业界在语音编码领域取得了很多重要的进展。目前在语音编码领域的研究焦点主要有两个:

①在保证语音质量的前提下,降低比特率。在采用的技术方面,从基于线性预测,使用分析法,向采用参数编码技术方向转变。语音编码主要的应用目标是蜂窝电话和应答机。

②对传统的语音编码器进行全频带扩展,使其适应音频的应用。例如,AMR从NB发展到WB,再到最新的WB+,现正在进行全频带的扩展工作;由G.729发展到G.729.1。除此之外,为适应在Internet上传送语音的需要,ITU-TSG16组正在研究和制定可变速率的语音编码标准。变速率的语音编码将是近期语音编码发展的一个趋势。

(2)音频编码技术的发展趋势。

MPEG4的研究已经开始了一段时间,也取得了一些进展,但由于MPEG4本身设定的目标比较远大,一些能力仍然在研究之中。随着以IPTV业务为代表的信息检索业务的开展,适合于在IP网络上传输的音频信号编码技术,用于制作、检索和存储音频信息的技术将成为发展的方向。8.2.2图形与图像信息处理

图形图像技术与应用是工业造型、视觉传达、平面设计、室内设计、建筑设计和多媒体技术等专业的一项基本技能。图形、图像是一种人类视觉所感受到的具象化的信息,一幅图片可以形象、生动和直观地表达大量的信息,具有文字和声音无可比拟的优点。图形、图像包含了比文字描述更为丰富、多样,因而也更为完备的信息量。人类对于图形、图像信息具有一目了然的快速吸收能力。18世纪,瑞士著名数学家欧拉从数学的实践中总结出“千言万语不如一张图”这句至理名言。欧拉这句名言对于我们学习图像制作的指导意义在于,图像制作不应该仅仅是对言语的诠释,而应该突破言语的樊笼,创造视觉形象的全新境界。总之,文字媒体引导人们通过逻辑思维给人以直观的切身感受。20世纪下半叶又进入了视觉形象的时代,这是人类历史螺旋发展的一个新台阶。

图形图像技术是一门集图形、图像、动画、视频等信息处理的技术,它可以通过外部设备接收外部的图形和图像等信息,经过计算机加工处理后,以图形或图像等多种形式输出,实现输入和输出方式的多元化,改变了计算机早期只能处理文字、数据的局限,使人们的工作和生活更加丰富多彩。对于计算机来说,图形和图像是两种很不相同的媒体,图形学和图像处理技术在计算机发展初期是两门相对独立的学科。然而,图形与图像在很多场合下又是很难区分的。随着多媒体技术的飞速发展,图形与图像的结合日益紧密。图像软件往往包含图形绘制功能,而图形软件又常常具备图像处理功能。

1.图像的分类

在计算机中的图像都是以数字的方式进行记录、处理和存储的,所以图像也可以说成是数字化图像。计算机生成的图形图像主要分为两类:一类为矢量图形,另一类为位图图像,如图8.8所示。图8.8矢量图形与位图图像

(1)矢量图形。矢量图形(也称为向量图形)是由数学方程所定义的直线和曲线组成。矢量图形与分辨率无关,可以将它们进行任意缩放也不会失真。

(2)位图图像。位图图像(也称为点阵图像)是由许多点组成的,其中的每一个点称为像素,每个像素可以具有不同的颜色和亮度,它是组成位图图像的基本单位。位图图像精细程度取决于图像的分辨率,并且处理也比较简单方便,但它的最大缺点是:图像文件保存的是组成位图的各像素点的颜色信息,颜色的种类越多,图像文件越大。在将图像文件放大、缩小和旋转时,会产生失真。

2.图形和图像之间的关系

(1)矢量图形的基本元素是图元,也就是图形指令。而位图图像的基本元素是像素,其显示要更加逼真一些。

(2)图形的显示过程是按照图元的顺序进行的,而图像的显示过程是按照位图图像中所安排的像素顺序进行的,与图像内容无关。

(3)图形缩放变换后不会发生变形失真,而图像的变换则会发生失真。

(4)图形能以图元为单位单独进行修改、编辑等操作,且局部处理不影响其他部分,而图像则不行。因为在图像中没有关于图像内容的独立单位,只能对像素或像素块进行

处理。

(5)图形实际上是对图像的抽象,而这种抽象可能会丢失原始图像的一些信息(可能对应用有用,也可能对应用无用)。

通过软件,矢量图可以转化为位图,而位图转化为矢量图就需要经过复杂的数据处理,而且生成的矢量图的质量不能和原来的图像比拟。对位图图像和矢量图形综合起来看,位图适合处理颜色变化复杂、细致的图案,可以充分发挥其颜色表现力,如照片、招贴画等,适合处理图案图像;矢量图则适合处理颜色变化较少、以几何图案为主的简洁明快的图案,可以充分发挥其线条表现力和文件较小的特点,如计算机辅助设计(ComputerAidedDesign,CAD)、计算机辅助制造、计算机动画(建模阶段)、创意设计、可视化科学计算、地形地貌和自然资源模拟以及卡通画等领域。

3.颜色模式

颜色模式是指同一属性下的不同颜色的集合。不同的颜色模式对颜色的表现会有较大差异。常见的颜色模式有位图模式、灰度模式、RGB模式、CMYK模式、SHB模式和Lab模式等。

(1)位图模式。该模式用两种颜色(黑和白)来表示图像中的像素。位图模式的图像也称为黑白图像。要想将其他模式转换为位图模式,应先转换为灰度模式,再转换为位图模式。

(2)灰度模式。该模式可以使用多达256级灰度来表现图像,使图像的过渡更平滑细腻。灰度图像的每个像素有一个0(黑色)到255(白色)之间的亮度值。当一个彩色图像被转换为灰度模式时,所有的颜色信息都将从图像中除去。

(3)RGB颜色模式。该模式是色光的色彩模式。将红(Red)、绿(Green)和蓝(Blue)三种基色按照从0(黑)到255(白色)的亮度值在每个色阶中分配,从而指定其色彩。当不同亮度的基色混合后,便会产生出256×256×256种颜色,约为1670万种。由于RGB是由三种色彩叠加形成了其他色彩,所以,这种色彩模式是一种加色模式。

(4)CMYK颜色模式。该模式是一种印刷模式。其中四个字母分别指青(Cyan)、洋红(Magenta)、黄(Yellow)、黑(Black),在印刷中代表四种颜色的油墨。CMYK模式在本质上与RGB模式没有什么区别,只是产生色彩的原理不同,在RGB模式中由光源发出的色光混合生成颜色,而在CMYK模式中由光线照到物体上时,这个物体将吸收一部分光线,并将剩下的光线进行反射,反射的光线就是物体的颜色。CMYK模式是一种减色模式。

(5)HSB模式。该模式是基于人眼对色彩的观察来定义的,在此模式中,所有的颜色都用色相、饱和度和亮度三个特性来描述。

(6)Lab模式。该模式是由国际照明委员会(CIE)于1976年公布的一种色彩模式。Lab颜色模式是以一个亮度分量L及两个颜色分量a和b来表示颜色的。其中L的取值范围是0~100,a分量代表由绿色到红色的光谱变化,而b分量代表由蓝色到黄色的光谱变化,a和b的取值范围均为 -120~120。

Lab模式所包含的颜色范围最广,它解决了由于使用不同的显示器或打印设备所造成的颜色复制的差异,也就是说,与光线及设备无关。彩色模式的色域如图8.9所示。图8.9彩色模式的色域示意图

4.常用图像文件格式

图形的生成算法以及曲线构成的理论等对于非专业用户来说过于复杂,没有必要细加研究。我们需要了解的是常用的图形文件有哪些格式,这些不同的格式分别对应哪些图形软件,相互之间如何转换等。要特别注意的是,图形文件总是与图形软件一一对应的,这是因为图形文件中存储的是生成图形的算法序号,而每一种图形软件的生成算法是完全不同的。

(1)AdobeIllustrator(.ai)。Adobe公司的Illustrator图形软件是多媒体图形软件的先驱,该软件于1987年推出,率先在文件层面上实现了图形与图像的集成,从而开创了多媒体时代图形软件的新纪元。Adobe公司支持的 .eps格式是一种跨平台的文件格式,与应用软件无关,与系统平台无关,甚至还与硬件无关。也就是说,在计算机中的 .eps格式文件,可以直接送到印刷机输出,而无须作任何转换。

Illustrator除了处理.ai格式和.eps格式文件以外,还可以处理其他格式的图形文件格式,Illustrator的导入功能包含在打开命令中,在打开和导入文件格式列表中,文本、图形和图像等不同类型的文件都罗列其间,例如有Text、Word、MSRTF、AcrobatPDF、Photoshop等软件可处理的文件格式。

(2)MacromediaFreeHand(.fh8)。Macromedia公司的FreeHand图形软件则着重于图形与文本的集成,该软件在图形软件基本功能的基础上,最大限度地扩展了文本处理功能,真正做到了多媒体意义上的图文并茂。FreeHand的本位格式文件的扩展名为.fhn,这里n是版本号,.fh8就是版本8的文件格式。与Illustrator一样,FreeHand除了处理本位格式 .fhn文件以外,还可以通过导入的方式来处理其他格式的文件。

(3)CorelDRAW(.cdr)。加拿大软件公司Corel公司的图形软件DRAW于1989年推出,该软件在功能集成方面后来居上,在图形图像专业软件领域中遥遥领先,业界称为“矢量之王”。CorelDRAW集成了图形、图像、文本以及排版等功能,为真正实现计算机图像制作的软件平台一体化迈出了坚实的一步。CorelDRAW的本位格式是 .cdr,跟所有的图形软件一样,也具备向下兼容的特性,目前已经升级到了版本12。CorelDRAW除了处理 .cdr文件之外,还可以通过导入的方式来处理其他格式的各类文件。

(4)3DSMax。这是Autodesk公司推出的三维建模、渲染、动画制作软件,其基本设计思想是通过建模完成对物品的形状设计,通过材质的选择和编辑实现物品的质感设计,通过光源类型的选择和灯光调整赋予物品适当的视觉效果,最后通过渲染完成物品的基本设计。

(5)AutoCAD。这是Autodesk公司推出的一个基于矢量绘图的更为专业化的计算机辅助设计软件,广泛应用于建筑、城市公共基础设施、机械等设计领域。图8.10给出了两张矢量工具绘制图片。图8.10矢量工具绘制图片

5.图像分辨率及常见图像文件格式

1)分辨率

(1)图像分辨率:指图像文件中保存的图像网格采样点数,显示实际包含的图像信息量,一般用像素(Pixel)表示。分辨率越高,图像就越清晰。

(2)屏幕分辨率:每屏所包含的像素来表示。通常取决于显示器以及显示卡的类型。屏幕分辨率是屏幕横向包含的像素点数乘以纵向包含的像素点,例如有640×480、800×600、1024×768像素等。

(3)扫描分辨率:用每英寸中所包含的采样点数(dotperinch)来表示。扫描仪的分辨率分为光学分辨率和输出分辨率。

(4)光学分辨率:是硬件技术指标,是扫描仪真正能扫描到的分辨率。常见的为800~3200dpi等。

(5)输出分辨率:是经过软件强化以及插值补点之后所产生的分辨率,大约为光学分辨率的3~4倍。

(6)打印分辨率:用每英寸中所打印的点数(dpi)来表示。一般24针的针式打印机可达180dpi,喷墨打印机则为300~720dpi,激光打印机的分辨率可达600~1200dpi。

2)图像文件格式

图像文件格式是千变万化的,主要由两方面的因素互动的结果,首先是压缩算法的因素,其次就是色彩的表示方法。下面介绍一些常用的图像文件格式。

(1)PSD:Photoshop软件的本位格式,兼容所有的图像类型,支持16种额外通道和基于向量的路径。用PSD格式存盘,保存的图像信息最完整,同时所占据的硬盘存储容量也最大。

(2)BMP:Microsoft公司定义的Bitmap格式是一种与设备无关的图像格式,采用索引色。兼容DOS、Windows、WindowsNT和OS/2,不兼容Macintosh。通常的Windows格式是不压缩的,相同的分辨率就有相同的文件大小,与图像所含的视觉内容无关。与PSD格式相比,BMP格式没有通道、路径等附加信息,所占据的硬盘存储容量也就小许多。

(3) GIF(GraphicsInterchangeFormat,图像互换格式):是CompuServe公司制定的图像存储规范,文件小,兼容索引色、线画稿和灰度类型。GIF采用Hash散列压缩编码,压缩率较高,同样的图像内容,用GIF格式要比用PSD格式小20倍。除了压缩效率高之外,GIF格式的另一个特点是动画格式的兼容性。因此,GIF格式是网页设计的最佳选择。

(4)JPG:是JPEG图像格式的扩展名。JPEG(JointPhotographicExpertsGroup)直译为联合图片专家组。从1980年开始,国际标准化组织ISO和国际电话电报咨询委员会CCITT联合进行了视频压缩的标准化研究,历时10年,于1991年完成了JPEG标准。JPG格式的特点是在保持图像的高精度的前提下,获得高压缩比,这是GIF格式所望尘莫及的。专业摄影师一般都采用JPG格式,与PSD格式相比,JPG格式只占十几分之一。互联网上高精度的图像也都是JPG格式。用Photoshop制作图像时,一般情况下,制作的中间过程用PSD格式保存,最后完成稿则用JPG格式保存,这样的做法有利于节省存储空间。总体上说,对于低压缩率高质量的图片使用JPG文件是一个恰当的选择。

(5)TIFF(TaggedImageFileFormat):是由Aldus公司和Microsoft联合开发的一种24位图像格式。它具有可移植性好的优点,兼容多种平台,如Macintosh、UNIX等。描述图像的细微层次信息量大,包含特殊信息阿尔法通道,允许所有操作,有利于原稿阶调和色彩复制。TIFF采用哈夫曼行程编码。与PSD格式相比,TIFF格式的兼容性特别好,比如,3DSMAX/VIZ只认得TIFF格式的通道信息。

(6)EPS(EncapsulatedPostScript):该格式在文件层面上实现了图形与图像的集成,是一种跨平台的文件格式,与应用软件无关,与系统平台无关,甚至还与硬件无关。也就是说,在计算机中的EPS格式文件可以直接送到印刷机输出,而无须作任何转换。印刷排版行业多用此格式。

(7)PCX:是Xsoft公司的专用格式,适用于索引色和线画稿,有多种版本。Photoshop支持PCXV.5。PCX采用扫描线行程压缩编码。

(8)TGA(Targa):TrueVision的专用显示卡定义,是一种24位图像格式,兼容Macintosh。

6.常见的图像处理技巧

(1)图像变换:快速傅里叶变换(FFT)、离散余弦变换(DCT)、霍特林变换(HT)、哈达马变换(HadamardTransform)。

(2)图像编码:微分脉冲编码(DPC)、线性预测编码(LDC)、行程编码(RLE)、哈夫曼编码(HuffmanCode)。

(3)图像复原:线性算子复原法、反向滤波器、最小二乘法。

(4)图像增强:对比度扩展法(锐化)、邻域平均法(平滑)、同态滤波(模型化)。

(5)彩色表示:标准色度学模型、孟塞尔表色法、色光加色法、色料减色法、色相分量法。

(6)分割描述:点相关、区域相关、拓扑描述(区域)、关系描绘(串文法)、测度描述。

这些算法的基本原理、设计细节和实现方法等,要具备相当的数理基础才能搞懂,对于图像制作软件应用者来说,没有必要深入探讨。从应用的层面归纳起来,这些图像处理技术可以概括为以下几个方面。

(1)像质改善:图像增强、锐化、平滑、校正、图像整饰、色彩处理。

(2)图像分析:边缘检测、区域分割、特征抽取、纹理分析、图像匹配、模式识别。

(3)图像重建:通过对离散图像进行线性空间内查获线性空间滤波来重新获得连续图像。

(4)数据压缩:图像数字化、图像压缩编码、图像分形技术、图像小波理论。多年来,图像处理与图形学两者独立发展、互不相干。但从20世纪90年代以后,出现了图像生成技术与图像处理相结合的趋势,这种趋势不仅反映在基于图像的实时动态绘制技术中,而且突出地表现在科学计算可视化这一新兴领域中。科学计算可视化是将科学计算过程中的数据及结果数据转换为图像,实际上也包括了工程计算可视化和测量数据可视化,其核心是三维数据场的可视化。这一技术可以应用于气象预报、石油地质勘探、环境保护、核爆炸模拟、计算流体力学、天体物理及医学等许多领域。图像处理是三维数据场可视化的重要组成部分。8.2.3动画、视频信息处理

1.什么是动画

动画的英文Animation源自于拉丁文字根的anima,意思为灵魂,动词animare是赋予生命,引申为使某物活起来的意思,所以animation可以解释为经由创作者的安排,使原本不具生命的东西像获得生命一般地活动。

动画是通过连续播放一系列由人工或计算机绘制的连续图像或图形画面,给视觉造成连续变化的图画。它包括了造型动画和帧动画。造型动画是通过改变画面物体的坐标来实现运动的;帧动画是一系列画面,其中对需要动作的地方作了微小变化,当它们连续以每秒15帧以上速度播放时,人就感到像运动起来。

2.什么是视频

视频则是使用摄像设备获取的自然人物和景物,并拍成连续的帧图像,并以一定的速度连续进行播放。

3.动画与视频的关系

若干幅位图快速地连续播放就构成了视频,而矢量图形连续变化就构成了一个动画。在实际工作中,这两个词语有时并不是严格区分的,比如说如果用Flash制作的动画通常不会说是视频,但是如果使用3dsmax等软件制作出的三维动画,实际上并不是矢量的,而是已经逐帧渲染为位图了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论