版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章多媒体第5章多媒体
本章详细介绍了多媒体的有关概念、理论及应用。当你对多媒体有充分的认识后,你就能选择合适的多媒体工具进行娱乐、休闲、工作,它将会给你的生活带来无穷乐趣。本章概要2第5章多媒体本章概要学完本章,你将能够:掌握多媒体的基本理论;描述多媒体技术的特点;描述多媒体中声音和图像的处理过程;列出在多媒体应用上所需的计算机设备;学会制作多媒体的技术。3第5章多媒体概述
多媒体技术是集文本、声音、视频、图像、动画等各种信息媒体于一体的信息处理技术,它通过一定的方式接收外部的各种媒体信息,经过计算机加工处理后,以图片、文字、声音、动画等多种方式输出,实现了输入输出方式的多元化。多媒体技术的出现改变了人类社会的生活方式、生产方式和交互环境,促进了多个学科的发展和融合,使计算机在社会生活的各个领域获得了更为广泛的应用。4第5章多媒体本章要点5.1多媒体世界5.2多媒体中的基本概念5.3多媒体技术5.4多媒体计算机系统5.5多媒体应用5第5章多媒体5.1多媒体世界在信息社会,人们迫切希望计算机能以人类习惯的方式提供信息服务,因而多媒体技术应运而生。它的出现,使得原本只有键盘输入的计算机有了“视觉”和“听觉”。用户不仅可以通过文字信息,还可以通过直接看到的影像和听到的声音来了解感兴趣的对象,并且可以参与或改变信息的演示。多媒体是全面的综合性的信息资源。事实上人们很难为多媒体绘出一个非常精确的定义,或许,这正使得多媒体有一种无限想象的创作空间。多媒体结合了文字、资料、图形、影像、动画、视讯、声音、特殊效果,再经由电脑表现出来,能达成信息传播中的任何媒体资源。6第5章多媒体5.1.1多媒体的发展过程
应用层次广泛面向商业、个人需要的第四代计算机,成为了多媒体技术发展的动力。毫无疑问,多媒体技术的萌芽、发展是伴随着第四代计算机开始的。
1987年8月,创新音乐系统(C/MS)问世,这是第一块得到众多音乐软件支持的12复音立体声音乐合成卡。这张声卡的出现,不仅标志着电脑具备了音频处理能力,也标志着电脑的发展终于开始进入了一个崭新的阶段——多媒体技术发展阶段。1988年MPEG(MovingPictureExpertGroup,运动图像专家小组,简称MPEG)的建立又对多媒体技术的发展起到了推波助澜的作用。进入90年代,随着硬件技术的提高,自80486以后,多媒体时代终于到来。多媒体技术的产生和发展带来计算机界的又一次革命,它标志着计算机不仅仅作为办公室和实验室的专用品,而将进入家庭、商业、旅游、娱乐、教育乃至艺术等几乎所有的社会与生活领域。
7第5章多媒体5.1.2多媒体的未来
网络和计算机技术相交融的交互式多媒体将成为21世纪多媒体发展方向。所谓交互式多媒体是指不仅可以从网络上接受信息、选择信息,还可以发送信息,其信息是以多媒体的形式传输。利用这一技术,人们能够在家里购物、点播自己喜欢的电视节目。21世纪的交互式多媒体技术的实现将以电视或者以个人计算机为基础。多媒体正在迅速的、以意想不到的方式进入人们生活的多个方面,大的趋势是各个方面都将朝着当今新技术综合的方向发展,这其中包括:大容量光碟存储器、国际互联网和交互电视。8第5章多媒体5.2多媒体中的基本概念5.2.1媒体及其五种基本形式5.2.2多媒体及其信息类型5.2.3超文本与超媒体9第5章多媒体5.2.1媒体及其五种基本形式1.感觉媒体(PerceptionMedium):指直接作用于人的感觉器官,使人产生直接感觉的媒体。如引起听觉反应的声音,引起视觉反应的图像等。2.表示媒体(RepresentationMedium):指传输感觉媒体的中介媒体,即用于数据交换的编码。如图像编码、文本编码和声音编码等。这是为了加工、处理和传输感觉媒体而人为地研究、构造出来的一类媒体。3.表现媒体(PresentationMedium):指进行信息输入和输出的媒体。如键盘、鼠标、扫描仪、话筒、摄像机等为输入媒体;显示器、打印机、喇叭等为输出媒体。10第5章多媒体5.2.1媒体及其五种基本形式(续)4.存储媒体(StorageMedium):指用于存储表示媒体的物理介质。如硬盘、软盘、磁盘、光盘、ROM及RAM等。5.传输媒体(TransmissionMedium):指传输表示媒体的物理介质。如双绞线、同轴电缆、光缆等。
11第5章多媒体5.2.2多媒体及其信息类型单从字面就可以看出,多媒体是由单媒体复合而成的,是融合两种以上媒体的人机交互式信息交流和传播的媒体。多媒体信息主要包括文本、图像、动画、声音和视频影像五类信息。12第5章多媒体多媒体信息1.文本文本是以文字和各种专用符号表达的信息形式,它是现实生活中使用得最多的一种信息存储和传递方式。文本主要用于对知识的描述性表示,如阐述概念、定义、原理和问题以及显示标题、菜单等内容。如Word文字处理软件编辑出的“DOC”文件,记事本和写字板的“TXT”文件等。2.图像
图像是多媒体软件中最重要的信息表现形式之一,它是决定一个多媒体软件视觉效果的关键因素。3.动画动画是利用人的视觉暂留特性,快速播放一系列连续运动变化的图形图像,也包括画面的缩放、旋转、变换、淡入淡出等特殊效果。通过动画可以把抽象的内容形象化。存储动画的文件格式有FLC、MMM、GIF、SWF等。13第5章多媒体
多媒体信息(续)4.声音声音是人们用来传递信息、交流感情最方便、最熟悉的方式之一。在多媒体中声音基本上分为音乐和音效两类。5.视频影像视频影像具有时序性与丰富的信息内涵,常用于交待事物的发展过程。视频非常类似于我们熟知的电影和电视,有声有色,在多媒体中充当重要的角色。视频文件的存储格式有AVI、MPG、MOV等。
14第5章多媒体5.2.3超文本与超媒体
超文本与超媒体技术是一种模仿人脑的联想记忆方式,是把一些信息块按需要用一定的逻辑顺序链接成非线性网状结构的信息管理技术。超文本超媒体15第5章多媒体1.超文本(hypertext)传统文本是以线性方式组织的,而超文本是一种非线性特殊文本。通常超文本被定义为:由信息节点和表示信息节点间相关性的链组成的具有一定逻辑结构和语义的网络。所谓节点,就是表达信息的一个单位,每个节点包含一个特定的主题信息。“链”是将节点链接起来,实现跨越式浏览、检索的一种机制。超文本的概念可用下图来说明。超文本中带有链接关系的文本通常用下划线和不同的颜色表示。文本①中的“超文本”与②中的“超文本”建立有链接关系,①中的“超媒体”与③中的“超媒体”建立有链接关系,③中的“超链接”与④中的“超链接”建立有链接关系……这种文件就称为超文本文件。16第5章多媒体2.超媒体超媒体与超文本之间的不同之处是,超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文本外,还使用图形、图像、声音、动画或影视片断等多种媒体来表示信息,建立的链接关系是文本、图形、图像、声音、动画和影视片断等媒体之间的链接关系。多媒体使用“超文本”、“超媒体”思想与技术组成了一个全球范围的超媒体空间,通过网络、只读光盘存储器(CompactDiscRead-OnlyMemory,简称CD-ROM)、数字多能光盘(DigitalVersatileDisc,简称DVD)和多媒体计算机,人们表达、获取和使用信息的方式和方法将产生重大变革,这对人类社会产生长远和深刻的影响。17第5章多媒体5.3多媒体技术5.3.1多媒体技术的特性5.3.2多媒体信息处理技术的发展5.3.3音频信息的处理5.3.4图像信息的处理5.3.5视频信息的处理5.3.6媒体综合技术5.3.7编码技术5.3.8虚拟现实5.3.9其他技术18第5章多媒体5.3.1多媒体技术的特性
多媒体技术具有四方面的显著特性,即多样性、交互性、集成性和实时性。多样性多媒体技术的多样性包括信息媒体的多样性和媒体处理方式的多样性。信息媒体的多样性指使用文本、图形、图像、声音、动画、视频等多种媒体来表示信息。对信息媒体的处理方式可分为一维、二维和三维等不同方式,例如文本属于一维媒体,图形属于二维或三维媒体。多媒体技术的多样性又可称为多维化。这一特性不仅使计算机所能处理的信息空间范围扩展和放大,而且使人与计算机的交互具有更广阔、更自由的空间。此外,多样性还指把多媒体系统的各种设备与设施合成为一个整体,将所有能够处理各种媒体信息的高速并行的处理系统、大容量的存储、适合多媒体通道的输入设备(键盘、摄像机、话筒等)和输出设备(显示器、喇叭等)、宽带的通信网络接口,以及适合多媒体信息传输的多媒体通信网络集成为一个整体。
19第5章多媒体2.集成性
多媒体技术的集成性是指以计算机为中心,综合处理多种信息媒体的特性,包括信息媒体的集成和处理这些信息媒体的设备与软件的集成。集成性首先是信息媒体的集成,即把单一的、零散的媒体有效地集成在一起,成为一个完整的统一体,从而使计算机信息空间得到相对的完善,并得到充分利用;其次,集成性还充分表现在存储信息的实体的集成,即多媒体信息由计算机统一存储和组织。
20第5章多媒体3.交互性
多媒体技术的交互性是指通过各种媒体信息,使参与的各方(发送方和接受方)都可以对有关信息进行编辑、控制和传递。交互性不仅增加用户对信息的注意力和理解,延长了信息的保留时间,而且交互活动本身也作为一种媒体加入了信息传递和转换的过程,从而使用户获得更多的信息。另外,借助交互活动,用户可参与信息的组织过程,甚至可控制信息的传播过程,从而可使用户研究、学习感兴趣的方面,并获得新的感受。21第5章多媒体4.实时性
多媒体技术的实时性是指在多媒体系统中声音媒体和视频媒体是与时间因子密切相关的,从而决定了多媒体技术具有实时性,意味着多媒体系统在处理信息时有着严格的时序要求和很高的速度要求。22第5章多媒体5.3.2多媒体信息处理技术的发展支持多媒体技术发展的基础技术(1)大规模集成电路的发展,使计算机的运算速度及内存容量大幅度提高,为多媒体信息的实时处理创造了条件。(2)大容量的存储技术和各种媒体压缩技术的发展,为多媒体信息的存储和传输提供了保证。(3)网络与通信技术的发展使多媒体通信对网络总带宽的要求得到一定程度的满足。(4)各种媒体技术标准的制定和完善推动了多媒体技术的发展。23第5章多媒体5.3.2多媒体信息处理技术的发展2.多媒体信息处理的关键技术多媒体信息处理的关键技术主要有6个方面:计算机系统技术、数据压缩和编码技术、数据存储技术、同步技术、数据管理和检索技术、网络技术。(1)计算机系统技术计算机系统技术是实现多媒体系统的物质基础。鉴于多媒体信息量大、处理方式复杂多样、实时性强等特点,多媒体计算机系统对运算速度、存储容量和信息传输速率均有很高的要求。多媒体计算机硬件结构的核心是微处理器,VLSI为多媒体技术的普及创造了必要条件。在硬件配置方面,一般使用高速总线的主机板,配有较大的内存和外存(硬盘),并使用高速串行总线USB2.0和IEEEl394连接各种标准配置的外部设备,多媒体操作系统是多媒体应用软件的支撑环境,主要解决两个问题:一是保证实时性,二是满足多媒体计算机各种功能的要求。24第5章多媒体
多媒体信息处理的关键技术(3)多媒体数据存储技术数字化的多媒体信息虽然经过了压缩处理,但仍然包含大量的数据。例如视频图像在未经压缩处理时的每秒数据量约为25MB,经某种算法压缩处理后,每分钟的数据量约为10MB,每小时的数据量为600MB。对于这样的数据量,显然不可能存于一张软盘上,而必须存于光盘或硬盘上。数字化数据存储可采用的介质有光盘、硬盘和磁带。
(4)多媒体同步技术在多媒体技术的应用中,各种媒体信息都与时间和空间存在着或多或少的依从关系,例如,视频、音频都明显地带有时间的依从特性。而在有多种媒体集成的信息中,媒体间也会存在空间上的位置特性。因此,多媒体的集成、转换和传递会受到时空同步的制约。25第5章多媒体
多媒体信息处理的关键技术(5)多媒体信息检索技术目前,比较先进的多媒体信息检索技术是基于内容的多媒体检索技术,它具有如下特点:①根据媒体对象的语义和上下文联系进行检索。②人机交互。③基于内容的检索是一种近似的匹配。(6)多媒体网络技术多媒体网络技术是多媒体技术和网络技术相结合的综合技术。通过宽带高速网络系统将多个独立的多媒体计算机连接成为局域网,或者是跨地域的广域网,实现多媒体通信和多媒体信息资源的共享。多媒体网络技术主要解决网络吞吐量、传输可靠性、传输实时性和服务质量等问题。目前,多媒体网络通信技术已经取得了许多新的进展,能够超越时空限制,实时快速地进行多媒体通信,例如可视电话、多媒体会议系统、多媒体交互电视系统、远程教育与远程医疗、公共信息检索系统等。26第5章多媒体3.多媒体的研究与发展技术(1)多媒体数据的表示技术包括文字、声音、图形、图像、动画、影视等媒体在计算机中的表示方法。人—机接口技术,如语音识别和文本—语音转换(TextToSpeech,简称TTS)也是多媒体研究中的重要课题;虚拟现实(VirtualReality,简称VR)是当今多媒体技术研究中的热点技术之一。(2)多媒体数据的存储技术多媒体数据的存储的目标是实现大容量信息的存储和管理。在发展集中式的海量存储技术的同时,也在向分布存储、并行访问的方向发展。分布数据存储技术与多媒体存储技术将在计算机通信网络中融合起来。
27第5章多媒体
多媒体的研究与发展技术(3)多媒体的应用开发包括多媒体CD-ROM节目(title)制作、多媒体数据库、环球超媒体信息系统(Web)、多目标广播技术(Multicasting)、影视点播(VideoOnDemand,简称VOD)、电视会议(VideoConferencing)、远程教育系统、多媒体信息的检索等。
(4)多媒体创作和编辑工具的研究开发基本目标是功能强大、适应性强、使用方便等,为将来人人都会使用多媒体创作和编辑工具提供条件。28第5章多媒体5.3.3音频信息的处理多媒体技术的特点是交互式地综合处理声音、文字和图像等多种信息。在多媒体系统中,语音和音乐是必不可少的。没有音频的视频是不可接受的。音频和视频同步,使视频图像更具真实性。娓娓动听的音乐和解说,使静态图像变得更加丰富多彩。可视电话、电视会议中的声音更为重要。随着多媒体信息处理技术的发展、计算机数据处理能力的增强,音频处理技术备受重视,并得到了广泛的应用。如:视频图像的配音、配乐;静态图像的解说、背景音乐;可视电话、电视会议中的话音;游戏中的音响效果;虚拟现实中的声音模拟;用声音控制Web;电子读物的有声输出等。29第5章多媒体1.音频处理方式处理声音的方式有两种:模拟方式和数字方式。1)模拟方式就像录音机,把声音信号的波形原样保存下来,下图所示为模拟信号的波形示意图。2)数字信号根据抽样定理,人们对模拟信号经过采样和量化,把模拟信号以数字形式保存起来,下图所示为采样量化的示意图30第5章多媒体
多媒体系统中处理的一般都是数字音频,为了保真,就要有更高的采样频率和更高的量化精度,量化精度越高,声音样本的位数越多;采样频率越高,单位时间内产生的数据个数就越多。决定一个数字波形质量和容量的因素有以下三个:(1)采样频率由于人耳能分辨的声音的最高频率为20kHz左右,根据采样定理,40kHz的采样频率就可以获得满意的质量。所以,在多媒体标准中,标准的声音采样频率有11.025kHz、22.050kHz和44.100kHz等。(2)采样量化位数采样量化位数反映了对采样点数据进行数字化时的精度。若对采样值量化时采用n位(即nbit)采样,则其量化的精度就有2n个等级。声音的量化一般是8位、16位或32位,相应的声卡也常被称为8位声卡、16位声卡、32位声卡等。
音频处理方式(续)31第5章多媒体(3)声道数声道数表明记录声音的波形个数,只记录一个声音波形称为单声道;记录两个波形称为双声道,即立体声。立体声的声音效果比单声道要好得多,但需占用更多的存储空间。记录声音所需的存储空间由下面的公式决定:记录每秒声音所需的字节数=(采样频率×采样量化位数×声道数)/8
根据公式可以计算出,对于双声道的声音,若用16bit量化、44.100kHz采样,每分钟的声音大约需要10MB的存储空间。
音频处理方式(续)32第5章多媒体2.音乐合成与MIDI用乐器演奏的音乐,因为乐器种类不多,又没有其它声音,可以用音乐合成技术来实现保存和播放。理论上,用多种频率的正弦波可以合成任何波形,调频(FM)音乐合成技术就基于这个理论。现在的音乐合成器(电子琴)和计算机上的声卡都配备有FM设备。FM设备内事先就已经保存了各种乐器的合成方式,播放时只要有乐器类型、音高、音量、播放时间等数据的代码,就可以播放出声音来。高级一点的FM设备使用的是波表技术,即保存的是WAVE格式的真实乐器的录音(不是合成的),播放效果更加逼真。现在流行的MIDI就是通过音乐合成技术工作的。MIDI(MusicalInstrumentDigitalInterface,简称MIDI)是音乐与计算机结合的产物,是电子乐器与计算机之间的连接界面和信息交流方式。MIDI格式的文件扩展名为“.mid”,通常把MIDI格式的文件简称为“MIDI文件”。33第5章多媒体
音乐合成与MIDI(续)MIDI是数字音乐国际标准。数字式电子乐器的出现,为计算机处理音乐创造了极为有利的条件。MIDI声音与数字化波形声音完全不同,它不是对声波进行采样、量化和编码,而是将数字式电子乐器的弹奏过程记录下来,如按了哪一个键、力度多大、时间多长等等。它实际上是一串时序命令,用于记录电子乐器键盘弹奏的信息,包括键、通道号、持续时间、音量和力度等。这些信息称之为MIDI消息,是乐谱的一种数字式描述。当需要播放时,只需从相应的MIDI文件中读出MIDI消息,生成所需要的乐器声音波形,经放大后由扬声器输出。MIDI文件的存储容量较数字音频文件小得多。如3分钟的MIDI音乐仅仅需要10KB的存储空间,而3分钟的数字音频信号音乐需要15MB的存储容量。34第5章多媒体3.其他音频技术(1)语音合成技术(2)语音识别技术35第5章多媒体(1)语音合成技术一般来讲,实现计算机语音输出有两种方法:一是播放事先录制好的声音,二是文语转换。若采用第一种方法,首先要把录制好的模拟语音信号转换成数字形式,编码后存于存储设备中,播放时,再经解码,重建声音信号(重放)。这种方式可获得高音质声音,并能保留特定人或乐器的音色,但所需的存储容量随录音时间线性增长,可能非常巨大。第二种方法是基于声音合成技术的一种声音产生技术,它可用于语音合成和音乐合成。文语转换是语音合成技术的延伸,它能把计算机内的文本转换成连续自然的语音流。若采用这种方法输出语音,应预先建立语音参数数据库、发音规则库等。需要输出语音时,系统按需求先合成语音单元,再按语音学规则或语言学规则,连接成自然的语流。文语转换的参数库不随发音时间增长而加大,但规则库却随语音质量的要求而增大。36第5章多媒体
(1)语音合成技术(续)计算机语音输出按其实现的功能来分,可以分为两个档次:(a)有限词汇的计算机语音输出。这是最简单的计算机语音输出,适合于特定场合的需求。它可以采用录音/重放技术,或针对有限词汇采用某种合成技术,对语言理解没有要求。可用于语音报时、汽车报站等。(b)基于语音合成技术的文字语音转换(TTS),实现由书面语言到语音的转换。它对书面语言进行处理,将其转换为流利的可理解的语音信号。这是目前计算机语音输出的主要研究阶段。它并不只是由正文到语音信号的简单映射,它还包括了对书面语言的理解,以及对语音的韵律处理。37第5章多媒体(2)语音识别技术口语是最自然最有效的交际方式,用对计算机讲话的方式来控制计算机或输入文字要比用键盘和鼠标好得多。这种技术的基础是语音识别和理解。语音识别是将人发出的声音、字或短语转换成文字、符号,或给出响应,如执行控制、做出回答。语音识别的研究已有几十年的历史,带有语音功能的计算机将很快成为大众化产品。语音识别将可能取代键盘和鼠标成为计算机的主要输入手段,使用户界面产生一次飞跃,所以语音识别所具有的商业前景是不可估量的。语音识别的目的是抽取语音信号携带的信息。语音信号是时间依赖信号,具有时变性、瞬变性的特点,其随机性和非平稳性给识别带来很多困难。众多专家从事语音识别相关技术的研究。基于语言学知识,建立语音识别的高层模型,识别并理解语言是我们的最终目的。目前比较成熟的应用有特定人语音识别系统、非特定人语音识别系统、说话人识别系统、话语系统等。38第5章多媒体4.常用的音频文件现在计算机上使用的音频文件多种多样,不同的文件使用不同的编码或压缩方法,文件的大小与播放效果也不一样,下表列举了一些常见的音频文件。
文件的扩展名说明aif(AudioInterchange)aucmf(CreativeMusicFormat)mff(MIDIFilesFormat)mid(MIDI)mp2mp3mod(Module)rm(RealMedia)ra(RealAudio)rolApple计算机上的声音文件存储格式Sun和NEXT公司的声音文件格式8位u律编码或16位线性编码声霸(SB)卡带的MIDI文件存储格式MIDI文件存储格式Windows的MIDI文件存储格式MPEGLayerI,ⅡMPEGLayerIIIMIDI文件存储格式RealNetworks公司的流放式声音文件格式RealNetworks公司的流放式声音文件格式Adlib声音卡文件存储格式39第5章多媒体
续表snd(sound)seqsngvoc(CreativeVoice)wav(Waveform)WMAApple计算机上的声音文件存储格式MIDI文件存储格式MIDI文件存储格式声霸卡存储的声音文件存储格式Windows采用的波形声音文件存储格式WindowsMediaAudio,微软音频压缩格式,比mp3压缩率更高40第5章多媒体5.3.4图像信息的处理图像是多媒体中携带信息的极其重要的媒体,有人发表过统计资料,认为人们获取的信息的70%来自视觉系统,实际就是文字、图像和视频。人们最易接受的是图像和视频,而视频也是由图像组成的,可见图像在多媒体中的重要。多媒体中处理图像要经过采集、编码、压缩、存储、分析处理、显示等多个过程,下图所示为处理过程示意图。41第5章多媒体图像处理过程42第5章多媒体1.采集图像的采集也要经过采样和量化,把图像在水平和垂直方向分解成许多的点,记录下每个点的颜色值,分解成红、绿、蓝三种基色的组合存储起来。采集图像的设备有许多,扫描仪、数码相机都是常用的设备,摄像机(或数字摄像机)采集的视频图像也是重要的图像来源。黑白图像量化时保存的是像素点的灰度(亮度)值,如量化成256个灰度级,保存时就要占8位空间(1个字节);彩色图像量化时保存的是像素点中三种基色的亮度值,如每个基色亮度值量化成256个灰度级,三种颜色就要占用24位,即3个字节。43第5章多媒体采集(续)矢量图是用一系列计算机指令来表示一幅图,如画点、画线,画曲线、画圆、画矩形等等。这种方法实际上是用数学方法来描述一幅图,然后变成许许多多的数学表达式,再编程,用语言来表达。矢量图有许多优点。例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像的移动、缩小放大、旋转、复制、属性的改变(如线条变宽变细、颜色的改变)也很容易做到;相同的或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可以加速画的生成,而且可以减小矢量图文件的大小。有些图像是人工制作的,这要借助于绘图工具,在计算机上绘制,完成后再以点阵或矢量形式保存起来。44第5章多媒体2.编码和压缩图像数字化之后的数据量非常大,要占用非常多的存储空间,传输时也要占用非常多的时间,因此,对图像进行编码和压缩就显得很重要。图像数据压缩主要是根据下面两个基本事实来实现的:一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了压缩数据的目的。利用前一个事实的压缩技术是无损压缩技术,利用后一个事实的压缩技术是有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。45第5章多媒体3.图像压缩标准(1)二值图像压缩(JBIG)二值图像压缩标准有G3、G4和JBIG。以非自适应、一维游程编码为基础,JBIG采用无损压缩技术,但它的压缩率比目前的CCITTG3、G4标准高1.1~30倍(根据内容的不同)。虽然JBIG是二值图像的编码标准,但也可以对含灰度值的图像或彩色图像进行无失真压缩。46第5章多媒体
图像压缩标准(续)(2)静止图像压缩标准(JPEG/JPEG2000)
为了压缩连续色调(即灰度级或彩色)的静止图像,“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG,1986年成立)于1991年3月提出了ISO/IECl0918号建议草案“连续色调静止图像的数字压缩编码”(DigitalCompressionandCodingofContinuous-toneStillImages),1992年正式通过。JPEG标准采用混合编码方法,可以支持很高的图像分辨率和量化精度。JPEG算法的平均压缩比为15:1,当压缩比大于50时将可能出现方块效应。这一标准适用于黑白及彩色照片、传真和印刷图片。
JPEG2000是一个新标准,不仅提高了对图像的压缩质量,还可根据图像质量、视觉感受和分辨率进行渐进传输。47第5章多媒体(3)动态图像压缩标准(H.261)
CCITT在1990年12月通过了H.261即p×64Kb/s视听业务用的视频编解码器(VideoCoder/DecoderforAudiovisualServicesatp×64Kb/s)。这个建议是针对运动实时动态图像的压缩编码和解码,应用目标是可视电话和电视会议。算法采用混合编码方法,压缩比可达48:1。它的原理框架奠定了以后MPEG标准的基础。(4)动态图像压缩标准(MPEG-1)“动态图片专家组”(MovingPictureExpertGroup,简称MPEG)提出的“用于数字存储媒体运动图像及其伴音率为1.5Mb/s的压缩编码”,简称为MPEG-1。它包括三个部分:MPEG视频、MPEG音频和MPEG系统。MPEG-1标准的平均压缩比为50:1,其处理能力可达到360×240像素。
图像压缩标准(续)48第5章多媒体(5)动态图像压缩标准(MPEG-2/H.262)
1996年底正式公布的MPEG-2标准引用了MPEG-1标准的基本结构,并作了扩展。它可以直接对隔行扫描视频信号进行处理;空间分辨率、时间分辨率和信噪比可分级,以适应不同用途的解码要求;输出码流速率可以是恒定的也可以是变化的,以适应同步和异步传输。
MPEG-2标准的处理能力可达广播级水平,即720×480像素。MPEG-2标准兼容MPEG-1标准,适应1.5~80Mb/s编码范围。MPEG-2标准也是高清晰度电视(HDTV)全数字方案、DVD方案所采用的数据压缩标准。图像压缩标准(续)49第5章多媒体
图像压缩标准(续)(6)动态图像压缩标准(MPEG-4/H.263)
MPEG-4是ISO为传输码率低于64Kb/s的实时图像设计的。与JPEG、MPEG-1、MPEG-2等其他标准所采用的基本压缩算法不同,该标准采用基于模型的编码、分形编码等方法,以获得极低码率的压缩效果。所涉及的应用范围覆盖了有线、无线、移动通信、Internet以及数字存储回放等各个领域,它在信息描述中首次采用了“对象”(Object)概念,是以内容为中心的描述方法,对信息元的描述更符合人的心理,不仅获得比原有标准更优越的压缩性能,也提供了各种新功能的应用。50第5章多媒体4.处理分析图像处理的完整过程包括图像的采集、量化、存储、变换、编码、分割、特征提取、图像数据库的建立、图像的分类和表示、图像识别、模型匹配、内容解释和理解等等。根据抽象程度和方法的不同,图像处理技术可分为图像处理、图像分析(包括图像分割)和图像理解三个层次。图像处理是较低层的操作,主要在图像的像素级上进行大数据量的处理。图像处理着重图像之间的变换,对图像进行各种加工以改善图像的视觉效果。51第5章多媒体处理分析(续)图像分割属于中层次的操作。图像分割和特征提取把原来以像素描述的图像转变成较简单的非图形式的符号描述,被提取的图像特征有边缘和区域,边缘检测和区域分割具有互补的特征。人们能方便地从一幅图像中找出感兴趣的区域,而要计算机做到这一点却需给它以客观测度,使之按灰度、颜色、纹理或几何特性等把一些物体或区域加以分离,称为分割。图像分割是进一步进行图像分析、模式识别、计算机视觉等高层处理的基础。图像理解是高层次操作,基本上是符号运算。图像理解主要指在图像分析的基础上,进一步研究图像中的目标和它们之间的联系,并做出对图像的理解以及对原来客观场景的解释,从而指导和规划行动。图像理解的处理过程和方法与人类的思维推理有许多类似之处。52第5章多媒体5.动画技术动画就是运动的画。在屏幕上依次播放一系列有细微差别的静态图片,各幅图片之间的细微差别就在人的视觉误差中形成了连续的动画。例如图中的10幅图表示的是小人走1步的动作,当把10幅画连续播放时,看到的就是小人在走。53第5章多媒体5.动画技术(续)用计算机实现的动画有两种,一种为帧动画,另一种为造型动画。帧动画是由一幅幅连续的画面组成的画像或图形序列,这是产生各种动画的基本方法;造型动画是把整个画面分解成多个活动的对象分别进行设计,构造每一对象的特征(如形状、大小、颜色等),在动画过程中每个对象可以移动和变换,播放时根据每个对象的位置和特征,实时生成画面,形成连续的动画过程。用计算机制作动画时,一般是先做好关键的画面(也称为关键帧),中间画面由计算机内插来完成。54第5章多媒体6.图像图形文件
自计算机出现以来,产生了许许多多的图像文件,因为互不兼容,有许多已经被淘汰。计算机图形或图像文件分两种类型:位映像图和矢量图,我们只介绍现在常用到的几种。(1)BMP文件格式位图文件(bitmap-file,简称BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。它是将一幅图像分割成栅格,栅格的每一点的亮度值都单独记录下来。Windows3.0以前的BMP格式与显示设备有关,因此把它称为设备相关位图(Device-DependentBitmap,简称DDB)文件格式。Windows3.0以后的BMP格式与显示设备无关,因此称为设备无关位图(Device-IndependentBitmap,简称DIB)格式,目的是让Windows能够在任何类型的显示设备上显示BMP。55第5章多媒体6.图像图形文件(续)(2)GIF文件格式
GIF(GraphicsInterchangeFormat,简称GIF)是CompuServe公司开发的图像文件存储格式,目前广泛用于互联网的网页中。1987年开发的GIF文件格式的版本号是GIF87a,1989年对其进行了扩充,扩充后的版本号定义为GIF89a。GIF图像文件以数据块(block)为单位来存储图像的相关信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(datastream)。GIF文件格式采用了LZW压缩算法来存储图像数据,定义了允许用户为图像设置背景的透明属性。此外,GIF文件格式可在一个文件中存放多幅彩色图形/图像。如果在GIF文件中存放有多幅图,它们可以像幻灯片或者像动画那样演示。56第5章多媒体6.图像图形文件(续)(3)TIFF图像文件格式标记图像文件格式(TagImage,简称TIFF)是图像文件格式中最复杂的一种,代码很长。它是一种多变的图像文件格式,图像信息的存放灵活多变,独立于操作系统和文件系统。该格式支持的色彩数最高可达16M种,其特点是:存储的图像质量高,但占用的存储空间也非常大,其大小是相应GIF图像的3倍,JPEG图像的10倍;细微层次的信息较多,有利于原稿阶调与色彩的复制。(4)PNG格式流式网络图形格式(PortableNetworkGraphicFormat,简称PNG),PNG是一种能存储32位信息的位图文件格式,其图像质量远胜过GIF。同GIF一样,PNG也使用无损压缩方式来减少文件的大小。在压缩位图数据时,它采用了颇受好评的lz77算法的一个变种。目前,越来越多的软件开始支持这一格式,在不久的将来,它可能会在整个Web上广泛流行。与GIF不同的是,PNG图像格式不支持动画。57第5章多媒体6.图像图形文件(续)(5)PostScript文件
PostScript是专门为打印图形和文字而设计的一种编程语言,很好地描述了矢量图和位图,现在也用于图像的存储和交换。PostScript文件的显示效果与打印的介质无关,不管你是在纸上、胶片上打印,还是在屏幕上显示都适合。它的使用平台主要是Macintosh机、PC机、Unix工作站等。几乎所有的Macintosh应用程序、PC机文字处理和单面排版程序及一些高性能的PC机图形和CAD应用程序,均支持PostScript图文格式。
(6)JPEG格式现在的JPEG文件基本上都是采用的JPEG文件交换格式(JPEGFormat,简称JFIF),使用的是JPEG压缩标准。58第5章多媒体5.3.5视频信息的处理在多媒体技术中,最复杂的是运动视频的处理技术。现在我们将从基本概念入手,简单介绍视频图像的采集、压缩、存储、回放(解压缩)、传输等有关处理技术。视频信号处理的一般过程如下图所示。59第5章多媒体1.视频数据的编码和压缩视频数据的编码和压缩是以声音与图像编码和压缩为基础的,主要采用的是MPEG系列标准,我们在前面已经介绍,这里不再重复。2.视频图像的编辑处理对视频图像的编辑处理,主要包括视频内容和视频效果的编辑处理(包括拼接、裁剪、缩放、移动、冻结、翻转、镜像、背景、叠加、透视、旋转、淡入淡出等)与视频内容的分析(比如计算机图像识别、文字识别等)两个方面的工作。这些处理基本上都要在计算机上完成,其处理的实质是对图像点阵数据的运算。视频信息的处理60第5章多媒体视频信息的处理3.视频文件类型如今随因特网的普及,各种新的视频文件类型层出不穷,早期有MPEG、DAT、MOV、AVI等,近几年又出现了RM、RA、RAM、ASF、VOB等。这些文件类型基本上使用的都是前面介绍过的压缩或编码标准。61第5章多媒体5.3.6媒体综合技术
前面介绍的都只是独立的媒体,伴随网络的发展,越来越多的综合性技术以及当今的超文本、XML、FLASH等技术,把我们带进了一个五彩缤纷的多媒体世界。1.超文本标记语言(HTML)HTML(HypertextMarkupLanguage,简称HTML)是组织多媒体文档的重要语言,它不仅用来编写Web网页,而且也越来越多地用来制作光盘上的多媒体节目。另外,HTML还可以用来编排文档、创建列表、建立链接、插入声音和影视片断。2.XML现在正在标准化的一种语言是可扩张标记语言(ExtensibleMarkupLanguage,简称XML)。它是比超文本标记语言更加灵活的一种Web文档格式。HTML使用预先定义的标签(tag)来描述网页中的元素(elements),而XML语言则允许网页开发人员定义标签。XML是通用标记语言(StandardforGeneralMarkupLanguage,简称SGML)文档格式的一个子集,而HTML是SGML的一种文档类型。62第5章多媒体3.FLASHFlash动画使用矢量图形和流(Stream)技术解决了传统动画传输慢的问题。基于矢量图形的动画可以随意缩放而不影响文件的大小和图像质量。流技术允许动画在未全部下载之前就可播放已经下载的部分,从而大大提高了动画在网络上的传输速度,因此Flash动画最适合网页点缀。用它产生的html格式的动画文件可直接插入到网页上流畅运行。Flash采用了先进的透明技术、物体变形技术,能用来创作复杂的动画。Flash支持声音及交互功能,能实现在作品播放过程中给操作者提供选择播放转向的功能,能使用户轻而易举地控制动画转到运行程序、网页上。
媒体综合技术(续)63第5章多媒体Flash采用特殊的动画文件格式,用它制作的动画文件很小。它保存文件时仅仅记录关键帧和控制动作语句,使文件大小减少到极限。因此Flash生成的编辑文件(*.fla),尤其是播放文件(*.swf)十分小巧。比如制作五分钟情节相同、画面相同的动画,Flash保存的文件为36KB,那么用其他动画软件制作的这个动画文件至少在120KB以上。因此,Flash动画文件最适合于网页。它既可用于制作几秒钟的简易动画,又能制作复杂的、能播放半小时以上的大型动画。Flash能将动画直接生成html文档,使用脚本控制动画播放。64第5章多媒体5.3.7编码技术1.统计编码数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编码方法。数据压缩的理论极限是信息熵。要求在编码过程中不丢失信息量的信息保持编码,叫做熵保存编码,或者叫熵编码。熵编码是无失真数据压缩,用这种编码结果经解码后可无失真地恢复出原图像。当考虑到人眼对失真不易觉察的生理特征时,有些图像编码不严格要求熵保存,可允许信息部分损失以换取高的数据压缩比,这种编码是有失真数据压缩。通常运动图像的数据压缩是有失真编码。这就是著名的香农率失真理论,即信息编码率与允许的失真之间关系的理论。熵编码是建立在随机过程的统计特性基础上的。常用的统计编码有霍夫曼编码、算术编码和行程编码。65第5章多媒体1.统计编码(1)霍夫曼编码霍夫曼(Huffman)编码方法于1952年问世,迄今仍经久不衰,广泛应用于各种数据压缩技术中,且仍不失为熵编码中的最佳编码方法。霍夫曼编码的理论依据是变字长编码理论。在变字长编码中,编码器的编码输出码字是字长不等的码字,按编码输入信息符号出现的统计概率,给输出码字分配以不同的字长。对于编码输入中出现概率大的信息符号,赋以短字长的输出码字;对于编码输入中出现概率小的信息符号,赋以长字长的输出码字。可以证明,按照概率出现大小的顺序,对输出码字分配不同码字长度的变字长编码方法,其输出码字的平均码长最短,与信源熵值最接近,编码方法最佳。66第5章多媒体(2)行程编码(RLC)行程编码(RunLengthCode,简称RLC),也称行程长度编码,是无失真压缩编码方法。计算机许多媒体静止图像数据压缩标准算法中就采用了行程编码方法。行程编码的基本原理是建立在图像的统计特性基础上的。比如在传真通信中,所传的文件多数为二值(黑、白)图像,每个像素的灰度为黑(1)、白(0)表示的二级灰度。如果每个像素用一位二进制码0或1直接传送,那么一帧图像编码输入码元数等于该帧图像的像素总数,当分辨率提高时,像素点数猛增,码元数随之激增,传送时间加长,所需存储空间也愈大。所以通常采用压缩编码传送,在接收端解码,还原原始文件。统计编码(续)67第5章多媒体行程编码(续)
对于黑、白二值图像,由于图像的相关性,每一行扫描线总是由若干段连续的黑像素点和连续出现的白像素点构成。黑(白)像素点连续出现的像素点数称为行程长度,简称长度。黑像素点的长度和白像素点的长度总是在交替发生,交替发生变化的频度与图的复杂度有关。现在我们把灰度1(黑)和1的行程长度,或0(白)和0的行程长度组合,构成编码输入码元而进行编码,并按其出现的概率分配以不同码长的码字,大概率分配短码,小概率分配长码。同样道理,对于灰度图像或彩色图像,也可以将灰度值(或彩色值)与其行程长度组合一起作为编码输入的码元进行编码。68第5章多媒体(3)算术编码
JPEG建议了两种熵编码方法:霍夫曼编码和算术编码。JPEG成员测试过,对于许多图像,算术编码的压缩效果比霍夫曼编码的压缩效果要好5%~10%。算术编码方法比霍夫曼编码、行程长度等熵编码方法都复杂,但是它不需要传送像霍夫曼编码的霍夫曼码表,同时算术编码还有自适应能力的优点,所以算术编码是能够实现高效压缩数据的很有前途的编码方法。统计编码(续)69第5章多媒体2.预测编码预测编码方法的原理,是从相邻像素之间有强的相关性特点考虑的。比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。预测编码方法分线性预测和非线性预测编码两种。线性预测编码方法也称差值脉冲编码调制法(DifferentionPulseCodeModulation,简称DPCM)。预测编码方法在图像和语音信号的数据压缩中都得到广泛的应用和研究。电视图像的帧内和帧间,都是采用的DPCM编码方法。70第5章多媒体5.3.8虚拟现实虚拟现实(VirtualReality,简称VR)是一种由计算机和电子技术创造的新世界,是一个看似真实的模拟环境。通过多种传感设备,用户可根据自身的感觉,使用人的自然技能对虚拟世界中的物体进行考察或操作,参与其中的事件;同时提供视、听、摸等直观而又自然的实时感知,并使参与者“沉浸”于模拟环境中。尽管该环境并不环绕我们,但它作为一个“逼真”的三维环境,仿佛就在我们周围。虚拟现实最早应用于电脑游戏中,现在也有许多其他方面的用途,如美军利用虚拟现实培养军人的作战能力。这种方式既省钱又安全。虚拟建模语言VARML对虚拟现实技术的普及起了很大作用。71第5章多媒体1.虚拟现实系统组成虚拟现实系统一般可分为桌面虚拟现实系统、沉浸式虚拟现实系统、分布式虚拟现实系统和遥现系统。桌面VR系统使用个人计算机和低级工作站实现仿真,计算机的屏幕作为参与者观察虚拟环境的一个窗口,各种外部设备一般用来驾驭该虚拟环境,并用于操纵在虚拟场景中的各种物体。这些外部设备包括鼠标、跟踪球、力矩球等。下图所示为桌面VR系统的基本组成。72第5章多媒体1.虚拟现实系统组成(续)
桌面VR系统虽然缺乏头盔显示的那种完全沉浸功能,但它仍然比较普及,这是因为它的成本相对来说比较低。沉浸式VR系统利用头盔显示器和数据手套等交互设备把用户的视觉、听觉和其他感觉封闭起来,使参与者暂时与实时环境隔离,而真正成为VR系统内部的一个参与者,他可利用各类交互设备操作和驾驭虚拟环境,其系统基本组成如下图所示。73第5章多媒体2.虚拟现实使用的技术VR是一项综合性的技术,其应用的技术主要有:三维交互技术:包括超声波、电磁等三维传感器,跟踪探测设备、手持数字化设备、立体视觉等设备中使用的关键技术。自然交互技术:包括手势识别、碰撞检测、自动抓取等技术。另外还有实时显示处理、三维虚拟声音、三维视觉建模和视觉成像等技术。74第5章多媒体3.虚拟现实的应用领域
虽然虚拟现实技术还不够成熟,但它确实已经被使用在许许多多的领域。作为一门新兴的科学,无论是在航空、航天、船舶、医学等高技术领域,还是在教育、娱乐、商业等方面都显示出了诱人的应用前景。随着相关硬件、软件成本逐渐降低以及技术方面不断取得新的突破,虚拟现实技术的应用领域还将迅速扩大。75第5章多媒体5.3.9其他技术触摸屏技术文字识别
硬件处理技术
76第5章多媒体1.触摸屏技术随着计算机技术的普及,在20世纪90年代初,出现了一种新的人机交互作用技术——触摸屏技术。利用这种技术使用者只要用手指轻轻地碰计算机显示屏上的图符或文字就能实现对主机操作,这样摆脱了键盘和鼠标操作,使人机交互更为直截了当。因此,触摸屏已成为当前最简便的人机交流的输入设备。它赋予多媒体以崭新的面貌,是极富吸引力的全新的多媒体交互设备。触摸屏的应用范围非常广阔,主要是公共信息的查询:如电信局、税务局、银行、电力等部门的业务查询;城市街头的信息查询;博物馆、美术馆的资料查询;机场车站的航班、车次查询;此外应用于领导办公、工业控制、军事指挥、电子游戏、点歌点菜、多媒体教学、房地产预售、机票/火车票预售等。77第5章多媒体
触摸屏技术(续)
触摸屏分为接触式和非接触式两种:前者是玻璃板式的透明屏,用手指等物体接触其表面。其优点是分辨率高,但价格也很高,且实质性的接触导致屏幕寿命大为降低;后者是使用红外光学技术,用户手指阻断交叉的红外光束得到位置信息,这种方法费用低,非实质性的接触使寿命可达几十万小时,虽然分辨率不高,但也足以适合用户手指触摸使用。78第5章多媒体2.文字识别文字识别分为手写识别和书面扫描识别两种。手写识别是通过记录文字图像抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以一定的规则提取信息特征,再由识别模块将信息特征与识别库的特征进行比较,加以识别,最后转化为计算机所使用的文字代码。而笔输入的识别特征库是基于多人以习惯笔顺书写的统计特征而建立的。文字识别技术发展比较快,现在的印刷体识别已经能达到95%以上,但手写体识别还有待进步。79第5章多媒体3.硬件处理技术
随着多媒体技术的发展,硬件要求也有相应提高,JPEG、MPEG等标准都有专门的编码和解码芯片,各种数字信号处理芯片(DSP)层出不穷。Intel为其CPU专门设计了多媒体指令MMX和SSI,AMD也为其CPU设计了多媒体指令“3DNow!”。很多厂家生产了多媒体处理器,更加速了多媒体的发展。80第5章多媒体5.4多媒体计算机系统多媒体计算机系统是指能够对文字、图像、视频等多种媒体进行处理的计算机系统,即具有多媒体功能的计算机系统。到目前为止,大部分的多媒体应用是在PC机上进行的。平时常见的多媒体计算机都是多媒体个人计算机(MultimediaPersonalComputer,简称MPC)。MPC机并不是一种全新的个人计算机,它是在普通PC机的基础上增加一些硬件及相应的软件,从而具有综合处理文字、声音、图像、视频等多媒体信息的功能。与通用的PC机相比,多媒体计算机的主要硬件除了常规的硬件如主机、内存储器、软盘驱动器、硬盘驱动器、显示器、网卡之外,还要有光盘驱动器、音频信息处理硬件和视频信息处理硬件等部分。81第5章多媒体主要内容5.4.1MPC机的特点与组成5.4.2多媒体计算机的硬件系统5.4.3多媒体计算机的软件系统82第5章多媒体5.4.1MPC机的特点与组成1.MPC机的特点在MPC机处理的多媒体信息中,必须包括音频和视频信息。与普通计算机处理的单一字符信息相比,音频和视频信息具有实时性强、复合性高和信息量大等特点。首先,播放声音或图像时要求音响或画面能连续、平滑地变化;其次,相关的声音、图像与文字必须按需要复合在一起,保持同步与协调。尤需指出,与文字信息相比,音频与视频的信息量要大得多。如果不采用压缩技术处理播放1分钟的声音信息,其信息量可达到2.6MB~5.3MB,相当于2~4张1.44MB的软盘容量;而持续1秒钟的电视图像所需的存储容量更高达9.22MB,若使用早期的10MB硬盘,全部容量仅够存储1秒钟的图像信息。上述的这些特点,决定了MPC的主机应比普通PC机具有更大的存储空间、更高的CPU速度和更快的内部通信和网络通信能力。83第5章多媒体2.MPC机的组成MPC机还应配置支持音频信息和视频信息的输入、输出与存储所需要的外部设备和相应的接口板,其中包括:①高质量的声卡和音箱、话筒等音频设备,为MPC提供优质的数字音响。声卡能把声音变成相应的数字信号和将数字信号转换成相应的声音,并把数字信号记录到硬盘上和从硬盘上读出重放。多数声卡还带有音乐合成器与MIDI乐器接口,允许外接电子乐器。②配有视频显示卡的高分辨率彩色显示器,支持MPC在同一画面上显示来自光盘的图形、图像与文字,并能使画面、字幕与伴音实现同步。带有视频图像采集功能的显示卡,还能支持MPC在显示器上观看从录像机或视频光盘(VCD)等送来的电视节目,并把所采集的信息存储在磁盘上。③大容量的光盘存储设备是MPC必不可少的基本配置。一张CD-ROM光盘可以存储650MB的多媒体信息,而近几年面世的第二代DVD-ROM光盘,每片容量可达到4.7GB。配上数据压缩技术和高倍速的光盘驱动器,在MPC上一次就能欣赏长达数小时的录像或影碟。84第5章多媒体5.4.2多媒体计算机的硬件系统通常认为声频卡、视频卡和CD-ROM是多媒体计算机的基本硬件,多媒体硬件系统的基本组成如图5-9所示。85第5章多媒体1.声卡在MPC中,常见的声音输出/输入设备包括:①音箱:单声道使用1只,立体声使用2只;②麦克风:可在“录音机”(SoundRecorder)等软件的支持下录制语音或音乐;③CD-ROM:可在“媒体播放器”(MediaPlayer)或XINGMPEGPlayer等软件的支持下播放CD唱盘或VCD影碟;④电子键盘或其他MIDI设备:创制MIDI音乐。在上述设备中,音箱和CD-ROM是必不可少的,因而也是MPC机的基本配置。所有的音响设备都要通过音频接口板(通常简称声卡)与主机连接。声卡是最基本的多媒体设备,有没有声卡,已成为区分MPC与普通PC机的主要标志之一。86第5章多媒体(1)声卡的组成
声卡的类型众多,结构也不尽相同。一般地说,一块声卡至少应具有下列部件:①实现录音和放音的部件包括在声音输入过程中把模拟信号转换为数字信号的模数转换电路,以及在声音输出过程中把数字信号转换为模拟信号的数模转换电路。每种声卡都具有固定的采样参数。如果录音电路使用的参数是22.05kHz和16位,放音电路也将使用同样的参数。早期的声卡均采用8位位宽。目前多数为32位及以上了。16位卡的采样精度可达到64K分之一,对多数应用均已足够了。87第5章多媒体
声卡的组成(2)②支持乐器合成的MIDI合成器这是决定声卡音质的关键部件。由于MIDI音乐对质量的要求较高,许多声卡制造商致力于提高合成器的质量,使音乐合成技术不断获得改进。早期的合成器采用FM(频率调制)合成技术,通过用一个正弦波修正另一个正弦波的方法来模拟各种乐器的声音,带有较深的人工合成痕迹。现在流行的声卡普遍采用“波表”(WaveTable)合成技术,其中又有“硬波表”与“软波表”两种不同的作法。近几年随着PCI总线的流行而推出的PCI声卡,把硬波表和软波表的优点结合起来,提出了一种新的MIDI合成方案。其具体作法是:波表存储在硬盘上,使用时调入内存;但并非交给CPU处理,而是经PCI总线传回声卡,由声卡上的专用合成芯片处理。这一被称为“可下载样本”(DownLoadableSample,简称DLS)的合成技术(简称DLS技术),现已成为新一代PCI声卡的标准。硬盘上的样本库可选择2MB、4MB乃至8MB等不同的大小,音源与音质也可由用户选择,而且其内容可经常更新,使声卡的音频真正作到生动、灵活和多样。88第5章多媒体(2)声卡的功能
多媒体计算机中所安装的声卡的功能直接影响到多媒体系统的音频效果。一般声卡应具有以下功能:①录制和编辑音频文件能以一定频率和精度采样声源的模拟波,并通过对其数字化,以*.voc、*.wav或*.au等声音文件格式存储。可以根据要求对音频文件做修改、编辑、文件类型转换等,如将*.voc文件转换成*.wav文件。还可以根据需要,将音频文件插入到其他应用程序中去。②合成和播放音频文件利用声卡上的合成器将存储在计算机内存中的音频信息合成为音乐乐曲或语音。通过混合器混合和处理多个不同音频源的声音,控制和调节音量大小,最后送至音箱或耳机播放。89第5章多媒体
声卡的功能(续)③压缩和解压缩音频文件通过对*.wav音频文件的存储量计算可知,一分钟的声音波形文件(44.1kHz采样频率、16位精度和双声道立体声)的存储量高达10.6MB,因而必须对音频进行编码压缩。大多数声卡上都固化了不同标准的音频压缩和解压缩软件,常用的压缩编码方法有ADPCM(自适应差分脉冲编码调制)和ACM(微软音频压缩管理器)等,压缩比大约为2:1~5:1。④具有与MIDI设备和CD驱动器的连接功能通过声卡上的MIDI接口,计算机可以同外界的MIDI设备相连接,如连接电子琴、电吉他等,使MPC具有创作电脑乐曲和播放MIDI文件的功能。游戏杆也可通过MIDI接口与计算机相连接,使游戏玩起来得心应手。通过声卡上提供的CD-ROM音频接口,CD-ROM驱动器可连接到计算机上。90第5章多媒体2.视频卡
多媒体技术中的一大支柱是视频技术,它使得动态图像能在计算机中输入、编辑和播放。视频技术通过软、硬件都能实现,但目前用得较多的是视频卡。视频卡的种类大体可分为视频叠加卡、视频捕捉卡、电视编码卡、MPEG卡和TV卡。(1)视频叠加卡视频叠加卡的功能是通过视频输入口输入标准的视频信号,经A/D转换后形成混合信号,再与计算机显示卡中的VGA信号相叠加,叠加后的信号显示在显示屏上。视频信号与VGA信号叠加的方式有窗口方式和色键两种。窗口方式是用软件命令在显示屏幕的任意位置上开设一个大小可指定的窗口,图像在该窗口内播放;色键方式是用户可利用软件命令自定义一种颜色为色键(透明色),同时定义该颜色是对VGA信号透明还是对视频信号透明。91第5章多媒体视频卡(续)(2)视频捕捉卡视频捕捉卡又称视频采集卡,用于图像捕捉尤其适用于捕捉视频图像(如来自录像机的视频图像),经数字化后,将图像以AVI格式文件保存在磁盘上,供以后编辑使用。视频捕捉卡的档次拉得很大,较贵的视频捕捉卡往往带有视频压缩功能。这类卡主要供专业编辑人员使用,用量较少。(3)电视编码卡其功能是将计算机送往VGA显示器的VGA显示信号转换成标准的NTSC、PAL或SECAM电视信号,因而可以将计算机上的影像转到电视机上观看。如果将转换后的标准电视信号加到录像机上,则可以记录计算机的显示画面,用于广告电视片的后期处理。电视编码卡转换的效果与其所支持的分辨率有关,分辨率越高,转换效果越好。92第5章多媒体视频卡(续)(4)MPEG卡
MPEG卡又称视频播放卡或电影卡,是多媒体视频卡中应用最多的一种。MPEG卡的作用是将压缩存储在VCD影碟中的电影解压缩后回放,使用户可利用CD-ROM及显示器观看电影。MPEG卡的功能包括MPEG音频解压、MPEG视频解压、音频和视频同步解压。MPEG卡使用方便,用户界面良好,若与CD-ROM配合使用,可在计算机上欣赏VCD片或光盘中的MPEG电影。目前有两类MPEG卡,一类不带屏幕缩放功能,只能全屏幕播放MPEG电影;另一类带有屏幕缩放功能,不仅可以全屏幕播放,而且可以缩小电影播放的窗口,便于用交互方式进行操作控制,播放的质量也可满足一般用户的要求。(5)TV卡
TV卡由TV调谐卡和视频叠加卡合并构成,前者能通过高频头选择接收电视台的信号,把它们转换为视频信号;后者可将电视的视频信号与显示器的VGA信号叠加在一起,在计算机显示器上显示。有些TV卡上还设有视频输入口,可直接接受来自录像机或摄像机的视频信号。因此,利用TV卡除观看电视外,还可观看录像带或摄像机的画面。93第5章多媒体3.CD-ROM
随着多媒体技术的迅速发展,光盘已成为MPC机中不可缺少的外部存储器之一。因为它与其它外存储器相比,有其独特的优点:存储容量大,制作成本低,不怕磁和热,工作稳定,密度高,寿命长,便于携带等。CD-ROM驱动器简称光驱,其作用是通过伺服机构控制光盘的转速,控制光束的定位、焦距,以检测并读出光盘上所携带的信息。(1)CD-ROM光盘
CD-ROM光盘简称光盘,利用光存储技术实现数据的读/写操作。早在1980年,荷兰的飞利浦公司和日本索尼公司就发明了CD唱盘(或唱碟),可利用光反射原理重放记录在盘面上记录的音频信息。1983年出现了记录只读信息的“紧凑光盘”,称为CD-ROM(CompactDisc—ReadOnlyMemory,简称CD-ROM)。但只是到1985年以后,随着多媒体技术的迅速发展,CD-ROM才应用到PC机中,成为MPC机中不可缺少的外部存储器之一。94第5章多媒体3.CD-ROM(续)
现在常用的CD-ROM光盘物理上共有三层结构,基体层是聚碳酸酯硬塑料,约1.2mm厚;在基体上覆盖了极薄的一层铝箔,称为反射层,它是光盘的信息载体,所有数据均刻在这一层上;再上面覆盖了一层保护膜,以保护反射层免受损伤。在光盘的生产过程中,压盘机通过激光在空盘的表面以环绕方式刻出螺旋形的光道。光盘上存储信息是通过在光道上沿着盘面以凹坑的形式存储的,一张CD-ROM盘片约有30亿个凹坑,分布在螺旋形光道上,螺旋光道绕盘达2万周。相邻光道只相隔1.6pm,相当于每英寸160000道,比软磁盘和硬盘的道密度高
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 值班防雷电安全教育
- 2024统编版八年级语文上册第六单元专项训练(学生版+解析版)
- 纲要考试题及答案
- 方差题目及答案
- 7月妇科护理技术模考试题(含参考答案)
- 【初中 物理】第十二章简单机械章末复习课件-2025-2026学年人教版物理八年级下册
- 小学五年级语文上册第三单元爱国情怀主题升华课件
- 2026年台州市黄岩经开投资集团有限公司下属公司公开招聘工作人员备考题库及参考答案详解
- 湖北省武汉市光谷未来学校2025-2026学年八年级上学期12月月考语文卷(含答案)
- 深度解析(2026)《GBT 33987-2017SXKa三频低轨遥感卫星地面接收系统技术要求》(2026年)深度解析
- 2025年下半年贵州遵义市市直事业单位选调56人考试备考题库及答案解析
- 易错点2.2摩擦力(解析版)高考易错点解读和针对训练
- 2025至2030丝苗米市场行业发展趋势分析与未来投资战略咨询研究报告
- 2025年陕西国际经贸集团有限公司招聘(31人)笔试备考重点题库及答案解析
- 江苏省南京市联合体(雨花、江宁、浦口区)2024-2025学年七年级上学期期末考试语文试题
- 2025秋国开电大《人力资源管理》形考任务1234参考答案
- 2025仁怀市公共交通服务有限公司招聘招聘141人考试笔试备考试题及答案解析
- 拳击机器人课件
- 2026年电商评价管理策略与产品口碑优化实操手册
- 基于国家智慧教育云平台的农村小学科学实验课创新教学模式实践与反思教学研究课题报告
- 小学STEM综合活动教学设计方案
评论
0/150
提交评论