多媒体技术与应用

上传人：青*** IP属地：安徽上传时间：2026-04-30 格式：PPT 页数：1446 大小：29.42MB 积分：12 举报 版权申诉

已阅读5页，还剩1441页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

21世纪高等学校计算机规划教材

多媒体技术与应用第1章多媒体技术概述第2章音频信号的获取与处理第3章图形图像数据的编辑与处理第4章计算机动画的制作与编辑第5章媒体视频信号的获取和处理

第6章多媒体数据压缩第7章多媒体计算机系统第8章多媒体应用系统设计第9章多媒体网页设计第10章多媒体数据库管理第11章多媒体通信与分布式多媒体系统第12章多媒体实验第1章多媒体技术概述1.1多媒体技术基本概念1.2多媒体技术主要研究的内容1.3多媒体技术应用领域及发展前景1.1多媒体技术基本概念 20世纪80年代中后期开始，多媒体计算机技术成为人们关注的热点之一。多媒体技术作为一种迅速发展的综合性电子信息技术，它给传统的计算机系统、音频和视频设备带来了巨大的变革，将对大众传媒产生深远的影响，从而加速计算机进入家庭和社会各个方面的进程。在介绍多媒体技术基本概念之前，我们先了解一些媒体、多媒体的基础知识。

1.1.1媒体和媒体分类1.1.2多媒体与多媒体技术1.1.3研究多媒体技术的意义1.1.1媒体和媒体分类1．信息与媒体2．媒体的分类（1）感觉媒体（2）表示媒体（3）显示媒体（4）存储媒体（5）传输媒体1．信息与媒体从本质上看信息是对社会、自然界事物特征、现象、本质及规律的描述。人类感知信息的途径包括以下几种。视觉：是人类感知信息最重要的途径，人类从外部世界获取信息的70%～80%是从视觉获得的。听觉：人类从外部世界获取信息的10％是从听觉获的。嗅觉、味觉、触觉：通过嗅觉、味觉、触觉获得的信息量约占10％。

媒体（Medium）在计算机领域中有两种含义，即存储媒体和表示媒体。其中，存储媒体是用以存储信息的实体，如磁带、磁盘、光盘和半导体存储器。表示媒体是指承载信息的载体，如数字、文字、声音、图形、图像、动画、视频等。所以信息是通过媒体进行表示和存储的，它们之间存在密不可分的关系。2．媒体的分类媒体作为信息表示和传播的形式载体，根据信息被人们感知、表示、呈现、存储或传输的载体的不同，ITU（国际电信联盟）建议将媒体分为下列5类：感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体。（1）感觉媒体

感觉媒体指直接作用于人的感觉器官，使人产生直接感觉的媒体。感知媒体帮助人类来感知环境。目前，人类主要靠听觉和视觉来感知外部环境中的信息，如我们听觉感知的语言、音乐，视觉感知的图像、动画和视频等。（2）表示媒体表示媒体指传送感觉媒体的中介媒体，即用于数据交换的编码。借助于此种媒体，能更有效地存储感觉媒体或将感觉媒体从一个地方传送到遥远的另一个地方，如图像编码、文本编码和声音编码等。（3）显示媒体显示媒体指把媒体信息显示出来。它通常分为两种，一种是输入类显示媒体，用来获取信息，如键盘、鼠标、扫描仪、摄像机和话筒等；另一种是输出类显示媒体，用来帮助人们进行信息的再现，如显示器、扬声器、打印机和绘图仪等。（4）存储媒体存储媒体指用于存储表示媒体的物理介质，如磁带、磁盘、光盘等。（5）传输媒体传输媒体指用来将表示媒体从一个地方传输到另外一个地方的物理介质，如电缆、光缆和微波等。1.1.2多媒体与多媒体技术1．多媒体概念2．多媒体技术3．多媒体技术特点1．多媒体概念多媒体译成英文为Multimedia。是由Multiple（多）和Media（媒体）复合而成的。实际上，多媒体不仅融合了文本、声音、图像、视频和动画等多种媒体信息，同时还包括计算机处理信息的多元化技术和手段。因此“多媒体”通常是指“多媒体技术”。2．多媒体技术多媒体技术（MultimediaTechnology）就是利用计算机把文字、图形、图像、动画、声音及视频等媒体信息进行数字化，并将其整合在一定的交互式界面上，使计算机具有交互展示不同媒体形态的能力。这极大地改变了人们获取信息的传统方法，符合人们在信息时代的阅读方式。多媒体技术不是各种信息媒体的简单复合，它是把多种形式的媒体信息通过计算机进行综合处理和控制，多媒体的产生一般经过数据获取、整理、编辑、存储、传递、展示等多种处理过程，在这些处理过程中需要一些方法和技术支持。多媒体技术是微电子技术、计算机技术、通信技术相结合的产物。20世纪90年代，微电子技术的发展，促成高清电视、高保真音响、高性能录像机和光盘播放机等的出现；而数字化通信技术将传统的通信技术与计算机技术紧密地结合，形成高速通信网络，使得信息的传输与交互能力得到了很大的提高；而计算机系统集成电路大幅度增加，且运算速度和处理能力越来越强，特别是个人计算机的发展更加迅猛。正是由于这三方面技术的发展，使得多媒体技术改变了计算机的使用领域，使计算机由办公室、实验室中的专用品变成了信息社会的普通工具，广泛应用于工业生产管理、学校教育、公共信息咨询、商业广告、军事指挥与训练、家庭生活与娱乐等领域。3．多媒体技术特点多媒体技术所处理的媒体信息是一个有机的整体，各种媒体之间在时间上、空间上存在着紧密的联系，具有

（1）集成性

（2）交互性

（3）实时性

（4）非线性

（5）多样性（1）集成性集成性是指结合文字、图形、影像、声音、动画等各种媒体的一种应用，并且是建立在数字化处理基础上的。集成性通常包括两方面，一方面是可以同时使用图形、文字、声音和图像等多种形式的媒体信息表达的集成性；另一方面是指处理媒体设备和软件技术的集成性，即计算机和各种输入/输出设备（如打印机、扫描仪、数码相机、投影仪、音响等设备）配合工作，同时需要相应的软件技术的支持（多媒体操作系统、多媒体创作工具软件、多媒体应用软件等）。（2）交互性交互性是指通过各种方式，有效地控制和使用信息，让使用者完成交互性沟通（InteractiveCommunication）的特性。这种特性有别于传统的信息交流方法，传统的信息交流只能单向地、被动地传播信息（比如看电视、听广播），而多媒体技术可以实现人对信息的主动选择，即使用者按照自己的意愿来选择信息的内容、参与多媒体信息的播放和节目的组织与控制，从而达到有效信息获取和解决问题的目的，例如通过数据库检索我们需要的文字、图片等资料；通过触摸屏进行信息内容的选择和使用等。（3）实时性由于声音、视频图像等是和时间密切相关的连续媒体，所以多媒体技术在处理的过程中必须支持实时性处理，即当用户给出操作命令时，相应的多媒体信息都能够得到实时控制。目前，在多媒体网络和多媒体通信中，实时传播和同步支持是大家关注的一个重要指标，例网络视频会议、IP电话、视频点播都能让我们感到实时的效果。（4）非线性一般而言，使用者对非线性信息存取需求要比循序性信息存取大得多。非线性特点将改变传统循序性的读写模式。以往人们读写方式大都采用章、节、页阶梯式的结构，即循序渐进地获取知识，多媒体系统克服了这个缺点，在多媒体技术中借助超文本链接（HyperTextLink）的方法，把内容以一种更灵活、更具变化的方式呈现给读者，它简化了使用者查询资料的过程。（5）多样性多媒体技术的多样性体现在信息载体的多样性及处理信息技术的多样性。多样化的信息载体包括磁盘介质、磁光盘介质、光盘介质、语音、图形、图像、视频和动画等。而处理信息技术的多样性体现在信息采集或生成、传输、存储、处理及显现的过程中，计算机对信息的处理不仅仅是简单的获取和再现，而是要根据人们的想法、创意进行加工、组合与变换，使得这些信息达到生动、灵活、自然的效果。1.1.3研究多媒体技术的意义在计算机发展的初期，只能通过0和1两种符号表示信息，即用纸带和卡片的有孔或无孔表示信息，纸带机和卡片是主要的输入输出设备。这种方式既不直观，也不方便，而且容易出错，一旦出错不容易发现。因此在当时计算机应用只能限于极少数计算机专业人员。 20世纪50年代到70年代，出现了高级程序设计语言，开始用文字作为信息的载体，人们可以用文字（如英文）编写源程序，输入计算机，计算机处理的结果也可以用文字表示输出。这样，人们与计算机交往就直观、容易得多。这时的输入输出设备主要是打字机、键盘和显示终端。长期以来，信息媒体的交互方式仅局限于文字和文本，但计算机的出现实现了文字和文本计算机化，给人们提供了不少方便，大大减轻了人们的劳动强度，提高了效率，但是，仅文字和文本方式的交互与人们的自然交互相距很远。因为在人们的感知系统中，视觉所获取的信息占60%以上，听觉获取的信息占20%左右，另外还有触觉、嗅觉、味觉、脸部表情、手势等占其余部分，虽然只靠文字、文本传输和获取信息也能表达信息内容，但直观性差，不能听其声、见其人。因此，多媒体技术的出现，首先是语音和图像的实时获取、传输及存储，使人们获取和交互信息流的渠道豁然开朗，既能听其声，又能见其人，千里之外，近在咫尺，改变了人们的交互方式、生活方式和工作方式，从而对整个社会结构产生了重大影响。 20世纪80年代开始，人们致力于研究将声音、图形和图像作为新的信息媒体输入输出计算机。1984年Apple公司的Macintosh个人计算机首先引进了“位映射”的图形机理，用户接口开始使用Mouse驱动的窗口技术和图符（Windowandicon），受到了广大用户的欢迎。这使得公众（包括儿童在内）都能使用计算机。由于Apple公司采取发展多媒体技术、扩大用户层的方针，使得它在个人计算机市场上成为唯一能同IBM公司相抗衡的一支力量。目前，国际上在下述几项技术上又有了突出的进展：●超大规模集成电路的密度增加了；●超大规模集成电路的速度增加了；●CD-ROM可作为低成本、大容量PC的只读存储器（可更换的5英寸盘片，每片容量为600MB，以及DVD（单面4.7GB））；●引进了双通道VRAM、RDRAM；●广泛使用网络技术。这五项计算机基本技术的进展有效地带动了数字视频压缩算法和视频处理器结构的改进，促使10年前单色文本／图形子系统转变成今天的彩色丰富、高清晰度显示子系统，同时能够做到全屏幕、全运动的视频图像，高清晰度的静态图像、视频特技，三维、实时的全电视信号以及高速真彩色图形。同时还有高保真度的音响信息。正是由于多媒体技术使得计算机具有综合处理声音、文字、图像和视频信息的能力。所以多媒体计算机技术作为信息高速公路架构的重要组成部分，是我国国民经济信息化的核心技术；另外，它还是解决高清晰度电视（HDTV）、常规电视数字化、交互式电视（InteractiveTV，ITV）、点播电视（VideoOnDemand，VOD）等问题的最佳方案；也是改造传统产业，特别是出版、印刷、广告、娱乐等产业的先进技术。1.2多媒体技术主要研究的内容随着多媒体应用越来越广，为了使多媒体技术更加人性化，多媒体技术一直被看作信息技术研究的热门课题。目前，多媒体技术研究的关键问题包括多媒体数据的压缩编码与解压缩技术、多媒体数据存储技术、多媒体数据库技术、多媒体通信技术、多媒体信息检索技术及虚拟现实技术等。

1．多媒体数据的压缩编码与解压缩技术2．多媒体数据存储技术3．多媒体数据库技术4．多媒体网络与通信技术5．多媒体信息检索技术6．虚拟现实技术1．多媒体数据的压缩编码与解压缩技术在计算机系统中，大量信息需要在有限的磁盘上存储；在计算机网络中，这些海量信息需要在较窄的信道中传输；另外多媒体技术面对的对象是三维图像、动画、音频及视频等。为了达到令人满意的视频画面质量和音频的听觉效果，必须对视频和音频做到实时处理，而实时处理技术的首要问题便是如何解决计算机系统对庞大的视频、音频等数据的获取、传输和存储问题。所以有效地减少存储量、提高传输速度及达到实时处理的效果就成为多媒体技术处理中的一个关键问题。数据压缩问题的研究自20世纪50年代的PCM编码开始，压缩技术研究的主要问题包括数据压缩比、压缩/解压缩速度以及简捷的算法。至今业界已经制定了一些视频压缩标准，比如H.261、JPEG和MPEG等，其中MPEG标准是一种在高压缩比的情况下，能保证高质量画面的压缩算法，最适用于视频VOD的存储、点播和网上传输等。当然，人们还在寻找更加有效地使用应用软件或硬件技术实现多媒体信息压缩的算法。2．多媒体数据存储技术传统的数据类型主要是整型、实型、布尔型和字符型，而多媒体数据处理中，除了上述常规数据类型外，还要处理图形、图像、声频、视频及动画等复杂数据类型；多媒体的音频、视频、图像等信息然虽经过压缩处理，但仍需相当大的存储空间；此外，多媒体数据量大且无法预估，因而不能用定长的字段或记录块等存储单元组织存储，这在存储结构上大大增加了复杂度。数据的存储技术最早起源于20世纪70年代的终端/主机的计算模式，当时数据是集中在主机上,即以连接在主机上的硬盘和磁带作为主要的存储和备份的设备。20世纪80年代以后，由于个人电脑的发展，客户机/服务器模式的出现使得数据存储分布化，网络上的文件服务器和数据库服务器是重要数据集中的地方，同时客户机也具有一定量的数据存储能力。20世纪90年代Internet的迅猛发展，使得存储技术发生着革命性的变化，这不仅体现在存储容量的急剧膨胀（即海量数据的出现；随着多媒体技术的发展，多媒体数据的多样性、地理位置的分散性也是目前存储技术面临的实际问题）同时对重要数据的安全、共享、管理及虚拟化也提出了更高的要求，这些都对数据存储技术提出了更多的挑战。3．多媒体数据库技术多媒体数据量大且不同媒体之间的特性差异也很大，数据的实时性要求高。另外，由于多媒体数据的复合、分散及时序等特性，使得数据库的查询不可能只通过字符进行，而应通过基于媒体内容的语义查询。目前，以数字视频、音频传输为代表的多媒体信息越来越多，这些多媒体信息具有信息量大、难以描述等特点，所以如何对这些海量信息进行组织、管理、操作和快速有效地检索等就成为数据库技术迫切需要解决的问题。目前基于关系模型的数据库管理系统仍然是主流技术，但是关系模型不适用于表达像文本、声音、图像这些非格式化的数据。简单化的关系模型会破坏媒体实体的复杂联系，丰富的语义性超过了关系模型的表示能力。而面向对象数据库模型对处理复杂的多媒体信息是比较理想的方法，即通过面向对象的数据模型把对象的集合、对象的行为、状态联系在一起，面向对象的概念是新一代数据库应用中所需的强有力的数据模型，但面向对象的数据库仍有许多理论和实现技术没有得到根本的解决，这仍是数据库技术研究的重要问题。4．多媒体网络与通信技术多媒体网络与通信技术是多媒体计算机技术和网络通信技术结合的产物。与普通数据通信不同，多媒体数据传输对网络环境提出了苛刻的要求，由于多媒体数据对网络的延迟特别敏感，所以多媒体网络必须采用相应的控制机制和技术，以保证多媒体数据对网络实时性和同步性的要求。由于公共交换电话网（PSTN）信息传输速率较低，适合传输话音、静态图像和低质量的视频图像等；局域网（LAN）传输延迟大，只适用于文本、图形、图像等非连续媒体信息的数据传输；窄带网N-ISDN能实现综合业务的传输，基本速率接口和基群速率接口能满足压缩视频、音频信号的带宽要求，它是支持可视会议、可视电话和传输静止画面的一种有效技术；宽带网B-ISDN以异步转移模式ATM作为传输与交换方式，充分利用光纤提供巨大的信道容量进行各种综合业务的传输与交换，因其有电路交换延迟小、分组交换效率高及速率可变的特点，将作为未来多媒体通信核心技术。网络多媒体对多媒体网络有以下一些要求：（1）高的吞吐量要求（2）低的网络延时要求（3）安全问题（4）传输服务质量问题（1）高的吞吐量要求。是指对高传输带宽、大存储缓冲带宽的要求和对流量的控制。（2）低的网络延时要求。是指对网络传输延时、抖动要求较高，因为多媒体视频流对网络传输延时和抖动比较敏感，另外传输的视频信号与音频信号必须同步等。（3）安全问题。它可以分为两个方面，一是内容数字版权等内容本身的安全问题，另一个则是关于内容受攻击的问题。到目前为止，安全工作主要集中在内容数字版权方面，为保护内容提供者的利益必须考虑数字版权的管理。数字版权管理的标准涉及授权语言标准、加密标准、密钥管理标准和架构等，由于目前数字版权的管理权还没有明晰，所以没有形成统一标准。（4）传输服务质量问题。如何保证多媒体信息在网络上的传输服务质量是目前研究的热点。近几年来出现了许多宽带技术，人们也提出了一系列相应的质量保证机制和协议，但对于无线网络的质量问题、不同网络多媒体应用，都提出了新的质量要求。目前，全新的电信组网技术、终端设备技术、多媒体技术、电视机技术、计算机IP网络承载技术组合成了多媒体网络通信新的技术学科。它的出现将有力地推动IP电话、视频会议、高清晰度电视、视频点播等领域的发展，推进电信网、计算机网和有线电视网络相互融合的进程。5．多媒体信息检索技术多媒体技术和Internet的发展给人们带来海量的多媒体信息，进而导致了超大型多媒体信息库的产生，所以凭借关键词难以足够形象和准确地对多媒体信息进行检索，进而需要找到针对多媒体信息有效的检索方式。因而有效地帮助人们快速、准确地找到所需要的多媒体信息成了多媒体技术解决的核心问题之一。基于内容的信息检索（Content-BasedRetrival）作为一种新的检索技术，是对多媒体对象的内容及上下文语义环境进行检索，如对图像中的颜色、纹理、形状或视频中的场景、片断进行分析和特征提取，并基于这些特征进行相似性匹配。基于内容的多媒体检索是一个新兴的研究领域，目前国内外都在探索和研究，目前虽然有一些基于内容的检索算法，但存在着算法处理速度慢、检索率低、应用局限性等问题。随着多媒体内容的增多和存储技术的提高，对基于内容的多媒体检索的需求将日益上升。目前在语音识别方面，IBM公司的ViaVoice已趋于成熟，另外剑桥大学的VMR系统，以及卡内基梅隆大学的Informedia都是很出色的音频处理系统。在基于内容的音频信息检索方面，美国的Muscle·fish公司推出了较为完整的原型系统，对音频的检索和分类有较高的准确率。但在图像、视频等内容识别方面还不成熟。作为一门交叉学科，基于内容的多媒体信息检索不仅需要利用图像处理、模式识别、计算机视觉、图像理解等多领域的知识做铺垫，还需要人工智能、数据库管理技术、人机交互等领域对媒体数据进行表示，从而设计出可靠、高效、人性化的检索系统。6．虚拟现实技术虚拟现实（VirtualReality，VR）是一种先进的计算机用户接口，它通过给用户同时提供诸如视觉、听觉、触觉等各种直观而又自然的实时感知交互手段，最大限度地方便用户的操作。虚拟现实是多种技术的综合，包括实时三维计算机图形技术、广角立体显示技术、对观察者的头、眼和手的跟踪技术，以及触觉/力觉反馈、立体声、语音输入输出技术等。较早的虚拟现实产品是图形仿真器，其概念在20世纪60年代被提出，到80年代逐步兴起，90年代产品问世。虚拟现实技术应用非常广泛，涉及航天、军事、通信、医疗、教育、娱乐、图形、建筑和商业等各个领域。

虚拟现实技术的主要特征包括以下一些。（1）多感知性（2）浸没感（3）交互性（4）构想性（1）多感知性。是指除了一般计算机技术所具有的视觉感知之外，还有听觉感知、力觉感知、触觉感知、运动感知、味觉感知及嗅觉感知等。理想的虚拟现实技术应该具有一切人们所具有的感知功能。由于相关技术限制，目前虚拟现实技术所具有的感知功能仅限于视觉、听觉、力觉、触觉、运动等几种。（2）浸没感。是指用户感到作为主角存在于模拟环境中的真实程度。理想的模拟环境应该使用户难以分辨真假，使用户全身心地投入到计算机创建的三维虚拟环境中，该环境中的一切看上去是真的，听上去是真的，动起来是真的，甚至闻起来、尝起来等一切感觉都是真的，如同在现实世界中的感觉一样。（3）交互性。是指用户对模拟环境内物体的可操作程度和从环境得到反馈的实时性。（4）构想性。是指虚拟现实技术应具有广阔的可想象空间，即拓宽人类认知范围，不仅可再现真实存在的环境，也可以随意构想客观不存在的甚至是不可能发生的环境。虚拟现实研究内容涉及到人工智能、计算机科学、电子学、传感器、计算机图形学、智能控制、心理学等。目前虚拟现实技术已经取得了一定的成就，但大部分仅仅限于扩展了计算机的接口能力，虽然这个领域的应用前景广阔，但仍存在着许多尚未解决的理论问题和尚未克服的技术障碍。但专家预测，随着计算机软、硬件技术的发展和价格的下降、通信技术的发展及虚拟现实技术的完备，预计本世纪虚拟现实技术会进入家庭。1.3多媒体技术应用领域及发展前景1.3.1多媒体技术应用领域1.3.2多媒体技术发展前景1.3.1多媒体技术应用领域多媒体技术是一种实用性很强的技术，它改善了人机交互界面，集声、文、图、像处理一体化，更方便了人们的信息交流方式。随着多媒体技术的深入发展，其应用越来越广泛，已渗透到各个领域和国民经济的各个方面。1．多媒体在网络通信中的应用2．多媒体电子出版物3．多媒体在教学、培训中的应用4．多媒体家电5．办公自动化

1．多媒体在网络通信中的应用多媒体通信的概念形成于20世纪80年代。世纪80年代后期，国外一些著名的研究机构开始进行有关多媒体通信的研究和开发工作，并在实验室内研制了一些雏型系统。近几年来，随着多媒体技术的迅速发展，一方面，多媒体技术使计算机能同时处理视频、音频和文本等多种信息，提高了处理信息的多样性；另一方面，网络通信技术消除了人们之间的地域限制。二者结合所产生的多媒体通信技术把计算机的交互性、通信的分布性有效地融为一体。

（1）视频会议

（2）远程医疗

（3）远程教学

（4）视频点播

（5）多媒体监控及监测系统（1）视频会议多媒体会议系统可以是点对点多媒体信息的交互和传输，也可以是点对多和多对多的交互和传输，其网络平台可以在局域网上运行，也可以在令牌环网、城域网、广域网以及ISDN网上运行，甚至可以在Internet、Intranet或公用电话网（PSTN）上运行。通过计算机远程参加会议，以可视化、实时的、交互的方式实现在不同地理位置的参会人员信息交流。目前在局域网和ISDN网上都已推出多媒体会议系统实用产品。在ISDN网上一般按H.320协议规范，局域网为H.323协议规范，而公用电话网则按H.324协议规范。多媒体会议系统一般分为两大类，一类是基于会议室的视频会议系统（Room-basedVideoConferencing），另一类是桌面视频会议系统（DesktopVideoConferencing）。国外推出的视频会议系统有：Intel公司的Proshare200系统，支持H.320标准协议，在LAN和窄带ISDN网上可实现20帧/秒的传输；CLI公司的DesktopVideo，在ISDN网上使用。国内推出了多媒体会议系统，如清华大学计算机系推出的基于MPEG-1的桌面会议系统等。（2）远程医疗随着多媒体技术发展，已具备了进行远程医疗的条件。利用电视会议进行双向或双工音频及视频交互，与病人面对面地交谈，进行远程咨询和检查，从而进行远程会诊，另外在远程专家指导下进行复杂的手术，并在医院与医院之间，甚至国与国之间的医疗系统建立信息通道，实现信息共享。（3）远程教学网络远程教育模式依靠现代通信技术及多媒体技术的发展，大幅度地提高了教育传播的范围和时效，使教育传播不受时间、地点、国界和气候的影响。目前，各大专院校都投入了很多力量重点实施远程教育，以解决边远地区的教育问题，以及进行专业文化的普及和提高。另外通过远程教学，使学生打破校园界限，改变传统的“课堂教学”的概念，可以接受到来自不同国家、教师的指导，可获得除文本以外更丰富、直观的多媒体教学信息，共享教学资源，它可以按学习者的思维方式来组织教学内容，也可以由学习者自行控制和检测，使传统的教学由单向转向双向，实现了远程教学中师生之间、学生与学生之间双向交流。（4）视频点播视频点播（VOD）系统是一种为用户提供不受时间、空间限制浏览和播放多媒体信息的人机交互应用系统。通过该系统可以任意点播视频点播系统中的影片，并可随意切换、重复点播，用户能够控制快进与快退、向前与向后查看、开始、暂停、取消或移到别的场景，这为用户提供了极大的方便。另外，还可利用该系统对信息、新闻或卡拉OK、游戏等进行点播，但前提是这些内容必须事先装入系统中。（5）多媒体监控及监测系统多媒体监控系统的引入可以提高效率，减少人员开销，实现无人管理,在发现问题时，采用自动控制或集中进行人工干预。目前很多地方都安装了多媒体监控系统，如电力系统对电厂、变电站及石油、化工行业中一些部门的管理。在工业生产实时监控系统中，尤其在现场故障诊断和生产过程中参数监测等方面有着非常重要的应用价值。另外，在一些危险部门中也可使用管理监控,如核能的监控、水下作业的监控等。现在多媒体监控系统已用于交通管理，其成效也是显著的。目前城市的交通拥挤现象非常普遍，通过监控系统对各个重要的交通路口的行人和车辆进行实时监控，监控中心每时每刻都能够准确地观测到各重要交通枢纽和干线上行人、车辆的动态分布,然后根据这一分布情况进行疏导，可大大改善和减轻长期困扰我们的交通拥塞现象。2．多媒体电子出版物电子出版物是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上，通过计算机或类似设备阅读使用，并可复制发行的大众传播媒体。多媒体电子出版物是20世纪80年代发展起来的新兴产业。电子出版物的内容可分为电子图书、辞书手册、文档资料、报刊杂志、教育培训、娱乐游戏、宣传广告、信息咨询、简报等，许多作品是多种类型的混合。多媒体电子出版物发展很快，不少大学图书馆中电子图书不断增加，上海交通大学建立了数字图书馆，在校园内提供文献检索，并建立多种有特色的科学信息库。按目前的发展趋势，未来的图书馆将走向数字化，实现无图书的图书馆。电子出版物的出版形式有电子网络出版和单行电子书刊两大类。电子网络出版是以数据库和通信网络为基础的出版形式，在计算机管理和控制下，向读者提供网络联机服务、传真出版、电子报刊、电子邮件、教学及影视等多种服务。而单行电子书刊载体有软盘（FD）、只读光盘（CD-ROM）、交互式光盘（CD-I）、图文光盘（CD-G）、照片光盘（Photo-D）、集成电路卡（IC）和新闻出版者认定的其他载体等。随着光盘技术不断发展，VCD和DVD不断推出新品种，价格不断降低，这给电子出版物提供了广阔的发展空间。3．多媒体在教学、培训中的应用在以多媒体计算机为核心的现代教育技术中加入了音频、动画和视频，使教学手段变得丰富多彩。多媒体教学系统有如下效果：学习效果好，说服力强，教学信息的集成使教学内容丰富、信息量大；感官整体交互，学习效率高；各种媒体与计算机结合可以使人类的感官与想象力相互配合，产生前所未有的思维空间与创造资源。各种计算机辅助教学软件（CAI）及各类视听类教材图书、培训材料等使现代教育教学效果越来越好。比如，IBM公司将一部动物百科全书制作到一张光盘上，盘中存有229种动物的资料，含700张全屏幕彩色图片、150张动物习性图、45个视频剪辑动画片，另外还有高保真的动物声音、交互式游戏及弹出式窗口，学生很容易运行该软件，轻松愉快地学到动物知识。这种多媒体教学、培训手段已完全不同于传统的教学模式，可以预见，今后多媒体技术必将越来越多地应用于现代教学实践中，并将推动整个教育事业的发展。4．多媒体家电多媒体家电是计算机应用中一个很大的领域。现在，在计算机上插上一块板卡就可以看电视了。另外数字电视已经走入市场,它将电视信号进行数字化采样，经过压缩后进行播放。把电视台所拥有的丰富的信息资源都以数字化多媒体信息的形式保存在一个巨大的信息库中，用户可以通过计算机网络访问信息库，选择所需要的内容，安排播放的顺序。人们不再满足于被动的接受电视台安排的播放时间观看电视台安排的节目内容，而在任何时间都可以享用电视台的信息资源，电视台变成了一个公用的多媒体信息库。目前，家电市场上出现了具有多媒体MP4功能的微波炉，可以用来听音乐，其表面显示屏可看图片、文字、视频等多媒体功能，它具备多媒体遥控接收窗口以及外接存储插口（USB/SD）。它还内置各种烹饪菜单，可以直接通过画面学做菜。而多媒体冰箱除了具有常规冰箱的功能外，还可以看电视，自由连接电脑、DVD机、DV、DC等各类外设，此外还支持MP3、MPEG、JPG等流行格式文件播放，功能比传统电视还强大。而多媒体最看得见的应用就是数字化的音乐和影像进入了家庭。由于数字化的多媒体具有传输储存方便、保真度非常高的特点，在个人电脑用户中广泛受到青睐，而专门的数字视听产品（如CD、VCD、DVD等设备）也大量进入了家庭。5．办公自动化多媒体技术为办公室增加了控制信息的能力和充分表达思想的机会，许多应用程序都是为提高工作人员的工作效率而设计的，从而产生了许多新型的多媒体办公系统，该系统将数据库、多媒体结合在一起，使文档管理、人事档案管理、公共信息查询、客户地址、名片、电话服务等更形象、方便、高效。由于采用了先进的数字影像和多媒体计算机技术，把文件扫描仪、图文传真机，文件资料微缩系统等和通信网络等现代化办公设备综合管理起来，构成了全新的办公自动化系统。此外，多媒体技术与通信业的结合已形成的新的应用领域——视频会议，使得在不同地点办公的人员可以通过显示器或电视屏幕来传达文件、进行讨论、协调工作等，无须关心地理位置上的差异，只需把自己要准备的方案、档案资料准备好，就可以随时交给“与会”各方，“面对面”地讨论问题。这种多媒体视频会议降低了成本，缩短了决策周期，提高了工作效率，真正做到了快捷高效。1.3.2多媒体技术发展前景伴随着社会信息化步伐的加快和低成本高速处理芯片的应用，数字信息的数量在今后几十年中将急剧增加，质量上也将大大地改善，多媒体正以迅速的、意想不到的方式进入人们生活的方方面面。总的来看，多媒体技术正向以下几个方向发展。1．多媒体与宽带网络通信结合的网络化2．多媒体智能化3．多媒体终端集成化4．多媒体技术标准化1．多媒体与宽带网络通信结合的网络化在当前形式下，有线电视网、通信网和因特网这三网正在日趋统一，并在技术上不断地改进，将给我们提供充裕的带宽，各种多媒体系统尤其是基于网络的多媒体系统，如可视电话系统、点播系统、电子商务、远程教学和医疗等将会得到迅速发展。另外，技术的创新和发展将使诸如服务器、路由器、转换器等网络设备的性能越来越高，包括用户端CPU、内存、图形卡等在内的硬件性能空前扩展，它使网络应用者改变以往被动地接受处理信息的状态，并以更加积极主动的姿态去参与眼前的网络虚拟世界。多媒体技术的发展使多媒体计算机将形成更完善的计算机支撑的协同工作环境，在网络环境的支持下消除了空间距离的障碍，也消除了时间距离的障碍，为人类提供更完善的信息服务。交互的、动态的多媒体技术能够在网络环境创建出更加生动逼真的二维与三维场景，人们还可以借助摄像等设备，把办公室和娱乐工具集成在终端多媒体计算机上，可与在世界任意角落的朋友进行实时的交流。2．多媒体智能化 1993年12月，英国计算机学会在英国Leeds大学举行了多媒体系统和应用（MultimediaSystemandApplication）国际会议。MichaelD.Vislon（RutherfordAppletonaboratory）在会上作了关于建立智能多媒体系统的报告，明确提出了研究智能多媒体技术问题。多媒体计算机将充分利用计算机的快速运算能力，综合处理声音、文字、图像、视频等信息，用交互式弥补计算机智能的不足，而进一步的发展就应该是增加计算机的智能，根据我国的国情和现状，切实可行的方案是使多媒体计算机增加如下的智能。

（1）文字的识别和输入：印刷体汉字、联机手写体汉字以及脱机手写体汉字的识别和输入。（2）汉语语音的识别和输入：主要是特定人、非特定人以及连续汉语语音的识别和输入。（3）自然语言理解和机器翻译：汉语的自然语言理解和机器翻译。（4）图形的识别和理解。（5）机器人视觉和计算机视觉。（6）知识工程以及人工智能的一些课题。目前，国内有的单位已经初步研制成功了智能多媒体数据库，它的核心技术是将具有推理功能的知识库与多媒体数据库结合起来形成智能多媒体数据库。另外，基于内容检索的多媒体数据库使多媒体终端设备具有更高的智能化，对多媒体终端增加如文字的识别和输入、汉语语音的识别和输入、自然语言理解和机器翻译、图形的识别和理解、机器人视觉和计算机视觉等智能。总之，将人工智能领域某些研究课题和多媒体计算机技术很好地结合起来就是多媒体计算机长远的发展方向。3．多媒体终端集成化计算机产业的发展趋势应该是把多媒体和通信的功能集成到CPU芯片中，过去计算机结构设计较多地考虑计算功能，主要用于数学运算及数值处理，最近几年随着多媒体技术和网络通信技术的发展，需要计算机具有综合处理声音、文字、图像、视频信息及通信的功能。从目前的发展趋势看可以把这种芯片分成两类：一类是以多媒体和通信功能为主，融合CPU芯片原有的计算功能，它的设计目标是用在多媒体专用设备、家电及宽带通信设备上，可以取代这些设备中的CPU及大量ASIC和其他芯片；另一类是以通用CPU计算功能为主，融合多媒体和通信功能，它的设计目标是与现有的计算机系列兼容，同时具有多媒体和通信功能，主要用于多媒体计算机中。近年来随着多媒体技术的发展，TV与PC技术的融合越来越引人注目，传统的电视主要用在娱乐，而PC重在获取信息。随着电视技术的发展，电视浏览收看功能、交互式节目指南、电视上网等功能应运而生。数字机顶盒技术适应了TV与PC融合的发展趋势，延伸出“信息家电平台”的概念，使多媒体终端集家庭购物、家庭办公、家庭医疗、交互教学、交互游戏、视频邮件和视频点播等全方位应用于一身，代表了当今嵌入化多媒体终端的发展方向。嵌入式多媒体系统可应用在人们生活与工作的各个方面，在工业控制和商业管理领域，如智能工控设备、POS/ATM机、IC卡等；在家庭领域，如数字机顶盒、数字式电视、WebTV、网络冰箱、网络空调等消费类电子产品；此外，嵌入式多媒体系统还在医疗类电子设备、多媒体手机、掌上电脑、车载导航器、娱乐、军事方面等领域有着巨大的应用前景。人们提出了信息家电新理念，有人预测未来的家庭不必购买那么多的家用电器，而以一个多媒体系统代之。它能够提供比现在所有家用电器更多更强的服务功能，如欣赏声像图书馆的各种资料，阅读电子杂志、向综合信息中心咨询、电子购物等。另外，还可以采用多媒体信息形式的远程通信，虽然相距遥远，但其交谈和合作的感受却如同相聚一室。4．多媒体技术标准化各类标准的研究将有利于产品规范化，应用更方便。因为以多媒体为核心的信息产业突破了单一行业的限制，涉及到诸多行业。而多媒体系统的集成特性对标准化提出了很高的要求，所以必须开展标准化研究，它是实现多媒体信息交换和大规模产业化的关键所在。多媒体技术从单机单点向分布、协同多媒体环境的网络方向发展，以网络为中心的多媒体计算机将是信息技术中的一场新的革命，而多媒体技术将与相邻技术结合以提供完善的人机交互环境，将继续向其他领域扩展，使其应用的范围进一步扩大。总之，新一代的多媒体将是网络多媒体、交互多媒体、自适应多媒体。多媒体技术作为一种整体性的技术，它的研究和发展需要多方面专家的合作，它的完善与成熟将是多学科、多领域、多技术共同发展的结果。第2章音频信号的获取与处理2.1多媒体音频基础知识2.2音频编辑软件CoolEdit的使用2.1多媒体音频基础知识最初的音频是用电信号记录下来进行存储和传输的，是模拟信号，而计算机处理的是数字音频，数字音频有独特的获取和处理方式。

2.1.1声音信号的数字化2.1.2数字音频的获取方式2.1.3数字音频的文件格式2.1.1声音信号的数字化1．声音的基础知识2．模拟音频和数字音频1．声音的基础知识声音是通过一定介质（如空气、水等）传播的一种连续的波，声音的主要传播介质是空气，因此，声音的本质是空气振动，由于空气振动引起耳膜的振动，然后被人耳所感知。声音的本质是空气振动，但并不是所有的空气振动都能被人耳所感知。声音信号的频率是指声音信号每秒钟变化的次数，用Hz表示。人耳所能感觉到空气振动的频率范围大约为20Hz～20kHz。因此，多媒体技术中所研究的音频（Audio）信号是指频率范围在20Hz～20kHz之间的声波，即人耳能识别的声音。如图2-1所示，音频信号包括语音（Speech）信号和非语音（Sound）信号两类。语音信号是指频率范围和人说话的信号频率范围一致的信号，人的发音器官发出的声音的频率范围大约在80～3400Hz之间，而人说话的信号频率通常在300～3000Hz之间。语言是人类社会的一种特有的信息系统，是社会交际工具的符号，而语音是语言的物质外壳（载体）。语音识别是多媒体技术的一个重要的研究方向，即希望计算机能自由地“听懂”人类的语言。非语音是指语音信号范围外的人耳所能识别的音频信号，主要包括乐音和杂音，非语音信号的特点是不具有复杂的语义和语法信息，信息量比较低，因此识别简单。

声音具有音调、音强和音色3个要素。（1）音调：由声音信号的频率所决定，对声音频率的感觉表现为音调的高低，在音乐中称为音高。（2）音强：决定声音的强弱，由声音信号的幅度决定，通常用音量来描述音强，以分贝（dB）为单位。人类能感知的声音的幅度范围在0～120（dB）之间。（3）音色：由声音的频谱决定。声波的各阶谐波的比例不同，随着时间衰减的程度不同，音色随之变动。2．模拟音频和数字音频声音是机械振动，振动越强，声音越大。声波本身难以进行远距离传送，而且也不能存储。为了将声音进行存储和传输，通常是将声音信号转换为电信号，用电压或电流的幅度表示声音强弱。这样声音信号表现为在时间和幅度上都是连续的电信号，如图2-2所示，这样表示的音频信号即模拟音频。模拟音频是连续的，然而计算机只能处理以0和1的形式表示的离散的信号量。在计算机内，所有的信息均以数字表示。各种命令是不同的数字，各种幅度的物理量也是不同的数字。要想在计算机中对音频信号进行存储、传输、播放、处理，就必须进行音频的模/数转换，即把模拟音频信号数字化，形成数字音频。如图2-3所示，将连续的模拟音频信号转换为离散的数字音频信号，通常采用的方法是每隔固定时间间隔对模拟音频信号抽取一个振幅值，并用给定位数的二进制数表示。这个过程经过了两步，第一步是采样，第二步是量化。（1）采样（Sampling）：在某些特定的时刻对模拟信号进行测量叫做采样，由这些特定时刻采样得到的信号称为离散时间信号，采样的作用是把连续的时间信号变为离散的时间信号。（2）量化（Quantization）：经过采样获得的离散时间信号的幅度值依然是连续的，因此需要对这些幅度值进行量化。把幅度区间划分成n个区间，一个区间对应于一个幅度值，对于所有落入第i个区间的任何幅度值，都用同一个幅度值来表示。这个过程称为量化。音频经过数字化采样和量化得到的时间和幅度都离散的数字信号就称为数字音频信号。由上论述可知，声音数字化也即对连续的模拟声音信号进行离散化，这种离散要进行两方面的离散，即时间的离散和强度的离散。连续时间的离散化通过采样来实现；连续强度的离散通过量化来实现。此时就需要考虑两个问题：一是在哪些时刻对声音进行采样，即每秒钟需要采集多少个声音样本，也就是采样频率是多少；二是每个样本用多少个二进制位来存储，即每个声音样本的位数应该是多少，也就是量化精度。采样频率一般是由奈奎斯特采样定理决定。奈奎斯特采样理论（Nyquisttheory）指出，采样频率不应低于声音信号最高频率的两倍，这样才能把以数字表达的声音还原成原来的声音。奈奎斯特理论采样定理用公式表示为 fs≥2f或者Ts≤T/2

其中fs为采样频率，Ts为采样周期，f为被采样信号的最高频率，T为被采样信号的最小周期。采样频率的高低是根据奈奎斯特理论和声音信号本身的最高频率决定的。例如，电话话音的信号最高频率约为3.4kHz，采样频率通常选为8kHz。量化样本的位数由计算机的性能和对声音质量的要求决定，一般有8位量化、16位量化和32位量化，即分别用一个字节、两个字节和四个字节存放一个采样点的幅度值。量化位数越高，需要的存储空间越大，但此时声音细节的丢失比较少，声音的质量较好。2.1.2数字音频的获取方式在多媒体应用软件中，经常要使用音频素材。数字音频的获取主要有以下几种方式：（1）使用声卡采集模拟设备上的声音信息，并以文件的形式存储在计算机中。（2）使用声卡录制声音信息，并以文件的形式存储在计算机中。（3）使用声卡及MIDI设备在计算机上创作乐曲。（4）从互联网下载或购买音频光盘。（5）从CD或VCD上截取音频数据。（6）从视频上获取音频数据。2.1.3数字音频的文件格式数字音频数据在计算机中以文件的形式出现。流行的声音文件格式很多，以WAV、MP3、MIDI为扩展名的文件格式比较常见。

1．WAV格式音频文件2．VOC格式音频文件3．MP3格式音频文件4．RA格式音频文件5．MIDI格式音频文件6．WMA格式音频文件1．WAV格式音频文件 WAV格式音频文件是最早出现的数字音频格式，也叫波形声音文件，由Microsoft公司和IBM公司共同开发。它记录了对实际声音采样的数据，被Windows平台及其应用程序广泛支持。WAV格式支持多种音频量化位数、采样频率和声道。采用44.1kHz的采样频率、16位量化位数的WAV文件的音质与CD相差无几。 WAV文件数据的缺点是数据量大，优点是音质较好，而且它还是一种标准数字音频，大多数压缩格式的声音都是在它的基础上经过数据的重新编码来实现的，这些压缩格式的声音信号在压缩前和回放时都要使用WAV格式。2．VOC格式音频文件 VOC格式音频文件是CreativeLab公司开发的声音文件，也是声霸卡使用的音频文件格式，被Windows平台支持。每个VOC文件由文件头块和音频数据块组成。文件头包含一个标识、版本号和一个指向数据块起始的指针。数据块分成各种类型的子块，如声音数据、静音、标记、ASCII文件以及终止标志、扩展块等。3．MP3格式音频文件 MP3的全称是MPEG-1AudioLayer3，是近年来颇为流行的音乐文件，它在1992年被合并至MPEG规范中。MP3文件的音质较好，并且文件的数据量较小。4．RA格式音频文件 RA文件是RealNetwork公司开发的一种流式音频文件，主要应用于网络上进行音频传输，网络连接连率不同，客户端所获得的声音质量也不尽相同。对于传输速率为14.4kbit/s的网络连接可获得调幅（AM）质量的音质；对于传输速率为28.8kbit/s的网络连接，可以达到广播级的声音质量；如果拥有更快的线路连接，则可获得CD音质的声音。5．MIDI格式音频文件 MIDI是MusicalInstrumentDigitalInterface的缩写，又称做乐器数字接口，是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其他电子设备交换音乐信号的方式，规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议，可以模拟多种乐器的声音MIDI文件就是MIDI格式的文件，在MIDI文件中存储的是一些指令，声卡接收到这些指令后就按照指令将声音合成出来。6．WMA格式音频文件 WMA文件是Microsoft公司开发的一种音频压缩格式，存储容量比MP3小，但音质稍差。2.2音频编辑软件CoolEdit的使用在多媒体的制作领域，音频是不可或缺的部分。音频的处理通常包含声音的编辑、特殊效果的添加及文件格式转换等操作。常见的音频处理软件有Windows操作系统中的SoundRecorder（通常被称做录音机）、SoundBlaster系列音频卡所附带的WaveStudio以及一些专门的多媒体音频处理软件，如GoldWave、CoolEdit等。本节以CoolEdit为例，介绍声音录制和编辑的基本技能以及一些特殊处理方法。2.2.1CoolEditPro简介2.2.2CoolEdit的基本操作

2.2.3使用CoolEdit进行音频编辑的综合实例2.2.1CoolEditPro简介 CoolEditPro由美国Syntrillium软件公司开发的，它经历了一系列版本，如CoolEditPro1.0/1.1/2.0/2.1等。CoolEditPro2.1为该软件的最高版本，之后该软件被实力更为强大的Adobe公司收购，随即推出AdobeAudition。AdobeAudition和CoolEditPro2.1在功能和界面上十分相近。 CoolEdit的主要功能有录制和采集音频文件；对音频文件进行剪切、粘贴、合并、重叠声音等操作；提供多种特效（如放大、降低噪音、扩展、回声、延迟、失真、调整音调等）；可以生成噪音、低音、静音、电话信号等声音；可以实现自动静音检测和删除、自动节拍查找等功能；可以在多种音频文件格式之间进行转换。1．CoolEdit界面2．CoolEdit功能菜单1．CoolEdit界面 CoolEdit有两种编辑状态，即波形编辑状态和多音轨编辑状态，如图2-4和图2-5所示，这两种状态可以通过快捷键【F12】或默认工具栏的第一个按钮进行切换。波形编辑状态主要用来对音频进行编辑，多音轨编辑状态主要用来进行音频合成。 CoolEditPro2.1波形编辑状态从上到下共分为标题栏、菜单栏、工具栏、资源管理区、波形显示区、操作区、状态栏显示区六个部分，如图2-4所示。2．CoolEdit功能菜单 CoolEdit2.1在波形编辑窗口界面共有10个一级菜单，包括File（文件）、Edit（编辑）、View（查看）、Effects（效果）、Generate（生成）、Analyze（分析）、Favorites（偏好）、Options（选项）、Window（窗口）、Help（帮助）和30多个快捷工具，下面进行简单介绍。

（1）File（文件）

（2）Edit（编辑）

（3）View（查看）

（4）Effects（效果）

（5）Generate（生成）

（6）Analyze（分析）

（7）Favorites（偏好）（1）File（文件）此菜单主要为对音频文件的一些操作，如新建、打开、关闭、存储等，同时包括如下一些专为音频文件设计的操作。● OpenAppend（追加）：将一个音频文件连接在一个已打开的文件的尾部。● ExtractAudiofromVideo（从视频提取声音）：可以从视频文件中把声音提取出来，主要是针对*.avi、*.mpg等格式的视频文件。● SaveSelection（保存选取区域）：允许将当前选中的部分波形文件单独保存下来。● FreeHardDriveSpace（清理硬盘空间）：CoolEdit进行音频编辑时，会随时产生一些临时文件并存储在指定的临时文件夹中，在硬盘中占了很大空间，使用该命令可以清空这些临时文件。（2）Edit（编辑）此菜单包含了一些常用的剪贴板操作，如复制、粘贴、删除等。其中属于音频文件的特有操作如下。● MixPaste（混合粘贴）：将剪贴板中的波形内容混合到当前波形文件中。● InsertinMultitrack（插入多轨工程）：将当前文件或当前文件被选中部分在多轨窗口中插入一个新轨，要事先在多轨模式下选择好轨道和音频块的开始位置，用鼠标单击即可。● DeleteSilence（删除静音）：删除波形文件中分贝极小的信号，可以使当前文件变短。●ZeroCrossings（零点定位）：将选中区域的开头和结尾自动调节在无声的状态。●FindBeats（确定节拍）：自动查找音乐中一个完整的拍子的起止点。●AdjustSampleRate（调整采样率）：改变声卡播放当前音频文件时所用的采样频率。●ConvertSampleType（转换音频格式）：改变当前文件的采样频率和量化位数等参数。（3）View（查看）大多为一些打开/关闭各子窗口以及快捷工具栏命令，其中比较常用的和音频操作相关的子菜单如下。●MulititrackView（多轨窗口切换）：切换到多轨编辑状态。●WaveformView（波形编辑窗口）：显示波形。●SpectralView（频谱编辑窗）：显示频谱。（4）Effects（效果）它是CoolEdit中的主要功能菜单，可以为音频增加很多特效。●Invert（反相）：将波形的上半周和下半周互换。●Reverse（倒置）：将被选中的波形的开头和结尾反相。●Silence（静音）：将被选中的波形变成零振幅的信号。●Amplitude（波形振幅）：对音频信号振幅的处理，即改变声音信号的音量。该菜单下有8个子菜单，可以通过对声音信号音量的改变获得一些特殊效果。●DelayEffects（延迟效果）：对延迟混响效果的处理，有11个子菜单，可以制作出一些场地声音、合唱效果等。●DirectX：列出支持的Direct的效果器插件。●Filters（滤波器）：可以对音频信号进行各种滤波处理。●Special（特殊处理）：产生一些特殊效果。●NoiseReduction（噪音消除）：消除选中音频的噪音。（5）Generate（生成）

可以生成一些特殊的声音●Silence（静音）：生成静音。●Tone（音调）：根据你的选择，生成一些标准信号音。●Noise（噪波）：生成噪音信号。●DTMFSignals：生成类似电话拨号音的信号。（6）Analyze（分析）自动对声音信号内部信息进行分析，并给出一些可视化的结果。●ShowFrequencyAnalyze：显示音频信号的频谱分析图像。●ShowPhaseAnalyze：显示音频信号的相位分析图像。●Statistics：显示音频信号波形统计数据。（7）Favorites（偏好）显示曾经使用过的效果编辑命令。2.2.2CoolEdit的基本操作1．声音的录制

2．音频数据的编辑

3．音量调节功能4．噪音消除功能

5．改变音频文件播放速度、音调高低1．声音的录制

在一个具有声卡的计算机上，使用CoolEdit可以通过麦克风直接录制外界声音，也可以从录音机、CD唱机等外界媒体设备获得声音。（1）准备工作（2）创建音频文件（1）准备工作录制声音前的准备工作主要从硬件安装和软件设置两方面进行。

音频处理所必需的硬件有声卡、音箱、麦克风等。首先安装好声卡，将麦克风与声卡的MICIN接口连接，将音箱与声卡的LINEOUT接口连接。如果是从录音机或CD唱机获得声音，需将录音机、CD唱机等输出端与声卡的LINEIN接口正确连接。软件设置需要做的工作是设置计算机的多媒体属性、选择录音设备等。具体操作是在Windows的【开始】菜单中选择【附件】→【娱乐】→【音量控制】命令，打开如图2-6所示的【音量控制】窗口。在【音量控制】窗口中选择【选项】→【属性】命令，打开音频属性对话框，如图2-7所示。在音频属性对话框中选择调节录音设备音量，勾选【Mic】选项前的复选框，单击【确定】按钮，弹出如图2-8所示的【录音控制】窗口，在其中将【Mic】选项下的复选框勾中。（2）创建音频文件运行CoolEdit程序，执行【File】→【New】命令，弹出新建音频文件对话框，如图2-9所示。在对话框中选择采样频率、量化位数、声道数后单击【确定】按钮。然后单击功能键中的录音按钮，开始录音，录制完毕单击停止按钮停止录音。按空格键，试听录音效果，再按一次空格键，结束试听。执行【File】→【SaveAs】命令，在出现的保存文件对话框中将录音保存到磁盘中。2．音频数据的编辑音频数据的编辑包括声音片段的选择、拷贝、剪切、删除、粘贴等操作。在CoolEdit中，不管进行什么操作，都要首先选择需要处理的区域，如果不选择，CoolEdit默认对整个音频文件进行操作。 CoolEdit中提供了三种音频粘贴方式。（1）普通粘贴（2）粘贴到新文件（3）混合粘贴（1）普通粘贴：执行【Edit】→【Paste】命令将内部剪贴板上的数据插入到当前波形插入点位置。这样插入点前的原波形文件和插入点后的原波形文件不变，只是在两个声音间插入了新的内容。（2）粘贴到新文件：执行【Edit】→【PastetoNew】命令可将剪贴板中的波形数据创建一个新文件。（3）混合粘贴：执行【Edit】→【MixPaste】命令可以弹出一个混合粘贴对话框，如图2-10所示。在对话框左下方的粘贴模式中选择【Overlap】模式，即叠加模式，可以将剪贴板中的音频数据叠加在文件已选中的音频数据中。3．音量调节功能【Effects】菜单下的【Amplitude】子菜单下有一系列和音频信号振幅相关的选项，可以实现音量调节、淡入淡出效果、去除人声等操作。（1）音量调节：该功能可以实现声音音量的提高或降低。执行【Effects】→【Amplitude】→【Normalize】命令，在弹出的对话框的【Normalizeto】选项中输入音量调节的百分比，如图2-11所示，然后单击【OK】按钮，被选中音频的音量改变了。

（2）淡入淡出效果：该功能可以实现一首歌曲开始时慢慢地从弱到强，结束时，声音慢慢地从强到弱消失。【示例1】为音乐设置淡入淡出效果【测试点】测试【Effects】菜单的淡入淡出功能。【效果】开始时音乐淡入，结束时音乐淡出。【步骤】

Step1.使用【File】→【Open】命令，打开歌曲“bigbigworld.mp3”。Step2.选中音乐开始时的50秒，执行【Effects】→【Amplitude】→【Envelope】命令，在弹出的【CreateEnvelope】对话框中选择【SmoothFadeIn】选项，单击【OK】按钮，如图2-12所示。 Step3.选中音乐结束时的50秒，执行【Effects】→【Amplitude】→【Envelope】命令，在弹出的对话框中选择【SmoothFadeOut】选项，单击【OK】按钮。 Step4.按播放按钮进行试听。（3）去除人声：该功能可以用来制作伴奏音乐，可以将一首歌曲中人的声音去掉，只留下乐器伴奏的声音。执行【Effects】→【Amplitude】→【ChannelMixer】命令，在弹出的【ChannelMixer】对话框的【Presets】栏中选择【VocalCut】选项，如图2-13所示。4．噪音消除功能通常自己录制的音频由于环境问题往往带有噪音，这种环境噪音一般贯穿整个声音文件始终，可以使用CoolEdit去除这种噪音。【示例2】消除噪音【测试点】测试【Effects】菜单的噪音消除功能。【效果】针对一段具有环境噪音的音频文件，处理后噪音消失。【步骤】 Step1.录制一段音频文件（例如一首歌或一段旁白）并保存。 Step2.选中音频开始时的环境噪音（此时人声还没有开始），如图2-14所示，呈现白色的区域即为被选中区域。Step3.执行【Effects】→【NoiseReduction】→【NoiseReduction】命令，在弹出的对话框中单击【GetProfilefromSelection】按钮，如图2-15所示，即可从刚才选中的噪音样本中提取噪音信息。然后单击【Close】按钮，回到波形界面。 Step4.执行【Edit】→【SelectionEntireWave】命令，选中全部音频文件，然后再次执行【Effects】→【NoiseReduction】→【NoiseReduction】命令，打开去除噪音对话框，单击【OK】按钮，完成去除噪音操作。 Step5.按播放按钮，试听。注意：对于环境的噪音样本的取得，可以按照上例的方式，也可以单独录制一段环境噪音，执行【Effects】→【NoiseReduction】→【NoiseReduction】命令，在弹出的对话框中使用【GetProfilefromSelection】按钮提取噪音样本。在CoolEdit中可以改变音频文件的播放速度和音调高低。执行【Effects】→【Time/Pitch】→【Stretch】命令，弹出如图2-16所示的改变音调/音速对话框。5．改变音频文件播放速度、音调高低左下角的【StretchMode】选项控制变速/变调的模式。（1）TimeStretch：时间伸缩，音调不变。（2）PitchShift：音调升降，节奏不变。（3）Resample：重采样，加快时音调升高，减慢时音调下降。

通过左上角的选项卡，可以选择【ConstantStretch】（均匀变速/变调）或【GlidingStretch】（渐变变速/变调）。【Stretch%】滚动条、【Ratio】、【Length】文本框和【Transpose】下拉列表都可以控制速度变化或音调升降的量。也可以从【Presets】栏中直接选择变速/变调预设。

【示例3】改变音乐的播放速度【测试点】测试【Effects】菜单改变音调/音速功能。【效果】针对一段背景音乐，减慢播放速度，使音乐变长。【步骤】

Step1.使用【File】→【Open】命令，打开歌曲“背景音乐.wma”。Step2.选中音乐开始时的50秒，执行【Effects】→【Time/Pitch】→【Stretch】命令，在弹出的对话框左上方的【Presets】列表框中选择【SlowDown】选项，如图2-16所示。 Step3.通过拖动【Stretch%】滚动条，或直接修改【Ratio】、【Length】文本框的内容，将速度降为原来的80%，单击【OK】按钮。 Step4.按播放按钮，试听。2.2.3使用CoolEdit进行音频编辑的综合实例下面用一个综合实例简单介绍CoolEdit进行音频处理的全过程。本例是为一个关于古典诗词欣赏的课件录制一段配有背景音乐的开头语。1．录制自己的声音2．制作背景音乐3．合成1．录制自己的声音 Step1.执行【File】→【New】命令创建音频文件，选择采样频率为44.1kHz、量化位数为16位、单声道。

Step2.按准备好的材料录制旁白，然后试听、编辑，这是一个反复进行的过程。最后将声音保存为一个音频文件，命名为“诗词欣赏.wav”，音频的长度为3:48.663。

Step3.对“诗词欣赏.wav”进行降噪处理。2．制作背景音乐 Step1.可以直接选择一段音乐，调整音量，并按照需要的时间长度对音乐进行剪辑或变速处理。

Step2.如果选择的音乐中带有伴唱，可以根据需要使用CoolEdit的去除人声功能，将人声去掉。

Step3.本例中选择的是WMA格式的文件，文件名为“背景音乐.wma”，音频的长度为3:23.999，音频持续时间比“诗词欣赏.wav”短，执行【Effects】→【Time/Pitch】→【Stretch】命令，将该音频的长度调整为4:00.000。

Step4.为该音频设置淡入淡出效果。3．合成 Step1.按【F12】功能键，将CoolEdit从波形界面切换到多音轨界面。

Step2.在轨道上单击右键，在弹出的右键菜单中执行【Insert】命令，如图2-17所示，将前面处理好的“诗词欣赏.wav”和“背景音乐.wma”分别添加在第一轨道和第二轨道上。 Step3.在已添加的波形文件上单击右键，在弹出的右键菜单中执行【WaveBlockProperties】命令，弹出音轨波形属性设置对话框，如图2-18所示。 Step4.图2-18中，上面的水平滚动条用于调整声道的覆盖范围，左面的垂直滚动条用于调整音量的大小，【TimeOffset】选项选项用于调整声音开始的时间，根据需要可以对已添加在音轨上的声音进行调整。本例将“诗词欣赏.wav”声音略略调高，声道偏向左声道，【TimeOffset】调为0:03.000，即3秒后开始出现旁白的声音。而“背景音乐.wma”的声音调低，声道偏向右声道，【TimeOffset】为0:00.000。 Step5.执行【Edit】→【MixDowntoFile】→【AllWaves】命令，对声音进行合成。

Step6.此时，CoolEdit自动回到波形编辑界面，合成的音乐默认文件名为“mixdown.wav”，按播放按钮进行试听。

Step7.保存文件名为“诗词欣赏开头语.wav”。第3章

图形图像数据的编辑与处理3.1多媒体图形图像基础3.2多媒体图像编辑软件Photoshop3.1多媒体图形图像基础在现实生活中图形和图像是既有区别又有联系的两个概念，二者所指的都是在二维平面上能在人的视觉系统中产生视觉印象的客观对象，一般图形所指代的客观对象往往带有鲜明的几何意义，而图像指代的客观对象往往是绘制或拍摄的。计算机中图形和图像的区别除了和现实生活类似含义外，计算机中的图形和图像的差别主要反映在它们的数据的表示方式上。

3.1.1图像和图形的概念

3.1.2图像的数字化

3.1.3矢量图生成技术3.1.1图像和图形的概念 1．图像和图形图像（Image）在计算机中又被称为点阵图或位图，它将二维平面对象的信息细化为密集排列的点，然后将这些点的信息按顺序存储在计算机中。在计算机中，图像的实质是一个数字矩阵，矩阵中各项数字用来描述构成图像的每一个点的亮度、颜色等信息。构成图像的点被称为像素（Pixel）。图像通常用数字设备捕捉的实际场景画面或以数字化形式存储的任意画面来获得。

图形（Graphics）在计算机中又被称为矢量图，一般指用计算机绘制的画面，它具有两个要素：一是几何要素，主要刻画对象的轮廓、形状等；二是非几何要素或者称之为属性要素，刻画对象的颜色、纹理等。图形（Graphics）在计算机中又被称为矢量图，一

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体技术与应用

文档简介

温馨提示

最新文档

评论

多媒体技术与应用

文档简介

温馨提示

最新文档

评论

相关文档