《数字媒体技术》教案_第1页
《数字媒体技术》教案_第2页
《数字媒体技术》教案_第3页
《数字媒体技术》教案_第4页
《数字媒体技术》教案_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数字媒体技术》教案《数字媒体技术》教案54/54PAGE54许昌网站建设《数字媒体技术》教案《数字媒体技术》教案《数字媒体技术》教案《数字媒体技术导论》教案课程名称:数字媒体技术教学章节:第1章数字媒体技术概论教学目的:了解媒体、数字媒体的内涵及特性,了解数字媒体研究及应用开发的概况。教学重点:了解媒体的概念、特性及分类。掌握数字媒体的定义、传播模式及其特性。指导数字媒体技术的研究及应用开发领域。教学难点:数字媒体特性及传播模式教学器具:教学课件。教学课时:2学时授课教师:孙清伟教学内容:章节概要:第一章数字媒体技术概论1.1媒体及特性1.2数字媒体及特性1.3数字媒体技术的研究领域主要内容1.1媒体及特性媒体,有时候也被称媒介或媒质。媒体包括多种含义。媒体是一种工具,包括信息和信息载体两个基本要素。一张光盘不能称为媒体,只有记录了信息,并可进行信息传播时才称为媒体。媒体的英文单词是medium,源于拉丁文的medius,其含义是中介、中间的意思,常用复数形式media。同时,媒体又是信息交流和传播的载体。媒体包括两层含义:(1)传递信息的载体,称为媒介,是由人类发明创造的记录和表述信息的抽象载体,也称为逻辑载体,如文字、符号、图形、编码等。(2)存储信息的实体,称为媒质,如纸、磁盘、光盘、磁带、半导体存储器等。载体包括实物载体、或由人类发明创造的承载信息的实体,也称为物理媒体。媒体分类媒体依据信息划分具有不同表现形式。按照人的感觉,媒体可分为视觉媒体、听觉媒体等;按照信息的表现形式,媒体可分为语言媒体、文字媒体、音乐媒体、图形媒体、动画媒体和视频媒体等;按照信息的种类,媒体可分为新闻媒体、科技信息媒体、生活媒体等。媒体依据信息的载体不同又有不同分类。按载体的种类不同,媒体可分为报纸、信件、电话、计算机、网络等;按照不同应用方式,媒体可分为印刷媒体、幻灯、电影媒体、广播电视媒体、计算机媒体、计算机多媒体、网络媒体等。按照媒体产生的时间和历史,媒体又可以分为新媒体和旧媒体(也有人说是传统媒体)。按人们对载体的心理承认度,媒体又可分为时尚媒体和传统媒体。按载体的传播范围,媒体又可分为个人媒体和大众媒体。根据国际电信联盟(ITU:InternationalTelecommunicationUnion)电信标准部推出的ITU-TI.374建议的定义,可以将媒体划分为如下五类:①感觉媒体②表示媒体③表现媒体④存储媒体⑤传输媒体感觉媒体(Perception),是指能够直接作用于人的感觉器官,使人产生直接感觉(视、听、嗅、味、触觉)的媒体,如语言、音乐、各种图像、图形、动画、文本等。表示媒体(Presentation),是指为了传送感觉媒体而人为研究出来的媒体,借助这一媒体可以更加有效地存储感觉媒体,或者是将感觉媒体从一个地方传送到远处另外一个地方的媒体,如语言编码、电报码、条形码、语言编码,静止和活动图象编码以及文本编码等。显示媒体(Display),是显示感觉媒体的设备。显示媒体又分为两类,一类是输入显示媒体,如话筒,摄象机、光笔以及键盘等,另一种为输出显示媒体,如扬声器、显示器以及打印机等,指用于通信中,使电信号和感觉媒体间产生转换用的媒体。存储媒体(Storage),用于存储表示媒体,也即存放感觉媒体数字化后的代码的媒体称为存储媒体。例如磁盘、光盘、磁带、纸张等。简而言之,是指用于存放某种媒体的载体。传输媒体(Transmission),传输媒体是指传输信号的物理载体,例如同轴电缆、光纤、双绞线以及电磁波等都是传输媒体。现在的媒体信息一般是集数据、文字、图形与图像等为一体的综合媒体信息,其主要特性为:多样性、集成性、交互性、信息接收方便性、信息使用方便性。1.2数字媒体及特性计算机存储、处理和传播的信息媒体为数字媒体(digitalmedia)。数字媒体包括两个方面。(1)信息,内容采用二进制表示;(2)媒介,能存储、传播二进制信息。数字媒体是数字化的内容作品以现代网络为主要传播载体,通过完善的服务体系,分发到终端和用户进行消费的全过程。(我国的数字媒体概念)数字媒体是指最终以二进制数的形式记录、处理、传播、获取的信息媒体。这些媒体包括数字化的文字、图形、图像、声音、视频影像和动画及其编码等逻辑媒体和存储、传输、显示逻辑媒体的物理媒体。但常常指逻辑媒体。从微观上来讲,数字媒介就是以数字的形式存在的内容,存储、传输、接收数字媒体内容的设备。从宏观上来讲,数字媒介就是数字内容、设备和介质。(1)数字化我们过去熟悉的媒体几乎都是以模拟的方式进行存储和传播的,而数字媒体却是以比特的形式通过计算机进行存储、处理和传播。比特只是一种存在的状态:开或关、真或假、高或低、黑或白,总之简记为0或1。比特易于复制,可以快速传播和重复使用,不同媒体之间可以相互混合。比特可以用来表现文字、图像、动画、影视、语音及音乐等信息。(2)交互性交互性能的实现,在模拟域中是相当困难的,而在数字域中却容易得多。因此,具有计算机的“人机交互作用”是数字媒体的一个显著特点。数字媒体就是以网络或者信息终端为介质的互动传播媒介。(3)趣味性互联网、IPTV、数字游戏、数字电视、移动流媒体等为人们提供了宽广的娱乐空间,媒体的趣味性真正体现出来。如观众可以参与电视互动节目,观看体育赛事的时候可以选择多个视角,从浩瀚的数字内容库里搜索并观看电影和电视节目,分享图片和家庭录像,浏览好品质内容。(4)集成性媒体技术是结合文字、图形、影像、声音、动画等各种媒体的一种应用,并且是建立在数字化处理的基础上的。它不同于一般传统文件,是一个利用电脑技术的应用来整合各种媒体的系统。媒体依其属性的不同可分成文字、音频及视频;其中,文字可分为文字及数字,音频(Audio)可分为音乐及语音,视频(Video)可分为静止图像、动画及影片等;其中包含的技术非常广,大致有电脑技术、超文本技术、光盘储存技术及影像绘图技术等。而计算机多媒体的应用领域也比传统多媒体更加广阔,如CAI、有声图书、商情咨询等,都是计算机多媒体的应用范围。(5)技术与艺术的融合信息技术与人文艺术、左脑与右脑之间都有着明显差异,但数字媒体传播却可以在这些领域之间架起桥梁。计算机的发展与普及已经使信息技术离开了纯粹技术的需要,数字媒体传播需要信息技术与人文艺术的融合。例如,在开发多媒体产品时,技术专家要负责技术规划,艺术家/设计师要负责所有可视内容,清楚观众的欣赏要求。数字媒体是利用数字电视技术、网络技术,通过互联网、宽带局域网、无线通信网和卫星等渠道,以电视、电脑和手机为终端,向用户提供视频、音频、语音数据服务、连线游戏、远程教育等集成信息和娱乐服务的一种传播形式。(1)大众传播模式传统的大众传播媒体,是一对多的传播过程,由一个媒介出发达到大量的受众,如图1-1所示。无论何种媒体信息,如文本、图像或声音、视频,通过编码后都转换成比特。信号就是比特流。图1-1施拉姆的大众传播模式实际的音频和视频信息都是连续变化的模拟信息。编码的过程实际上是根据一定的协议或格式把这种模拟信息转换成比特流的过程。8个比特组成一个字节,也称一个码字。译码是编码的逆过程,它是根据相同的协议把比特流转换成媒体信息,同时去掉比特流在传播过程中混入的噪声的过程。比特流实际上包括信息码和控制码两部分。从传播学的角度分析,编码是把信息转换成可供传播的符号或代码;译码就是指从传播符号中提取信息。(2)媒体信息传播模式1949年,信息论创始人、贝尔实验室的数学家香农与韦弗一起提出了传播的数学模式,如图1-2所示。一个完整的信息传播过程应包括信息来源(source)、编码器(encoder)、信息(message)、通道(channel)、解码器(decoder)、接收器(receiver)。其中,“通道”就是香农对媒介的定义,技术上定义为铜线、同轴电缆等。图1-2香农—韦弗的传播过程模式(3)数字媒体传输模式数字媒体系统完全遵循信息论的通信模式。从通信技术上看,它主要由计算机和网络构成,如图1-3所示。它在传播应用方面比传统的大众传播更有独特的优势。在数字媒体传播模式中,信源和信宿都是计算机。因此,信源和信宿的位置是可以随时互换的。这与传统的大众传播如报纸、广播电视等相比,发生了深刻的变化和革命。图1-3数字媒体传播模式数字媒体传播的理想信道是具有足够带宽的、可以传输比特流的高速网络信道。网络可能由电话线、光缆或卫星通信构成。图6描述的是两点之间的传播过程,实际上数字媒体可以是多点之间的传播,如图1-4所示。图1-4网络上的多点传播模式(4)超媒体传播模式范德比尔大学的两位工商管理教授——霍夫曼与纳瓦克(DonnaL.HoffmanandThomasP.Novak)提出了超媒体的概念。霍夫曼认为以计算机为媒介的超媒体传播方式延伸成多人的互动沟通模式;传播者(F-Firm)与消费者(C-Consumer)之间的信息传递是双向互动的、非线性的、多途径的过程,如图1-5所示。图1-5超媒体传播模式超媒体整合全球互联网环境平台的电子媒体,包括存取该网络所需的各项软硬件。此媒体可达到个人或企业二者彼此以互动方式存取媒体内容,并透过媒体进行沟通。超媒体传播理论是学者们第一次从传播学的角度研究互联网等新型媒介,得到了国际网络传播学研究者的重视。1.3数字媒体技术的研究领域互联网和数字技术的快速发展正在颠覆传统媒体,使得人们获取信息、浏览信息、以及对信息反馈的方式都在发生相当大的变化,如图1-6所示。网络使用者媒体消费行为调查结果数字媒体产业价值链数字媒体新趋势将在未来几年内成为不容忽视的重大经济驱动力,目前主要呈现出几大发展趋势。数字媒体产业价值链的延伸,是在3C融合基础上,传媒业、通信业和广电业相互渗透所形成的新的产业形态,如图1-7所示。数字媒体产业价值链(1)内容创建内容创建是数字媒体价值链过程中的第一个阶段。数字媒体对象的创建有多种手段,可以从非数字化的媒体对象中采集,例如利用视频采集卡、音频采集卡、扫描仪等设备可将电视信号、声音、图片等采集为数字媒体;可以从已有的数字媒体对象中截取,例如应用视频编辑软件可以截取数字视频中的某些片断或数字声音中的某一部分;可以从某些数字媒体对象中分离,例如将数字视频分解为静态的图片或单独的数字声音等。创建阶段的产品的存在形式一般是在存储介质中的各种格式的媒体文件。数字媒体产业价值链(2)内容管理在数字媒体价值链中,数字媒体的内容管理是非常重要的一个阶段,包括存储管理,查询管理,目录、索引等等,在这个阶段,数字媒体携带的信息需要被格式化地表示出来,它的使用也将在管理阶段被规范。目前对数字媒体的管理大都是各个应用程序中根据应用的需要单独设计、单独完成的。(3)内容发行信息发布环节的主要作用是将信息送到用户端。例如,对数字媒体对象的买卖交易、在线销售等。和管理阶段一样,目前对数字媒体的发布也是每个应用程序单独设计、单独完成。(4)应用开发应用开发是将内容展现给用户的应用,包括音乐点播服务、视频点播服务、游戏服务等。将制作出来的数字媒体内容,经过一定的资源整合和优化配置,形成新的应用提供能力。并向数字媒体的运营平台合作,共同向客户提供服务。数字媒体产业价值链(5)运营接入运营接入是提供具体将数字媒体应用提供和传播给客户的运营平台和传输通道。采用一系列先进的网络技术手段,实施内容产品管理、带宽管理、网络使用的授权管理、安全认证服务等。(6)价值链集成价值链集成指面向客户销售和交易数字媒体时,存在着最后对价值链的集成环节,以提供给最终客户更高性价比、内涵丰富的各种服务集成产品,为整个价值链创造更多价值。价值链的集成包括商务集成和技术集成。(7)媒体应用客户利用各种接收装置来获取数字媒体的内容,如PC、STB机顶盒、零售显示屏、无线网关、信息站、媒体网关等等。数字媒体的最终使用者既是价值链的起点、价值链的归宿,也是价值链的源泉。数字媒体内容产业将内容制作技术以及平台、音视频内容搜索技术、数字版权保护技术、数字媒体人机交互与终端技术、数字媒体资源管理平台与服务、数字媒体产品交易平台等六个方向定义为发展重点。其中,前四个属于技术与平台类,后两个属于技术与服务类。数字媒体技术六个重点发展方向内容制作技术以及平台:应以高质量和高效率制作为导向,研究开发国际先进的数字媒体内容制作软件或功能插件。音视频内容搜索技术:海量数字内容检索技术使数字内容能够得到有效的制作、管理与充分的利用。数字版权保护技术:为了保障数字媒体产业的持续、健康发展,必须采取一套有效的数字版权保护机制。这是数字媒体服务产业发展的核心问题之一。数字媒体人机交互与终端技术:如何将数字媒体用最好的体验手段展现给用户,是数字媒体产业最后能否得到市场接受的重要环节。数字媒体资源管理平台与服务:对纷繁复杂的海量数字内容素材、音视频作品及最终产品,需要建立基于内容描述的资源集成、存储、管理、数字保护、高效的多媒体内容检索与信息复用机制等服务。数字媒体产品交易平台与服务:在统一的数字媒体运营与监管标准与规范制约下,通过贯穿数字媒体产品制作、传播与消费全过程的版权受控形成自主创新的数字媒体交易与服务体系。数字媒体涉及的技术范围很广,技术很新、研究内容很深,是多种学科和多种技术交叉的领域。主要技术范畴包括:(1)数字媒体表示与操作,包括数字声音及处理、数字图像及处理、数字视频及处理、数字动画技术等。(2)数字媒体压缩,包括通用压缩编码、专门压缩编码(声音、图像、视频)技术等。(3)数字媒体存储与管理,包括光盘存储(CD技术、DVD技术等)、媒体数据管理、数字媒体版权保护等。(4)数字媒体传输,包括流媒体技术、P2P技术等。数字媒体的技术范畴规划了数字媒体技术的研究领域,其主要的研究方向包括:(1)数字声音处理包括音频及其传统技术(记录、编辑技术)、音频的数字化技术(采样、量化、编码)、数字音频的编辑技术、话音编码技术(如PCM、DA、ADM)。数字音频技术可应用于个人娱乐、专业制作、数字广播等。(2)数字图像处理包括数字图像的计算机表示方法(位图、矢量图等)、数字图像的获取技术、图像的编辑与创意设计。常用的图像处理软件有Photoshop等。数字图像处理技术可应用于家庭娱乐、数字排版、工业设计、企业徽标设计、漫画创作、动画原形设计、数字绘画创作。(3)数字视频处理包括数字视频及其基本编辑技术、后期特效处理技术。常用的视频处理软件有Premiere等。数字视频处理技术可应用于个人、家庭影像记录、电视节目制作、网络新闻。(4)数字动画设计包括动画的基本原理、动画设计基础(包括环节:构思、剧本、情节链图片、模板与角色、背景、配乐)、数字二维动画技术、数字三维动画技术、数字动画的设计与创意。常用的动画设计软件有3DMAX、Flash等。数字动画可应用于少儿电视节目制作、动画电影制作、电视节目后期特效包装、建筑和装潢设计、工业计算机辅助设计、教学课件制作等。(5)数字游戏设计包括游戏设计相关软件技术(Directx、OpenGL、Director等)、游戏设计与创意。(6)数字媒体压缩包括数字媒体压缩技术及分类、通用的数据压缩技术(行程编码、字典编码、熵编码等)、数字媒体压缩标准,如用于声音的MP3、MP4、用于图像的JPEG、用于运动图像的MPEG。(7)数字媒体存储包括内存储器、外存储器、光盘存储器等。(8)数字媒体管理与保护包括数字媒体的数据管理、媒体存储模型及应用、数字媒体版权保护概念及框架、数字版权保护技术,如加密技术、数字水印技术、权利描述语言等。(9)数字媒体传输技术包括流媒体传输技术、P2P技术、IPTV技术等。等等。数字媒体有着广泛的应用和开发领域,包括教育培训、电子商务、信息发布、游戏娱乐、电子出版、创意设计等。下面的内容介绍了数字媒体在一些领域内的应用。数字媒体应用领域——教育培训在教育培训方面,可以开发远程教育系统、网络多媒体资源、制作数字电视节目等。数字媒体因能够实现图文并茂、人机交互、反馈,从而能有效地激发受众的学习兴趣。用户可以根据自己的特点和需要来有针对性地选择学习内容,主动参与。以互联网为基础的远程教学,极大地冲击着传统的教育模式,把集中式教育发展成为使用计算机的分布式教学。学生可以不受地域限制,接受远程教师的多媒体交互指导。因此,教学突破了时空的限制,并且能够及时交流信息,共享资源。数字媒体应用领域——电子商务在电子商务领域,开发网上电子商城,实现网上交易。网络为商家提供了推销自己的机会。通过网络电子广告、电子商务网站,能将商品信息迅速传递给顾客,顾客可以订购自己喜爱的商品。数字媒体应用领域——信息发布在信息发布方面,组织机构或个人都可以成为信息发布的主体。各公司、企业、学校及政府部门都可以建立自己的信息网站,通过媒体资料展示自我和提供信息。超文本链接使大范围发布信息成为可能。另外,博客、播客等形式提供了展示自我和发布个人信息的舞台。数字媒体应用领域——个人娱乐在个人娱乐方面,开发娱乐网站,利用IPTV、数字游戏、影视点播、移动流媒体等为人们提供娱乐。随着数据压缩技术的改进,数字电影从低质量的VCD上升为高质量的DVD。通过数字电视,不仅可以看电视、录像,实现视频点播,而且微机、互联网、联网电话、电子邮箱、电脑游戏、家居购物和理财都可以使用。另外,数码相机、数码摄像机及DVD光碟的发展,也推动了数字电视的发展。电脑游戏已成为流行的娱乐方式,特别是网络在线游戏因其新颖、开放、交互性好和娱乐性强等特点,受到越来越多人的青睐。数字媒体应用领域——电子出版在电子出版方面,开发多媒体教材,出版网上电子杂志、电子书籍等。实现编辑、制作、处理输出数字化,通过网上书店,实现发行的数字化。电子出版是数字媒体和信息高速公路应用的产物。我国新闻出版署对电子出版物曾有以下界定:“电子出版物系指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。”表1-1电子出版与传统出版的比较比较方面出版物出版形式内容编辑制作介质发行方式阅读方式传统出版物有纸印刷文字、图片电子照排纸张传统传统电子出版物光盘出版多媒体信息多媒体制作光盘传统多媒体

计算机电子出版物网络出版多媒体信息多媒体制作硬磁盘Internet网络多媒体计算机数字媒体应用领域——创意设计创意设计方面,包括工业设计,企业徽标设计,漫画创作、动画原形设计、数字绘画创作,游戏设计等。创意设计是多媒体活泼性的重要来源,好的创意不仅使应用系统独具特色,也大大提高了系统的可用性和可视性。精彩的创意将为整个多媒体系统注入生命与色彩。多媒体应用程序之所以有巨大的诱惑力,主要是其丰富多彩的多种媒体的同步表现形式和直观灵活的交互功能。数字媒体应用领域——虚拟现实虚拟现实(VirtualReality,VR)综合了计算机图形学、人机交互技术、传感技术、人工智能等领域的最新成果,用以生成一个具有逼真的三维视觉、听觉、触觉及嗅觉的模拟现实环境。是由计算机硬件、软件以及各种传感器所构成的三维信息的人工环境,即虚拟环境,是可实现的和不可实现的物理上的、功能上的事物和环境,用户投入这种环境中,就可与之交互作用。例如,美国在训练航天飞行员时,总是让他们进入到一个特定的环境中,在那里完全模拟太空的情况,让飞行员接触太空环境的各种声音、景像,以便能够在遇到实际情况时能做出正确的判断。沉浸(immersion)、交互(interaction)和构想(imagination)是虚拟现实的基本特征。虚拟现实在娱乐、医疗、工程和建筑、教育和培训、军事模拟、科学和金融可视化等方面获得了应用,有很大的发展空间。练习与思考:《数字媒体技术导论》刘清堂等北京清华大学出版社2008.3第13页一、填空题二、简答题《数字媒体技术导论》教案课程名称:数字媒体技术教学章节:第2章数字音频技术基础教学目的:了解音频的三个特性及概念、了解常用的声音记录设备及录制编辑软件,知道数字音频的文件格式及特性。掌握音频数字化的过程及编辑软件的操作和应用。教学重点:音频的三个特性及概念,声音记录设备及录制编辑软件,数字音频的文件格式及特性。教学难点:音频数字化的过程及数字音频质量和参数的关系教学器具:教学课件。教学课时:4学时授课教师:孙清伟教学内容:章节概要:第二章数字音频技术基础2.1音频技术及特性2.2音频数字化2.3数字音频质量及格式2.4数字音频的编辑技术2.5数字音频技术应用主要内容:学习目标:(1)知道音频的三个特性及其相关概念。(2)说出几种声音记录设备。(3)了解模拟音频处理技术涉及到的设备及各自主要功能(4)掌握音频数字化的过程(5)能够列举几种常见数字音频格式,并进行简单的比较。(6)了解几款常见的数字音频编辑软件,并知道其基本性能。(7)熟练掌握一款数字音频编辑软件的操作方法。物理学上,声音被看成一种波动的能量,即声波。同时在物理学上,一般用声音的三个基本特性来描述声音,即频率、振幅和波形。生理学上,声音是指声波作用于听觉器官所引起的一种主观感觉。如响度、音调、音色和音长等。尽管这两个关于声音的理解涵义有所不同,但它们之间有一定的内在联系。在物理学上声音的三个基本特性:频率、振幅和波形,对应到人耳的主观感觉就是音调、响度和音色。所谓频率即发声物体在振动时,单位时间内的振动的次数,单位为赫兹(HZ)。振幅是指发声物体在振动时偏离中心位置的幅度,代表发声物体振动时动势能的大小。振幅是由物体振动时所产生的声音的能量或声波压力的大小所决定的。声能或声压愈大,引起人耳主观感觉到的响度也愈大。音色是指声音的纯度,它由声波的波形形状所决定。即使某种声音它们的振动和频率都一样,也就是说它们的音调高低,声音强弱都相同,但它们的波形不一样,所以听起来就会有明显的区别。声音的分类:按照人耳可听到的频率范围,声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20~20000赫兹间。声音高于20000赫兹为超声波,低于20赫兹为次声波。按照声音的来源以及作用来看,可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑,感叹等;乐音也可成为音乐,是指人类通过相关乐器演奏出来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;响音(音效)是指除语言和音乐之外电影中所有声音的统称,如动作音响、自然音响、背景音响、机械音响、特殊音响。最初声音信息的传播是瞬时性的,不能对声音进行存储和回放。直到爱迪生发明留声机声音才可以得以记录和重放。爱迪生的留声机记录声音利用的是“声音是由振动产生的”这一基本原理。图2-1爱迪生留声机成品声音记录技术发展史(1)机械留声机:最早用来记录声音的是机械式留声机,1877年由美国人爱迪生发明的。初期的留声机结构非常简单,只是在一个木盒中装上一只铜制的大喇叭,录放音的声波都经过这只喇叭传递。(2)钢丝录音机:世界上最早出现的钢丝录音机是在1898年,它由丹麦科学家波尔森发明的,第一次用磁性记录的方式进行记录。(3)磁带录音机:磁带录音机属干磁性记录技术的再发挥,是根据电磁感应定律,提出用永久剩磁录音的可能性,把声音记录在磁带上,接着再用磁带进行还原。由于音频技术的迅猛发展,不论从机型的繁衍、结构和改进、功能的扩展、性能的提高诸多方面都取得了瞩目的进步.上述材料中显示了传统音频记录技术的演变历史,从记录介质上看历经了石蜡(锡箔)记录、钢丝记录、磁带记录;从技术手段上来看经历了机械记录和磁性记录,从外形上面来看录音设备由原来的开放式结构变成后来的封闭式的设备(盒式)。在对声音进行处理的过程中,除了对声音进行记录之外,还需要对声音进行一些其它方面的调整。如对声音进行音调的调节、多声音混合、高中低音的调整,还有诸如原始声波信号的拾取等等问题。音频处理设备:话筒(Microphone麦克风)音箱(speaker,扬声器)模拟调音台话筒(Microphone麦克风)话筒的主要功能就是进行声音能量的收集。当出现磁性记录技术之后,话筒的功能就开始发生变化,除了完成声音的收集外,还要完成声能向电能的转化(声音信号转化成电流信号),但是其还原声音的功能已逐渐消失。音箱(speaker,扬声器)音箱的主要功能就是还原声音,将音频电流信号变换成声音信号,可以说是留声机中大喇叭另一功能的转化。模拟调音台调音台在现代电台广播、舞台扩音、音响节目制作中是一种经常使用的设备,它具有多路输入,每路的声音信号可以单独被处理,还可以进行各种声音的混合,且混合比例可调;拥有多种输出。调音台在诸多系统中起着核心作用,它既能创作立体声、美化声音,又可抑制噪声、控制音量,是声音艺术处理必不可少的一种设备。2.2音频数字化模拟音频信号:一般,模拟信号在时间或者空间维度上可以无限制的细分下去。模拟信号最大的特点就是它是一种连续的不间断的信号。对音频模拟信号进行处理时,一般采用模拟的技术手段。电器元件是将连续的原始信号的变化形式原封不动的传递给下一单元,这就是模拟的处理方式。数字音频是指用一连串二进制数据来保存的声音信号。这种声音信号在存储和电路传输及处理过程中,不再是连续的信号,而是离散的。关于离散的含义:数字化的音频信号两种途径:第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频;第二种途径就是在数字化设备中创作出数字音频,比如电子作曲。音频数字化一般经过三个阶段“采样——量化——编码”。具体步骤如下:第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集,这个过程就叫采样;第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是量化;第三步将等级值变换成对应的二进制表示值(0和1),并进行存储,这个过程就是“编码”。通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。数字化过程两个指标:一是量化深度,也可称之为量化分辨率,是指单位电压值和电流值之间的可分等级数;二是采样频率,即采样点之间的时间间隔。两者与音质还原的关系是:采样频率越高,量化深度越大,声音质量越好。横坐标是时间轴(采样频率),纵坐标是幅度值(量化分辨率),曲线代表的是模拟信号对应的波动曲线,带颜色的方格是采样量化后的所得结果。采样量化由图中可以得知,当频率越小(时间间隔越短),量化深度(量化分辨率)越大,二者的轮廓越吻合,这也说明数字化的信号能更好的保持模拟音频信号的形状,有利于保持原始声音的真实情况。在数字音频的衡量指标中,采样频率的单位是Hz,量化深度一般用比特(Bit)来度量。例如:某一音频的数字化指标是44.1kHz,8个比特位。那么这里的44.1kHz比较容易理解,但8比特位并不是说把某一单位的电压(电流)值成8份,而是分成28=256份;同理16位是把纵坐标分成216=65536份。通常情况下,在音频数字化的过程中,设置的采集频率可已选择三种:32kHz、44kHz、48kHz。特别是在CD制作过程中,一般的采样频率是44.1kHz,那么为什么会设置这三个档次呢?采样频率对波形的影响如图,上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示采样点。上下波形之所以不吻合,是因为采样点不够多,或是采样频率不够高。这种情况关于合理的采样频率这一问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产生低频失真,则采样频率至少是录制的最高频率的两倍(上图中,采样频率只是录制频率的4/3倍)。这个频率通常称作Nyquist极限。,称之为低频失真。2.3数字音频质量及格式数字音频文件存储在计算机中要占据一定的空间,然而不同的采样频率、量化深度和录制时间生成的音频文件大小也不同。例如:用44.1kHz、16bit来进行立体声(即两个声道)采样(标准的CD音质),录制(或采集)3分钟的音频,那么在该未经压缩的声音数据文件的大小为:一秒钟内采样44.1×1000次,每次的数据量是16×2=32bit(因为立体声是两个声道),那么3分钟的总共数据量是44100×32×60×3=254016000(bit),换算成计算机中的常用单位(Byte),总共数据量是254016000/8/1024/1024=30.28MByte。比特率,即每秒钟音频的二进制数据量。上述例题的比特率是176.4kB/s。如果要衡量一个数字音频的音质好坏的话,通常可以参考以下指标:采样频率:即采样点之间的时间间隔,采样间隔时间越短,音质越好。量化深度(量化分辨率):是指单位电压值和电流值之间的可分等级数,可分等级越多,音质越好。音频流码率:数字化后,单位时间内音频数据的比特容量,流码率越大音质越好。以上三个方面的指标中,前面两个指标是绝对指标,而音频流码率是一个相对指标,可以间接用来考察音频的质量。其实,不同的编码方式就对应计算机中不同的文件格式,反映在计算机中就是文件的后缀名不同。对于数字音频的常见格式有以下几种:(1)WAV格式:WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。(2)MIDI格式:MIDI是MusicalInstrumentDigitalInterface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。(3)CDA格式:大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数。CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。(4)MP3格式:其全称是MPEG-1AudioLayer3。MP3能够以高音质、低采样率对数字音频文件进行压缩。(5)MP3Pro格式:MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。(6)WMA格式:WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(DigitalRightsManagement)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。(7)MP4格式:MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。(8)SACD格式:SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富、清晰。(9)Quicktime格式:QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。(10)VQF格式:VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。(11)DVDAudio格式:DVDAudio是新一代的数字音频格式,与DVDVideo尺寸以及容量相同,为音乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合(12)MD格式:Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一张小小的盘中存储60~80分钟采用44.1khz采样的立体声音乐,就是因为使用了ATRAC算法(自适应声学转换编码)压缩音源。(13)RA格式:RealAudio是由RealNetworks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据。(14)LiquidAudio格式:LiquidAudio是一家提供付费音乐下载的网站。它通过在音乐中采用自己独有的音频编码格式来提供对音乐的版权保护。LiquidAudio的音频格式就是所谓的LQT。(15)Audible格式:Audible拥有四种不同的格式:Audible1、2、3、4。格式1、2和3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音更清楚,而且可以更有效地从网上进行下载。(16)VOC文件格式:在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。(17)AU格式:AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。(18)AIFF格式:AIFF(.AIF)是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。(19)Amiga格式:Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。(20)MAC格式:Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。(21)S48格式:S48(stereo、48kHz)采用MPEG-1layer1、MPEG-1layer2声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。(22)AAC格式:AAC实际上是高级音频编码的缩写。AAC是MPEG-2规范的一部分。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。2.4数字音频的编辑技术对于数字音频的技术操作具体来说可以归纳为以下六个方面的内容。(1)数字录音:该技术操作是指通过数字方式将自然界中的声源或者存储在其它介质的模拟声音通过“采样——量化——编码”的方式将其变成计算机中或其它数字音频设备中能够识别的数字声音。(2)数字音乐创作:该技术操作是指通过相关的数字音频创作工具(如:计算机和Midi键盘、Midi吉它等)直接生成创作数字音频,通常是数字音乐。(3)声音剪辑:该操作旨在对数字音频素材进行裁剪或者复制。(4)合成声音:也可称之为混音,声音合成是指根据需要,把多个声音素材叠加在一起,生成混合效果。(5)增加特效:增加特效是指对原始的数字音频素材进行听觉效果的优化调整,以使其符合需要。(6)文件操作:对数字音频的文件操作是指对整个音频文件进行的操作,而非改变其音色、音效。数字音频处理设备可以分为两类:一类是专用数字音频设备,另一类是非专为处理音频而设计的多媒体计算机。(1)数字调音台:前面介绍过模拟的调音台,可以知道调音台的作用有两个:其一是将每一路进行优化和调节;其二,对多路声音进行混合输出。(2)数字录音机:如图2-8所示是数字录音机。数字录音机是对模拟录音方式进行了升级,采用数字记录方式来存储音频信号。一般可用硬盘记录方式或者光盘记录方式。图2-8数字录音机(3)数字音频工作站:如图2-9是数字音频工作站。数字音频工作站是一台能够完成从录音、编辑、混合、压缩,一直到最后刻出母盘的全部音频节目制作过程的设备。拥有这样一台设备就相当于有了调音台、多轨录音机、编辑机、效果器等这些录音棚的价值不菲的全部家当。它最大的特点就是集成度高,免去录音连线的烦恼,且便于携带。图2-9数字音频工作站在进行数字音频处理时,除了用到上述几种专用的硬件设备外,还会用到一些其它配套设备,如麦克风、音箱等等。其实,不管是专用设备,还是多媒体计算机,在处理数字音频时,其关键的硬件技术内核包括:1)模数转换器:模数转换器(AnalogtoDigitalConverter,ADC)是一个硬件芯片,一般用在带录音功能的音频处理设备之中,其作用就是将模拟的音频电压(流)信号转成数字脉冲电压(PCM)信号。任何ADC都包括上面提到的三个基本功能:采样、量化和编码,用来完成从模拟的音频信号向数字音频信号的采集过程。2)数模转换器:数模转换器(DigitaltoAnalogConverter,DAC)也是一个硬件芯片,一般用在数字音频的重放设备中,用来将数字音频信号还原成模拟的音频信号。可以把DAC想像成16个小电阻,各个电阻值是以二的倍数增大。当DAC接受到来自计算机中的二进制PCM信号,遇到0时相对应的电阻就开启,遇到1相对应的电阻不作用,这样每一批16Bits数字信号都可以转换为相对应的电压大小。如图2-6中所示,还原后的电流信号看起来就像阶梯一样,当然会跟原来平滑的信号有些差异,但是人的耳朵没有那么灵敏,只要采样的频率和量化深度足够的话,一般不会察觉到差异。图2-6采样量化3)数字信号处理器:数字信号处理器(DigitalSignalProcessor,DSP)是一个专门用来处理数字声音的微型处理器,类似于计算机中的CPU,可以用来模拟和产生声场,并对声音效果进行控制。数字音频编辑软件可分为两种:一种是音源软件(音序器软件),主要是针对数字音乐创作而言。它是一种可以用来产生和模拟各种乐器或发声物的应用软件。音源软件中最核心的是音序器,其主要作用是把音乐元素或事件进行系列或序列编程。这类软件一直与MIDI音乐创作联系在一起。另外一种软件是编辑软件,可以完成对声音的录音、剪辑、混音合成、特效处理。下面来介绍几款较为常用的数字音频编辑软件。首先来介绍两款音序器软件。(1)Cakewalk:Cakewalk是全世界使用率最高的专业作曲软件,其功能非常全面。使用Cakewalk,不但可以制作MIDI,还能录制音频;在歌曲伴奏制作完后,通过Cakewalk的音频功能,可以将作者制作的歌曲伴奏录制成音频(WAV)文件,也可以在Cakewalk的界面下直接录制人声,将MIDI和音频文件混合编辑。(2)FLStudio:FLStudio是一款音乐创作利器,能够让作者的计算机变成全功能的录音室。它首先提供了音符编辑器,可以根据音乐创作人的要求编辑出不同音律的节奏,例如鼓,镲,锣,钢琴,笛,大提琴,筝,扬琴等等。其次提供了音效编辑器,音效编辑器可以编辑出各类声音在不同音乐中所要求的音效,例如各类声音在特定音乐环境中所要展现出的高,低,长,短,延续,间断,颤动,爆发等特殊声效。另外它还提供了方便快捷的音源输入,对于在音乐创作中所涉及的特殊乐器声音,只要通过简单外部录音后便可在FLSTUDIO中方便调用,音源的方便采集和简单的调用造就了FLSTUDIO强悍的编辑功能。音频编辑软件及功能包括:(1)Cubase:Cubase是德国著名的Steinberg公司出品的苹果、PC双平台软件。Cubase在许多方面技术都比Cakewalk要优秀,其录音、混音功能更加完善。但是Cubase的操作不太人性化,很不方便,需要花较多的时间去学习,而且要想发挥ASIO的优势,需要安装一块支持ASIO技术的专业声卡。音频方面,Cubase比Sonar较成熟;而软件合成器方面,Cubase占有绝对优势。Cubase从5.0版开始全面支持软件合成器技术。它是目前最成熟的MIDI/音频/合成器一体化音乐工作站。(2)Nuendo:Nuendo是Steinberg新推出的,它似乎是Cubase的变种版本。但它主要强调的是录音、混音和环绕声制作。著名的老牌摇滚乐队Queen刚刚推出的最新杜比环绕声DVD音乐大碟就是用Nuendo做的。Nuendo也能够进行视频配音配乐工作。Nuendo的MIDI较弱。它是一个非常优秀的多轨录音、混音软件。(3)LogicAudio:LogicAudio是一个功能太强大的“音乐工作站”。LogicAudio既有苹果版又有PC版,在美国用得很多,适合专业人士使用。它是MIDI/音频/合成器一体化的音乐工作站。(4)Samplitude:Samplitude并不是一个全能的音乐工作站软件,因为它的MIDI功能非常弱,而且不支持软件合成器插件。但它的混音能力效果好,比较适合在独立的电脑里工作。它是一款非常优秀的多轨录音、混音、音频编辑软件。(5)VegasAudio/Video:VegasAudio是一款多轨音频软件,VegasVideo则是多轨视频软件,它们都是著名的SonicFoundry公司出品的。功能上很接近,所不同的是前者有一条视频轨,后者有无限条。它们都没有MIDI功能,只有音频和视频功能。VegasAudio的音频编辑能力非常强,具有无限轨道,26个Aux,而且操作非常方便。Vegas对各种格式的支持非常好,能够在同一轨道里混排不同格式的音频数据。VegasAudio是一款很好的多轨音频软件。VegasVideo既是一个强大的多轨音频工作站,又是一个专业的视频编辑软件。它的视频功能几乎等同于著名的Premiere:无限视频轨,强大灵活的剪辑操作,支持各种视频格式,全面支持DV,全面支持网络流媒体文件,支持DVD,各种特效、字幕工具,支持效果插件。它的运行速度和处理速度比Premiere快得多,对系统的消耗很少。除开视频,它在音频方面则更是遥遥领先于其他视频软件。(6)SoundForge:SoundForge是著名的SonicFoundry公司的主打产品,是广泛应用于电脑多媒体领域的音频编辑软件,同时大量用于游戏音效的处理和编辑。SoundForge的音频编辑功能十分完善,能够对音频文件进行非常精细的编辑,自带各种效果器,支持DirectX插件,能够为视频配音配乐,能刻制音乐CD。可谓功能强大,一般只要能想到的功能它都有。(7)Wavelab:Wavelab的功能与SoundForge不相上下,双方都有各自的优势。SoundForge的优势是各种大小功能很多,对各种音频格式的支持很好,操作方便;而Wavelab的优势是处理速度快,能够进行实时效果处理,能够进行简单的多轨混音。Wavelab的效果实时处理是它的一大特色。它有一个主通道调音台,可以实时调节音量,以及加各种效果。一般认为,SoundForge更适合多媒体音频编辑工作一些,而Wavelab可以胜任音乐制作方面的任务。(8)CoolEdit:CoolEdit是一个很强大的软件。CoolEdit的处理效果非常专业。CoolEditPro有两种操作方式——多轨的和单个文件的。CoolEditPro其实也可以作为一个简单的多轨音频工作站软件来使用。CoolEdit在效果处理某些方面领先于其他同类软件,尤其是降噪和变调功能。(9)AdobeAudition:AdobeAudition是集音频录制、混合、编辑和控制于一身的音频处理工具软件,前身就是CoolEditPro。它功能强大,控制灵活,使用它可以录制、混合、编辑和控制数字音频文件。也可轻松创建音乐、制作广播短片、修复录制缺陷。而且现在还可以在使用外部硬件的情况下自动记录参数,当侦听时调节音量、面板和效果控制,实时记录这些

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论