第2章_多媒体文字与音频素材处理制作.ppt_第1页
第2章_多媒体文字与音频素材处理制作.ppt_第2页
第2章_多媒体文字与音频素材处理制作.ppt_第3页
第2章_多媒体文字与音频素材处理制作.ppt_第4页
第2章_多媒体文字与音频素材处理制作.ppt_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 多媒体文字与音频素材处理制作,2.1 文字素材制作,2.2 音频素材的采集与制作,小结,思考题与习题,Cool Edit Pro2.0 入门实例,2.1.1 文字信息的数字化,1 文字信息数字化方法 在多媒体素材中,文本与其它媒体相比,有如下特点: 字符组成字符集,形式简单。文本字符集主要由ASCII编码字符集、国际统一编码字符集、汉字编码字符集等,都是用二进制编码以字节为单位表示的。 输入容易,处理简便。字符输入有多种方式,都很简便,处理容易。 文件小,占用存储空间最少,存取速度快。 样式多种,表达准确。,2.1 文字素材制作,汉字字形的存储,汉字字形产生有两种模式 即母体字形 母体

2、字形是采用原字字形,字形美观、分辨率高,多用于电子照排系统。 数字字形 数字字形是非常适合计算机处理的字形,不仅可充分利用计算机存储技术和软件控制技术提高速度,而且随着技术进步成本不断降低。 数字字形有点阵式和矢量式两种表现方式,点阵式字形,采用图像式的点阵排列呈现字符 点阵字体采用点阵组成字符,这种字体在放大、缩小、旋转或打印时会失真; DOS操作系统下通常使用的是点阵式字形。标准的西文字符(包括阿拉伯数字)是用88个点阵来描述一个字。如图标出了字符“A”的二进制字形码,每个字符占用8个字节,点阵式字形 (续),网状方格中的每格对应存储器的一位,有笔划的格对应二进制“1”,无笔划的对应“0”

3、,一个西文字符占用8个字节,而一个汉字则需要32个字节。点阵越大,分辨率越高,显示、打印质量越好,但每个字所需的的存储容量也越大 16*16点阵表示的汉字“涨”,汉字编码,汉字数量庞大,1981年我国颁布的“国家信息交换用汉字编码字符集”(GB2312-80)标准规定了信息交换用的6763个汉字和682个非汉字图形字符(如全角的数字、标点符号、制表符及拉丁、日文、俄文、英文字母等)所用的编码,简称国标码 。 汉字输入方法很多,但在西文键盘上开发的各种输入方法,最终实现都是在其汉字编码方案输入到计算机后,都要对相应的汉字编码进行转换,变为“机内码”,再通过机内码调出对应的汉字字形。 编码转换则是

4、由支持软件的各种算法实现的,因此转换的关键是找到合理的算法。,2文本文字与图像(或图形)文字模式,多媒体素材中获取的文字有两种模式: 一种是文本文字 另一种是图像、图形文字 二者的主要区别是: 产生文字的软件不同 文件的格式不同 应用场合不同 屏幕显示效果不同,2.1.2文本文字的编辑与排版,文本文字的编辑排版一般具有以下几个内容 字体与字体的格式(Style) 字的定位(Align) 字的定位主要有四种:左齐、居中、右齐、两端对齐等。 字体(Font)的选择 由于WINDOWS安装的字库不同,字体选项会有些差别,还可通过可安装字库扩充更多的字体。其中宋体粗细均匀,端庄大方,给人以稳定、安详、

5、大方的感觉,多用于图书、报刊的正文;仿宋体笔划纤细、清秀,可用于副标题、短文、诗歌、作者名字等;楷体秀丽隽永,柔中带钢,可作副题、插白、插诗、以及温和趣味的句子,应注意字体的适当选择。黑体较粗,常用于重要性、警告性的句子或者标题上。,续,字的大小(Size) 字的大小一般是以字号和磅(Point)为单位,磅值越大,字越大。 字体文件有TTF或FON等扩展名构成,TrueType字体是TTF文件。常用的标志装饰意义也可以字体形式出现,WINDOWS系统中著名的Webdings字体就不是单纯的字母样式。 字的颜色 可以向文字指定调色板中的任何一种颜色,以使画面更加漂亮。 文本中字、行及段间距 在W

6、ord中,字间距有“标准”、“加宽”、“紧缩”三种默认值,也可以自定义,单位为磅。行以及段落之间则以“单倍行距”为单位,有不同标准可以选择,同时也可以选择磅值作为行间距和段间距。 需要强调的是,文字的技术处理固然很重要,但是文字资料的准确性、完整性更为重要。因此,在编写文字脚本时,一定要慎重把关,确保质量。,2.1.3美术字的制作,启动Microsoft Word2003 执行菜单命令“视图”“工具栏”“艺术字”,屏幕显示艺术字工具栏,单击工具栏上“插入艺术字”图标 。 弹出的艺术字库对话框中选择一种样式 。 从弹出的“编辑艺术字”对话框中输入文字内容,即完成了艺术字的创作 (现场打开Word

7、演示实例),2.1.4文字非键盘输入法,联机手写文字输入 联机手写输入系统是用一支输入笔在一块特殊的书写板上写字,用压敏或电磁感应等方式将笔在运动中的坐标输入计算机,计算机中的识别软件根据采集到的笔迹之间的位置关系和时间关系信息来识别所写的字,并把结果显示在屏幕上 。 扫描输入文字 文字的扫描输入是通过扫描仪将纸上的文字变成计算机可处理的信息,一般用于大量文字的快速录入 。 语音输入文字 将输入的文字用规范的读音朗读出来,通过话筒等输入设备送入计算机中,然后经语音识别系统进行识别,再转换成文本文件显示、存储 。,2.2.1数字音频信号的获取,1 音频信号的数字化过程 描述声音的模拟信息是个连续

8、模拟正弦波,不能由计算机直接处理,必须将其数字化。 声音信息的计算机获取过程就是声音信号的数字化处理的过程。 经过数字化处理之后的结果就是数字音频(又称波形声音), 数字音频能够像文字和图形信息一样进行存储、检索、编辑和其它处理。,2.2音频素材的采集与制作,音频信号的数字化过程(续),数字音频是时间离散的数据序列,图为声音的模拟信号数字化过程。,点击播放:演示动画,(1)采样,采样是计算机处理模拟声音信号的第一步。采样任务是将声音的模拟信号数字化,其基本原理是以固定的时间间隔对声音波形曲线的振幅进行一次取值,即幅值截取,生成阶跃变化的数字信号。,点击播放:动画演示,量化 采样后得到的采样值(

9、振幅值)表示形式是音频信号的量化编码。通常,用二进制表示量化后的幅值,模数转换ADC位数越多,转换后的音频质量越好。 编码 转换后的数字音频的音质和保真度越好,声音文件的字节数越大。数据编码必须压缩后存储最常用的压缩方法为自适应脉冲编码调制(ADPCM)法。ADPCM压缩编码方案的信噪比高,数据压缩倍率可达25倍而不会明显失真,因此数字化声音信息大多利用此种压缩方法。,2 数字音频质量的三要素,采样频率 采样频率就是每秒抽取声音波形振幅值的次数。采样频率越高,转换后的音频信号质量越好。 采样精度 即每次采样获得的数据所使用的二进制量化位数。位数越多,音质越好。 通道数 通道数十指所使用的声音通

10、道的个数。它表明一次采样的声音波形数,单声道一次采样一个波形,双声道(立体声) 一次采样两个声音波形。采用立体声道声音丰满,有立体感,但存储空间要多占用许多,多声道数据量更大。,3 数字音频分类,按用途分类 音频可分为语音(如解说词) 音乐(如配乐) 声效(如掌声) 按声音来源分类 数字化声波,即利用声卡等专用设备将语音、音乐等波形信息转换成数字方式,并经编码保存起来,使用时再解码和转换成原来的波形。 MIDI合成,即通过电子乐器的弹奏形成数字指令驱动音乐合成器,并借助于合成器产生的数字声音信号还原成相应的音乐或音效。(点击播放:动画演示) 利用声音素材库获取,但应有版权许可。,(3)按数据文

11、件格式分类,音频数据文件格式种类很多,例如按数据格式分类时常用的音频文件格式: Windows环境中的标准数字音频文件.wav格式。 数字乐器MIDI音频文件 .mid。 激光唱盘CD和激光视盘音频文件.cda 和.vob。 用于声卡的音频文件.voc。 以及用于网络的流媒体格式的rm和压缩格式的MP3等。,2.2.2音频文件格式转换与压缩,1常用的音频文件及其特点 波形音频文件 扩展名.wav。 .wav是真实声音数字化后的数据文件,也是用于Windows环境中的标准数字音频文件。 数字乐器MIDI音频文件 扩展名.mid。 激光唱盘CD和激光视盘音频文件, 扩展名分别为.cda 和.vob

12、。 它们不仅为开发者提供了高质量的音源,还无需硬盘存储声音文件,声音直接通过光盘由CD-ROM或DVD驱动器中特定芯片处理后发出,播放设备多样。 用于市场主流声卡的音频文件,扩展名.voc。 适合网络快速传输的.au和流媒体格式的.rm以及音频压缩格式的MP3等。,为了使影音信息的传播更为快捷通畅,建议使用以下三类格式的文件: (1)符合国际统一标准的。 (2)由行业权威公司制定的。 (3)得到广大用户认可的。,2 音频文件的格式转换,由于不同格式文件在音质、高保真、文件占用空间诸方面各有千秋,因此为获得最佳效果或利用某一特点,需要进行文件格式转换。 在许多音频编辑软件中都有文件格式选择和转换

13、功能 Media Vision随卡提供的Sound Forge就是Windows波形文件的编辑与转换软件。 市场流行的“超级解霸”,其中“超级解霸”中的“超级音频解霸”功能模块可将: WAV文件或CD文件直接录为MP3格式文件。 可将音乐CD文件压缩成MP3或WAV文件。 “MP3数字CD抓轨”模块可以将音乐CD文件自动“抓”(转录)成MP3或WAV文件。 也可将MP3、VCD直接“抓”(转录)成.DAT扩展名的音乐、影音文件; “MP3压缩工具”模块,可把各种音频文件格式(包括MIDI)转换成MP3格式。,3 音频文件的压缩,音频文件压缩的必要性 音频文件数字化后占用较大的存储空间,其大小是

14、用如下公式计算: 音频文件字节数=采样频率*量化位数*声道数*时间(s)/8 这样录制一分钟左右的声音就要上百KB,必须进行数字音频信号压缩。信号压缩往往是以信号失真、降低音质为代价的,所以要兼顾权衡。 好的数据压缩技术有三个重要指标: 一是压缩比要大,即压缩前后所需的信息存储量之比要大。 二是实现压缩的算法要简单,压缩解压缩速度要快,尽可能地做到实时压缩解压缩。 三是恢复效果要好,要尽可能地恢复原始数据。,(2)音频文件压缩方法,用“录音机”程序压缩WAV文件 (现场演示) 用压缩工具软件压缩WAV文件 许多市场上流行的压缩/解压缩软件都支持对WAV文件的压缩,如目前流行的CoolEdit、

15、SoundForge、SOX (Sound eXchange)等 。,2.2.3.用Windows自带的“录音机”程序制作音频素材,1 录制音频(现场演示) 2 声音文件编辑(现场演示) 插入到另一个声音文件中 混合声音文件 删除声音文件一部分 改变音频文件及音频属性 3 改善音质与音频效果制作(现场演示) 改善音质 音频效果制作 改变音量 改变播放速度 添加回音效果 反向播放,2.2.4 音频专用处理软件功能简介,1 音频编辑处理软件简介 商品化数字音频处理软件很多,主要功能仍可归为如下几类: 录制声音信号 声音剪辑 增加特殊效果 文件操作,2 常用的流行软件,Gold Wave: 是运行在

16、Windows环境下比较典型的音频处理软件。它以不同的采样频率录音,音源可以是CD-ROM、录音机、录像机及话筒多种信号。声音、文件编辑和混音、特效功能齐全,能充分满足多媒体创作的需要。 TC Native Reverb: 无限轨道、顶极混响效果软件。其混响效果仅逊色于少数高档专业硬件混响效果器。 Cool Edit Pro 2.0: 是一个非常出色的数字音乐编辑器和MP3制作软件,具有高品质的音乐采样能力,采样频率可达192KHz,分辨率可达32位,支持20多种音乐文件格式,其声音与音效的处理可提供完善的音乐解决方案,后面我们将介绍该软件的使用方法。 VegasTM PRO: 多轨音频软件的

17、后起之秀,无限轨道,多轨录音并且实时显示录音波形,许多功能是传统专业设备难以达到的。 此外,还有著名的德国老牌多轨音序器音频软件 Cubase VST, Logic Audio Platinum、Cakewalk公司出品的Cake Walk9.0以及著名的Sound Forge.都是不错的音频编辑软件。,3 音频编辑处理软件的应用实例Cool Edit Pro2.0音频编辑软件,(1) Cool Edit Pro2.0功能简介 Cool Edit Pro2.0能记录的音源包括CD、卡座、话筒等多种,并可以对它们进行降噪、扩音、剪接等处理,还可以给它们添加立体环绕、淡入淡出、3D回响等奇妙音效,

18、制成的音频文件。他还可以在AIF、AU、MP3、Raw PCM、SAM、VOC、VOX、WAV等文件格式之间进行转换,并且能够压缩保存为RealAudio格式。 Cool Edit Pro2.0有几个特点很受用户青睐,一是对文件的操作是非损伤性,使新手尽可放开手脚去尝试各种操作;二是能自动保存意外中断的工作,如遇停电、死机等,当重新启动该系统时,可重新恢复到中断前的工作状态,甚至包括剪贴板中的内容。,(2) 编辑环境,现场打开软件演示 1.菜单栏 2.工具栏 3.资源管理窗口 4.波形显示轨道 5.水平分割栏 6.缩放工具 7.时间窗口 8.水平标尺 9.选取/查看控制 10.播放控制 11.

19、水平声强标尺 12.状态栏 13.切换为波形编辑界面,(3) 基本编辑操作,用Cool Edit Pro2.0编辑声音,与在字处理器中编辑文本相似: 一方面,都包括复制、剪切和粘贴等操作。 另一方面,都须事先选择编辑对象或范围,这些操作才有意义。 此外,Cool Edit Pro2.0在Edit菜单下还提供了一些选择特殊范围的菜单: 如零交叉(Zero Crossings),可以将事先选择波段的起点和终点移到最近的零交叉点(波形曲线与水平中线的交点)。 用查出节拍(Find Beats),可以以节拍为单位选择编辑范围;对于声音文件,还可以单独选出立体左声道或右声道,进行编辑等。,剪贴板,Coo

20、l Edit Pro2.0提供了五个内部剪贴板,加上Windows剪贴板,共有六个剪贴板可同时使用。 Cool Edit Pro2.0允许同时编辑多个声音文件,若在多个声音文件之间传送数据,就可以使用五个内部剪贴板。 如果要与外部程序交换数据,可使用 windows剪贴板,这给编辑带来了很大便利。 但要注意一点,当前剪贴板只有一个,每次进行复制、剪切和粘贴等操作,始终是针对当前剪贴板。 选定当前剪贴板的操作方法是在Cool Edit Pro2.0主窗口上,点击菜单“编辑”“设置当前剪贴板”,选择一个剪贴板即可。,声音的混合,利用Cool Edit Pro2.0的编辑功能,可以将当前剪贴板中的声

21、音,与窗口中的声音混合,方法是: 点击菜单“编辑”“混和粘贴”,然后,选择需要的混合方式,如插入、叠加、替换或调制。 波形图中黄色竖线所在的位置为混合起点(即插入点),混合前应先调整好该位置。,删除静音 点击菜单“编辑”“删除静音”,删除静音功能可用来使一个听起来断断续续的声音文件,变为一个连续的文件。 波形缩放 操作界面简单窗口下部有两组波形缩放按钮,六个带放大镜图标为一组,是水平缩放按钮;另一组是垂直缩放按钮,只有两个,在窗口右下角,同样为放大镜图标。为便于编辑时观察波形变化,可以点击波形缩放按钮,也可以在水平或垂直标尺上,直接滑动鼠标右键,或右击标尺,弹出菜单,定制显示效果。,(4) 制

22、作特殊音效(演示),颠倒(Invert) 倒序(Reverse) 回声(Echo) 三维回声效果室(Echo Chamber) 脑波同步器(Brainwave Synchronizer) 淡入淡出(Fade) 制作音乐(Music),(5)噪音处理,采样降噪法 将噪音的样本特征提取出来(采样),然后将该噪音信号从原音频信号中去除,对原音的破坏很小。 滤波降噪法 用滤波器将音频中噪音出现的频段阻隔掉,但与该噪音处于同一频段的可用音频也将被阻隔破坏,故对原音有一定破坏作用。 噪音门限 提供一个门限,将低于该门限的音频中的噪音部分去除,该方法也会对原音频文件有所破环,但只限于低电平部分(噪音门限不会

23、取得很高)。,下面归纳Cool 2000自带降噪器进行采样降噪的主要步序:,选择噪音样本。 设置参数。 选择好以上参数后,点击“噪音采样”按钮,采样完毕后,才可以调整“降噪级别”。试听并调整参数,通过预览(Preview)试听降噪效果,然后试着更改一些参数,以达到最满意的听觉效果。 保存,选择文件名将文件存盘(.fft)。 (现场演示实例)。,Cool Edit Pro2.0 入门实例,Cool Edit Pro2.0单轨道编辑操作界面,首先我们通过麦克录制一段声音,然后对所录制的声音作简单的编辑。 单击右侧的两个图标,听一下声音改变前后的效果。,原始声音,编辑后的声音,1利用Cool Edi

24、t Pro2.0来录制音乐,请先准备好你的麦克风。 新建一新文件。 点击菜单“文件”中的“新建工程”,出现“新建波形”对话框如右图,选择适当的录音声道(Channels)、分辨率(resolution)和采样频率(Sample Rate)。一般使用立体声、16位、44100Hz。 按下“录音键”开始录制。我们录制一段朗读“one、two、three、four”。 录完后再按下“录音键”。,录音键,利用Cool Edit 2000编辑音乐,对音乐的剪切粘贴、降噪、扩音以及单声道和立体声设置等都是我们用得较多的编辑功能。 下面我们将我们录制的那段朗读“one、two、three、four”的读数声

25、音中的“two”和“three”这两部分的发音互换个位置。 我们将“two”发音选取,见下图,可以用我们常见的“点拖”方式,也可以左击鼠标定义起始点,右击鼠标定义终止点的独特方式,如果想选取整个波形,双击鼠标。,按下“Cut”快捷键(Ctrl+x)或用菜单“编辑”“剪切”。 注意:要选择左右两个声道的声音,讲鼠标放在两个声道的中间,如图中箭头所示的横线上进行选择。,在“three”发音的后面用鼠标点击一下,再按下粘贴键“Paste”粘贴。就这么简单就完成了。 保存文件,点击播放按钮,试听编辑的效果。,小结,多媒体应用系统中使用最多的文本媒体,其作用不仅是呈现具体的内容,还经常用在标题、图像、动画、导航及菜单中。对文本媒体除了解文本文字与图形、图像文字的主要区别外,还要了解其应用场合。对文本制作要熟练运用文本编辑软件,掌握1-2种输入法进行文字的录入、排版和各种编辑功能外,还要熟悉美术字的制作和应用。 音频是携带信息的重要媒体,学习音频媒体处理与制作,首先要了解音频信号采集和数字化处理过程、衡量音频信号质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论