




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5.3 数字声音及应用,5.3.1 波形声音的获取与播放 5.3.2 波形声音的表示与压缩编码 5.3.3 波形声音的编辑 5.3.4 计算机合成声音,5.3.1 波形声音的获取与播放,声音的特性和类型,声音由振动产生,通过空气进行传播 声音是一种波,它由许多不同频率的谐波组成 谐波的频率范围称为声音的“带宽”,计算机处理的声音类型: 话音或语音(speech),专指人的说话声音,带宽仅为3003400Hz 全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”(audio) ,20Hz20kHz,数字波形声音的获取,方法:,2. 量化(qua
2、ntization,模数转换 ),3. 编码(encoding),1. 取样(sampling),数字波形声音的获取设备,声音的联机获取设备(声卡),声音的脱机获取设备:数码录音笔,声卡的功能与组成,波形声音的获取与编码 波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成,注:当前PC机的声卡已经与主板芯片组集成在一起,不再做成独立的插卡,声音的重建与播放,计算机输出声音分为两步: 1 声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成,2 声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器) 关于音箱: 普通音箱接收的是重建的模拟声音信号 数字音箱可直接接收数字声音信号
3、,声音失真更小,5.3.2 波形声音的表示 与压缩编码,数字波形声音的表示及参数,数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav” 数字波形声音的主要参数有: 取样频率: 语音的取样频率低,一般为8kHz 全频带声音(如音乐)的取样频率高,一般为44.1kHz 量化位数:通常为8位、12位或16位 声道数目:单声道为1,双声道为2 码率(比特率),每秒钟的数据量,数字波形声音码率的计算,未压缩时数字波形声音的码率计算公式 码率 = 取样频率 量化位数 声道数 例:,压缩编码之后数字波形声音的码率为: 压缩后的码率 = 未压缩时的码率/压缩倍数 例
4、:上面CD唱片的立体声音乐压缩为MP3后,若压缩倍数是10倍,则该MP3音乐的码率是:114kb/s左右,数字波形声音的数据压缩,数字波形声音的数据量很大,例如: 数字语音1小时的数据量大约是30MB CD立体声高保真的数字音乐1小时的数据量大约是635MB 数据压缩的必要性: 为了降低存储成本和提高在网络上的传输效率 数据压缩的可能性: 声音中包含了大量冗余信息;人耳的灵敏度有限,允许有一定失真 数字波形声音压缩编码的方法: 全频带声音:国际标准MPEG;工业标准Dolby AC-3 数字语音:固定电话使用ADPCM编码 移动电话使用高效率的混合编码技术,全频带数字音频编码的标准,所谓“MP
5、3音乐”就是一种采用MPEG-1层3编码的高质量数字声音, 它能以10倍左右的压缩比降低高保真数字声音的存储量,使一张普通CD光盘上可以存储大约100首MP3歌曲,附:MP3播放器的结构与原理,嵌入式处理器用于运行控制程序,控制各个部件协调工作:它接收控制按键的操作命令,从闪烁存储器读取MP3音乐数据送到DSP去解码;显示播放器的工作状态;负责与主机连接并交换数据等等,数字信号处理器DSP完成MP3数据流的解码操作,并输出波形格式的数字音频信号,经数模转换和功率放大之后,用户即可听到声音,存放MP3音乐数据,容量越大,可存放的歌曲数目就越多,存放MP3播放器的控制程序,显示MP3播放器的工作状
6、态和歌曲的歌词,什么是流媒体?,在因特网上收听(看)音(视)频节目的2种方式: 下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待很长时间,并需要较大的存储容量) 流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后, 就可以开始一边播放一边下载,等待时间短、存储需求小) 流媒体技术就是允许在网络上让用户一边下载一边收看(听)音视频媒体的一种技术 目前主要有3个公司的流媒体产品: Real Networks公司的 Real Media 微软公司的 Windows Media 苹果公司的 Quick Time,附:流媒体是如何工作的?,流媒体 播放软件,Web服务器,W
7、eb 浏览器,网 页,(客户计算机),http协议,3 点击流媒体节目,启动流媒体播放程序,RTSP/TCP,RTP/UDP,6 播放器可以边播放边接收数据,并可以控制播放、暂停、快进、快倒等,5 将音(视)频节目传输给客户计算机,RTCP/UDP,HTML网页,1 请求网页,2 服务器送回网页,4 向流媒体服务器发出请求,数字波形声音的主要文件格式,.wav波形声音文件 .pcm使用PCM编码的声音文件 .mp2MPEG 层 1 或层2 编码的声音文件 .mp3MPEG 层3 编码的声音文件 .rm,.ra(RealAudio)RealNetworks的流式声音文件 .wma微软公司的流式声
8、音文件 .aif (Audio Interchangeable File Format)苹果公司的声音文件,5.3.3 波形声音的编辑,波形声音编辑软件的功能,主要功能: 1 编辑声音:如声音剪辑、复制、调节音量 2 声音的效果处理:如混响、回声等 3 录音 4 声音的格式转换 5 播放声音,声音编辑软件的 典型用户界面,5.3.4 计算机合成声音,什么是计算机合成声音?,计算机合成声音就是计算机模仿人说话或演奏音乐 计算机合成声音有两类: 计算机合成语音: 计算机模仿人把一段文字朗读出来,即把文字转换为语音(简称为 TTS) 应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务
9、等 计算机合成音乐: 计算机模拟各种乐器发声并按照乐谱演奏音乐 应用:计算机作曲、配器等,例:计算机合成的语音,Hello,everybody (1) 你好,我是贝尔实验室的中文语音合成系统(BellTTS1) 南京大学计算机系2002年招收了202名本科生,22名博士生,130多名硕士生。(中科大讯飞公司) (Bell) 安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件 (讯飞) 我们都是同行,我们一路同行,去参加人参培植研讨会 (讯飞) (Bell),需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力,计算机合成音乐(MIDI),计算机合成音乐需要三个要素:乐器、乐
10、谱和“演奏员”,声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来,乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件,其文件扩展名为 .MID或 .MIDI,媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令,例:计算机合成的MIDI音乐,例1 音乐之声(6KB) 例2 军港之夜(7KB) MIDI的优点: 数据量极小(比CD立体声少3个数量级,比MP3少3个数量级) 易于制作和编辑修改 可以与波形声音同时播放 MIDI的不足: 只能合成音乐,不能合成歌曲和语言 音质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宠物驯养师岗位面试问题及答案
- 2025届浙江省丽水、湖州、衢州市高二下化学期末教学质量检测试题含解析
- 河北省雄安新区博奥高级中学2025年化学高二下期末质量检测试题含解析
- 公司房车使用管理办法
- 杭州建筑拆除管理办法
- 公墓资金使用管理办法
- 农民工权益保障与工资支付法规解析
- STM32虚拟仿真综合实验平台设计与应用研究
- 儿童文学的内涵与外延探究
- 体育舞蹈课程教学体系构建与技能评价标准研究
- 患者出院随访统计分析报告
- 设备采购售后服务方案
- 智能船舶与海洋工程:物联网在船舶与海洋工程中的应用
- 《不宁腿综合征》课件
- CST仿真技术交流
- 部编版道德与法治小升初一二三四五六年级全册复习简答题100道汇编(附答案)
- 幼儿园课程审议下的主题活动实施
- 商业保理行业营销策略方案
- 《扫描电子显微镜》课件
- 水利水电工程施工截流设计说明书
- 变速箱厂总平面布置设计设施规划与物流分析课程设计
评论
0/150
提交评论