版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本节内容本节内容v音频采集音频采集v噪音噪音MIDI音乐音乐v语语音识别技音识别技术术v语语音合音合成技术成技术v降噪操作降噪操作v变变速变调操作速变调操作v回声效果回声效果v淡淡入淡出入淡出v混混音效果格式转换音效果格式转换v方法:方法:vwindows自带录音机进行采集自带录音机进行采集vAudition软件录制软件录制v手机录制手机录制噪音噪音v音高和音强变化混乱、听起来不谐和的声音音高和音强变化混乱、听起来不谐和的声音是由发音体不规则的振动产生的,从物理学是由发音体不规则的振动产生的,从物理学的角度来看:噪声是发声体做无规则振动时的角度来看:噪声是发声体做无规则振动时发出的声音。发出的
2、声音。噪声的分类和产生噪声的分类和产生v白噪声是指一段声音中的频率分量的功率白噪声是指一段声音中的频率分量的功率在整个可听范围(在整个可听范围(020KHZ)内都是均匀)内都是均匀的。是一种无规噪声,瞬时值是随机变化的。是一种无规噪声,瞬时值是随机变化的。具有连续的噪声谱,包含有各种频率的。具有连续的噪声谱,包含有各种频率成分的噪声。频率能量的分布是均匀的。成分的噪声。频率能量的分布是均匀的。噪声的分类和产生噪声的分类和产生v粉红噪声的频率分量功率主要分布在中低粉红噪声的频率分量功率主要分布在中低频段。在一定的范围内音频数据具有相同频段。在一定的范围内音频数据具有相同或类似的能量。或类似的能量
3、。噪声的分类和产生噪声的分类和产生v褐色噪声的频率分量功率主要集中在低频褐色噪声的频率分量功率主要集中在低频段。段。vMIDI乐器数字接口乐器数字接口v(MusicalInstrumentDigitalInterface)是一个工业标准的电子通信协定,为是一个工业标准的电子通信协定,为电子电子乐器乐器等演奏设备(如等演奏设备(如合成器合成器)定义各种音)定义各种音符或弹奏码,容许电子乐器、电脑、手机符或弹奏码,容许电子乐器、电脑、手机或其它的舞台演出设备彼此连接,调整和或其它的舞台演出设备彼此连接,调整和同步,得以实时交换演奏数据同步,得以实时交换演奏数据Midi音乐的合成音乐的合成vMIDI
4、产生的方法:频率调制合成法,波表合成产生的方法:频率调制合成法,波表合成法法vMIDI播放的方法:计算机根据按键音量节奏等播放的方法:计算机根据按键音量节奏等指令合成还原出乐器声音指令合成还原出乐器声音vMIDI音乐的特点:文件小,可编辑性强,处理音乐的特点:文件小,可编辑性强,处理语音的能力和效果差。语音的能力和效果差。v30minMIDI音乐音乐200kWAV音乐音乐300M3.6 语音识别技术语音识别技术v1. 语音识别的基本原理语音识别的基本原理语音识别系统的实现主要分为三大阶段:语音识别系统的实现主要分为三大阶段:v连续语言信号的预处理连续语言信号的预处理v特征提取特征提取v模式匹配
5、模式匹配v2. 语音识别系统的类型语音识别系统的类型v 按照输入方式可分为三种:孤立字(词)、连接按照输入方式可分为三种:孤立字(词)、连接词以及连接语音的识别。词以及连接语音的识别。v 按照发音者可分为特定人、限定人和非特定人语按照发音者可分为特定人、限定人和非特定人语音识别系统三种。音识别系统三种。v 根据可识别的词汇量多少可分为小词汇量、中等根据可识别的词汇量多少可分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。词汇量、大词汇量以及无限词汇量语音识别系统。v3. 语音识别技术的应用语音识别技术的应用v 教育应用教育应用v 信息处理与电子商务领域的应用信息处理与电子商务领域的
6、应用v 消费娱乐产品的应用消费娱乐产品的应用v3. 常见语音识别技术常见语音识别技术v百度:百度的语音识别技术研究项目,名为百度:百度的语音识别技术研究项目,名为“Deep Speech”。据介绍,在噪音较大的背。据介绍,在噪音较大的背景下,百度语音识别技术的正确率高于谷歌景下,百度语音识别技术的正确率高于谷歌10%。v中国科技大学中国科技大学: 科大讯飞公司在语音识别技术科大讯飞公司在语音识别技术上占有优势地位,该公司已经推出了成熟的上占有优势地位,该公司已经推出了成熟的语音输入法等产品。语音输入法等产品。v三星语音引擎三星语音引擎3.7 语音合成语音合成3.7.1语音合成的概念语音合成的概
7、念语音合成包含两种可能实现的途径。语音合成包含两种可能实现的途径。v一种是录音重放模式,使机器再生一个预先存一种是录音重放模式,使机器再生一个预先存入的语音信号,采用数字存储技术。入的语音信号,采用数字存储技术。v另一种可能是采用数字信号处理的方法。另一种可能是采用数字信号处理的方法。 按照人类语言功能的不同层次,语音合成可分按照人类语言功能的不同层次,语音合成可分为三个层次:为三个层次:v从文字到语音的合成从文字到语音的合成v从概念到语音的合成从概念到语音的合成v从意向到语音的合成从意向到语音的合成语音数据的存储形式可分为两大类:语音数据的存储形式可分为两大类:v波形存储波形存储v参数存储参数存储 3.7.2文语转换技术文语转换技术语音合成系统包括三个主要的组成部分:语音合成系统包括三个主要的组成部分:v文本分析模块:让计算机认识文字,和文本分析模块:让计算机认识文字,和词语,进而知道怎么发音词语,进而知道怎么发音v韵律生成模块:音节的声调、语气、停韵律生成模块:音节的声调、语气、停顿、发音长短顿、发音长短v声学模块声学模块 :根据要求让计算机发声:根据要求让计算机发声声音素
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内部流程审核制度
- 内部离岗制度
- 龙湖集团新晋研发工程师的工作上手指南与计划
- 腾讯技术专家面试全解析
- 内部食堂承包档口管理制度
- 农场内部员工管理制度及流程
- 制单部门内部员工制度
- 司法协查内部制度
- 员工内部合同管理制度
- 员工内部通道管理制度
- JBT 10364-2014 液压单向阀标准规范
- 中建履约过程风险发函时点提示及函件指引(2023年)
- 海洋生态学课件二
- GB/T 24475-2023电梯远程报警系统
- HCIA-Security 华为认证初级网络安全工程师实验手册
- 《美学原理》导论-课件
- SB/T 10130-2008绞肉机技术条件
- GM/T 0031-2014安全电子签章密码技术规范
- GB/T 492-1989钠基润滑脂
- 立法建议书6篇
- 2023年苏州工业职业技术学院单招综合素质考试笔试模拟试题及答案解析
评论
0/150
提交评论