版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 语音信号处理 Speech Signal Processing第1章 绪论 第2章 语音信号的声学基础及产生模型第第3 3篇篇 语音信号处理技术语音信号处理技术 与应用与应用(10(10学时学时) )第第2 2篇篇 语音信号分析语音信号分析(14学时)第第1 1篇篇 语音信号处理基础语音信号处理基础(4学时) 第3章 时域分析第4章 短时傅立叶分析 第5章 同态滤波及倒谱分析 第6章 线性预测分析第7章 矢量量化第8章 隐马尔可夫模型(HMM)第9章 语音检测分析第10章 语音编码(1)波形编码第11章 语音编码(2)声码器及混合编码第12章 语音合成第13章 语音识别第14章 说话人识别第
2、15章 语音增强第11章 语音编码(2)声码器技术及 混合编码v声码器概念v通道声码器v同态声码器v线性预测声码器v混合编码v各种编码方法的比较及语音编码性能指标和质量评价声码器的概念 语音参数编码语音参数编码,即,即声码器声码器,通过对语音信号的,通过对语音信号的参数参数进行提取进行提取及编码,力图使重建语音信号具有尽可能高的可懂度,即及编码,力图使重建语音信号具有尽可能高的可懂度,即保持原保持原语音的语意语音的语意,而重建信号的波形同原语音信号的波形可能会有相,而重建信号的波形同原语音信号的波形可能会有相当大的差别。当大的差别。它只要求得到的信号听起来与输入语音完全一样,而不必与输它只要求
3、得到的信号听起来与输入语音完全一样,而不必与输入波形相同。入波形相同。优点:优点:编码率低,编码率低,2.4kbit/s甚至以下。甚至以下。为了达到很低的传输码率,声码器只能提取和传输那些携带听觉为了达到很低的传输码率,声码器只能提取和传输那些携带听觉上最重要部分的信息的上最重要部分的信息的参数参数,同时必须进行高效的编码。,同时必须进行高效的编码。缺点缺点:合成的语音质量差,特别是自然度较低,不一定能听出讲:合成的语音质量差,特别是自然度较低,不一定能听出讲话人是谁话人是谁典型的声码器典型的声码器:通道声码器、相位声码器、同态声码器以及目前:通道声码器、相位声码器、同态声码器以及目前广泛使用
4、的线性预测广泛使用的线性预测(LPC)声码器声码器LPC声码器和通道声码器为研究最深入,使用最广泛的声码器,声码器和通道声码器为研究最深入,使用最广泛的声码器,LPC声码器较好地解决了传输数码率与所得到的语音质量间的矛声码器较好地解决了传输数码率与所得到的语音质量间的矛盾,比较有实用价值。盾,比较有实用价值。相位声码器早期常用,由于其语音质量不如相位声码器早期常用,由于其语音质量不如LPC声码器而逐渐被声码器而逐渐被淘汰。淘汰。同态声码器语音质量比同态声码器语音质量比LPC声码器好,但始终无法降低其数码率声码器好,但始终无法降低其数码率整个滤波器输出的包络近似于语音的频谱包络整个滤波器输出的包
5、络近似于语音的频谱包络在发端,语音加于滤波器组和基音提取器上。在发端,语音加于滤波器组和基音提取器上。滤波器组将语音的频率范围分成许多相邻的频带或通道,滤波器滤波器组将语音的频率范围分成许多相邻的频带或通道,滤波器的数目取决于不同的结构方式,一般的数目取决于不同的结构方式,一般14-20个以上个以上是早期广泛使用的声码器是早期广泛使用的声码器1.通道声码器通过边带信息,包括浊音、清音分类、基音周期等,来恢复通过边带信息,包括浊音、清音分类、基音周期等,来恢复语音信号的谐波结构,或者说是提供声门激励的信息。语音信号的谐波结构,或者说是提供声门激励的信息。通道声码器的输出语音的音质较差,听起来通道
6、声码器的输出语音的音质较差,听起来“电气电气”很重,明很重,明显混有正弦声、混响声、哨声、蜂音等。显混有正弦声、混响声、哨声、蜂音等。但可懂度可做的很好,抗背景噪声能力也强,即顽健性好。但可懂度可做的很好,抗背景噪声能力也强,即顽健性好。2.同态声码器同态声码器的基础建立在语音信号的产生模型上,即是同态声码器的基础建立在语音信号的产生模型上,即是语音由语音由声门激励和声道响应序列的卷积所产生声门激励和声道响应序列的卷积所产生,因此采用,因此采用同态解卷同态解卷方方法来进行处理。法来进行处理。同态处理后,同态处理后,激励信息处于倒谱的高时域激励信息处于倒谱的高时域,而,而声道信息处于低时声道信息
7、处于低时域域,两者是相互分开的。,两者是相互分开的。在同态声码器的分析部分,由倒谱在同态声码器的分析部分,由倒谱c(n)分离出包含声道频谱包络分离出包含声道频谱包络信息的低时部分,同时由高时部分判断清浊音分类并提取基音周信息的低时部分,同时由高时部分判断清浊音分类并提取基音周期期倒谱分析流图倒谱分析流图在同态声码器中,每在同态声码器中,每10-20ms计算一次倒谱,计算一次倒谱,从每一帧的倒谱高时部分估计基音周期和清从每一帧的倒谱高时部分估计基音周期和清/浊音信息;它们和倒浊音信息;它们和倒谱的低时部分一起,经过量化和编码,送去传输和存储。谱的低时部分一起,经过量化和编码,送去传输和存储。在接收端合成部分,传输过来的声门激励参数生成声门激励序列;在接收端合成部分,传输过来的声门激励参数生成声门激励序列;从量化的低时段倒谱计算出近似的声道冲激响应,令二者直接卷从量化的低时段倒谱计算出近似的声道冲激响应,令二者直接卷积得到合成的语音信号。积得到合成的语音信号。3.线性预测声码器激励信号激励信号产生器产生器混合编码改变激励信号的选择原则,是合成语音尽可能接近原始语音。先改变激励信号的选择原则,是合成语音尽可能接近原始语音。先分析输入语音,提取声道模型参数,然后选择激励信号激励声道分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四川南江公用事业发展集团有限公司招聘5人笔试历年典型考点题库附带答案详解
- 2025吉林省吉高工程咨询有限公司新项目监理检测技术人员(吉高集团招聘3号)招聘拟聘用人员笔试历年难易错考点试卷带答案解析
- 2025中国北京同仁堂(集团)有限责任公司拟招录集团本部投资管理部收并购项目岗人选笔试历年常考点试题专练附带答案详解
- 头层皮超纤基布项目可行性研究报告
- 空分装置绿色节能升级改造项目可行性研究报告
- 产妇产后恢复护理
- 江西会考考试试卷及答案
- 护理服务明星专业技能提升
- 面部护理与身体护理的差异
- 大功率风电精密轴承项目初步设计
- 2025内蒙古鄂尔多斯市鄂托克旗招聘专职社区人员30人笔试考试备考题库及答案解析
- 家电元旦活动方案策划(3篇)
- 2025福建厦门海隆码头有限公司门机司机岗社会招聘2人备考考点试题及答案解析
- 2026水利部长江水利委员会事业单位招聘87人(第二批)笔试备考题库附答案解析
- 天津市第九十中学2025-2026学年上学期七年级英语第二次月考试卷(含答案无听力部分)
- 《NYT 789-2004 农药残留分析样本的采样方法》(2026年)实施指南
- 2025中国气象局在京单位第二批拟招聘52人(公共基础知识)测试题附答案解析
- Unit 6 Changing for the seasons Part A Let's learn 课件 2025-2026学年人教PEP版英语四年级上册
- 2025年10月自考00319行政组织理论试题及答案含评分参考
- 车行投资车辆合同范本
- 培训课堂纪律要求
评论
0/150
提交评论