语音信号处理复习.ppt_第1页
语音信号处理复习.ppt_第2页
语音信号处理复习.ppt_第3页
语音信号处理复习.ppt_第4页
语音信号处理复习.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音信号处理,SpeechSignalProcessing,全书三篇,16章(讲15章),第一篇语音信号处理基础,第2章语音信号处理的基础知识,第1章绪论,第二篇语音信号分析,第3章语音信号的时域分析,第4章语音信号的短时傅里叶分析,第5章语音信号的同态滤波及倒谱分析,第6章语音信号的线性预测分析,第7章语音信号的矢量量化,第8章隐马尔可夫模型(HMM),第9章语音检测分析,第三篇语音信号处理技术与应用,第10章语音编码(一)波形编码,第11章语音编码(二)声码器技术与混合编码,第12章语音合成,第13章语音识别,第14章说话人识别,第15章语音增强,第2章语音信号处理的基础知识,语音的产生语音的分类:浊音、清音语音的基本特性语音的时间波形和频谱特性语音信号的统计特性,第1章绪论,语音信号处理:概念、应用领域语音、语言:,声道模型,语音信号的产生模型,激励模型,辐射模型,声管模型,共振峰模型,级联型,并联型,混合型,语音产生的数字模型,语音取样值,准周期脉冲序列发生器,基音周期,增益控制,随机噪声发生器,时变线性系统,时变参数,浊音,清音,语音信号的产生模型,第2章思考题:什么叫语言?什么叫语音?人类的发音器官包括哪些?在发音时各起了什么作用?解释以下概念:基音频率、共振峰、浊音、清音。语音信号模型包括哪些子模型?激励模型和辐射模型各属于什么性质的滤波器?,第3章语音信号的时域分析,语音处理的目的,语音信号分析方法,短时分析技术:对语音信号采用分段或叫分帧处理称为短时分析,短时能量分析,短时平均能量的定义,窗口形状的选择,窗口的长度,主要用途:区分清音段和浊音段,短时平均幅度,短时过零分析:定义、主要用途,短时相关分析,第3章思考题:1.在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?2.短时平均能量(平均幅度)和短时平均过零率的定义。这两种时域参数的用途。窗口函数的长度和形状对它们有什么影响?3.短时自相关函数和短时平均幅度差函数定义和用途,它们间有什么差异?,第4章语音信号的短时傅里叶分析,短时傅里叶变换的定义,短时傅里叶变换的取样率,标准傅里叶变换的解释,滤波器的解释,语音信号的短时综合,滤波器组求和法,语谱图,可同时在时间和频率上显示语音频谱随时间的变化。,表达式,频率分辨率、时间分辨率与窗口长度的关系:,第4章思考题:,短时傅里叶变换的定义式是什么?短时傅里叶变换的两种解释是什么?如何提高短时谱的频率分辨率?在求语音信号的短时谱时,对窗函数有什么要求?对语音信号频谱分析采用海明窗和矩形窗各有什么特点?短时傅里叶变换滤波器解释的两种形式的物理意义是什么?4.什么是语谱图?窄带语谱图和宽带语谱图各有什么特性?,第5章语音信号的同态滤波及倒谱分析,由卷积结果求得参与卷积的各个信号称为“解卷”,也称为反卷积。同态信号处理也叫同态滤波,它实现了将卷积关系变换为求和关系的分离处理。,复倒谱和倒谱,同态信号处理的基本原理,卷积同态系统模型,特征系统,D*和D*-1的三步数学运算,语音信号两个卷积分量的复倒谱,避免相位卷绕的算法,最小相位信号序列:信号的零极点全部在z平面单位圆内。,第5章思考题:,与第9章结合复习,1.什么叫解卷?解卷算法有几种?什么叫同态滤波?其作用是什么?2.卷积同态系统的组成及意义?特征系统D*和逆特征系统D*-1运算的三个步骤是什么?3.什么是复倒谱?什么是倒谱?分别写出其数学表达式。清、浊音的复倒谱或倒谱各有什么特点?4.什么是相位卷绕?它是如何产生的?有什么方法克服?,主要内容6.1概述6.2线性预测分析的基本原理6.3线性预测分析的解法自相关法6.4格型法6.5线性预测分析应用-LPC谱估计和LPC复倒谱,第6章语音信号的线性预测分析,线性预测分析就是根据已知信号s(n)对各参数和增益G进行估计。在这里为线性预测系数。,线性预测(简写为LPC)分析的基本原理是将被分析的信号用一个模型来表示,即将信号看作是一个模型(即系统)的输出。用模型参数来描述信号。,H(z),u(n),s(n),图6-1信号s(n)的模型化,F(z),s(n),图6-3线性预测器,逆滤波器,第6章思考题:,1.如何将信号模型化为模型参数?最常用的是什么模型?什么叫线性预测?什么叫逆滤波器?2.自相关法求预测误差滤波器的预测系数、预测误差功率的过程。3.什么叫LPC参数?PARCOR参数?LSP参数?4.什么是LPC谱?LPC谱估计的特点。,7.1概述7.2矢量量化的基本原理7.3失真测度7.4最佳矢量量化器和码本设计7.5降低复杂度的矢量量化系统7.6语音参数的矢量量化,第7章语音信号的矢量量化,第7章思考题:,1.什么叫矢量量化?什么叫码书?码字?2.矢量量化器的工作原理是什么?3.什么叫失真测度?常用的有哪几种?4.矢量量化器最佳设计的两个条件?如何理解?5.LBG算法原理?,第8章隐马尔可夫模型(HMM),8.1概述8.2隐马尔可夫模型的引入8.3隐马尔可夫模型的定义8.4隐马尔可夫模型三项问题的求解,HMM模型的结构主要有两种:各态历经:主要用于说话人识别、语种辨识等(即只能用于不要求时间顺序的语音信号处理)从左至右:主要用于语音识别(因语音识别特征参数是一个时间序列),第8章思考题,根据某状态HMM模型,每一种路径输出某某符号的概率计算。,1.什么叫做隐马尔可夫过程?为什么说语音信号可以看成隐马尔可夫过程?2.HMM模型的结构主要有哪两种?它们的特点是什么?3.隐马尔可夫模型有哪些模型参数?请叙述这些参数的含义和定义式。,第9章语音检测分析,语音检测分析语音特征参数的提取和分析。主要包括:基音检测和共振峰参数的估值。,简化逆滤波法(SIFT),基音检测,倒谱法,自相关法,共振峰估值,带通滤波器法DFT法倒谱法LPC法,第9章思考题,1.基音检测的自相关法中的中心削波处理的思路及实现过程?2.用倒谱法实现基音检测和共振峰检测的原理及实现框图?,第10章语音编码波形编码,语音编码的概念、应用和分类等语音信号的压缩编码原理语音通信中的语音质量脉冲编码调制(PCM)及其自适应,波形编码、参数编码,预测编码及其自适应APC自适应预测编码APC系统框图、总量化误差预测编码可以改善信噪比的原因短时预测和长时预测自适应差分编码调制(ADPCM),1.在语音通信中,常将语音质量分为哪四等?2.语音信号能进行压缩编码的依据是什么?语音编码的分类?3.自适应的控制量有几个?控制方式有几种,其特点是什么?4.预测编码可以改善信噪比的原因是什么?5.什么是短时预测和长时预测?,第10章思考题,参数编码(声码器)概念声码器的基本结构相位声码器和通道声码器同态声码器线性预测声码器混合编码,第11章语音编码声码器技术及混合编码,1.什么叫声码器?其传输速率可低达多少?目前已研究出哪几种类型声码器?其中最常用的是哪一种?为什么?2.画出LPC声码器的原理框图。在LPC声码器中,最好的量化参数是什么?为什么?,第11章思考题,第12章语音合成,语音合成的概念、目的语音合成系统与声码器中的语音合成器的区别语音合成原理语音合成的方法:波形合成法、参数合成法、规则合成法语音合成系统的特性共振峰合成:框图、原理线性预测合成:形式有两种用预测器系数ai直接构成的递归型合成滤波器采用反射系数构成的格型合成滤波器,2种方法的异同点,1.语音合成的目的是什么?它主要分为几类?什么叫波形合成法和参数合成法?其区别在哪儿?试比较它们的优缺点。2.共振峰合成器和LPC合成法的构成原理?对系统框图的理解?这两种方法的异同点?,第12章思考题,第13章语音识别,语音识别的概念、目的和分类语音识别原理:模式匹配原理、语音识别的步骤框图理解动态时间规整(DTW):概念、目的、原理孤立词识别系统:原理和框图理解,1.什么是语音识别?语音识别系统如何分类?当前,语音识别的主流方法是什么?2.语音识别系统由哪几个部分组成?语音识别中常用的语音特征参数有哪些?3.什么是动态时间规整?实际中,它解决了什么问题?4.孤立词识别系统框图?框图中,参考模式库和模式识别的作用是什么?,第13章思考题,第14章说话人识别,说话人识别定义、目的和关键问题说话人识别分类、应用特征提取说话人识别所用的特征特征类型的优选准则:F比作为有效性准则(物理意义)说话人识别系统的结构:组成、基本结构、说话人识别系统的性能评价如:说话人确认系统最重要的两个性能指标:错误拒绝率(FR)、错误接受率(FA),说话人识别中的识别方法DTW型说话人识别系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论