




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语音识别之语音识别之MFCCMFCC特征提取特征提取报告人:汤旭国学号:11303490933/8/2022语音识别应用语音识别应用预处理模块预处理模块:对输入的原始语音信号进行处理滤除掉不重要的信息及背景噪声语音分帧(近似认为语音信号在10-30ms内是短时平稳的)预加重(提升高频部分)等处理特征提取特征提取:去除语音信号中对于语音识别无用的冗余信息保留反映语音本质特征的信息 即提取出反映语音信号特征的关键特征参数形成特征矢量 序列,以便用于后续处理声学模型训练:声学模型训练:根据训练语音库的特征参数训练出声学模型参数 在识别时可以将待识别的语音的特征参数同声学模型进行匹配,得到识别结果。语
2、言模型训练:语言模型训练:语言模型是用来计算一个句子出现概率的概率模型。 它主要用于决定哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语的内容。语音解码和搜索算法:语音解码和搜索算法:针对输入的语音信号,根据己经训练好的HMM声学模型、语言模型及字典建立一个识别网络根据搜索算法在该网络中寻找最佳的一条路径,这个路径就是能够以最大概率输出该语音信号的词串语音是怎么产生语音是怎么产生 人通过改变声道的shape发出的不同声音。声道的shape包括舌头,牙齿等。 我们可以分析不同声道产生的语音短时功率谱的包络识别语音 MFCCs(Mel Frequency Cepstral
3、 Coefficents)是一种能准确描述这个包络的特征,在语音识别人工特征方面,可谓是一枝独秀主要的几个概念声谱图(Spectrogram)倒谱分析(Cepstrum Analysis)Mel频率分析(Mel-Frequency Analysis)梅尔倒频谱系数(Mel-Frequency Cepstral Coefficients)一、声谱图(一、声谱图(Spectrogram)FFT FFT FFT 一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram
4、)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)一、声谱图(一、声谱图(Spectrogram)二、二、Cepstrum Analysis峰值表示语音的主要频率成分,我们把这些峰值称为共振峰(formants)共振峰携带了声音的辨识属性(就是个人身份证一样,所以它特别重要)。用它就可以识别不同的声音。如何提取?二、二、Cepstrum Analysis语音信号序列时域:x(n)=h(n)*e(n)频域:X(K)=H(K)E(K)为了较好地将语音信号中
5、的激励信号和声道响应分离倒谱:log|Xk |= log |Hk |+ log |Ek |二、二、Cepstrum Analysis慢变化的包络快变化的周期化细致结构二、二、Cepstrum Analysis我们需要把这两部分分离开-卷积同态系统二、二、Cepstrum Analysis二、二、Cepstrum Analysis二、二、Cepstrum AnalysisMel-Frequency Analysis现在给我们一段语音,我们可以得到它的频谱包络(连接所有共振峰值点的平滑曲线)理论我们可以得到特征向量,但是Mel-Frequency Analysis人类听觉感知的实验表明:听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的,人耳就像一个滤波器组这些滤波器在频率坐标轴上不是统一分布的 在低频区域,分布密集 在高频区域,分布稀疏 如果在语音识别系统中能模拟人类听觉感知处理特点,就有可能提高语音的识别率Mel-Frequency Analysis梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)考虑了人类的听觉特征,先将线性频谱映射到基于听觉感知
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教部编版三年级语文下册《口语交际:春游去哪儿玩》示范教学课件
- 教育孩子心得体会模版
- 2024年天文知识竞赛教学总结模版
- 北魏政治和北方民族大交融教学设计
- 11《我是一只小虫子》(课件)
- 文博会新质生产力
- 大学生职业规划大赛《广播电视学专业》生涯发展展示
- 餐厅管理员述职报告
- 慢性淋病的临床护理
- 学前儿童发展 课件 第8-12章 学前儿童思维的发展-学前儿童社会性的发展
- CJJ 33-2005城镇燃气输配工程施工与验收规范
- 《市场营销:网络时代的超越竞争》第4版 课件 第9章 通过构建渠道网络传递顾客价值
- 农民工工资代付款方协议模板
- 药物合成反应-9合成设计原理
- 跨学科阅读纲要智慧树知到期末考试答案章节答案2024年山东师范大学
- 2025届湖南省数学高一下期末学业水平测试试题含解析
- 哮病-《中医内科学》教案
- 《阵列式消声器技术要求》(T-CAEPI 17-2019)
- 起重工属具安全使用规范课件
- 社区警务工作培训
- 山西省众辉公司招聘考试题库
评论
0/150
提交评论