




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、声音识别之Matlab篇 .声音识别的基本过程声音的读取声音的预处理声音的特征提取声音的识别.声音的读取y,Fs,bits=audioread(e:baima.wav); %读出信号,采样率和采样位数Sound(y,Fs); %播放声音.声音的预处理音频信号的预处理是整个声音识别系统的基础,正确的预处理操作,可以提高识别算法的精度,甚至影响整个系统的识别性能。1.预处理包括:预加重分帧加窗2.预加重:消除低频干扰,提升更为有用的高频部分的频谱。即将声音信号通过一个高通滤波器:3.分帧:利用声音信号具有短时平稳性的特点,对声音信号分帧提取其短时特性,处理语音信号时一般取帧长为10-30ms。分帧
2、可以采用连续分段的方法,也可以采用交叠分段的方法,但为了使帧与帧之间过渡平滑,保持其连续性,一般采用交叠分段的方法,前一帧和后一倾交叠的部分称为帧移,帧移一般取帧长的一半。.声音的预处理4.加窗:因为傅立叶变换对应的是无限信号,信号经过分帧后变成有限信号,分帧的信号再进行傅立叶变换后,高频部分将有泄露,所以要加窗. 在声音信号处理中常见的窗函数有矩形窗、汉明(Hamming)窗、汉宁(Hanning)窗。.加窗图像:使用具有平滑过渡特性的窗口,目的是为了减少帧起始和结束处的信号不连续性。.预处理程序:.声音的特征提取声音识别中的特征参数:1.频率2.短时过零率3.短时能量4.Mel倒谱系数.声
3、音的频谱特性: FFT,即快速离散傅立叶变换。由于信号在时域上变化迅速且会随着时间不断的改变,所以不容易观察出周期性的变化,使得在时域上没有办法作有效的观察。为了方便看出信号的特性,通常会将它转换到频域上的能量分布来观察,不同的能量分布,就能代表不同声音的特性。.: 声音的短时能量:短时能量函数主要用来区分轻音和浊音.声音的短时过零率:表示一种语音信号波形穿过横轴的次数。过零分析是语音时域分析中最简单的一种。可以粗略的描述信号的频谱特性,用于区分和判断清音和浊音。端点检测可通过短时能量和短时过零率来做。.Mel倒谱系数(MFCC): 如图所示由于语音信号在时域上的变化快速而不稳定所以通常都将它
4、转换到频域上来观察。此时它的频谱会随着时间作缓慢的变化,所以通常将声音信号分帧加窗后,经过快速傅立叶变换(FFT),求出每帧的频谱参数,再将每帧的频谱参数通过一组N个(N一般为2030个)三角形带通滤波器所组成的梅尔频率滤波器,将每个频带的输出取对数,求出每一个输出的对数能量(logenergy), 再将此N个参数进行余弦变换(cosinetransform),求出L阶的Mel参数。 MFCC是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率感知的非线性特性,它与频率的关系可用下式近似表示:.改进后的MFCC.声音识别SVM是一种训练机器学习的算法,可以用于解决分类和回归问题。基
5、本原理:将所有待分类的点映射到“高维空间”,然后在高维空间中找到一个能将这些点分开的“超平面”。但是仅仅找到超平面是不够的,因为在通常的情况下,满足条件的“超平面”的个数不是唯一的。SVM需要的是利用这些超平面,找到这两类点之间的“最大间隔”。分类间隔越大,对于未知点的判断会越准确。优点:做一些非常复杂的数据转换工作,然后根据预定义的标签或者输出进而计算出如何分离用户的数据。缺点:就是由于更多的运算量,训练的时间要长很多。.SVM算法的工具箱很多,共用的最好的是libsvm工具箱。两个主要函数: svmtrain()%通过训练集来训练模型 svmpredict()%对测试集进行预测model=
6、svmtrain(train_label,train_matrix, option);predict_label, accuracy,decision_values = svmpredict(test_label,test_matrix, model);1.train_matrix与test_matrix必须是double型。2.train_label与test_label是列向量。3.option:参数很多,比如-c:损失函数,即是对错分的惩罚参数。-g是一个核函数类型。.Svm算法流程:1)设置训练集和样本集需要两组数据,一组是训练集,一组是测试集。2)设置SVM参数通过对训练集的预测训练得到最佳参数。3)训练SVM利用函数svmtrain,利用训练集训练分类器,得到model.4)用这个SVM进行分类预测调用函数svmpredict,利用model对测试集进行分类预
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能渔业养殖助手行业深度调研及发展战略咨询报告
- epc总包合同范例
- 特殊膳食需求油行业跨境出海战略研究报告
- 智能护肤APP社区行业跨境出海战略研究报告
- 代加工合同范例乙方
- 湿地公园建设项目管理计划
- 宠物行业卫生与防疫措施
- 四年级英语班级合作学习计划
- 医疗行业安全生产管理体系及管理措施
- 电池循环测试数据管理系统租赁与维护服务合同
- 武汉市农村土地承包经营权转包出租合同
- 小学数学-课前三分钟.ppt
- 钢纤维混凝土检查井盖J
- 上海市节能评审和节能评估文件编制费用收费标准
- 施工场地移交单(共4页)
- 河北省初中生综合素质评价实施
- 各种液体粘度表
- 德国化学成分牌号与DIN17007系统的数字材料号对照表[1]
- 完整版,加工贸易手册核销
- 22-1附件1:国家电网公司班组建设管理标准
- 马云-冬天的使命原稿
评论
0/150
提交评论