


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于Matlab的语音端点检测方法浅析语音的端点检测在语音的编码、语音识别、语音增强、说话人识别中起着非常重要的作用,直接影响着后续工作的正确率。本文介绍了端点检测的基本方法:基于短时能量的、基于短时过零率的、双门限检测的方法,并通过Matlab仿真对双门限检测的方法进行分析。端点检测是语音识别中非常重要的一步。所谓语音端点检测,就是从一段给定的语音信号中找出语音的起始点和结束点。在语音识别系统中,正确、有效的进行端点检测不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰、提高语音识别的正确率。所谓端点检测,就是从一段给定的语音信号中找出语音的起始点和结束点。在语音识别系统中,正确、有效地进行端点检测不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰、提高语音识别的正确率。研究表明,即使是在安静的环境下,语音识别系统一半以上的错误可能主要来基于Matlab编写的语音端点检测程序function x1,x2 = vad(x)%幅度归一化到-1,1x = double(x);x = x / max(abs(x);%常数设置FrameLen = 240;FrameInc = 80;amp1 = 10;amp2 = 2;zcr1 = 10;zcr2 = 5;maxsilence = 8;% 6*10ms= 30msminlen= 15; % 15*10ms = 150msstatus= 0;count = 0;silence = 0;%计算过零率tmp1= enframe(x(1:end-1), FrameLen, FrameInc);tmp2= enframe(x(2:end), FrameLen, FrameInc);signs = (tmp1.*tmp2)0.02;zcr = sum(signs.*diffs, 2);%计算短时能量amp = sum(abs(enframe(filter(1 -0.9375, 1, x), FrameLen, FrameInc), 2);%调整能量门限amp1 = min(amp1, max(amp)/4);amp2 = min(amp2, max(amp)/8);%开始端点检测x1 = 0; x2 = 0;for n=1:length(zcr) goto = 0; switch status case 0,1 % 0 = 静音, 1 = 可能开始 if amp(n) amp1 % 确信进入语音段 x1 = max(n-count-1,1); status= 2; silence = 0; count = count + 1; elseif amp(n) amp2 | . % 可能处于语音段 zcr(n) zcr2 status = 1; count= count + 1; else % 静音状态 status= 0; count = 0; end case 2, % 2 = 语音段 if amp(n) amp2 | . % 保持在语音段 zcr(n) zcr2 count = count + 1; else % 语音将结束 silence = silence+1; if silence maxsilence % 静音还不够长,尚未结束 count= count + 1; elseif count minlen % 语音长度太短,认为是噪声 status= 0; silence = 0; count = 0; else % 语音结束 status= 3; end end case 3, break; endend count = count-silence/2;x2 = x1 + count -1;subplot(311)plot(x)axis(1 length(x) -1 1)ylabel(Speech);line(x1*FrameInc x1*FrameInc, -1 1, Color, red);line(x2*FrameInc x2*FrameInc, -1 1, Color, red);subplot(312)plot(amp);axis(1 length(amp) 0 max(amp)ylabel(Energy);line(x1 x1, min(amp),max(amp), Color, red);line(x2 x2, min(amp),max(amp), Color, red);subplot(313)plot(zcr);axis(1 length(zcr) 0 max(zc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年宿州泗县卫健系统县级医院招聘真题
- 逾期自我检讨书
- 涉外继承纠纷分析基础知识点归纳
- 社区大数据与社区信息化政策研究基础知识点归纳
- 2025年中考音乐知识试题
- 2025图解《政务数据共享条例》V1.0学习解读
- 资源循环利用产业的多元化融资模式与投资吸引力
- 区域性废弃物循环利用项目的可持续发展与生态影响分析
- 医疗设备企业经营管理方案
- 2025至2030年中国甲基氨基酮行业投资前景及策略咨询报告
- 混凝土浇筑清包合同范本
- 生子前签协议书
- 加装电梯补偿协议书
- 人教版小学语文五年级下册复习材料
- 2025年中国龟甲胶市场调查研究报告
- 煤矿机电运输培训课件
- 2025至2031年中国牙科椅行业投资前景及策略咨询研究报告
- 2025至2030中国天文馆行业投资前景研究及销售战略研究报告
- 大额存单合同协议
- 2025-2030中国鱼油行业市场深度调研及发展趋势和投资前景预测研究报告
- 2025年全国国家版图知识竞赛(中小学组)题库
评论
0/150
提交评论