![端点检测[特制材料]_第1页](http://file1.renrendoc.com/fileroot_temp2/2021-2/21/1f44499b-b878-4282-906f-46594a45c1c1/1f44499b-b878-4282-906f-46594a45c1c11.gif)
![端点检测[特制材料]_第2页](http://file1.renrendoc.com/fileroot_temp2/2021-2/21/1f44499b-b878-4282-906f-46594a45c1c1/1f44499b-b878-4282-906f-46594a45c1c12.gif)
![端点检测[特制材料]_第3页](http://file1.renrendoc.com/fileroot_temp2/2021-2/21/1f44499b-b878-4282-906f-46594a45c1c1/1f44499b-b878-4282-906f-46594a45c1c13.gif)
![端点检测[特制材料]_第4页](http://file1.renrendoc.com/fileroot_temp2/2021-2/21/1f44499b-b878-4282-906f-46594a45c1c1/1f44499b-b878-4282-906f-46594a45c1c14.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语音信号处理实验一:端点检测姓名:XXX学号:XXXX班级:XX一、 实验目的:理解语音信号时域特征和倒谱特征求解方法及其应用。二、 实验原理与步骤:任务一:语音端点检测。语音端点检测就是指从包含语音的一段信号中确定出语音的起始点和结束点。 正确的端点检测对于语音识别和语音编码系统都有重要的意义。采用双门限比较法的两级判决法,具体如下第一级判决:1. 先根据语音短时能量的轮廓选取一个较高的门限T1,进行一次粗判:语音起止点位于该门限与短时能量包络交点所对应的时间间隔之外(即AB段之外)。 2. 根据背景噪声的平均能量(用平均幅度做做看)确定一个较低的门限T2,并从A点往左、从B点往右搜索,分别
2、找到短时能量包络与门限T2相交的两个点C和D,于是CD段就是用双门限方法根据短时能量所判定的语音段。 第二级判决:以短时平均过零率为标准,从C点往左和从D点往右搜索,找到短时平均过零率低于某个门限T3的两点E和F,这便是语音段的起止点。门限T3是由背景噪声的平均过零率所确定的。注意:门限T2,T3都是由背景噪声特性确定的,因此,在进行起止点判决前,T1,T2,T3,三个门限值的确定还应当通过多次实验。任务二:利用倒谱方法求出自己的基音周期。三、 实验仪器:Cooledit、Matlab软件四、 实验代码: 取端点流程图一:clc,clearx,fs,nbits=wavread(fighting
3、.wav); %x为0N-1即1Nx = x / max(abs(x); %幅度归一化到-1,1%参数设置文书#借鉴FrameLen = 240; %帧长,每帧的采样点inc = 80; %帧移对应的点数T1 = 10; %短时能量阈值,语音段T2 = 5; %短时能量阈值,过渡段T3 = 1; %过零率阈值,起止点minsilence = 6; %无声的长度来判断语音是否结束silence = 0; %用于无声的长度计数minlen = 15; %判断是语音的最小长度state = 0; %记录语音段状态0 = 静音,1 = 语音段,2 = 结束段count = 0; %语音序列的长度%计算
4、短时能量shot_engery = sum(abs(enframe(x, FrameLen,inc).2, 2);%计算过零率tmp1 = enframe(x(1:end-1), FrameLen,inc);%tmp1为二维数组=帧数*每帧的采样点FrameLentmp2 = enframe(x(2:end) , FrameLen,inc);%signs = (tmp1.*tmp2) T1 % 确信进入语音段 x1 = max(n-count-1,1); % 记录语音段的起始点 state = 2; silence = 0; count = count + 1; elseif shot_eng
5、ery(n) T2| zcr(n) T3 %只要满足一个条件,可能处于过渡段 status = 1; count = count + 1; x2 = max(n-count-1,1); else % 静音状态 state = 0; count = 0; end end if state = =2 % 1 = 语音段 if shot_engery(n) T2 % 保持在语音段 count = count + 1; elseif zcr(n) T3 % 保持在语音段 x3 = max(n-count-1,1); else % 语音将结束 silence = silence+1; if silenc
6、e minsilence % 静音还不够长,尚未结束 count = count + 1; elseif count minlen % 语音段长度太短,认为是噪声 state = 0; silence = 0; count = 0; else % 语音结束 state = 3; end end end if state = =3 % 2 = 结束段 break; endend x1,x2,x3 %A、C、E坐标x11 = x1 + count -1 %B坐标x22 = x2 + count -1 %D坐标x33 = x3 + count -1 %F坐标%画图 subplot(3,1,1)plo
7、t(x)axis(1 length(x) -1 1)%标定横纵坐标title(原始语音信号,fontsize,17);xlabel(样点数); ylabel(Speech);line(x3*inc x3*inc, -1 1, Color, red); %画竖线line(x33*inc x33*inc, -1 1, Color, red);subplot(3,1,2)plot(shot_engery);axis(1 length(shot_engery) 0 max(shot_engery)title(短时能量,fontsize,17);xlabel(帧数); ylabel(Energy);li
8、ne(x1 x1, min(shot_engery),T1, Color, red); %画竖线line(x11 x11, min(shot_engery),T1, Color, red); %line(x2 x2, min(shot_engery),T2, Color, red); %line(x22 x22, min(shot_engery),T2, Color, red); %line(1 length(zcr), T1,T1, Color, red, linestyle, :); %画横线line(1 length(zcr), T2,T2, Color, red, linestyle,
9、 :); %text(x1,-5,A); %标写A、B、C、Dtext(x11-5,-5,B);text(x2-10,-5,C);text(x22-5,-5,D);subplot(3,1,3)plot(zcr);axis(1 length(zcr) 0 max(zcr)title(过零率,fontsize,17);xlabel(帧数); ylabel(ZCR);line(x3 x3, min(zcr),max(zcr), Color, red); %画竖线line(x33 x33, min(zcr),max(zcr), Color, red); %line(1 length(zcr), T3,
10、T3, Color, red, linestyle, :); %画横线text(x3-10,-3,E起点); %标写E、Ftext(x33-40,-3,F终点);运行结果与分析:x1 = 650, x11 = 734,x2 = 646,x22 = 752,x3 = 643,x33 = 763得出的值x3x2 x1 x11 x220.08&indLF %求基因周期basic_T=(LF+ind)/fs; %由点转化为毫秒,即基音周期elsebasic_T=0;endfprintf(基因周期=%dn,basic_T); % basic_T所求基因周期%画图subplot(2,1,1);plot(f
11、rame);axis(1 frameSize -1*10.(-3) 1*10.(-3)title(某个加窗信号);subplot(2,1,2);plot(cepstrum);axis(1 ylen/2 -5 5)title(倒谱图);运行结果与分析: 1、 根据倒谱图可以看出信号没有周期性,应该是清音,所有求出的结果为第一个峰值位置,即0,则基音周期为0/8000s=0,结果基本符合。2、 从自相关函数图中也可以看出在0点峰值最高。3、 总觉得“自相关函数”、“倒谱”、“分帧”、“基音周期”等概念有些弄不清楚五、 心得体会:1、开始frame2 = frame.*(hamming(frameSize);总是出现Matrix dimensions must agree的错误。后来找资料发现把语音的双声道改成单声道就可以了。我想会不会是单声道是把相关的所有音频信号压缩后,用一种音轨播放的,而双声道是把相关的所有音频信号压缩后,把音频分高音音轨和低音音轨分别用两个音轨播放的,有两个声道的缘故,所以虽然双声道的frameSize打印出来时与单声道的一样,而实际上比单声道大,导
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025居间合同的违约责任
- 聘用保洁员合同5篇
- 2025年餐厅兼职员工的劳动合同样本
- 寿县隔音屏施工方案设计
- 大同无尘室工程施工方案
- 施工方案都要两级交底吗
- 2025年黄山市属事业单位考试试卷
- 绿化带内排水施工方案
- 二次进场专项施工方案
- 新型蓄水池施工方案范本
- 高速公路改扩建工程监理投标方案(技术方案)
- 突发性耳聋的中医辩证及护理方案
- T-SZEIA 001-2024 温室气体产品碳足迹量化方法与要求 变电站电气设备
- 2025年湖南省安全员-B证考试题库及答案
- 北师大版六年级下册数学全册同步分层作业设计含答案解析
- 简易钢结构雨棚施工承包合同范本
- 苏州市前期物业管理委托合同范本
- 2022年冀教版七年级上册数学第一次月考试卷
- 《气管支架临床应用》课件
- 8·12天津滨海新区爆炸事故调查报告分析及反思
- 2024新指南:中国阿尔茨海默病早期预防指南解读课件
评论
0/150
提交评论