话音激活检测模块的设计与仿真的中期报告_第1页
话音激活检测模块的设计与仿真的中期报告_第2页
话音激活检测模块的设计与仿真的中期报告_第3页
话音激活检测模块的设计与仿真的中期报告_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

话音激活检测模块的设计与仿真的中期报告中期报告:话音激活检测模块的设计与仿真1.介绍话音激活检测模块是语音处理系统中的一个重要部件,它负责在语音信号中检测出有效语音信号的起始点和终止点。在语音处理领域,对于后续处理模块的性能影响很大,因此说话人唤醒、语音识别、语音合成等领域都需要使用话音激活检测模块。本文将介绍话音激活检测模块的设计与仿真,分别从模块的工作原理及其实现、仿真实验的步骤及结果等角度进行阐述。2.模块的工作原理及其实现话音激活检测模块的工作流程如下:首先,将输入语音信号分帧,然后对帧信号进行预处理,包括加窗、预加重等操作,接着对前一帧信号和当前帧信号进行能量比较,并设置一个阈值(该阈值会动态更新),然后判断该帧是否为语音帧。如果是语音帧,则记录此时的时间,并继续检测后续帧是否为语音帧;如果非语音帧,则停止记录时间并输出上一个语音帧开始时间和终止时间。根据上述流程,我们实现了一下函数:```pythondefvad(signal,fs,winlen=0.025,winstep=0.01,thresh=0.1,smooth=0.01,delta=0.5):#分帧frames=sigFraming(signal,winlen,winstep,fs)frames=frames.astype(np.float32)#预处理foriinrange(len(frames)):frames[i]=preEmphasis(frames[i],delta)frames[i]=hammingWin(frames[i])#计算每帧的能量frameEnergy=np.array([np.sum(frame**2)forframeinframes])#动态阈值minThresh=np.min(frameEnergy)maxThresh=np.max(frameEnergy)thresh=minThresh+thresh*(maxThresh-minThresh)#平滑frameEnergySmoothed=smoothSignal(frameEnergy,smooth)#判断是否为语音帧isVoice=np.array([1ifenergy>threshelse0forenergyinframeEnergySmoothed])#记录语音帧的时间voicedIndex=np.where(isVoice==1)[0]timeLimit=[]i=0whilei<len(voicedIndex):begin=0end=0j=iflag=0whilej<len(voicedIndex)-1:ifvoicedIndex[j+1]-voicedIndex[j]>1:#另起一段语音帧ifflag:timeLimit.append((begin,end-1))i=j+1breakelse:ifnotflag:flag=1begin=voicedIndex[j]end=voicedIndex[j]j+=1ifj==len(voicedIndex)-1andflag:timeLimit.append((begin,end-1))i+=1returntimeLimit```其中,`sigFraming`、`preEmphasis`、`hammingWin`和`smoothSignal`函数分别实现了信号分帧、预加重、加窗和信号平滑操作。3.仿真实验的步骤及结果下面我们来用一些试验验证我们的模块是否正常工作。首先,定义一个信号:```pythonfs=8000time=np.linspace(0,1,fs,endpoint=False)freq1=100freq2=500signal1=np.sin(2*np.pi*freq1*time)signal2=np.sin(2*np.pi*freq2*time)signal=np.concatenate((signal1,signal2))```接着,使用模块处理此信号:```pythontimeLimit=vad(signal,fs,thresh=0.2)```输出语音帧的起始、终止时间如下:```[(0,1865),(3200,4799)]``

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论