基于BP神经网络的语音识别技术_第1页
基于BP神经网络的语音识别技术_第2页
基于BP神经网络的语音识别技术_第3页
基于BP神经网络的语音识别技术_第4页
基于BP神经网络的语音识别技术_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于BP神经网络的语音识别技术、报告者:目录、I .语音识别概述2。语音识别过程3。语音信号预处理4。语音识别特征提取5。BP神经网络原理6 .作为语音识别程序设计、I .语音识别概述、语音识别研究对象,在语音识别、生理学、心理学、语言学、计算机科学和信号处理等诸多领域,最终目的是人类和机器进行自然语言通信,用语言操作计算机。语音识别系统可以分为孤立词(词)语音识别系统、连接词语音识别系统和连续语音识别系统。语音识别系统分为两个方向。一是根据对说话人的依赖,可以分为特定人和非特定人的语音识别系统;二是根据词汇大小,可分为小词汇、中间词汇、大词汇、无限词汇语音识别系统。ii .语音识别过程,如图的系统整体体系结构中所示,基于BP神经网络的语音识别系统的构建可以分为训练阶段和识别阶段两个阶段。首先,用户通过麦克风输入语音形成原始语音,系统对其进行预处理。预处理包括三个过程:预加权、帧和端点测试。系统的前端使用端点检测来确定一个语音信号中的起点和终点。在特征提取部分,使用MFCC作为特征参数,数字1-5,3 .语音信号预处理,1 .由于预加权、嘴唇辐射中6dB/oct的衰退,我们希望在处理语音信号之前以6dB/oct比率增加(或增加)信号,将输出信号水平提高到类似的水平。可以使用以下差异表达式定义的数字过滤器:表达式中的系数通常介于0.9和1之间。2 .语音信号的帧分割语音信号是典型的非静态信号,其中平均函数u(x)和自相关函数R(xl,x2)随时间发生很大变化。但是在短时间内,语音信号保持频谱特性平稳。也就是说,有短时间内停止的特性。因此,在实际处理中,可以将语音信号分成称为“帧”的非常小的时间段(约10 30毫秒)。语音信号数字处理中常用的窗口函数是矩形窗口、汉明窗口等,其表达式如下(其中n是帧长度):矩形窗口:汉明窗口:3。基于端点检测、短时能量和短时零交叉比的双阈值检测方法,可以在短时能量检测更好的地区区分浊音和静音。在清音的情况下,其能量很小,在短时间能量检测中,由于低于能量阈值,被误认为静音,短时间过影率可以在语音中区区分静音和清音。结合两种检测功能,可以同时检测语音段和静音段。下图是我本科课程设计终点检测的程序GUI界面。在这里,声音是教科书中的示例性声音“他去无锡”,我通过cooledit向示例性声音中添加白色噪音,可以看出声音段混合在噪声中,短时间能量的文值选择太高会切断声音段,所以添加0度可以更好地识别声音段。这幅图可以看到出站选择的合理性对终点识别的效果有很大的影响4。语音识别特征提取,特征提取:每个语音寻找不同语音的唯一特征,并通过此判断未知语音,因此每个语音识别系统必须执行特征提取。语音信号的特征主要有域和频域两种。时域特征:短时间平均能量、短时间平均过零速度、共振峰、俯仰周期等;频域特征:线性预测系数(LPC)、LP逆频谱系数(LPCC)、Mel频率逆频谱系数(MFCC)等。本实验为萃取特征参数选取MEL频率cept系数(MFCC)。阅读文献发现,基于DTW算法和MFCC的语音已经被识别,但是情况相对不好,中间测试只能识别特定的语音段,更换说话者后识别效果很低。5 .BP神经网络原理,BP神经网络也称为误差反向传递神经网络。在提取了语音的特征参数后,神经网络利用多个连接权非线性地操作输入模式的最大兴奋输入点代表了输入模式对应分类。神经网络的连接权重系数在使用过程中根据识别结果的正确性,持续可变地进行校正。单个隐藏层网络的整个体系结构分为输入层、隐藏层和输出层,如图所示。此处隐藏的层可以是一个层次结构,也可以是多个层次结构,具体取决于具体情况。VI。语音识别编程,数字语音识别实验目的:识别135岁数字(135是因为135岁数字的识别率最高)的培训样本:每个数字选择5个样本进行培训(都是同一个人的样本)测试样本:每个数字选择3个样本进行识别测试(都是同一个人的样本)t1=100,netbp=newff (pr,30,10,3,tan SIG,tan SIG,train bfg);使用% conjugate gradient方法TRAINSIG的优点是,当培训不收敛时,培训会自动停止,所需的时间比其他算法(TRAINLM,TRAINGD)少。也就是说,快速netbp . trainparam . EPO CHS=100;%设置培训阶段nettr=train(netBP,PS,T);%网络培训,神经网络培训:Y=sim(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论