基于STFT的特殊词汇识别的比较研究.doc_第1页
基于STFT的特殊词汇识别的比较研究.doc_第2页
基于STFT的特殊词汇识别的比较研究.doc_第3页
基于STFT的特殊词汇识别的比较研究.doc_第4页
基于STFT的特殊词汇识别的比较研究.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于STFT的特殊词汇识别的比较研究文献综述报告摘要: 语音识别的研究早在20 世纪70年代就开始了。计算机的出现推动了现代信息处理技术的发展。基于计算机、语音识别、分类、特征提取等一系列问题,被越来越多的研究人员关注。语音信号的识别是新兴的交叉学科,其研究涉及物理学、信号处理等诸多学科知识。就是在这样的背景下,以研究语音特征提取算法、跟踪匹配声音信息为目的而提出来的。从声音的基本特征出发,阐述了时域、频域上音频信号的分析方法,并研究了音高、音长的特征提取及匹配算法,最终实现了系统应用,论文是利用matlab软件完成系统设计的。关键词:语音识别;短时傅里叶变换;matlab 1 引言语音信号属于非平稳信号,它的一个重要特点是语音信号随时间变化而随机变化的,又由于人的声道形状及其变化规律具有一定惯性,因此在一段时间间隔内语音信号保持相对稳定,所以对语音信号的分析和处理就必须建立在“短时”概念基础上。本文基于短时傅里叶变换方法,利用hr数字低通、带通和高通滤波器对原始语音信号在不同频率范围进行提取,得到感兴趣的敏感语音。处理后的语音在低音、中音和高音段音效明显,达到了敏感语音提取的目的。由于所处理的音频文件不受格式限制,灵活性和操作性好,因此这种方法可应用于动漫音效合成和特殊音效生成场合,具有实际应用价值。2 matlab软件介绍2.1 matlab概述在科学研究和工程应用中,往往需要进行大量的数学运算,其中包括矩阵运算。这些运算一般要借助相应的程序作近似计算。而这既需要对有关的算法有深刻的理解,有需熟练常务所用语言的语法和变成技巧,而同时具备这两方面才能是有一定的困难的。matlab诞生于20世纪70年代,意为矩阵与实验室的组合。matlab擅长数值计算,能处理大量的数据、效率高。它是集合命令翻译和科学计算于一身的一套交互软件系统,在matlab下,矩阵的运算变得异常的容易,后来又增添了丰富多彩的图象处理及多媒体功能,使得matlab的应用范围越来越广泛。matlab的核心是一个基于矩阵运算的快速解释程序,它交互地接受拥护输入的各项命令,输出计算结果。matlab提供了一个开放市的集成环境,用户可以运行系统提供的大量命令,包括数值计算、图形绘制忽然代码编制等它的具体功能有:数据可视化功能、矩阵运算功能、大量的工具箱、绘图功能等。matlab语言简单但内涵丰富,其具有编程效率高、用户使用方便、扩充能力强、移植能力好、矩阵和数组的运算高效快捷、绘图方便等显著特点。目前的matlab已经成为国际上最为流行的软件之一,它除了传统的交互式编程之外,还提供了丰富可靠的矩阵运算、图形绘制、数据处理、图像处理,方便的windows编程等便利工具,出现了各种以matlab为基础的实用工具箱,广泛地应用于各个领域。2.2 matlab功能介绍matlab的核心是一个机遇矩阵运算的快速结实程序,它交互地接受用户输入的各项命令,输出计算结果。matlab提供了一个开放式的集成环境,拥护可以运行系统提供的大量命令,包括数值计算、图形绘制和代码编制等。具体具有以下功能:数据可视化功能;矩阵运算功能;大量的工具箱;绘图功能;gui设计;simulink仿真。2.3 matlab语言特点matlab语言有不同于其他高级语言的特点,它被称为第四代计算机语言。它的语言最大的特点就是简单和快捷。例如:编程效率高;用户使用方便;扩充能力强,交互性好;移植性好,开放性好;语句简单,内涵丰富;高效方便的矩阵和数组运算;方便的绘图功能等等。3 基于短时傅里叶变换matlab系统的实现3.1短时傅里叶变换短时傅立叶变换基本思想是将信号加滑动时间窗,并对窗内信号做傅立叶变换,得到信号的时变频谱。傅里叶变换之后的图像仅包含频域信息,丢失了时域信息,在那些同时需要频域和时域信息的时候(在什么时候存在哪些频率)就显得无能为力,因此出现了短时傅里叶变换,短时傅里叶变换认为在一个小的时间段deltat内信号是稳定的,信号包含的频率是不变的,利用一个窗口函数与原始函数卷积,在特定的时间仅计算该时间前后共deltat时间内的信号的傅里叶变换作为该时间点的傅里叶变换,即该时刻的频谱。3.2短时傅立叶变换特点短时傅立叶变换基本思想是将信号加滑动时间窗,并对窗内信号做傅立叶变换,得到信号的时变频谱。因而它的时间分辨率和频率分辨率受heisenberg测不准原理约束,一旦窗函数选定,时频分辨率便确定下来。这就使它对突变信号和非平稳信号的分析存在局限性,因而不是一种动态的分析方法, 不能敏感地反映信号的突变,只适用于对缓变信号的分析。3.3 matlab系统的实现(stft)传统的傅里叶变换方法只适用于周期、瞬变、平稳随机信号,所以对于非平稳的信号这种方法并不适用,而且考虑乐音分析实时性的要求,也必须对信号进行分段分析以提取短时特征。所以,必须采取短时傅里叶变换。信号短时傅里叶变换定义如下: (3.3.1) 为窗口函数。这里有两个问题,一个是窗长问题;另一个是窗函数选择问题。如果要求短时傅里叶变换忠实再现原序列的傅里叶变换,窗函数的傅里叶变换必须相对于原序列的傅里叶变换是一个冲激函数,这要求选择较大的窗长,当然,如果窗长过大,则不能准确反映短时特征,所以要选取合适的窗长16。同时,窗函数也影响短时频谱,矩形窗第一旁瓣衰减不够会导致短时频谱与原始频谱相差较大,一般在音频分析会根据实际情况选择最合适的窗函数。、从定义可以看出,短时傅里叶变换实际上就是加窗以后的傅里叶变换,在此基础上,可以得到短时功率谱: (3.3.2)有短时功率谱可以求得短时自相关,因为短时功率谱是短时自相关的傅里叶变换:(3.3.3)计算短时傅里叶变换可以利用快速傅里叶变换算法fft,需要计算的fft的点数是2的幂,一般对给定窗长不足情况采取补零处理的方法。4基于小波变换matlab系统的实现4.1小波变换小波可以理解为是在短时傅里叶变换的基础上对窗口函数增加了一个尺度因子,该尺度因子随着频度变化而变化,使得在低频时降低窗口宽度增加时间分辨率而在高频时增加窗口宽度增加频率辨率。4.2小波变换特点小波变换通过伸缩和平移运算对信号进行多尺度分解,能够有效地从信号中获取各种时频信息, 它在时域和频域同时具有良好的局部化性质,具有多分辨率分析特性。但小波分解的结果依赖小波基函数,而各小波基函数的适用范围很不一致,这就造成了小波基选择问题,如果母小波选择不当,则应用效果会大受影响;小波分析不具有自适应性,一旦选择了小波基和分解尺度,则用它来分析具多频率成分的数据时,所得结果只能反映某一固定频带内的信号,所以要选择不同的小波基。4.3 matlab系统的实现(w t) 小波分析是当前数学中一个迅速发展的新领域,在matlab中,图像的增强、除噪、压缩是其应用领域中的一个方面.文中首先介绍了小波分析的历史与现状,然后详细地说明了当前小波分析在图像方面的各个应用领域和研究的意义,以及其研究工具matlab组成和特点,从理论上讲解了小波变换的由来、定义和特点,在分析中所涉及到的连续小波变换、离散小波变换、二维小波变换.通过小波分析的理论研究,应用matlab来实现了一般图像的压缩、除噪和增强,然后利用小波分析的工具箱打开图形接口方式,来实现相关小波分析的应用。5语音识别技术的前景和应用可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统 的方向前进。6 小结本论文主要是基于高级面向对象开发语言matlab的基本特征,以及matlab强大的工具箱功能,实现了基于短时傅里叶变换matlab语音识别系统对一个实际录音文件的特征提取与分析。系统的使用者现在可以在matlab软件的帮助下,运行使用整个系统,得到想要的语音相关信息和比对。 参考文献1 孙祥.matlab 7.0基础教程M.北京:清华大学出版社,2005.5,34-128.2 思科技产品研发中心.matlab 7基础与提高M.北京:电子工业出版社,2005,21-37.3 罗宾纳著;阮平望译.语音识别基本原理M.北京:清华大学出版社,1999.9,78-91.4 刘幺和,宋庭新.语音识别与控制应用技术M.北京:科学出版社,2008.2,66-107.5 彭志科,何永勇,卢青,褚福磊等. 小波多重分行及其在振动信号分析中的研究J.机械工程学报(自然科学版),2002,09(20):3-21.6 王刚. 基于小波变换和多重分形分析的表面肌电信号分析D.上海:上海交通大学,2008. 7 何培民等.信息处理系统M.北京:北京科技出版社,1993.12,1-139.8 阎石.数字电子技术基础(第五版)M.北京:高等教育出版社,2006,1-88.9 Orlando.fla.fourier transform infrared spectroscopy,applications to chemical systems. v.4J academic pr.inc,1992.英文题目Based on the special vocabulary STFT identification of the comparative study英文摘要Fourier transform basic idea is to will signal and sliding time window, and the window inside signal do Fourier transform, get signal time-varying spectrum Fourier transform after image contain only the frequency domain information, lost time domain information, in those also need the frequency domain and time domain information (when existence whichfrequency) is helpless, so there was a short time Fourier transform, short time Fourier transform think in a small time within the deltat signal is stable, signal contains frequency are the same, and use a window function and the original fun

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论