版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
...wd......wd......wd...语音信号分析与处理系统设计语音信号分析与处理系统设计摘要语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进展处理的新兴的学科,是目前开展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本设计针对现在大局部语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。最后,本文对语音信号处理的进一步开展方向提出了自己的看法。关键字:Matlab;语音信号;傅里叶变换;信号处理;目录TOC\o"1-3"\h\z1绪论11.1课题背景及意义11.2国内外研究现状11.3本课题的研究内容和方法21.3.1研究内容21.3.2运行环境21.3.3开发环境22语音信号处理的总体方案32.1系统基本概述32.2系统基本要求32.3系统框架及实现32.4系统初步流程图43语音信号处理基本知识63.1语音的录入与翻开63.2采样位数和采样频率63.3时域信号的FFT分析63.4数字滤波器设计原理73.5倒谱的概念74语音信号处理实例分析84.1图形用户界面设计84.2信号的采集84.3语音信号的处理设计84.3.1语音信号的提取84.3.2语音信号的调整104.3.2.1语音信号的频率调整104.3.2.2语音信号的振幅调整114.3.3语音信号的傅里叶变换124.3.4语音信号的滤波134.3.4.1语音信号的低通滤波134.3.4.2语音信号的高通滤波154.3.4.3语音信号的带通滤波154.3.4.4语音信号的带阻滤波164.4语音信号的输出175总结18参考文献19致谢201绪论语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。随着社会文化的进步和科学技术的开展,人类开场进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、和获取语音信息,这对于促进社会的开展具有十分重要的意义,因此,语音信号处理正越来越受到人们的关注和广泛的研究。1.1课题背景及意义语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。通过语言相互传递信息是人类最重要的基本功能之一。语言是人类特有的功能,它是创造和记载几千年人类文明史的基本手段,没有语言就没有今天的人类文明。语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。语音信号处理是研究用数字信号处理技术对语音信号进展处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的穿插学科。1.2国内外研究现状20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换〔FFT〕等是语音信号数字处理的理论和技术根基。随着信息科学技术的飞速开展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术〔LPC〕,并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化〔VQ〕应用于语音信号处理中;而用隐马尔可夫模型〔HMM〕描述语音信号过程的产生是80年代语音信号处理技术的重大开展,目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速开展,语音信号处理的各项课题是促进其开展的重要动力之一,同时,它的许多成果也表达在有关语音信号处理的各项技术之中。1.3本课题的研究内容和方法1.3.1研究内容本论文主要介绍的是的语音信号的简单处理。本论文针对以上问题,运用数字信号学基本原理实现语音信号的处理,在matlab7.0环境下综合运用信号提取,幅频变换以及傅里叶变换、滤波等技术来进展语音信号处理。我所做的工作就是在matlab7.0软件上编写一个处理语音信号的程序,能对语音信号进展采集,并对其进展各种处理,到达简单的语音信号处理的目的。1.3.2运行环境运行环境主要介绍了硬件环境和软件环境。硬件环境:①处理器:InterPentium166MX或更高②内存:512MB或更高③硬盘空间:40GB或更高④显卡:SVGA显示适配器软件环境:操作系统:Window98/ME/2000/XP1.3.3开发环境开发环境主要介绍了本系统采用的操作系统、开发语言。(1)操作系统:WindowsXP(2)开发环境:Matlab7.02语音信号处理的总体方案2.1系统基本概述图形用户界面〔GraphicalUserInterface,简称GUI,又称图形用户接口〕是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于承受。GUI的广泛应用是当今计算机开展的重大成就之一,他极大地方便了非专业用户的使用人们从此不再需要死记硬背大量的命令,取而代之的是可以通过窗口、菜单、按键等方式来方便地进展操作。2.2系统基本要求本文是用Matlab对含噪的的语音信号同时在时域和频域进展滤波处理和分析,在MATLAB应用软件下设计一个简单易用的图形用户界面〔GUI〕,来解决一般应用条件下的各种语音信号的处理。2.3系统框架及实现语音信号的采集使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。语音信号的处理语音信号的处理主要包括信号的提取、信号的调整、信号的变换和滤波等。Ⅰ.语音信号的时域分析语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进展分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。提取:通过图形用户界面上的菜单功能按键采集电脑设备上的一段音频信号,完成音频信号的频率,幅度等信息的提取,并得到该语音信号的波形图。调整:在设计的用户图形界面下对输入的音频信号进展各种变化,如变化幅度、改变频率等操作,以实现对语音信号的调整。Ⅱ.语音信号的频域分析信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源鼓励的线性系统的输出。输出频谱是声道系统频率响应与鼓励源频谱的乘积。声道系统的频率响应及鼓励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。①变换:在用户图形界面下对采集的语音信号进展Fourier等变换,并画出变换前后的频谱图和变换后的倒谱图。滤波:滤除语音信号中的噪音局部,可采用低通滤波、高通滤波、带通滤波和帯阻滤波,并比较各种滤波后的效果。3〕语音信号的效果显示通过用户图形界面的输出功能,将处理后的信号的语音进展播放,试听处理后的效果。2.4系统初步流程图图2.1列出了整个语音信号处理系统的工作流程:信号采集信号采集信息提取信号调整信号滤波信号变换效果显示图2.1语音信号处理系统的工作流程其中信号调整包括信号的幅度和频率的任意倍数变化。如以以下图2.2图2.2信号调整信号调整信号调整幅度调整频率调整信号的滤波采用了四种滤波方式,来观察各种滤波性能的优缺点:信号滤波信号滤波切比雪夫—I型低通滤波椭圆数字带通滤波切比雪夫—Ⅱ型带阻滤波切比雪夫—Ⅱ型高通滤波图2.3语音信号滤波的方式在以上三图中,可以看到整个语音信号处理系统的流程大概分为三步,首先要读入待处理的语音信号,然后进展语音信号的处理,包括信息的提取、幅度和频率的变换以及语音信号的傅里叶变换、滤波等;滤波又包括低通滤波、高通滤波、带通滤波和带阻滤波等方式。最后对处理过的语音信号进展处理后的效果显示。以上是本系统的工作流程,本文将从语音信号的采集开场做详细介绍。3语音信号处理基本知识3.1语音的录入与翻开在MATLAB中,[y,fs,bits]=wavread('Blip',[N1N2]);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。[N1N2]表示读取从N1点到N2点的值〔假设只有一个N的点那么表示读取前N点的采样值〕。sound(x,fs,bits);用于对声音的回放。向量y那么就代表了一个信号〔也即一个复杂的“函数表达式〞〕也就是说可以像处理一个信号表达式一样处理这个声音信号。3.2采样位数和采样频率采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的复原就越真实越自然。采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多那么捕捉到的信号越准确。对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的复原也越加准确。3.3时域信号的FFT分析FFT即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进展改进获得的。在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。函数FFT用于序列快速傅立叶变换,其调用格式为y=fft(x),其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,假设x为一向量,y是x的FFT且和x一样长度;假设x为一矩阵,那么y是对矩阵的每一列向量进展FFT。如果x长度是2的幂次方,函数fft执行高速基-2FFT算法,否那么fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数FFT的另一种调用格式为y=fft(x,N),式中,x,y意义同前,N为正整数。函数执行N点的FFT,假设x为向量且长度小于N,那么函数将x补零至长度N;假设向量x的长度大于N,那么函数截短x使之长度为N;假设x为矩阵,按一样方法对x进展处理。3.4数字滤波器设计原理数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进展加工处理,或者说利用数字方法按预定的要求对信号进展变换。数字滤波器可以理解为是一个计算程序或算法,将代表输入信号的数字时间序列转化为代表输出信号的数字时间序列,并在转化过程中,使信号按预定的形式变化。数字滤波器有多种分类,根据数字滤波器冲激响应的时域特征,可将数字滤波器分为两种,即无限长冲激响应〔IIR〕滤波器和有限长冲激响应〔FIR〕滤波器。从性能上来说,IIR滤波器传输函数的极点可位于单位圆内的任何地方,因此可用较低的阶数获得高的选择性,所用的存贮单元少,所以经济而效率高。但是这个高效率是以相位的非线性为代价的。选择性越好,那么相位非线性越严重。相反,FIR滤波器却可以得到严格的线性相位,然而由于FIR滤波器传输函数的极点固定在原点,所以只能用较高的阶数到达高的选择性;对于同样的滤波器设计指标,FIR滤波器所要求的阶数可以比IIR滤波器高5~10倍,结果,成本较高,信号延时也较大;如果按一样的选择性和一样的线性要求来说,那么IIR滤波器就必须加全通网络进展相位较正,同样要大增加滤波器的节数和复杂性。整体来看,IIR滤波器到达同样效果阶数少,延迟小,但是有稳定性问题,非线性相位;FIR滤波器没有稳定性问题,线性相位,但阶数多,延迟大。3.5倒谱的概念定义:倒谱定义为信号短时振幅谱的对数傅里叶反变换。特点:具有可近似地别离并能提取出频谱包络信息和细微构造信息的特点用途:①提取声道特征信息:提取频谱包络特征,以此作为描述音韵的特征参数而应用于语音识别。②提取音源信息:提取基音特征,以此作为描述音韵特征的辅助参数而应用于语音识别。求法:A:短时信号;B:短时频谱;C:对数频谱;D:倒谱系数;E:对数频谱包络;F:基本周期4语音信号处理实例分析4.1图形用户界面设计在MATLAB主窗口中,选择File菜单中的New菜单项,再选择其中的GUI命令,就会显示图形用户界面的设计模板。MATLAB为GUI设计一共准备了4种模板,分别是BlankGUI(默认)、GUIwithUicontrols(带控件对象的GUI模板)、GUIwithAxesandMenu(带坐标轴与菜单的GUI模板)与ModalQuestionDialog(带模式问话对话框的GUI模板)。设计语音信号处理系统的用户图形操作界面〔GUI〕SoundProcess,其中菜单主要包括File、Process和Output三大主要局部,其中File菜单包括输入〔Input〕、保存〔Save〕和退出〔Quit〕等功能;Process菜单主要包括提取〔Extract〕、调整〔Extract〕、变换〔Transform〕和滤波〔Filter〕菜单,其中调整〔Extract〕包括幅度调整〔Range〕和频率调整〔Frequency〕,滤波〔Filter〕菜单包含低通滤波〔LowpassFilter〕、高通滤波〔HighpassFilter〕、带通滤波〔BandpassFilter〕和帯阻滤波〔BandstopFilter〕等功能菜单。4.2信号的采集该系统是以一段简短的的语音信号做为分析样本,通过计算机系统将一段“主人,信息收到了〞的语音信号保存到到计算机中,并且保存格式为“*.wav〞。4.3语音信号的处理设计4.3.1语音信号的提取在Matlab中使用Wavread函数,可得出信号的采样频率为22500,并且声音是单声道的。利用Sound函数可以清晰的听到“主人,信息收到了〞的语音。采集数据并画出波形图。其中声音的采样频率Fs=22050Hz,y为采样数据,NBITS表示量化阶数。局部程序如下:fn=input('EnterWAVfilename:','s');%获取一个*.wav的文件[x,fs,nb]=wavread(fn);ms2=floor(fs*0.002);ms10=floor(fs*0.01);ms20=floor(fs*0.02);ms30=floor(fs*0.03);t=(0:length(x)-1)/fs;%计算样本时刻subplot(2,1,1);%确定显示位置plot(t,x);%画波形图legend('Waveform');xlabel('Time(s)');ylabel('Amplitude');运行后弹出语音信号处理系统的操作界面如图4.1:图4.1语音信号处理系统的操作界面然后点击File菜单中的子菜单Input,回到Matlab软件的输入界面如图4.2:图4.2输入界面输入要处理的语音信号的名称,便可得到语音语音的波形图如图4.3:图4.3语音语音的波形图如图中提取的语音的波形图所示,整段音频数据中得声音上下起伏与录入的声音信号基本一致,并且可以观察到其中包含局部高频噪声。4.3.2语音信号的调整在语音信号的研究中,经常会对语音信号进展进展多倍频率以及多倍幅度变换调整,日常应用中,这种变换调整也经常要用到。所以在设计中也添加了这种功能,并能够观察调整后的信号的波形图得变化,而且能通过语音处理界面的输出功能试听处理后的语音信号。4.3.2.1语音信号的频率调整在设计中,可以将语音信号的采样频率提高或降低,来实现语音信号的调整,得到理想的语音信号。例如将采样频率提高一倍,即可得到语音信号频率为原频率2倍新的语音信号。运行ProcessAdjustFrequency,得到如图4.4的信号波形图,并试听调整后的效果。图4.4频率调整后波形图与原语音信号相比,经过调整后的信号周期变为原来的1/2,此时的语速明显变快,即实现了信号的2倍频功能。4.3.2.2语音信号的振幅调整在设计中,可以将语音信号的幅度进展提高或降低操作,来实现语音信号的调整,得到声音音量大小不同的语音信号,例如将原语音信号的幅度提高一倍,得到如以以下图4.5的信号波形图,可以通过GUI操作界面的输出功能试听调整后的效果。图4.5幅度调整后波形图此时听到的调整后声音声调变高,但不是很明显,可以将幅度的变化值设置的比较大,那样的话就可以得到效果相当明显的语音信号了。4.3.3语音信号的傅里叶变换倒谱分析是指信号短时振幅谱的对数进展傅里叶反变换。它具有可近似地别离并提取出频谱包络信息和细微构造信息的特点。对语音信号进展频谱分析,在Matlab中可以利用函数fft对信号行快速傅里叶变换,得到信号的频谱图,并进展倒谱分析,得到倒谱图。傅里叶变换的局部程序如下:x=y(44101:55050,1);%提取原语音信号的一局部t=(0:length(x)-1)/fs;%计算样本时刻subplot(3,1,1);%确定显示位置plot(t,x);%画波形图legend('波形图');xlabel('Time(s)');ylabel('Amplitude');Y=fft(x,hamming(length(x)));%做加窗傅里叶变换fm=5000*length(Y)/fs;%限定频率范围f=(0:fm)*fs/length(Y);%确定频率刻度subplot(3,1,2);plot(f,20*log10(abs(Y(1:length(f)))+eps));legend('频谱图');%画频谱图ylabel('幅度(db)');xlabel('频率(Hz)');c=fft(log(abs(x)+eps));%倒频谱计算ms1=fs/1000;ms20=fs/50q=(ms1:ms20)/fs;%确定倒频刻度subplot(3,1,3);plot(q,abs(c(ms1:ms20)));%画倒谱图legend('倒谱图');xlabel('倒频〔s〕');ylabel('倒频谱幅度〔Hz〕');运行ProcessTransform,对语音信号的一局部进展傅里叶变换,并进展倒谱分析,得到如图4.6图4.6声音样本波形图、频谱图和倒谱图从上面的倒谱图可以看出.当读“主人,信息收到了〞时,所对应的频率大概在200Hz左右。这与人的语音信号频率集中在200Hz到4.5kHz之间是相一致的。而在未发声的时间段内,相对的小高频局部(200500Hz)应该属于背景噪声。4.3.4语音信号的滤波从图4.4中发现,语音信号中包含背景噪声,这些噪声的频率一般较高。所以可以利用MATLAB软件中的滤波器进展滤波处理,得到较为理想的语音信号。4.3.4.1语音信号的低通滤波系统中设计了一个截止频率为200Hz切比雪夫—I型低通滤波器,它的幅频特性如以以下图4.7:图4.7低通滤波器的幅频特性低通滤波器性能指标:wp=0.075pi,ws=0.125pi,Rp=0.25;As=50dB;经过低通滤波器处理后,比较处理前后的波形图的变化,如以以下图4.8:图4.8低通滤波后波形和频谱的变化低通滤波后,声音稍微有些发闷、消沉,原因是高频分量被低通滤波器衰减。但是很接近原来的声音。4.3.4.2语音信号的高通滤波运用切比雪夫—Ⅱ型数字高通滤波器,对语音信号进展滤波处理。高通滤波器性能指标:wp=0.375pi,ws=0.425pi,Rp=0.25;As=50dB;然后将其与原信号的比较图如以以下图4.9:图4.9高通滤波后波形和频谱的变化高通滤波后,此时只有少许杂音,原因是低频分量被高通滤波器衰减,而人声局部正好是低频局部,所以只剩下杂音,或者发出高频杂音但人的耳朵听不到。4.3.4.3语音信号的带通滤波运用椭圆数字带通滤波器函数,对语音信号进展滤波处理后其与原信号的比较图如以以下图4.10:图4.10带通滤波后波形和频谱的变化4.3.4.4语音信号的带阻滤波运用切比雪夫—Ⅱ型数字带阻滤波器,对语音信号进展滤波处理后其与原信号的比较图如以以下图3.11:图4.11帯阻滤波后波形和频谱的变化从以上各种数字滤波器经过滤波后得出的语音信号相比较,低通滤波后,声音稍微有些发闷,但是很接近原来的声音;高通滤波后听不到人的声音;带通滤波后声音有点像机器人小叮当发出的声音。带阻滤波后,声音比较接近原来的声音。从频谱图中我们可以看出声音的能量主要集中在低频(0.2pi即2204.5Hz以内)局部。4.4语音信号的输出可以将处理后的语音信号在Matlab软件先播放,体验处理后的语音信号的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品研发与测试流程模板
- 奢华化妆品质量承诺函7篇
- 2026幼儿园人工智能启蒙课件
- 网络数据守秘与传输责任承诺书3篇
- 智能科技安全稳定承诺书(9篇)
- 司机岗位聘用合同协议合同三篇
- 企业责任践行使命承诺书范文4篇
- 建筑施工安全防护装备使用规范操作指引
- 财务安全保障承诺书范文7篇
- 艺术品鉴定技术继承责任书(7篇)
- 气管切开病人的护理问题及护理措施
- 2024年贵州省贵阳市中考生物地理合卷试题(含答案逐题解析)
- TB10001-2016 铁路路基设计规范
- 建筑幕墙工程(铝板、玻璃、石材)监理实施细则(全面版)
- 医疗器械公司宣传册
- 2024年中小学教师 高级职称专业水平能力题库 (含答案)
- 信息安全管理体系ISMS建设方案
- 初中八年级-足球-脚内侧传球
- 广西中小学幼儿园教师职业道德负面清单和失范行为处理办法
- 磁敏感加权成像
- 宿舍调整申请表
评论
0/150
提交评论