数字语音处理作业.doc_第1页
数字语音处理作业.doc_第2页
数字语音处理作业.doc_第3页
数字语音处理作业.doc_第4页
数字语音处理作业.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

姓名:郑咪 班级:电子21002 学号:1014781053课题一:数字语音信号的Matlab仿真实验一、语音信号分析与处理语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本文主要介绍的是的语音信号的简单处理。本文针对以上问题,运用数字信号学基本原理实现语音信号的处理,在matlab7.0环境下综合运用信号提取,幅频变换以及傅里叶变换、滤波等技术来进行语音信二、语音信号处理的总体方案2.1 系统实现1) 语音信号的采集 2) 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。3) 语音信号的处理.语音信号的时域分析提取:通过图形用户界面上的菜单功能按键采集电脑设备上的一段音频信号,完成音频信号的频率,幅度等信息的提取,并得到该语音信号的波形图。.语音信号的频域分析 变换:在用户图形界面下对采集的语音信号进行Fourier等变换,并画出变换前后的频谱图和变换后的倒谱图。三、语音信号处理实例分析3.1 语音信号的提取在Matlab中使用Wavread函数,可得出信号的采样频率为22500,并且声音是单声道的。利用Sound函数可以清晰的听到“主人,信息收到了”的语音。采集数据并画出波形图。其中声音的采样频率Fs=22050Hz,y为采样数据,NBITS表示量化阶数。部分程序如下: fn=input( Enter WAV filename:,s); %获取一个*.wav的文件x,fs,nb=wavread(fn);ms2=floor(fs*0.002);ms10=floor(fs*0.01);ms20=floor(fs*0.02);ms30=floor(fs*0.03);t=(0:length(x)-1)/fs; %计算样本时刻 subplot(2,1,1); %确定显示位置plot(t,x); %画波形图legend(Waveform);xlabel( Time(s);ylabel(Amplitude); 运行后弹出语音信号处理系统的操作界面如图1:图1 语音信号处理系统的操作界面然后点击File菜单中的子菜单Input,回到Matlab软件的输入界面如图2:图2 输入界面输入要处理的语音信号的名称,便可得到语音语音的波形图如图3:图3 语音语音的波形图如图中提取的语音的波形图所示,整段音频数据中得声音高低起伏与录入的声音信号基本一致,并且可以观察到其中包含部分高频噪声。31数字语音信号的采集举例y,fs,bits=wavread();fs = 22050 %采样频率bits =16 %采样点数图3-1数字语音信号的采集3.12数字语音信号的频谱分析实验程序:x1,Fs,bits=wavread(C:WINNTMediading.wav);%sound(y,Fs,bits);figure(1);plot(x1); %做原始语音信号的时域图形title(原始语音信号);xlabel(时间 n);ylabel(音量 n);figure(2);y1=fft(x1); %做length(x1)点的FFTy1=fftshift(y1);%平移,是频率中心为0derta_Fs = Fs/length(x1);%设置频谱的间隔,分辨率plot(-Fs/2:derta_Fs: Fs/2-derta_Fs,abs(y1);%画出原始语音信号的频谱图title(原始语音信号的频谱);grid on;图3-2原始语音信号图3-3原始语音信号的频谱3.2 语音信号的频率调整在设计中,可以将语音信号的采样频率提高或降低,来实现语音信号的调整,得到理想的语音信号。例如将采样频率提高一倍,即可得到语音信号频率为原频率2倍新的语音信号。运行ProcessAdjustFrequency,得到如图4的信号波形图,并试听调整后的效果。图4频率调整后波形图与原语音信号相比,经过调整后的信号周期变为原来的1/2,此时的语速明显变快,即实现了信号的2倍频功能3.3语音信号的振幅调整在设计中,可以将语音信号的幅度进行提高或降低操作,来实现语音信号的调整,得到声音音量大小不同的语音信号,例如将原语音信号的幅度提高一倍,得到如下图5的信号波形图,可以通过GUI操作界面的输出功能试听调整后的效果。图5 幅度调整后波形图 此时听到的调整后声音声调变高,但不是很明显,可以将幅度的变化值设置的比较大,那样的话就可以得到效果相当明显的语音信号了。3.4 语音信号的傅里叶变换倒谱分析是指信号短时振幅谱的对数进行傅里叶反变换。它具有可近似地分离并提取出频谱包络信息和细微结构信息的特点。 对语音信号进行频谱分析,在Matlab中可以利用函数fft对信号行快速傅里叶变换,得到信号的频谱图,并进行倒谱分析,得到倒谱图。 傅里叶变换的部分程序如下:x=y(44101:55050,1); %提取原语音信号的一部分t=(0:length(x)-1)/fs; %计算样本时刻subplot(3,1,1); %确定显示位置plot(t,x); %画波形图legend(波形图);xlabel( Time(s);ylabel(Amplitude);Y=fft(x,hamming(length(x); %做加窗傅里叶变换fm=5000*length(Y)/fs; %限定频率范围f=(0:fm)*fs/length(Y); %确定频率刻度subplot(3,1,2);plot(f,20*log10(abs(Y(1:length(f)+eps);legend(频谱图); %画频谱图ylabel(幅度(db);xlabel(频率(Hz);c=fft(log(abs(x)+eps); %倒频谱计算ms1=fs/1000;ms20=fs/50q=(ms1:ms20)/fs; %确定倒频刻度subplot(3,1,3);plot(q,abs(c(ms1:ms20); %画倒谱图legend(倒谱图);xlabel(倒频(s));ylabel(倒频谱幅度(Hz));运行Process Transform,对语音信号的一部分进行傅里叶变换,并进行倒谱分析,得到如图6图6 声音样本波形图、频谱图和倒谱图从上面的倒谱图可以看出当读“主人,信息收到了”时,所对应的频率大概在200Hz左右。这与人的语音信号频率集中在200 Hz到4.5 kHz之间是相一致的。而在未发声的时间段内,相对的小高频部分(200500Hz)应该属于背景噪声。3.5 语音信号的滤波 从图7中发现,语音信号中包含背景噪声,这些噪声的频率一般较高。所以可以利用MATLAB软件中的滤波器进行滤波处理,得到较为理想的语音信号。3.6 语音信号的低通滤波 系统中设计了一个截止频率为200Hz切比雪夫I型低通滤波器,它的幅频特性如下图7:图7 低通滤波器的幅频特性低通滤波器性能指标: wp=0075pi,ws =0125pi,Rp=025;As =50dB;经过低通滤波器处理后,比较处理前后的波形图的变化,如下图8:图8 低通滤波后波形和频谱的变化低通滤波后,声音稍微有些发闷、低沉,原因是高频分量被低通滤波器衰减。但是很接近原来的声音。五、总结在这次课题中我不但对数字语音信号处理和Matlab这两门课有了更深的了解而且锻炼了自己的动手和自学能力,本文对语音信号处理系统的设计作了详细的介绍,采用一系列图像分析和处理技术,实现了语音信号的基本处理的功能,经过测试运行,本设计圆满的完成了对语音信号的读取与打开;较好的完成了对语音信号的频谱分析,通过fft变换,得出了语音信号的频谱图;在滤波这一块,课题主要是从数字滤波器入手来设计滤波器,基本实现了滤波,完成了各种滤波器的滤波效果比较,与课题的要求十分相符。课题二:数字语音处理电路原理分析一 数字语音信号处理介绍通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。二 数字语音信号处理理论基础 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。1、语音信号处理的目的:得到某些语音特征参数以便高效地传输或存储;通过某种处理运算以达到某种用途的要求。2、语音信息的交换大致上可以分为三大类:(1)人与人之间的语言通信:包括语音压缩与编码、语音增强等。(2)第一类人机语言通信问题:语音合成机器讲话、人听话的研究。(3)第二类人机语言通信问题:语音识别和理解 ;语音识别和理解:人讲话、机器听话的情况。3、语音信号处理的发展分为语音合成、语音编码、语音识别三、数字语音处理的电路结构分析 1、语音信号处理过程的总体结构 信息加工和处理的一般流程如图1.1所示 图1.1 信号处理和加工的一般示意图2、语音处理过程的结构框图图1.2 语音处理过程的结构框图3、整体设计思路Matlab 语言是一种数据分析和处理功能十分强大的计算机应用软件 ,它可以将声音文件变换为离散的数据文件 , 然后利用其强大的矩阵运算能力处理数据 ,如数字滤波 、傅里叶变换 、时域和频域分析 、声音回放以及各种图的呈现等 , 信号处理是 Matlab 重要应用的领域之一 。本设计是用 Matlab对含噪的的语音信号同时在时域和频域进行滤波处理和分析。整个设计思路的设计原理示意图如图所示:图3-1语音信号处理的工作流图3-2语音信号的滤波示意图4、语音信号的数字化用可编程逻辑器件来设计数字语青电路,前提是先要把语音信号数字化,也就是语音的A/D变换。通常还要对A/D变换后的语音数据进行编码。PCM(脉冲编码调制)技术是一种本的语音数字化编解码技术,在语音通信中得到广泛的应用。我国采用的是A律PCM码,即对A/D变换后的语音信号按照“A律”进行对数式压缩处理,使得8位的PCM码相当于压缩前的13位之线性码,符合G.711标准。还有一种提“律”的PCM码,方法略异,主要通行干北美等地。PCM编码的特点是,对语音信号按8kHz的速率取样,每次取样得到8bit数据,1 路语音占用64kbit/s的带宽。PCM码的最高位是符号位,其余7位表示语音振幅绝对值的:大小。为了避免在无语音时出现一长串的“0”。使数据通信难以同步,还要对偶数位进行“反转”处放,如把“00000000”的偶数位取反成为“01010101”来表示实际语音的零振幅,又如用“10101010”和“00101010”分别表示实际语音的正向和负向最大振幅。(1)PCM编解码器件和信号时序 有很多专用集成电路能够完成PCM编解码,美国国家半导体公司的TP3094就是其中一种。TP3094是4路双向PCM编解码芯片,芯片内部的电原理见下图PCM 取样时钟的频率是2048kHz。由于 1路语音占用 64k带宽,因此1个PCM的基本信道能够容纳32路语音,称为 1“帧”。这32路语音分时复用传输电路,每路数据每次占用的时间称为 1 个“时隙”。容易算出,时隙的宽度是 13280003.9 ( s)。有了各自的时隙,32路信号就可以在 1 条信号线上互不影响地分时传输了。(2) 用P扣设计数字语音电路用PLD芯片和PCM编解码芯片设计的数字语音电路见下图。来自 电话送受话器(即电话手柄,用来试验通话)插座JOJ3的4路双向语音连接到TP3094做编解码处理。TP3094的VXIO-VXI3是各路模拟语音输入踹,连接到电话送话器,电阻R1-R8用来调节各路语音的输人增益。TP3094的VROO-VRO3是各路模拟语音输出端,连接到电话受话器。5、整体实现过程采样器的作用是把连续信号变为脉冲或数字序列。图中示出了一个连续信号f(t)经采样器采样后变为离散信号的过程图3-3连续信号f(t)经采样器采样后变为离散信号图中f(t)为被采样的连续信号,S(t)为周期性窄脉冲信号,fs(t)为采样后的离散信号,它用下式来表征:fs(t)=f(t)s(t) 采样信号的频率特性为:如果F*(j)中各个波形不重复搭接,相互间有一定的距离(频率)即若即采样定理可叙述如下:如果采样周期满足下列条件,即:式中max为连续信号f(t)的最高次谐波的角频率。则采样信号f*(t)就可以无失真地再恢复为原连续信号f(t)。需要指出的是,采样定理只是在理论上给出了信号准确复现的条件。我们可以利用windows自带的录音机录制语音文件,进行数字信号的采集。(开始程序附件娱乐录音机,文件属性立即转换8000KHz,8位,单声道)或其他软件,将话筒输入计算机的语音输入插口上,启动录音机,录制一段自己的话音。然后在MATLAB软件平台下,利用函数wavread对语音信号进行采样,记住采样频率和采样点数。通过wavread函数的使用进一步理解采样频率、采样位数等概念。此电路由模拟语音信号产生电路、滤波器、功率放大电路、直流稳压电源组成。在试验中由模拟语音信号产生电路产生频率为50HZ15KHZ的正弦波,然后经过低通滤波器和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论