




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中 北 大 学 学 报(自然科学版)JOURNAL OF NORTH UNIVERSITY OF CHINA (NATURAL SCIENCE EDITION)Matlab在语音信号分析与处理中的应用(中北大学电子测试技术国家重点实验室,山西 太原 030051)摘要:语音信号处理技术是语音处理领域中新近发展起来的一个学科分支。MATLAB是一个数据分析和处理功能十分强大的工程实用软件。运用它来进行语音信号的采集、分析和处理相当便捷。文章结合“图文声并现的多媒体电话机”课题项目的相关内容,简单介绍了在Matlab环境中,如何采集语音信号和语音信号采集后的频谱分析处理,及噪声分析和滤除,并通过实例分析了语音信号处理的Matlab实现方法,为语音识别的实现提供基础。关键词:MATLAB;语音信号;频谱分析;傅里叶变换中图分类号:TP212 文献标示码:AThe use of MATLAB in analysis and procession of sound signal (National Key Laboratory for Electronic Measurement Technology, North University of China, Taiyuan Shanxi 030051, China)Abstract: The sound signal processing technology is a new subject branch in the field of speech processing. MATLAB is a engineering practical software with very strong functions for data analysis and processing. It is quitely convenient use it to carry on the speech signal collection, analysis and processing. Combining with the related content of a project of our laboratory -graphic sound and now multimedia telephone, this paper introduced how to sample the sound signal and the give the sound signal spectrum analysis after the sampleing in Matlab environment simply. By the example, a implementation methods with MATLAB of sound signal processing was analyzed, provide the foundation for the next step the realization of sound recognition.Keyword: Matlab; sound signal; frequency analysis; FFT0 引言随着计算机技术和信息技术的发展,语音交互已经成为人机交互的必要手段。而语音信号的采集和处理是人机交互的前提和基础。Matlab是美国Math Works公司推出的一种面向工程和科学计算的交互式计算软件。它以矩阵运算为基础。把计算、可视化、程序设计融合到了一个简单易用的交互式工作环境中。同时,由于Matlab是一个数据分析和处理功能十分强大的工程实用软件,它的信号处理与分析工具箱为时/频域信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成时/频域信号的处理和分析以及信号的可视化,使人机交互更加便捷。1 语音信号的采集Windows附件的娱乐中有个录音机程序。通过它可以驱动声卡采集、播放和简单处理语音信号。为了清晰的阐明对语音信号进行频谱分析,首先使用Windows的录音机功能可以用麦克风直接录制一个声音文件:“中北大学研究生Matlab课程”。本电脑中录音器只能保存为.wav格式,由于Matlab能直接读取的音频文件只能是.wav或.au。因此,通过“千千静听”软件对文件格式进行了转换。将原录制文件转换为wav格式文件,文件名为test.wav,供MATLAB相关函数直接读取、写入或播放。为简便起见,本文以wav格式语音信号作为分析处理的输入数据。在MATLAB中,y,fs,bits=wavread(Blip,N1 N2);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。N1 N2表示读取的值从N1点到N2点的值。 sound(y); 用于对声音的回放。向量y则就代表了一个信号,也即一个复杂的“函数表达式”,也可以说像处理一个信号的表达式一样处理这个声音信号。下面是语音信号在MATLAB中的语言程序,它实现了语音的读入与打开,在MATLAB中使用wavread函数读取转换得到的声音采样频率Fs为1lkHz,且声音是8位单声道的声音文件“test.wav”。当然,可以并利用wavplay函数对上述声音信号进行播放,这里不再进行相关的播放操作。下面分别绘制该语音信号的原始的采样、频谱、幅值、相位几种信号波形如图1所示。x,fs,bits=wavread(wzf.wav); sound(x); X=fft(x,4096);magX=abs(X);angX=angle(X);subplot(221);plot(x);title(原始信号波形);subplot(222);plot(X); title(原始信号频谱);subplot(223);plot(magX);title(原始信号幅值);subplot(224);plot(angX);title(原始信号相位);图1 语音信号的波形Fig1. Waveform of the sound signal2 语音信号分析及MATLAB的实现2.1语音信号的频谱分析过程傅里叶频谱分析是语音信号频域分析中广泛采用的一种方法。语音波是一个非平稳过程。因此适用于周期,瞬变或平稳随机信号的标准傅里叶变换不能直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。进行频谱分析时,在时域数据进行短时FFT处理之前都要进行加窗处理。在FFT处理之后普通频谱分析可以进行频域上的滤波处理。从而使频谱更加平滑。最后IFFT处理观察恢复后的时域信号图形。频谱分析过程(如图2所示)。图2 频谱分析过程Fig2. analytical process of frequence2.2 短时傅里叶变换(频谱分析)傅里叶频谱分析的基础是傅里叶变换,用傅里叶变换及其反变换可以求得傅里叶谱,自相关函数。功率谱、倒谱。由于语音信号的特性是随着时间缓慢变化的。由此引出语音信号的短时分析。如同在时域特征分析中用到的一样,这里的傅里叶频谱分析也采用相同的短时分析技术。信号x(n)的短时傅里叶变换定义为式中,(n)为窗口函数。可以从两个角度理解函数的物理意义:第一种解释是,当n固定时,如n=n0,则是将窗函数的起点移至n0处截取信号x(n)。再做傅里叶变换而得到的一个频谱函数。这是直接将频率轴方向来理解的。另一种解释是从时间轴方向来理解,当频率固定时。例如,则可以看作是信号经过一个中心频率为k的带通滤波器产生的输出。这是因为窗口函数(n)通常具有低通频率响应。而指数对语音信号x(n)有调制的作用,使频谱产生移位。即将x(n)频谱中对应于频率k的分量平移到零频。2.3短时傅里叶反变换(倒谱分析)傅里叶变换建立了信号从时域到频域的变换桥梁。而傅里叶反变换则建立了信号从频域到时域的变换桥梁这两个域之间的变换为一对一映射关系。我们知道,可以看作是加窗后函数的傅里叶变换。为了实现反变换,将以进行频率采样即令k=2k/L.则有其中,L为频率采样点数。将在时域n上每隔R个样本采样。则可令,n=rR,r=1,2用这些出其离散傅里叶反变换yr(n)如下:,而因此可以证明,x(n)和y(n)之间只相差一个比例因子,二者关系如下:2.4 MATLAB处理语音信号Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件。然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种分析图的呈现等。下面以语音信号的波形图、FFT频谱图和倒谱图(如图3所示)分析为例来说明Matlab在语音信号处理中的具体实现方法。fs=8000; %语音信号采样频率为8000x1=wavread(test.wav);t=(0:length(x1)-1)/8000;y1=fft(x1,2048); %对信号做2048点FFT变换f=fs*(0:1023)/2048;figure(1)plot(t,x1) %做原始语音信号的时域图形grid on;axis tight;title(原始语音信号);xlabel(time(s);ylabel(幅度);figure(2)plot(f,abs(y1(1:1024) %做原始语音信号的FFT频谱图grid on;axis tight;title(原始语音信号FFT频谱)xlabel(Hz);ylabel(幅度);图3 原始信号Fig3. original signal图4 原始信号FFT频谱Fig4. FFT frequency spectrum of original signal由频谱图可清楚地看到样本声音主要以低频为主,主要频率集中在0-2500kHz之间,下面我们将就噪声与滤波方面进行观测研究,首先我们在原始信号的基础上增加一频率为3600Hz和3800Hz的两种高频噪声信号,利用Matlab做出增加噪声后的波形图如图5中滤波前的时域波形图所示。然后利用窗函数设计制作FIR滤波器对加噪后的语音信号进行滤波处理,并且绘制滤波前后的频谱图像如图6所示。具体的实现程序为:fs=8000; %采样频率8000Hzx1=wavread(test.wav); t=(0:length(x1)-1)/8000;f=fs*(0:2047)/4096;A1=0.05;A2=0.10;d=A1*cos(2*pi*3600*t)+A2*sin(2*pi*3800*t); %3600Hz和3800Hz的余弦噪声信号x2=x1+d d;wp=0.3*pi;ws=0.5*pi;wdelta=ws-wp;N=ceil(6.6*pi/wdelta); %取整wn=(0.3+0.5)*pi/2;bz,az=fir1(N,wn/pi,hanning(N+1); %选择窗函数并归一化截止频率figure(1)freqz(bz,az);grid on;axis tight;f2=filter(bz,az,x2);figure(2)subplot(2,1,1)plot(t,x2);grid on;axis tight;title(滤波前的时域波形);subplot(2,1,2)plot(t,f2);grid on;axis tight;title(滤波后的时域波形);y3=fft(f2,4096);f=fs*(0:2047)/4096;figure(3)y2=fft(x2,4096);subplot(2,1,1);plot(f,abs(y2(1:2048);grid on;axis tight;title(滤波前的频谱)xlabel(Hz);ylabel(幅度);subplot(2,1,2)plot(f,abs(y3(1:2048);grid on;axis tight;title(滤波后的频谱)xlabel(Hz);ylabel(幅度);sound(f2,8000); %回放声音图5 加噪信号滤波前后时域波形对比Fig5. Time domain waveform contrast of the signal had added noise before and after filter对比发现不管是时域波形还是频谱波形,都可以看到噪声信号能够顺利滤除,说明通过这一窗函数设计的FIR滤波器在该声波噪声滤除中有很好的效果,这一过程对应于语音识别中信号的预处理,对于信号的分析有着重要意义。图6 滤波前后频谱分析对比Fig5. Frequence spectrum contrast of the signal had added noise before and after filter3 结束语本文主要是基于高级面向对象开发语言MATLAB的基本特征。以及MATLAB强大的工具箱功能,实现信号的预处理、信号的时域处理和信号的频域处理。其中实现信号的时域处理过程中。设计了加窗处理:在信号频域处理过程中,实现对低于20kHz语音信号进行频谱分析。同时,通过上述实例说明。基于MATLAB可以很好的达到对语音
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030中国番茄酱市场前景深度监测与未来消费战略发展分析报告
- 2025至2030中国电动打磨机行业市场占有率及投资前景评估规划报告
- 2025至2030中国环氧增塑剂行业市场深度调研及发展趋势与投资风险报告
- 心理辅导与残疾人餐具使用技巧的结合教育
- 教育技术安全性评估与风险管理策略
- 货车清洗培训课件大全
- 商业决策中的心理学个性化学习路径设计的重要性
- 抖音商户助播突发状况反应能力制度
- 全球铀矿资源分布2025年核能产业市场前景与挑战研究报告
- 公交优先战略2025年城市交通拥堵治理的公共交通服务质量评价体系报告
- 贵州省黔西南州、黔东南州、黔南州2025年八年级英语第二学期期末学业水平测试试题含答案
- 杭州市公安局滨江区分局招聘警务辅助人员笔试真题2024
- 2025年江苏省高考物理试卷真题(含答案)
- 学校国际学生管理制度
- DB31/ 638-2012铸钢件单位产品能源消耗限额
- 第1章 人工智能概述幻灯片
- 肾肿瘤超声诊断
- 工程尾款减免协议书
- 基因组变异数据库构建-洞察阐释
- 地铁安检考试试题及答案
- 2025年高考语文解密之语言文字运用含答案或解析
评论
0/150
提交评论