数字信号在语音处理上的应用_第1页
数字信号在语音处理上的应用_第2页
数字信号在语音处理上的应用_第3页
数字信号在语音处理上的应用_第4页
数字信号在语音处理上的应用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 一 、研究背景和价值语言是人类交流信息的基本手段,在人们日益扩大的交流中占据着重要地位。在如今高度发达的信息社会中用数字化的方法进行语音的传送、储存识别、合成、增强等是整个数字化通信网中最重要、最基本的组成部分之一随着信息科学技术的飞速发展,语音信号处理的研究也日益显示出它的要性,并取得了重大进展。虽然语音信号处理作为研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。同时,语言也是人与机器之间进行通信的重要工具,他是一种理想的人机通信方式,因而可为信息处理

2、系统建立良好的人机交互环境,进一步推进计算机和其智能机器的应用,提高社会的信息化程度。数字信号外理是许多科学和工程技术领域中不可缺少的一个方面,在通信 、雷达、语音处理、图象处理、声学、地震学、地质勘探、气象学、遥感、生物医学工程、核工程、航天工程等领域中都离不开数字信号处理。随着计算机技术的发展,数字信号处理技术得到飞速发展。现在,已经从最初的只是用数字方法去完成模拟信号处理的基本功能发展成为一门独立的学科。数字信号处理在其发展初期是与模拟信号处理密切相关的。模拟信号处理讨论的两个主要问题是滤波器设计和频谱分析。模拟信号处理所研究的问题主要局限在这两个方面,这是与当时信号处理的数学基础和物理

3、依托有关的。当时能够完成电信号滤波的主要手段是依靠LC网络,相应的数学分析工具是傅里叶变换。数字信号处理在其发展的初期只是试图用数字方法代替模拟方法去完成上述任务。20世纪60年代形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅里叶变换等是语音信号数字处理的理论和技术基础。随着信息科学技术的发展,语音信号处理取得了重大的进展。70年代提出了用于语音信号的信息压缩和特征提取的线性预测技术,成为语音信号处理的有力工具。近年来人工神经网络的研究取得了迅速发展语音信号处理的各项课题是促进其发展的重要动力之一,同时它的许多成果也体现在有关语音信号处理的各项技术中。因此,在60年代和70年代初期

4、,数字信号处理领域中的大量研究工作以及发表的大量论文和著作都集中于两个方面。一方面是数字滤波器 (仍限于低通、高通、带通、带阻等类型)的设计,即各种FIR、nR数字滤波器设计硬件实现结构以及稳定性。有限字长效应等问题;另一方面是FFT的各种算法。二 、研究任务 首先是要对所需处理的语音信号的采集,运用MATLAB对其时域、频率响应、幅值、相位、频谱做出分析。然后对获取到的语音信号进行倒谱处理,接着用滤波器对加信号进行滤波。最后进行数据转换,使用不同的采样频率对信号进行处理得到不同频率下的时域波形及其频谱。对比不同采样率下语音信号的差别。完成各部分任务的程序设计,并做出仿真分析。三、任务实施1、

5、语音信号采集 由于条件限制,本实验中采集的语音是通过音乐播放器截取的一段语音,文件名为“guxiang1”,然后通过软件处理转换成wav格式的语音信号并保存,以作为实验处理的语音信号,完成后续实验分析。 2、工具选择 在本次仿真使用的工具是MATLAB,MATLAB(矩阵实验室)是MATrix LABoratory的缩写,是一款由美国The MathWorks公司出品的商业数学软件。MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MATLAB还可以用来创建用户界面及与调用其它语言(包括C,C+和FOR

6、TRAN)编写的程序。 MATLAB具有很多优点,编程环境比较简单,容易实现,易于操作,而且处理能力特别强,它的内部包含了许多模块集合小工具,可以编程,也可以进行建模,完成许多方面的仿真分析。而且编程即支持汇编,也支持C+,有丰富的图形库,所以在本实验中,选取MATLAB作为仿真工具。四、仿真及分析1. 语音信号时域和频谱时域是描述数学函数或物理信号对时间的关系。例如一个信号的时域波形可以表达信号随着时间的变化。本文分析的语音信号“guxiang1”的时域图如图1所示,还包含该信号的幅值及相位。图1 语音信号的波形、幅值和相位频率响应函数频率响应函数是描述测试系统动态特性的重要参数,通过频率响

7、应函数进行频率分析也是进行数字滤波器设计的重要方法。频率响应函数是系统输出与输入的傅里叶变换之比Hj=Y()X()实验时用冲激函数作为系统激励信号,用各种数字滤波器作为测试系统。冲激函数具有无限宽广的频谱,用冲激函数做激励信号相当于对测试系统输入所有频率的信号,系统必然有对应的输出。计算出系统输出与输入的傅里叶变换之比,就是系统的频率响应函数。语音信号“guxiang1”的频率响应图如图2所示。图2 信号频率响应图频谱任一信号,只要符合一定条件都可以分解为一系列不同频率的正弦(或余弦)分量的线性叠加;每一个特定频率的正弦分量都有它相应的幅度和相位。因此对于一个信号,它的各分量的幅度和相位分别是

8、频率的函数;或者合起来,它的复数幅度是频率的函数。这种幅度(或相位)关于频率的函数,就称为信号的频谱。当把信号频谱,即幅度(或相位)关于频率的变化关系用图来表示,就形成频谱图。从频谱图上,我们既可以看到这个周期信号由哪些频率的谐波分量(正弦分量)组成;也可以看到,对应各个谐波分量的幅度,它们的相对大小就反映了各谐波分量对信号贡献的大小或所占比重的大小。信号的频谱是信号的一种新的表示方法,从频谱可以看到这个周期信号由哪些频率的谐波分量(正弦分量)组成;也可以看到,对应各个谐波分量的幅度,它们的相对大小就反映了各谐波分量对信号贡献的大小或所占比重的大小。语音信号“guxiang1”的频谱如图3所示

9、。图3 语音信号的频谱2. 语音信号倒谱分析语音信号不是加性信号,而是卷积信号。为了能用线性系统对其进行处理,可以先采用卷积同态系统处理。经过卷积同态系统后输出的伪时域序列称为原序列的“复倒频谱”。它的定义式可以表示为:xn=IFTlnFTxn倒谱或称 “倒频谱”的定义为 :cn=IFTlnFTxn同态信号处理法就是设法将非线性问题转化为线性问题来处理的一种方法。按照被处理的信号来分类,大体上可以分为乘积同态信号处理和卷积同态信号处理。由于语音信号可以视为声门激励信号和声道响应信号的卷积结果。我们仅讨论卷积同态信号处理系统的问题。同态信号处理也称为同态滤波,实现将卷积关系变换为求和关系的分离处

10、理,即解卷。解卷算法可以分为两大类:第一类是首先为线性系统V(Z)建立一个模型,然后对模型参数按照某种最佳准则进行估计,这种方法称为参数解卷方法。采用的模型可以分为全极点模型(AR模型)和零极点模型(ARMA模型),如果采用最小均方误差准则对AR模型进行估计,就得到线性预测编码算法(LPC)。第二类算法称为非模型解卷。同态信号处理完成解卷任务就是其中最重要的一种。对信号进行分析得出它的倒谱参数的过程称为同态处理。对于语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成和识别。语音信号“guxiang1”的频谱如图4所示,图中上图

11、为“guxiang1”的原始信号,下图为频谱图。图4 语音信号的频谱图它和复倒谱的主要区别是对序列对数幅度谱的傅立叶逆变换,它是复倒谱 中的偶对称分量。它们都将卷积运算,变为伪时域中的加法运算,使得信号可运用满足叠加性的线性系统进行处理。复倒一潜涉及复对数运算,而倒谱只进 行实数的对数运算,较复倒谱的运算量大大减少。对语音信号的某一帧同样可以分析出它的短时倒谱参数,总的说来,无论对于语音通信、语音合成或语音识别,倒谱参数所含的信息比其他参数多,也就是语音质量好,识别正确率高。但其缺点是运算量比其他参数大,尽管如此,倒谱分析方法仍不失为一种有效的语音信号的分析方法。3.语音信号数字滤波数字滤波是

12、数字信号分析中最重要的组成部分之一,与模拟滤波相比,它具有精度和稳定性高、系统函数容易改变、灵活性强、便于大规模集成和可实现多维滤波等优点。在信号的过滤、检测和参数的估计等方面,经典数字滤波器是使用最广泛的一种线性系统。 数字滤波器是指完成信号滤波处理功能的,用有限精度算法实现的离散时间线性非时变系统,其输入是一组数字量,其输出是经过变换的另一组数字量。因此,数字滤波器本身既可以是用数字硬件装配成的一台完成给定运算的专用的数字计算机,也可以将所需要的运算编成程序,让通用计算机来执行。从数字滤波器的单位冲击响应来看,可以分为两大类:有限冲击响应(FIR)数字滤波器和无限冲击响应(IIR

13、)数字滤波器。滤波器按功能上分可以分为低通滤波器(LPF)、高通滤波器(HPF)、带通滤波器(BPF)、带阻滤波器(BSF)。在很多实际应用中如语音和音频信号处理中,数字滤波器来实现选频功能。因此,指标的形式应为频域中的幅度和相位响应。在通带中,通常希望具有线性相位响应。在FIR滤波器中可以得到精确的线性相位。FIR滤波器传递函数的极点是固定在原点,是不能动的,它只能靠改变零点位置来改变它的性能,所以要达到高的选择性,必须用高的阶数,对于同样的滤波器设计指标,FIR滤波器所要求的阶数可能比IIR滤波器高5-10倍,结果成本高信号延时也较大,如果按线性相位要求来说,则IIR滤波器就必须加全通网络

14、进行相位校正,同样大大增加了滤波器的阶数和复杂性。而FIR滤波器却可以得到严格的线性相位。语音信号“guxiang1”的时域及频谱滤波后的图形如图5所示。图5语音信号的时域及频谱滤波后波形图由图可知,滤波对波形影响不大,但对高频有较大衰减。在讨论由模拟滤波器变换为数字滤波器时,普遍采用的是双线性变换法,它保留的是从模拟到数字域的系统函数表示。在滤波器的选取时,由于设计方法的侧重点不同,作出比较是困难的。如果在IIR 滤波器情况下,最优的设计将是椭圆滤波器。我们以双线性变换法设计数字椭圆滤波器为例,分别给出低通、高通、带通、带阻四种情况下滤波前后信号的波形和频谱进行比较。4. 数据转换数据转换是

15、指改变音频格式中的采样频率或量化位数。转换原理是:先用矩阵插值或抽取技术实现变量变换,如果是抽取数据还需在变换前作滤波处理使之满足采样定理;变量变换完成后再用 audiowrite 函数重新定义量化位数和采样频率即可实现数据转换。数据转换过程中,要注意采样频率与原始采样频率及插值或抽取系数的关系。语音信号“guxiang1”的不同采样频率下的波形图,图中上部分为时域及其频谱图,中间图为原采样率下的波形图及频谱图,下面的图为新采样频率下的新波形图及频谱图。图6 不同采样率下的波形图及频谱图由图可知,在满足采样定律条件下,实现数据抽取,在原采样率下波形变密、频谱变宽且幅度减半,但在新采样率下波形和

16、频谱都很好。 通过试听输出文件还可感受处理效果。五、总结语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科。语音是一种信号,是一种特殊的向量matlab软件是进行数字信号分析与处理必不可少的一门工具。利用matlab丰富的应用函数如:audioread,audioplay,audiowrite,fopen,fprintf, fclose等,实现了对wav类型的音频文件的信号采集和综合分析,借助matlab 程序设计实现对音频信号的密码设置,借matlab 数据接口建立文本文档,利用相关分析函数对预留语音信号频谱和试验者语音信号频谱进行相关分析从而实现语音识别,为文本文档加密。从而对整个数字音频信号的处理方法做了一个全面而系统的实践。虽然在仿真过程中我遇到了许多困难与挫折,对matlab了解不足致使编写matlab程序困难等。通过查找资料向师兄请教,不断和同学讨论,以及大量查找文献资料,不断调试程序等努力,最终也自己操作运行了一些实例,但是还是知道自己欠缺很多,运行的这些实例没没有很强的系统性。通过这些实例的结果验证了课本上的知识,对这些知识的理解有了更深的理解,加深了印象。不过时间有限,自己本身的能力也有欠缺的地方,不能将所学的知识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论