MATLAB小波在语音信号压缩中的应用.doc_第1页
MATLAB小波在语音信号压缩中的应用.doc_第2页
MATLAB小波在语音信号压缩中的应用.doc_第3页
MATLAB小波在语音信号压缩中的应用.doc_第4页
MATLAB小波在语音信号压缩中的应用.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

陕西理工学院课程设计MATLAB小波在语音信号压缩中的应用冯飞飞(陕理工学院物电学院 电信专业081班,陕西 汉中 72300x)指导教师:蒋媛摘要:本设本文介绍了小波变换在语音压缩中两种新技术。第一种技术是消除了低于某一阈值与能量值小波分解高频系数的零小波变换。第二种技术是平均零小波变换,它除了履行第一种技术所要达到的目标之外,它平均分解的小波近似系数。这些系数几乎不变,是较高层次的分解转化。然后,小波系数在传输前,用Lloyd量化的算法和编码和熵编码技术,在接收端,接收信号进行解码,然后才处理减少量化。关键词:MATLAB 语音 小波Application of MATLAB wavelet in speech signal compression Fengfeifei(Grade08,Class081, Electronic Information Science and Technology,Department of Physics Shaanxi University of Technology,Hanzhong 723000,Shaanxi) Tutor: JiangyuanAbstract: This design introduces the wavelet transform in speech compression of two kinds of new technologies. The first technique is eliminated by less than a given threshold value and energy value of wavelet decomposition coefficients to zero wavelet transform. The second techniques is averaged to zero by wavelet transform. In addition to its performance first technique to achieve the goal, it is average decomposition wavelet approximation coefficient. These coefficients are almost invariant, its higher level of decomposition and transformation.Then,using Lloyd quantization and coding and entropy coding technique before transmission. At the receiving port, the received signal is decoded, Handle reduction in quantization.Key words: MATLAB; speech signal; Wavelet目录引言11小波理论21.1小波定义与应用21.2小波仿真应用42语音信号52.1语音的特性52.1.1语音信号具有短时平稳性52.1.2语音信号分为清音和浊音52.1.3语音信号可以用统计分析特性来描述52.2语音信号的采集63语音压缩83.1语音压缩技术83.2小波包编码的优势83.3人耳听觉特性分析93.4小波编码解码过程94总结12参考文献.12附录.13引言通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。然而语音通信过程中不可避免的会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。而语音增强就是从带噪语音信号中提取尽可能纯净的原始语音,改善语音质量,提高语音的清晰度和可懂度。语音压缩质量应该比电话质量更好。本文中提出了两种新的压缩技术。每一种技术都在后来被证明,不仅产生了一个更高的压缩比,而且实现了在较高信噪比条件段的质量的提高和平均意见得分值测试比率的提高。本文中所讨论的语音压缩技术是基于离散小波传输。提出的这种技术比现有的技术更加简单而有效。1小波理论1.1小波定义与应用小波(wavelet),即小区域的波,是一种特殊的长度有限、平均值为0的波形。小波函数的确切定义为:设为一平方可积函数,即,若其傅里叶变换满足条件:则称为一个基本小波或小波母函数,称上式为小波函数的可容许条件。小波分析是近15年来发展起来的一种新的时频分析方法。其典型应用包括齿轮变速控制,起重机的非正常噪声,自动目标所顶,物理中的间断现象等。而频域分析的着眼点在于区分突发信号和稳定信号以及定量分析其能量,典型应用包括细胞膜的识别,金属表面的探伤,金融学中快变量的检测,INTERNET的流量控制等。从以上的信号分析的典型应用可以看出,时频分析应用非常广泛,涵盖了物理学,工程技术,生物科学,经济学等众多领域,而且在很多情况下单单分析其时域或频域的性质是不够的,比如在电力监测系统中,即要监控稳定信号的成分,又要准确定位故障信号。这就需要引入新的时频分析方法,小波分析正是由于这类需求发展起来的。小波变换的时频窗口特性与短时傅里叶的时频窗口不一样,因为a不仅影响窗口在频率轴上的位置,也影响窗口的形状。这样小波变换对不同的频率在时域上的取样步长是可调节的,即在低频时小波变换的时间分辨率较低,而频率分辨率较高;而高频时小波变换的时间分辨率较高,而频率分辨率较低,这正符合低频信号变化缓慢而高频信号变化迅速的特点,所以被誉为数学显微镜。这便是它优于经典的傅里叶变换和短时傅里叶变换的地方。小波变换也一种积分变换,为小波变换系数。它不同于傅里叶变换的地方是,小波基具有尺度和平移两个参数,所以函数一经小波变换,就意味着将一个时间函数投影到二维的时间-尺度相平面上,这样有利于提取信号函数的某些本质特征。小波分析是一门新的学科,在频域和时域具有良好的局部化特性,克服了傅里叶分析的不足,能使用傅里叶的地方都可以用小波分析来代替并且效果会更好。小波分析在数据的压缩、去噪、边缘检测等方面比现有方法更有效。小波分析与傅里叶分析的区别在于:傅里叶分析只考虑时域和频域之间的一对一映射,它以单个变量(时间或频率)的函数表示信号;小波分析则利用联合时间尺度函数分析非平稳信号,小波分析和时频分析的区别在于:时频分析在时频平面上表示非平稳信号,小波分析描述非平稳信号虽然也在二维平面上,但不是在时频平面上,而是在时间尺度平面上,在小波分析中,人们可以在不同尺度上来观察信号,这种对信号分析的多尺度观点是小波分析的基本特征。小波分析属于时频分析的一种,传统的信号分析是建立在傅立叶变换的基础上的,由于傅立叶分析使用的是一种全局的变换,要么完全在时域,要么完全在时域,要么完全在频域,因此无法表述信号的时频局域性质,而这种性质恰恰是非平稳信号最根本和最关键的性质。为了分析和处理非平稳信号,人们对傅立叶分析进行了推广乃至根本性的革命,提出并发展了一系列新的信号分析理论:短时傅立叶变换、Gabor变换、时频分析、小波变换、分数阶傅立叶变换、线调频小波变换、循环统计量理论和调幅-调频信号分析等。其中,短时傅立叶变换和小波变换也是应传统的傅立叶变换不能够满足信号处理的要求而产生的。短时傅立叶变换分析的基本思想是:假定非平稳信号在分析窗函数g(t)的一个短时间间隔内是平稳(伪平稳)的,并移动分析窗函数,使在不同的有限时间宽度内是平稳信号,从而计算出各个不同时刻的功率谱。但从本质上讲,短时傅立叶变换是一种单一分辨率的信号分析方法,因为它使用一个固定的短时窗函数。因而短时傅立叶变换在信号分析上还是存在着不可逾越的缺陷。小波变换是一种信号的时间尺度分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于探测正常信号中夹带的瞬态反常现象并展示其成分,所以被誉为分析信号的显微镜,利用连续小波变换进行动态系统故障检测与诊断具有良好的效果。1.2小波仿真应用小波在提取淹没在噪声中的周期信号中的应用仿真如下。仿真输入信号与噪声信号如图1.1,加噪信号与周期自相关如图1.2。图1.1仿真输入信号与噪声信号图1.2加噪信号与周期自相关2语音信号2.1语音的特性2.1.1语音信号具有短时平稳性语音信号是一种随时间而变化的信号,在一小段时间内(1030ms)语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短段(称为分析帧)来进行处理。2.1.2语音信号分为清音和浊音语音分为清音和浊音,二者的产生机理不同,特征也有很大的差异。由声带振动发出的语音称为浊音,其他方式发音称为清音。清音没有明显的时域和频域特征,没有周期性,类似于白噪声。浊音在时域上有明显的周期性,在频域上具有共振峰结构,能量大部分集中在低频段内。因此,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量,抑制非语音分量。2.1.3语音信号可以用统计分析特性来描述语音信号是一个随机过程,长时间时域统计特性在语音增强中意义不大。其短时谱幅度的统计特性是时变的,只有当分析帧长趋于无穷大时,才能近似地认为它具有高斯分布。高斯统计模型是根据中心极限定理得到的。在高斯模型的假设下,傅立叶展开系数被认为是独立的高斯随机变量,均值为0,而方差是时变的。这种高斯模型应用于有限帧长时只是一种近似的描述,作为分析的前提在宽带噪声污染的带噪语音增强中应用。下面是一段语音信号的时域波形图(图2.1)和频域图(图2.2),由这两个图可以看出语音信号的两个特点。 图2.1语音信号时域波形图 图2.2语音信号频域波形图2.2语音信号的采集在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。抑制50Hz的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH和fL,则对于绝人多数语音编译码器,fH=3400Hz、fL60100Hz、采样率为fs8kHz;而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。当使用要求较高或很高的场合时fH4500Hz或8000Hz、fL60Hz、fs10kHz或20kHz。为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔t在模拟信号x(t)上逐点采取其瞬时值。采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。下图2.3时一段语音信号在采样频率44.1KHz情况下的频谱图。图2.3采样频率44.1KHz情况下的频谱图。由图可知,这段语音信号的频率主要集中在1KHz左右,当采样频率为44.1KHz时,由于采样频率比较大,所以采样点数就越密,所得离散信号就越逼近于原信号,频谱也没有发生混叠。图2.4频谱图对上述信号进行1/80采样频率抽取,即采样频率变为将近500Hz时,由于采样频率比较小,所以采样点数就稀疏,所得离散信号就越偏离于原信号,频谱也发生了混叠。在采样的过程中应注意采样间隔的选择和信号混淆:对模拟信号采样首先要确定采样间隔。如何合理选择t涉及到许多需要考虑的技术因素。一般而言,采样频率越高,采样点数就越密,所得离散信号就越逼近于原信号。但过高的采样频率并不可取,对固定长度(T)的信号,采集到过大的数据量(N=T/t),给计算机增加不必要的计算工作量和存储空间;若数据量(N)限定,则采样时间过短,会导致一些数据信息被排斥在外。采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。量化电平按级数变化,实际的振动值是连续的物理量。具体振值用舍入法归到靠近的量化电平上。 语音信号经过预滤波和采样后,由AD变换器变换为二址制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字信号。在实际工作中,我们可以利用windows自带的录音机录制语音文件,图2.5是基于PC机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得WAVE文件,为后续的处理储备原材料。调节录音机保存界面的“更改”选项,可以存储各种格式的WAVE文件。图2.5 基于PC机的语音信号采集过程采集到语音信号之后,需要对语音信号进行分析,如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。3语音压缩3.1语音压缩技术语音压缩技术指的是对原始数字音频信号流运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,压缩信号编码速率,也称为压缩编码。以生成适合传输的数字信号流,提高传输效率。这样做的优点在于可以适应在低码率的信道上实现可靠传输,也可以在同样的信道上传输更多的数据。对语音编码技术中语音质量的评价主要分为两类,客观评定方法和主观评定方法。其中客观评定方法用客观测量的手段来评价语音编码的质量,其特点是计算简单,但不能完全反映人对语音质量的感觉。主观评定方法符合人类听话时对语音质量的感觉,因而得到广泛应用。语音压缩编码技术有多种,归纳起来大致可分为三类,即波形编码、参数编码和混合编码。波形编码:针对语音波形进行编码,而尽量保持输出波形不变,即恢复的语音信号基本上与输入信号波形相同。参数编码:是先对语音信号进行分析,提取出其参数,对参数进行编码,在解码后由这些参数重新合成出重构的语音信号,使得到的信号听起来与输入语音相同;而不是对语音信号的波形直接处理,因而恢复信号与原信号不必保持相同。混合编码:由参数编码与波形编码相结合。这种编码器正在得到人们较大的关注。这种编码器既具备了声码器的特点(利用语音生成模型提取语音参数),又具备了波形编码的特点(优化激励信号,使其与输入语音波形相匹配)。 当前语音压缩编码的常用技术有:脉冲编码调制(Pulse Code Modulation,简称PCM),自适应差分脉;中编码调制(ADI cM)及自适应增量调制(ADM),子带编码(SBC),线性预测语音生成模型与参数编码。由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式:语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。通常,以上几种压缩方式都是综合起来使用的。3.2小波包编码的优势 语音信号的特性是其高频分量持续时间短,这要求分析算法对高频分量具有较高的时间分辨率;而低频分量持续时间长,允许较低的采样速率,这要求分析算法对低频分量具有较高的频率分辨率。小波包变换正具有这一特性,小波包函数相当于滤波器组,这种滤波器组有一重要特征:在改变中心频率的同时,频宽也改变。这样该滤波器组的品质因素就不会发生改变。这样,不仅可以把信号变换到时频空间,而且随信号频率成份的不同而调整时域取样步长,从而可聚焦到信号的任意细节,兼备良好的时域和频域分辨率。因为小波包变换在信号高低频部分都具有在时域和频域同时有良好的局域化特性,对语音这种非平稳信号的特征分析,与小波分析相比,效果更好。小波包提供了对小波空间进行分解的工具。分解过程可在某一支上停止而这不影响在另一支上继续。一棵分解树不论如何生长,数据总量将是保持不变的。所以小波包为信号分析提供了更大的灵活性。 3.3人耳听觉特性分析人耳有一听觉阈值,在此阈值下的任何频率的声音是完全听不见的;响度曲线的最低一根曲线表示人的正常听觉阈值,在1kHz5kHz的区域内,听觉最灵敏,低频和高频段的阈值明显升高。如下图3.1.图3.1人耳听觉阈值声音掩蔽效应,即一种声音的存在会抑制人耳听到另一个声音。这是由于信号的存在使感觉阈值升高了。一个2KHz,80dB的正弦音对其他正弦音的掩蔽曲线,第二个音在实线下面时,它不会引起听觉感受。如下图3.2。图3.2 2KHz,80dB的正弦音对其他正弦音的掩蔽曲线3.4小波编码解码过程对输入语音进行预处理,检测到语音信息,进行小波包变换将其变换到一定的时频空间,此空间的时频分辨率接近人耳的平均时频分辨率然后计算出最佳小波分解树对小波分解树进行量化实现对信号的压缩编码。详细框图见下图3.3图3.3小波编码过程解码部分对解码后的变换系数进行小波包重构恢复出语音信号,再利用附加信息恢复出完整的语音信息。解码过程见图3.4。图3.4解码过程利用Pentium(3GHz)计算机,在matlab平台上,对几段男、女、童声(包括音频信号)的语音信号进行了压缩和重构,其原始信号和重构信号的波形和频谱如图3.5所示。图3.5实验仿真图4总结通过本次课设,使我对语音信号有了全面的认识,对数字信号处理的知识又有了深刻的理解,我熟悉和掌握MATLAB程序设计方法,小波的应用,熟悉MATLAB处理工具箱,学会运用MATLAB工具箱对简单信号的加噪及小包波分析。通过这次练习是我进一步了解了信号的产生、采样及频谱分析的方法。以及其中产生信号和绘制信号的基本命令和一些基础编程语言。让我感受到只有在了解课本知识的前提下,才能更好的应用这个工具;并且熟练的应用MATLAB也可以很好的加深我对课程的理解,方便我的思维。这次设计还使我了解了MATLAB的使用方法,深刻体会到MATLAB分析工具的强大,提高了分析和动手实践能力。同时我相信,进一步加强对MATLAB的学习与研究对我今后的学习将会起到很大的帮助。参考文献1胡昌华,张军波,夏军,张伟基于MATLAB的系统分析与设计小波分析M西安:西安电子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论