




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音信号非线性分析【摘要】混沌是指在确定的非线性系统中出现的一种非常复杂的随机现象,近二十年来,混沌理论及其应用的研究引起了国际学术界的广泛关注,成为一个研究热点。本文介绍了基于混沌理论的语音信号非线性分析。概括语音信号非线性和混沌的依据;描述了语音信号混沌特性参量,包括Lyapunov指数和分形维;讨论运用Takens 嵌入定理于语音信号相空间重构时的研究议题,包括嵌入维数、时间延迟、噪声及滤波影响、预测时间及数据长度要求等。【关键词】语音信号非线性混沌lyapunov指数1 混沌学的发展混沌是上世纪最重要的科学发现之一,被誉为继相对论和量子力学后的第三次物理学革命,它打破了确定性与随机性之间不可逾越的分界线,将经典力学研究推进到一个崭新的时代。1963年,美国气象学家E.Lorenz在大气科学杂志上发表了“决定性的非周期流”的文章,指出在确定的气象预测数学模型中存在混沌现象,描述了混沌对“初始条件的敏感性”这一基本性态,即著名的“蝴蝶效应”,发现了混沌现象的第一个奇怪吸引子Lorenz吸引子1,Lorenz也因此成为“混沌学之父”。1975年,正在美国马里兰大学攻读博士学位的华人李天岩和他的导师J.Yorke联名发表了一篇震动整个学术界的论文周期3蕴涵混沌2,率先引入了“混沌”( Chaos)一词,为这个新兴研究领域确立了一个中心概念,为各学科研究混沌现象树立起了一面统一的旗帜。1977年,第一次国际会议在意大利召开,标志着混沌科学的诞生。长期以来由于混沌的奇异特性,特别是对初始条件极其微小变化的高度敏感性及不稳定性,所谓“差之毫厘,失之千里”,使得人们认为混沌是不可靠的,难以控制的,因而在工程应用领域总是被回避和抵制。1990年,Ott.Grebogi和Yorke提出的OGY方法使混沌运动达到有效控制并在试验上得到验证,从而国内外对非线性系统混沌控制的研究迅速发展起来,成为非线性科学领域研究的热点3。现在人们已经发现,混沌是易于操纵的,可以开发利用的,甚至是无价的,混沌可以应用于应用在很多方面,例如:电路输出的同步化;控制化学反应中的振荡;稳定有病的心脏的不规则的搏跳;为保密通讯提供信号的解码手段等等。而且在心脏HRV(心脏变异性)的研究中,在语言加工信息的研究中,在对人脑功能以及处理信息的机理分析中,在股票动态分析预测中,在流行病数学模型分析中,在混沌神经网络的信息图像处理中,在天文学,地球物理学,天气预报,地震预报,智能科学,经济理论,人口理论,医药化学等方面也都开始得到广泛应用。2 混沌的特点混沌是服从确定性规律但具有随机性的运动。所谓服从确定性运动,是指系统的运动可以用确定的动力学方程的形式或离散方程形式表示,即使有时这类方程还没有被找到所表述,而不是像噪声那样不服从任何动力学方程。所谓运动具有随机性,是指不能像经典力学中的机械运动那样由某时刻状态可以预言以后任何时刻的运动状态,混沌运动倒是像其他随机运动或噪声那样其运动状态是不可预言的,换言之,混沌运动在相空间中没有确定的轨道。混沌运动的一些特点:1.混沌运动是决定性和随机性的对立统一,即它具有随机性但又不是真正的或完全的随机运动。虽然混沌运动在整个时间进程中具有随机性,即在较长时间上不能对其运动做出预言。2.对初始状态的敏感依赖 与随机性密切相关的是混沌运动对初始状态的敏感依赖。系统作通常规则运动时,无法避免的涨落或噪声干扰所引起的初始条件的微小变化一般只引起运动状态的微小差别。即初始状态很接近的轨道总是很接近的,甚至可能是趋向于一致的,这样才能使人们对系统的运动做出预言,也才有所谓的机械运动决定论,混沌运动则不然,由于系统无法避免的涨落,初始条件的微小差别往往会使相邻轨道按指数形式分开。洛伦兹戏称混沌运动这种对初始条件的敏感依赖性为蝴蝶效应。蝴蝶效应是区别混沌运动同其他确定性运动的最重要的标志。3.只有非线性系统才可能作混沌运动 对于线性微分方程初始条件给定了,它就没有确定的解。也就是说。线性系统不可能作带有随机性的混沌运动。所以说,混沌运动只可能在非线性系统中。3 语音信号的混沌性语音信号处理是近年来研究一直很活跃的学科领域,已经在数字语音通信、话音识别、话音存贮和保密通信等许多方面取得了重要成果。传统的语音信号处理基于线性系统理论,基本的假定是语音信号特性随时间的变化是缓慢的。这个假定导出各种“短时”处理方法,语音信号被分割为一些短段再加以处理,每一段视为确定的平稳信号,经过处理以后产生一个新的依赖于时间的序列而用于描述的语音信号。随着研究的深入,人们发现语音信号是一个复杂的非线性过程。用声学和空气动力学理论分析, 语音有声门的非线性振动过程,受舌、声道形状的变化,语音信号(特别是摩擦音、爆破音等)会在声道边界层产生涡流,并最终形成湍流, 发其它音时,声门喷出的气流仍有湍流存在,而湍流本身就是一种混沌4。语音信号具有的渐变不稳定性可通过成熟的自适应方法处理,而其非线性性质却一直在传统语音处理的发展趋势中未得到应有的重视。近十几年来,非线性理论中的混沌和分形信号处理为人们提供了分析自然现象的全新方法。严格的声学及空气动力学理论已证明,语音信号的产生中存在混沌的机制。从信号处理的角度检查信号是否为混沌的,首先必须从信号的物理背景出发探讨;其次,必须实验验证5:信号是有界的;信号的分形维有限,且通常不是整数,这是不规则信号区别于噪声的根本点之一; 信号的最大Lyapunov指数是正的,这决定了信号对初始条件的敏感依赖;信号是局部可预测的,特别地,信号的动力学系统可以用确定性模型重建。针对语音信号的非线性特性和混沌特性,从物理背景和实验两方面出发,已有许多研究。大量关于语音信号分形维和Lyapunov指数的统计实验(下文讨论)表明,语音信号符合最大Lyapunov指数为正的和分形维有限的要求;而语音信号显然是局部可预测的。因此,语音信号中存在有混沌因素。这是将混沌及分形理论引入语音信号处理的基础。4 基于混沌理论的语音信号非线性分析通过分析系统相空间6,可了解系统的动力学特性。但通常对实际系统,仅能知道表现为时间序列形式的系统观察值。因此,从时间序列重构系统相空间具有重要意义。Takens7提出了解决问题的方法,称为Takens嵌入定理。该定理指出,任意m维的紧的超平面, 可被微分同胚地嵌入变换为等价的对应维数的欧氏空间。其中,微分同胚指嵌入换及其逆变换是可导的;等价的对应维数指嵌入维数M,就可以了。Takens嵌入定理可应用延时坐标法重构相空间。在应用该定理重构语音信号相空间时,必须对以下几个问题给予足够的重视。1Lyapunov指数6是混沌过程的一个重要参数,它给出过程对初始条件敏感依赖的度量。判断信号是否为混沌的,一个重要的依据在于检查其最大Lyapunov指数是否为正。事实上,Lyapunov指数给出的是动态系统沿其相空间主轴发散或收敛的平均速度。同时,它可以指示,对系统的可靠预测能进行多久。在重构相空间的基础上,可以分析时空演化特性Lyapunov指数,Lyapunov指数在混沌系统研究中的意义是: 0,相空间运行轨迹迅速分离,长时间动态行为对初始条件敏感,即处于混沌状态; = 0 表示沿着轨迹低于指数速度的运动,相当于没有混沌; 0 表示相空间的轨迹是收缩的,对初始条件不敏感,相当于没有混沌。因此,即使Lyapunov指数的大小不知道,Lyapunov指数符号的类型也能提供动力学系统的定性情况。语音信号估计最大Lyapunov指数可采用Wolf 方法:首先对语音信号用延时相图法进行相空间重构,给定初始点 (d 为相空间维数),得到该点的最近邻域点,记其长度为。随着时间演化到t1,初始长度也演化到。在搜索时,所要求的点应满足以下两条准则:(1) 该点与基准点的分开距离应比较小。(2) 演化向量与被替换向量之间的角度分离也比较小。如果符合上述条件的点不能找到, 暂保留当前所使用的向量, 整个过程不断重复。于是有式中M 是使用替换向量的总数。文献9给出了10个因素的最大Lyapunov指数的分布。采用15 名发音人的6000 次发音, 采样率为16kHz,12阶线性预测后重构三维相空间。表1部分汉语语音的最大Lyapunov 指数分布音素类别音素类别 shzglian舌尖后阻声舌尖前阻声舌根阻声舌尖阻声复鼻尾音5. 4980 7. 30853. 1975 4. 88300. 9475 1. 35280. 9055 1. 56610. 6462 1. 1727j bdiuo舌面阻声唇阻声舌尖阻声单元音双元音3. 3348 4. 19811. 2586 1. 81370. 3998 0. 62480. 7886 1. 37860. 4654 0. 5356Lyapunov 指数 的含义是相空间演化轨迹变化的快慢程度,可近似理解为语音发音器官状态的变化。从数据中可以发现,辅音的 比元音大,辅音中擦音和塞擦音 最大,其次是塞音,再次是浊音,这与语音的发声机理是吻合的。2.分形维是刻划动力学系统奇异吸引子复杂度的重要参数。分形维有各种定义,如容量维、信息维、Hausdorff维、相关维、Lyapunov 维、Minkowski-Bouliqand维等。其中,容量维最为常用,其计算方法为计盒算法。计盒维数的定义:设有集合A ,用一个网状栅格将其覆盖,网格边长为S ,N(s)为网格中含有集合A 任何一部分的网格数,则计盒维数为计盒维数算法:本文采用最小二乘法拟合logN(s) log(1/s) 直线, 求出此直线的斜率即为计盒分维数D。具体实现过程为:(1)将原始语音信号归一化到单位正方形区域, 得到归一化信号;(2)将正方形区域划分为边长为s 的网格,计算logN(s),log(1/s) ;(3) 改变s 的大小,计算相应的logN (s),log (1/s) ;(4) 令利用最小二乘拟合直线y =kx+b,k 即为计盒维数D。D 的计算公式由均方误差 令 及,得3Takens嵌入定理指出,在重构相空间时,如果嵌入维数大于吸引子维数的2倍,延迟坐标向量可构成原可微流形在欧氏空间中的微分同胚。嵌入定理其实是将系统相空间向嵌入空间投影,若嵌入维数选得太小,相空间轨迹向低维空间投影,会产生许多错误的交叉,随着嵌入维数的增大,错误交叉数量会减少,当取了足够大的嵌入维数时,原系统相空间就被解折叠了。当然,嵌入维数大于吸引子维数的2倍,仅仅是相空间重构的充分条件,在实际应用中,嵌入维数并非取得越大越好,如果嵌入维数取得太大,观测数据中的噪声会占满该嵌入空间的大部分,原系统吸引子退缩一隅,重要性被噪声掩盖。理论上,如果求得了系统的分形维,系统的嵌入维数就可以确定,也可直接求系统重构的嵌入维数值,求适合嵌入维数较有价值的方法可以分为三类6。第一类使用去虚假交叉(虚假相邻点)的想法;第二类分析系统的主分量;最后一类利用信息论分析系统变量的相互依赖性。Takens嵌入定理重构相空间,所取的观察值是对原时间序列以一定间隔重新采样的,该间隔就是时间延迟。时间延迟的意义在于让参加系统重构的相邻数据尽可能不相关,从而让嵌入空间中的样点所包含的关于原吸引子的信息尽可能大。从这一点看,时间延迟应取得大一些。但是,类似Nyquist定律,时间延迟也不能取得太大,必须保证原系统的信息尽可能地被传递到嵌入空间中去。因此,必须适当选取时间延迟。现有的时间延迟的选择方法一般都基于如下的两个准则之一:序列相关法。让重构矢量内元素之间的相关性减弱,同时重构矢量包含的原动力学系统的信息不丢失; 相空间扩展法。重构相空间轨迹应从相空间的主对角线(时间延迟很小时)尽可能地扩展,但又不出现折叠。实际观测的数据总会受到噪声干扰。噪声是否会影响语音信号动力学系统的重构,如何去除噪声对重构的影响,成为实际应用中不可或缺的研究任务。其中,基于混沌信号处理的噪声去除方法是研究的重点方向。另外,在求解动力学系统的各项指标时,必须兼顾求解算法的抗噪能力。一般简单的滤除噪声方法,是用滤波器对信号滤波。但人们已认识到,经滤波的混沌信号的特征可能被改变。滤波后信号的Lyapunov指数可能被改变或不变,取决于原系统某一特定的Lyapunov指数和滤波器极点实部之间的大小关系。滤波通过增加新的Lyapunov指数来影响混沌系统;由于Lyapunov维数和Lyapunov指数有直接的关系,滤波因而影响系统的分形维。但是,适当选取滤波器参数,可以实现让滤波对原系统不产生根本上的实质影响。使用平滑滤波器滤除噪声,如果平滑滤波器能保留原混沌系统的信息,则不会影响原混沌信号。文献8研究混沌系统中的局部预测问题,得出在噪声影响不大情况下的如下式子:其中,E为预测归一化均方误差,m为用多项式做近似器的多项式阶数, 为系统吸引子的最大Lyapunov指数,D 为吸引子维数,T 为预测时间,C 为常数。文献2应用该式,得到式子: 其中,为T时刻预测误差的归一化标准差,为起始时刻预测误差的归一化标准差。从该式中可以知道可靠预测大致时间。5 总结文中主要介绍基于混沌理论的语音信号非线性分析。首先介绍了混沌学的发展以及混沌的特点,之后简单介绍了语音信号非线性和混沌性的依据;然后描述语音信号混沌特性的参量,包括Lyapunov 指数和分形维;讨论运用Takens 嵌入定理于语音信号相空间重构时应注意的问题,包括嵌入维数、时间延迟、噪声及滤波影响和预测时间及数据长度要求等。基于语音信号的实际物理背景,通过其混沌特性的分析,可以为语音信号重构和压缩编码开辟一条新途径,以改善语音信号处理方法的复杂度和处理效果。参考文献1徐大中,李国东,臧鸿雁.混沌控制理论及研究进展J.青海师范大学学报,20042 T Y Li, J A Y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025珠海市国资委合同制职员招聘公告
- 油气油田装备生产线项目节能评估报告
- 基础务知识试题及答案
- 新能源储能项目技术方案
- 医学综合基础试题及答案
- 石灰岩矿山建设项目商业计划书
- 离婚财产分割与子女教育援助及财产分配协议书
- 离婚房产及共同财产分割执行监督协议
- 公共设施物业管理权终止及设施维护责任协议
- 高端离婚协议书起草及子女抚养权争夺策略
- 2025年保密观知识题库及答案
- 2025-2026学年统编版一年级上册道德与法治教学计划含教学进度表
- 70岁以上驾驶员换证三力测试题库(含答案)
- 2025秋形势与政策课件-践行多边主义完善全球治理
- (2025秋新版)人教版八年级历史上册全册教案
- 2025年小麦种子研发与应用技术合作开发协议
- 四合一检测仪使用课件
- 恋爱课件教学课件
- 人民陪审员培训民事课件
- 药物中毒的护理与急救
- 2025年食安员、食品安全总监、主要负责人考试题及答案
评论
0/150
提交评论