硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf_第1页
硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf_第2页
硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf_第3页
硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf_第4页
硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

硕士学位论文-隐马尔科夫模型及其在机械故障模式识别中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号:分类号: 学校代码:学校代码:10079 密级:密级: 华华 北北 电电 力力 大大 学学 硕硕 士士 学学 位位 论论 文文 题题 目:目:隐马尔科夫模型及其在机械故障模式识别中的应用 英英 文文 题题 目目:hidden markov model and its application in mechanical faults pattern recognition 研研 究究 生生 专专 业:业:控制理论与控制工程 研研 究究 方方 向:向:检测技术与自动化装置 指指 导导 教教 师:师: 职称:职称:教 授 论文提交日期:论文提交日期:2007 年 2 月 华华 北北 电电 力力 大大 学学 华北电力大学硕士学位论文 1 声 明 本人郑重声明:此处所提交的硕士学位论文 ,是本人在华北电 力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得的研究成果。据本人所 知,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研 究成果,也不包含为获得华北电力大学或其他教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了 谢意。 学位论文作者签名: 日 期: 关于学位论文使用授权的说明 本人完全了解华北电力大学有关保留、 使用学位论文的规定, 即: 学校有权保管、 并向有关部门送交学位论文的原件与复印件;学校可以采用影印、缩印或其它复制手 段复制并保存学位论文;学校可允许学位论文被查阅或借阅;学校可以学术交流为 目的,复制赠送和交换学位论文;同意学校可以用不同方式在不同媒体上发表、传播 学位论文的全部或部分内容。 (涉密的学位论文在解密后遵守此规定涉密的学位论文在解密后遵守此规定) 作者签名: 导师签名: 日 期: 日 期: 华北电力大学硕士学位论文 2 摘 要 隐马尔科夫模型 (hidden markov model, 简称作 hmm) 是一种新的模式识别技术, 其基本方法是通过对训练信号进行特征值提取和标量量化, 建立具有相应状态数和观测 值数的隐 markov 模型,然后利用该模型计算待诊断信号与训练信号的相似概率,根据 相似概率的差异判断信号状态的变化,达到信号模式分类的目的。本文的主要研究工作 是利用 hmm 进行机械设备运行状态识别和故障诊断,包括三项研究内容:1)在深入 学习 hmm 理论基础上,探讨 hmm 的技术实现方法,编制 matlab 环境下的 hmm 实 现程序;2)研究振动信号特征提取方法,开发基于 labview 的希尔伯特变换和倒频 谱分析程序;3)应用 hmm 对于汽轮机和齿轮等两种典型旋转机械设备运行状态进行 分析识别。对于汽轮机设备,以其振动信号频谱中基频处的幅值作为 hmm 训练的特征 值,建立汽轮机升负荷过程的 hmm,进行设备状态变化分析;对于齿轮箱设备,建立 运行过程振动信号的 hmm 模型, 根据相似概率的变化识别齿根裂纹故障的生成及发展 趋势,两个应用案例都给出满意的结果。 关键词:隐马尔科夫模型,故障诊断,特征提取,汽轮机,齿轮关键词:隐马尔科夫模型,故障诊断,特征提取,汽轮机,齿轮 abstract hidden markov model (hmm)is a new technique in pattern recognition. by extracting and vector quantizing the features of training signal, hidden markov mode with according state number and observation number can be established, then the similarity probability of the unknown signal can be calculated through hmm. by comparing the similarity probability, pattern of the signal can be recognized. in this work, hmm is applied in the pattern recognition and fault diagnosis of mechanical equipment, the mean works include three parts: 1) the realization approach of hmm for fault diagnosis was discussed and the program of hmm was developed with matlab; 2) the methods of feature extraction from vibration signal, especially cepstrum and envelop method, was studied, and according program was developed with labview; 3) two typical rotating machine(turbine and gearbox) with different signal characteristics were used to improve the effectiveness of hmm for identification and classification of machine condition. for the turbine, the amplitude at the basic frequency is extracted as the features for hmm training, for the gear box, hmm is established to recognize the development of gear crack. the results of these two examples are all satisfied. tian chunhua(control theory and control engineering) directed by prof. liu yibing key words: hidden markov model, fault diagnosis, feature extraction, turbine, gear 华北电力大学硕士学位论文 3 目 录 中文摘要 英文摘要 第一章 概述 . 1.1 研究意义. 错误!未定义书签。错误!未定义书签。 1.2 hmm 方法研究现状 . 1.3 本文的主要工作及内容. 1.3.1 主要研究工作 . 1.3.2 本文内容安排 . 第二章 隐 markov 模型的基本理论 2.1 markov 模型 . 2.2 hmm 基本概念 2.2.1 hmm 定义 . 2.3 hmm 基本算法 2.3.1 前向-后向算法 2.3.2 viterbi 算法. 2.3.3 baum-welch 算法 2.4 hmm 的类型 2.4.1 按照观测变量分类 2.4.2 按照 markov 链形状分类 . 2.5 hmm 在实际应用中的改进措施 2.5.1 初始模型的选取 2.5.2 算法下溢问题的处理 2.6 基于 dhmm 的齿轮数据建模与诊断 第三章 振动测量分析方法 . 3.1 时域分析方法 . 3.2 频域分析方法 . 3.3 倒频谱分析方法 . 3.4 包络分析分析方法 . 3.5 虚拟仪器技术 . 3.5.1 虚拟仪器的特点 华北电力大学硕士学位论文 4 3.5.2 虚拟仪器系统的构成 3.6 基于 labview 的虚拟仪器分析仪 3.6.1 倒频谱分析仪 3.6.2 包络分析仪 第四章 基于隐 markov 模型的故障模式分类 4.1 基本方法 . 4.1.1 振动信号特征值分析和提取 4.1.2 幅值标准化和标量量化 4.1.3 hmm 训练 . 4.1.4 hmm 模式 . 4.2 hmm 在汽轮机振动信号分析中的应用 4.2.1 dhmm 方法的实现步骤 4.2.2 dhmm 建模及状态识别 4.2.3 dhmm 训练 4.2.4 识别结果 4.3 hmm 在齿轮振动信号分析中的应用 4.3.1 实验意义 4.3.2 实验描述 4.3.3 信号测试系统 4.3.4 时域信号分析 4.3.5 dhmm 在齿轮模式分类中的应用 第五章 结论与展望 . 5.1 本文研究结论 . 6.2 下一步工作设想 . 参考文献 致 谢 在学期间发表的学术论文和参加科研情况 华北电力大学硕士学位论文 5 第一章第一章 概述概述 1.1 研究意义研究意义 隐马尔科夫模型(hidden markov model,简称为 hmm)是一种时间序列的统 计模型,适用于动态时间序列,尤其是对于包含大量丰富信息、非平稳和低重复性 和复现性的信号,具有很强的模式分类能力,并具有传统模式识别方法所不具备的 独特的特性,因此近年来受到理论和工程应用领域研究人员的广泛关注,已经在模 式识别的很多领域,特别是在语音识别领域得到成功的应用27。 随着科学技术的进步与飞速发展,工业设备与系统不断向着大型化、高效率、 高性能和高自动化方向的发展,在设备运行经济性不断提高的同时,可靠性和安全 性也越来越受到关注,因为一旦关键设备出现故障,导致整个生产系统的非计划停 运,则会造成巨大的经济损失,甚至危及人身安全。因此希望能及时了解设备的运 行状态、预防事故,最大限度发挥设备的潜力。这就对设备状态监测和故障诊断工 作者提出了更高的要求。 各种类型的旋转机械是许多工业企业(如电厂,炼油厂等)的主要设备,保证 这些设备的安全和可靠运行非常重要。大型旋转设备中的许多关键零部件(例如齿 轮、轴承等)由于长期连续工作在高载荷、高转速下,极易受到损害和出现故障。 据统计,传动机械中 80%的故障是由齿轮引起的,旋转机械中齿轮故障占其故障的 10%左右20。采用一些先进技术对旋转机械设备及其零部件进行状态监测与故障诊 断,可以提高维修效率,减少一些不必要的经济损失,从而创造更大的经济效益和 社会效益,具有重大的意义。 目前在基于振动信号分析的旋转机械故障诊断领域,各种针对平稳信号的分析 诊断技术相对程度,已有大量的理论和应用研究成果。而对于变工况条件下产生的 非平稳振动信号的诊断方法研究还处于初期阶段,许多基于非平稳信号分析的故障 特征提取和故障识别技术正处于研究阶段。旋转机械设备变工况状态(例如汽轮机 升降速过程)下产生的非平稳振动信号中,包含有大量反映设备运行状态和故障的 信息,而这些信息往往是在设备平稳运行的过程中是无法监测到的。因此,对变工 况过程的研究具有非常重要的价值。非平稳运行状态比平稳运行状态复杂,产生的 非平稳信号的频率和幅值都会随着时间发生变化,例如当设备升降速过程中,转速 通过转子系统的临界转速时,设备振动会产生剧烈变化。由于该过程会受到来自设 备的很多因素的影响,因此其振动信号的特征具有很差的重复性和复现性。因此需 华北电力大学硕士学位论文 要有一种相应的特征值提取和故障诊断的方法6。 过去在对汽轮机升降速过程进行监测和故障诊断中,常常会选取某一特定转速 下的一段信号进行分析 然后将其频谱与相应故障模式的进行对比,来判断设备的 状态。很明显,这种方法存在缺陷,停留在静态观测的基础之上,不能反映出整个 升降速过程的变化,而振动信号变化的趋势包含有很有价值的信息,并且会影响到 诊断的全面性和准确性。而 hmm 是一种动态模式识别工具,能够对一个时间跨度 上的信息进行统计建模和分类,在对汽轮机升降速过程的诊断过程中,可以整个过 程进行分析和对比,从而最终确定设备所处状态。即 hmm 故障诊断方法在一个动 态的环境中对设备状态进行观测、评估,能够早期发现故障的迹象,以便于把故障 消灭在萌芽状态16。这是 hmm 在动态信号分析领域的主要特点。另外,hmm 是 以统计模型为基础的, 而模式识别理论是机器学习领域的一个分支, 因此研究 hmm 故障诊断方法对于设备运行状态进行自动监测和估计具有重要意义。 1.2 hmm方法研究现状方法研究现状 hmm 的基本理论在 19 世纪六十年代末七十年代初就由 baum 等人在一系列论 文中提出,随后由 baker 和 jelinek 等人首先将其应用到语音识别之中27。早期的 语音识别领域应用动态时间弯折算法(dynamic time warping - dtw),并取得了一 定的结果。20 世纪 80 年代中期,由于贝尔实验室的 rabiner 等人对 hmm 的全面 介绍,才逐渐使 hmm 为世界各国从事语音处理的研究人员所了解和熟悉,成为公 认最有效的语音识别方法之一,并逐渐取代了动态 dtw 技术。过去十几年 hmm 的研究已经逐渐推广到其它众多应用领域,有关的介绍该理论及其应用的资料也越 来越多7,9,10。 图 1-1 语音信号识别流程图图 1-1 语音信号识别流程图 语音识别技术的实现过程如图 1-1 所示。首先要建立一种对应关系,例如,使 一个字对应一个 hmm,这里的状态就是指这个字的读音所包含的全部可能的音素 (或其细分、或其组合)。对应于此字的一个观测样本,这些音素按照一定的先后 顺序出现,这就形成了 hmm 中的状态序列,现实中是不可观测到的27。相应的观 测过程的实现就是每个字母所对应的声音信号的振幅。为了建立对应关系,首先应 6 华北电力大学硕士学位论文 7 对该字的一组观测样本(该字的若干个声音信号)进行学习,也就是说相应的状态 序列缺失的情况下进行 hmm 的参数估计。 文献7中提出了一种将隐马尔科夫模型(hmm)和支持向量机(svm)相结 合的分类算法,并将其应用在音频自动分类中,取得了比较满意的结果。文献16, 17, 18均介绍了 hmm 在语音识别中的成功应用, 其中文献16应用连续隐 markov 模型(chmm)对语音信号进行分类,并对模型状态进行了重构,在对非特定人的 语音识别中,该方法识别的准确性较常规模型更高。文献17设计了一个基于离散 隐 markov 整词模型的非特定人汉语小词表关键词提取语音识别系统,提出一种基 于前向-后向搜索得到的关键词假设做二次识别的置信度策略,并将该置信度用于 关键词提取系统的说话验证,得到了较好的效果。由上可看出,隐 markov 模型在 语音识别方面的研究非常广泛和深入,并取得了非常多的成果,也显示了 hmm 的 应用潜力。 目前,hmm 的应用领域也在不断的扩大,例如身份识别14、指纹识别15、基 因识别18以及滤波28等,几乎信号处理和模式识别领域中的各个方面都能找到 hmm 的踪影。 近年来,hmm 在设备故障诊断中也已经有了不少的成功应用。文献1中提出 了一种新的基于 hmm 的故障检测和诊断方法。首先,对无故障轴承和故障轴承分 别提取其运行时的振动信号,然后由振动信号中提取特征值组成模型训练的特征值 矩阵,用不同状态下得特征值矩阵训练代表不同状态的 hmm 模型。特征值的提取 是基于振动信号 ar 模型的二项式转换函数的反应系数。通过将给定振动信号的特 征值送入已训练好的模型中进行计算,并将其计算得出的概率值进行对比,通过选 取输出概率最大的模型即为信号所反映的设备状态。该方法同样适用于诊断多故障 情况。 文献2中将 hmm 方法应用于核电站事故识别, 首先对各种事故状态下的数据 提取特征值,然后用各特征值矩阵训练对应的 hmm 模型。本文选用了左右型 dhmm 模型,包含 6 个状态,每个状态有 22 个观测值,并对 8 种事故状态和一种 正常状态分别建立了 hmm 模型,仿真结果表明,hmm 模型可以正确区分各种不 同事故状态。 文献4中应用连续马尔科夫模型(continuous hidden markov model , chmm) 对机械设备信号进行分析和故障诊断,结果表明 hmm 具有很好的准确性、鲁棒性 和预见性。 除此之外,文献5,8,27也分别介绍了 hmm 在机械故障诊断中的应用,并 通过实例分析证明了 hmm 在该领域应用的可行性。 hmm 应用于设备故障诊断的方法可以归纳为:将已知设备不同运行状态(包 华北电力大学硕士学位论文 8 括正常状态和故障状态)的信号作为训练样本,提取的特征值,建立对应状态的 hmm 模型;在此基础上,获取未知运行状态信号,将其提特征值送入各个 hmm 模型进行计算,得到相似概率输出结果,将输出相似概率最大的模型所对应的状态 识别为未知状态信号的状态。 1.3 本文主要工作及内容本文主要工作及内容 1.3.1 主要研究工作 本文的工作是在深入学习研究 hmm 理论及其在设备故障诊断中的应用案例的 基础上,开发 hmm 程序,并将其应用于两种典型旋转机械设备的运行状态识别和 故障诊断中,主要内容包括以下三个部分: 1hmm 建模方法研究及程序实现 在深入学习 hmm 理论基础上,探讨离散隐马尔科夫模型(discrete hidden markov model,简记做 dhmm)的技术实现方法,编制 matlab 环境下的 dhmm 实现程序。 2振动信号特征提取方法及程序实现 特征值提取是 hmm 建模和诊断的重要环节,特征值选取是否合理会直接影响 模型的可靠性以及训练结果的准确性。在系统分析振动信号特征常规提取方法(时 域特征、频域特征等)的基础上,对倒频谱分析和包络分析方法进行深入研究,开 发基于 labview 的虚拟包络分析仪和倒频谱分析仪,并分别用仿真信号和实际信 号对仪器功能进行调试。 3. hmm 在设备故障诊断中的应用研究 针对两种典型旋转机械设备(汽轮机和齿轮箱) ,研究 hmm 建模方法和故障 诊断。汽轮机升负荷过程中,由于运行工况的变化,导致振动信号发生变化,信号 中以基频振动为主,提取不同状态下振动信号频谱中的基频幅值作为模型训练的特 征值,建立该组信号的 dhmm,对汽轮机的运行状态进行识别。对于齿轮箱,选 择连续运行的一组监测信号,信号中包含设备从正常状态到产生裂纹故障,直至某 个齿断掉的全部信息。通过包络分析提取 hmm 训练用的特征值并建立 dhmm 模 型,用前期正常信号作为模型的训练信号,而随时间递增的一长段数据作为待诊断 信号送入模型计算输出概率,对于 dhmm 方法在故障诊断中的有效性进行验证。 hmm 作为一种新的方法,在故障诊断领域中的应用存在着很多的实际问题, 本文最后对该方法的局限性进行了讨论。 华北电力大学硕士学位论文 9 1.3.2 本文内容安排 第一章对 hmm 模型方法的研究意义、 研究现状以及本文的研究内容和主要工作进 行介绍;第二章系统阐述 hmm 的基本概念与基础理论;第三章介绍常用振动信号分析 及特征提取方法,重点介绍倒频谱分析和包络分析方法,对所开发的虚拟倒频谱分析仪 和包络分析仪的程序结构和仿真算例进行介绍; 第四章首先给出了 hmm 模式识别方法 的基本实现步骤,然后通过对汽轮机升速信号和齿轮信号分析的两个工程案例,说明了 hmm 在工程应用中的有效性;第五章对本文的工作进行总结,并需要进一步解决的问 题和其在实际应用中的局限性进行了分析。 华北电力大学硕士学位论文 第二章第二章 隐马尔科夫模型的基本理论隐马尔科夫模型的基本理论 2.1 markov模型模型 markov 随机过程在自然科学和工程技术中有着广泛的应用,其原始模型是 markov 链。在实践中常常遇到这样的随机过程,在已知目前状态的条件下,未来 的演变与以往的状态无关,这种已知“现在”的条件下, “将来”与“过去”独立 的特性称为 markov 性,具有 markov 性的随机过程被称为 markov 过程。典型例子 包括 1)人口增长过程;2)布朗运动;3)一只没有记忆的青蛙随机地从一片荷叶 跳到另一片荷叶。 2.2 hmm基本概念基本概念 hmm 是在 markov 模型的基础上发展而来的,由于实际问题比 markov 模型所 描述的问题更为复杂,观测到的事件并不是与状态一一对应,而是通过一组观测概 率分布相联系, 这样的模型称为 hmm。 它是一个双重随机过程, 其中之一是 markov 链,这是一个基本的随机过程,描述状态之间的转移。另一个随机过程描述状态和 观测变量之间的统计对应关系。这样,站在观察者的角度,只能看到观察值,不像 markov 模型中的观测值和状态一一对应。因此不能直接看到状态,而是通过一个 随机过程去感知状态的存在及其特性,因此称为“隐”markov 模型。 图 2-1 罐子模型(一个离散 hmm 的例子) 图 2-1 罐子模型(一个离散 hmm 的例子) 10 华北电力大学硕士学位论文 11 , 以如图 2- -1 所示的罐子模型实例介绍 hmm 概念。设有 n 个罐子,每个罐子中 有很多彩色的球,球的颜色由一组概率分布矢量来描述。实验这样进行:根据某个 初始概率分布,随即选取 n 个罐子中的一个,例如第 i 个罐子,再根据这个罐子中 彩色球颜色的概率分布,随机的选择一个球,记下球的颜色,记为,再把球放回 罐子中,又根据描述罐子的转移概率分布随机的选择下一个罐子,例如第 j 个罐子, 再从罐子中随机选一个球,记下球的颜色,记为,一直进行下去,可以得到一个 描述球的颜色的序列由于这是一些观测到的事件,因而称之为观测值序 列。但罐子之间的转移以及每次选取的罐子都被隐藏起来了,并不能直接观测到。 而且每个罐子中选取球的颜色并不是与罐子一一对应,而是由该罐子中求得颜色的 概率分布随机决定的。此外,每次选择哪一个罐子由一组转移概率所决定。 1 o 2 o 12 ,o o l 2.2.1 hmm定义 上面的罐子模型给出了 hmm 的基本思想,现在给出 hmm 的定义。 一个 hmm 可由下列参数描述: 1.n:模型中,markov 链的状态数。记 n 个状态为 12 , n l,记 t 时刻 markov 链所处的状态为 q ,显然( tt q 12 , n ) 。在罐子和球的实验中罐子就相当于 hmm 中的状态。 2.m:每个状态对应的可能的观测值数目。记 m 个观测值为v, 12 ,v m v ,记 t 时刻的观测值为,其中 t o 12 ( ,) t ov vvml在罐子和球的实验中所选的颜色就是 hmm 模型中的观测值。 3.:初始概率分布矢量, 12 (,) n =l,其中(),1 iti p qin= 在罐子和球的实验中,是实验开始时选择的某个罐子的概率。 4.a:状态转移概率矩阵,() ijn n aa = 其中, 1 (/)1, ijtjti ap qqi jn + = 在罐子和球的实验中指每次选取当前罐子的条件下选取下一个罐子的概率。 5.b:观测值概率矩阵,() jkm n bb =,其中在罐子和球的实验中, jk b就是第 j 个罐子中球的颜色 k 出现的概率。 综上所述,记 hmm 为:(, , , )n ma b=,或简写为:( , ,)a b=。 更形象地说,hmm 可分为两部分,一个是 markov 链,由, a描述,产生的输 出为状态序列; 另一个随机过程由b来描述, 产生的输出为观测值序列。 一个hmm 的组成如图2-22-2所示,其中t为观测序列的时间长度。 图 2-2 hmm 的组成示意图图 2-2 hmm 的组成示意图 华北电力大学硕士学位论文 2.3 hmm基本算法基本算法 要建立一个hmm,必须要解决三个基本问题,围绕这三个基本问题,人们研 究了三个基本算法。这三个问题是: 问题 1 hmm的概率计算问题 给定观测序列和模型 12 ,., t oo oo=,怎样有效的计算变量序列o在给定模 型下的概率(|)p o。 问题 2 hmm的最优状态序列问题 给定观测序列和模型 12 ,., t oo oo=。怎样选择一个相应的状态序列 ,使其能够在某种意义上最优(例如 更好的解释观测变量) 。 12 ,. t qq qq= 问题 3 hmm的训练问题(参数估计) 该问题由baum-welch算法解决,该算法对给定观测值序列, 能确定一个模型 12 ,., t oo oo= ( , ,)a b=,使(|)p o最大。这是一个泛函极值问题,因而不存 在一个最佳方案来估计。 2.3.1 前向-后向算法 前向-后向算法是hmm概率计算问题的解决方案。该算法用来计算给定一个 观察值序列,以及一个模型 12 ,., t oo oo=( , ,)a b=时,模型产生出o的概率 (|)p o。根据图 2-2 所示hmm的组成,(|)p o最直接的求取方法如下:对于一个 固定的状态序列 12 ,. t sq qq=,有 1122 1 (|, )(|, )()().() t ttqqqtt t p o sp oqbo bobo = = (2.1) 其中, ( )|,1 qttjktjtk bobqovtt= (2.2) 而对给定,产生状态序列s的概率为 1 11 2 (|). tt qq qqq p saa = (2.3) 因此所求概率为 1 1111 222 (|)()().() ttt qqq qqqqqt p obo aboabo = (2.4) (1)前向算法)前向算法 12 华北电力大学硕士学位论文 前向算法中首先定义前向变量为: 12 ( )(,. ,|),1 ttti ip o oo qtt= 1iii (2.5) 在此基础上,该算法分成三步实现: 1)初始化:( )( )ib o= (2.6) 2)递归: (2.7) 11 1 ( )( )(),1,1 n ttijjt i ii a b ott + = = jn 3)终结: (2.8) 1 (|)( ) n t i p oi = = 前向算法中,递归步是核心步骤,算法示意图如图2-3(a)所示。该图反映了 在t时刻的状态i(1)是通过怎样的途径到达t+1时刻的状态j的。前向算 法有如图2-3(b)所示的格型结构。 in 图 2-3 前向算法示意图 图 2-3 前向算法示意图 前向算法的思想是由递归方法计算由时刻t的状态i向t+1时刻状态j转移的所 有途径的概率,这些概率值之和为(|)p o。实际计算中首先计算出对应每个t和每 个i的前向和后向概率,然后套用公式: 11 (|)( )( )( ),11 nn ttt ii p oiiitt = = (2.9) 式(2.9)也称为全概率公式。 (2)后向算法)后向算法 与前向算法类似,定义后向变量为: 12 ( )(, )11 ttttti ip ooo qtt + =k, (2.10) 其中,( )1 t i=,后向算法的计算过程如下: 1)初始化 13 华北电力大学硕士学位论文 14 t n( )1,1ii= (2.11) 2)递归 11 1 ( )()( ),1,2,1,1 n tijjtt j ia b ojttti + = = ln (2.12) 3)终结 1 ()( n t i p oi = =) (2.13) 后向算法初始化时对于所有的状态i定义( ) t i等于1。与前向算法类似,后向 算法也是一个格型结构的算法,其中步骤2)的算法说明如图2-42-4所示: 图 2-4 后向算法 t 时刻的递归关系 图 2-4 后向算法 t 时刻的递归关系 2.3.2 viterbi算法 viterbi算 法 用 来 计 算 给 定 一 个 观 察 值 序 列oo1 2 ,., t oo=和一个模型 ( , ,)a b=,如何确定一个最佳状态序列qq的问题。这里讨论的最优意 义上的q,是指使 * 12 , t * qq=l * (,p q o)最大时所确定的状态序列。这可用 viterbi 算法实现。 其描述如下: 定义( ) t i为t时刻沿一条路经,且 12, , t q qql t q i =,产生出的最大概 率,即有: 12 , t o ool 1 11 1, ( )max(,) t ttti qq ip qq qoot = l ll, 则求取最优状态序列的过程分为以下四步: * q 1)初始化 1tii n( )(),1ib oi= t n (2.14) ( )0,1ii= (2.15) 华北电力大学硕士学位论文 2)递归 15 1 1 1 ( )max ( )(),2,1 t ttijjt j n ji ab ottjn = (2.16) 1 1 ( )argmax( ),1,1 ttij i n ji attjn = i t i 1 (2.17) 3)终结 * 1 max( ) t i n p = (2.18) * 1 argmax( ) t i n q = (2.19) 4)确定最佳状态序列 * 11 (),1,2, ttt qqttt + = l 式(2.19)中 , 符 号argmax定 义 为 , 如 果i=i时 ,( )f i达 到 最 大 值 , 则 1 argmax ( ) i n if i =。 示例:viterbi 算法的求解过程 按照定义 1 1 1 ( )max ( )() t ttij j n ji a jt b o =,考察j=1,假设 31 1 argmax( ) i i n qi 1 a =,在 观察到的前提下,由状态转移到下一个状态的概率最大者为 1 o 12, , n q qql 1 q 1(3)a 图 2-5 viterbi 算法的计算过程示意图 图 2-5 viterbi 算法的计算过程示意图 31 。在时刻t时,粗箭头连接的是观测到o o 121 , t o l的前提条件下,从状态 到状态q(箭头指向的状态)的最大概率的路径。求解过程如图2-5所 示。 12, , n q qql i 华北电力大学硕士学位论文 2.3.3 baum-welch算法 这个算法用于解决hmm训练问题,即hmm参数估计问题。baum-welch 算 法可描述为,给定一个观测值序列 12 , t oo oo=l,该算法能够确定一个模型 ( , ,)a b=,使(p o)最大。这是一个泛涵极值问题,因而不存在一个最佳方案来 估计。在这种情况下,baum-welch 算法利用递归的思想,使(p o)为局部最大, 最后得到模型的参数。 定义( , ) t i j为给定训练序列和模型o时, 时刻t时markov链处于 i 状态和时 刻t+1时处于 j 状态时的概率,即 1 ( , )( ,) ttit i jp o qq j + = (2.20) 根据前向变量和后向变量的定义可以导出: 11 ( , )( )()( )/() ttijjtt i ji a b ojp o + = (2.21) 那么t时刻markov链处于 i 状态的概率为: 1 ( )( ,)( , )( )( )/() n ttittt j ip o qi jiip o = = (2.22) 因此,表示从 1 1 ( ) t t t i = i 状态转移出去的期望值,而 1 ( , ) t t t i j 表示从 i 状态 转移到 j 状态的期望值,由此导出了 baum-welch 算法中著名的重估公式: ( ) i t i= (2.23) 1 11 ( , )/( ) tt ijtt tt ai ji = = (2.24) 11 11 ( )( )/( ), tt jtt tt b kjjv = = t 且o k = (2.25) 那么hmm的参数( , ,)a b=的求取过程为:根据观测序列o和选取的初始模 型 0 ( , , )a b=, 由重估公式(2.23)、(2.24)、(2.25), 求得一组新的参数 i, ij a,( ) j b k, 同时得到了一个新模型( , , )a b=,可以证明()(p op o),即有重估公式得到 的比在表示观测值序列的方面要好。重复这个过程,逐步改进模型参数,直 到 o (|)p o满足一定的收敛条件,即不再明显增大,此时的就是所求之模型。 2.4 hmm的类型的类型 根据不同的分类方法,可以将hmm分成多种类型。 16 华北电力大学硕士学位论文 2.4.1 按照观测变量分类 根据图2-2所示,hmm由两个随机过程组成,其一为markov链,另外一个是 观测变量随机过程。 按照观测到的随机变量统计特性, 可以把hmm分为离散hmm 和连续hmm。前面2.2中提到的罐子模型(见图2-1) ,由于其观测变量是m个离 散可数的观测值中的一个,因而称之为离散hmm(记为dhmm) ,这类模型中某 个状态j对应的观测值的统计特性是由一组概率 jk b,1,2,km=l来描述。所谓连 续hmm(记为chmm) ,指观测值为一个连续的随机变量x,因此某个状态j对应 的观测值的统计特性由一个观测概率密度函数来表示。 在本文中描述的hmm 模型都是dhmm模型。 () j b x 2.4.2 按照markov链形状分类 hmm中的markov链的形状由状态转移概率矩阵决定,如果markov链的状态 从任一状态出发,在下一时刻可以达到任一状态,即对应的a矩阵中没有零元素, 则这样的hmm称为各态历经的hmm。他的特点是状态转移概率矩阵中的每一个 元素都是正值。 对于某些实际应用的场合,其它类型的hmm比标准的各态历经的hmm能更 好的模拟信号的属性。这种模型称为左右型hmm,因为隐藏在该模型下的状态序 号随着时间的增加而增加,也就是说系统的状态演化的方式都是按照清晰的左右方 式进行,显然这种模型更能描述以连续的方式随时间而改变的信号,如语音信号。 在旋转机械监测中,设备振动信号的特性与语音信号相似,因此本文讨论的hmm 模型都为左右型。左右型hmm的本质属性是状态转移概率具有下列的约束形式: 0, ij aj= +?i n 对于左右型hmm的最后一个状态,状态转移概率通常指定为: 1,0, nnni aai=,随意 $ 是 改进后的模型。再将 $ 作为初始值使用重估公式,得到,这样就在一定程度上避 免了初值的选取不当,变经典的训练过程为 $ 。在图2-6中的虚线 表示,不用重估公式,$也可以近似为模型参数。 图 2-6 改进的 hmm 参数估计方法示意图 图 2-6 改进的 hmm 参数估计方法示意图 hmm中的markov链具有不同的形状。因此,针对不同形式的hmm,也可以 采用不同的有效的初值选取方法。 18 华北电力大学硕士学位论文 2.5.2 算法下溢问题的处理 在前向-后向算法和baum-welch算法中,都有( ) t i和( ) t i的递归计算,因为 所有的量都小于1,因此,( ) t i(随着t的增加)和( ) t i(随着t的减少)都迅速 的趋于零,为了解决这种下溢问题,必须采取增加比例因子的方法,对有关算法加 以修正,处理过程为: 1)对的处理 1( ) () ii ib o1= (2.26) *11 1 1 1 1 ( )( ) ,1 ( ) n i ii in i = = t (2.27) ? * 1 1 1 ( )( ) (),1,1,2,1 n t tijjt i ji a b ojn t + + = = l (2.28) ? ? ? 11 * 1 11 1 ( )( ) ( ),1,1,2,1 ( ) tt t n tt j jj jjn j + + + = = ltt (2.29) 2)对的处理 * ( )1,1( )1,1 tt iinii= = n (2.30) ? * 11 1 ( )()( )1,1,2,1 n tijjtt j ia b ojin tt + = = = l (2.31) ? * 1 ( ) ( ),1,1,2,1 t t t i iin t + = = l t (2.32) 3)概率(p o)的计算公式的处理 对和作了上述处理以后,为了保持原有公式的计算结果不变,必须在概率 (p o)的计算公式中做相应的处理,以消去比例因子的影响。 由的处理过程容易推出: * 12 ( )( )/ ttt ii= l ? * 1121 1111 ( )( )()( )/ nnnn t ttijjttt jjij ji a b oj (2.33) 19 = = l t (2.34) 因此 ( ) n t12 j 1 j = = l (2.35) 即 12 1 ()( ) n t j p oj = = l t (2.36) 或 1 lg()lg t t t p o = = (2.37) 华北电力大学硕士学位论文 4)viterbi算法的处理 在原来的viterbi算法加入对数化处理即可,即定义 1 11 1, ( )max lg(,) t tttti qq ip qq q qo t o = l ll in (2.38) 则初始化公式变为: 11 ( )lglg(),1 ii ib o=+ (2.39) 递归运算公式变为 1 1 1 ( )max( )lglg() itijj i n iiab t o =+ (2.40) 终结公式变为: 1 * 1 lgmax( ) t i n p =i (2.41) 这样得到的是的对数值而不是。应该指出,实际上为了避免计算出的概 率值太小,而总是采用 * p * p lg()p o。事实上单个的(p o)的值与通常意义上的概率是 有些区别的, 单个具体的()p o总是很小很小, 因此单个()p o的数值本身并无多 大意义,通常是在应用中比较几个()p o的相对大小才有意义。 2.6 基于基于dhmm的齿轮数据建模与诊断的齿轮数据建模与诊断 本节利用文献30提供的从实际齿轮箱获得的故障特征数据,对hmm诊断方 法进行测试。该齿轮箱为某型号拖拉机的变速箱,使用监测系统获取该齿轮箱在正 常状态和齿根裂纹、断齿两种故障状态下的振动信号。首先对信号进行快速傅利叶 变换,取频谱中对故障反应敏感的啮合频率处及其边带成分处的幅值作为特征值, 组成对应着三种不同状态的特征值矩阵,然后利用特征值进行hmm训练。本例中 选用三状态dhmm模型,即模型参数n=2,m=5。模型状态结构如图2-7。表2-1中 为齿轮箱的样本数据,正常状态、齿根裂纹状态和断齿状态的样本数据分别测量三 组。表2-2中为对应样本数据三种状态的测试数据,其中,样本数据和测试数据为 在相同工况下测得,且具有相同的采样频率。 图 2-7 markov 链的初始形状图 2-7 markov 链的初始形状 20 华北电力大学硕士学位论文 21 表 2-1 齿轮箱状态样本数据 数据 特征样本 齿轮状态 1 0.2286 0.1292 0.0720 0.1592 0.1335 0.0733 0.1159 0.0940 0.0522 0.1345 0.0090 0.1260 0.3619 0.0690 0.1828 无故障 2 0.2090 0.0947 0.1393 0.1387 0.2558 0.0900 0.0771 0.0882 0.0393 0.1430 0.0126 0.1670 0.2450 0.0508 0.1328 无故障 3 0.0442 0.0880 0.1147 0.0563 0.3347 0.1150 0.1453 0.0429 0.1818 0.0378 0.0092 0.2251 0.1516 0.0858 0.0670 无故障 4 0.2603 0.1715 0.0702 0.2711 0.1491 0.1330 0.0968 0.1911 0.2545 0.0871 0.0060 0.1793 0.1002 0.0789 0.0909 齿根裂纹 5 0.3690 0.2222 0.0526 0.5157 0.1872 0.1614 0.1425 0.1506 0.1310 0.0500 0.0078 0.0348 0.0451 0.0707 0.0880 齿根裂纹 6 0.0359 0.1149 0.1230 0.5460 0.1977 0.1248 0.0624 0.0832 0.1640 0.1002 0.0059 0.1503 0.1837 0.1295 0.0700 齿根裂纹 7 0.1759 0.2347 0.1829 0.1811 0.2922 0.0655 0.0774 0.2273 0.2056 0.0925 0.0078 0.1852 0.3501 0.1680 0.2668 断齿 8 0.0724 0.1909 0.1340 0.2409 0.2842 0.0450 0.0824 0.1064 0.1909 0.1586 0.0116 0.1698 0.3644 0.2718 0.2494 断齿 9 0.2634 0.2258 0.1165 0.1154 0.1074 0.0657 0.0610 0.2623 0.2588 0.1155 0.0050 0.0978 0.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论