隐马尔可夫模型及其应用.docx_第1页
隐马尔可夫模型及其应用.docx_第2页
隐马尔可夫模型及其应用.docx_第3页
隐马尔可夫模型及其应用.docx_第4页
隐马尔可夫模型及其应用.docx_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小论文写作: 隐马尔可夫模型及其应用学院:数学与统计学院 专业:信息与计算科学 学生:卢富毓 学号:20101910072内容摘要:隐马尔可夫模型是序列数据处理和统计学习的重要概率模型,已经成功被应用到多工程任务中。本小论文首先从隐马尔可夫模型基本理论和模型的表达式出发 ,进一步阐述了隐马尔可夫模型的应用。HMM隐马尔可夫模型(Hidden Markov Model,HMM)作为一种统计分析模型,创立于20世纪70年代。80 年代得到了传播和发展,成为信号处理的一个重要方向,现已成功地用于语音识别,行为识别,文字识别以及故障诊断等领域。隐马尔可夫模型状态变迁图(例子如下)x 隐含状态y 可观察的输出a 转换概率(transition probabilities)b 输出概率(output probabilities)隐马尔可夫模型它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。 在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。HMM的基本理论隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程-具有一定状态数的隐马尔可夫链和显示随机函数集。自20世纪80年代以来,HMM被应用于语音识别,取得重大成功。到了90年代,HMM还被引入计算机文字识别和移动通信核心技术“多用户的检测”。近年来,HMM在生物信息科学、故障诊断等领域也开始得到应用。隐马尔可夫模型(HMM)可以用五个元素来描述,包括2个状态集合和3个概率矩阵: (1)隐含状态 S 这些状态之间满足马尔可夫性质,是马尔可夫模型中实际所隐含的状态。这些状态通常无法通过直接观测而得到。(例如S1、S2、S3等等) (2) 可观测状态 O 在模型中与隐含状态相关联,可通过直接观测而得到。(例如O1、O2、O3等等,可观测状态的数目不一定要和隐含状态的数目一致)。(3) 初始状态概率矩阵 表示隐含状态在初始时刻t=1的概率矩阵,(例如t=1时,P(S1)=p1、P(S2)=P2、P(S3)=p3,则初始状态概率矩阵 = p1 p2 p3 . (4) 隐含状态转移概率矩阵 A。 描述了HMM模型中各个状态之间的转移概率。 其中Aij = P( Sj | Si ),1i,jN. 表示在 t 时刻、状态为 Si 的条件下,在 t+1 时刻状态是 Sj 的概率。 (5) 观测状态转移概率矩阵 B (英文名为Confusion Matrix,直译为混淆矩阵不太易于从字面理解)。 令N代表隐含状态数目,M代表可观测状态数目,则: Bij = P( Oi | Sj ), 1iM,1jN. 表示在 t 时刻、隐含状态是 Sj 条件下,观察状态为 Oi 的概率。 一般的,可以用=(A,B,)三元组来简洁的表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态之间的概率关系。的三个典型问题 已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决. 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决. 已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Reversed Viterbi算法解决. 另外,最近的一些方法使用Junction tree算法来解决这三个问题。来自维基百科的关于HMM的一个实例假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么.你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间.他选择做什么事情只凭天气.你对于他所住的地方的天气情况并不了解,但是你知道总的趋势.在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况. 你认为天气的运行就像一个马尔可夫链.其有两个状态 雨和晴,但是你无法直接观察它们,也就是说,它们对于你是隐藏的.每天,你的朋友有一定的概率进行下列活动:散步, 购物, 或 清理. 因为你朋友告诉你他的活动,所以这些活动就是你的观察数据.这整个系统就是一个隐马尔可夫模型HMM. 你知道这个地区的总的天气趋势,并且平时知道你朋友会做的事情.也就是说这个隐马尔可夫模型的参数是已知的.你可以用程序语言(Python)写下来: states = (Rainy, Sunny)observations = (walk, shop, clean)start_probability = Rainy: 0.6, Sunny: 0.4transition_probability = Rainy : Rainy: 0.7, Sunny: 0.3, Sunny : Rainy: 0.4, Sunny: 0.6, emission_probability = Rainy : walk: 0.1, shop: 0.4, clean: 0.5, Sunny : walk: 0.6, shop: 0.3, clean: 0.1, 在这些代码中,start_probability代表了你对于你朋友第一次给你打电话时的天气情况的不确定性(你知道的只是那个地方平均起来下雨多些).在这里,这个特定的概率分布并非平衡的,平衡概率应该接近(在给定变迁概率的情况下)Rainy: 0.571, Sunny: 0.429 transition_probability 表示基于马尔可夫链模型的天气变迁,在这个例子中,如果今天下雨,那么明天天晴的概率只有30%.代码emission_probability 表示了你朋友每天做某件事的概率.如果下雨,有 50% 的概率他在清理房间;如果天晴,则有60%的概率他在外头散步.HMM的应用一、HMM在语音处理中的应用 HMM是序列数据处理和统计学习的一种重要概率模型,近几年来已成功被应用到许多语音处理的任务中。抽取过程描述如下:(1) 对论文部分进行预处理。主要是依据回车和逗号、分号等标点和符号对头部信息进行语义块切分,然后在语义块基础上进行信息抽取,这样可以有效提高抽取准确率召回率。另外还根据“摘要”、“中图分类号”等待定标签将相应抽取域标识;(2) 根据一些特征对部分语义块(如标题、单位等)进行词语切分,然后计算各个词语成语义块输出概率;(3) 在给定的HMM模型下,用韦特比算法进行计算,求出状态序列,即语义块相关联的域,然后按关联抽取各语义项。下面给出HMM模型的语音到口型的映射图。二、HMM在人脸表情识别中的应用HMM在人脸识别中应用模型步骤如下:(1)评估问题:得到观察序列 和模型参数 ,利用前向-后向算法快速计算出该模型下,观察事件序列发生的概率 . (2)解码问题:利用 Viterbi算法选择对应的状态序列 ,是S能够合理地解释观察序列O。即揭晓模型隐含部分,在优化准则下找到最有状态序列。(3) 学习问题。 利用Baum-Welch算法来调整模型参数 ,即得到模型中的五个参数,使得 最大。人脸表情识别的任务就在于通过表情图像来分析和建立HMM,对表情进行训练和识别。人脸表情HMM状态划分和确定如下图所示,结果如表2所示:除此之外,HMM在生物信号分析、故障诊断等研究广泛运用,并且取得了丰硕的成果。HMM的最新应用HMM作为序列数据处理和统计学习的一种重要概率模型,具有建模简单,物理意义明确等优点,且已经有很多成熟的算法,是一种精确地匹配时变数据的技术,除了在上述中的语音识别、生物信号分析、模式(如人脸、步态、表情等)识别、故障诊断等的研究中广泛运用,并且取得了丰硕的成果。在以下几个方面得到最新的应用:A、HMM在人的行为分析中的应用:人的行为分析在视频会议、人机交互、智能控制、基于行为的视频检索以及医疗诊断等方面有广泛的应用前景和潜在的经济价值,是当前计算机视觉领域的一个研究热点。B、HMM在网络安全中的应用:随着计算机的飞速发展,信息网络已经成为社会发展的重要保障,网络安全越来越受到关注。在网络安全研究中,入侵检验是其中重要的一方面,是对入侵行为进行处理以保证网络安全的前提和基础。传统的检测方法是Forrest等人提出的时延嵌入序列法(TIDE)。而由Warrender等人于1999年首次在入侵检测中引入HMM,随后被广泛应用入侵检测中。除了入侵检测,还应用于数据库异常检测、Web用户异常访问等的检测中。C、HMM在信息抽取中的应用:信息抽取是处理海量文件的重要环节,旨在帮助人们从海量联机文件中快速、准确地抽取自己真正需要的信息,抽取出来的信息以一定的方式存储在数据库中。而信息抽取中目标信息在网页、文章等中的具体位置,称为抽取域,而要抽取的信息,即抽取域中的内容称为语义项,信息抽取的过程首先要确定抽取域,然后提取相应的语义项,这与HMM的结构相吻合,即各抽取域和HMM的隐状态序列相对应,而语义项和个状态的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论