(应用数学专业论文)隐非齐次马尔可夫模型的混合性.pdf_第1页
(应用数学专业论文)隐非齐次马尔可夫模型的混合性.pdf_第2页
(应用数学专业论文)隐非齐次马尔可夫模型的混合性.pdf_第3页
(应用数学专业论文)隐非齐次马尔可夫模型的混合性.pdf_第4页
(应用数学专业论文)隐非齐次马尔可夫模型的混合性.pdf_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士学位论文 摘要 隐马尔可夫模型在近几十年来被广泛应用于弱相依随机变量的 建模上,被用作研究发音过程,神经生理学与生物遗传等方面问题的 工具。虽然隐马尔可夫模型在今天已经得到了广泛的应用,但它的理 论基础并不完善,并且如在动态的图象处理、气象预测等的一些实际 应用中,人们需要建立隐非齐次马尔可夫模型来进行研究。但由于隐 非齐次马尔可夫模型难以处理,所以对于隐非齐次马尔可夫模型的理 论研究基本上还是空白。隐非齐次马尔可夫模型的理论方面的研究具 有很大的研究意义。 本文的主要目的是研究隐非齐次马尔可夫模型的混合性。首先, 介绍了隐马尔可夫模型的有关知识。其次,研究了一重隐非齐次马尔 可夫模型的混合性。先给出并证明了非齐次马尔可夫链满足混合性的 充分条件,并将所得结果推广到了隐非齐次马尔可夫模型上。最后, 研究了m 重隐非齐次马尔可夫模型的混合性。先给出了m 重非齐次马 尔可夫链混合性的定义,然后利用此定义和引理证明了m 重非齐次马 尔可夫链满足混合性的充分条件,并将所得结果推广到了m 重隐非齐 次马尔可夫模型上,对进一步研究多重隐马尔可夫模型提供了理论基 础,且能为实际问题如弱相依随机变量的建模、发音过程、神经生理 学和生物遗传学等领域的研究提供理论依据 江苏大学硕士学位论文 关键词:马尔可夫链,非齐次马尔可夫链,隐马尔可夫模型,隐非齐 次马尔可夫模型,m 重非齐次马尔可夫链,m 重隐非齐次马 尔可夫模型,混合 江苏大学硕士学位论文 a b s t r a c t h i d d e nm a r k o vm o d e l sh a v ed u r i n gt h el a s td e c a d eb e c o m ew i d e s p r e a df o r m o d e l i n gs e q u e n c e so fw e a k l yd e p e n d e n tr a n d o mv a r i a b l e s ,耐t ha p p l i c a t i o n si n a r e a ss u c ha ss p e e c hp r o c e s s i n g ,n e u r o p h y s i o l o g ya n d b i o l o g y h i d d e nm a r k e rm o d e l sa r ew i d e l ya p p l i e d ,b u ti t st h e o r e mf o u n d a t i o na r en o t p e r f e c t ,a n dw es h o u l ds e tu ph i d d e nm a r k o vm o d e l si nt h ep r a c t i c e da p p l i c a t i o n s u c ha sd y n a m i cg r a p h i c a lm o d e l s ,c l i m a t ef o r e c a s t b e c a u s eh i d d e nm a r k o vm o d e l s a r ed i f f i c u l tt om a n a g e ,t h e o r yr e s e a r c ho fh i d d e nn o n h o m o g e n e o u sm a r k o vm o d e l s a r eb a s i c a l l yb l a n k n e s s i ti si m p o r t a n tm e a n i n gt os t u d yt h eh i d d e nn o n h o m o g e n e o u s m a r k o vm o d e l s t h ep u r p o s eo ft h i si st os t u d yt h em i x i n gp r o p e r t yo fh i d d e nn o n h o m o g e n e o u s m a r k o vm o d e l s i nt h i s p a p e r , f i r s t l y , i ti n t r o d u c e ss o m ek n o w l e d g ea b o u th i d d e n m a r k o vm o d e l s s e c o n d l y , w es t u d yt h em i x i n gp r o p e r t yo ff i r s to r d e rh i d d e n n o n h o m o g e n e o u sm a r k o vm o d e l s t h es u f f i c i e n tc o n d i t i o nf o rn o n h o m o g e n e o u s m a r k o vc h a i n st om e e tt h i sk i n do fm i x i n gp r o p e r t yi sg i v e na n dp r o v e d ,a n dt h e r e s u l t sa b o u t n o n h o m o g e n e o u sm a r k o vc h a i n s a r ee x t e n d e dt o t h eh i d d e n n o n h o m o g e n e o u sm a r k o vm o d e l s i nt h ee n d ,w es t u d yt h em i x i n gp r o p e r t yo fmt h o r d e rh i d d e nn o n h o m o g e n e o u sm a r k o vm o d e l s t h ed e f i n i t i o no ft h em i x i n gp r o p e r t y o fmt ho r d e rn o n h o m o g e n e o u sm a r k o vc h a i n si sg i v e n ,a n dt h es u f f i c i e n tc o n d i t i o n f o r 聊t ho r d e rn o n h o m o g e n e o u sm a r k o vc h a i n st om e e tt h i sk i n do fm i x i n gp r o p e r t y i s p r o v e db yu s i n g t h ed e f i n i t i o na n dl e m m a ,a n dt h e nt h er e s u l t sa b o u t n o n h o m o g e n e o u sm a r k o vc h a i n sa r ee x t e n d e dt ot h eh i d d e nn o n h o m o g e n e o u s m a r k o vm o d e l s ,w h i c hp r o v i d e ss o m et h e o r e t i c a lb a s e sf o rf u r t h e r s t u d y i n g m u l t i o r d e rh i d d e nm a r k o vm o d e l sa n ds o m ep r a c t i c a lp r o b l e m ss u c ha sm o d e l i n g s e q u e n c e s o f w e a k l yd e p e n d e n t r a n d o m v a r i a b l e s , s p e e c hp r o c e s s i n g , n e u r o p h y s i o l o g ya n db i o l o g y 江苏大学硕士学位论文 k e yw o r d s :m a r k o vc h a i n s ,n o n h o m o g e n e o u sm a r k o vc h a i n s ,h i d d e nm a r k o v m o d e l s ,h i d d e nn o n h o m o g e n e o u s m a r k o vm o d e l s ,mt ho r d e r n o n h o m o g e n e o u sm a r k o vc h a i n s ,mt ho r d e rh i d d e nn o n h o m o g e n e o u s m a r k o vm o d e l s ,m i x i n g 江苏大学硕士学位论文 a e l v p 芦 石 e x e e i 磊。】 缩写与符号说明 几乎处处 随机变量 概率 盯一域 尸韵子盯一域 随机变量x 的数学期望 随机变量x 。的条件期望 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和 汇编本学位论文。 保密口 本学位论文属于,在年我解密后适用本授权书。 不保密囹 学位论文作者签名:扬覆簪 指导教师签名:砌 0 客年9 只f8 日。3 年 只穆b 独仓i j 性申明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立 进行研究工作所取得的成果。除文中已经注明引用的内容以外,本论文 不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全 意识到本声明的法律结果由本人承担。 学位论文作者签名:纫昃筝 日期:冽年月 江苏大学硕士学位论文 1 1 马尔可夫链简介 第一章绪论 马尔可夫链( 简称马氏链) 是一种特殊的随机过程,最初由苏联数学家 a a m a r k o v b 所研究,它的直观背景如下: 设想有一个随机运动的体系( 例如运动着的质点等) ,它可能处的状态( 或 位置) 记为& ,s l ,瓯,总数共有可列多个或有穷个,这体系只可能在时刻 t = 1 2 ,忍,上改变它的状态。随着的运动过程,定义一列随机变量 邑,甩= o ,1 2 ,其中 邑= k ,如在f = r l 时,位于& 一般地, 托,n o ) 未必是相互独立的。 实际中常常碰到具有下列性质的运动体系,如果已知它在f = 玎时的状态, 则关于它在n 时以前所处的状态的补充知识,对预言在n 时以后所处的状态不 起任何作用。或者说,在已知“现在 的条件下,“将来 与“过去 是独立的。 这种性质,就是直观意义上的“马尔可夫性”( 简称“马氏性 ) ,或称“无后 效性 。具有这种特性的随机过程称为马尔可夫过程,简称马氏过程。 荷花池中的一只青蛙的跳跃是马尔可夫过程的一个形象化例子。青蛙按照它 瞬间跳起的念头从一片荷叶上跳跃到另一片荷叶上。如果青蛙是没有记忆的,人 们自然可以假定,当己知青蛙在某时刻所处的位置时,它下一步跳往何处与它此 前走过的路径无关。如果将荷叶编号( 例如编号为自然数1 ,2 ,3 ,) ,并用凰表 示青蛙在初始时刻所处的荷叶的号码,用墨,置,分别表示青蛙经过第一次, 第二次,跳跃后所处的荷叶的号码,那么,随机序列 以,n o ) 就是一个马 尔可夫过程。 江苏大学硕士学位论文 1 2 马尔可夫链的定义 对于一随机试验,设q 是所有样本点 缈 构成的样本空间,f 是q 上的所有 随机事件构成的事件集合称为仃一代数,p 是定义在f 上的概率测度。定义在q 上 的取值于实数域的f 可测函数石( 缈) 称为随机变量。称定义在概率空间( q ,f ,d 上的随机变量族x = 仁,( 国) ,t z ) 为一随机过程,其中tc r ( 实数集) ,t 可以 为无穷的或有穷的,可以为可列的或不可列的,称为参数集。若z 为有限集,如 弘,( 国) ,0 f 0 ,总有 尸( 叉_ + 1 = 厶“l x o = i o , x 1 = f l ,j 乙= 屯) = p ( j _ + ,= 厶+ li x 。= 屯) ( 1 2 1 ) 成立,则称x 为离散参数的马尔可夫链。若s 为可列集或有限集,则称x 分别 为离散参数的可列马尔科夫链和离散参数的有限马尔可夫链。本文研究的内容中 涉及到的马尔可夫链主要是指离散参数马尔可夫链,以后简称为马氏链。 设弘。,门0 是定义在s = 仙2 ) 上的马氏链,v i ,j s ,咒 - 1 ,记 a o ,_ ) = p ( 邑= j i x 。= f ) ( 1 2 2 ) = ( 见( f ,助, ”1 ( 1 2 3 ) 则称见( i ,j f ) 为马氏链 x 。,玎q 的一步转移概率,简称转移概率;若只随着n 的 2 江苏大学硕士学位论文 变化而变化,则称 x 。,以o ) 为非齐次马氏链, ,万1 ) 为其一步转移概率矩阵 列,简称转移概率矩阵列;若v n l ,只恒为p ,则称弘。,玎田为齐次马氏链, p 为其一步转移概率矩阵,简称转移概率矩阵。 1 3m 重马尔可夫链的定义 定义1 3 1 【2 1 设 x 。,以o 是在状态空间s = 1 ,2 ,n ) 中取值的随机变量 序列 ,如果对任意整数n m及 魄es ,0 f 厅, 当 p ( x 。= ,x ,= z 1 ”,x 川= x n - i ) o 时,总有 尸( 以= l x o = x o ,五= 而,以一l = 一。) = 尸( 鼍= 毛i 以一册= 训,以一。= 吒一1 ) ( 1 3 1 ) 成立,则称 邑,n 0 ) 为m 重有限马氏链若条件( 1 3 1 ) 与胛无关,则称 邑,咒o ) 为m 重有限齐次马氏链;反之称 以,n o ) 为m 重有限非齐次马氏链 记 q ( i o ,6 9 m 一,) = 尸( k = f o ,五= ,以一。= 一,) , 岛( 巾,乙) = p ( 咒= ,l 咒一。= ,以一,= 乙) , ( 1 3 2 ) 称g ( f 0 ,毛,乙一。) 为m 维初始分布,见( i ,) 为聊阶转移概率;称 = ( 岛( i ,乙) ) 为m 阶转移矩阵这时易知其联合分布 p ( 托= ,五= x l ,以= ) = q ( x o ,西,x m 1 ) i 兀仇( 稚i 碗一。,x k - 1 ) ( 1 3 3 ) 戽= 坍 3 江苏大学硕士学位论文 第二章预备知识 在给出本文的主要内容之前,我们先给出一些预备知识。本章节中给出了隐 马尔可夫模型的背景知识,隐马尔可夫模型的定义,隐马尔可夫模型的等价定义 及其性质,同时给出了后几章内容中涉及到的相关定义与引理。 2 1 隐马尔可夫模型简介 2 1 1 隐马尔可夫模型的特点 马尔可夫过程是一类具有马尔可夫性的随机过程。其特点是,当过程在时刻 t 。所处的状态已知,则过程在t 。以后所处状态与过程在t 。以前所处状态无关,这 个特性叫无后效性,也叫做马尔可夫性。通俗地说,就是“已知现在,将来和过 去无关”。若马尔可夫过程弘( f ) ,t z 的状态空间s 为尺中的可列集,则称 x ( f ) ,t 丁,为马尔可夫链。若t 为可列离散集,则称弘( f ) ,t r ) 为离散参数马 尔可夫链;若z 为连续的,则称 x ( f ) ,t 丁) 为连续参数马尔可夫链。 自1 9 0 7 年苏联数学家a a m a p k o b 引出马尔可夫链概念以来,人们对马尔可 夫链的基础及应用的研究盛久不衰。随后由c m u 的b a k e r 和m m 的j e l i n e k 等 人将其应用到语音识别当中,后来在2 0 世纪8 0 年代中期,b e l l 试验室的r a b i n e r 等人对隐马尔可夫模型也进行了深入地研究。隐马尔可夫模型是马尔可夫链的拓 展,与马尔可夫链不同的是,客观存在观测到的信号不是模型状态的本身,而是 状态的概率函数。真正的模型的状态变迁我们是看不到的。我们只能看到每个时 刻状态所发射的观测信号,通过这些观测的信号,去推断内在的状态的变迁。这 也正是模型名称中“隐 字的含义。 4 江苏大学硕士学位论文 q 马尔可夫硅 曹马尔可夫覆型 隐马尔可夫模型的特点是马尔可夫链 z ,刀o ) 是隐藏的,称为状态链,它 不能被直接观察到,而能观察到的是戤,刀o ) 链,称为观测链,事实上,观测 链戗,刀o ) 概率上是依赖于状态链讧。,玎o ) 的,而且 y :1 ) 在给定 x 。,k ,1 ) 的 情况下的条件概率只与弘。) 有关。 从信息论角度看,马氏链式有记忆信源的普通模型,无记忆不变信道是最简 单的通信信道( 信道其实就是一族转移概率) 。马氏链与无记忆( 不变) 信道的 组合就组成了一类比马氏信源复杂的过程,即隐马尔可夫模型。也就是说,在信 息论中隐马尔可夫模型可看作是通过离散时间无记忆( 不变) 信道观察到的离散 时间( 齐次) 马氏链的概率函数。 记齐次马氏链忸。,z 0 ) 的初始分布为( 们,转移矩阵为a ,状态链 留。,刀o ) 到观测链敝,甩o ) 的转移矩阵为曰。当无记忆信道是不变的,且状态 链阢,刀o ) 是齐次的时,隐马尔可夫模型可由参数( 厂( 叭,a ,曰) 来表示。对于具 体唯一平稳分布的平稳马氏链来说,隐马尔可夫模型可由似,b ) 来表示。隐马尔 可夫模型的基本假定是:参数向量厂( 0 1 ,参数矩阵a 与曰都是未知的,将它们合 记为参数组旯竺( ( 们,a ,b ) 。三元参数组( 厂( 们,a ,召) 完全确定了状态链与观测链的 联合统计规律。所以,我们通常用力表示一个隐马尔可夫模型,并称之为隐马尔 可夫模型名。值得注意的是:这里讲的隐马尔可夫模型基本假定是状态链是时齐 的马尔可夫链,而且状态到观测的转移也是时齐的。但是在实际应用中经常遇到 状态链是非齐次的情形,如在动态的图像处理吲、气候的预测等均需要建立非齐 次隐马尔可夫模型来研究。本文研究的重点是隐非齐次马尔可夫模型的混合性。 5 o 占 江苏大学硕士学位论文 2 1 2 隐马尔可夫模型理论的发展 自从1 9 6 6 年b a u m 和p e t r i e 3 1 提出了隐马尔可夫模型可作为马氏链的概率 函数以后,人们对隐马尔可夫模型的研究就没有间断过。至1 9 6 9 年,b a u m 和 p e t r i e 一同研究了平稳遍历有限状态有限字母集的隐马尔可夫模型的统计性 质,给出隐马尔可夫模型的相对熵密度的几乎必然收敛性;同时证明了m l 参数 估计的相容性和渐近正态性。1 9 7 0 年b a u m ,p e t r i e ,s o u l e s 和w e i s sh 1 5 1 给出 了计算一般隐马尔可夫模型的观测链的某状态的条件概率的向前向后递归公式, 并且应用该递归公式给出了一般隐马尔可夫模型的参数极大似然估计的有效计 算机迭代程序,而d e m p s t e r ,l a i r d 和r u b i n 叫又将该计算机迭代程序用于隐马 尔可夫模型的最大期望( e m ) 演算法上。其实c h a n g 和h a n c o c k 7 1 在研究符号互 扰信道的最优译码中早已给出了类似的向前向后递归公式。随后 l e r o u x 【引,f i n e s s o 引,l eg l a n d ,m e v e l0 0 l 及d o u c ,m a t i a s 1 1 1 研究了隐马尔可夫模 型的相对熵密度的遍历理论,并且l eg l a n d ,m e v e l 【1 0 1 及d o u c ,m a t i a s 1 1 1 也研究 了隐马尔可夫模型的指数遍历性和几何遍历性,使得隐马尔可夫模型的理论日趋 完善。 隐马尔可夫模型作为重要的研究工具,近年来在弱相依变量的建模,发音过 程、神经生理学、生物遗传等问题的研究上得到了广泛应用。另外在工程学中, 统计学和计量经济学中经常会碰到的许多随机过程也与隐马尔可夫模型有关。隐 马尔可夫模型的观察链不需要时统计上独立的。如自回归过程在每个当时时刻的 动态都只依赖于当前时刻马氏链的状态。当自回归系数是零时,开关自回归过程 就沦落为隐马尔可夫模型。在控制论中,另一种与之相关的马氏已调泊松过程, 这种泊松过程的速率是由不能观测到的连续时间马氏链所控制的。一个马氏已调 泊松过程可以被看作为马氏更新过程或是隐马尔可夫模型 1 2 1 。除此之外在纯理 论上,l e r o u x 1 3 1 给出了隐马尔可夫模型的大数定律,m a x w a l 【1 4 1 与b i c k e l 等人 1 1 5 】 【1 6 1 给出了隐马尔可夫模型在中心极限定理方面的一些性质。 6 江苏大学硕士学位论文 2 1 3 在应用中研究隐马尔可夫模型的主要方向 在应用中研究隐马尔可夫模型主要有如下三个方向【1 7 】: ( 1 ) 从一段观测序列瓴,0 七刀) 及已知模型名= ( ,a ,b ) 出发,估计x 。的 最佳值,称为解码问题。这是状态估计问题。可用于推知内在的状态的变迁。在 实际应用的领域中,我们往往只能观测到外在的信号,本方向是要利用算法使我 们由外在的观测到的信号计算出内在的状态变迁序列。隐马尔可夫模型也正是在 这一点上的功能而被广泛应用于文本信息抽取领域。 ( 2 ) 从一段观测序列慨,0 k n ) 出发,估计模型参数组五= ( ,a ,b ) ,称 为学习问题。这是参数估计问题。这是三个方向中最困难的一个,目l j 尚无解决 这个问题的解析方法。实际上,给定任何有限观测序列作为训练数据,没有一种 最佳方法能估计模型参数,但是可以利用迭代方法或利用梯度技术来选定名,使 观测序列亿,k 胛 概率在模型五达到局部最大。 ( 3 ) 对于一个特定的观测链傲,0 k n ,已知它可能是由已经学习好的若 干模型之一所得的观测,要决定此观测究竟是得自其中哪一个模型,这称为识别 问题。就是分类问题。常常用来在多个隐马尔可夫模型中选优。选择的标准是选 取产生观测序列傲,0 k 刀) 概率最大的模型。这种技术在语音识别领域应用很 多,人们将声音的信号看作观测序列,通过计算来选择声音信号所对应的字或词。 实际问题中,这三个问题有时并不完全能分开,有时也并不需要解全三个问 题。例如,在语音识别或手写体汉字或数字的脱机识别中,我们只需要要作( 2 ) 与( 3 ) ,这相当于将一个“标准的 语音音素或一个“标准的”手写体汉字“学 习成 一个隐马尔可夫模型相对应起来,以便把该模型作为这个音素或手写字的 代表模板,这是学习相位;而在进一步用这些模板中的最合适者,作为对于一个 需要识别的音素或手写字的分类归属,这是运转相位。至于归属哪个模板最合适, 就要用合理的距离,或准距离,在此意义下的优化。 值得注意的是在应用中,仅用上述隐马尔可夫模型会有很大的局限性,因此 可分别将x 。,k 推广,比如: ( 1 ) 石。也可推广为取值于平面有限格点的马尔可夫场,而k 与它的关系如 7 江苏大学硕士学位论文 上述,这就定义了一隐马尔可夫场。 ( 2 ) 一般地,匕还可以是连续型随机变量。如果记在x 。= x 的条件下,k 的条件分布密度为厂,则名= ( 厂( 叭,a ,六) 也称为一个( 连续的) 隐马尔可夫模型。 这时厂常是分布类型已知而带来未知参数的密度。状态是连续的隐马尔可夫模型 至今还未见有人直接使用。事实上,在实际计算中,只要将,离散化为直方图, 则它就纳入了有限隐马尔可夫模型的框架。 2 1 4 隐马尔可夫模型的优点 隐马尔可夫模型建模具有如下优点1 7 】: ( 1 ) 隐马尔可夫模型是一种简单的数学模型。它的包容性很大,内涵性很 广,在应用中的弹性相当大,可以很好地利用我们对于被建模的对象所了解的先 验知识,因而有很广的适应性。 ( 2 ) 隐马尔可夫模型是一种不完全数据的统计模型,它之所以被广泛采用, 在于这种模型既能反映对象的随机性,又能反映对象的潜在结构,便于利用对象 的结构与局部联系性质等方面的知识,以及对研究对象的直观的与先验的了解。 ( 3 ) 隐马尔可夫模型是很少的几个既能从物理模型出发,又与数据拟合直 接联系的算法之一。 ( 4 ) 隐马尔可夫模型虽然也具有某些黑箱的特点,但是与纯黑箱操作的人 工神经网络等算法相比,有明显的的优点。它的参数常常有较为实质的含义,而 线性模型、时间序列模型中的参数一般只是作为被拟合了的参数而出现的,缺少 较为真实含义。 ( 5 ) 隐马尔可夫模型有快速而有效的学习方法。 以上诸点使隐马尔可夫模型成为随机建模与拟合基石,在应用中有其普适性。 2 1 5 隐马尔可夫模型的实现 在具体应用隐马尔可夫模型建模时,首先要先设定马尔可夫链的状态集及其 规模,即总状态数l ,这有相当大的弹性,然后,确定相应的观测过程。为了使 得观测链与隐马尔可夫链之间有隐马尔可夫关系,常常需要对实际提供的观测链 8 江苏大学硕士学位论文 加以改造。例如,一个脱机手写体汉字是一张黑白像素图( 一个取值0 或者1 矩阵) ,它和刻画笔道的a m a r k o v 场之间的依赖关系并不能满足隐马尔可夫关 系的要求。需要对它进行预加工,也就要先进行“特征提取 。以尽量简化使得 隐马尔可夫关系能成立。 在确定了模型规模以后,对于隐马尔可夫模型处理,又可分为两个不同的相 位:学习相位与运转相位。学习相位是由给定的观测过和的一组样本出发,去估 计隐马尔夫模型的参数力= ( 从a ,b ) ,从而完全确定模型;而运转相位则是用学 习相位所确定的模型参数,对给定的某个观测过程的样本,来估计相应隐马尔可 夫模型的状态,或计算出它在各个隐马尔可夫模型下出现的概率。 语音识别各脱机手写汉字最终需要知道的是,给定的语音或脱机手写体汉字 样本应出自哪个模型,这是一个识别过程,通常可以按照b a y e s 方法去决定模型, 去决定模型,即选取使得给样本出现的概率最大的模型作为它的分类归属,这就 是识别的结果。而在d n a 碱基序列的排序问题中,考虑的方法则与之不同。在 在d n a 碱基序列的排序问题中,需要知道的是如何排列,也就是需要知道给定 的某个观测过程的样本所对应的隐马尔可夫链的状态。 在学习相位中,面临的是一个不完全数据的参数估计问题。除了运用算法以 外,还可以进行交错估计。即可先设置一组初值参数,由此出发配全观测列按 b a y e s 方法去估计马尔可夫链的状态列,再用此状态列配合观测列用最大似然估 计去重新估计模型参数,交替地不断重复此两个步骤,以达到比较稳定的结果。 也可以从设置马尔可夫链的一个状态列作为开始,去估计参数组,再由此参数组 对应的模型去估计状态,如此交替进行。 2 2 隐马尔可夫模型的定义 定义2 2 1h 明设s = l ,2 ,n ) ,t - 1 ,2 ,m ) 为两个有限集, 疋,n 0 ) 与 k ,n o ) 是概率空间 q ,f ,p 上分别取值于s 与t 的随机变量序列假设 以,刀0 ) 是时齐马氏链,它不能被直接观测到,称为状态链,而能观测到的是 匕,船0 ) ,称为观测链,它们合起来满足如下隐马尔可夫条件m m 条件) : 9 江苏大学硕士学位论文 尸( k + 。= + 。i 匕= 厶,瓦= 9 m9 r o = l o ,x o = o ) = p ( k + ,= + 。l 以= 屯) ( 2 2 1 ) 尸( k = 乇i 以= ,艺一。= 乇一,x 。一。= 一,k = l o ,x o = f o ) = 尸( 匕= 乙i 以= ) ( 2 2 2 ) 如果状态到观测的转移也是时齐的则称 ( 以,匕) ,n o ) 为有限齐次隐马尔可夫 模型,这里“隐 的含义是说状态链是隐藏起来的令 尸= ( p ( f ,州,i ,jes , ( 2 2 3 ) 与 8 = ( b o ,啪,歹s ,l e t , ( 2 2 4 ) 分别表示齐次马氏链 以,n o ) 的转移矩阵,状态链到观测链的转移矩阵。其中 p ( i ,) = 尸( 瓦= 歹i e 一。= f ) ,n l ,b ( j ,) = p ( k = ,l 曩= ) ,n 0 。 接下来我们类似地给出了隐非齐次马尔可夫模型的定义: 定义2 2 2 设s = 1 ,2 ,n ) ,t = 1 ,2 ,m ) 为两个有限集, 以,力0 ) 与 匕,n o ) 是概率空间( q ,f ,尸) 上取值于s 与z 的随机变量序列假设 k ,n o ) 是非齐次马氏链,它不能被直接观测到,称为状态链,而能观测到的是 匕,刀o ) , 称为观测链,它们合起来满足h m m 条件。记 只= ( 见( f ,) ) f ,j e s ,l 1 , ( 2 2 5 ) 与 或= ( 屯( ,) ) 枷,j e s ,z z ,聆o , ( 2 2 6 ) 分别表示非齐次马氏链 以,z o ) 的转移矩阵,状态链到观测链的转移矩阵其 中见( f ,) = 尸( 以= _ ,i 以一。= f ) ,吒( 工,) = j p ( 艺= l r f 鼍= ) ,则称 ( 以,匕) ,疗o ) 为有限隐非齐次马尔可夫模型若s ,t 均为可列集,则称 ( 以,匕) ,n o ) 为可列隐 非齐次马尔可夫模型。 注( 1 ) 在上述定义中 k ,z 0 ) 为马氏链的条件其实是不必要的,下面给出 证明。 定理2 2 1 设 ( 瓦,) ,n o ) 是如定义2 2 2 所定义的隐马尔可夫模型,则 1 0 江苏大学硕士学位论文 以,胛0 ) 是马氏链 证明由( 2 2 1 ) 式有 尸( 瓦+ 。= + 。,以= i n ,匕= 厶,x o = i o , k = l o ) = 尸( 以卅= + 。i 托- - - - i n ) p ( x o = ,艺= 乙,x o = i o ,k - - 1 0 ) , 上式两边对毛,2 l ,厶求和有 故有 尸( 瓦+ 。= i n + 1 ) e = ,e 一。= 屯小,:c o = f 0 ) = 尸( 以+ 。= + ,l 以= ) 尸( 疋= ,以一。= 书,x o = i d ) , 尸( 以+ 。= + 。i 以= ,以一,- - - = i n _ l g ) 五= 乇) = p ( 以+ 。= + “以= ) , 因此 咒,刀0 ) 是马氏链 ( 2 ) 因为由以上定义可推导出 以,刀0 ) 是马氏链,故隐马尔可夫模型的 概念是一般马氏链概念的推广。 ( 3 ) 在信息论中隐马尔可夫模型可以看作是马氏链和无记忆信道的组合, 即是通过无记忆信道观察到的马氏链的概率函数。特殊地,齐次隐马尔可夫模型 是齐次马氏链和无记忆不变信道的组合。 2 3 隐马尔可夫模型的等价定义 下面给出隐马尔可夫模型的等价定义:( 证明参见 1 9 1 ) 定理2 3 1 设 ,胛o ) 与也,聆o ) 是概率空间 q ,f ,竹上分别取值于可 列集s 与z 的随机变量序列,则下列命题相互等价: ( i ) 阢,l ,刀o ) 是如2 2 2 定义的隐马尔可夫模型 ( i i ) 对任意s ,z ,0 f 万,有 p ( :c o = i o , r o = t o ,以= 厶,e = 厶) = p ( 凰= 毛) p = t oi 甄= 乇) 兀p ( k = & i 鼍= 攻) p ( 五= & i 以一。= 磊一。) ( 2 3 1 ) k = l 江苏大学硕士学位论文 ( i i i ) 对任意s ,et ,0 f n ,有 e ( r o = t o ,x = ,k - - t i x o = o ,五= ,墨= 厶) 2 4 隐马尔可夫模型的性质 ( 2 3 2 ) 由定义易知隐马尔可夫模型 ( 以,k ) ,胛o ) 还具有如下性质:( 性质2 4 1 - 性 质2 4 5 的证明参见【1 9 】) 性质2 4 1 设 ( x 。,匕) ,n o ) 是隐马尔可夫模型,则 ( 咒,k ) ,刀o ) 为马氏链 性质2 4 2 设 ( x 。,k ) ,”o 是隐马尔可夫模型贝o ( k 小艺) ,刀o ) 为马氏链 性质2 4 3 设伍。,l ,n o ) 是隐马尔可夫模型,则对 v o j o s n s h + l s n + m ,0 t o 乙 t n + l o ) 是平稳的。 ( 2 4 6 ) 江苏大学硕士学位论文 2 5 相关定义与引理 定义2 5 1 设 以,n 1 ) 是一r v 序列,f 是 x r ,一,x s ) 产生的仃域, 1 ,s 0 0 ,如果存在正整数,对于n - n ,m 1 ,a e l m , b 碌。,有 ! i mp ( a b ) 一? ( a ) p ( 8 ) l - - o ( 2 5 1 ) 则称该序列为混合的随机序列。 定义2 5 2 设 以,? 1 ) 是一r v 序列,f 是 x r ,x s ) 产生的仃域, 1 ,s 0 0 ,如果存在正整数n ,对于n - n ,m 1 ,a f l m , n 碌。,有 i p ( 么b ) 一p ( 4 ) p ( b ) i 口( ,z ) ( 2 5 2 ) 成立,其中口( 玎) 与a ,占独立,且满足。l i m 口( 刀) = o ,则称该序列为口一混合的随 机序列。这样,x 。和x 。+ 。在刀足够大时相互独立。 定义2 5 3 设 ,聆1 ) 是一r v 序列,f 是 e ,x s 产生的仃域, 1 ,s 0 0 ,如果存在正整数n ,对于n ,m 1 ,a f 1 mb 躁。,有 骝i p ( b i 彳) 一尸( b ) l 1 ) 简记为p ,尸”彤简记为p 设q 是一随机矩阵,若q 的各行均相同,则称q 为常数矩阵 定义2 5 6 称非齐次马尔可夫链 ) 是强遍历的,若存在常数矩阵q ,使 得对一切m 0 有 l i m ip佃朋竹lq0=0k-。o 一 ( 2 5 7 ) 定义2 5 7 设 以,厅0 ) 为定义在s = 1 ,2 ,n ) 上的m 重非齐次马尔可夫 链,记 。p ( 巾,乙) = p ( 以卅。= 歹l 以一历= i i ,咒一。= 乙) , ( 2 5 8 ) 江苏大学硕士学位论文 则称。p ( 。( l ,) 为其聊重f 步转移概率:若马氏链是齐次的,则其f 步转移概 率记为p ( ( l ,i m ) :特别地令 。p ( o ( i ,) = 毛;i 乏: , 3 c 中i e 群= 以,瓦小,以) ,x ”= ,以) ,艺- bi ”分别是群与x ” 的实现设 p = ( p ( ji ”) ) ,| s ,i ”s ” 是一m 蕈转移矩阵定义一m 维转移矩阵如下: 其中 歹= ( p ( 脚i , i m ,j m s m , p ( 歹”i z ”) = 三厶i f ”) 冀鲁“, ,= 1 ,朋一1 ; 称户为由m 重转移矩阵p 所确定的m 维转移矩阵 定义2 5 8 设 以,玎0 ) 为定义在s = 1 ,2 ,n 上的聊重非齐次马尔可夫 链, 。p ( o ( 歹l f ”) 如式( 2 5 8 ) 所定义,若对v 万所,j f s , i ”s 朋,极限 l ,i m 。p ( ,p ) 存在且它不依赖于f ”s m ,记为万( ) ,即有 l i m 。p f ) ( 巾”) = 万( n s ,i ”s ”, 则称 瓦,玎o ) 为强遍历的,也称为强遍历的 引理2 5 1 设 x 。,以1 ) 是如1 2 1 定义的齐次马氏链,对于任何正整数 m ,z 及非负整数刀,马氏链的转移概率满足下面方程: 仇( m + f ) ( = 以( f ,后慨+ 。,) ( 后,) ( 2 5 9 ) 称式( 2 5 9 ) 为切普曼一柯尔莫哥洛夫方程,简称为c - k 方程。 引理2 5 2 设弘。,冗畸是如1 2 1 定义的齐次马氏链,有平稳分布 万= 互 ,f s ,则该马氏链是平稳序列,即满足v f o 1 6 江苏大学硕士。学位论文 p ( = 五,以= ) = 尸( 置。+ ,= 而,“= 吒) 进一步可知如果该平稳马氏链。,n n 是遍历的,即l i m 谚= 万,则有 朋 - - - 1 0 0 。 l i m p ( x o = j f ,五= f ) = l i r a 乃孝1 ) - 覆乃 刀 。 引理2 5 3 t 2 1 设m 维转移矩阵户是由m 重转移矩阵p 所确定的如果乒是 遍历的,则p 也是遍历的,即设 f 脚s ” 是由尸所确定的m 维平稳分布,则有 擞州巾”) 2 p ( 胪毒。万( 一办 v i 朋s ”及j s 成立,其中 ( 巾”) = 矿( :1 2 ,乙,p ( ,n 引理2 5 4 1 2 1 设芦是由m 重转移矩阵p 所确定的m 维转移矩阵如果p 中 的元素均大于0 ,即 p = ( p ( 巾”) ) ,p ( ji ”) 0 ,v f 册”j s , 则f 是遍历的 引理2 。5 5 1 设 以,z o ) 是如定义1 2 1 所定义的所重非齐次马尔可夫链, 其状态空间为s = 1 ,2 ,) ,见( l ,) 和。p ( p ) 分别如( 1 3 2 ) 式和( 2 5 8 ) 式定义,设尸= ( p ( i f ”) ) 为另一所重转移矩阵,假设p 所确定的胁维转移矩阵歹 是遍历的如果对s ,i ”s ”, i r a p ( j l i ”) = p ( p ) ,则 咒,刀o ) 是强遍历 的即对s ,i ”s m , n - m ,存在万( 歹) 使得;骢。p ( i f “) = 万( ) 1 7 江苏大学硕

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论