条件随机场CRF.ppt

上传人：柠*** IP属地：江西上传时间：2020-03-20 格式：PPT 页数：87 大小：1.19MB 积分：12 举报 版权申诉

免费预览已结束，剩余82页可下载查看

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

条件随机场CRF 北京10月机器学习班邹博2014年12月14日 2 87 思考给定文本标注词性他估算当前的赤字总额在9月份仅仅降低到18亿 NN NNS NNP NNPS PRP DT JJ分别代表普通名词单数形式普通名词复数形式专有名词单数形式专有名词复数形式代词限定词形容词 3 87 复习 MarkovBlanket 一个结点的MarkovBlanket是一个集合在这个集合中的结点都给定的条件下该结点条件独立于其他所有结点即一个结点的MarkovBlanket是它的parents children以及spouses 孩子的其他parent 4 87 MarkovBlanket 补充知识 SerumCalcium 血清钙浓度高于2 75mmo1 L即为高钙血症许多恶性肿瘤可并发高钙血症以乳腺癌骨肿瘤肺癌胃癌卵巢癌多发性骨髓瘤急性淋巴细胞白血病等较为多见其中乳腺癌约1 3可发生高钙血症毒素 5 87 图像模型考察X8的马尔科夫毯 Markovblanket 6 87 无向图模型有向图模型又称作贝叶斯网络 DirectedGraphicalModels DGM BayesianNetwork 在有些情况下强制对某些结点之间的边增加方向是不合适的使用没有方向的无向边形成了无向图模型 UndirectedGraphicalModel UGM 又被称为马尔科夫随机场或者马尔科夫网络 MarkovRandomField MRForMarkovnetwork 7 87 条件随机场设X X1 X2 Xn 和Y Y1 Y2 Ym 都是联合随机变量若随机变量Y构成一个无向图G V E 表示的马尔科夫随机场 MRF 则条件概率分布P Y X 称为条件随机场 ConditionalRandomField CRF 注大量文献将MRF和CRF混用包括经典著作后面将考察为何会有该混用 8 87 DGM转换成UGM 9 87 DGM转换成UGM 10 87 条件独立的破坏靠考察是否有则计算U的祖先图 ancestralgraph 11 87 MRF的性质成对马尔科夫性parewiseMarkovproperty局部马尔科夫性localMarkovproperty全局马尔科夫性globalMarkovproperty表述说明随机变量Y Y1 Y2 Ym 构成无向图G V E 结点v对应的随机变量是Yv 12 87 考察结点间的独立性 13 87 成对马尔科夫性设u和v是无向图G中任意两个没有边直接连接的结点 G中其他结点的集合记做O 则在给定随机变量Yo的条件下随机变量Yu和Yv条件独立即 P Yu Yv Yo P Yu Yo P Yv Yo 14 87 局部马尔科夫性设v是无向图G中任意一个结点 W是与v有边相连的所有结点 G中其他结点记做O 则在给定随机变量Yw的条件下随机变量Yv和Yo条件独立即 P Yv Yo Yw P Yv Yw P Yo Yw 15 87 全局马尔科夫性设结点集合A B是在无向图G中被结点集合C分开的任意结点集合则在给定随机变量YC的条件下随机变量YA和YB条件独立即 P YA YB YC P YA YC P YB YC 16 87 三个性质的等价性根据全局马尔科夫性能够得到局部马尔科夫性根据局部马尔科夫性能够得到成对马尔科夫性根据成对马尔科夫性能够得到全局马尔科夫性可以反向思考满足这三个性质或其一的无向图称为概率无向图模型 17 87 复习隐马尔科夫模型 18 87 HMM的确定 HMM由初始概率分布状态转移概率分布A以及观测概率分布B确定 19 87 HMM的参数 Q是所有可能的状态的集合N是可能的状态数V是所有可能的观测的集合M是可能的观测数 20 87 HMM的参数 I是长度为T的状态序列 O是对应的观测序列A是状态转移概率矩阵其中aij是在时刻t处于状态qi的条件下时刻t 1转移到状态qj的概率 21 87 HMM的参数 B是观测概率矩阵其中 bik是在时刻t处于状态qi的条件下生成观测vk的概率是初始状态概率向量其中 i是时刻t 1处于状态qi的概率 22 87 HMM的参数总结 HMM由初始概率分布状态转移概率分布A以及观测概率分布B确定和A决定状态序列 B决定观测序列因此 HMM可以用三元符号表示称为HMM的三要素 23 87 HMM的两个基本性质齐次假设观测独立性假设 24 87 HMM的3个基本问题概率计算问题给定模型和观测序列计算模型下观测序列O出现的概率P O 学习问题已知观测序列估计模型的参数使得在该模型下观测序列P O 最大预测问题即解码问题已知模型和观测序列求对给定观测序列条件概率P I O 最大的状态序列I 25 87 概率计算问题直接算法暴力算法前向算法后向算法这二者是理解HMM的算法重点 26 87 直接计算法按照概率公式列举所有可能的长度为T的状态序列求各个状态序列I与观测序列的联合概率P O I 然后对所有可能的状态序列求和从而得到P O 27 87 直接计算法状态序列的概率是对固定的状态序列I 观测序列O的概率是 28 87 直接计算法 O和I同时出现的联合概率是对所有可能的状态序列I求和得到观测序列O的概率P O 29 87 直接计算法对于最终式分析加和符号中有2T个因子 I的遍历个数为NT 因此时间复杂度为O TNT 过高 30 87 前向算法定义给定定义到时刻t部分观测序列为o1 o2 ot且状态为qi的概率为前向概率记做可以递推的求得前向概率 t i 及观测序列概率P O 31 87 前向算法初值递推对于t 1 2 T 1最终 32 87 后向算法定义给定定义到时刻t状态为qi的前提下从t 1到T的部分观测序列为ot 1 ot 2 oT的概率为后向概率记做可以递推的求得后向概率 t i 及观测序列概率P O 33 87 后向算法初值递推对于t T 1 T 2 1最终 34 87 后向算法的说明为了计算在时刻t状态为qi条件下时刻t 1之后的观测序列为ot 1 ot 2 oT的后向概率 t i 只需要考虑在时刻t 1所有可能的N个状态qj的转移概率 aij项以及在此状态下的观测ot 1的观测概率 bjot 1 项然后考虑状态qj之后的观测序列的后向概率 t 1 j 35 87 前向后向概率的关系根据定义证明下列等式 36 87 单个状态的概率求给定模型和观测O 在时刻t处于状态qi的概率记 37 87 单个状态的概率根据前向后向概率的定义 38 87 的意义在每个时刻t选择在该时刻最有可能出现的状态it 从而得到一个状态序列I i1 i2 iT 将它作为预测的结果给定模型和观测序列时刻t处于状态qi的概率为 39 87 两个状态的联合概率求给定模型和观测O 在时刻t处于状态qi并且时刻t 1处于状态qj的概率 40 87 两个状态的联合概率根据前向后向概率的定义 41 87 期望在观测O下状态i出现的期望在观测O下状态i转移到状态j的期望 42 87 学习算法若训练数据包括观测序列和状态序列则HMM的学习非常简单是监督性学习若训练数据只有观测序列则HMM的学习需要使用EM算法是非监督学习 43 87 再次分析二项分布的参数估计极大似然估计简单的例子10次抛硬币的结果是正正反正正正反反正正假设p是每次抛硬币结果为正的概率则得到这样的实验结果的概率是 44 87 极大似然估计MLE 目标函数最优解是 p 0 7即使用样本的均值可以作为全体的均值估计一般形式 45 87 直接推广上述结论假设已给定训练数据包含S个长度相同的观测序列和对应的状态序列 O1 I1 O2 I2 Os Is 那么可以直接利用极大似然估计的上述结论给出HMM的参数估计 46 87 监督学习方法转移概率aij的估计设样本中时刻t处于状态i时刻t 1转移到状态j的频数为Aij 则观测概率bik的估计设样本中状态i并观测为k的频数为Bik 则初始状态概率 i的估计为S个样本中初始状态为qi的概率 47 87 Baum Welch算法若训练数据只有观测序列则HMM的学习需要使用EM算法是非监督学习 48 87 Baum Welch算法所有观测数据写成O o1 o2 oT 所有隐数据写成I i1 i2 iT 完全数据是 O I o1 o2 oT i1 i2 iT 完全数据的对数似然函数是lnP O I 假设是HMM参数的当前估计值为待求的参数 49 87 EM过程根据函数可写成 50 87 极大化极大化Q 求的参数A B 由于该三个参数分别位于三个项中可分别极大化注意到 i满足加和为1 利用拉格朗日乘子法得到 51 87 初始状态概率对上式相对于 i求偏导得到对i求和得到从而得到初始状态概率 52 87 转移概率和观测概率第二项可写成仍然使用拉格朗日乘子法得到同理得到 53 87 预测算法近似算法Viterbi算法 54 87 预测的近似算法在每个时刻t选择在该时刻最有可能出现的状态it 从而得到一个状态序列I i1 i2 iT 将它作为预测的结果给定模型和观测序列时刻t处于状态qi的概率为选择概率最大的i作为最有可能的状态会出现此状态在实际中可能不会发生的情况 55 87 Viterbi算法 Viterbi算法实际是用动态规划解HMM预测问题用DP求概率最大的路径最优路径这是一条路径对应一个状态序列定义变量 i t 在时刻t状态为i的所有路径中概率的最大值 56 87 Viterbi算法定义递推终止 57 87 团无向图G中任何两个结点均有边连接的子集称作G的团 Clique 若C是G的一个团并且不能再加入任何一个G的结点使其称为团则C称作G的最大团 MaximalClique 58 87 下图的最大团是什么 59 87 Hammersley Clifford定理 UGM的联合分布可以表示成最大团上的随机变量的函数的乘积的形式这个操作叫做UGM的因子分解 Factorization 60 87 Hammersley Clifford定理 UGM的联合概率分布P Y 可以表示成如下形式其中 C是G的最大团是C上定义的严格正函数乘积是在UGM所有的最大团上进行的被称作势函数 PotentialFunction 61 87 线性链条件随机场设X X1 X2 Xn 和Y Y1 Y2 Ym 都是联合随机变量若随机变量Y构成一个无向图G V E 表示的马尔科夫随机场 MRF 则条件概率分布P Y X 称为条件随机场 ConditionalRandomField CRF 即其中表示与结点v相连的所有结点w一种重要而特殊的CRF是线性链条件随机场 LinearChainConditionalRandomField 可用于标注等问题这时条件概率P Y X 中 Y表示标记序列或称状态序列 X是需要标注的观测序列 62 87 线性链条件随机场线性链条件随机场的无向图模型 63 87 线性链条件随机场的定义设X X1 X2 Xn Y Y1 Y2 Yn 均为线性链表示的随机变量序列若在给定随机变量序列X的条件下随机变量序列Y的条件概率分布P Y X 构成条件随机场即满足马尔科夫性则称P Y X 为线性链条件随机场在标注问题中 X表示观测序列 Y表述对应的输出标记序列或称状态序列 64 87 线性链条件随机场的参数化形式设P Y X 为线性链条件随机场则在随机变量X取值为x的条件下随机变量Y取值为y的条件概率有以下形式其中上式中 tk和sl是特征函数 k l是对应的权值 Z x 是规范化因子 65 87 参数说明 tk是定义在边上的特征函数称为转移特征依赖于当前和前一个位置 sl是定义在结点上的特征函数称为状态特征依赖于当前位置 tk和sl都依赖于位置是局部特征函数通常 tk和sl取值为1或者0 满足特征条件时取1 否则取0 CRF完全有特征函数tk sl和对应的权值 k l确定线性链条件随机场模型属于对数线性模型 66 87 例设有一标注问题输入观测序列为X X1 X2 X3 输出标记序列为Y Y1 Y2 Y3 Y1 Y2 Y3的取值范围为 1 2 67 87 例 t2 t2 y1 1 y2 1 x 2 2 0 5t3 t3 y2 2 y3 1 x 3 3 1t4 t4 y1 2 y2 1 x 2 4 1t5 t5 y2 2 y3 2 x 3 5 0 2s1 s1 y1 1 x 1 l 1s2 s2 y2 2 x i 2 0 5s3 s3 y1 1 x i 3 0 8s4 s4 y3 2 x i 4 0 5 68 87 CRF的简化形式为方便起见将转移特征和状态特征及其权值同统一的符号表示设有K1个转移特征 K2个状态特征 K K1 K2 则在各个位置求和 69 87 CRF的简化形式用w表示统一的权值则CRF可表示成 70 87 CRF的简化形式以F y x 表示全局特征向量则CRF可以写成向量内积的形式 71 87 CRF的矩阵形式引入特殊的起点终点标记 y0 start yn 1 stop定义m阶矩阵 m是标记yi取值的个数 72 87 CRF的矩阵形式条件概率P y x 为其中 Z x 是归一化因子 73 87 CRF的两个问题 CRF的概率计算问题前向后向算法CRF的预测算法Viterbi算法 74 87 CRF的概率计算问题给定条件随机场P Y X 输入序列x和输出序列y 计算条件概率P Yi yi x P Yi yi Yi yi x 前向后向算法 75 87 前向向量 i yi x 在位置i的标记是yi并且到位置i的前部分标记序列的非规范化概率 yi可取的值有m个 i yi x 是m维列向量 76 87 前向向量初始化 77 87 后向向量 i yi x 在位置i的标记是yi并且从i 1到n的后部分标记序列的非规范化概率 yi可取的值有m个 i yi x 是m维列向量 78 87 后向向量初始化 79 87 归一化因子归一化因子Z x 80 87 概率计算条

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

条件随机场CRF.ppt

文档简介

温馨提示

最新文档

评论

条件随机场CRF.ppt

文档简介

温馨提示

最新文档

评论

相关文档