版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模 式 识 别,第3章 概率密度函数的估计,为什么需要概率密度函数的估计,贝叶斯决策需要的已知信息 贝叶斯分类器中只要知道先验概率,条件概率P(i),P(x|i),就可以设计分类器了 存在问题: 未知概率密度函数 未知类条件概率密度 未知先验概率密度 有一些训练数据,需要研究的问题,研究如何用已知训练样本的信息去估计P(i),P(x|i) 分类器设计的步骤: 第一步: 利用样本集估计概率密度函数 第二步: 利用概率密度函数进行分类决策,学习,训练,分类,贝叶斯决策理论设计分类器步骤,概率密度函数估计中的三个问题,如何利用样本估计概率密度函数 估计量的性质如何 利用样本集估计错误率的方法,几种估
2、计类型,概率密度函数的形式是否已知 参数估计 非参数估计 训练样本的类别是否已知 非监督参数估计 非参数估计,几种估计类型,参数估计与非参数估计 参数估计 已知研究的问题具有某种数学模型, 如正态分布,二项分布, 再用已知类别的学习 样本估计里面的参数。 非参数估计 未知数学模型,用已知类别的学习样本直接估计数学模型。,几种估计类型,监督学习与无监督学习 监督学习 在已知类别样本指导下的学习和训练,参数估计和非参数估计都属于监督学习。 无监督学习 不知道样本类别,只知道样本的某些信息去估计,如:聚类分析。,几种估计类型,监督参数估计 非监督参数估计 非参数估计,统计模式识别,句法模式识别,参数
3、估计的基本概念,基本概念 统计量 参数空间 点估计 估计量 估计值 区间估计,给定样本集合:x1, x2, xN,f(x1, x2, xN),未知参数,的容许值组成的集合,计算估计值的统计量d(x1, x2, xN),取值范围的估计(d1, d2),参数估计的基本概念,两种主要的点估计方法 最大似然估计 贝叶斯估计,最大似然估计,最大似然估计的特点 通常,训练样本数目增加时具有很好的收敛性质 一般,比其它方法简单,例如比贝叶斯方法简单,最大似然估计,问题假定: 待估参数是确定的未知量 按类别把样本分成C类X1,X2,X3, XM,其中第i类的样本共N个,Xi = (X1,X2, XN)T ,并
4、且是独立从总体中抽取的 Xi中的样本不包含j(ij)的信息,所以可以对每一类样本独立进行处理。 第i类的条件概率的函数形式已知,根据以上假定,我们下边就可以只利用第i类学习样本来估计第i类的概率密度,其它类的概率密度由其它类的学习样本来估计。,最大似然估计,似然函数 属于i类的学习样本有N个样本,即: Xi=(x1 , x2 ,xN)T 采样到Xi样本的概率密度: p(Xi |i)= p(x1 , x2 ,xN |i),N个随机变量x1 , x2 ,xN的似然函数是N个随机变量的联合密度l(i)=p(Xi|i),这个i的函数l(i)就是似然函数,最大似然估计,p(Xi |i)和l(i)的区别
5、p(Xi |i)和l(i)形式上相似,但含义不相同 p(Xi |i)是Xi的函数,是概率密度函数l(i)是i的函数,不是概率密度函数,Gaussian分布,方差已知,均值未知,似然函数是均值的函数,样本越多,似然函数越尖锐,最大似然估计,最大似然估计的基本思想,求 i的最大似然估计就是把p(xi| i)看成 i的似然函数,求出使它最大时的 i值。,最大似然估计,最大似然估计的基本思想 学习样本独立从总体样本集中抽取的 取对数 :,N个学习样本出现概率的乘积,如何计算出使得似然函数l()取值最大的的估计值?,最大似然估计,最大似然估计的基本思想 对i求导,并令它为0:,最大似然估计,最大似然估计
6、的基本思想 前式的解不一定唯一, 只有取值最大的是最终的解。,最大似然估计,一维正态分布的参数估计 总体的分布形式: 有两个参数未知: 和,最大似然估计,一维正态分布的参数估计 有N个观测样本X= (x1,x2, xN)T 构造似然函数:,最大似然估计,一维正态分布的参数估计 最大似然估计量的方程为:,最大似然估计,一维正态分布的参数估计 最大似然估计量的方程为:,最大似然估计,一维正态分布的参数估计 最大似然估计量的方程为:,无偏估计,有偏估计,最大似然估计,例: 不规则硬币,正面概率u和背面概率1-u未知,且无先验知识。根据观测数据估计新的实验中出现正面还是背面。 有道理?,有道理?,最大
7、似然估计,最大似然估计的基本思想举例 实验室的研究生录取分数 不同实验室有个期望录取分数线 受到往年录取成绩的影响 假设只有两个真实取值:分数高vs分数低 某实验室去年都是”分数低” 同学A估计该实验室今年为分数高“ 同学B估计该实验室今年为分数低,哪一个更接近于最大似然估计方法?,贝叶斯估计,问题假定: 待估参数是待估计的参数,是随机变量 的概率分布概率已知 学习样本x = (x1,x2, xN)T ,独立同分布 根据学习样本估计参数,贝叶斯估计,贝叶斯决策 基于最小错误率的贝叶斯决策 基于最小风险的贝叶斯决策 在限定一类错误率条件下使另一类错误率为最小的两类别决策 最小最大决策,贝叶斯估计
8、,贝叶斯估计的基本思想 基于最小风险的贝叶斯决策 希望决策方法使得风险最小化 参数估计 希望的估计数值尽可能的准确 即: 希望风险最小化 需要构造一个衡量准确程度的函数,贝叶斯估计,风险 损失函数: (, ) 待估参数和学习样本x=(x1,x2,xN)T是随机变量 则,风险R为:,贝叶斯估计,风险 整理得,贝叶斯估计,贝叶斯估计,贝叶斯估计,平方误差损失函数时的估计算法 损失函数: (, )=(- )2 定理: 如果损失函数为二次函数,即 (, )=(- )2,则的贝叶斯估计量是在给定x时的条件期望,即,贝叶斯估计,步骤 确定的先验分布p(),。 用样本x=(x1, x2,. xN)T求出样本
9、的联合概率密度分布p(x| ),它是的函数。 利用贝叶斯公式,求的后验概率 利用定理求贝叶斯估计量,贝叶斯估计,一维正态分布的参数估计 总体的分布形式: 未知,但概率分布已知,贝叶斯估计,一维正态分布的参数估计 计算联合概率密度分布p(X| ) : 计算求的后验概率p(| X) :,贝叶斯估计,一维正态分布的参数估计 计算求的后验概率p(| X) :,利用待定系数法,即可求得两个参数的值,贝叶斯估计,一维正态分布的参数估计 利用定理求贝叶斯估计量: 计算求的后验概率p(| X) :,贝叶斯估计,贝叶斯学习,参数估计存在的问题 最大似然估计存在的问题 贝叶斯估计的优点:避免过学习,贝叶斯学习,贝
10、叶斯学习基本思想 已知: 样本X=(x1, x2,. xN)T 问题: 通过样本集推断总体分布p(x|X) 总体分布形式已知 问题转化为估计参数的估计问题,即: 然后再利用p( |X) 估计p(x|X),贝叶斯学习,贝叶斯学习基本思想,根据独立性假设,贝叶斯学习,例:一维随机变量x服从均匀分布 未知,但分布概率已知 给出一组观测值X=4,7,2,8,估计p(x|),贝叶斯学习,最大似然估计方法? 似然函数 的估计值 X的分布函数 贝叶斯学习的方法?,一组观测值X=4,7,2,8,取多少,lnl()最大?,最小能取多少?,贝叶斯学习,先观察随着N的增加,p(|X)的变化 如果没有观测值(N=0)
11、 , 则p(|X0)为: 如果观测到一个x数值, x 1=4,则p(|X1)为:,N=1,贝叶斯学习,先观察随着N的增加,p(|X)的变化 如果观测到2个x数值, x 2=7,则p(|X2)为:,N=2,贝叶斯学习,先观察随着N的增加,p(|X)的变化 如果观测到3个x数值, x 3=2,则p(|X3)为:,N=3,贝叶斯学习,先观察随着N的增加,p(|X)的变化 如果观测到4个x数值, x 4=8,则p(|X4)为:,N=4,贝叶斯学习,贝叶斯学习,最后,根据p(|X)和下式得到p(x|X),最大似然估计,正态分布的监督参数估计,监督参数估计 监督 不同类别的样本有不同的概率密度函数 用每个
12、类别自己的样本估计该类别的概率密度函数 每个样本属于那个类别是已知的 参数估计 概率密度函数的总体分布形式已知 某个或某些类别的参数未知,非监督参数估计,非监督参数估计 非监督 不同类别的样本有不同的概率密度函数 用每个类别自己的样本估计该类别的概率密度函数 每个样本属于那个类别是未知的 参数估计 概率密度函数的总体分布形式已知 某个或某些类别的参数未知,非监督参数估计,问题假设 样本来自类别数为c的各类中,但不知道每个样本究竟来自哪个类别 每类的先验概率P(wj ),j=1,,c已知; 类条件概率密度的形式已知; 未知的仅是c个参数向量= 1 , 2的值,非监督参数估计,例: 两类别正态分布
13、情况下的非监督参数估计问题 已知: c=2 两个类别样本概率密度函数的形式是正态分布 即c1类的概率密度函数: 即c2类的概率密度函数:,非监督参数估计,例: 两类别正态分布情况下的非监督参数估计问题 已知: 1和2已知 非监督参数估计问题: 利用训练样本估计1和2 。 难点:训练样本的类别未知,非监督参数估计,估计方法 最大似然估计 期望最大化(EM) 贝叶斯估计斯学习,期望最大化(EM),解决问题 带缺失数据或者隐藏参数的参数估计问题 基本思想 样本数据分为标记样本和未标记样本 按照统计的观点,对于每一个样本的产生,其背后都有一个模型,即样本生成模型。 样本生成模型的参数先由标记样本确定,
14、再通过标记样本和利用当前模型判断标记的未标记样本共同调整。,期望最大化(EM),例: 估计k个高斯分布的均值 已知: 数据D,由k个不同正态分布的混合所得分布而生成 生成过程: 1.随机选择k个正态分布中的一个 2.随机变量xi按照该正态分布生成 3.该过程不断重复,生成一组数据D,期望最大化(EM),期望最大化(EM),例: 估计k个高斯分布的均值 问题简化 K=2 正态分布的选择基于均匀概率进行 正态分布的方差2已知,均值1, 2未知 学习任务 输出:均值=的估计数值,期望最大化(EM),步骤1: 假定当前假设=成立,计算每个隐藏变量zij的期望 zij表示第i个样本点是第j个高斯过程生成的概率 步骤2: 假定隐藏变量zij所取的值为第一步中得到的期望值Ezij,然后计算一个选的极大似然假设 ,用其替代原有参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京理工大学事业编制相关岗位招聘备考题库及参考答案详解【培优a卷】
- 2026江苏镇江市润州区卫生健康系统事业单位招聘专业技术人员21人备考题库附参考答案详解(b卷)
- 2026陕西安康学院高层次人才招聘备考题库附参考答案详解【综合卷】
- 2026四川成都市龙泉驿区东山国际小学教师招聘12人备考题库附完整答案详解【典优】
- 2026汉江实验室三亚研究中心(三亚深海科学与工程研究所)招聘20人备考题库附参考答案详解(达标题)
- 2026广西桂林市社会保险事业管理中心招聘公益性岗位人员1人备考题库(真题汇编)附答案详解
- 2026恒丰银行总行实习生招收备考题库附答案详解【黄金题型】
- 2026浙江宁波报业传媒集团有限公司招聘编辑1人备考题库【夺冠系列】附答案详解
- 2026浙江温州市公证协会招聘1人备考题库及答案详解【典优】
- 2026福建龙岩市投资开发集团有限公司招聘1人备考题库附答案详解(基础题)
- 2026广东深圳医学科学院科研职能岗位招聘笔试备考试题及答案解析
- 山东大众报业集团有限公司招聘笔试题库2026
- 2026年国网江苏省电力有限公司高校毕业生招聘约825人(第二批)笔试模拟试题及答案解析
- 2026上半年新疆维吾尔自治区招聘事业单位工作人员分类考试4474人笔试备考题库及答案解析
- GB/T 20151-2026光度学CIE物理光度系统
- GB/T 18570.9-2025涂覆涂料前钢材表面处理表面清洁度的评定试验第9部分:水溶性盐的现场电导率测定法
- 高中实验室安全教育课件
- 安徽省合肥市2025-2026学年上学期期末八年级数学试卷(含答案)
- 2026年甘肃省交通运输厅所属事业单位招聘笔试易考易错模拟试题(共500题)试卷后附参考答案
- 电信公司客户服务部门员工绩效考评表
- 安徽合肥市人力资源服务有限公司招聘笔试题库2026
评论
0/150
提交评论