图像理解 课件 15-场景分析和语义解释_第1页
图像理解 课件 15-场景分析和语义解释_第2页
图像理解 课件 15-场景分析和语义解释_第3页
图像理解 课件 15-场景分析和语义解释_第4页
图像理解 课件 15-场景分析和语义解释_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

场景分析和语义解释图像理解之十五2场景理解概述场景分析获取场景中景物的信息目标识别是场景分析的重要步骤和基础考虑目标本身的内部关系,还要关注目标间的分布和相对位置从认知的角度看,场景分析(比目标识别)更关注人对场景的感知和理解结合生物学、生理学和心理学研究成果3场景理解概述场景分析场景的视觉内容(景物及分布)具有很大的不确定性:不同的光照条件,影响景物检测和跟踪不同的景物外在表观(有时尽管结构元素类似),影响对景物的识别不同的观察尺度,影响对景物的辨识不同的景物位置、朝向以及互相遮挡因素,影响对景物认知的复杂性4场景理解概述场景感知层次分三个层次进行对场景的分析和语义解释局部层:该层主要强调对场景的局部或单个景物进行分析、识别或对图象区域进行标记全局层:该层考虑整个场景的全局,关注具有相似外形和类似功能的景物的相互关系抽象层:该层对应场景的概念含义,给出场景抽象的描述人类对场景的感知有很强的能力对中层的感知有一定的优先级人类对中层的大部分目标(如运动场)具有很快和很强的辨识能力,对它们的识别、命名比对低层和高层都要快对中层的感知更加优先是由于它能同时最大化类内相似度和最大化类间的差异(同在中层的景物常有相似的空间结构及相似的行为)5场景理解概述场景感知层次建立高层概念与低层视觉特征和中层目标特性间的联系,并识别景物及它们之间的相对关系(1)低层场景建模直接对景物的低层属性进行表达和描述,再借助分类识别再对场景的高层信息进行推理(2)中层语义建模借助对目标的识别来提高低层特征分类性能6场景理解概述场景语义解释(1)视频计算技术(2)视觉算法动态控制策略(3)对场景信息的自学习(4)快速或实时计算技术(5)多传感器融合协同(6)视觉注意机制(7)结合认知理论的场景解释(8)系统的集成与优化7模糊推理模糊是一个与清晰或精确对立的概念,表达各种各样不严格、不确定、不精确的知识和信息模糊集和模糊运算模糊推理方法8模糊集和模糊运算在模糊空间X中的一个模糊集合S是一个有序对的集合MS(x)代表x在S中的隶属程度,总取非负实数模糊集合常可以用其隶属度函数唯一地描述精确集模糊集模糊集9模糊集和模糊运算模糊逻辑运算(对模糊集合的运算)类似一般逻辑运算的名称但定义不同的运算(a)加强模糊集VD(verydark)(b)加强加强模糊集VVD(veryverydark)10模糊集和模糊运算(c)减弱的模糊集SD(somewhatdark)(d)加强模糊集VD的非,即模糊集NVD(notverydark)11模糊推理方法将各模糊集中的信息以一定规则结合起来做出决策基本模型模糊规则:一系列无条件的和有条件的命题无条件模糊命题:xisA有条件模糊命题:IfxisAthenyisB

12模糊推理方法基本模型与无条件模糊规则对应的隶属度就是LA(x)有条件模糊规则:最简单的是单调模糊推理模糊规则:ifxisDARKthenyisLOW13模糊推理方法模糊结合(1)最小-最大规则(最小化和最大化)用最小相关LAi(x)来限定模糊结果的LBi(y)14模糊推理方法模糊结合(1)相关积对原始的结果模糊隶属度函数进行放缩而不是截去,保持原始模糊集的形状15模糊推理方法去模糊化确定一个能最好地表达模糊解集合中信息的、包含多个标量(每个标量对应一个解变量)的矢量先确定模糊解的隶属度函数的重心c,并将模糊解转化为一个清晰解变量c在模糊解的隶属度函数中确定具有最大隶属度值的域点给出一个清晰解d16遗传算法图象解释使用自然进化机制搜索目标函数的极值遗传算法原理语义分割和解释17遗传算法原理遗传算法的特点将优化问题的自然参数集合编码成有限长度的码串(常使用字符只有0和1的二值码串)在搜索空间里同时从大量群体样本点中进行搜索,发现全局最优的机会很大直接使用目标函数,进化函数的值称为遗传算法的适应度使用概率转换规则而不是确定性的规则,用高适应度支持好的码串而消除低适应度的差码串(最好的码串将在进化过程中有高的概率存活)18遗传算法原理遗传算法的基本运算复制:根据概率让好的码串存活而让其他码串死亡交叉:对换码串对的头和边界位置来产生新的码串变异:频繁地随机改变某些码串的某个码,以保持各种局部结构避免丢失一些优化解特性19遗传算法原理遗传算法的步骤生成初始群体的编码字符串,给出目标函数值(适应度)在新群体中概率化地复制高适应度的码串,除去低适应度的码串通过交叉组合从旧群体复制的编码字符串构建新码串不时地随机选择码串中的某个码进行变异对当前群体中的码串根据其适应度进行排序如果最大适应度的码串的适应度值在若干个进化过程中都没有明显增加,停止;否则返回步骤(2)继续计算20语义分割和解释根据区域本身性质Xi对区域Ri进行解释ki的置信度根据对其邻近区域Rj的解释kj来对区域Ri进行解释ki的置信度对整幅图像中的解释置信度的评价21语义分割和解释将图象根据语义信息划分为对应的区域并借助上下文等高层信息进行优化例:初始化图象为初级区域构建一个初级区域邻接图对偶图22语义分割和解释随机地选取码串的起始群体遗传优化开始随机对区域标记得到的码串为BLBLB和LLLBLBL|BLB⇒Cimage=0.00,LL|LBL⇒Cimage=0.12LLBLB⇒Cimage=0.20,BLLBL⇒Cimage=0.002|323语义分割和解释LLL|BL⇒Cimage=0.12,LLB|LB⇒Cimage=0.20LLLLB⇒Cimage=0.14,LLBBL⇒Cimage=0.18LLBL|B⇒Cimage=0.20,LLBB|L⇒Cimage=0.18LLBLL⇒Cimage=0.10,LLBBB⇒Cimage=1.004|53|424语义分割和解释如果优化准则的最大值在若干个接续的步骤中没有明显变化,转到步骤(7)让遗传算法生成一个分割和解释假设的新的群体,转到步骤(4)具有最大置信度的码串(最优分割假设)代表最终的语义分割和解释码串LLBBB具有最高的置信度,所以遗传算法停止25场景目标标记对图象中目标区域的语义标记,即赋予目标以语义符号。对每个场景图象中的目标赋一个标记(有语义含义)以获得对场景图象的恰当解释标记方法和要素离散标记:它对每个目标只赋予1个标记,主要考虑对图象标记的一致性概率标记:它允许对联合存在的目标赋予多个标记。这些标记是用概率加权的,每个标记都有一个标记信任度26场景目标标记标记方法和要素离散标记:获得了一致性的标记,或检测出要赋予场景一致性标记的不可能性?分割不完善导致不能给出一致性解释概率标记:总能给出标记结果,常比离散标记所给出的一致但很不可能的解释要更好标记要素:①一组目标,②一个有限的标记集合,③一个有限的目标间关系集合,④相关的目标间存在的兼容性函数(约束)27场景目标标记离散松弛标记目标本身的性质可用一元的关系来描述目标间的联系需用二元或多元的联系来描述①窗户长方;②桌子长方;③抽屉长方①窗户位于桌子上方②电话放在桌子上③抽屉在桌子内部④背景与图象边缘相连一元二元28场景目标标记离散松弛标记先把所有存在的标记都赋给每个目标然后迭代地对每个目标进行一致性检验将那些有可能不满足约束的标记除去29场景分类根据视觉感知组织原理,确定出图象中存在的各种特定区域,并给出场景的概念性解释词袋/特征包模型pLSA模型LDA模型30词袋/特征包模型词袋模型源自对自然语言的处理,引入图象领域后也常称为特征包模型特征包模型由类别特征(feature)归属于同类目标集中形成包(bag)而得名用特征包模型表达和描述场景需要从场景中抽取局部区域描述特征,这可称为视觉词汇构建视觉词汇集合(词典)可包括如下几个方面:①提取特征;②学习视觉词汇;③使用视觉词汇的量化特征;④利用视觉词汇的频率表达图象31词袋/特征包模型将图象划分成多个子区域(视觉单元)后,对每个子区域赋予一个语义概念将语义概念与视觉词汇联系起来,那么对场景的分类就可借助词汇的表达描述模型来进行32pLSA模型概率隐语义分析模型源于概率隐语义索引,是为解决目标和场景分类而建立的一种图模型模型描述图象集合T={ti}所包含的视觉单词来自单词集合——词典(视觉词汇表)S={sj}用尺寸为N

M的统计共生矩阵P来描述图象集合T的性质,矩阵中每个元素pij=p(ti,sj)表示图象ti中单词sj出现的频率该矩阵实际中是一个稀疏矩阵33pLSA模型模型描述隐变量(称主题变量)z∈Z={zk}基于主题与单词共生矩阵的条件概率模型34pLSA模型模型计算确定对所有图象公共的主题矢量和对每幅图象特殊的混合系数,其目的是确定对图象中出现的单词给以高概率的模型,从而可选取最大后验概率对应的类别作为最终的目标类别对隐变量模型的最大似然估计可采用最大期望(EM)算法计算35pLSA模型模型应用示例基于情感语义的图象分类问题图象即为库中图片,单词选自情感类别词汇,而主题为隐含情感语义因子(代表底层图象特征和高层情感类别之间的一个中间语义层概念)利用pLSA模型来学习隐含情感语义因子,从而得到每个隐含情感语义因子在情感单词上的概率分布p(sj|zk)和每张图片在隐含情感语义因子上的概率分布p(sj|ti)⇒训练分类器进行分类36LDA模型隐含狄利克雷分配模型是一个集合概率模型,可以看作是在pLSA模型基础上加上超参层,建立隐变量z的概率分布而形成的基本LDA模型一个三层贝叶斯模型(方框表示重复/集合)基本简化平滑37LDA模型基本LDA模型LDA模型包含K个隐含主题z={z1,z2,…,zK}LDA模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论