图像理解 课件 16-研究示例_第1页
图像理解 课件 16-研究示例_第2页
图像理解 课件 16-研究示例_第3页
图像理解 课件 16-研究示例_第4页
图像理解 课件 16-研究示例_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究示例图像理解之十六2研究示例多传感器图象信息融合基于内容的图象和视频检索时空行为理解一些得到较多关注的研究领域融合三个层次:象素、特征和决策层检索是各类视觉信息在全球得到广泛采集、传输和应用背景下一个新的研究领域图象理解需要充分掌握时空信息,分析场景含义,解释场景动态3时空行为理解图象理解内容(之一)判断场景中有哪些景物、它们随时间如何改变其在空间的位置、姿态、速度、关系等简言之,要在时空中把握景物的动作、确定动作的目的,并进而理解它们所传递的语义信息动作检测和识别近期得到很多关注和研究高抽象层次的行为识别与描述(与语义和智能相关)研究还开展不多,技术在不停地发展更新中4时空行为理解理解时空行为时空:客观位置、轨迹、速度、外观、姿态、关系、…对群体目标活动中的聚合、消散、分化、合并等动态演变现象,…行为:主观举止、动向、态势、情感、…5时空行为理解时空技术时空兴趣点动态轨迹学习和分析动作分类和识别活动和行为建模6时空技术新的领域从1996年开始的图象工程综述五大类:图象处理,图象分析,图象理解,技术应用,综述评论图象理解:匹配融合,场景恢复,图象感知和解释,基于内容的图象和视频检索(2000年)进入第二个十年时,图象理解大类中增加了一个新的小类——C5:时空技术(3-D运动分析,姿态检测,对象跟踪,行为判断和理解)7时空技术多个层次8时空技术从动作到行为的五个层次(1)动作基元(actionprimitives)指用来构建动作的原子单元,一般对应场景中局部短暂的运动信息(2)动作(action)由主体的一系列动作基元构成的有具体意义的集合体(有序组合),一般动作常代表由一个人所进行的简单运动模式,且常仅持续秒的量级。人体动作的结果常导致人体姿态的改变9时空技术(3)活动(activity)为完成某个工作或达到某个目标而由主体执行的一系列动作的组合(主要强调逻辑组合)。活动是相对大尺度的运动,一般依赖于环境和交互人。活动常代表由多个人进行的序列(可能交互的)复杂动作,且常持续较长的时段(4)事件(events)指在特定时间段和特定空间位置发生的某种特定活动。通常其中的动作由多个主体/发起者执行(群体活动)。对特定事件的检测常与异常活动有关(5)行为(behavior)主体/发起者主要指人或动物,强调主体/发起者受思想支配而在特定环境/上下境中改变动作,持续活动和描述事件等10时空兴趣点空间兴趣点的检测使用线性尺度空间表达对图象建模高斯核Harris兴趣点检测11时空兴趣点空间兴趣点的检测µsp的本征值λ1和λ2(λ1≤λ2)构成fsp沿两个图象方向变化的描述符检测角点函数的正极大值在感兴趣点,本征值的比a=λ2/λ1应该很大对Hsp的正局部极值,a应该满足k≤a/(1+a)2设k=0.25,H的正最大值将对应理想的各向同性兴趣点(此时a=1,即λ1=λ2)12时空兴趣点空间兴趣点的检测检测在局部时空体中具有沿时和空都有图象值大变化的位置空间方差σl2和时间方差τl2为检测感兴趣点,在f中搜索具有μ的显著本征值λ1,λ2,λ3的区域13动态轨迹学习和分析试图通过对场景中各个运动目标行为的理解和刻画来提供对监控场景状态的把握先对目标进行检测并跟踪,接着用所获得的轨迹自动地构建场景模型,最后用该模型描述监控的状况和提供对活动的标注14动态轨迹学习和分析在场景建模中,先将有事件发生的图象区域定义为兴趣点(POI),然后在接下来的学习步骤中定义活动路径(AP)在POI/AP学习中的主要工作包括:(1)活动学习:通过比较轨迹来进行(2)适应:研究管理POI/AP模型的技术(3)特征选择:确定对特定任务正确的动力学表达层次自动场景建模学习路径自动活动分析15自动场景建模目标跟踪在T帧视频中被跟踪的目标会生成一系列可推断出来的跟踪状态:兴趣点检测感兴趣区域对应地形图中的结点入/出区域是目标进入或离开视场的位置停止区域源于场景地标点,即目标在一段时期内趋于固定的位置16自动场景建模活动路径学习活动定义在开始和结束的两个感兴趣点之间3种基本结构的主要区别包括输入的种类,运动矢量,轨迹/视频片段,以及运动抽象的方式17学习路径原始的轨迹可表示成动态测量的序列运动矢量位置、速度、加速度仅使用轨迹就可能以无监督的方式学习AP18学习路径轨迹预处理(1)归一化:保证所有轨迹有相同的长度(2)降维:将轨迹映射到新的低维空间轨迹聚类①定义一个距离(对应相似性)测度②聚类更新的策略③聚类验证19学习路径路径建模路径模型是对聚类的紧凑表达①考虑完整的路径,有平均的中心线,两边还有包络指示路径范围②将路径分解为子路径(表示成子路径的树)20自动活动分析只有在特定环境下才好定义是否感兴趣(1)虚拟篱笆:一旦有入侵就触发分析(2)速度分析:基于速度的预警(3)路径分类:利用历史运动模式获得活动路径(4)异常检测(5)在线活动分析(6)目标交互刻画21动作分类和识别基于视觉的人体动作识别是对图象序列(视频)用动作(类)标号进行标记的过程动作分类动作识别22动作分类直接分类将观察序列中所有帧的信息都加到单个表达中或对各个帧分别进行动作的识别和分类(不特别关注时间域)时间状态模型①生成模型:学习观察和动作间的联合分布,对每个动作类建模(考虑所有变化)②鉴别模型:学习在观察条件下动作类别的概率。它们并不对类别建模但关注类间的差别23动作分类动作检测并不显式地对图象中目标表达建模,也不对动作建模。它将观察序列与编号的视频序列联系起来,以直接检测(已定义的)动作基于表观的方法:直接利用对图象的前景、轮廓、光流等的描述基于人体模型的方法:利用人体模型表达行为人的结构特征,如将动作用人体关节点序列来描述24动作识别整体识别强调对整个人体目标或单个人体的各个部分进行识别(如基于人体的剪影)姿态建模(1)基于表观的方法(2)基于人体模型的方法(3)基于3-D重构的方法稀疏型:基于时空Harris角点的时空兴趣点稠密型:借助运动强度提取的时空兴趣点25动作识别活动重建动作导致姿态改变,将姿态定义为一个状态,借助状态空间法将状态之间通过转移概率来切换,则一个活动序列的构建可通过在对应姿态的状态之间进行一次遍历而得到交互活动①人与环境的交互(如人开车)②人际交互:将单人活动结合起来而得到。对单人活动可借助概率图模型来描述26动作识别群体活动群体目标运动分析主要以人流、交通流以及自然界的密集生物群体为对象,研究群体目标运动的表达与描述方法,分析群体目标的运动特征以及边界约束对群体目标运动的影响27活动和行为建模获取输入视频或序列图象提取精练的底层图象特征从底层特征到中层动作描述从基本的动作出发进行高层语义解释活动的层次要高于动作对动作和活动的建模和识别常采用不同的技术动作建模活动建模和识别28动作建模非参数建模方法从每帧中提取特征,并与存储的模板匹配(1)2-D模板:运动检测,跟踪目标,对周期性强的动作进行动作识别(2)3-D目标模型:对时空目标建立的模型(3)流形学习方法:利用学习数据所在的流形可确定数据的固有维数,该固有维数的自由度较小,可帮助在低维空间设计有效的模型29动作建模立体建模方法将视频看作象素强度的3-D立体并将标准的图象特征扩展到3-D(1)时空滤波:采用一组时空滤波器对视频体数据滤波。根据响应进一步推出特定的特征(2)基于部件的方法:一个视频体可看作许多局部部件的集合体,各个部件有特殊的运动模式。由于本质上的局部性,对非稳态背景比较鲁棒(3)子体匹配:子体是空间上一致的立体区域。它并不需要从尺度空间的极值点提取动作描述符而是检查两个局部时空块之间的相似度(通过比较两个块之间的运动)(4)基于张量的方法:一个3-D时空体可以自然地看作一个有3个独立维的张量,这提供了一种整体匹配视频的直接方法30动作建模参数建模方法对运动的时间动态建模(1)隐马尔科夫模型:状态空间的一种典型模型,对时间序列数据的建模很有效,有很好的推广性和鉴别性(2)线性动态系统:比隐马尔科夫模型更一般化(3)非线性动态系统:切换线性动态系统包括一组线性动态系统和一个切换函数,切换函数通过在模型间的切换来改变模型参数31活动建模和识别活动相比于动作,不仅持续时间长,而且大多数人们所关注的活动应用都包括多个动作人图形模型(1)信念网络:贝叶斯网络先将一组随机变量编码为局部条件概率密度(CPD),再对它们间的复杂条件依赖性进行编码对比只能编码一个隐变量的传统HMM,动态信念网络(DBN)可以对若干随机变量间的复杂条件依赖关系进行编码32活动建模和识别(2)皮特里网:一种描述条件和事件之间联系的数学工具。它特别适合模型化和可视化如排序,并发,同步和资源共享等行为包含两种结点——位置和过渡——的双边图33活动建模和识别合成方法主要借助语法概念和规则来实现(1)语法语法利用一组产生式规则描述处理的结构产生式规则指出如何从词(活动基元)构建句子(活动),以及如何识别句子(视频)满足给定语法(活动模型)的规则上下文自由语法(CFG)被用来对人体运动和多人交互进行建模和识别34活动建模和识别合成方法(2)随机语法随机上下文自由语法(SCFG)对上下文自由语法进行了概率扩展,更适合用于将实际的视觉模型结合起来SCFG可用于对活动(其结构假设已知)的语义进行建模SCFG还被用来对多任务的活动(包含多个独立执行线程,断断续续相关交互的活动)建模35活动建模和识别基于知识和逻辑的方法(1)基于逻辑的方法:依靠严格的逻辑规则来描述一般意义上的领域知识以描述活动声明式模型用场景结构、事件等描述所有期望的活动。活动模型包括场景中目标间的交互虽然基于逻辑的方法提供了一个结合领域知识的自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论