版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(新一代人机交互技术) 人行为识别与理解是指对人的行为模式进行人行为识别与理解是指对人的行为模式进行 分析和识别,并用自然语言等加以描述分析和识别,并用自然语言等加以描述. . 这种技术包含从视频序列中抽取相关的视觉这种技术包含从视频序列中抽取相关的视觉 信息、用一种合适的方法进行表达,然后解信息、用一种合适的方法进行表达,然后解 释这些视觉信息释这些视觉信息, ,从而实现识别人的行为。从而实现识别人的行为。 人体行为识别种类人体行为识别种类 头部运动头部运动 手势识别手势识别 手语识别手语识别 体势识别体势识别 下肢运动下肢运动 人体行为识别的意义 1. 感知接口(感知接口(Perceptu
2、al Interface) 基于视觉的形体语言作为语音和自然语言理解的有效补充来完成更加智基于视觉的形体语言作为语音和自然语言理解的有效补充来完成更加智 能的人机交互。对于机场等高噪声的场合,基于视觉的高级用户接口能能的人机交互。对于机场等高噪声的场合,基于视觉的高级用户接口能 够提供比语音识别更加准确的信息输入。够提供比语音识别更加准确的信息输入。 2. 智能监控(智能监控(Smart Surveillance) 实时主动的监控实时主动的监控, 而不是察看已经发生犯罪事实记录,从而避免犯罪的而不是察看已经发生犯罪事实记录,从而避免犯罪的 发生,同时也减少雇佣大批监视人员所需要的人力、物力和财
3、力的投入发生,同时也减少雇佣大批监视人员所需要的人力、物力和财力的投入. 3. 运动分析(运动分析(Motion Analysis) 建立人体几何模型、解释人体的运动行为机制建立人体几何模型、解释人体的运动行为机制,从而提高运动性能从而提高运动性能, 可应可应 用于体育运动、舞蹈等训练中用于体育运动、舞蹈等训练中,也应用于医学康复也应用于医学康复. 4. 虚拟现实(虚拟现实(Virtual Reality) 电脑游戏中人的形体、运动和行为交互的设计逼真性实际得益于物理空电脑游戏中人的形体、运动和行为交互的设计逼真性实际得益于物理空 间中人的运动分析,虚拟环境中人体运动建模如关节运动机制等间中人
4、的运动分析,虚拟环境中人体运动建模如关节运动机制等. 指姿态指姿态,单幅图像单幅图像 指动作指动作,由一系列由一系列 姿态组成姿态组成 输入图象输入图象 识别结果识别结果 人的运动图像序列进行分析人的运动图像序列进行分析 处理,涉及到运动检测、目处理,涉及到运动检测、目 标分类、人的跟踪及行为理标分类、人的跟踪及行为理 解与描述。解与描述。 运动检测、目标分类、人的运动检测、目标分类、人的 跟踪属于视觉中的低级和中跟踪属于视觉中的低级和中 级处理部分(级处理部分(Low-level and Low-level and Intermediate-level Intermediate-level
5、VisionVision). . 行为理解和描述则属于高级行为理解和描述则属于高级 处理(处理(High-level VisionHigh-level Vision) 动态人体行为识别的过程动态人体行为识别的过程 运动检测运动检测 运动检测的目的是从序列图像中将变化区域从背景图像中提运动检测的目的是从序列图像中将变化区域从背景图像中提 取出来。运动区域的有效分割对于目标分类、跟踪和行为理取出来。运动区域的有效分割对于目标分类、跟踪和行为理 解等后期处理是非常重要的,因为以后的处理过程仅仅考虑解等后期处理是非常重要的,因为以后的处理过程仅仅考虑 图像中对应于运动区域的像素。然而,由于背景图像的动
6、态图像中对应于运动区域的像素。然而,由于背景图像的动态 变化,如天气、光照、影子及混乱干扰等的影响,使得运动变化,如天气、光照、影子及混乱干扰等的影响,使得运动 检测成为一项相当困难的工作检测成为一项相当困难的工作 1 1)背景减除()背景减除(Background SubtractionBackground Subtraction) 2 2)时间差分()时间差分(Temporal DifferenceTemporal Difference) 3 3)光流()光流(Optical FlowOptical Flow) 目标分类目标分类 运动目标中人的检测运动目标中人的检测, 从检测到的运动区域中
7、将对应于人从检测到的运动区域中将对应于人 的运动区域提取出来。的运动区域提取出来。 不同的运动区域可能对应于不同的运动目标,比如交通不同的运动区域可能对应于不同的运动目标,比如交通 道路上监控摄像机所捕捉的序列图像中可能包含行人、道路上监控摄像机所捕捉的序列图像中可能包含行人、 车辆及其它诸如飞鸟、流云、摇动的树枝等运动物体,车辆及其它诸如飞鸟、流云、摇动的树枝等运动物体, 为了便于进一步对行人进行跟踪和行为分析,运动目标为了便于进一步对行人进行跟踪和行为分析,运动目标 的正确分类是完全必要的。的正确分类是完全必要的。 这个步骤在一些情况下可能是不必要的(比如已经知道这个步骤在一些情况下可能是
8、不必要的(比如已经知道 场景中仅仅存在人的运动时)。场景中仅仅存在人的运动时)。 目标分类方法目标分类方法 1)基于形状信息的分类)基于形状信息的分类(Shape-based Classification) 用区域的分散度、面积、宽高比用区域的分散度、面积、宽高比, 区分人车及混乱扰区分人车及混乱扰 动动,人体轮廓模式的形状参数从图像中检测运动的人人体轮廓模式的形状参数从图像中检测运动的人 2)基于运动特性的分类)基于运动特性的分类(Motion-based Classification) 人体运动的周期性进行目标分类人体运动的周期性进行目标分类,计算运动区域的残计算运动区域的残 余光流来分析
9、运动实体的刚性和周期性,非刚性的余光流来分析运动实体的刚性和周期性,非刚性的 人的运动相比于刚性的车辆运动而言具有较高的平人的运动相比于刚性的车辆运动而言具有较高的平 均残余光流,同时它也呈现了周期性的运动特征,均残余光流,同时它也呈现了周期性的运动特征, 据此可以将人区分出来据此可以将人区分出来 人的跟踪人的跟踪 跟踪等价于在连续的图像帧间创建基于位置、速度、形状、跟踪等价于在连续的图像帧间创建基于位置、速度、形状、 纹理、色彩等有关特征的对应匹配问题纹理、色彩等有关特征的对应匹配问题. . 常用的数学工具有卡尔曼滤波(常用的数学工具有卡尔曼滤波(Kalman FilteringKalman
10、 Filtering)、)、 CondensationCondensation算法及动态贝叶斯网络(算法及动态贝叶斯网络(Dynamic Bayesian Dynamic Bayesian NetworkNetwork)等。)等。KalmanKalman滤波是基于高斯分布的状态预测方法,滤波是基于高斯分布的状态预测方法, 不能有效地处理多峰模式(不能有效地处理多峰模式(Multi-modeMulti-mode)的分布情况;)的分布情况; CondensationCondensation算法是以因子抽样为基础的条件密度传播方法,算法是以因子抽样为基础的条件密度传播方法, 结合可学习的动态模型,可
11、完成鲁棒的运动跟踪。结合可学习的动态模型,可完成鲁棒的运动跟踪。 跟踪分类跟踪分类 就跟踪对象而言,有跟踪如手、脸、头、腿等身体部分与跟踪就跟踪对象而言,有跟踪如手、脸、头、腿等身体部分与跟踪 整个人体的;整个人体的; 就跟踪视角而言,有对应于单摄像机的单一视角、对应于多摄就跟踪视角而言,有对应于单摄像机的单一视角、对应于多摄 像机的多视角和全方位视角;像机的多视角和全方位视角; 还可以通过跟踪空间(二维或三维)、跟踪环境(室内或户还可以通过跟踪空间(二维或三维)、跟踪环境(室内或户 外)、跟踪人数(单人、多人、人群)、摄像机状态(运动或外)、跟踪人数(单人、多人、人群)、摄像机状态(运动或
12、固定)等方面进行分类。固定)等方面进行分类。 1)基于模型的跟踪()基于模型的跟踪(Model-based Tracking) a)线图法()线图法(Stick Figure):将身体的各个部分以分段直线来近似):将身体的各个部分以分段直线来近似 b)二维轮廓()二维轮廓(2D Contour):将人的肢体用一组连接的平面区域块所):将人的肢体用一组连接的平面区域块所 表达表达 c)立体模型()立体模型(Volumetric Model):利用广义锥台、椭圆柱、球等三维):利用广义锥台、椭圆柱、球等三维 模型来描述人体的结构细节,因此要求更多的计算参数和匹配过程中更模型来描述人体的结构细节,因
13、此要求更多的计算参数和匹配过程中更 大的计算量大的计算量 2)基于区域的跟踪()基于区域的跟踪(Region-based Tracking) 人体看作由头、躯干、四肢等身体部分所对应的小区域块所组成,通过人体看作由头、躯干、四肢等身体部分所对应的小区域块所组成,通过 跟踪各个小区域块来完成整个人的跟踪。跟踪各个小区域块来完成整个人的跟踪。 跟踪方法跟踪方法 3)基于活动轮廓的跟踪()基于活动轮廓的跟踪(Active Contour Based Tracking) 利用封闭的曲线轮廓来表达运动目标,并且该轮廓能够自动连续利用封闭的曲线轮廓来表达运动目标,并且该轮廓能够自动连续 地更新。地更新。
14、4)基于特征的跟踪()基于特征的跟踪(Feature-based Tracking) 基于特征的跟踪包括特征的提取和特征的匹配两个过程。特征如基于特征的跟踪包括特征的提取和特征的匹配两个过程。特征如 质心速度、纹理、彩色及形状等。以卡尔曼滤波形式的点、线特质心速度、纹理、彩色及形状等。以卡尔曼滤波形式的点、线特 征的跟踪技术在计算机视觉领域中已被很好地开发征的跟踪技术在计算机视觉领域中已被很好地开发 可参考的动态人脸跟踪方法可参考的动态人脸跟踪方法 动态人脸检测与跟踪的解决思路可以归结为四类:动态人脸检测与跟踪的解决思路可以归结为四类: 基于运动信息的方法:充分利用运动连续性规律,基于运动信息
15、的方法:充分利用运动连续性规律, 进行图象在连续帧间的跟踪、预测,以达到快速跟踪进行图象在连续帧间的跟踪、预测,以达到快速跟踪 的目的。的目的。 基于彩色信息的方法:利用人脸彩色信息,提取人基于彩色信息的方法:利用人脸彩色信息,提取人 脸特征中相对固定不变的颜色信息脸特征中相对固定不变的颜色信息(如肤色、虹膜等如肤色、虹膜等) 进行人脸检测,它具有速度快、姿态不变性等特点。进行人脸检测,它具有速度快、姿态不变性等特点。 基于参数模型或模板的方法:通过获取目标的先基于参数模型或模板的方法:通过获取目标的先 验知识,建立参数模型,对输入的每一帧图像通过验知识,建立参数模型,对输入的每一帧图像通过
16、滑动窗口进行模型匹配,实现人脸跟踪。滑动窗口进行模型匹配,实现人脸跟踪。 基于人脸局部特征的方法:根据不同的人脸器官基于人脸局部特征的方法:根据不同的人脸器官 特征信息进行器官跟踪特征信息进行器官跟踪。 行为理解与描述行为理解与描述 运动检测、目标分类与人的跟踪是人运动分析中研究较运动检测、目标分类与人的跟踪是人运动分析中研究较 多的三个问题,而人的行为理解与描述是近年来被广泛多的三个问题,而人的行为理解与描述是近年来被广泛 关注的研究热点,它是指对人的运动模式进行分析和识关注的研究热点,它是指对人的运动模式进行分析和识 别,并用自然语言等加以描述。别,并用自然语言等加以描述。 行为理解可以简
17、单地被认为是行为理解可以简单地被认为是时变数据的分类问题,时变数据的分类问题,即即 将测试序列与预先标定的代表典型行为的参考序列进行将测试序列与预先标定的代表典型行为的参考序列进行 匹配。匹配。 行为理解的关键问题是如何从学习样本中获取参考行为行为理解的关键问题是如何从学习样本中获取参考行为 序列,并且学习和匹配的行为序列必须能够处理在相似序列,并且学习和匹配的行为序列必须能够处理在相似 的运动模式类别中空间和时间尺度上轻微的特征变化。的运动模式类别中空间和时间尺度上轻微的特征变化。 动态行为识别方法动态行为识别方法 1 1) 模板匹配方法(模板匹配方法(Template MatchingTe
18、mplate Matching) 采用模板匹配技术的行为识别方法首先将图像序列转换为一组静采用模板匹配技术的行为识别方法首先将图像序列转换为一组静 态形状模式,然后在识别过程中和预先存储的行为标本相比较。态形状模式,然后在识别过程中和预先存储的行为标本相比较。 2 2) 状态空间方法(状态空间方法(State Space ApproachesState Space Approaches) 基于状态空间模型的方法定义每个静态姿势作为一个状态,这些基于状态空间模型的方法定义每个静态姿势作为一个状态,这些 状态之间通过某种概率联系起来。任何运动序列可以看作为这些状态之间通过某种概率联系起来。任何运动
19、序列可以看作为这些 静态姿势的不同状态之间的一次遍历过程,在这些遍历期间计算静态姿势的不同状态之间的一次遍历过程,在这些遍历期间计算 联合概率,其最大值被选择作为分类行为的标准。目前,状态空联合概率,其最大值被选择作为分类行为的标准。目前,状态空 间模型已经被广泛地应用于时间序列的预测、估计和检测,最有间模型已经被广泛地应用于时间序列的预测、估计和检测,最有 代表性的是代表性的是HMMs。每个状态中可用于识别的特征包括点、线或。每个状态中可用于识别的特征包括点、线或 二维小区域。二维小区域。状态空间方法虽然能克服模板匹配的缺点,但通常涉及状态空间方法虽然能克服模板匹配的缺点,但通常涉及 到复杂
20、的迭代运算到复杂的迭代运算. 3) 其它方法其它方法: 如基于模型的方法如基于模型的方法 模板匹配方法举例模板匹配方法举例 Bobick与与Davis采用运动能量图像采用运动能量图像MEI(Motion Energy Images) 和运动历史图像和运动历史图像MHI(Motion History Images)来解释图像序列中)来解释图像序列中 人的运动。序列中的运动图像首先经差分运算并二值化;而后这些人的运动。序列中的运动图像首先经差分运算并二值化;而后这些 包含运动区域的二值化运动图像随着时间累加形成包含运动区域的二值化运动图像随着时间累加形成MEI;最后;最后MEI 增强为增强为MHI
21、,MHI中每个像素的值与该位置的持续运动时间成比中每个像素的值与该位置的持续运动时间成比 例。每个行为由不同视角下图像序列的例。每个行为由不同视角下图像序列的MEI和和MHI所组成,从中可所组成,从中可 以提取出基于矩的行为特征以提取出基于矩的行为特征(7个Hu矩作为特征向量)用于识别阶段的用于识别阶段的 模板匹配。模板匹配。 Polana与与Nelson利用二维网格的特征进行人的运动识别,首先计算利用二维网格的特征进行人的运动识别,首先计算 连续帧间的光流场,并将每个光流帧在空间栅格上沿连续帧间的光流场,并将每个光流帧在空间栅格上沿X和和Y方向分方向分 解,每个单元格的幅度被累加,从而形成一
22、高维特征向量用于识别;解,每个单元格的幅度被累加,从而形成一高维特征向量用于识别; 为了归一化运动的持续时间,他们假设人的运动是周期性的,并将为了归一化运动的持续时间,他们假设人的运动是周期性的,并将 整个序列分解为该行为的许多循环过程;最后,采用最近邻算法进整个序列分解为该行为的许多循环过程;最后,采用最近邻算法进 行行为识别。行行为识别。 模板匹配法特点模板匹配法特点 模板匹配技术的优点是计算复杂度低、实现简单模板匹配技术的优点是计算复杂度低、实现简单. 对于噪声和运动时间间隔的变化是敏感的对于噪声和运动时间间隔的变化是敏感的.是一种基是一种基 于运动的低级特征的方法,识别率较低于运动的低
23、级特征的方法,识别率较低 状态空间方法的时变数据匹配状态空间方法的时变数据匹配 a)动态时间规整)动态时间规整DTW:DTW具有概念简单、算法鲁棒的优点,早期具有概念简单、算法鲁棒的优点,早期 被广泛地应用于语音识别中,并且最近才被用于匹配人的运动模式;被广泛地应用于语音识别中,并且最近才被用于匹配人的运动模式; 对对DTW而言,既使测试序列模式与参考序列模式的时间尺度不能完全而言,既使测试序列模式与参考序列模式的时间尺度不能完全 一致,只要时间次序约束存在,它仍能较好地完成测试序列和参考序一致,只要时间次序约束存在,它仍能较好地完成测试序列和参考序 列之间的模式匹配。列之间的模式匹配。 b)
24、隐马尔可夫模型)隐马尔可夫模型HMM:HMM更加成熟的匹配时变数据的技术,更加成熟的匹配时变数据的技术, 它涉及到训练和分类两个阶段,训练阶段包括指定一个隐马尔克夫模它涉及到训练和分类两个阶段,训练阶段包括指定一个隐马尔克夫模 型的隐藏状态数,并且优化相应的状态转换和输出概率以便于产生的型的隐藏状态数,并且优化相应的状态转换和输出概率以便于产生的 输出符号与在特定的运动类别之内所观察到的图像特征相匹配。每一输出符号与在特定的运动类别之内所观察到的图像特征相匹配。每一 个运动类别,对应一个个运动类别,对应一个HMM。匹配阶段涉及到一个特定的。匹配阶段涉及到一个特定的HMM可能可能 产生相应于所观
25、察图象特征的测试符号序列的概率计算。产生相应于所观察图象特征的测试符号序列的概率计算。HMMs在学在学 习能力和处理未分割的连续数据流方面比习能力和处理未分割的连续数据流方面比DTW有更好的优越性,当前有更好的优越性,当前 被广泛地应用于人的运动模式匹配中。被广泛地应用于人的运动模式匹配中。 c)神经网络)神经网络NN:同样是目前比较感兴趣的匹配时变数据的方法,如同样是目前比较感兴趣的匹配时变数据的方法,如 径向基函数网络径向基函数网络 状态空间方法举例状态空间方法举例 Yamato等利用二维小区域块的运动、彩色、纹理等特征进行人等利用二维小区域块的运动、彩色、纹理等特征进行人 的行为识别:人的运动区域块的网格特征被用作学习和识别的的行为识别:人的运动区域块的网格特征被用作学习和识别的 低级特征;学习是利用低级特征;学习是利用HMM来为每个类别产生符号模式;模来为每个类别产生符号模式;模 型参数的优化是利用型参数的优化是利用Baum-Welch算法实现的;识别是以给定序算法实现的;识别是以给定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新疆博尔塔拉蒙古自治州第五师高级中学高一上生物期末质量跟踪监视模拟试题含解析
- 2023年荣昌县辅警协警招聘考试真题附答案详解(突破训练)
- 2024年云浮辅警招聘考试题库及答案详解一套
- 安徽省泗县三中2025-2026学年高二上生物期末达标测试试题含解析
- 北京市一七一中学2026届化学高二上期末学业水平测试模拟试题含解析
- 2025-2026学年昆明市重点中学生物高一第一学期期末预测试题含解析
- 2026届湖南名师联盟高二上化学期末监测试题含解析
- 2026届山东省济南市济南第一中学生物高一上期末监测试题含解析
- 浙江省杭州市七县市2023年物理高二第一学期期末考试模拟试题含解析
- 2025年四川省攀枝花市第十二中学化学高二第一学期期末达标检测试题含解析
- 环境设计景观毕业设计
- 骨科临床新技术实践总结
- 2025年大学《海洋技术》专业题库- 海洋信息技术在海洋资源管理中的应用
- 2025中国邮政校园招聘笔试历年参考题库附带答案详解
- 外墙保温施工成本方案参考
- 中国儿童弱视防治专家共识(2021年)解读 4
- 2025年统编版小学语文四年级上册期中考试综合测试卷(附答案)
- 2025-2030基于数字孪生的焊接机器人虚拟调试平台建设实践
- 放疗基本知识介绍教案(2025-2026学年)
- 厂房网状围墙施工方案
- 11.《牛郎织女》(二) 课件 2025-2026学年 统编版语文五年级上册
评论
0/150
提交评论