




已阅读5页,还剩59页未读, 继续免费阅读
(机械电子工程专业论文)基于隐markov模型的步态识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕十学伊论文 摘要 步态识别作为一种新的生物特征识别技术,通过对人行走姿势的分析实现对个人身 份的识别和认证。相比其他生物识别方法其突出特点是可远距离识别,这也使得步态识 别在身份识别,视觉监控,安全防务等领域有着广阔的应用前景。 隐m a r k o v 模型( h i d em a r k o vm o d e l ,h m m ) 是一种基于随机过程的模型,有着坚实 的数学基础,对预测、模拟随机时序数据性能良好。利用h m m 可以对人体行走过程 中从一个姿势到另一个姿势进行动态的描述,获得较好的识别效果。本文步态识别的研 究内容由3 个部分组成:图像序列预处理,特征提取,h m m 建模。 图像序列预处理包括图像采集、运动检测和图像形态学处理,本文采用一种改进的 背景减除方法分离出人体运动的图像,并且通过形态学处理改善前景运动图像质量。 在特征提取时采用以区域代替边缘的新颖方法,具有较小的计算代价和较强的抗噪 声干扰能力,并且通过k - 均值算法获得一个步态周期中的5 个状态,求每帧和状态的欧 氏距离,进一步压缩观测向量维数,获得等价的低维度特征向量。 在识别阶段,采用高斯混合输出的连续型h m m ,利用k - 均值类聚法建立初始高斯 混合模型,然后利用b a u mw e l c h 算法对初始h m m 模型不断训练求精。采用这种方法对 每一个人通过训练建立其行走姿态h m m 。识别处理时,以待识别步态序列相对于各个 已训练模型的输出概率作为识别依据。 本文采用的步态识别原理方法在详细分析步念的结构特点和运动特征基础上建立 识别模型,h m m 的统计特性决定其在步态的描述和识别中具有很好的稳健性。作者开 发的原型系统在中国科学院自动化研究所提供的c a s i a 步态数据库上进行了步态身份 识别实验,实验结果表明:采用此方法对于小数据库侧面视角下的识别有着较高刚识别 率。 关键词:运动检测,特征提取,h 删训练,步态识别 基于隐m a r k o v 模型的步态识别 g a i tr e c o g n i t i o nu s i n gh i d em a r k o vm o d e l a b s t r a c t g a l tr e c o g n i t i o nr e f e r st oa u t o m a t i ci d e n t i f i c a t i o no fa l li n d i v i d u a lb a s e do nh i s h e rs t y l e o f w a l k i n g ,a n d i t i sa n e w b i o m e 仃i c sr e c o g n i t i o n t e c h n o l o g y p r o m i n e n tc h a r a c t e r i s t i co f g a i t r e c o g n i t i o ni si d e n t i f i c a t i o no fa ni n d i v i d u a lf r o mad i s t a n c e 5 0i th a sab r o a da p p l i c a t i o n p r o s p e c ta ts e c u r i t ys y s t e m ,h u m a ni dm a n a g e m e n t , a n dd i g i t a ls u r v e i l l a n c e h i d e sm a r k o vm o d e l ( h m m ) i sam o d e lb a s e do ns t a t i s t i e s ,a n di th a st h es t r o n g m a t h e m a t i c sf o u n d a t i o n h m mh a saw e l lp e r f o r m a n c ea tf o r e c a s ta n ds i m u l a t i o no fr a n d o m d a t as e q u e n c e u s i n gh m mt ot h eg a i tr e c o g n i t i o nc a ng e tt h ed y n a m i ci n f o r m a t i o nf r o ma s t a n c et om o t h e rs t a n c e ,a n do b t a i naw e l lr e c o g n i t i o ne f f e c t i nt h i st h e s i sg a i tr e c o g n i t i o n p r o c e s s i n gi n c l u d e st h r e ec e n t r a lp a r t s :p r e p r o c e s s i n go f g a i ts e q u e n c e s ,f e a t u r ee x t r a c t i o na n d h m m m o d e l i n g 1 1 1 ep r e p r o c e s s i n go fg a i ts e q u e n c e si se x t r a c th u m a nm o t i o nf r o mg a i tv i d e o i tm a i n l y i n c l u d e sm o t i o nd e t e c t i o na n dm o r p h o l o g i c a lp o s t p r o c e s s i n g a ni m p r o v e da p p r o a c ho f b a c k g r o a n ds u b t r a c t i o ni sp r o p o s e d ,a n dt h e ni m p r o v e sq u a l i t yo ff o r e g r o u n di m a g eb y m o r p h o l o g i c a lp r o c e s s i nt h ef e a t u r ee x t r a c t i o ns t a g e ,r e c o g n i t i o ns y s t e mc a l c u l a t e st h eo u t e rc o n t o u ro fa h u m a ns i l h o u e t t ef e a t u r eu s i n ga r e af e a t u r eo fs i l h o u e t t e ,t h e no b t a i n sf i v ee x e m p l a r sf r o ma g a i tc y c l eb yk - m e a n sa l g o r i t h ma n dc o m p r e s s e sf e a t u r ev e c t o r sb ye u c l i d e a nd i s t a n c e b e t w e e ne x e m p l a r sa n de a c hf r a m e i nt h er e c o g n i t i o np a r t , ah m mw i t hm i x t u r eo fg a u s s i a n so u t p u t si sc o n s t r u c t e df o r e a c hi n d i v i d u a li nae n r o l l e dg a i td a t a b a s e f i r s t , w ei n i t i a l i z eag a u s s i a nm i xm o d e lf o r t r a i n i n gi m a g es e q u e n c ew i t hk m e a n sa l g o r i t h m t h e nt r a i nt h eh m m p a r a m e t e r su s i n ga b a u m - w e l c ha l g o r i t h m w ec a l c u l a t et h eo u t p u tp r o b a b i l i t yo ft h eu n k n o w n g a i ts e q u e n c et o a l le n r o l l e dh m ma n dc h o o s et h ep e r s o nc o r r e s p o n d i n gt om a x i m u mo u t p u tp r o b a b i l i t ya si t s c l a s s i f i c a t i o ni d e n t i f i c a t i o n 1 1 1 ep r o p o s e da p p r o a c hm e t h o da n a l y s e sa n dc a p t u r e sh u m a ng a i ts t r u c t u r ea n dt h e d y n a m i ci n f o r m a t i o n e x p e r i m e n t sa r ei m p l e m e n t e do ng a i td a t a b a s eo fc a s i aa n dt h e e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e da p p r o a c hi sq u i tr o b u s ta n dh a s ah i g hr e c o g n i t i o n r a t ei nc a s i ad a t a b a s e k e yw o r d s :b a e k g r o u n ds e p a r a t i o n ,f e a t u r e se x t r a c t i o n ,h m mt r a i n i n g , g a i tr e c o g n i t i o n 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:芏生盛叠 导师签名:堡垒塞盗 鱼、1 年月日 大连理工大学硕卜学位论文 1 绪论 1 1 生物识别技术 生物识别技术【1 】【2 】( b i o m e t r i ci d e n t i f i c a t i o nt e c h n o l o g y ) 是利用人体生物特征进行身 份认证的一种技术。所选取的生物特征应是唯一的( 与他人不同) ,可以测量或可自动 识别和验证的生理特性或行为方式。生物特征被广泛地应用于人体身份识别领域。目前 己获得应用的生物特征识别,大致上可以分为两种: 生理特征:直接对人体进行测量得到的特征。到目前为止最为明显的最为成功的生 理特征包括指纹、脸部、虹膜、掌纹等。 动作特征:基于人体动作提取出来的特征。这些特征不能直接得到,最主要的特点 是具有时间性。已经建立的测量包括笔迹、声音模式等,步态特征属于人体动作特征中 典型的一种。 生物识别系统对生物特征进行取样,提取其唯一的特征并且转化成数字代码,并进 一步将这些代码组成特征模板,识别系统交互进行身份识别时,系统首先获取其特征并 与数据库中的特征模板进行比对,以确定是否匹配,从而决定接受或拒绝该人。 生物识别技术是目| i 最为方便与安全的识别技术,它不需要记住复杂的密码,也不 需随身携带钥匙、智能卡之类的东西。生物识别技术认定的是人本身,没有什么能比这 种认证方式更安全、更方便了。由于每个人的生物特征具有与其他人不同的唯一性和在 一定时期内不变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身份认定,安 全、可靠、准确。此外,生物识别技术产品均借助于现代计算机技术实现,很容易配合 电脑和安全、监控、管理系统整合,实现自动化管理。 生物识别技术可广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务 等领域。例如,一位储户走进了银行,他既没带银行卡,也没有回忆和提供密码就可径 直提款。当他在提款机上提款时,一台摄像机对该用户的眼睛扫描,然后迅速而准确地 完成了对用户的身份鉴定,办理完业务,该营业部所使用的正是现代生物识别技术中的 “虹膜识别系统”。美国政府在“9 1l ”以后连续签署了3 个国家安全法案,要求必须采用 生物识别技术。2 0 0 3 年6 月,联合国国际民用航空组织公布了生物技术的应用规划,规 划提出,将在个人护照中加入生物特征( 指纹识别、虹膜识别、脸像识别) ,并在进入 各个国家的边境时进行个人身份的确认。目前,此规划己在美国、欧盟、澳大利亚、日 本、韩国、南非等地区和国家通过,并在2 0 0 4 年底开始实施。国际航空组织的这项规 划表明,生物特征认证技术开始进入大规模成熟应用阶段。 基于隐m a r k o v 模犁的步态识别 在不远的将来,人们将会购买越来越多的i t 产品,它们有内置的智能生物识别设 备,这样就可以为日常活动提供生物识别功能,例如进入家庭或办公室,启动交通工具, 登陆计算机,用移动电话通话等。可以预计,生物识别将成为最受欢迎的身份确认方法。 1 2 步态识别 1 2 1 步态识别概述 步态【3 】是人行走的方式和风格,每个人有截然不同的走路姿势,因为人们在肌肉的 力量、肌腱和骨骼长度、骨骼密度、视觉的灵敏程度、协调能力、经历、体重、重心以 及个人走路风格上都存在细微差异,要模仿另一个人走路姿势非常困难。步态识别旨在 不考虑衣服、视角、背景等情况下根据人们走路的姿势进行人的身份识别。 步态识别可以在远距离非接触的状态下进行,步态作为一种生物特征,比其它的生 物识别技术有着如下几个优点:非侵犯性、远距离识别、对系统分辨率要求低、难以隐 藏性。 由于人的行走步态的非接触性、可感知性和难于伪装的非侵犯性,因此在计算机视 觉监控系统中可以选择它们作为生物特征用于一定距离时的身份识别。作为一种新的行 为特征,步态还具有难于隐藏和伪装、易于捕捉等优点,而且它也是一定距离时唯一可 感知的行为特征。当然,像其它生物特征一样,步态也会受到一些诸如醉酒、怀孕、关 节受伤等物理因素的影响。 步态识别在人机接口、安全监控、视频会议、医疗诊断等方面均具有广泛的应用前 景,它激发了广大科研工作者及相关商家的浓厚兴趣。步态识别最有前景的潜在应用之 一是视觉监控。智能监控系统的需求主要来自那些对安全要求敏感的场合,如银行、商 店、停车场、军事基地等。动态场景的视觉监控是从摄像机摄取的图像序列中检测、识 别、跟踪目标并对其行为进行理解。区别于传统意义上的监控系统,这里所说的视觉监 控在于其智能性。简单而言,不仅用摄像机代替人眼,而且用计算机代替人、协助人, 来完成监视或控制任务。 美国9 1 1 事件后,反恐怖活动已成为各国政府的共识,加强机场的安全防务受到各 国的重视,步态识别技术的使用,将增强人们对重要场所的安全监测能力,有助于人们 防御来自恐怖分子的袭击。 1 2 2 步态识别研究内容 基于步态的远距离身份识别涉及到人的步态获取和运动分割、步态运动跟踪、步态 行为识别三个主要步骤,本文将在运动分割、图像处理、识别算法等方面进行深入研究。 2 大连理t 大学硕士学位论文 步态识别流程如图1 1 框图所示,步态识别研究的主要内容有如下几个方面。 视频监控 u 运动检测 j 形态学处理 特征提取 u 步态识别 图1 1 步态识别流稃图 f i g 1 1b l o c kd i a g r a mo f g a i tr e c o g n i t i o n ( 1 ) 高效的图像处理。包括图像增强,填充,去除孤立噪声点,二值化,归一化等 贯穿整个识别处理的过程,是整个研究的基础性工作,对后续特征建模与识别工作影响 较大。 ( 2 ) 运动检测,准确地分离出背景,获得人体运动侧面图像,对复杂背景下,如何 排除或者尽可能降低光照变化,阴影等造成的影响尤为重要。 ( 3 ) 特征提取与描述,需寻求一个稳定,算法复杂度较低的模型描述个体的步态特 征。 ( 4 ) 识别认证方法。对于步态特征这种典型的时变数据,动态时间规e ( o t w ) 和隐 m a r k o v 模型等方法是有效的分类识别方法。 基于隐m a r k o v 模璎的步态识别 1 2 3 步态识别研究现状 步态识别是生物特征识别技术的一个新兴子领域。在远距离的情况下,脸像、指纹、 虹膜等生物特征将不可能被使用,此时,人的步态仍是可见的,且它可在被观察者没有 觉察的情况下从任意角度进行非接触性的感知和度量。因此,从视觉监控的观点来看, 步态是远距离情况下最有潜力的生物特征。 步态识别国际上的研究始于9 0 年代,现在正越来越受到关注,如2 0 0 0 年美国国防高 级研究项目署d a r p a 的h i d ( h u m a ni d e n t i f i c a t i o na tad i s t a n c e ) 计划,美国五角大楼也正 拟定采用步态识别技术进行反恐。国际上的主要研究机构包括英国的南安普敦大学以及 美国的麻省理工学院、卡内基梅隆大学、佐治亚理工学院、马里兰大学等2 6 家高校和公 司在h i d 计划驱动下于2 0 0 0 年开始步态识别研究。另外,中国、日本、加拿大、瑞士等 国家的一些高校或研究机构也开始了这方面的探索。 国内关于步态识别的研究开展较晚。2 0 0 0 年以后,以中科院自动化所模式识别实验 室为代表的少数几家研究机构开始进行步态识别的研究工作。近年来,中国科学院自动 化研究所生物识别与安全技术研究中心以及中国科学院自动化研究所模式识别国家重 点实验室视觉监控研究组作了大量的研究工作,在步态识别,远距离身份识别,视频监 控等方面取得了大量研究成果,发表了多篇论文,其产品已开始应用于安全监控等领域。 为了推进步态识别研究的发展,中国科学院自动化研究所免费提供c a s i a 步态数据库的 下载。目前,已有多家单位相继投入了步态识别的研究,主要包括哈尔滨工业大学、西 北工业大学、西安电子科技大学、北京工业大学等多所国内著名大学。 然而,这些工作1 4 - 2 7 1 并不是完全的应用系统开发,而更多的是原理性探索。也就是 说,步态识别技术目前仍处于起步阶段,其特点为: ( 1 ) 实验通常是在受限的条件下实现的,如相对简单的背景,相对于摄像机方位, 采集是人的侧面行走图像等。 ( 2 ) 算法评估都是在小样本数据库上进行的。 1 3 论文安排 论文安排如下: 第1 章绪论,本章主要介绍生物识别技术和步态识别的背景和应用,介绍步态识 别的主要研究内容以及国内外研究现状。 第2 章步态识别方法概述,本章介绍目前步念识别的分类和常用方法,以及常用 的步念分类识别算法。 大连理工大学硕十学位论文 第3 章隐m a r k o v 模型研究,这一章详细地介绍隐m a r k o v 模型的概念,基本算法 及应用。 第4 章步态图像预处理,包括运动检测和形态学处理,采用一种改进的运动检测 方法得到运动区域图像,并且采用有效的数学形态学方法改进所获得运动图像的质量。 第5 章基于h m m 的步态识别,首先实现一种新颖的特征提取方法获得步态特征 向量,并分析步态行为特点和h m m 可行性,然后应用h m m 于步态的分类与识别。 最后对全文所作工作进行了总结与展望。 基于隐m a r k o v 模型的步态识别 2 步态识别研究方法 步态识别主要是针对含有人的运动图像序列进行分析和处理,通常包括运动的分割 与分类,特征提取与描述,步态识别几个过程。根据特征选取方法的不同,步态识别方 法一般分为基于模型和基于特征两种。 2 1 基于模型的步态识别方法 基于模型的步态识别方法预先建立模型,通过模型和二维图像序列的匹配获得模型 参数,则参数的比较结果等价于识别结果。 目前所使用的主要模型有椭圆模型,线图模型等,下面进行简要介绍。 ( 1 ) 椭圆模型 4 1 l e e 首先对人体侧面投影所构成轮廓图像进行二值化处理,依据质心比例关系将人体 分成7 个部分用椭圆对每一部分建模,以椭圆的质心、离心率等参数作为反映人体步态的 特征参数。采用七个椭圆表达人的侧面二值化图像的身体的不同部分,每个部分用一个 椭圆表示。 圜氛 图2 1 椭圆模型 f i g 2 1e e l l i p s e sm o d e l 对于任意一个椭圆区域f g ,y ) ,则该椭圆区域的质心为 ;2 专善7 g ,y h 了2 专善,b ,y b n 为该区域内所有像素总数 = 1 ( x ,y ) 一6 ( 2 1 ) ( 2 2 ) ( 2 3 ) 大连理工大学硕士学位论文 该区域的协方差矩阵为 m a = 专渺,t 鬈歹) g 离- ) 该协方差矩阵的特征值 ,五与对应的特征向量q ,v :指示椭圆长短轴的长度和 方向。特征值之比,与长轴的方向口如下: ,:生 如 弘础一s ( 下v io 荆x x 表示单位矢量 1 ,o 】,则对于每一帧的步态特征矢量可以用下式表示 北) = ( _ ,_ ,i ,q ) f = 1 ,7 上面的2 8 个特征,加上整个身体的质心y 坐标共有2 9 个特征表示一帧步态图像, 个特征作为步态识别的特征。 ( 2 ) 线图模型【5 】 ( 2 5 ) ( 2 6 ) ( 2 7 ) 以此2 9 根据解剖学的知识获得相应的脖颈、肩胸、骨盆、膝盖和脚踝的高度比例。 利用线段表示身体的不同部分,在图像序列中跟踪各个部分的摆动角度,利用摆动 的角度作为特征进行步态识别。 图2 2 线图模型 f i g 2 2l i n e sm o d e l ( 3 ) j a n g h e e 6 1 对人体模型做了更细致的分析。首先提取人体运动轮廓,根据人体特 征确定骨盆、膝盖和脚踝的大致垂直位置。膝盖的位置在提取步态特征时非常重要,因 此需要精确定位。精确定位膝盖位置的方法是,在膝盖垂直位置上下扫描,依据( 1 ) 在x 轴上,膝盖距离人体前进方向最近,或者距离前进的相反方向最远;( 2 ) 另外后面膝盖 的垂直位置应该等于或大于前面的垂直位置,确定其位詈。确定膝盖位置后,步态上半 基丁隐m a r k o v 模犁的步态识别 部分数据可以从骨盆和膝盖之问提取,下半部分数据从膝盖到脚踝之间提取。所使用的 特征数据是骨盆和膝关节分别连接的两部分之间的角度。分类识别阶段采用后向神经网 络。 基于模型的方法有人体生理理论基础,可供识别的步态特征非常多。研究表明考虑 全部的步态特征每个人的步态是唯一的1 7 1 。基于模型的方法在某种程度上能处理遮挡和 噪声。模型化不足之处是提取特征方法比较复杂;对人体区域分割要求比较高;有些特 征很难提取。 2 2 非模型化的步态识别方法 非模型化方法不需要构建模型,而是先对待研究的对象提出假设,然后用图像序列中 目标移动所产生的时空模式的各类统计值,从步态中提取特征参数。 ( 1 ) 最早的非模型化方法是根据步态的时空相关特性得到步态信号【8 j 。在x t ( t r a n s l a t i o n a n d t i m e ) 空间,头部和腿步有不同的运动模式。依据这些模式提取人体运 动的轮廓边界,使用有5 个部分的人体模型进行匹配,得到步态模型。对模型进行速度 上的归一化处理得到步态信号,再使用线性插值方法计算归一化的步念矢量。计算各个 对象步态矢量的平均值作为聚类中心。识别时,使用欧氏距离测量待识别对象和各样本 聚类中心之间的距离,把待识别对象和距离最小的归为一类。这种方法在5 个人2 6 个序 列的数据库上测试,使用不同权值的欧氏距离测量法,正确分类率在6 0 - 8 0 之间。 ( 2 ) 文献【9 ,1 0 】中作者采用所谓的z e r n i k e 速度矩来描述和识别运动的物体,并将 z e m i k e 速度矩应用到步态识别当中。 z e m i k e 速度矩如下式所示 i m a g e * mn 啪一= 矿c 名 t = lx = ly = l c = g 一一y 一y ,y y :g 一石广侈一石, 式中的i 表示帧序号,每一帧图像的大小为m x n i = 击善 万= 击善m 归一化的速度矩为 ( 2 8 ) ( 2 9 ) ( 2 1 0 ) ( 2 1 1 ) ( 2 1 2 ) 大连理丁大学硕士学位论文 例m = 堕 ( 2 1 3 ) 以 式中a 为运动目标的平均面积,i 为图像的数目。 ( 3 ) l i u l e 和b o y d i l 使用光流法提取步态信号,它是一种统计的方法。光流方法描 述瞬时运动形状,包括运动物体的形状( 空间) 和运动的形状( 时间) ,可以从运动形 状的周期性差异区别不同的步态。首先从n + l 幅图像计算出胛幅光流图像。使用尺度无 关的矩描述光流图中的空间形状分布,得到图像的m 个矢量,对于序列图像可以求出一 个特征矢量。不同对象的矢量有基本相同的周期特征和不同的相位特征,相位特征差别 很大,足够表现出不同个体步态之间的差异。训练时计算各样本特征矢量的平均值作为 聚类中心,识别时计算待识别序列矢量和每个聚类中心的距离,采用最近邻法则,把序 列归类到距离最近的类中。在小数据库上,本方法达到9 0 的识别率。 ( 4 ) 文献【8 】提出了p c a 方法,此方法也是利用运动步态图像的时空相关特性,但是 采用参数空间的方法降低计算量,增强了健壮性。首先提取步态轮廓,用轮廓点位置矢 量表示步态空间特征。对步态序列的矢量组进行主分量分析( p c a ) 得到步态特征的压 缩表示,然后把它映射到参数空间。识别时计算待识别序列的特征值和样本序列特征值 之间的距离,选择距离最小的归为一类。在7 人数据库上,1 6 个特征矢量识别率达到 1 0 0 ,8 个矢量识别率为8 8 。p c a 对噪声健壮,但它没有统一的模型,如果训练时发 生错误,就很容易造成错误的识别。这种方法在文献【1 2 】中得到发展,使用c af 规范化 分析) 提高识别能力。 ( 5 ) h a y f r o n - a c q u a h 掣”】使用广义对称性( s y m m e 仃y ) 算子分析人体运动的时空对称 性。这种方法的根据来源于心理学家的观点,即步态是对称性的运动模式。对称性算子 不依赖于形状,而是通过它们的对称特性来定位特征。原有对称性算子只能计算空间的 对称性,文献 1 3 】对其进行扩展,加入步态的时间对称性信息( 周期性) 。广义对称性 表示步态的时空特征对于噪声和丢帧相对不敏感,具有一定程度上处理遮挡的能力,对 于低分辨率的图像也能很好得处理,因此识别率比前期的高。 根据以上的文献采用的非模型化方法,总结出非模型化方法的主要特点如下: 1 理论上大都采用在模式识别领域成熟数学方法,如傅立叶描述子、h m m 和主元 分析( p c a ) 等。 2 不同于模型化方法把人体分割几部分,非模型化方法考虑人提步态轮廓的整体特 征。 3 采用时空相关思想,使用数学方法表示步态的空问特征和步态序列所表现出的时 问特征本文提出的方法也是采用时空相关思想,以h m m 对时变特征数据集建模。 基丁隐m a l k o - , 模犁的步态识别 文献【1 4 】提出一种结合非模型化方法和基于模型方法的方法,它基于面积度量的步 态掩码( g a i tm a s k ) 。通过变换人体轮廓来获得相关于个体步态的信息。使用掩码把步态 轮廓分割成很多区域,通过度量掩码区域内的面积变化获取步态特征。 多角度步态识别方法在文献【1 8 】中做了初步研究,以前的研究使用的人体运动图像 都是正侧面的,文献【1 5 】的图像序列分别从不同的角度获取。它以一个参考对象做研究 对象,得出把不同角度图像转换的同一角度图像的方法,提取在各种角度下都不改变的 静态特征作为识别特征。还提出“期望混淆”的概念来表示识别中表现的不确定性,期望 混淆的值越小识别性能越好。文献【1 6 】中对多角度识别进行研究,而且还考虑到携带物体 ( 试验者携带一个球) 时的情形。文献 1 7 】考虑到人体相对摄像平面倾斜4 5 度时情形。 文献【1 8 】提出步态和脸部相结合识别个人的方法,使用多个摄像头构建人体的三维 图像,提取步态特征和脸部特征用于识别。 2 3 步态分类识别算法 目| j 所使用的步态分类识别方法主要有子空间变换法,动态时间规正法,隐m a r k o v 模型等。其中动态时间规整与隐m a r k o v 模型在处理时变数据时具有非常出色的效果。 2 3 1 子空间变换法 ( 1 ) 主元分析法( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 主元分析的目的是通过线性变 换寻找一组最优的单位正交向量基( 即主元) ,用它们的线性组合来重建原样本,并使重建 后的样本和原样本的误差最小。在数学上,主元分析就是通过解特征值问题来对角化协方 差矩阵。选择其若干个非零特征值( 数量远小于原始尺寸) 的特征向量作为主元。因此原 空间的样本就可以用低维主元子空日j 的投影系数来描述。主元分析中主元选取的优先级 通常是按对应的特征值大小来确定的,特征值越大,其优先级就越高。但是就步态识别而 言,最佳应该选择多少个主元目前没有定论。 尽管主元分析方法在步态识别中取得了不错的效果,但是由于它是以所有样本的最 优重建为目的,因此对于描述不同类样本之问的差异而言,它不一定是最优的描述。从这 个意义上说,用它来描述步态识别的特征还不是最佳选择。 ( 2 ) 线性判决分析( l i n e a rd i s c r i m i n a n ta n a l y s i s ,l d a ) 线性判决分析以样本的可分性为且标,寻找一组线性变换使每类的类内离散度最小, 并且使类间的离散度达到最大。因此适合模式分类识别问题。经典的线性判别分析中使 用的是f i s h e r 准则函数: t ,( w ) :a r g m a x 芝皇盟( 2 1 4 )+ w w 。s 。w l 大连理工大学硕士学位论文 其中类问离散度瓯和类内离散度昂为: 配= m 以一) 一y ( 2 1 5 ) i - ! fm , s ,= 一一k 一“y ( 2 1 6 ) l = l3 = 1 由矩阵理论可知, ) 得求解等同于求1 s b 的特征值问题。 人脸识别和步态分析地应用表明基于主元分析法的特征空间变换法对于降维映射 是行之有效的,但缺乏有利于提高分类效率的数据分析能力,而线性判决分析能够增大类 间距、缩小类内距,因此有利于提高分类能力。因此,结合主元分析法的数据降维能力和 线性判决方法的分类能力,对步态识别具有重要意义。 2 3 2 动态时间规整 动态时间规整( d y n a m i ct i m ew a r p i n g ,d t w ) 是一种柔性模式匹配算法,能够对存在 全局或局部扩展、压缩或变形的模式进行匹配,解决动态模式的相似度量和分类问题。 早期被广泛的应用于语音识别领域,具有概念简单、算法鲁棒的优点。利用d t w 可以 在测试序列与参考序列的时间尺度不一致的情况下较好地完成测试序列与参考序列之 间的模式匹配。 在正常的步行状态下,步态呈现可重复性,近似于呈现周期特征;另一方面,现实步行 中存在着速率变化的现象,即同一个人步行的速率不能唯一确定,样本的采样也只能取部 分速率和方向的样本序列,不可能取得所有速率的步态样本序列。因此,样本待测序列和 样本序列的匹配呈现动态而非静态特性。 2 3 2 隐m a r k o v 模型 隐m a r k o v 模型是一种描述随机过程统计特性的概率模型,由马尔可夫链演变发展而 来。h m m 实际上是一种状态隐含,观察序列可见的双随机过程,即对应的有限m a r k o v 状态是隐含的,所能见到的是与这些状态依概率相关的一系列观察值,通过特征空间的 概率函数描述观察值。h m m 不仅状态到状态之问的转移是随机的,而且每一个状态的 观测符号也是随机的,它不仅可以考虑测量数据的序列相关性,同时能够考虑测量数据 的非高斯性以及测量过程中随机因素的影响。 h m m 作为一种信号时间序列统计模型,目前己经成为信号处理领域中一个重要的 研究方向,特别在语音信号处理领域得到了深入的研究与具体应用,是实现语音识别的 一种主流技术。 步态识别中,隐m a r k o v 模型作为状态空间模型的一种方法,它定义每个标本帧( 样 基丁隐m m k o v 模型的步态识别 本) 作为一个状态,这些状态之间通过某种概率联系起来。因此,一个步态序列可以被认 为是不同标本帧的各种状态的组合,然后利用联合概率作为行为归纳的判别准则。用对应 于不同状态的特征向量来描述人的结构特性同时用转移矩阵模拟状态闻的转换来表征 人体步态的动态特性。本文采用隐m a r k o v 模型作为匹配识别方法,在本文第三章对隐 m a r k o v 模型进行了详细的介绍。 2 4 本章小结 本章概述了目前所应用于步态识别的特征选取方法和匹配算法。 1 介绍了椭圆模型,线图模型等基于模型的特征提取方法。 2 介绍了非模型的特征选取方法。 3 概述了子空间变换法,动态时间规整,隐m a r k o v 模型等广泛应用的模式识别算 法。 大连理 大学硕十学位论文 3 隐m a r k o v 模型原理 3 1h m m 基本思想 3 1 im a r k o v 链 m a r k o v 过程脚1 1 2 9 1 描述的是一类重要的随机过程,它是由俄国有机化学家v l a d i m i r v a s i l e v i e hm a r k o v n i k o v 于1 8 7 0 年提出来的。如果一个过程的“将来”仅依赖“现在”而不 依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程,时间和状态都离散 的马尔科夫过程称为马尔科夫链。 数学上可以给出如下定义:随机序列以,在任一时刻疗,它可以处在状态岛,以, 且它在m + k 时刻所处的状态为q 。的概率,只与它在m 时刻的状态q 。有关,而与m 时 刻以前它所处的状态无关,即: 尸似。+ 。= q 。+ 。i 以= q m , x m 。= g 。,j 严吼) = 尸c k + 。= q 槲i 以= q 。)( 3 1 ) 其中q l , q 2 ,q 。,g m ,岛,氏) 则称x 。为m a r k o v 链,并且称: 只,埘+ 七) = p ( g 。+ 。= qi q 。= 只) 1 f ,n ( 3 2 ) 为k 步转移概率,当只沏,历+ 七) 与m 无关时,称这个m a r k o v 链为齐次m a r k o v 链, 此时有: 只,坍+ t ) = 只0 ) ( 3 3 ) 当k = 1 时,乞( 1 ) 称为步转移概率,简称为转移概率,记为口。,所有转移概率, 1 f ,j s a ,可以构成一个转移概率矩阵,即: 口l i 口l f 0 f 茎1 2 l 口:。:口二j 并且有1 姜= 3 4 由状态转移概率矩阵a 可以得到ka 步转- 移概率只,( 女) 。为了完全描述m a r k o v 链,除 矩阵之外,还必须引进初始概率矢量万= 仞l ,一,“) ,其中: ,r ,= p ( q l = 只 l i n( 3 5 ) 显然有: o 一1 ,互= 1 ( 3 6 ) 基丁:隐m o x k o v 模型的步态识别 由万,a 共同描述一个m a r k o v 链。 3 1 2i - i m m 概念 在实际问题中,状态经常是不确定或不可见的,只有通过观测序列的随机过程才能 表现出来,观察到的事件与状态也并不是一一对应,而是通过一组概率分布相联系。于 是引入更贴近实际问题的h m m ,h m m 是一个双重随机过程,它由两个部分组成: ( 1 ) 马尔可夫链:描述状态的转移,用转移概率描述; f 2 ) 一般随机过程:描述状态与观察序列问的关系,用观察值概率描述。 其组成关系如图3 1 所示。 在m a r k o v 链模型中,观察值和状态一一对应,观察者观察到了观察值,也就知道 了这个观察值所处的状态。而在h m m 模型中,观察值和状态不是一一对应的,观察 者只能看到观察值,不能直接看到状态,只能通过一个随机过程去感知状态的存在及其 特性。即如果得到一个观察值序列o = d l ,o :,o ,由于观察值与状态不是一一对应的, 因此不能由此观察值直接得到状态序列q = q l , q :,q ,若要得到实际的状态序列,必 须要知道观察值在每种状态中的分布情况,状态的初始概率,以及状态转移概率矩阵, 并通过一些算法( 如v i t e r b i 算法) 来进行估计。 im a r k o v 链 状态序列 随机过程 观察值序列 仁,爿)p ) g l ,9 2 ,g r o l ,d 2 ,d r 图3 1 骶:组成示意图 f i g 3 1s t r u c t u r eo f h m m h m m 可以利用一个模型五元组来描述: 五= ( n ,m ,以a ,b j ( 3 7 1 或者简写为 五= ( 万,a ,b ) ( 3 8 ) 下面以著名的球和缸来进一步说明h m m 的基本原理以及参数的含义,如图3 2 所 示,设有个缸,每个缸中装有肘个彩球,球的颜色由一组概率分布描述。 大连理工大学硕士学位论文 缸1缸2 缸n 难) = 6 l 。难) = 岛。 难) = 6 觚 尸防) = 6 u 尸l ) = 占尸( 咎) = 门 ;i ;i p = 户陋) = 6 删尸= 专肼 图3 2 球和缸模型 f i g 3 2a nn s t a t eu ma n db a l lm o d e l 实验进行方式如下: ( 1 ) 根据初始概率分布,随机选择个缸中的一个开始实验; ( 2 ) 根据缸中球颜色的概率分布,随机选择一个球,记球的颜色为d 1 ,并把球放回 缸中; ( 3 ) 根据描述缸的转移的概率分布,随机选择下一口缸,重复以上步骤。 最后得到一个描述球的颜色的序列0 l ,0 2 ,o r ,称为观察值序列0 。 在上述实验中,有几个要点需要注意( h m m 约束) : ( 1 ) 不能被直接观察缸自j 的转移; ( 2 ) 从缸中所选取的球的颜色和缸并不是一一对应的; ( 3 ) 每次选取哪个缸由一组转移概率决定。 h m m 参数的含义如表3 1 所示。 表3 1 删参数说明表 t a b 3 1t a b l ef o rh m m p a r a m e t e r se x p l a i n i n g 基于隐m a m o v 模犁的步态识别 3 2h m m 主要算法 上节给出了h m m 的基本概念,在实际应用中,h m m 需解决如下三个问题嘲唧: ( 1 ) 给定观察序列o = o i ,0 2 ,研,以及模型丑= 0 ,b ,石) ,如何计算j p ( d 1 a ) ,常 用的算法有前向后向算法和v i t e r b i 算法。 ( 2 ) 对于给定的观察序列0 = d l ,0 2 ,o r ,以及模型a = 0 ,b ,万) ,求模型五对应于 观察序列d 的最佳状态序列q = q l , g :,q ,即寻找使p ( d i a ) 达到最大时,o 所对应的 状态序列。一般采用v e r t e r b i 算法求解。 ( 3 ) 如何调整模型参数a = 0 ,b ,万) ,使得p ( d i 旯) 最大。一般采用b a u m w e l c h 算法。 3 2 1 前向后向算法 问题l 是一个估值问题( e v a l u a t i o np r o b l e m ) ,给定一个观察序列和模型,计算给 定模型产生给定观察序列的概率。这个问题也可以用来衡量给定模型和给定观察序列的 匹配程度。例如有几个模型可以选择的时候,问题1 的方法可以选择一个与给定观察序 列最佳匹配的模型。前向后向算法可以解决这个问题。 前向后向算法用来计算给定一个观察值序列o = o i ,0 2 ,o r ,以及一个模型 五= 防,a ,口) 时,由模型五产生出o 的概率尸( d i 五) 。 根据概率论中的知识,可以直接计算e ( o i 丑) 如下: 给定一个固定的状态序列s = ( g ,q :,g f ) ,有 r p ( o l s ,五) = 丌p ( o fq t , 2 ) = b q ( o i 弘。:( d 2 ) 协) ( 3 9 ) t = l 气,研) 表示在毋状态下观察到q 的概率。 对给定的五,产生s 的概率为 尸pla ) =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年周口鹿邑县招聘幼儿园教师真题
- 2024年湘潭市市直事业单位招聘真题
- 产品运输方案
- Unit 2 Period 4 Section B(1a-3c)重难知识导学和精练(原卷版)
- 2025宠物领养合同书
- 2024年湖北社区《网格员》考前模拟题(含答案)
- 2024年设备监理师考试题库及参考答案
- 提升练:2.3.1 课时1 乘方
- 新能源模拟题库与答案
- 咸阳师范考试试题及答案
- 江苏拱棚施工方案设计
- 2025版国际双语幼儿园托班入托服务合同
- 2025年巨量引擎医药健康行业营销白皮书
- 氯化钾使用护理课件
- (高清版)DBJ∕T 13-318-2025 《建筑施工盘扣式钢管脚手架安全技术标准》
- 2025年天津市中考数学试卷(含标准答案及解析)
- JJF1033-2023计量标准考核规范
- 部编人教版六年级道德与法治上册全册教学课件
- 培训反馈意见表
- 商业银行资产管理与负债管理
- 电力系统分析孙淑琴案例吉玲power程序实验指导书
评论
0/150
提交评论