(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(电路与系统专业论文)基于简单固定背景图像特征的人数统计[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆大学硕士学位论文中文摘要 摘要 基于图象处理的机器视觉与智能识别技术是图象处理的前沿和人工智能研究 领域的重要分支,机器识别的方法在于研究合适的计算模型,然后利用机器来实 现简单的智能判决。本文以“人”目标的检测为研究对象,采用归一化方案和主动轮 廓算法提取采样图象中的目标信息,即图象特征,并利用一定的先验知识对该信 息进行判断,达到检测和识别“人”目标的目的。 目标检测是识别的前提工作,本文通过加权灰度分析寻找一个可以逼近我们 感兴趣目标的图象点( 即目标点) ,并在此基础上建立直角坐标系,分割采样图, 解决多个目标检测的问题。 目标匹配是目标跟踪,识别领域的基本思想,在本课题中鉴于采样图获取目标 的位置,角度和形态差异,直接进行目标匹配显然是不可行的。本文采用归一化 的思想,通过角度修正,坐标平移和坐标伸缩,得到目标的标准尺寸和形态。与 传统归一化算法的区别在于,本文并不采用某个标准模板作为参考,因而可以防 止非“人”目标在归一化之后具有和人”目标相似的尺寸和形态。 轮廓检测一直是目标的识别算法中最基本也最困难的问题,传统的轮廓检测方 案往往受采样图的实际效果影响较大,造成提取轮廓模糊或存在断点乃至严重的 轮廓失真。通常的解决方案是采用相应的后续修正算法,让目标轮廓尽量保持连 续。本文在目标归一化的基础上,采用主动轮廓算法,较好的解决了轮廓对目标 的贴近及其本身连续性问题,避免了复杂的后续修正工作。 通常情况下的目标识别往往可以对识别过的目标进行标记或能很快提取其不 变特征,不至于影响其他目标判断。然而“人”目标的形态会随时间发生随机的改变, 不容易提取其不变性特征,鉴于人数统计的客观要求,不能容许对同一个人重复 计数。本文通过对上一次目标检测和目标识别的结果以及当前目标检测结果进行 综合验算的方法,来判断是否对当前采样图进行识别判断,在解决了重复计数问 题的同时大大降低了系统的实时处理数据量。 关键词:目标检测,归一化,主动轮廓,计数 重庆大学硕士学位论文 英文摘要 a b s t r a c t t h et e c h n o l o g yb a s e do ni m a g ep r o c e s s i n ga n dm a c h i n ev i s i o ni si nt h ef o r e f r o n to f t h ei n t e l l i g e n tr e c o g n i t i o no f i m a g ep r o c e s s i n ga n di ti st h ei m p o r t a n tr e s e a r c hb r a n c h o fa r t i f i c i a li n t e l l i g e n c ep l a n t t h ei d e n t i f i c a t i o n a lm e t h o di st of i n das u i t a b l em o d e l , a n dt h e nu s i n gm a c h i n e st oa c h i e v es i m p l ei n t e l l i g e n tj u d g m e n t i nt h i sp a p e r , w es t u d y t h er e c o g n i t i o na n d j u d g e m e n to f t h et a r g e to f h u m a nb e i n g s w eu s et h en o r m a l i z a t i o n p r o g r a ma n da na c t i v ec o n t o u rt oe x t r a c ta l g o r i t h mi n f o r m a t i o no f t h eo b j e c ta n di m a g e c h a r a c t e r i s t i c sf r o ms a m p l i n gi m a g e t h e n , w em a k eu s eo fs o m ep r i o rk n o w l e d g eo f t h i si n f o r m a t i o nt or e a c ht h ej u d g e m e n tw h i c hc a u s et ot h ei d e n t i f i c a t i o no f ”p e o p l e ” g 0 a l s t a r g e td e t e c t i o ni st h ep r e m i s eo fr e c o g n i t i o n a c c o r d i n gt og r a yw e i g h t e d a n a l y s i sw ec a nf i n da ni n t e r e s t i n gt a r g e tw h i c hi sc l o s et o1 骆t h ei m a g ep o i n t ( t h a tm a y b et h eg o a lp o i n t s ) o nb a s i so ft h i s ,w ec a ne s t a b l i s h m e nac a r t e s i a nc o o r d i n a t e sa n d s e g m e n tf r o mt h es a m p l i n gi m a g et os o l v et h en u m b e r so f t a r g e t sd e t e c t i o np r o b l e m t a r g e tm a t c h i n ga n dt a r g e tt r a c k i n gi st h eb a s i ci d e o l o g yo f i d e n t i f i c a t i o na r e a , i nt h el i g h to ft h ei s s u eo fu n c e r t a i n e ds a m p l i n gi m a g e i ti sh a r dt o g a i nt h ep o s i t i o n , m o r p h o l o g i c a ld i f f e r e n c e si np e r s p e c t i v e s om a t c h i n gt h et a r g e td i r e 碰l yi so b v i o u s l y n o tf e a s i b l e i nt h i sp a p e r , i n c o r d i n gt ot h ei d e ao fn o r m a l i z a t i o np r o g r a m s u c h 鹪 a n g l ec o r r e c t i o n ,c o o r d i n a t et r a n s l a t i o na n dt e l e s c o p i cc o o r d i n a t e s ,w ec 锄o b t a i n s t a n d a r ds i z e sa n ds h a p e so fo b j c e t s i nad i f f e r e n tw i t ht r a d i t i o n a la l g o r i t h m ,i td o e s n t u s es t a n d a r dt e m p l a t e sa sar e f e r e n c e t h u sw ec a n p r e v e n tt h eo t h e rt a r g e t sf r o mg e t t i n g s i m i l a rs i z ea n dm o r p h o l o g yo f p e o p l e t a r g e t s c o n t o u rd e t e c t i o ni sa l w a y sb et h ei st h em o s tf u n d a m e n t a la n dm o s td i f f i c u l t p r o b l e mo fo b j e c t i v er e c o g n i t i o na l g o r i t h m ,t r a d i t i o n a lc o n t o u rd e t e c t i o np r o g r a mo r e n s u f f e r sf r o mt h ei n a c t u a lr e s u l t so fs a m p l i n gm a pg r e a t l y , w h i c hc a u s e sf u z z yr e s u l to f c o n t o u re x t r a c t i o na n db r e a k p o i n t si nc o n t o u ro re v e ns e r i o u sd i s t o r t i o no f t h ec o n t o u r s t h eu s u a ls o l u t i o ni st oa d o p tc o r r e s p o n d i n ga m e n d m e n t st ot h ef o l l o w - u pa l g o r i t h m s f o ro b j e ac o n t o u r st 0m a i n t a i nc o n t i n u o u s b a s e do nt h eg o a lo fn o r m a l i z a t i o na n d a c t i v ec o n t o u ra l g o r i t h mi s s u ei nt h i sp a p e r , w oc a l ls o l v et h ep r o b l e mt og e tp r o f i l eo f t h et a r g e tc l o s et oh i so w nc o n t i n u i t ya n dv o i dt h ec o m p l e xf o l l o w - u pr e c t i f i c a t i o n w o r k s u n d e rn o r m a lc i r c m n s t a n c e s ,t h et a r g e tr e c o g n i t i o nc a no f t e nb es o l v e db y 重庆大学硕士学位论文 英文摘要 i d e n t i f i n gt h et a r g e t0 1 e x t r a c t i n gi t si n v a r i a n tf e a t u r e 鹪s o o n 嬲p o s s i b l e t h u s i tw i l l n o ta f f e c tj u d g m e n to fo t h e rg o a l s h o w 州, ”p e o p l e ”t a r g e tp a t t e r n sw i l lh a v er a n d o m c h a n g e s o v e rt i m e s oi ti sn o te a s yt oe x t r a c ti t si n v a r i a n tf e a t u r e s g i v i n gt h es t a t i s t i c a l n u m b e ro fo b j e c t i v e si sn o ta l l o w e dt or e p e a tt h es a m ei n d i v i d u a lc o u n t s b a s c do n r e s u ro f p r e v i o u st a r g e td e t e c t i o na n dt h ei d e 】a t i f i c a t i o no f g o a l si nc u r r e n t ,w ec a nu s e t h ei n t e g r a t e dc a l c u l a t i o nm e t h o dt od e t e r m i n et h en e c e s s i t yo f i d e n t i f i n ga n d j u d g i n go f t h ec u r r e n ts a m p l i n gp l a n i nar e s u l t ,w es o l v et h ep r o b l e mo fc o u n t i n gr e p e a t l ya n d r e d u c et h ea m o u n to f d a t ei nar e a l t i m ep r o c e s s i n g k e y w o r d s :t a r g e td c t c c t i n 吕n o r m a l i z a t i o n ,a c t i v ec o n t o u r , c o u n t i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重庆太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:伶炙 签字日期:砷年月7 日 学位论文版权使用授权书 本学位论文作者完全了解重麽太堂有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。本人授权重鏖太堂可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 保密() ,在年解密后适用本授权书。 本学位论文属于 不保密( v ) 。 ( 请只在上述一个括号内打“4 ”) 学位论文作者签名:砼炙 导师签名: 未7 哆响 签字日期:多m 彳年z 月7 日签字日期:川年6 月7e t 重庆大学硕士学位论文1 绪论 1 绪论 1 1 研究背景 在我们生存的世界中,存在着多种多样的可被我们所感知的信号,从而帮助 我们去了解周围的环境。其中,光线的刺激作用于眼睛所形成的图像信号,占有 着重要的地位,据资料显示,人的8 0 以上的信息来源是通过视觉系统所获得的图 像信号。人和高等动物都有着发达的视觉系统,使得客观环境中存在的事务或目 标可以被识别,从而引发进一步的处理。对于人类来说,这种功能是与身俱来的, 十分轻松的事情。可对于机器视觉系统【l l 来说,这样却是十分困难的事情。 分析我们人类视觉判断一个场景中的物体 2 1 ,比如判断是否是一个人的过 程,如果不确定是否是物体正面,首先是从轮廓着手,将“人”目标和其他目标以及 背景部分区别开来,其次是查看上下特征,在头部区域查看是否有头发,眼睛, 鼻子,耳朵等明显的五官口】,在身体区域观察是否有手,腿,腰等显著躯干特征。 通过以上观察,和头脑中的“人”目标的概念进行比对判断,便可以得到结论。 对于一个智能视觉处理系统来说,图像的获得可以通过各种光电器件( 如摄 像头,c c d ) 等得到,并转化成数字信号。其后的处理一般是交给功能强大的计算 机和微处理器来完成。一个完整的机器视觉系统【4 l 基本上是由三个相互关联而又 有明显区别的过程组成的,即场景分离、目标生成和智能判决。摄象头采集的原 始图象往往有很多冗余的信息或干扰,比如背景信息,噪声干扰等等,这些不必 要信息对于我们找到真正感兴趣的目标信息是一个障碍,场景分离就是要通过图 象处理来弱化干扰因素的影响,强化我们感兴趣的部分瞪】;目标生成,是一个指 定判断区域和判断对象的过程,通常是一个包括目标和非目标在内的粗识别步骤, 对可能是目标的区域和物体收集或标记,最后再通过进一步的特征提取和处理, 结合一定的判决模型,以较大的概率判断这幅图像或它的一部分是不是我们所要 寻找的目标。和人类视觉不同的是,机器智能受判决模型数学上的精确性和机器 系统先验知识的局限性制约f 6 】,无法在目标可能的复杂性和判断的准确性上保持 很高的一致。比如,人类视觉可以通过衣服等无法精确描述的附加物来识别“人” 目标,而机器系统却不行。 然而,机器识别作为图象处理和人工智能相结合的新兴科学具有和人的主观 识别完全不同的优势,在文字处理,指纹处理,车辆监控【柏】,安全检查等诸多方 面都有广阔的应用前景1 7 | 。针对不同的应用场合,我们对“人”目标的识别无外2 种目的,一是充分提取细节特征识别到具体的个人,这类应用在社会安全领域如 犯罪调查,身份验证等方面已经有相应的硬件实现;二是忽略单个目标,只对某 重庆大学硕士学位论文1 绪论 场合的“人”目标群体感兴趣,比如只想知道该群体数目的增减情况,这一方面由于 忽略了对每个目标单位的详细判断,为降低算法复杂度,降低硬件成本提供了客 观依据,因而可以在更普遍的场合得到应用,而现有的智能识别系统针对这类应 用的研究并不充分。 1 2 研究现状 从原始图象中识别和检测目标,一直是图象处理领域的一个前沿课题埔】。由 谢树煜等提出的实时视频对象与计数系统的模型和算法设计【9 】,通过综合运用颜 色模型转换、减影、膨胀、腐蚀、聚类、匹配、跟踪等图象处理技术,成功的在 非复杂背景的人物运动图象中实现了对待检测区域内运动对象的识别检测和计 数。但这类方法受具体场合的影响很大,改变背景特征,改变摄象头取图高度, 或者改变场景中的目标运动方向,就必须对方案提出相应的改变甚至更新整套设 计。 人工神经网络的理论和算法的成熟,为机器智能识别提供了可能0 】,在m a t l a b 软件包里面已经集成了一部分基于人工神经网络理论的应用型模块。该技术通过 机器对样本的学习,让目标的特征可以被机器掌握,从而在目标和非目标的对象 中做出选择和判断。但应用人工神经网络的图像处理和识别技术,关键需要找到 合适的模型来描述样本的特征,其实质仍然是特征的提取。 近年来,随着学科综合趋势的加强,有学者将解剖学,形态学以及图象处理 技术综合起来,提出一种全新的骨点检测算法,通过角度修正,骨点匹配,检验 当前人目标和数据库信息的相似程度,该方法具有更高的精度,识别误差非常小, 但是由于是具体到目标个体的识别,庞大的数据库和硬件成本不能在普通的场合 得到广泛应用。另外,根据不同的应用要求,也没有必要采用精确的目标识别, 比如类似本课题的识别计数系统,分辨每个目标单位是没有必要的,我们只关心 “人”目标的数目,对于到底是谁,并不需要知道。 近年来公车车门附近普遍装上了摄象头,很自然的联想到,是不是可以利用 某种识别计数系统来计算上下车乘客的数目,为收集相应的信息,制定合理的公 车运营策略提供数据支持,这就是公车智能识别系统。参考相应的文献 i l l ”1 发现, 普遍的方案是采用红外识别,重量传感的思路,基于图象处理的识别系统由于干 扰因素较多【1 ”,使得目标搜索,目标匹配等传统方案不能达到一个令人满意的准 确度。一些相关文章,依据传统的图象处理技术,对乘客的衣着复杂度没有充分 考虑,对人的头发颜色则取为黑色,忽略了白发乘客,戴帽子乘客可能带来的识 别困扰。 目标、背景分离技术已经是图象处理中最基本最成熟的技术之一,很多文献将 2 重庆大学硕士学位论文1 绪论 此过程称为初始化。本文跳过目标,背景分离技术,只考虑中后过程的目标识别 和检测,是因为各个场合下的初始化方案必定有很大不同。没有太多的参考价值, 而初始化以后的“人”目标检测和特征提取过程却有很大的参考余地。因此,我们讨 论单纯背景的“人”目标识别计数系统,对于类似的课题有一定的通用性。由于传统 轮廓提取方案的局限性加上人体轮廓的复杂性和随机性,绝大多数“人”目标识别方 案都没有考虑轮廓提取方法。本文采用与传统轮廓方案有很大不同的主动轮廓算 法来提取轮廓特征,主要通过衣服较少的头部轮廓和帽子不能遮蔽的脸部轮廓, 作出判断,是一种新的尝试。 1 3 论文的结构安排( 研究意义) 第一章为绪论,主要包括课题的研究背景,研究现状,提出本文的基本思路, 综述本文的创新重点。第二章介绍目标检测的处理流程和系统的工作机制。第三 章介绍归一化算法及其在本文中的实现步骤。第四章引入主动轮廓算法的理论和 在本文的具体应用。第五章为仿真实现和数据分析。第六章为硬件实现方案。第 七章为结束语。 3 重庆大学硕士学位论文2 计数系统的目标检测 2 计数系统的目标检测 2 1 引言 基于图象处理的目标检测是图象智能识别的前提,目标检测的任务是通过提 取相应的目标特征,将我们要识别的目标全部标志出来,并尽可能的减少干扰目 标的存在。也就是,通过一套特征方案寻找一个包括所有感兴趣目标的识别目标 集【4 2 】。这个目标集的大小,取决于我们的方案和待处理图象的复杂程度。如果只 包含感兴趣目标,称为理想目标集,或者最小目标集,而实际上,这样的效果很 难做到。在确定选取方案的时候,一方面要考虑将目标包括在内,另一方面要尽 量排除干扰。所以过于严格的方案容易造成目标遗漏,而提取宽松的特征,又会 给后续判断带来较多的计算和比较,增加整个识别过程的复杂度。所以根据实际 应用的需求,需要综合比较一些不同方案的优劣。 2 2 基于图象的成象系统存在的技术瓶颈 图象识别的前提是获取相关的图象信息,好的图象采集方案,不仅可以获取 较完整的信息,而且可以帮助提取目标特征,方便圈定识别目标集。对于公众场 合的成象系统,将摄象头放在成象视角较好的地方是第一个考虑因素 j 4 1 ,其次, 要考虑该角度是否能够取到明显的目标特征,能否降低干扰因素的存在。基于图 象的识别对各类噪声和干扰往往比较敏感,所以选择放置角度应考虑背景变化的 因素。这些背景的变化包括景物变化,成象距离变化和光线变化等等,这些可能 的变化对于识别目标会带来很大的困扰【1 们,使得我们很难找到一个简单有效的方 案针对所有的成象背景都有令人满意的效果。 图象的遮蔽效果是图象处理中经常无法回避的问题,这是图象的二维局限性所决 定的。在任意一个拍摄角度下,理论上都无法避免目标遮蔽的存在。但在具体的 应用中,结合场景和目标运动的特点,可以决定一个最佳的图象采样角度。如果 将遮蔽效果和背景特点结合考虑,则摄取角度将可能被局限于很小的范围,或者 无法令二者均达到最优。以牺牲识别目标集的完整性为代价的次优方案成为这种 技术困难下的一种解决途径【1 “,但换一个角度考虑,投入少量的成本增加摄取角 度,让各个角度存在相应的互补性,无疑是一个更好的方法。但是,事实上这个 方向的研究并没有太多的进展。多角度图象虽然增加了获取信息的完整性,但对 于图象同步和数据综合提出了更多的挑战,特别是多幅同步图象的信息综合涉及 更加复杂的控制和处理。 对应于某个采样角度,必定存在相应的容易提取的图象特征。对于实时系统 4 重庆大学硕士学位论文 2 计数系统的目标检测 而言,采用的特征提取方案在保证准确率的同时还应注意时效性,即必须考虑这 个方法占有的系统处理时间。这个时间主要和处理信息的多少,算法复杂度的大 小有关。一方面,实时系统要求更快的信息处理,另一方面,我们希望能够得到 最优的识别目标集【1 ”。时间和效果的最优往往在实际的系统中难以兼顾,在此情 况下,通常的方法是第一,通过分析图象特点和目标特点,找到采集图象的数据 冗余,依靠大量的减少实时数据量增加系统的时效性,第二,以牺牲检测精度为 代价,获取次优的目标集来降低系统的时间依赖性。 2 3 图象采集方案的要求 通过2 2 节的介绍,对于人目标的实时计数系统图象采集部分需要注意和考虑 的问题已经有了大致的框架。即需要让摄象头采样的图象包含尽量完整的目标信 息,减少目标干扰,降低时间依赖性。在此基础上确定一个方案( 算法) ,该算法 应综合考虑检测效率和计算复杂度。假定我们安排单个摄象头,为了能够检测到 人目标的显著特征,当然应该尽量包含人目标的头不信息。因为,人目标的头部 五官等具有区别于其他干扰目标的显著特征。所以,可以选择头部附近前后左右 上五个方向。其中,正面,侧面和头顶有明显多于从背后摄象的图象特征可以利 用。正面图象最容易发现人目标的五官特征,检测效率高,算法也比较简单。但 是对于很多场合,无法处理目标遮蔽带来的识别障碍,另外,考虑背景因素的前 提下,正面的摄象角度容易受到背景变化的干扰,在很多场合下,场合的入口处 具有很强的随时间变化的背景光线,在采样图象中非常明显。 侧面图象可以找到人目标的耳朵,鼻子,嘴巴,下巴等特征,但是同样无法 应对图象遮蔽,而且由于人目标是非刚性的形体,头部的旋转和身体运动轨迹的 随机性都会让侧面图象丢失满意的视角,让原本显著的图象特征不容易被发现和 提取。 相对而言,在不考虑背景因素前提下,受遮蔽影响最小的是顶部摄象头。很 多应用的场合下,留心观察会发现,摄象头几乎都是安排在顶部的。顶部采样图 的特点是,能够将目标作为一个整体进行观察,找出相应的目标特征或运动特点, 并能够运用传统的跟踪,搜索和匹配技术实现对目标的检测,识别。但是,如果 要通过目标轮廓来执行后续判断,顶部的轮廓特征相对于其他位置是最差的【1 8 】。 本文从创新角度出发,采用轮廓方案作为目标识别和判断的依据,仅仅使用顶部 摄象头显然是不行的。所以必须要获得其他位置的图象信息,这样就必须引入多 幅图象的数据综合问题。加上实时要求,对算法提出了复杂度的限制,所以,本 文采取的方法是,利用项部摄象头获取的图象信息指导其他位置摄象头的采样和 图象矫正。本文的图象采集方案如下: 5 重庆大学硕士学位论文 2 计数系统的目标检测 在场景入口位置,设置三个摄像头,分别处于上,左,右位置,如下图所示 bc 图2 1a ,b ,c 表示三个摄像头 f i g u r e 2 1a , b ci n d i c a t e3c m e 娜 在实际系统中,把a 放在顶部的中央,b ,c 分别在左右对称的位置,从平面 上看,三个摄像头的中心交于一点。这样设计的好处在于,我们可以得到图像的 三维立体信息,同时,由于摄像头的分工给后续的检测判断提供方便。容易想到, 由于离顶部最近,人目标的头部信息最有可能成为a 俯视图的重点,这是目标检 测的重要依据。而b ,c 负责提供侧面图像,为后面的轮廓判断做好准备,之所以 设置左右2 个,是考虑到多目标,包括非“人”目标可能带来的遮蔽效果;而左右对 称的设计,可以给单个目标的归一化带来方便。下面就进一步介绍这个设计的具 体作用。 2 4 目标检测 假设对a 每隔一定时间抓取一次图像,这个时间间隔必须保证不会遗漏任 何目标的通过,并且能够在连续的采样图上能观察到目标通过的基本过程,同时 考虑到系统的实时处理需要的运行时间,我们这里取为0 1 秒。按照理想化的假设, 人目标的头部信息主要是头发,而黑色头发在人群中有很高的比例。设图像在坐 标( 工,y ) 处的象素灰度为厂以y ) ,我们使用一个加权的方法对整个图像范围的灰度 进行计算并取平均【1 9 1 工= ( e f w v ) ( ) ,y = ( _ ,) ( ) ( 2 1 ) g 阮y ) = ( f ( i ,_ ,) ) ( ) ( 2 2 ) j j f j 其中,m ,n 分别表示采样图的行列值,善,y 表示最终的横纵坐标,g ( x , y ) 表 示一个加权后的平均灰度,吃表示f ( i ,_ ,) 对应的权值。假设对于黑色灰度取很高 的权值,对于其他灰度按照其靠近黑色的程度取较小的权值,那么这样计算下来, 6 重庆大学硕士学位论文2 计数系统的目标检测 必定使得横纵坐标x ,y 非常靠近黑色集中的区域或在黑色区域之内。这就是用加权 灰度寻找目标点的基本思路,在这里,我们把目标点,称为“质点”,它反应了图 像中低灰度区域的重心。容易想到,如果有几个黑色头发的人目标在这个图里或 者有其他灰度较低的干扰目标存在,那么质点很可能并不处于任何一个低灰读区 域之内。 图2 ,2 质点并不处于某个低灰度区域之内 f i g u r e2 2 p a r t i c l ei sn o ti nal o w - i n t e n s i t yl e g i o n 于是,我们以这个图的质点为原点,建立一个直角坐标系。在它的各个象限 非别用式( 2 1 ) ,( 2 2 ) 进行质点判断,直到我们所找到的质点已经处于某个低灰 度区域之内,并且该区域的面积不小于一个阀值时,结束计算,这里我们把这个 面积阀值称为目标判断值。 计算步骤如下: 1 以整个图的质点为原点建立直角坐标, 2 在垂直坐标两边寻找质点,然后在水平坐标两边寻找质点,着找到的质点 满足后续条件,结束,否则转3 3 在4 个象限分别寻找质点,若找到质点所在的象限面积不小于一个规定值, ( 我们规定为不小于目标判断值的2 倍) 继续建立直角坐标,转2 ,否则转4 4 结束所有寻找,返回所有质点的灰度值和坐标。 我们把这时候的质点称为“目标质点”,目标质点的数目就是待测目标的数目。 7 重庆大学硕士学位论文2 计数系统的目标检测 圈叫翌 图2 3 目标检测流程 f i g u r e2 3 t h ep r o c e s s i n go f d e t e c t i n go b j e c t s 但是,对于实时运算,对每个灰度值取不同的权值使得这一过程的计算量偏 大,于是想到用阶段量化的方法,设置几个门限,大于相应的门限值则取同样的 权值【2 0 】。而且,进行整个视图范围的灰度计算受背景等因素干扰的可能性大大增 加。我们考虑一些改进如下,首先限制a 摄像头的抓取范围,只保留一个宽度大 于标准成人头部长度a ( 从俯视角度,前额至后脑) 1 5 倍,长度接近场景入口宽 度的矩形条,如图: 假设的头部目标 图2 aa 摄像头的抓取范围 f i g u r e2 4t h eg r a s p i n gs c o p eo f ac a m g t a 1 5 五 这样一来,就大大减少了计算范围,图中上边界和下边界的另一个好处是, 可以判断目标是进入还是离开场景,当采样图中发现某个“目标质点”越来越靠近边 界时,则给出一个目标进入或消失的信号,并且当前待测目标数减1 。 由于a 摄象头的抓取问隔时间很短,不妨认为在系统对目标进行判断之后,目标 仍未离开图2 2 的矩形区域。那么,根据减少系统实时处理数据量和不可重复计数 要求,我们制定如下的控制准则: 1 若项部检测目标数大于侧面检测目标数,以侧面检测目标数为准。 2 若顶部检测目标数为0 ,将b ,c 置于无效状态 3 若顶部检测目标数小于侧面检测目标数,以顶部检测目标数为准 8 f肛l 重庆大学硕士学位论文 2 计数系统的目标检测 4 顶部检测始终开启 5 若顶部采样图中不存在新目标,将b ,c 置于无效状态;否则同步开启b , c 采样侧面图 6 在侧面图未获取有效目标区域的情况下,间隔o 2 s 继续取3 幅侧面采样图 进行判断,若仍未检测到有效区域,视为假目标 由此,我们得到一个控制框图如下: 图2 5 计数系统的控制部分 f i g u r e2 5t h ep a r to f j u a g ea n dc o n t r o lo f c o u n t i n gs y s t e m 值得注意的是,尽管使用了3 个摄象头采样图象数据,但是对于3 个以上的 多目标识别仍然困难。这是因为,摄象头的取图范围十分有限,在3 个以上的目 标同时通过入口场景时,中间目标存在严重的被遮蔽干扰,2 侧摄象头无法保证得 到中间目标完整的侧面信息,因此,本文主要讨论2 个以下的目标进入情景。另 外,由于此部分要求人的头部灰度与背景灰度有一定的区分度,因此对于一部分 没有明显区分度的头部目标有漏检的可能,这是灰度图象本身的局限性造成的。 9 重庆大学硕士学位论文3 图象目标的归一化处理 3 图象目标的归一化处理 3 1 引言 数学上的归一化运算是把一个数据集统一到一个标准尺度下的计算。在图象 处理中,对某一个场景取样,可以把取样的图象看作是一个多元函数厂( 五y ,f ) ,它 表明图象的内容是随时间和空间变化的。假定在连续场景中存在一个我们感兴趣 的目标,我们把含有且只含有该目标的一系列连续的图象祯称为相关采样图象, 把组成该目标的象素在这些图象中的表达函数记为g ( x , y ,f ) ,这个函数我们称为目 标函数。它反应了目标在相关采样图象中的时空特征【2 1 】。那么显然, g ( x ,) ,f ) 也 是随时空变化的。为了识别该目标,必须能够找到一个相对稳定的特征来代替这 个变化的目标函数陋】,归一化就是其中一种思路。图象处理中归一化的基本思想 是,通过相应的参数确定一个算子,用该算子与目标函数进行某种运算,得到一 个新的函数g y ) 。新函数至少在相关采样图象的采样时间内对时间不敏感,并 且坐标位置的变化比原函数要小,相当于将变化的目标函数统一到了一个模板函 数之下。这样,就成功的减小了目标的形态,角度,位置变化给识别判断带来的 影响,从而提高识别率。 3 2 图象归一化的基本问题 通过摄象头抓取采样图象是把三维空间信息表达成二维信息的过程,所以我 们无法从一幅二维图象中确定每个象素的位置深度,即该点和摄像头之间的距离。 经验告诉我们,当某个目标离摄象头远的时候,它在采样图中占有的尺寸比例会 相应的减小,反之则增大。但它的实际大小究竟如何,没有一个固定的参照很难 得出结论。实际上,摄象头带来的尺寸缩放并不是一个严格按离开摄像头的距离 之比例变化的函数,也就是说,摄象头不是一个按距离缩放的线性器件。特别对 于一个三维物体,它的各个部分按照所处位置距离摄像头的不同,被放大缩小的 比例显然并不一致。 假设有一个采样图平面集,它们垂直于自身中心与摄象头中心的连线,如图, 我们把这个平面集称为标准平面集 1 0 重庆大学硕十学位论文 3 图象目标的归一化处理 图3 1标准平面集 f i g u r e3 1s t a n d a r dp l a n e ss e t 摄象头 考察其中一个标准平面与摄象头的距离d ,以及平面上象素和摄象头中心的角度 口,如图 距离d 摄象头 图3 2 标准平面上象素与摄象头的几何关系 f i g u r e3 2 t h eg e o m e t r i cr e l a t i o n s h i p sb e 钾珊ap i x e li nas t a n d a r dp l a n ea n dc a m e r a 按照简单的设想,由象素构成物体的尺寸只与各象素与摄象头的距离有关, 前提是认为摄象头是一个按距离缩放的线性器件。不妨设这个比例函数为妒( d ) , 距离不同,各象素点的坐标需要相应的调整,这样才能让整个物体的平面尺寸得 到真实的反应。以标准平面的中心为原点建立直角坐标系,那么,单个象素的坐 标x y 的调整式为 x = x f o ( d c o s o ) ;y = y q ,( d c o s 护) ( 3 1 ) 式中,y 是象素的原坐标,z 。y 是新坐标,o 是该象素与摄象头中心连线和平 面中心和摄象头中心连线的夹角。显然,当矽的值不是很大时,新坐标的变化也不 大,也就是说,存在一个以标准平面中心为核心的邻域,使得该区域内的象素可 以使用统一的比例函数9 ( d ) 作为坐标调整的依据。 实际上,得到一个三维物体各部分的精确尺度并不是一个必要的环节,基于 其他显著特征或特征匹配的图象识别技术甚至不要求得到清晰的图象轮廓。而基 重庆大学硕士学位论文 3 图象目标的归一化处理 于轮廓的特征提取方案,最感兴趣的显然是图象中物体的外形轮廓。为了解决这 个问题,参考上面的叙述,我们可以取一个标准平面,并认为,靠近该平面中心 的某个邻域内,物体的尺寸与距离摄象头中心的距离存在一个相同的比例关系。 比例确定以后,我们还需要一个固定的参照。这个参照是为了解决以谁为标准进 行比例缩放的问题。为了方便起见,不妨认为该参照平面也是一个标准平面,并 且与摄象头之间存在一个固定的距离,外形和大小相同的物体在该参照平面下有 固定的尺寸。那么,依据这个参照尺度进行调整,可以认为,调整后的图象是处 于同一个标准平面模式下。这样,我们开始所关心的问题可以表达成如下几个方 面: 1 采样图象中物体的轮廓是否处在一个标准平面上 2 在容许的误差范围内如何确定该平面中心附近的一个区域,让该区域内的 象素坐标可以按照统一比例进行调整 3 如何确定一个参照尺度,在采样图象中容易找到相应的尺度,以确定调整 的比例 3 3 归一化转动角参数的确定 由于人的头部旋转的可能性比较大,所以抓取侧面图象的时候,并不能保证 侧面轮廓处于某一个标准平面上。但从俯视角度,可以找到一条平分头发区域的 直线。由于人体的对称性,我们知道该直线与人的鼻尖或下巴尖共同决定了一 个平面口,而侧面轮廓也必然包含鼻尖,下巴尖和头顶部分,于是可以认为,平 面盯非常贴近侧面轮廓所在的平面,这个贴近的程度取决于3 2 0 2 4 0 x 2 与人的对 称线重合的程度。在实际应用中,不妨认为这2 个平面是重合的。于是可以认为, 由直线和鼻尖,下巴尖共同构成了人的侧面头部轮廓平面,该平面与上节所讲 的标准平面之间存在一个夹角。设这个夹角为口,如果我们把这个平面旋转角度 口,那么人的头部轮廓就位于一个标准平面之内了。这就回答了3 - 2 节提出的第一 个问题。那么我们如何让头部轮廓平面旋转呢,这个旋转角度到底如何确定? 事 实上,直线1 7 与标准平面存在如图的几何关系 图3 3 直线口与标准平面几何关系( 俯视图) f i g u r e3 3 t h eg e o m e t r i cr e l a t t o n s h l p sb e t w e e l ll i n e 8a n ds t a n d a r dp l a n e 1 2 重庆大学硕士学位论文3 图象目标的归一化处理 由上述内容我们知道直线与头部轮廓处在同一平面,但与标准平面的夹 角未必就等于2 个平面的夹角,由几何关系可知,当且仅当该直线垂直于2 平面 交线的时候,直线与平面的夹角才等于平面之间的夹角。问题在于,从俯视角度, 头部轮廓平面是否如图3 3 ,可以完全被直线遮蔽。由于人体的对称特点,如果 只考虑颈部旋转,不考虑颈部向旁侧的扭动,即头部始终保持俯视角度的端正, 那么直线一定可以完全遮蔽其侧面轮廓平面,即在俯视角度用该直线代替整个 轮廓平面。而标准平面是正对侧面摄象头的平面,对于顶部俯视角度而言,它可 以被顶部摄像头采样图中的任意一条平行于y 轴的直线代替表示。这样2 个平面 的夹角就简化成了2 条直线的夹角。联系前面的章节,我们把这个寻找夹角口的 过程表达出来,步骤如下: 1 通过顶部摄像头采样图像,寻找目标质点 2 对每一个目标质点选择一个相应的区域,寻找一条直线将此区域内的象素 平分 3 将此直线与采样图纵坐标夹角记为口 步骤l 的方法在2 2 中已经进行了详细介绍,这里我们给出步骤2 的具体方法: 对于步骤1 寻找到的目标质点,以该点为中心,取一个边长从到, 之间变化的正 方形区域。为了尽量避开对整个采样图的计算,减少多目标之间的互相干扰和其 他非相关象素的干扰,提高人目标头部区域平分线的精度,我们需要选择一个 合理的区域,尽量包含对应于单个目标质点的可能的头部区域,同时避开其他的 非相关区域。根据人目标头部在顶端采样图中可能的尺寸,我们先确定其边界, 即包含一个人的头部区域的正方形的最小尺寸不小于“同时不大于厶。在确定正 方形边长范围以后,通过步长,进行区域匹配。一个最优的正方形区域必须满足 如下条件: ( 1 ) 以目标质点为中心,区域内绝大多数象素的灰度值不低于某个阀值,该 值的确定需要参照目标质点的灰度值; ( 2 ) 该区域内象素灰度值的方差不大于某个阀值; ( 3 ) 该区域内大于目标质点灰度值的象素的面积不小于正方形区域面积的一 半,灰度值满足条件( 1 ) 的象素面积不小于正方形区域的8 0 c 矧; ( 4 ) 该区域满足条件( 1 ) ,( 2 ) ,( 3 ) ,且是边界范围内寻找到的一个最大的 正方形区域。 由于上述的条件( 2 ) 需要对区域内象素的进行方差运算,对实时系统的要求 较高,我们可以提高条件( 1 ) 的阀值,由于目标质点主要取决于周围象素的灰度 值,可以认为它近似的等于周围某区域内的象素平均灰度值,加上阀值限制,则 质点周围某正方形区域内的象素灰度值的方差可以得到理论上的保证,对于这样 1 3 重庆大学硕士学位论文 3 图象目标的归一化处理 的正方形区域,可以省去条件( 2 ) 的判断。如果能够找到满足以上4 个条件的正 方形区域,结束步骤2 ,转步骤3 ;否则判断该目标质点为无效质点,取采样图中 下一个目标质点,进行步骤2 ,3 的操作。 到这里我们已经回答了本章节开始提出的问题,得到了确定夹角口的完整步 骤。在不考虑人目标颈部侧向扭动的假设前提下,可以将本章节内容概括为如下 流程: 图3 4计算夹角口流程 f i g u r e3 4 p r o c e s so f c a l c u l a t ea n g l e 口 是 由本节开始的问题,我们计算这个夹角是为了指导平面旋转。其实平面并没 改变,各点在此平面上的坐标也没改变,但从视觉角度,经过旋转以后,各点的 横坐标将发生变化,而从俯视角度看,旋转是绕y 轴进行的,目的是让轮廓平面与 标准平面重合。故轮廓平面纵坐标不发生变化。记原平面上某点的象素坐标为 ( x ,y ) ,将此平面转动口角度,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论