全文预览已结束
付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
206 基于 行人快速检测 叶 林a,陈岳林b,林景亮a(桂林电子科技大学 a. 机电工程学院; b. 信息科技学院,广西 桂林 541004) 摘 要: 为了更好更快速地实现对行人的检测,提出一种基于空间梯度直方图的行人检测算法。该算法在分类识别时用 法级联结构的分类器,将那些对不包含行人信息的区域进行筛选排除,从而使信息量减少。实验结果表明,该算法在不降低检测效果的情况下明显提高了行人检测效率,具有较强的鲁棒性。 关键词: 行人检测; 子;支持向量机; 法 E a. b. 41004, 【 to a of of of of is 【 算 机 工 程 6 卷 第 22 期 010 年 11 月010人工智能及识别技术 文章编号: 1000 3428(2010)22 0206 02 文献标识码: A 中图分类号: 概述 人体检测作为对人体进行视觉分析的基础,近年来得到了越来越多研究人员的关注,其作为智能监控、高级人机接口、人体运动分析、人体行为理解等领域一个先决条件,经过十多年的研究出现了众多的算法1 大量的实验表明了这些算法的有效性。 但是在白天或者夜间都能对行人进行检测,如夜间检测方法4、在红外图像下检测行人、红外图像领域中的人体检测问题等己开始得到国内外学者的关注5。 由于可见光图像中无法通过人体图像的特点来确定其候选区域,因此只能在整幅图像范围内对目标进行多尺度搜索以确定人体的位置;另一方面,在可见光图像中由于人体的尺度大小未知,且同一人体的不同区域受光照影响很大。文献 1 提出了在可见光图像中采用方向梯度直方图(行人进行检测,并取得了良好的效 果。本文用 法的思想原理结合人脸检测中的 法6,运用 级联结构的分类器和基于 学习算法特点,实现了比法更快的行人检测。 2 方向梯度直方图 为了消除人的外观以及其他环境因素等对检测的影响,本文采用计算方向梯度直方图,先进行统计,再将多个小块合并为一大区域,最后通过对方向梯度直方图进行归一化等运算,来提高该算法的鲁棒性。方向梯度直方图的具体算法如下1:首先对输入图像进行伽玛值 (整和滤波,由于伽玛值调整对检测结果影响比较小,在处理之前将调整伽玛值步骤省略问题。图像平滑滤波可提高算法的抗噪性,采用高斯滤波: (, ,) (, , ) (, )L (1) 22() 221(, , ) e /22+= (2) 其中, (, , )高斯函数; (, )x y 是坐标; 是尺度坐标;(, ) 大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。需要注意的是,这里对图像进行滤波与 不同的是 法进行卷积运算时 值是可变的,是一系列变化的 运算之后得出一个尺度空间,而法是一个确定的值。 通过取不同的 值进行计算实验得出当 1 = 时效果最好。 对图像平滑后计算梯度,图像梯度是二维函数梯度的衍生。平滑图像 (, )2)、式 (3)计算其梯度模和方向,得到与原图等大的梯度图像。 22(, ) ( 1, ) ( 1, ) (, 1) (, 1)x y Lx y +(3) ( , ) ( , 1) ( , 1) / ( 1, ) ( 1, )x y Lx + + (4) 求得图像的梯度后得出每个像素点上的梯度模值和方向进行加权统计。由于方向的对称性,在构建方向直方图时采用了 0180的方向范围。 不同形状的物体具有不同的梯度分布,其梯度方向直方图也有较大差异。 3 述子 文献 1提出将出入的 64128大小的图片进行划分, 把 44大小的像素区域划为一个单元,在每个小单元内进行梯度统计。梯度方向在 0360内,经过验证将直方图分为 9 级,直方图包含的级数太多导致对小的方向旋转太敏感,而级数太少则导致结构太粗糙。计算每个单元对应的用梯度幅值加权作者简介: 叶 林 (1985 ),男,硕士研究生,主研方向:图像处理,模式识别;陈岳林,教授、硕士;林景亮,硕士 收稿日期: 2010 334201617 207的梯度方向直方图,将其表示为一个 9 维的特征向量。 将前面的单元合并成大区域,即 22 个单元组成一个新的区域,每个区域为 88 了使后面检测具有更好的效果,向量统计时要包含尽量多的信息,在原始图像的域划分时使相邻的 2 个区域有部分重叠。重叠部分大小为原区域的 50%,那么一幅 64128 图片可划分 715 个 88 区域。如图 1 所示, C=44 B=88 图 1 区域分块图 子图像中所有单元的特征向量联结起来,即构成图像对应的特征向量。因此,一张 64128 的图片总体的向量变成一组 10549=3 780 维的向量。 在求取上述 量后,用整个子图像的直方图“能量”对特征向量进行归一化处理,可以进一步去除光照变化的影响。经过实验对比可以确定归一化算子为: *21+) 其中,原向量;*归一化后的向量; 为常数。 4 分类识别 别 得到一组 3 780 维的向量后,用基于统计的方法来分类识别。基于统计分类的方法通 过机器学习从一系列训练数据中学习得到一个分类器,用该分类器来表示行人,然后利用该分类器对输入窗口进行识别。可根据分类器的设计方法将现有的基于统计分类的方法分为基于神经网络 (方法、基于支持向量机 (方法和基于 方法。 3 种方法各有其特点和应用环境,故不能草率下结论判断 3 种方法的优劣。在文献 1中用线性支持向量机来识别,笔者用供的图片库对 行培训,在库中有三千多张图片,其中两千多张在是有各种姿势形态的行人图片,一千多张是非行人图片。图片大小都是 64128 像素,通过提取这些图片的向量进行培训,得出 决策函数,从而进行识别新输入的图片。 实际上当输入的图片大小是其他尺寸时,检测窗口也同时改变,而上面提到的 征向量的维数也可以重新定义。当输入图像为 480640 时,检测窗口将近 4 800 个,而特征向量的维数变成 597949=167 796,此时,向量数据量非常大,实时实现检测非常困难。而 他的文章提出将图片进行分割, 将输入的图片分割成若干个 64128 的区域分别进行计算统计,在每个区域内检测识别,减少了运算,通过验证确实可行。此方法很 大程度上减少了运算数据量,不过由于向量提取过程复杂,总的计算量还是不小。另外一种方法是先对图片进行降采样处理,经过几次降采样之后使得图片变小,可得到 64128 大小的窗口,提取向量进行输入支持向量机,分成 105 个窗口进行检测。对图像进行降采样虽然减小了图片和运算量,但是降采样会使图片变得粗糙,降低识别的正确率。 法 从直观上分析,一张图片中的很大一部分是不包含行人的,且很多区域与行人的外观相去较大。如果能用较小的计算量将一张图片中包含信息量较少的区域排除,那么文献 6提出的 法正是符合以上标准的经典算法。这个算法最初应用于人脸检测,后来又成功地应用于行人检测。概括地说,该方法主要有以下的特点: (1)级联结构的分类器。所谓级联分类器是指分类器分成很多级,只有通过了前一级,才能进入后面一级。 (2)基于 学习算法。 法最初是用于将一组弱分类器组合成一个强分类器。 法具体方法见相关文献。 法的流程如下: (1)给定训练样本和初始权重 (2)t=1,2, ,T 1)归一化样本权重。 2)对每一个特征,训练一个弱分类器。 3)选择最优的弱分类器 4)更新样本权重。 (3)得到强分类器1 本文使用线性 为 法中的弱分类器,由线性 成得到强分类器。定义各种大小和尺寸的梯度直方图特征块,然后利用 法选出最有效的块。由此既避免了文献 1中所有块都是相同大小、特征不够丰富的局限性,又排除了冗余特征,从而提高了效率,更好地实现检测的实时性。 5 实验结果分析 经实验验证得出本文的方法是 确实有效的。本文采用了供的图片进行实验, 该行人库分为测试集与训练集。训练集中含有 2 416张行人图片和 1 218张不含行人的背景图片;而测试集中则含有 1 127 张行人图片和 454 张背景图片。由于该库中行人的外观各异, 因此是一个相当复杂的行人库。先将正样本降采样缩放至 64128 小,然后随机选择不同大小尺寸的梯度直方图特征进行训练。整个训练过程在一台 , 及 2 存的 耗时约一天时间,短于文献 1中的一周时间。 同时本文收集了 200 张其他格式各样的行人图片对改进算法检测,并与文献 1中算法的效果进行对比。为了更好地了解算法性能,通过统计检测率和误报率得出的曲线如图 2所示。测试得出检测效果比文献 1中的效果好。值得一提的是在收集的图片库进行测试时,图片大小为 240160,比文献 1中的要大,但是检测速度更快,检测效果更好。处理 240160大小的图片处理时间是 200 文献 1算法要 1 000 理 240160 大小的图片处理时间见表 1。图 3 为检测效果。 图 2 算法效果比较 (下转第 210 页 ) 210 行滤波,并将滤波效果与 33 尺度的中值滤波器进行比较,滤波结果如图 3、图 4 所示。 图 2 不同噪声强度的图像 图 3 中值滤波器去噪的图像 图 4 利用量子测量算子的可信度去噪图像 可以通过对 2 种滤波方法的处理结果与原图像进行比较来定量分析 2 种方法的优劣。这里通过 2 个量来比较,一个是去噪后的图像与原图像所有点差值的方差,另一个是去噪后噪声点所占的比例。很明显方差值较小的或者是噪声点比例小的去噪效果较好,比较结果见表 1。可以看出新的滤波方法远比中值滤波好。 表 1 新算法与中值滤波的比较 噪声强度 声强度 法 方差 噪声点比例 方差 噪声点比例中值滤波 噪声可信度滤波 由仿真结果可见,本文所提出的基于量子测量算子的噪声可信度滤波,去噪效果与中值滤波器相比更加清晰,不但能够较好地保留图像的细节,有效防止图像的失真,而且有更强的去噪能力。当图像的噪声强度较小时,本文所提出的滤波方法几乎可以完全将图像复原。当噪声强度较大时,在去噪的基础上也可以一定程度上防止图像失真。 7 结束语 本文建立一种具有自适应性的滤波方法,与传统方法不同的是,这种自适应滤波借鉴了量子测量算子及形态学结构元素的思想,并且引入了噪声可信度的思想。在运算过程中,通过噪声可信度来生成及改变测量算子的大小及形状,使其自适应于噪声区域的大小及 形状。仿真结果 表明,该算法不但可以有效去除噪声,而且能够保留图像的细节,有效防止图像的失真。在噪声强度较小时几乎可以还原图像,并且在一定噪声强度范围内滤波效果几乎不受噪声强度的影响。此外,本文所提出的噪声可信度的思想可以用于其他的一些去噪算法中,使图像处理达到更好的效果。 参考文献 1 谢可夫 , 周心一 , 许光平 . 量子衍生坍缩形态学滤波 J. 中国图象图形学报 , 2009, 14(5): 9672 陈 清 . 量子信息处理方案研究及其应用 D. 合肥 : 中国科学技术大学 , 2007. 3 佐川弘幸 , 吉田宣章 . 量子信息论 M. 宋鹤山 , 宋 天 , 译 . 大连 : 大连理工大学出版社 , 2007. 4 舒红霞 , 杨俊敏 . J. 计算机工程 , 2007, 33(18): 205编辑 陈 文 (上接第 207 页 ) 表 1 240160 大小的图片处理时间比较 算法 处理时间 /献 1算法 1 000 本文算法 200 图 3 检测效果 6 结束语 本文提出一种基于空间梯度直方图的行人检测算法。该方法识别时应用 法用级联结构的分类器,将那些不包含行人信息的区域进行筛选排除, 使信息量减少。理论分析和实验测试证明,本文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学国学竞赛复习题库+-图文
- 2025年全国导游资格考试大纲
- 2023重症医学科ICU护理专科理论试题
- 2025版税务师《涉税服务实务》真题模拟试题
- 2023年一级人力资源管理师专业技能真题及答案
- 2022年国家公务员考试申论真题(副省级)
- 基层卫生人才能力提升培训理论补考考试
- 《市场营销学》第六章定价策略练习题
- 2022监理工程师网络继续教育专业课试题
- 《文化差异与跨文化交际》章节测试题与答案
- 车联网技术与应用PPT完整全套教学课件
- 《量子力学》全本课件
- 医患沟通技能评价量表(SEGUE)
- 如何识别与消除七大浪费演示文稿
- 第四章-集成运算放大电路
- 病毒性肝炎的免疫学检查
- 第一章(诱发电位概论)+第二章(体感诱发电位)(2013年)
- GB/T 27924-2011工业货架规格尺寸与额定荷载
- GB/T 25085.3-2020道路车辆汽车电缆第3部分:交流30 V或直流60 V单芯铜导体电缆的尺寸和要求
- GB/T 242-2007金属管扩口试验方法
- GB/T 20878-2007不锈钢和耐热钢牌号及化学成分
评论
0/150
提交评论