6已阅基于梯度方向直方图的行人检测方法研究_倪恺_第1页
6已阅基于梯度方向直方图的行人检测方法研究_倪恺_第2页
6已阅基于梯度方向直方图的行人检测方法研究_倪恺_第3页
6已阅基于梯度方向直方图的行人检测方法研究_倪恺_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011年第 35 卷第 05 期 (总第 355 期 )0引言行人检测是目标检测的重要分支 ,是近年来智能汽车领域中的前沿方向和研究热点 ,它在智能汽车中的监控系统 、驾驶员辅助系统方面拥有广泛的应用前景 。 检测方法多种多样 ,其本质是利用行人特征将行人从背景中分割出来 ,将检测问题转化为模式分类的问题 。 行人检测在物体检测领域有特殊性 , 对于人体形态而言 ,人体是一个非刚性的 、形变大的 、多角度的物体 ,同时还受到光照 、衣着以及复杂背景环境的影响 ,多视 、多态的人体检测具有很大难度与挑战 。目前广泛的资料中 ,行人检测的方法包括背景提取和形状模型匹配的方法 ,该方法通过对当前图像与参考背景进行逐个做差来得到运动目标 ,再与相对应的行人形状模型进行匹配 ,但仅能处理一系列的图像帧 ,不能处理单独的一帧图像 ,而且行人的多态性使算法变得复杂 ,使模型匹配很难达到理想的结果 。应用 征的方法 , 从训练样本中提取 征 ,应用该特征并进行逐层训练 ,得到强分类器 ,通过强分类器进行行人的识别 。 征检测方法已成功应用于人脸检测 , 但是行人较人脸有很大不同 ,征是基于灰度分布的区域特征 , 而行人由于不同衣着的影响 ,在灰度分布的区域上并没有明显的不同 。基于以上考虑 , 笔者研究了一种利用梯度方向直方图 (征1的方法 ,提取图像中局部区域的梯度方向直方图特征 , 利用支持向量机 (方法形成分类器 ,作为 征训练的分类 ,从而实现行人检测 。 因此可以描述局部区域的形状信息 ,能对局部对象外观和形状进行很好的表征 ,事实证明可以很好地应用在行人检测中 。1 征的定义征算法2 2005 年提出 。 用了表达能力强的 征 , 由于计算机性能的提高 ,用了上千维的特征 , 在 人库中 ,万分之一的误报率下取得了近 90%的检测率 。 与征4类似 ,征通过提取局部区域的边缘或梯度分布 , 可很好地表征局部区域内目标的边缘或梯度结构 ,进而表征目标的形状 ,对辐射差异和配准误差有较强的稳健性 。征对于大小为 64128 的训练样本 ,按照 88 像素的单元 (行划分 ,这样就形成文章编号 :10028692(2011)05 ,肖志涛 ,张 芳(天津工业大学 信息与通信工程学院 ,天津 300160)【摘 要 】 为满足汽车安全性的要求 ,基于图像的梯度方向直方图特征 ,利用支持向量机的方法 ,实现了行人检测 。 该方法提取正负样本图像的局域梯度直方图特征 ,利用支持向量机进行样本训练 ,得到行人分类器 。 利用训练好的分类器进行检测 ,实验结果表明 ,该方法可以有效检测出前方出现的行人 ,并达到了较好的检测效果 。【关键词 】 梯度方向直方图 ;行人检测 ;支持向量机【中图分类号 】 文献标识码 】 00160, To of a be to is is to in VM is to do to is to 天津市科技支撑计划重点项目 (10频应用与工程 5 卷第 05 期 (总第 355 期 )了 816=128 个 后再将每相邻的 4 个 分为l 块 ( 采用 出的方法 ,图 1 为 征模板 ,其中宽 (W)与高 (H)的比率为 11。形成是按照每个 行滑动生成的 ,由此原训练样本 (64128)便具有 715=105 个 本图像中 间的关系如图2 所示 。对于划分后的每个 其中所有像素的梯度方向进行投影 ,形成每个 自的梯度方向直方图 。 这里的方向区间 (量设定为 9,如图 3 所示 ,即每 20一个区间 , 然后再将每个 的 4 个 梯度方向直方图数据串联起来 ,则每个 是一个 36 维的向量 。再将所有的 次串联起来 ,便形成了对每个训练图像的 36105=3 780 维编码5征的计算征的计算7过程如下 ,其中 H(x,y)表示图像在像素点 (x,y)处的灰度值 。首先计算梯度 ,采用 ,1模板计算每个方向的梯度幅值和方向Gx(x,y)=H(x+1,y)-H(y) (1)Gy(x,y)=H(x,y+1)-H(x,(2)计算得 Gx(x,y),Gy(x,y),分别表示训练样本图像中像素点 (x,y)的水平方向梯度 、垂直方向梯度的幅值 。样本中像素点 (x,y)的梯度幅值为G(x,y)= Gx(x,y)2+Gy(x,y)2姨(3)样本中像素点 (x,y)的梯度方向为(x,y)=y(x,y)Gx(x,y) (4)然后计算 9 个区间 (各个像素点在分量区间上的幅值Vk(x,y)=G(x,y),(x,y)(x,y)埸k9 (5)为了消除光照等影响 , 对块中每个单元的区间分量进行归一化处理f(Ci,k)=(x,y)x,y)+(x,y)x,y)+(6)式中 :f(Ci,k)表示在某个单元 第 k 个区间的累计强度在 所占的比例 , 其中 i=1,2,3,4。式 (6)中加一个较小的数 ,避免出现分母为 0 的情况 ,本文中取 =由式 (6)可知每个单元的特征可由 1 个 9维向量表示 ,而每个块由 4 个单元组成 ,从而块的特征可由一个 36 维向量表示 。 本文的 征可以表示为f(Ci,k)|i=1,2,3,4,k=1,2,9 (7)2分类器的选择笔者选择的分类器为线性 类器8,线性 推广能力好 ,并且在 工作中已经证明 ,结合 征可以很好地区分人体和非人体 。训练过程中 ,大小为 l 的训练样本集 (xi,i=1,2,l由二类别组成 ,如果 类 ,则标记为正 (),表示为行人 ,如果属于第 2 类 ,则标记为负(1),表示为非行人 ,训练的目标是构造判别函数将测试的行人相关数据尽可能正确地分类 。如果存在分类超平面wx+b=0 (8)使得wxi+b1,wxi+b-1,1,i=1,2,l (9)则称训练集是线性可分的 , 其中 wx 表示向量 wx 对于式 (9),可写成如下形式yi(wx+b)1,i=1,2,l (10)由统计学理论知 , 如果训练样本集没有被超平面错误分开 ,并且距超平面最近的样本数据与超平面之间的距图 1 征模板WH=11 样本图像中 关系 度方向的划分视频应用与工程 5 卷第 05 期 (总第 355 期 )a 正样本b 负样本图 5 正负样本例图离最大 ,则该超平面为最优超平面 ,由此得到判别函数f(x)=wx+b) (11)其泛化能力最优 ,其中 )为符号函数 ,最优超平面的求解需要最大化 2/w,即最小化12w2,进而可将求最优分类面问题转化为求带有约束条件为不等式的条件极值问题 。构造 数L(w,b)=12w2xiw+b)+i,0,i=1,2,l (12)应满足条件坠坠wL(w,b)=0,坠坠bL(w,b)=0,即w=。将其代入 数中 ,消去w 和 b,经运算得到对偶最优化问题()=i0,i=1,2,l, (13)式中 :其解是原最优化问题的整体最优解 ,解出各个最佳值 i(表示为 i*)后 ,利用 w*=b*值可由 iyi(b)0 式中对 的数据求得 ,至此分类器的训练算法完毕 。对行人进行在线检测时 ,对于待分类向量 x,选择某一特定类型的核函数 K(x,计算 f(x)=K(xi,x)+b*为 +1 或 定 x 属于哪一类 。3行人目标检测流程行人目标检测的流程如图 4 所示 ,主要分为 2 部分 ,包括离线样本训练和在线行人检测 , 检测过程中对待检测的图像先进行分层处理 , 根据图像的大小可计算出图像的层数 后按照一定比例进行放缩 ,在放缩后的多个图像中用一定大小的窗口进行穷举搜索和判别 ,最后将所有尺度下的检测结果进行融合合并 , 融合合并后的窗口是单一的 ,是最终的行人位置窗口 。4实验结果笔者选用 人库 ,其中训练数据包括2 416 张正样本训练图像 (大小为 12864), 如图 5a 所示 ,1 218 张没有人的图像作为负样本 (大小为 12864),如图 5b 所示 。该数据图像集的特点是衣服 、姿态 、光照和视角等变化大 ,图像中的人体是在不同的场景中获得的 ,有野外的 、繁华街道的 、海边散步的等 ,由此训练出来的分类器具有较强的通用性 。离线样本训练开始打开样本图像样本 i=1j=1征分类器检测行人窗口j=i=人定位重叠窗口合并 行人检测流程图视频应用与工程 5 卷第 05 期 (总第 355 期 ). 997,23(1):485 A . 000,22(11):13306 B/2010 7 B/2010 :傅 瀛 ,硕士 ,主研信号与信息处理 ;王永芳 ,女 ,博士 ,副教授 ,主研视频编码及三维视觉 ;廖小僮 ,女 ,硕士 ,主研信号与信息处理 ;张兆阳 ,博士 ,教授 ,主研视频编码及三维视觉 。责任编辑 :闫雯雯 收稿日期 :2010 正确的检测结果图 7 漏检结果图 8 虚警结果为了验证准确性 , 用数码照相机 集了一组非连续的图像 ,与训练样本之间的相关性差 ,作为测试集 ,包括 264 幅图像 ,其中包含 775 个完整的人体 。 采集的图像中既有单一的行人 , 也包括在复杂背景下的多个行人 。 实验表明 ,经训练好的分类器可成功检测到 617个人体 , 漏检 57 个 , 虚警 158 个 , 正确检测率达到近80%。 采集的图像中 ,当行人过小 ,该行人检测会失败 ,这是由于采集图像的大小远远大于训练样本的大小 , 故需逐层缩小待检测图像 , 直至其行数小于 128 或列数小于64,小于该大小的区域不在待检测的考虑范围之内 ,而且在车辆行驶中行人在图像中会越来越明显 , 检测的几率会逐渐增高 。图 6 为正确的检测结果 ,图 7 为一些漏检的情况 ,图 8 则为虚警的情况 ,背景比较复杂或者和行人比较接近的时候 ,将背景的部分区域也检测为行人 。5小结研究了智能车辆的一个重要部分 :前方行人的检测 。通过一个线性的 类器与梯度方向直方图 (征相结合 ,对一种应用的行人检测算法进行了研究 ,对单幅图像有很好的检测效果 。实验结果表明 ,该算法性能保持了一定的准确性 , 对图像中的单一行人检测有较高的正确率 。参考文献 :1 , . of / 2005. 2005:8862 . a to /2005. 2005: 8293 . in . 2006.4 G. . 2004, 60(2): 915 朱文佳 . 基于机器学习的行人检测关键技术研究 D上海交通大学 ,2008.6 黄茜 ,顾杰峰 ,杨文亮 . 基于梯度向量直方图的行人检测 J2009,9(13):36467 周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论