

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、行人检测现状转自1. 行人检测的现状(大概可以分为两类)(1).基于背景建模:利用背景建模方法,提取出前景运动的目标,在目标区域内进行特征提取,然后利用分类器进行分类,判断是否包含行人;背景建模目前主要存在的问题:(背景建模的方法总结可以参考我的前一篇博文介绍)(前景目标检测总结)必须适应环境的变化(比如光照的变化造成图像色度的变化);相机抖动引起画面的抖动(比如手持相机拍照时候的移动);图像中密集出现的物体(比如树叶或树干等密集出现的物体,要正确的检测出来);必须能够正确的检测出背景物体的改变(比如新停下的车必须及时的归为背景物体,而有静止开始移动的物体也需要及时的检测出来)。物体检测中往往
2、会岀现Ghost区域,Ghost区域也就是指当一个原本静止的物体开始运动,背静差检测算法可能会将原来该物体所覆盖的区域错误的检测为运动的,这块区域就成为Ghost,当然原来运动的物体变为静止的也会引入Ghost区域,Ghost区域在检测中必须被尽快的消除。(2).基于统计学习的方法:这也是目前行人检测最常用的方法,根据大量的样本构建行人检测分类器。提取的特征主要有目标的灰度、边缘、纹理、颜色、梯度直方图等信息。分类器主要包括神经网络、SVM、adaboost以及现在被计算机视觉视为宠儿的深度学习。统计学习目前存在的难点:(a)行人的姿态、服饰各不相同、复杂的背景、不同的行人尺度以及不同的关照环
3、境。(b)提取的特征在特征空间中的分布不够紧凑;(c)分类器的性能受训练样本的影响较大;(d)离线训练时的负样本无法涵盖所有真实应用场景的情况;目前的行人检测基本上都是基于法国研究人员Dalal在2005的CVPR发表的HOG+SVM的行人检测算法(HistogramsofOrientedGradientsforHumanDetection,NavneetDalel,BillTriggs,CVPR2005)。HOG+SVM作为经典算法也别集成到opencv里面去了,可以直接调用实现行人检测为了解决速度问题可以采用背景差分法的统计学习行人检测,前提是背景建模的方法足够有效(即效果好速度快),目前
4、获得比较好的检测效果的方法通常采用多特征融合的方法以及级联分类器。(常用的特征有Harry-like、Hog特征、LBP特征、Edgelet特征、CSS特征、COV特征、积分通道特征以及CENTRIST特征。2. 行人检测综述性文章1D.Geronimo,andA.M.Lopez.Vision-basedPedestrianProtectionSystemsforIntelligentVehicles,BOOK,2014.2P.Dollar,C.Wojek,B.Schiele,etal.Pedestriandetection:anevaluationofthestateoftheartJ.IE
5、EETransactionsonPatternAnalysisandMachineIntelligence,2012,34(4):743-761.苏松志,李绍滋,陈淑媛等.行人检测技术综述J电子学报,2012,40(4):814-820.4 M.Enzweiler,andD.Gavrila.Monocularpedestriandetection:surveyandexperimentsJ.IEEETransactionsonPatternAnalysisandMachineIntelligence,2009,31(12):2179-2195.5 D.Geronimo,A.M.Lopezand
6、A.D.Sappa,etal.SurveyofpedestriandetectionforadvanceddriverassistancesystemsJ.IEEETransactionsonPatternAnalysisandMachineIntelligence,2010,32(7):1239-1258.6 贾慧星,章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述J,自动化学报,2007,33(1):84-90.7 许言午,曹先彬,乔红.行人检测系统研究新进展及关键技术展望J,电子学报,2008,36(5):368-376.8 杜友田;陈峰;徐文立;李永彬;基于视觉的人的运动识别
7、综述,电子学报,2007.35(1):84-90.9 朱文佳.基于机器学习的行人检测关键技术研究D.第一章,硕士学位论文,上海交通大学.2008.指导教师:戚飞虎.最新论文2014_ITS_Towardreal-timepedestriandetectionbasedonadeformabletemplatemodel2014_PAMI_Scene-specificpedestriandetectionforstaticvideosurveillance2014_CVPR_PedestrianDetectioninLow-resolutionImagerybyLearningMulti-sca
8、leIntrinsicMotionStructures(MIMS)2014_CVPR_SwitchableDeepNetworkforPedestrianDetection2014_CVPR_InformedHaar-likeFeaturesImprovePedestrianDetection2014_CVPR_WordChannelBasedMultiscalePedestrianDetectionWithoutImageResizingandUsingOnlyOneClassifier2013_BMVC_Surveillancecameraautocalibrationbasedonped
9、estrianheightdistribution2013_Virtualandrealworldadaptationforpedestriandetection2013_Searchspacereductioninpedestriandetectionfordriverassistancesystembasedonprojectivegeometry2013_CVPR_RobustMulti-ResolutionPedestrianDetectioninTrafficScenes2013_CVPR_OptimizedPedestrianDetectionforMultipleandOcclu
10、dedPeople2013_CVPR_PedestrianDetectionwithUnsupervisedandMulti-StageFeatureLearning2013_CVPR_Single-PedestrianDetectionaidedbyMulti-pedestrianDetection2013_CVPR_ModelingMutualVisibilityRelationshipinPedestrianDetection2013_CVPR_LocalFisherDiscriminantAnalysisforPedestrianRe-identification3. 行人检测sour
11、cecode1.INRIAObjectdetectionandLocalizationToolkit,Dalal于2005年提岀了基于HOG特征的行人检测方法,行人检测领域中的经典文章之一。HOG特征目前也被用在其他的目标检测与识别、图像检索和跟踪等领域中。2. Real-timePedestrianDetection.JianxinWu实现的快速行人检测方法。3. HoughTransfomforPedestrianDetection.OlgaBarinova,CVPR2010Paper:OndetectionofmultipleobjectinstancesusingHoughTransf
12、orms4. HIKSVM,HOG+LBP+HIKSVM,行人检测的经典方法.5. GroundHOG,GPU-basedObjectDetectionwithGeometricConstraints,In:ICVS,2011.CUDA版本的HOG+SVM,video.6. 100FPS_PDS,Pedestriandetectionat100framespersecond,R.Benenson.CVPR,2012.实时的(G>oo)哦。Real-time!7. POM:ProbabilisticOccupancyMap.Multiplecamerapedestriandetection
13、.8. PitorDollarDetector.IntegralChannelFeature+多尺度特征近似+多特征融合.Real-Time!4. 行人检测DataSetsMIT数据库该数据库为较早公开的行人数据库共924张行人图片(ppm格式,宽高为64x128),肩到脚的距离约80象素。该数据库只含正面和背面两个视角,无负样本,未区分训练集和测试集。Dalal等采用“HOG+SVM”,在该数据库上的检测准确率接近100%。INRIA数据库该数据库是目前使用最多的静态行人检测数据库,提供原始图片及相应的标注文件。训练集有正样本614张(包含2416个行人),负样本1218张;测试集有正样本2
14、88张(包含1126个行人),负样本453张。图片中人体大部分为站立姿势且高度大于100个象素,部分标注可能不正确。图片主要来源于GRAZ-01、个人照片及google,因此图片的清晰度较高。在XP操作系统下部分训练或者测试图片无法看清楚,但可用OpenCV正常读取和显示。Daimler行人数据库该数据库采用车载摄像机获取,分为检测和分类两个数据集检测数据集的训练样本集有正样本大小为18x36和48x96的图片各15560(3915x4)张,行人的最小高度为72个象素;负样本6744张(大小为640x480或360x288)测试集为一段27分钟左右的视频(分辨率为640x480),共21790
15、张图片,包含56492个行人。分类数据库有三个训练集和两个测试集,每个数据集有4800张行人图片,5000张非行人图片大小均为18x36另外还有3个辅助的非行人图片集,各1200张图片。Caltech行人数据库该数据库是目前规模较大的行人数据库,采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640x480,30帧/秒。标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。数据集分为set00set10,其中setOOset05为训练集,set06setIO为测试集(标注信息尚未公开)。性能评估方法有以下三种
16、:(1)用外部数据进行训练,在set06set10进行测试;(2)6-fold交叉验证,选择其中的5个做训练,另外一个做测试,调整参数,最后给岀训练集上的性能;(3)用set00set05训练,set06set10做测试。由于测试集的标注信息没有公开,需要提交给PitorDollar。结果提交方法为每30帧做一个测试,将结果保存在txt文档中(文件的命名方式为IOOO29.txtIOOO59.txt),每个txt文件中的每行表示检测到一个行人,格式为“left,top,width,height,score”。如果没有检测到任何行人,则txt文档为空。该数据库还提供了相应的Matlab工具包,包
17、括视频标注信息的读取、画ROC(ReceiverOperatingcharacteristicCurve)曲线图和非极大值抑制等工具。TUD行人数据库TUD行人数据库为评估运动信息在行人检测中的作用,提供图像对以便计算光流信息。训练集的正样本为1092对图像(图片大小为720x576,包含1776个行人);负样本为192对非行人图像(手持摄像机85对,车载摄像机107对);另外还提供26对车载摄像机拍摄的图像(包含183个行人)作为附加训练集。测试集有508对图像(图像对的时间间隔为1秒,分辨率为640x480),共有1326个行人。Andriluka等也构建了一个数据库用于验证他们提出的检测
18、与跟踪相结合的行人检测技术。该数据集的训练集提供了行人的矩形框信息、分割掩膜及其各部位(脚、小腿、大腿、躯干和头部)的大小和位置信息。测试集为250张图片(包含311个完全可见的行人)用于测试检测器的性能,2个视频序列(TUD-Campus和TUD-Crossing用于评估跟踪器的性能。NICTA行人数据库该数据库是目前规模较大的静态图像行人数据库,25551张含单人的图片,5207张高分辨率非行人图片,数据库中已分好训练集和测试集,方便不同分类器的比较。Overett等用“RealBoost+Haar”评估训练样本的平移、旋转和宽高比等各种因素对分类性能的影响:(1)行人高度至少要大于40个
19、象素;(2)在低分辨率下,对于Haar特征来说,增加样本宽度的性能好于增加样本高度的性能;(3)训练图片的大小要大于行人的实际大小,即背景信息有助于提高性能;(4)对训练样本进行平移提高检测性能,旋转对性能的提高影响不大。以上的结论对于构建行人数据库具有很好的指导意义。ETH行人数据库Ess等构建了基于双目视觉的行人数据库用于多人的行人检测与跟踪研究。该数据库采用一对车载的AVTMarlinsF033C摄像头进行拍摄分辨率为640x480帧率13-14fps,给出标定信息和行人标注信息,深度信息采用置信度传播方法获取。CVC行人数据库该数据库目前包含三个数据集(CVC-01、CVC-02和CV
20、C-Virtual),主要用于车辆辅助驾驶中的行人检测研究。CVC-01Geronimo,2007有1000个行人样本,6仃5个非行人样本(来自于图片中公路区域中的非行人图片,不像有的行人数据库非行人样本为天空、沙滩和树木等自然图像)。CVC-02包含三个子数据集(CVC-02-CG、CVC-02-Classification和CVC-02-System),分别针对行人检测的三个不同任务:感兴趣区域的产生、分类和系统性能评估。图像的采集采用Bumblebee2立体彩色视觉系统,分辨率640x480,焦距6mm,对距离摄像头050m的行人进行标注,最小的行人图片为12x24。CVC-02-CG主要针对候选区域的产生,有100张彩色图像,包含深度和3D点信息;CVC-02-Classification主要针对行人分类,训练集有1016张正样本,7650张负样本,测试集分为基于切割窗口的分类(570张行人,7500张非行人)和整张图片的检测(250张包含行人的图片,共587个行人);CVC-02-System主要用于系统的性能评估,包含15个视频序列(4364帧
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 恒力招聘考试题及答案
- 雨露助残活动方案
- 杭州自考试题及答案
- 骨科知识考试题及答案
- 高空吊绳考试题及答案
- 分拣货物考试题及答案
- 多场景信息管理系统框架模型
- 电梯故障考试题及答案
- 跨部门协作沟通及会议记录工具
- 文档管理自动化系统及文件归档指南
- 高中英语新课标3000词汇表(新高考)
- 《中国政法大学》课件
- 班本课程的实施与开展培训
- 旅馆消防安全灭火疏散应急预案模版(3篇)
- 汽车吊维保记录
- 机房网络改造升级方案
- 函数的单调性与最值课件高三数学一轮复习
- DL∕T 5344-2018 电力光纤通信工程验收规范
- DL∕T 2528-2022 电力储能基本术语
- DL∕T 1785-2017 电力设备X射线数字成像检测技术导则
- 不交社保劳动合同模板
评论
0/150
提交评论