版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模式识别-课程大作业实验复杂交通场景中人、车的检测与跟踪 姓名:陈明学号:201208070103班级:智能1201教师:李智勇时间:2016年12月24日单位:湖南大学 信息科学与工程学院 一、实验题目复杂交通场景中人、车的检测与跟踪 二、实验内容 2.1 熟悉各种分类器(贝叶斯分类器、线性分类器、支持向量机、神经网 络、Adaboost等)与各种特征(颜色特征、梯度特征、LBP特征、边缘特征、Haar-like特征以及SIFT特征等),并掌握其中的一种或多种。 2.2熟悉运动目标跟踪的基本原理与一些经典、常用的运动目标跟踪算法 (卡尔曼滤波算法、Camshift算法等)。2.3利用训练好的
2、分类器对复杂交通场景视频中的人和车辆进行检测,并在 视频中标定出来。2.4对视频中检测到的人和车进行实时运动目标跟踪(可选)。 三、实验原理及过程3.1 特征原理及分类器: 选取特征:HOG特征,LBP特征 选取分类器:SVM 支持向量机3.1.1 HOG特征 HOG, 即方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进
3、行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。3.3.1.1主要思想: 在一副图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。(本质:梯度的统计信息,而梯度主要存在于边缘的地方)。3.3.1.2具体的实现方法是: 首先将图像分成小的连通区域,我们把它叫细胞单元。然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组合起来就可以构成特征描述器。3.
4、3.1.3提高性能: 把这些局部直方图在图像的更大的范围内(我们把它叫区间或block)进行对比度归一化(contrast-normalized),所采用的方法是:先计算各直方图在这个区间(block)中的密度,然后根据这个密度对区间中的各个细胞单元做归一化。通过这个归一化后,能对光照变化和阴影获得更好的效果。3.3.1.4优点: 与其他的特征描述方法相比,HOG有很多优点。首先,由于HOG是在图像的局部方格单元上操作,所以它对图像
5、几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。因此HOG特征是特别适合于做图像中的人体检测的。 3.3.1.5 HOG特征提取算法的实现过程: 大概过程: HOG特征提取方法就是将一个image(你要检测的目标或者扫描窗口):1)灰度化(将图像看做一个x,y,z(灰度)的三维图像);2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);目的是调节图像的对比度,降
6、低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;3)计算图像每个像素的梯度(包括大小和方向);主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。4)将图像划分成小cells(例如6*6像素/cell);5)统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的descriptor;6)将每几个cell组成一个block(例如3*3个cell/block),一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。7)将图像image内的所有block的HOG特征descriptor串联起来就可以得到该ima
7、ge(你要检测的目标)的HOG特征descriptor了。这个就是最终的可供分类使用的特征向量了。 3.1.2 LBP特征:3.2.1.1背景介绍局部二值模式(Local binary patterns,LBP)是机器视觉领域中用于描述图像局部纹理特征的算子,具有旋转不变性和灰度不变性等显著的优点。它是由T. Ojala, M.Pietikäinen, 和 D. Harwood 12在1994年提出,LBP在纹理分类问题上是一个非常强大的特征;如果LBP与HOG结合,则可以在一些集合上十分有效的提升检测效果。LBP是一个简单但非常有效的纹理运算符。它将各个像素与其附近的像素进行比较,
8、并把结果保存为二进制数。由于其辨别力强大和计算简单,局部二值模式纹理算子已经在不同的场景下得到应用。LBP最重要的属性是对诸如光照变化等造成的灰度变化的鲁棒性。它的另外一个重要特性是它的计算简单,这使得它可以对图像进行实时分析。本节介绍相关LPB算法特征提取知识。3.2.1.1.2基本理论局部二值模式是广泛用于图像分类的一种图像特征,它的特点是,在图像发生光照变化时,提取的特征仍然能够不发生大的改变。提取LBP的过程首先是将原始图像转换为LBP图,然后统计LBP图的LBP直方图,并以这个向量形式的直方图来表示原始的图像。LBP的基本思想是定义于像素的8邻域中,以中心像素的灰度值为阈值,将周围8
9、个像素的值与其比较,如果周围的像素值小于中心像素的灰度值,该像素位置就被标记为0,否则标记为1.每个像素得到一个二进制组合,就像00010011.每个像素有8个相邻的像素点,即有28种可能性组合.如下图所示。因此,LBP操作可以被定义为: 其中 是中心像素,亮度是 ;而 则是相邻像素的亮度。s是一个符号函数: 这种描述方法使得你可以很好的捕捉到图像中的细节。实际上,研究者们可以用它在纹理分类上得到最先进的水平。正如刚才描述的方法被提出后,固定的近邻区域对于尺度变化的编码失效,所以,使用一个变量的扩展方法。主意是使用可变半径的圆对近邻像素编码,这样可以捕捉到如下的近邻:进行对一个给定的点 ,他的
10、近邻点可以由如下计算: 其中,R是圆的半径,而P是样本点的个数。这个操作是对原始LBP算子的扩展,所以有时被称为扩展LBP(又称为圆形LBP)。如果一个在圆上的点在图像坐标上,我们使用他的内插点。计算机科学有一堆聪明的插值方法,而OpenCV使用双线性插值。 对LBP特征向量进行提取的步骤,:(1)将检测窗口划分为16×16的小区域(cell);(2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;(3)然后计算每
11、个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率;然后对该直方图进行归一化处理。(4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量;然后便可SVM或者其他机器学习算法进行分类了。 3.1.2 SVM支持向量机: 所谓支持向量机,顾名思义,分为两个部分了解:一,什么是支持向量(简单来说,就是支持或支撑平面上把两类类别划分开来的超平面的向量点,下文将具体解释);二,这里的“机(machine,机器)”便是一个算法。在机器学习领域,常把一些算法看做是一个机器,如分类机(当然,也叫做分类器),而支持向量机本身便是一种监督式学习的方法,
12、它广泛的应用于统计分类以及回归分析中。支持向量机的基本思想是:首先,在线性可分情况下,在原空间寻找两类样本的最优分类超平面。在线性不可分的情况下,加入了松弛变量进行分析,通过使用非线性映射将低维输入空间的样本映射到高维属性空间使其变为线性情况,从而使得在高维属性空间采用线性算法对样本的非线性进行分析成为可能,并在该特征空间中寻找最优分类超平面。其次,它通过使用结构风险最小化原理在属性空间构建最优分类超平面,使得分类器得到全局最优,并在整个样本空间的期望风险以某个概率满足一定上界。3.1.2.1 学习问题 l(1)产生器(G),随机产生向量 ,它带有一定但未知的概率分布函数F(x)(2)训练器(
13、S),条件概率分布函数F(y|x) ,期望响应y和输入向量x关系为y=f(x,v) (3)学习机器(LM),输入-输出映射函数集y=f(x,w),w W,W是参数集合(4)学习问题就是从给定的函数集f(x,w),w W中选择出能够最好的逼近训练器响应的函数。而这种选择是基于训练集的,训练集由根据联合分布F(x,y)=F(x)F(y|x)抽取的n个独立同分布样本 (xi,yi), i=1,2,n 组成 。3.1.2.2 学习问题的表示l学习的目的就是,在联合概率分布函数F(x,y)未知、所有可用的信息都包含在训练集中的情况下,寻找函数f(x,w0),使它(在函数类f(x,w),(w W)上最小化
14、风险泛函 :l模式识别问题:3.1.2.3 经验风险最小化原则(ERM ) (1)最小化经验风险(训练样本错误率 ) : 函数集Fk=F(x,w);wWk, k=1,2,n F1 F2 Fn VC维:h1h2hn 在使保证风险(风险的上界)最小的子集中选择使经验风险最小的函数 (2)ERM的缺点l用ERM准则代替期望风险最小化并没有经过充分的理论论证,只是直观上合 理的想当然做法。l这种思想却在多年的机器学习方法研究中占据了主要地位。人们多年来将大部分注意力集中到如何更好地最小化经验风险上。l实际上,即使可以假定当n趋向于无穷大时经验风险也不一定趋近于期望风险,在很多问题中的样本数目也离无穷大
15、相去甚远 ,如神经网络。 3.1.2.4 Vapnik-Chervonenkis(VC)维 (1)定义:VC维是对由学习机器能够实现的分类函数族的容量或表达力的测度。 分类函数集= f(x,w):wW的VC维是能被机器对于分类函数的所有可能二分标志无错学习的训练样本的最大数量,描述了学习机器的复杂性 (2)学习机器实际风险的界 其中n样本数量,h是VC维,是递减函数 两种方法:l神经网络: 保持置信范围固定(通过选择一个适当构造的机器)并最小化经验风险。 l支持向量机(SVM): 保持经验风险固定(比如等于零)并最小化置信范围。结构风险最小化原则 函数集Fk=F(x,w);wWk, k=1,2
16、,n F1 F2 Fn VC维:h1h2hn 3.1.2.5 支持向量回归机SVM本身是针对经典的二分类问题提出的,支持向量回归机(Support Vector Regression,SVR)是支持向量在函数回归领域的应用。SVR与SVM分类有以下不同:SVM回归的样本点只有一类,所寻求的最优超平面不是使两类样本点分得“最开”,而是使所有样本点离超平面的“总偏差”最小。这时样本点都在两条边界线之间,求最优回归超平面同样等价于求最大间隔。(1) SVR基本模型对于线性情况,支持向量机函数拟合首先考虑用线性回归函数拟合,为输入量,为输出量,即需要确定和。 图3-3a SVR结构图 图3-3b 不灵
17、敏度函数惩罚函数是学习模型在学习过程中对误差的一种度量,一般在模型学习前己经选定,不同的学习问题对应的损失函数一般也不同,同一学习问题选取不同的损失函数得到的模型也不一样。常用的惩罚函数形式及密度函数如表3-1。表3-1 常用的损失函数和相应的密度函数损失函数名称损失函数表达式噪声密度-不敏感拉普拉斯高斯鲁棒损失多项式分段多项式标准支持向量机采用-不灵敏度函数,即假设所有训练数据在精度下用线性函数拟合如图(3-3a)所示, (3.11)式中,是松弛因子,当划分有误差时,都大于0,误差不存在取0。这时,该问题转化为求优化目标函数最小化问题: (3.12)式(3.12)中第一项使拟合函数更为平坦,
18、从而提高泛化能力;第二项为减小误差;常数表示对超出误差的样本的惩罚程度。求解式(3.11)和式(3.12)可看出,这是一个凸二次优化问题,所以引入Lagrange函数: (3.13)式中,为Lagrange乘数,。求函数对,的最小化,对,的最大化,代入Lagrange函数得到对偶形式,最大化函数: (3.14)其约束条件为: (3.15)求解式(3.14)、(3.15)式其实也是一个求解二次规划问题,由Kuhn-Tucker定理,在鞍点处有: (3.16)得出,表明,不能同时为零,还可以得出: (3.17)从式(3.17)可得出,当,或时,可能大于,与其对应的称为边界支持向量(Boundary
19、 Support Vector,BSV),对应图3-3a中虚线带以外的点;当时,即,与其对应的称为标准支持向量(Normal Support Vector,NSV),对应图3-3a中落在管道上的数据点;当,时,与其对应的为非支持向量,对应图3-3a中管道内的点,它们对没有贡献。因此越大,支持向量数越少。对于标准支持向量,如果,此时,由式(3.16)可以求出参数: 同样,对于满足的标准支持向量,有 一般对所有标准支持向量分别计算的值,然后求平均值,即 (3.18)因此根据样本点求得的线性拟合函数为 (3.19)非线性SVR的基本思想是通过事先确定的非线性映射将输入向量映射的一个高维特征空间(Hi
20、lbert空间)中,然后在此高维空间中再进行线性回归,从而取得在原空间非线性回归的效果。首先将输入量通过映射映射到高维特征空间中用函数拟合数据,。则二次规划目标函数(3.14)式变为: (3.20)式(3.20)中涉及到高维特征空间点积运算,而且函数是未知的,高维的。支持向量机理论只考虑高维特征空间的点积运算,而不直接使用函数。称为核函数,核函数的选取应使其为高维特征空间的一个点积,核函数的类型有多种,常用的核函数有:多项式核:;高斯核:;RBF核:;B样条核:;Fourier核:;因此式(3.20)变成 (3.21)可求的非线性拟合函数的表示式为: (3.22) 3.2实验过程: 3.2.1
21、训练过程: 3.2.2 LBP及HOG特征检测实验过程:四、实验结果1、LBP分类器对一些分块区域进行检测这个LBP粗检测2、对有车的区域,标记好之后进行区域合并,再进行HOG的细检测 这些因为没有人,都是车辆检测漏检多,误检多行人检测:没有比较适合的视频,用图片来检测可见:实验效果一般五、思考题4.1复杂交通场景中人和车辆的检测与跟踪的主要困难和挑战是什么? 答:从实际实验来看,主要有干扰因素多、样本少、受天气影响大等因素影响实验。 4.2根据实验结果从以下三个方面评价自己的检测与跟踪算法。4.2.1准确性:算法能检测出视频图像序列中运动物体的准确程度,能够对单一目标、多个目标提取出目标轮廓
22、,在复杂背景环境、背景中存在大量干扰时,也能准确检测出运动目标。 答: 准确性不好,主要样本少4.2.2实时性:算法处理图像数据,到获得结果所需要的时间度量,在满足准确性的前提下,处理时间应尽可能地短。 答:HOG检测速度慢,处理时间长,利用LBP加快了速度,但依然较慢4.3鲁棒性:算法在受到外界干扰时,能继续执行原先功能的稳定能力,如在有新目标进入画面,画面中目标发生重叠等情况下,算法能继续进行目标的检测和跟踪而不发生丢失。 答:环境变化检测不好,特别天气。六、实验总结虽然从上面的实验结果来看,效果并不是很好,有部分或许是算法未深刻理解,也有部分原因是时间仓促,不过在模式识别课程总结的最后一
23、个实验,我觉得是最重要的是理解其中的算法,毕竟这些才是精髓。进一步深刻理解了一些重要的模式识别中的算法: 1) LBP,局部二值模式(Local binary patterns,LBP)是机器视觉领域中用于描述图像局部纹理特征的算子2) HOG, 即方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。3)支持向量机SVM(Support Vector Machine),是一种有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。 参考文献:1朱娟,陈杰基于混合差分的车辆检测方法J计算机工程与设计, 2011,32(1):3323352胡铟,杨静宇基于模型的车辆检测与跟踪J中国图象图形学报, 2008,13(3):4504553杨建国,尹旭全,方丽,等基于自适应轮廓匹配的视频运动车辆检测 和跟踪J西安交通大学学报,2005,39(4):3513554王崴,唐一平,任娟莉,等一种改进的Harris 角点提取算法J光学 精密工程,2008,16(10):199520015李二森,张保明,刘景正,等SIFT 特征匹配技术在自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小超市消防安全制度
- 打车报销管理制度
- 艾灸馆安全规章制度
- 水电站安全保卫制度
- 燃气增值业务管理制度
- 危化品安全管理制度
- 员工请假扣工资制度
- 选剥混茧工岗前安全素养考核试卷含答案
- 植保无人机驾驶员安全操作模拟考核试卷含答案
- 毛皮制品制作工安全理论竞赛考核试卷含答案
- 2026广东云浮市新兴县林业局招聘1人笔试备考试题及答案解析
- 2026春道德与法治二年级下册《身心健康很重要》教学设计
- 抖音直播营销案例分析
- 平行线的判定课件2025-2026学年人教版数学七年级下册
- 2025青岛国企社会招聘笔试题及答案解析
- 2026年春季学期校园“1530”安全教育记录表
- GB/T 27664.1-2026无损检测仪器超声检测设备的性能与检验第1部分:仪器
- 2025年江西交通职业技术学院单招职业技能测试题库带答案解析
- 隧道爆破作业安全操作规程
- 《大学物理》说课课件
- 宴会设计与管理 项目三宴会台型设计
评论
0/150
提交评论