(控制理论与控制工程专业论文)车辆特征提取和分类方法的研究.pdf_第1页
(控制理论与控制工程专业论文)车辆特征提取和分类方法的研究.pdf_第2页
(控制理论与控制工程专业论文)车辆特征提取和分类方法的研究.pdf_第3页
(控制理论与控制工程专业论文)车辆特征提取和分类方法的研究.pdf_第4页
(控制理论与控制工程专业论文)车辆特征提取和分类方法的研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 模式识别包含了两个主要部分,分别是特征提取和分类器设计,在车辆识别 中有着重要的意义。对数据进行有效的特征提取并运用神经网络分类是实现合理 分类的有效途径。本文提出了两种特征提取方法用于车辆波形数据的提取,研究 了最小距离分类法和人工神经网络在车辆识别方面的应用,仿真实验表明本文所 提出的特征提取和分类方法具有良好的车辆识别效果。 主成分分析是一种统计分析方法,它采取降维将多个变量转换为个数较少的 综合变量,使这些综合指标尽可能地反映原来指标的信息量,而且彼止之间不相 关,从而达到简化的目的。核主成分分析法实际上就是主成分分析的一种改进算 法,它将原特征空间映射到了另一个高维空间,在这个新的高维空间中运用核技 巧提取出车辆数据的成分。 传统中的模式识别系统一般只是使用样本之间的距离或者相关性分类器来进 行分类的,这种系统对于输入样本带有噪声、类别数量比较大的问题很难取得好 的分类结果。自适应共振网络a r t 网络具有其它分类方法不具备的优良特性,它可 以很好地解决稳定性和可塑性这个二难的问题,可以稳定快速地识别已经学习过 的对象,同时也能够快速地学习没有学习过的对象。因此可以利用它稳定机制和 竞争学习的优点来进行车辆的分类识别。本文中对传统的a r t 网络进行了两点改 进,实际上就是结合其优点的基础上引进了两个准则,其一就是引进最小余弦夹 角作为输入模式计算准则,其二就是引进模式相似度作为检验识别准则,建立了 一个学习算法简单化的a r t 网络,其比较适合于高维特征值目标的分类。并且基于 该网络设计了一个新的分类器。使用该分类器对主成分分析法和k p c a 所得到的样 本特征进行了仿真实验,其结果表明,该分类器的识别率,识别速度以及自适应 性超过了其他神经网络分类器。 关键词t 模式识别;特征提取;k p c a ;神经网络;分类器 a b s t r a c t p a t t e r nd e c t i o ns y s t e mc o n t a i n st w oi m p o r t a n tp a r t s t h e ya r ef e a t u r ee x t r a c t i o n a n dc l a s s i f i e rd e s i g n u s i n ge f f e c t i v ef e a t u r ee x t r a c t i o nm e t h o dt op r o c e s sd a t aa n d a p p l y i n gt h ea r t i f i c i a ln e u r a ln e t w o r k st oc l a s s i f i c a t i o no fv e h i c l e sd e c t i o na r eo n eo f t h ee f f e c t i v es p p r o a c h e s t w of e a t u r ee x t r a c t i o nt h e o r yw h i c hh a v eb e e nu s e dt og e t f e a t u r eo fv e h i c l ew a v e f o r ma n dt h ea p p l i c a t i o no ft w oc l a s s i f i c a t i o nm e t h o d sw h i c h a r ea r t i f i c i a ln e u r a ln e t w o r k sa n dm i n i m u md i s t a n c ec l a s s i f i c a t i o na r ef u r t h e r d i s c u s s e di nt h i sd i s s e r t a t i o n t h es i m u l a t i o nr e s u l t ss h o wt h a tt h ep r o p o s e df e a t u r e e x t r a c t i o nm e t h o da n dc l a s s i f i e rh a v eg o o de f f e c t c o m p o n e n ta n a l y s i s i sas t a t i s t i c a la n a l y s i st e c h n i q u ew h i c hc a nr e d u c et h e d i m e n s i o no fv a r i a b l e s c o m p o n e n ta n a l y s i sr e d u c et h ed i m e n s i o no fd a t a ,a n de l i m i n a t et h ed a t ac o r r e la t i o nw i t hr e t a i n i n gt h em o s ti n f o r m a t i o n t h ek p c a ( k e r n e l c o m p o n e n ta n a l y s i s ) i si n f a c ta ni m p r o v e dc o m p o n e n ta n a l y s i sa l g o r i t h m ,w h i c h t r a n s f o r mt h eo r i g i n a ls p a c ei n t oan e wh i g h - d i m e n s i o ns p a c e i nt h i sn e wh i g h d i m e n s i o n a ls p a c e ,i tc a no b t a i nm a i nc o m p o n e n tb yt h eu s eo fk e r n e lt r i c k s t r a d i t i o n a lp a t t e r nd e c t i o ns y s t e mu s u a l l ym a k e su s eo fr e l a t i v i t yc l a s s i f i e ro r d i s t a n c eb e t w e e nt h es a m p l et oc l a s s i f yv e c t o r s ,b u tt h i ss y s t e mc a n ta c h i e v eg o o d c l a s s i f i c a t i o nr e s u l t sw h e nt h ei n p u ts a m p l e sc o n t a i nn o i s eo rt h en u m b e ro fc a t e g o r i e s t o oi sl a r g e a d a p t i v er e s o n a n c et h e o r yn e t w o r kh a v es o m eg o o dc h a r a c t e r i s t i c s w h i c ho t h e rc l a s s i f i c a t i o nm e t h o d sd on o t ,a n dt h i sn e t w o r kc a nr e s o l v et h ep r o b l e mo f p l a s t i c i t ya n ds t a b i l i t y ,c a nq u i c k l ya n ds t e a d i l yi d e n t i f yt h eo b j e c t sw h i c hh a v eb e e n s t u d i e da n dc a nq u i c k l yl e a r nt h eo b je c t sw h i c hh a v eb e e nn o ts t u d i e d s ow ec a nu s e i t ss t a b l em e r i t sa n dc o m p e t i t i v el e a r n i n gt oc l a s s i f yf e a t u r e s t r a d i t i o n a la r t n e t w o r kh a sb e e ni m p r o v e di nt w oa s p e c t s ,o n ei st h ec o s i n eo ft h ea n g l eb e t w e e nt h e i n t r o d u c t i o no ft h em i n i m u ms t a n d a r d sa sa ni n p u tp a t t e r n ,t h eo t h e ri st h ei n t r o d u c t i o n o fi d e n t i f i c a t i o nc r i t e r i af o rj u d g i n gs i m i l a r i t y s os i m p l i f i e da r tn e t w o r kl e a r n i n g a l g o r i t h mh a sb e e n e s t a b l i s h e da n di ti ss u i t a b l ef o r t h ec l a s s i f i c a t i o no fh i g h d i m e n s i o n a lf e a t u r ev a l u et a r g e t t h e nan e wc l a s s i f i e ri se s t a b l i s h e db a s e do nt h a t n e t w o r k e x p e r i m e n t a lr e s u l t so nt h ed a t ao b t a i n e db yc o m p o n e n ta n a l y s i sa n d k e r n e lc o m p o n e n ta n a l y s i ss h o wi t sh i g hd e c t i o ne f f e c t ,d e c t i o nr a t ea n ds e l f - a d a p t a t i o nw h i c hf a re x c e e do t h e rn e u r a ln e t w o r k s k e yw o r d s :p a t t e r nd e c t i o n ;f e a t u r ee x t r a c t i o n ;k p c a ;n e t w o r k ;c l a s s i f i e r i i 长沙理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研 究所取得的研究成果。除了文中特别加以标注引用的内容外,本论 文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文 的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 本人完全意识到本声明的法律后果由本人承担。 作者签名: 日期:沙l o 年r月硼日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位 论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学 技术信息研究所将本论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 本学位论文属于 1 、保密口,在 年解密后适用本授权书。 2 、不保密d 。 ( 请在以上相应方框内打“、 ) 作者签名:弘翟包起 日期:fo 年j月伊日 导师签名:时音 日期:如i 口年j 月沙l j 第一章绪论弟一早三百v 匕 模式识别就是将应用作为基础的一门学科,其目的就是将对象分类,在上 世纪的2 0 年代就开始的模式识别,开始模式识别主要在统计学领域方面有所应 用。但随着计算机的面世和人工智能的发展,在上个世纪6 0 年代初期模式识别 就快速地成为了一门学科,在很多的领域中广泛地使用了模式识别,从最开始 的光学字符识别,发展到笔输入的计算机、d n a 序列分析、生物身份认证,人 脸识别、图像理解、信号处理和数据挖掘等。就像我们的社会那样从工业化的 发展到后工业化的阶段,自动化以及对信息处理和检索的需求在工业生产中变 的越来越重要,这种趋势就把模式识别推到了今天的工程应用和高级研究阶段。 在大多数机器的智能系统当中,模式识别主要是用于决策。 1 1 研究背景 随着飞速发展的社会经济和具有了极大进步的现代科技,发生着同新月异 的变化城市交通,其中汽车化最为突出。汽车对人类的生活产生了极大的改变, 社会的节奏得到了很大程度地加快,人们的工作效率也得到了提高。但汽车在 带给人们方便的同时,也给人类带来了社会问题。最近几十年不断增加的汽车 的数量,使得如今的交通系统的基础设施几乎饱和,因此对交通需求同益增长。 特别是在人口密集的大型城市,人们在不同地点之间快速地往来,秩序混乱、 道路拥挤、污染加剧、事故频发等这些城市交通问题已经制约着社会经济的可 持续发展。近年来尽管一些措施被用来解决以上交通问题,然而目前缓解交通 拥挤的效果仍然很有限,许多的生态与环境方面的问题因此的也愈来愈严重。 由于修建公路不仅耗资巨大,还需要大量的土地资源,很显然,单纯靠修建更 多的道路绝对不可能完全解决交通问题。要想将这些科技发展所带来的问题有 效地解决好,还必须得进一步发展科技,用更先进的科技去解决。政府以及许 多的科研机构开始致力于研究并推广智能化的交通系统( i t s ) 引,以更好地 科学管理交通系统。 1 2 几种常见的车辆特征提取方法及其优缺点 1 2 1 外形轮廓扫描法 获得尽可能多的车辆特征信息是能够准确分类识别车辆的关键因素,在这 个基础之上对车辆的特征参数进行分析处理以实现j 下确的车辆分类识别。使用 轮廓扫描法的目的就是获取到车辆的外部形状的特征,从而根据其外部形状对 车辆分类识别。扫描主要是使用手段就是红外线或者无线电,激光扫描比前两 种扫描方法要更加先进一些。进行轮廓扫描的主要方式就是将发射部件安装到 车道的一边和车道的上面部分,再由发射部件向车道上发射出扫描波束1 5 1 。扫 描波束传播到的区域一般就是一个薄薄的平面,这个平面必须是垂直于车辆j 下 在行驶的方向。当行驶的车辆穿过这个波束所占据的平面时,就会有一部分区 域的波束被车辆挡住。因为事先在车道底部和车道的另一边安装了波束的接受 装置,因此当车辆经过时就会有一部分的波束不能够被接受到,如果知道车辆 的行驶速度,就可以结合波束接受装置的接受情况计算出车的外形特征,即车 辆的长、宽、高。在目前,这种方法检测车辆的外形特征,并进行车辆的分类 识别的技术还是比较成熟的,这样识别车辆也比较可靠,而且投入实际使用也 是简易可行的。 1 2 2 车轴计数法 使用一种方式测出车辆的轴数就称为车轴计数法,并将获得到的车轴数量 作为车辆的特征信息应用到车辆的分类识别中。有两种主要的方法检测车辆的 车轴数量,一是使用传感器检测的办法,二是使用不接触的检测办法。传感器 的办法就是将压电传感器埋设在车道的下面,检测出由车辆经过所产生的压力 的变化,车辆轴数不同就会有不同的压力变化次数,再根据变化次数就可以获 得车辆轴数的信息。不接触检测的办法就使用到了波束1 ,一般是发射波束, 再检测到反射回来的波束,与上一节中所述的有些类似,不过这种方法更简单 些。目前,国内生产出来的压电传感器质量不够,不能够满足实际应用中的要 求,西方发达国家研究出的压电传感器就可以满足实际应用的要求,但是如果 全部都从发达国家进口压电传感器就会耗掉大量的财力,在目前是不能够接受 的,还有一个原因就是知道车辆的轴数还不能准确地判断出车辆的类别,所以 检测车轴数量的技术一般就不会被单独的使用,而是和其它检测识别系统结合 在一起来完成车辆的检测识别。 1 2 3 车牌自动识别法 车牌的自动识别方法实际上就是使用图像处理技术来检测车辆的特征信息 1 。它主要是以工业控制计算机,图像处理相关的硬件设施和字符识别相关的 软件为核心,完成车辆牌照的实时拍照,再将所拍摄到的车辆牌照的图像进行 分析处理,提取出可分类的车辆特征信息。在整个过程中,首先要获取到车辆 牌照的图像,这个可以使用专门的图像摄取系统来完成。图像摄取系统的摄取 系统包含两个部分,个是探测器,另一个就是摄像装置。当车辆行驶过来时, 2 首先由探测器感应到车辆,再启动摄像装置拍摄下车牌完整的图像。由于摄像 时车辆是运动的并且车牌上可能会有污点存在,可能会导致获得到的车牌图像 不是很清晰,这样就会影响到车牌特征的提取。因此,车辆牌照的图像必须先 进行一系列的处理,使车牌的特征更加明显可辨,便可以通过牌照初步识别车 辆的类型。不过目前的技术还不够成熟,对于摄取车牌的图像会受到多方面的 因素的影响,可能会很难得到可辨别的车牌信息。因此要想通过车牌自动识别 车辆还需要做进一步的研究。 1 2 4 环形线圈检测法 从其本质上来说环形线圈就是一个电涡流式的传感器,首先将环形线圈埋 设在道路的下面1 ,当有车辆从上面经过时,车辆的底盘上的铁磁材料就会和 线圈产生的磁场发生作用,导致环形线圈中的频率发生改变,线圈频率的变化 量的大小只能与车辆底盘的几何形状、线圈的尺寸参数、磁导率、电源的频率、 电导率以及线圈到车辆底盘问的距离等的参数有一定的关系。在这些参数里面, 线圈的尺寸和电源频率这两部分是固定不发生变化的,车辆底盘上的铁磁材料 也是不变化的,从而可以认为线圈的电导率和磁导率不会发生变化。因此,一线 圈的频率的变化量就可以被认为只是根据车辆底盘上的几何形状、车辆底盘的 高度、车的行驶的速度等参数的不同而发生改变。车辆的底盘的特征跟车辆有 密切的关系,这样就可以根据所测得的频率变化量来识别车辆。通过环形线圈 检测到的不同车辆的频率曲线来进行分类的这种模式识别方法比较容易实现 1 ,分类的效果也很明显。但是,存在一些问题,例如车辆动态的情况下会导 致感应曲线发生出乎意料的改变等,还需要进一步的研究才可以更准确地实现 车辆的分类识别。 1 2 5 轴重和总重识别法 除了上面介绍的哪几种特征提取方法以外,还有其它的一些方法可行的, 测量车辆的轴重和总重也可以作为车辆的特征信息。检测出车辆的轴重和总重 并且综合其它的相关信息来对车辆进行分类识别,必然会提高对车辆分类识别 的准确率。检测系统的核心部分就是动态称重仪,动态称重仪也是计重收费系 统中的一个关键的设备。根据称重仪的工作原理的不同,称重仪一般分为压电 式、振弦式、石英式、光纤式等几大类,其中压电式称重仪在国内已有计重收 费方面的应用叫。这里就以压电式称重仪为例子来介绍,压电式称重仪的工作 原理是:当车辆的各轴压过铺设在车道上面的称重平台的时候,称重仪传感器 内部由电阻应变计所组成的多组电桥会失去平衡,然后会产生出瞬间不平衡的 输出信号并且传输到中央处理器,经中央处理器的模数转换后便可用于专门的 程序计算出各轴重并且累加算出车货的总重。 在目前的技术水平下,这种方法还是存在着一些不足之处,目前还没有很 好地解决高速行驶下的车辆的准确称重。虽然前面介绍了几种称重仪,如果车 辆是在高速的运动状态,要想使用前面所述的几种称重仪准确地检测到它的重 量还不是一件容易的事情,目前还没有解决还这个问题。如果得到了驶过车辆 的轴重和总重,也是只能将其作为一个参考的特征信息,很难使用它独立地完 成车辆的自动识别。要实现准确的检测轴重和总重,并使用它完成车辆的自动 识别还需要进一步的探索和研究,因此,在目前这种方法还是处于研究的阶段。 1 2 6 事先划分识别方法 在对不同的种类的车辆的自动识别和分类的技术中,在目前真正能够应用 到实际的还不是很多,然而对于车辆的分类都是按公路收费所必需要的条件进 行的,因此就必须使用一种比较折衷的方法来进行解决1 。现在所常用的就是 这一类方法,就是将车辆类型的相关信息例如座位的数量以及吨位等的数据, 包含在车上的用来长期存储数据的数据单元之中,使用事先划分来代替实时的 测量2 1 。当收费的时候,把这些数据传递给进行处理的那一方,以确定收费的 具体金额数。这样的处理方法要比实时测量更容易,但也存在比较容易造假的 缺点 1 3 车辆波形分类问题的提出 1 3 1 车辆感应波形的产生 将绝缘线圈埋在路面的下面较浅处以及将控制箱检测器装于路边,其中检 测器中振荡电路的电磁感应部分就是环型线圈。当汽车驶过或停在在绝缘线圈 上方,车辆的金属部分就会产生涡流电流,并且电流的方向和线圈电流的方向 相反,因此,线圈电流产生的磁场方向与引起涡流电流产生的磁场相反,减弱 了线圈磁场的场强,而线圈磁场场强的减小导致振荡电路的振荡频率增加,因 为不同类的车辆其底盘形状、重量和结构等是不同的,电感量的变化不同,振荡 频率也会发生实时变化,用频率变化曲线表示出检测频率的实时变化,即得到 不同车辆的电磁感应波形,如图1 1 所示列出检测到的不同类车辆的电磁感应 波形。 4 图1 1 常见几种车辆的电磁感应波形 1 3 2 车辆感应波形的一般特征 在以往对感应波形的特征提取研究中,人们大致可选感应波形的一般特征 来描述感应波形,这些特征主要有: 1 波峰数,例如小轿车一般只有一个波峰,而大货车一般有三个以上的波 峰。 2 最大值的位置,例如客车中最大峰值一般在曲线的中间区域,而卡车的 最大峰值一般宰波形的两头。 3 曲线的高度,例如一般小轿车的最大波峰值要比其他车辆的最大峰值要 l 两。 4 曲线的左右走势,例如有些曲线是中间高两头低,有些曲线是中间低两 端高,有些曲线是从左到右逐渐上升,等。 5 曲线的上下比重,即最小凹值比最大凸值的比例,能够通过它来反映出 曲线的最大凸值与最小凹值的一个差距,例如客车整体上来说波形比较稳定, 上下比重比较大,卡车波形起伏比较大,上下比重比较大。 通过以上的一般几何特征,人们可以对曲线有一些直观的描述,如小轿车 的曲线给人的直观印象是瘦而高,大客车曲线给人的直观印象是平儿宽,大卡 车的曲线是起伏比较大,且峰数比较多。这些特征进一步说明了可以根据车辆 感应波形的不同而对不同的车辆进行分类。但是这些一般几何特性比较笼统和 模糊| 13 。1 引,在实际运用中,感应波形凸凹变化并不规则,同种类车的波形曲线 5 从图片轮廓上来说是具有相似性的,但仅仅利用一般几何性质的曲线特征去描 述曲线的整体往往会出现错误或者是比较模糊。因此一般几何特征作为神经网 络的输入向量错误率较大,必须将感应波形数据进行特征提取,所得数据向量 作为神经网络的输入。 1 4 本文的主要内容概述 本文主要研究了基于a r t 神经网络的分类器、最小距离分类器以及基于 最小风险的a r t 神经网络分类器。a r t 神经网络是一种没有教师监督的神经 网络,比较适合于聚类,一方面它可以不断地从外界学习这称为由底向上的过 程,另一方面可以稳定住自己的学习,这就是由上往下的过程。a r t 神经网络 用于车辆感应波形分类的主要思想是根据波形轮廓的主要特征进行分类识别, 首先将采集到的数据进行预处理使其变的更适合于a r t 网络的输入的向量, 然后通过a r t 网络的无教师监督学习对车辆特征数据进行聚类学习,经过大 量的学习直至得到稳定的网络,再对分出来的类别规定名称标识,当有新的车 辆数据输入时自动分到相应的类别。基于最小风险检测a r t 网络结构与传统 的a r t 网络结构有些类似,只是在识别准则和输入模式准则上作了些改进。 主要工作可概括成以下几个方面: ( 1 ) 主成分分析法特征提取理论 考虑到车辆电磁感应数据都是高维向量,如过不经过降维处理会影响到分 类的准确性以及网络的学习和分类速度。因此要对原始数据进行降维,抽取主 要特征分量。主成分分析5 是把多个变量化为个数较少的综合变量的一种统计 分析方法。在多变量的研究中,往往由于变量个数太多,且彼止之间存在着一 定的相关性,因而使得所观测的数据在一定程度上有信息的重叠,而在高维空 间中研究样本的分布规律就更困难。主成分分析采取降维的方法,找出少量综 合性变量来代替原来众多的变量,使这些综合变量尽可能地反映原来变量的信 息量,而且彼止之间不相关,从而达到简化的目的。 ( 2 ) 核主成分分析法特征提取理论 目前,核主分量分析( k p c a ) 是抽取原始样本的非线性特征非常有效的办法 引,其与其它的特征提取方法不同之处就是它使用了核技巧。文中所述的核技 巧最早应用于s v m 方法中,基于核的主成分分析方法本质上就是核技巧的推 广应用。核方法的基本思想就是将原特征空间映射到另一个新的高维空间,并 通过使用核技巧在新的高维空间中进行相应的线性变换。在新的空间中其线性 方向实与原始特征空间中的非线性方向相对应的。因此,基于核的分析方法本 质上就是一种非线性的分析方法7 1 。这种特征提取方法与其它的方法不同之处 6 就是它能够在一个新的高维空间中很有效地运用了核函数,而不需要在原始的 特征空间中进行直接的分线性映射,这些特点使得它比一般的特征提取方法更 具有优越性n8 l 。 ( 3 ) 分类器的研究与设计 模式识别的最终目的就是对抽取到的特征进行最大限度地分类识别,因 此,模式识别系统中的核心单元就是分类器。从分类决策的角度上来看,降低 错误识别率和提高模式识别精度的关键得因素救在于是否能够对所提取到的 特征实现有效的分类判别。在目前的模式识别中,常用到的分类识别规则有最 大似然法、最小距离法、模糊推理法、最近邻分类法、人工神经网络法和贝叶 斯分类法等,常用到的分类器有最大似然分类器、最小距离分类器、r b f 分类 器、最近邻分类器、多特征组合分类器、b p 神经网络分类器等9 。上面所述 的这些分类方法以及分类器都只是适合对低维空间的数据进行分类识别,有依 赖于条件概率分布及类先验概率分类,也有的依赖于如何选取信度函数、模糊 集隶属度函数以及神经元激活函数等分类识别函数,基于不同的分类识别函数 所设计出的分类器的分类的性能和效果也是各不相同的,而且这些分类方法均 可称为静态的分类方法,太缺少自适应学习新的信息的能力。自适应共振网络 a r t 网络具有其它分类方法不具备的优良特性,它可以很好地解决稳定性和可 塑性这个二难的问题,可以稳定快速地识别已经学习过的对象,同时也能够快 速地学习没有学习过的对象。因此可以利用它稳定机制和竞争学习的优点来进 行车辆的分类识别他。 1 5 本文章节安排 本论文的内容分为如下五个部分 第一章绪论。介绍了本文的研究背景与发展方向,介绍了车辆检测方法 和技术以及车辆特征的抽取方法,对分类器的设计也进行了简要的概述,最后 简要的介绍了本文章节安排。 第二章特征提取方法。首先介绍了主成分分析法和核主成分分析法的基 本原理和特征提取方法,对两种特征提取方法进行了仿真,并对仿真结果进行 了比较研究。 第三章a r t 网络与最近邻分类法的比较与研究。首先介绍了a r t 网络的 基本原理和网络结构,对最近邻分类法的基本原理和算法进行了介绍,分别用 这两种分类法对主成分分析所得到的车辆特征数据进行分类仿真,最后对得到 的仿真结果进行了比较分析并简要的阐述了两中方法的优劣。 第四章基于最小风险检测a r t 网络分类器的设计。最小风险检测a r t 网 络分类器是对a r t 网络的做了一些改进而得来的,本章中介绍了改进得到的 最小风险检测a r t 网络,基于改进得到的最小风险检测a r t 网络的基础上设 计了一个新的分类器,将它应用到了车辆的分类识别,通过仿真实验对该分类 器的分类识别性能进行了测试。 第二章特征提取方法 2 1 引言 在本章中主要研究的是车辆的特征数据,因为存在着一个主要问题,就是 检测所获得的车辆数据都是高维向量,因此需要尽可能地将特征数量减少到最 少,以便减少计算的复杂度。另外一个原因就是,虽然两个不同的特征可能具 有很好的分类信息,但是如果将它们结合起来看做成一个特征向量时,由于它 们之间的相关性,几乎就得不到任何信息。减少特征数量的另一个主要原因是 分类器的通用性的要求。如果选择到的特征几乎不具有可供分辨的信息,就会 对分类器的性能产生极坏的影响。如果选择了具有能够辨别的分辨信息,将不 仅可以极大地简化了分类器的设计而且可以提高分类的准确率。进一步定量地 描述就是,我们要选择的那些特征向量是具有类间距离大而类内方差小的特 征。也就是说,不同类之间问的特征值距离比较远,而同一个类别中的特征值 就会致密地聚集。最后可以采用不同的办法进行处理,其中一种方法就是分别 处理每一个特征,除去那些几乎不具有辨识能力的特征;另一种方法就是将特 征综合起来考虑,可以对特征向量做一些线性的或者非线性的变换,使其具备 更好的辨别特性。本章中介绍了几种常用的特征提取方法,并且通过仿真实验 测试了它们的仿真效果并对其进行比较分析,得出它们的优缺点,找出相对更 适合于车辆特征提取的方法。 2 2 车辆数据的预处理 通过数据采集系统采集到的原始数据就是一维信号,其波形通常是具有比 较多的干扰信号,例如:车体的震动、天气变化、检测仪器的误差、白噪声等 原因产生的干扰信号。这些干扰因素会使得采集到的波形数据中含有较多的毛 刺和抖动,车速的大小会使波形被线性地压缩或者被线性地拉长,因此在使用 该曲线对车辆进行分类之前应该对数据进行处理。具体做法如下: ( 1 ) 进行平滑滤波。采取窗口平滑滤波将车辆波形变的光滑,使得波形 图像清晰可辨。 ( 2 ) 去掉奇异点。这些点属于误差,应先去掉。 ( 3 ) 对波形数据进行均匀的采样。 ( 4 ) 截掉那些无用的信号。 经过以上数据预处理,电磁感应波形数据均规范成等列的单行向量,并且 9 可以得到光滑的波形图,下图2 1 所示为一挂车波形处理前后变化过程,由此 可见同类车辆的轮廓基本相似。 图2 1 波形预处理前后 利用车辆的电磁感应特征曲线对车辆进行有效地识别,最重要的就是要从 中提取出各种车辆的波形特征,进而所设计分类器就是可以根据所得特征进行 分类。在和环形线圈相类似的研究中,学者们提出了不少的特征提取方法,最 简单的就是不用去考虑波形特征,直接按照车辆的长度进行简单划分;也有些 学者研究过应用谱分析方法如小波分析、傅里叶分析等方法提取波谱的特征; 而且更多的是采用感应波形的几何特征来描述。但这些方法提取到的特征并不 是按照标准来实现的,实际上,每一个标准大类可分成许多个子类,子类之问 的波形轮廓特征也是不相同,而子类之中的车辆波形的特征比较接近。由于车 辆的标准大类所划分的范围是比较广而导致子类之间的波形轮廓特征不相同, 在每一个标准大类中的子类的车轴和车辆也都会有所区别的,根据感应波形的 特征和外形特征、车辆实际的长度等。因此在实际情况中,虽然两幅波形图在 轮廓上具有一定的相似性,但是按照一般的波形特征描述就会比较模糊,可能 会被分到不同的类别。本课题中应用了主成分分析方法提取特征,较好地提取 波形的主要轮廓特征为分类器的输入向量。 2 3 主成分分析法 主成分分析是把多个变量化为个数较少的综合变量的一种统计分析方法。 在多变量的研究中,往往由于变量个数太多,且彼止之间存在着一定的相关性, 因而使得所观测的数据在一定程度上有信息的重叠,而在高维空间中研究样本 的分布规律就更困难。主成分分析采取降维的方法他,找出少量综合性变量来 代替原来众多的变量,使这些综合变量尽可能地反映原来变量的信息量,而且 要求综合变量之间不相关,从而达到简化的目的。 l o 利用车辆的电磁感应特性判别车辆,本质上就是按频率曲线自身的相似度 聚类。对波形的每一点进行匹配会使得变量太多而行不通。因而利用主成分分 析法提取最有效的综合因子作为波形的特征向量既可简化计算也可到达最好 的聚类效果。 2 3 1 主成分分析的基本理论 导出主分量的方法如下。 1 ) 设问题原坐标x 系为x l ,x 2 ,x p ,为将它们综合成p 个综合指标, 将坐标旋转成相互正交的新坐标系】, y = c x ( 2 1 ) 即 y l 。c l i x i - 4 - c 1 2 x 2 + 4 - c i p x , y 2 2 1 x l - 4 - c 2 2 x 2 - i - - - - 1 - c 2 p x 9( 2 2 ) y p2c p l x i + c p 2 x 2 + + c p p x p 并且满足靠2 i + 2 2 + + c 助2 = 1 ( 七= 1 , 2 ,3 ,p ) ,其中c i y 由下列原则确定: y i 与y j ( i j ,f ,j = l ,2 ,历) 相互无关; y i ,j ,2 ,y p 按如下方式排序:y l 是工i ,x 2 ,z p 的切线性组合 中方差最大者,y 2 是与y l 不相关的x l ,x 2 ,x p 的所有线性组合中反差最大 者;y p 是与y l ,y 2 ,y p 1 都不相关的x l ,x 2 ,x p 的所有线性组合中 方差最大者。换言之,这样设定的综合指标因子分别被称为原变量的第一、第 二、第p 个主分量,它们的方差依次递减。 2 ) 根据( 2 1 ) 式设定的新旋转直角坐标系,系数矩阵c 为正交矩阵,n 个 样本对应的点在变换后的y 坐标系中,在y 1 轴上有最大方差,在y 2 轴上有次 大方差,以此类推,在y p 轴上有最小的方差。同时该n 个点对不同的y j 轴和y i 轴的协方差( j i ) 为零,即要求y 满足: 阳= ( c x ) ( c x ) - c x x c - _ a( 2 3 ) 其中 a = ( 2 4 ) 相应于以的特征向量为q 。假定x 为已标准化处理后的数据矩阵,则x x 为原始数据的相关矩阵。设肠= 月即: r = l2 r 2 i2 名1名2 ( 2 5 ) p p; 甲 伽;仞 其中: 上 一 一 2 一:( 石蔚一x ,) ( x 毛,一工,) = 产兰皇= = = = = = = = = = 一 ( 2 6 ) 、( 一i ) 2 ( 一i ) 2 lk = l = l 解特征方程i 甜一r i = 0 ,通常用雅可比法( j a c o b i ) 求特征值以( 扛1 , 2 ,p ) , 并使其按大小顺序排列,即丑如,力。0 。 分别求出对应于特征值五的特征向量c i ( f = 1 , 2 ,p ) ,即得出综合指标对 应的向量这单要求i c i l i = l ,即c ;= l ,其中c 表示向量q 的第个分量。 j = l 以上的特征向量q ( f = 1 , 2 ,p ) ,即为综合指标对应的向量。在p 个特征值 如 名。0 中,选择m ( m 1 ,则该聚类好,因为它表明各聚类之间的距离大,而类内部的直 径相对较小。d n 实际上是数据样本聚类后的至少聚类程度。显然d 玎越大,表 明聚类越好。对于某个类c ,其聚类度d n ,为: 眈,侧面i ( 2 2 0 ) 它表明该类自身的聚类程度,而类c f 和c :,之间关联程度下式表示。 钒= 磊面d 丽( c i , 厕c j ) ( 2 2 1 ) 2 6 2 类可分性比较 从车辆特征数据中对每一类已知车辆随机抽样出一组数据,统一标识号与 车辆名称的关系加下表2 1 。用前林两种特秆榀脚方法对汶此数棍讲行钋瑚 抽取出车辆特征,采用前述的类可分性测试方法对所得特征进行可分性测量。 表2 1 原始数据 车辆标号 小客车 689lol3 中型客车 4 84 9515 35 4 大客车 2 52 93 0313 2 小型货车 6 46 57 36 08 4 中型货车 10 610 81 1o1 1210 3 大型货车 12 612 7l2 8l3 0l3 3 特大货车 15 815 9l6 0l6 l16 2 挂车 l4 4l4 5l3 815 215 6 分别对原始数据、主成分分析与核主成分分析所得数据计算d n 扩,其中 ( f = l ,2 4 0 ,j = 1 , 2 4 0 ) , 将计算得到的d n 结果,按照小客车、中型客车、大客 车、小型货车、中型货车、大型货车、特大货车、挂车8 类划分中所包含的标号, 计算8 :k 类间的可分度,计算结果如下,图2 4 是对未处理数据的可分度测试, 图2 5 为主成分分析所得,图2 6 为核主成分分析所得。 0 。二一立l 小客车- i 中客车一六客车 小货车中货车 大货车l 特大货车 挂车 阻 小客车 0 il 7 7 6 4 :1 8 7 1 2 1 9 3 8 21 3 6 9 1 5 0 5 4 1 1 3 4 3 62 3 9 0 2 j 2 中客车 1 7 7 6 4 :0 2 5 3 8 1 1 1 8 4 11 3 4 4 4 4 2 2 8 3 : 1 7 3 0 92 3 6 9 2 i 3 大客车 1 8 7 1 22 。5 3 8 1o1 。9 1 8 _1 6 8 4 83 3 1 6 40 。8 8 0 81 。8 5 8 9 | 4 小货车 1 9 3 8 2l 。1 8 4 11 9 1 8 7o1 1 5 2 62 。2 1 3 61 4 0 1 31 。9 0 7 5 5 中货车1 3 6 9 1 1 3 4 “ 1 6 8 4 81 1 5 2 6o2 5 5 4 31 1 5 6 71 8 9 7 1 | 6 大货车 5 0 5 4 14 2 2 8 33 3 1 6 42 2 1 3 6 2 5 5 4 30 1 5 | 3 42 6 2 3 0 卜。 1 7 特大货车 1 3 4 3 61 7 3 0 90 8 8 0 81 4 0 1 31 1 5 6 7 1 5 4 3 4 o 1 3 0 3 7 i 一一 一! 一一 ;8 挂车 2 3 9 0 22 3 6 9 21 8 5 8 91 9 0 7 51 8 9 7 12 6 2 3 01 3 0 3 7 o 图2 4 未处理数据类间可分度 1 6 在原始数据所得到的计算结果来看,虽然大多类相互之间的可分度都是大 于l 的,但是还存在个别数据可分度小于1 ,表明这个类别的数据可分度差,如 果不进行数据处理可能这个类别的数据完全不能得到正确的分类。按照d u n n 指 标,选择最小聚类度作为类间可分度的衡量指标,则d n = 0 8 8 0 8 ,该指标小于l 则表明该聚类是不可行的,所以引入了数据特征提取算法,希望能够通过对数 据的特征提取提高类间可分度。 璃0 , :,? :鹗1 小客车一j 中客车 大客车! 小货车中货车i 大货车i 特大货车挂车 蕴 小客车o 1 8 2 4 52 5 2 7 5 : 1 9 9 3 71 。3 2 5 2 l5 5 6 2 8 :1 5 0 9 12 2 8 0 5 2 中客车1 8 2 4 5 :03 1 7 1 9 ii 0 7 6 51 3 1 6 2 l3 7 9 1 41 8 2 5 12 2 6 3 6 3 大客车 2 5 2 7 53 1 7 1 9o :2 2 6 5 12 0 5 8 85 3 7 4 81 1 2 5 4 ,2 0 3 2 8 4 小货车 1 9 9 3 7 1 0 7 6 5 2 2 6 5 1 :01 1 9 2 72 0 9 7 7i 4 7 1 11 8 2 7 7 5 1 货车 1 3 2 5 21 3 1 6 22 0 5 8 81 1 9 2 702 7 5 0 0i 3 0 6 11 8 9 5 9 6 大货车 5 。5 6 2 83 。7 9 1 45 3 7 4 82 0 9 7 72 7 5 0 0o :i 5 8 1 92 。3 8 2 6 7 特大货车 1 5 0 9 11 8 2 5 11 1 2 5 4 :1 。4 7 1 11 3 0 6 11 5 8 1 9 :01 2 0 7 9 8 挂车2 2 8 0 5 ;2 2 6 3 62 0 3 2 8 1 8 2 7 71 8 9 5 92 3 8 2 6 :1 2 0 7 90 图2 5 主成分分析类间可分度 l 警。7 一l 尘骞丰一。中客车一i 六客车上小货车l 中货车 杰货车一i 鸶六货车拄车j l 孺军一 0 2 1 2 9 6 3 。4 9 5 0 1 1 2 0 2 92 。6 5 8 01 4 9 7 93 - 3 5 4 6 17 5 0 1 7 r 2 t 中客车 2 1 2 9 6 i05 0 9 6 4 ii 0 3 5 4 ;4 5 1 8 6 4 。5 1 3 5 :4 5 4 4 7 ;8 0 5 7 4 3 i 大客车 一二 3 4 9 5 0 ;1 5 0 9 6 4 0 ;4 5 9 9 3 :1 2 2 9 2 6 3 7 5 9 1 - 1 4 6 25 4 8 4 7 : 4 小货车 一”1 一? 一一 一一一:一 1 2 0 2 9 :i ! 1 0 3 5 4 :一,5 9 9 熏! l3 8 8 2 5 3 5 3 5 6 。 曼1 2 6 1 8 1 2 7 1 。; 一。一一一_ 1 5 中货车 2 6 5 8 04 。5 1 8 6 :1 2 2 9 2 3 。8 8 2 5 :0 ;4 。5 3 1 1 1 9 3 9 86 6 5 8 9 , 一一:一 一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论