版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
车标信号采集的设计与处理分析案例目录TOC\o"1-3"\h\u2019车标信号采集的设计与处理分析案例 1139231.1引言 1133601.2系统的需求分析 1162071.3数据库的设计及信号采集 10284271.4行为分析 1342211.4.1核函数对识别精度的影响 14282581.4.2参数优化对识别精度的影响由表 171.1引言本章主要对基于多普勒效应的车标识别系统进行需求分析以及使用可行性分析,紧接着,就系统的需求分析结果,介绍了满足相关需求需要的技术实现,进行系统的可行性分析。1.2系统的需求分析 设容量有限训练集D={(x1,y1),(x2,y2).,(xmYm)},y;∈{-1,+1},为已有标签的模型训练集,模式识别的最朴素的诉求是基于训练集D在多维空间内求得一个分类超平面,使各类属性的训练样本有所分别。如图1.1所示,多个分类超平面中,两类训练数据样本“正中间”的分类超平面即为最佳超平面,即图1.1中黑色实线。因为该分类超平面对新的数据所产生的微观改变的“容忍”性最好。若有已知样本以外的数据更靠近两类样本的分隔界,则其他它分类超平面将产生异常,而蓝实线分类超平面所受影响的最小。所以该分类超平面所产生的识别效果的鲁棒性最强,对新的数据的识别效果更优。图1.1两类训练样本的多个划分超平面之前对车标信号支持向量机的研究中,均默认了车标信号线性可分,也就是说,有一个∅可以准确识别车标信号。然而在工程领域及本课题实际情况下,初始车标信号空间内可能很难求得一个能正确分别两类车标信号样本的∅,如图1.2所示。图1.2从线性不可分到线性可分未解决以上矛盾,可令车标信号从低维空间转换至新的高维空间,以便车标信号在新的空间内线性可分。如图1.2所示,若将原始的平面空间转换至一个合适的立题空间,就能求解出一个合适的∅。若车标信号的原始维度有限,则可以求得新的高维空间使车标信号线性可分。不难看出,如果∅的表达式已知,核函数k即可求得。但在实际应用及本课题所涉及的车标识别中通常不知道∅的具体形式,而核函数的选择往往决定了整个特征空间。因此,∅成为SVM正确率高低的最大变量。如果选用不恰当,车标信号将转换至不恰当的新的分类空间,造成分类效果大幅下降。目前,工程领域尚未找到核函数选择的较为普遍的方法,一般采用尝试法与经验法。常用的核函数如表1.1所示。表1.1常用核函数名称表达式参数线性核K(xi多项式核K(d≥1为多项式次数高斯核K(xi,yσ>0为高斯核带宽Sigomid核K(tanh为双曲正切函数,β>0,θ<0一次SVM仅可以完成对数据的二分类,对于基于SVM的多分类问题,则需组合多个SVM模型对车标信号进行识别。毛连忠等人曾利用SVM研究过服装型号推荐问题,其采集了多位女性的身高、领围等特征部位尺寸,并根据身材数据为用户在S、M、L、XL中选择推荐尺寸,算出各个部位个体尺寸与标准尺寸的差值,进而给出各个型号下的合身度函数值fs、fu、f、fxL,选取其中的最小值为推荐型号,并将各部分尺寸和推荐型号作为训练集。c对于多分类模型,该课题提出了“一对一”模型:该算法是将个体尺寸样本中的每两个型号作为二类分类模型,若包含n中型号,则其所需分类器个数k为:k=用每个SVM来识别待测尺寸数据,得到k个推荐尺寸。根据每--次的识别结果:对n种型号开展选举,最高的型号则为待推荐尺寸数据的推荐结果。由上式可知若从S、M、L、X四个型号中进行尺寸推荐,则需进行6次SVM分类。对于分类结果多为两两相似的情况,亦可以利用大分类法将两个较为相似的类别分至--组,于是本课题提出了二拓扑SVM分类结构,对于n类结果,其训练所需分类器个数k为:k=n-1同为四分类,本课题需要将通过车标雷达硬件平台所采集的靠近、远离、挥手、握拳四种车标动作进行分类,经FFT对数据进行预处理,可以观察得到靠近和远离两种动作较为相似,挥手和握拳两种动作较为相似,因而可以采用二.拓扑SVM结构,先使用--次SVM将车标信号进行二分类,再各自使用一次SVM进行四分类,如图1.3所示。图1.3车标信号四分类二拓扑结构可以看出,二拓扑结构仅需3次SVM即可完成四分类,给出车标动作信息,相较于一对一分类方法,减少了3次SVM分类,运算效率大幅提高。默认车标信号数据为线性可分,即存在确定的∅可将两种类别的车标信号完全划分开。可是,在实际工程中往往很难确定该线性可分结果是否会导致车标信号分类过拟合或完全线性可分。此种需要全部车标信号均满足∅划分的现情况称为“硬间隔”,为了弱化该情况,引入“软间隔”的定义,如图1.5所示。图1.5软间隔示意图核函数、车标信号映射以及车标空间是一一对应的。核函数相关参系数的变更实际则是隐形地对核函数进行变更,进而对特征映射进行变化,同时调节车标信号特征空间的复杂程度。车标信号空间的维数决定了线性∅的最大VC维,若车标信号空间维数很高,最佳∅复杂度将会较高,对于训练集识别效果好但兼容性差;反之同样成立。这两种情况下得到的SVM都不会对车标信号有良好的分类效果。因而需要确定合适的核函数系数以获得恰当的车标信号分类空间,这样才可获得车标分类性能好的SVM.惩罚参数C为决定SVM分类效果的又一个影响参数。其最大作用是在确定的车标信号空间中改变SVM的置信区间和经验风险的相对大小,以进--步提高SVM的泛化性能。不同车标信号空间的最佳参数值有所改变,在某个的车标信号空间中,参数C的值越小可避免过拟合过拟合但识别效率低;反之同样.成立。所以,对于本课题所建立的车标信号数据集,为了得到识别结果优良的SVM,确定合适的选择-一个合适的惩罚参数C至关重要。为使SVM的分类识别及参数寻优更加便捷,来自我国台湾地区的林智仁等研究人员设计并编写了LBSVM软件库。Matlab平台支持LIBSVM软件库的开发与应用,svmtrain语句可完成对SVM的训练及其参数寻优。惩罚因子C的大小由svntrain语句的“-c”项决定,默认值为1。其它调参项如表1.2所示。表1.2常用核函数的参数项名称参数项代码项线性核无无多项式核多项式次数d“-d”,默认为3高斯核高斯核带宽σ“-g”,其中g=1sigomid核系数β偏移θ“-g”,默认为分类类别数目的倒数“-r”,默认为0随着研究的深入和工程项目经验的积累,相关人员尝试使用一些算法对SVM的参数进行改变和寻优。遗传算法及网格搜索法是较为经典的两种方式。受自然选择思想的启发,科研领域逐步探索出了全局优化算法,即遗传算法CGeneticAlgorithm,GA)。GA随机产生含有一定量个体的车标信号SVM参数种群,对种群依环境(优化效果)进行自然选择、并对种群进行生物学演变,最终产生字代参数群体,不断往复,直至完成迭代,找到最优参数组合。据生物学理论,GA主要包含五个步骤。(1)参数编码在GA中,种群中独立的参数点往往采用编码的方式来表示,以便于完成交叉、变异等生物学遗传演变。编码的方式对于参数寻优的复杂度、代码运行时间有一定的影响。(2)求解适应度在工程领域,个体适应度的高低与机器学习算法的参数有关,代表了该参数下模型的优劣。在同一种群中,参数点被保留的可能性与该点适应度的高低呈正相关。不难看出,任意个体适应度均为正数,且随着遗传进化的推进,适应度总体呈上升趋势。(3)自然选择适应度取决于不同参数点下模型的优劣,即参数点生存能力,但在生物进化的过程中,仍然需要一定的自然选择来完成。自然选择即采取某种方法从参数种群内挑选一定比例参数个体作为父本或母本来演化子一代的过程。工程领域一般采取转盘法进行自然选择。(4)交叉在生物学领域,交叉是父本及母本的DNA信息混合并产生新的个体的过程。针对GA,交叉操作主要是将父本及母本参数信息交换点的某一端进行互换,以得到子一代个体。(5)变异在生物学领域,变异是个体因外界环境等第三方不确定因素而产生的基因突变的现象,其概率极低。在GA中,变异是为了使个别原始参数点跳出原搜索范围,避免参数陷入局部最优点而在迭代结束前就丧失了寻找更优参数的机会。由于变异概率不高,所以GA变异选用均匀变异法即可。利用GA对SVM进行参数寻优的流程图如1.6所示。图2.6基于GA的SVM参数优化流程网格搜索法是机器学习中最原始的优化算法,利用该方法求解SVM的最佳参数点是一种效果良好的寻优方式,可以从多个参数维度对SVM进行优化。网格搜索算法的定义是将待寻优参数于限定的参数空间内划分为大小相等的网格,之后一次求解各个网格所对应参数值的模型训练效果。该参数优化算法原理简单、易于编译。网格搜索法可用于优化本课题的动态车标支持SVM,其主要优点如下:(1)能够同时对惩罚参数C、核参数两个参数值进行遍历寻优,并使两组参数互不干涉,可实现并行搜索。(2)在SVM参数搜索范围相对确定的情况下,网络搜索消耗的时间较少。(3)求得的最佳参数值为参数空间的全局最优解,不会使SVM停驻于某一区域的参数解。然而网格搜索法缺点亦然明显,主要如下:(1)若设定参数范围较大时,寻优时间较长。(2)如果经验不足,未限定合适的参数寻优区域,相对其它参数寻优方式,不易求得二拓扑结构SVM的最佳参数值。不难看出,网格搜索算法实质上是一种穷举的方法。本课题利用该算法进行SVM寻优的基本流程为:(1)跟据经验确定惩罚参数C、核参数待搜索的范围。(2)固定各惩罚参数C、核参数检验步长,将惩罚参数C、核参数依步长离散化,沿着惩罚参数C、核参数的步长依次检验,网格中的离散的点对应不同的参数值。(3)在检验结果中,选取最优参数点作为SVM最优参数。其流程图如1.7所示。图1.7基于网格搜索算法的SVM寻优流程针对以线性核为核函数的SVM单参数优化问题,可以采用GA寻优,经一定次数的迭代后,找到适应度最佳的惩罚因子C;而就多参数优化问题,GA与网格搜索法进行参数寻优各有优劣。网格搜索法往往固定了步长,在规定的范围内依次验证SVM的训练正确率。相比于遗传算法,其验证了全局参数的SVM训练正确率,不会陷入局部最优点,且SVM核函数常用的参数范围不是特别广,且往往将参数取对数并增加相应步长依次验证,减少了训练时间,提高了验证效率。但是网格搜索法步长固定,在参数较大时,其对数衰减的更快,在前进相同的步长下参数增幅过大,在相邻的验证网格中,会找不到两个网格间训练效果更加的参数点。网格搜索法的优势是可以宏观锁定“高原参数区”,如图所示黄色区域所示,但在微观寻找局部“高峰参数点”上,即局部最优点上不具优势。图1.8网格搜索法对“高原参数区”的宏观锁定1.3数据库的设计及信号采集为使模型训练的效果具有普遍性,需利用数据采集系统采集具有一定样本容量的数据集。按照实际应用情况完成了有效的靠近、远离、挥手及握拳动作各1000次。本课题对4000条车标信号采集后完成了FFT处理等相关工作,作为本次实验的数据集。在4组1000条车标信号中,随机选用各组车标信号的900条对模型进行训练,其余的100条作为测试集进行实验验证。利用键盘以及鼠标等交互工具,以用户界面为中介,实现了用户与机器、用户与程序的沟通,这种方式被称为图形用户界面(GraphicalUserInterfaces,GUI)o其由选项栏、按键、备注栏以及图形等模块组成的前端平台,用户通过在GUI中的操作执行后端程序,从而实现了与机器的交互。为促进大数据开发、数学分析以及数组运算的发展,美国Mathworks集团于1984年推出了以矩阵为最小运算单位的数学编程软件Matlab。Matlab的GUI工作平台可由“guide”命令启动并绘制界面,界面图片保存之后即可生成以存储基本模块函数的.m文件,用户可直接在各个模块下进行编译,具有清晰、简洁、易懂等特点。自6.0版本起,MatlabGUI平台添加了设备控制箱(instrumentcontroltoolbox),旨在为RS-232/RS-485通信准则给予相关的支持,降低软件开发难度。通过其中的serial相关命令、调用串口专属instrcallback()中断,可实现串行通信,并具有如下优势:(1)兼容多种串行设备(RS-232,RS-422,RS-485)的连接与通信;(2)二进制数据及文本(ASCII)数据两种通信方式均受支持;(3)支持异步通信及同步通信;(4)支持基于事件驱动的通信(亦称中断方式)。GUI平台的串口通信仅把信号传输到PC端,而其它功能均利用软件实现,因此利用GUI平台实现数据预处理等功能较实用传统串口通信软件要简洁,如需添加某项功能,只需添加一个代码模块即可实现,而不需要改变通信设备的连接和软件架构。Matlab对车标信号的采集基本上是利用serialU命令完成,主要包含四个步骤:(1)创建串口或通信设备并设置其属性;(2)打开串口或通信设备;(3)读取串口或通信设备数据;(4)关闭串口或通信设备。MatlabGUI界面绘制好之后,会按数据采集界面中绘制的组件将代码分成不同的function模块,形成初步的代码架构,不同的function之间涉及参数共享问题,即全局变量,本课题数据采集系统涉及的全局变量如表1.1所示。变量定义s串口COM串口编号rate波特率Data_re每接收1024个数后存于该数组Data_save接收数据后,读取Data_re的数据,以方便Data_re继续读取收视数据m数据所保存.mat及.xls的文件编号k上下组数据间切换的数据组标号表1.1数据采集系统全局变量MatlabGUI在各按钮下,无法避免需要在一些区域绘制图像,在MatlabGUI中,图像的属性为“axes,在各个按钮下进行绘图编译时需要使用"axes()”调用图区域句柄后,才可进行绘图操作。本课题共涉及4个图像绘制,其名称及功能如表1.2所示。表1.2GUI界面图区域名称及呈现内容区域名称呈现内容Data_picture原始车标信号图像FFT_amplitude车标信号FFT幅度FFT_phrase_orignal车标信号全段FFT相位FFT_phrase_new车标信号分段FFT相位包括本课题在内的常用GUI界面,通常以按钮为操作功能点,所以在每个按钮的Callback函数下编写代码即可。图1.1数据采集系统界面由于本课题所采用的芯片位数有限,当采集的数据值超过256即电压超过0.205伏时车标速度过快时会出现数据溢出现象,如图1.2(b)所示。在实际应用中,可以换用性能更好的芯片来避免这一情况的发生,由于本课题旨在探究车标信号的分类及识别方法,所以暂时采用价格相对经济的硬件模块。因而本课题在车标信号采集时需要注意车标信号是否发生过饱和现象,如果采集数据溢出,则不应将相应数据保存,如果采集数据未出现溢出现象,如图1.2(a)所示,则可以继续观察。图1.2正确动作与错误动作对比1.4行为分析我们除了对4000条车标信号的FFT进行了保存外,同时也保存了其原始的数据信号,我们分别将原始信号、全段FFT,分段(N=32)FFT依次作为数据集,利用二拓扑支持向量机模型进行分类,其分类结果如表1.3-表1.6所示。表1.3线性核分类结果SVM1SVM2SVM3原始数据0.79250.50000.4650全段FFT0.88500.65500.5500分段FFT0.95000.98000.7000表1.4多项式核分类结果SVM1SVM2SVM3原始数据0.70000.82000.5000全段FFT0.62500.71500.5000分段FFT0.85000.98500.4750表1.5高斯核分类结果SVM1SVM2SVM3原始数据0.50250.80000.5000全段FFT0.79250.88500.5500分段FFT0.91500.98000.9300表1.6sigmoid核分类结果SVM1SVM2SVM3原始数据0.58750.61000.5950全段FFT0.79250.55000.6050分段FFT0.87500.94000.6750可以看出,分段FFT因其对时域信息的保留和频域信息的捕获,在绝大多数情况下,其分类效果好于原始数据集全段FFT。1.4.1核函数对识别精度的影响SVM进行分类时,核函数的选取对结果有重要的影响,目前对于核函数选取没有统一的方法,经验法与尝试法是较常见的方法[[48]。本课题对三次SVM尝试了不同核函数,其训练正确率如表1.7所示。表1.7训练结果SVM1SVM2SVM3线性核0.9500.9800.700多项式核0.8500.9850.475高斯核0.9150.9800.930sigomid核0.8750.9400.675由表1.7可得不同核函数对于不同SVM的训练能力不同,最佳的核函数组合方案为:SVM1使用线性核,SVM2使用多项式核,SVM3使用高斯核。训练集分类结果如图1.3所示。由图1.4可以看出,训练集分类正确率为90.69%(3265/3600)。利用最佳方案,测试集分类结果如图1.4所示。图1.4测试集分类结果由图1.4可以看出,该二拓扑SVM模型在测试集的识别正确率为90.25%(361/400)。本课题对车标信号进行分类识别的SVM二拓扑结构,以3600条经全段FFT处理车标信号的.mat文件作为训练集,其训练时长表1.8所示,SVM1采用多项式核,SVM2采用线性核,SVM3采用高斯核,其训练时长共计1.28秒。表1.8车标信号SVM二拓扑结构训练时长统计SVM编号核函数选择训练时间(秒)训练正确率SVM1线性核1.259895.00%SVM2多项式核0.446998.50%SVM4高斯核0.970691.00%二拓扑SVM1.277390.69%同时为验证SVM二拓扑结构对于车标信号识别的有效性,本课题模仿时下最经典的CNN网络LeNet-5进行比对验证,该比对CNN网络对车标信号先后进行了卷积池化等操作。最终输出的结果为靠近、远离、挥手、握拳4种车标动作,如图1.5所示。经100次迭代,训练正确率如图1.6所示。图1.5车标信号识别CNN比对模型架构图1.6CNN比对模型训练正确率CNN车标识别模型可在每次迭代之后保存当前最优的模型,由图可以看出,CNN车标识别模型在70代左右起达到最优效率,训练正确率为90%,本课题后续将400条车标信号测试集输入CNN模型对其进行测试,测试正确率为89.25%,对比表的数据,可以看出同样不经过参数优化,CNN与SVM训练以及测试的结果相当。另外,本课题在训练神经网络时记录了各次迭代后的时间戳,经时间戳转换,其各主要轮次迭代完成后的训练时间如表1.9所示。表1.9CNN模型各主要迭代次数的训练时间迭代次数当前正确率当前最优正确率当前训练总时长(秒)2082.5%82.5%12.20815085.0%85.0%28.80717090.0%90.0%41.594310087.5%90.0%57.9174可以看出,在同一台PC下(即在相同的硬件配置下)CNN达到与SVM相同的识别能力,至少需要约41.60秒才能完成训练,而进行迭代前,并不知道迭代具体会在哪一个阶段达到最佳,若完成整个迭代过程,则100代需历经约57.92秒,这与表中SVM的训练时间相差甚远。虽然优化模型结构、改进参数优化方法可能会在一定程度上减少CNN的训练时间,但从表1.6及表1.7的数据可以看出,SVM比CNN依然高效的多。1.4.2参数优化对识别精度的影响由表可得,最佳的核函数组合方案为:SVM1选择线性核,S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年从零到精通学徒安全培训内容
- 2026年幼儿教育质量监督协议
- 2026年油田运营管理合同协议
- 2026年安全培训内容包括什么重点
- 2026年监控施工安全培训内容核心要点
- 阿坝藏族羌族自治州茂县2025-2026学年第二学期五年级语文第五单元测试卷(部编版含答案)
- 2026年商场消防安全培训内容核心要点
- 九江市修水县2025-2026学年第二学期五年级语文期中考试卷(部编版含答案)
- 襄樊市枣阳市2025-2026学年第二学期二年级语文第四单元测试卷(部编版含答案)
- 宝鸡市金台区2025-2026学年第二学期五年级语文第六单元测试卷(部编版含答案)
- 【揭阳】2025年广东省揭阳市惠来县卫健系统公开招聘事业单位工作人员152人笔试历年典型考题及考点剖析附带答案详解
- 2025年北京市西城区社区工作者招聘笔试真题及答案
- 2026年及未来5年市场数据中国演艺行业市场发展数据监测及投资潜力预测报告
- Z20名校联盟2026届高三语文第二次联考考场标杆文9篇:“出片”
- 部编版五年级下册第二单元 口语交际《怎样表演课本剧》考题作业设计
- 2026年员工安全操作培训
- 2026工业机器人核心零部件行业现状与发展趋势报告
- 蚯蚓养殖技术操作指南
- mckinsey -国家健康:更健全的健康状况更强劲的经济发展 The health of nations Stronger health,stronger economies
- 机动车检测维修工程师考试题及答案
- 2026年春季小学信息科技(甘肃版2021)五年级下册教学计划含进度表
评论
0/150
提交评论