【《基于深度学习的交通标志识别算法设计和实验探究》12000字(论文)】_第1页
【《基于深度学习的交通标志识别算法设计和实验探究》12000字(论文)】_第2页
【《基于深度学习的交通标志识别算法设计和实验探究》12000字(论文)】_第3页
【《基于深度学习的交通标志识别算法设计和实验探究》12000字(论文)】_第4页
【《基于深度学习的交通标志识别算法设计和实验探究》12000字(论文)】_第5页
已阅读5页,还剩25页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于深度学习的交通标志识别算法设计和实验探究摘要近几年,交通标志检测与识别已经成为智能交通领域的研究热点,卷积神经网络,是一种图像分类技术,利用深度学习来实行自主运算。本文将通过ImageNet预训练卷积神经网络的模型,通过迁移学习来达成各种交通标志图像分类。把各种交通标志图像训练成一个单独模型。交通标志检测系统可以分为交通标志样本特征训练过程与交通标志检测分类。交通标志样本特征训练过程的核心是针对训练样本库的处理,对交通标志特征的提取,可离线存储至本地文件,通过训练来获取交通标志检测模型。本文基于CCTSDB数据集作为本次交通标志识别研究的数据集,在利用OpenCV搭建实验平台并利用RCNN、YOLO与InceptionV3网络对各种交通标志图像数据集进行迁移训练,最后,通过Qt5开发可视化交通标志识别系统界面。由实验结果得出,本实验采用的深度学习交通标志识别算法是有效且可行的,与此同时该系统是依据卷积神经网络算法分析设计的,算法实用性和稳定程度也可以得到保障。关键词:交通标志识别;深度学习;OpenCV;YOLO;Qt5;CCTSDB目录摘要 [1]中国交通数据集由长沙理工大学综合交通运输大数据智能处理湖南省重点实验室张建明老师团队制作完成,部分图像如下图所示。本文将通过CCTSDB交通标志图像,将不同派别下的各种交通标志图像分别放入训练集和测试集,用OpenCV进行标记后处理,并采用Darknet框架训练交通标志识别模型,识别率达标后完成训练。1.3论文组织结构第一章在大量相关研究中,首先综合分析了交通标志识别课题的研究背景与研究意义。对未来交通识别应用的广泛程度进行预测,紧接着介绍了论文的主要研究方法和整体步骤。第二章分析介绍了交通标志检测和识别的国内外研究历史与现状。主要包括国内外团队的最新研究,以及交通标志图像识别领域研究现状。第三章主要介绍了利用区域推荐算法和非极大值抑制原理对图像进行初步的定位,YOLO模型对交通标志特征的提取,最后是对数据集中的图像进行标定,分为“警告类”,“禁止”类,和“指向”类。第四章介绍了LeNet-5网络这种典型卷积神经网络模型的原理,并比较分析了这种网络结构的优缺点。在真实的生活场景中我们需要快速且精准地判断出交通标志的意义,同时发挥出识别精确度的长处。第五章总结全文研究内容与实验结果,指出本文的不足之处,并展望未来的发展2.交通标志识别的研究现状分析最直接地看交通标志,无非大多是三角、圆形、矩形,而且颜色形状较为固定,看似检测较为简单。但是,现实中的道路交通标志并非如此理想化,有很多不确定的人为因素或是自然因素会对交通标志牌的完整性进行破坏,比如最常见的场景是交通标志牌因树木的生长而被遮挡。如何准确、快速对交通标志进行检测在世界范围内仍然是一个值得去研究的重点。在深度学习的早期研究历史情况中,研究人员大多采用传统的图像分析与机器学习等方法去解决交通标志自动标定检测与跟踪等问题,即便成果卓著,但还是有些不足需要更进一步的改动。近几年,因为深度学习的发展脚步飞速,卷积神经网络在图像分类和目标检测领域也进步明显,人们对交通标志识别又有了更深的认识,但数据集的稀缺仍是限制研究的主要原因。2.1目标检测领域的研究现状首先介绍一下卷积神经网络传统的检测方式,开始时先在待检测的图像上选择含括目标的部分,之后将目标区域的图像特征提取出来,最后应用训练好的图像特征分类器通过滑动窗口的方式把图像遍历一遍,以此来实现对图像的检测。目标检测得到结果后就是最基础的分类操作了。但是有两个关键性问题是显而易见的:一是滑动窗口的区域性搜索对目标的把握不准确,这导致的结果是整体的计算量会大幅升级,检测的效率也不高;二是人为设定的特征无法和现实中多样化的目标进行良好的匹配。对以上的缺点进行分析后,研究者发现可以采用候选区域(regionproposal)的方式对以上问题进行改进。在这里简单解释一下什么是候选区域,其原理就是优先考虑图像中的颜色、边界、轮廓等信息提前锁定目标出现的位置,这样可以对候选区的总量进行一个稳定。因为候选区域数量维持的不错,滑动窗口操作会更加针对图像的特征,因此图像遍历的计算量大幅减少,现如今世界范围内用的最多的候选区域算法有selectivesearch和edgeboxes等。前面已经简介了卷积神经网络在图像分类上的重大研究成果,所以目标检测得到候选区域后使用卷积神经网络对其进行特征提取和分类是一个很好的选择。Girshick在2014年第一次提出了R-CN框架REF_Ref74303185\r\h[2],第一次提出了卷积神经网络加候选区域的方法代替传统目标检测使用的滑动窗口加人工设计特征训练分类器的方法,这对目标检测方向是一次巨大的贡献。R-CNN先根据Selectivesearch算法提取2000个目标候选框,然后用卷积神经网络对每个候选域进行分类来实现目标的检测,在检测精度方面取得了良好的效果,但由于存在重复计算导致速度偏慢。为了提升检测的精确程度,国内外研究学者先后提出SPPNet,FastR-cn,Faster-RCNN,YOLO和SSD等方法,这些方法相较于传统目标检测方法,使基于卷积网络的目标检测算法实时性和检测精度都有很大的提高。2.2交通标志识别研究现状在道路相对复杂的城市中,交通标志检测识别技术对汽车的道路辅助系统有不可或缺的作用。比如现如今的导航系统,都用到了标志识别的系统,城市场景中的交通标志检测与识别技术无论是对于目前比较成熟的驾驶辅助系统还是无人汽车这种前沿科技而言,都是非常重要的组成部分,对于提高道路安全有着非常重要的意义。伴随着互联网和计算机科技的不断进步和完善,使用计算机图像识别处理系统对物品自动识别的研究已经在开始初步启动,挖掘如何利用计算机技术“快,准,精”地识别交通标志图像,对于交通标志分类、交通标志识别等方面具有现实意义。2006年,陶佰睿就研究过采用软件的方式来区分交通标志。软件首先把数据发掘出来,之后图像的预处理等构建各种种类的交通标志类别数据库。在改良后的数据库中,最终通过建模发现了不同品种交通标志自身特性的特征参数。赵作林于2015年提出一种改进分类器Adaboost.m2-KNN[3],它是依据于过去两种分类器的制作出来的。此人工分类器虽然在当时引起了不小的轰动,“深度学习”工作原理步入大众视野,因此采用人工智能代替人工图像分类的论文也越来越多的被采用。采用深度学习来实行自主运算的卷积神经网络是目前行业内针对图像检测分类的主流方法。利用CNN卷积神经网络算法提取特征的方法,最早由LeCun提出的学术文章卷积神经网络应用于手写数字识别。CNN在视觉分类领域获得非常大的成效。人们尝试将ImageNet预训练的CNN模型用于不同数据集,利用迁移学习方法取得不错效果。刘孟南于2017年想到植物叶片的图像集分类可以由基于非线性重构模型算法计算,使得网络训练过程中的梯度弥散与网络陷入局部极小值这两个问题,可以被有效地避免。2.2.1对卷积神经网络深度结构的研究网络层数越多,能表达的信息越多,能同时处理的数据量也更大,因此研究人员通过实验设计出更多层数的网络模型来提升算法的识别精确程度。目前国外许多研究队伍都指出了更“深层”的模型结构。比如,百度设计的DeepImage是一个十三层的网络结构:在2014年ILSVRS挑战杯中获得亚军的VGG16网络拥有19层网络结构;冠军Google团队的GoogleNet[4],具有22层的结构。2.2.2模型中池化层应用方法研究通常情况下卷积层紧接着是池化层,池化层的作用通常用是减少卷积层图像输出的维度,这种特性可以有效地避免拟合问题的发生。在目前为止,池化操作大体上分为两类平均池化和最大池化。首先是最大池化,其运行原理是把从上一层得到的输出结果进行模拟训练,得到的是选定区域的极大值。之后是平均池化,平均池化操作得到的结果是平均值,Boureau等对仔细对比了这两种池化操作方法,实验证明平均池化操作后,输出得到的图像冗余背景较多,而最大池化则可以更多的保留纹理信息,相比于图像背景,纹理特征更重要,因此在CNN中一般采用最大池化的池化方法。2.2.3对网络激活函数的研究CNN中的激活函数为了增加对模型的表达能力,其在网络模型中加入非线性因素。卷积神经网络模型中在早期用的最多的激活函数大多数是SigmoidI函数和tanh函数[5],二者的表示形式分别为式(2-1)和式(2-2)。fx=11+e−kx(2-1)

fx随着网络越来越深”,会使得反向传播过程中误差梯度扩散明显,产生梯度弥散,不利于训练的收敛。Nair等在2010年提出了修正线性单元ReLu(RectifiedLinearUnits)[6]即式(2-3)fx=max⁡(0,x)ReLU在输入小于0的值时输出为0,可以通过此特性来去除数据中的多余部分,最大地保留数据的特性。He等在此基础上提出了参数化修正线性单元Prelu,当输入小于0时输出为ax,且a可以适应获取,相比于ReLU,只增加了少量额外的参数,却可以很好提高精度。2.3本章小结本章先提出交通标志检测应用的各种现实情况和未来研究趋势,证明本课题仍有很大的研究价值,之后分析介绍了国内外团队对交通标志检测和研究的历史和现状,分析阐明了各类识别方法的优势和不足以及数据集的缺少致使现有方法的不足。最后说明本文的研究目的,先对数据集进行收集与标记,对现有的卷积神经网络算法进行改进,来实现更有效地对交通标志的检测。3.交通标志图像定位3.1图像定位简介与传统的机器学习算法不相同,传统的算法必须使用一些技术性或是技巧性的方法来抽取图像的特点,深度学习在这一方向具有得天独厚的长处。深度学习通过大批的交通标志图像模型进行模拟训练,从这些模拟得到的样本图像中自然地提取交通标志图像的特点,卷积神经网络自二十世纪八十年代的出现之后,已经成为许多科研方向的重点。图3-1特征提取过程图3.2区域选择推荐算法利用区域选择推荐算法定位道路标志是交通标志识别在卷积神经网络上的一次伟大的历史性突破。与之前的机器学习的算法不相同的是,在录入一个图像时区域卷积神经网络系统会通过识别图像的各种细节例如,图像的颜色,轮廓,边界,空间占比,纹路等来对候选目标的数量进行初步的预测。有时为了推荐区域的顺利产出,会应用一个网格,使它滑动在倒数第一层卷积层产出的卷积神经特点图,该网格在利用窗口在输入的卷积神经特点图上。此网络的表达如以下图像表示,因为网络的运行是在滑动思维下运作的,两个全连接层分析享有全部的坐标信息和空间位置,这一框架很顺利地通过的卷积层呈现,在的卷积层后使用ReLU(Rectified)激励函数进行最后输出。为了对区域推送网络进行模拟训练,使其能够对交通标志做出一个区块化的判断,每一个anchor模型都要匹配一个二进制的标签,分配一个正标签给两类anchor,这步操作与这个标签是不是属于此目标无关,第一类anchor和现实框的匹配程度最好,第二类anchor与现实框的匹配程度大于0。定义最终的交通标志模型识别最小化目标loss函数如下:(3-1)其中,ⅈ是anchor对应的下标,是第个anchor含有交通标志目标的预测概率,如果anchor是真,则为1,否则,如果anchor为负,则为0[7]。是代表预测框盒子坐标的4个数据的向量,是与真anchor相关的真实框盒子坐标的4个参数的向量。分类损失函数是两类(目标和非目标)的逻辑损失,对于回归损失函数,我们使用,其中是一个平滑损失函数,如公式所示smoothL1=0.5x公式代表仅仅当anchor为真()和anchor为负(),分类层和回归层输出由和构成,这两项将通过,以及平衡常数均值化。对于回归,本文通过如下公式来参数化4个坐标&tx=x−xa/&tx∗=x∗−其中,x,y,w和h分别代表图像中交通标志框的中间坐标[8],其表示的是交通标志目标框的宽度和高度,变量x,xα和3.3非极大值抑制原理最后确定交通标志目标框时,深度学习目标框需要进行非极大值抑制(NMS)如下图所示,其是众多计算机视觉和模式识别和图像处理应用中的关键预处理步骤。图3-2交通标志非极大值抑制示意图NMS的直接实现包含有两个循环,当中的外循环遍历所有像素,内循环针对其所有的相近像素测试是否能成为外部循环的候选。首先,第个相邻像素在前个相邻像中与当前候选者中是最大的,其发生概率为11+ⅈ;第二,循环必须在第次迭代之前不被中止,即当前候选值比已经测试的相邻像素大,其发生概率为1ⅈ,最终得到:p(i)=1i(i+1)(3-在每次迭代中,发生候选像素与第个相邻像素之间的准确预测一次,其总计比较次,直到第次迭代结束。因此,每个像素的预期比较数目(CpP)为E(CpP)=&2n2n+1+i=12n其中是左和右相邻像素的数目,且第一项捕获候选像素是局部最大值时的情况。3.4基于YOLO模型的交通标志特征提取3.4.1YOLO原理简介YOLO(Youlookonlyonce)其原理比较简易:图像盒子的多个边框和轮廓会被一个卷积神经网络一起同一时间进行预测。YOLO会对数据集所有的图像进行模拟预测,之后会对检验性能进行直接的优化和更新。YOLO会对图形进行一个完整的考虑,其次,YOLO能对物体对象进行更加一般的抽象表示。3.4.2YOLO模型训练YOLO会把录入的图形分割成n*n的网格,每个单独的网络会预测M个边界框并得到它们的置信度分数。每个边界框有五个可以预测的值:x,y,w,h以及置信度,坐标代表框的中心相对于网格单元的边界,预测的宽度和高度是相较于整个图像。通过图像宽度和高度将边界框宽度和高度归一化,使得他们的预测值在0和1之间。其具体函数如下:φ(x)=&x,    &&x>0&0.1x,    &&其他YOLO会对每一个单元网格内的多种边界框进行一次预测,在模拟练习时,我们应该把每个对象都匹配一个边框预测期。其公式如下:λcoordi=0s2 其中,Iⅈj0bj代表如果对象出现在网格ⅈ中,并且ⅈj表示网格ⅈ中第j个3.4.3YOLOv3YOLOv3相较于传统的YOLO引入了参差连接算法,目的是对网络的深度进行加深,网络的主体部分有五十三层卷积层也可以被称为Darknet53,其主要结构是由3×3的卷积层和1×1卷积核连接块匹配组合而成,残差连接块如下图所示。图3-3参差连接块如图上所示,x是残差连接块的输入,F(x)是x经过两层卷积层后的输出,残差连接就是将输入x与F(x)相加。残连接的公式如下所示[9]:H(x)=F(x)+x(3-7)Darknet-53相较于ResNet-01,其功能差距主要体现在网络的分类精细程度和速率上,前者比后者块上了近两倍。Darknet-53的分类精度与ResNet-152[10]相比差距并不大,但是前者的效率却比后者高出一倍。相比于别的网络结构,Darknet-53做到了每秒最多的计算。Softmax分类器有一点缺陷就是对于不同类的目标会存在相互排斥的现象导致检测不准的现象,针对此种问题YOLOv3采用的是binarycross-entropyloss分类器代替原先传统的Softmax分类器,此方法可以解决识别目标互斥的问题达到多种标志同时分类。YOLOv3网络为了丰富多类目标特征尺寸信息对更细微的图像目标进行检测加入了FPN架构,它结合了不同层次的特征图像,此架构可以把许多不同类别的图形特点输入到网络中进行多方面的预测。YOLOv3采用k-means[11]聚类算法来确定先验框的大小,对于COC数据集输入图像是416×416的大小。特征图得到先验框的规则是,若特征图像的整体尺寸越小则得到的先验框会越大,反之得到的先验框会较小。举个例子,最小的特征图11×11应具有最大的感受视野,所以应用最大的先验框(14,92),(154,187)和(377,324),24×24的特征图应用先验框(30,61),(62,45)(59119),52×52的特征图具有最小的感受视野,应用最小的先验框(11,14),(12,31)和(1,4)。图3-4Yolov3networkstructure3.5交通标志图片标注交通标志深度学习网络的训练是一个非常重要的步骤,为了训练交通标志识别模型,需要对每一张交通标志图像进行标定。在此实验利用OpenCV搭建实验平台并利用RCNN、YOLO网络对各种交通标志图像数据集进行迁移训练。3.5.1标定软件本文使用labeImg标注软件来标定交通标志采集的图像,labeImg[12]软件如图所示。图3-5标定软件labeImg3.5.2标定过程通过labeiImg打开图像目录,然后创建类别标签,本文的分类主要分为warning、prohibitory以及mandatory,其标注如图所示。图3-6标定warning图3-7标定指向型交通标志基于深度学习的交通标志识别算法研究4.交通标志识别交通标志被检测后就要关注如何对交通标志进行一个分类。在我们日常生活中,我们遇到的多数的交通标志可以分为三大类,警告类、指向类、禁止类,本实验就要把数据集中的图像标定为以上三类。分好类后就要进行识别的步骤了,识别的精准度和实时性都能对系统是否能搭载到我们日常生活中造成影响。然而现实中交通标志所在的环境并不单一,有时还很复杂,交通标志牌有时会被树木遮挡,还有光照的原因,标识牌还有可能反光,这都是需要被考虑在系统实现的内容里。为了提升交通标志识别的准确性和实时性,提出一种基于卷积神经网络的交通标志识别改进后的算法。4.1卷积神经网络4.1.1卷积神经特点卷积神经网络是深度学习的一个重要组成,此技术主要是在图像检测识别方向运用,其结构大体上是卷积层,池化层,全连接层以及损失函数。在图像提取这一关键步骤中体现了卷积层的两大特色:1.局部连接:卷积层的节点和上一层的图像的一些部分相连接,并会把对应的像素值进行一个输出。2.权值共享[13]:图像作为一个整体来对内核的参数进行共享,位置的改动并不会对卷积核内的参数进行修改。正因为卷积层拥有这两大特点。卷积神经网络有时因数据过多发生的拟合问题才会得到较好的解决[14]。卷积网络的操作中应用的是权值共享的模式模拟了人类或者动物的神经网络,模型自己的参数难度可以通过卷积层的两大特点进行一个比较不错的降低,此方法大大地降低了参数数量。省去了网络创建初期的设计识别和数据参数预处理的大部分初期工作。4.1.2图像卷积原理CNN在通过输入数据学习权重连接部分参数,采用卷积提取图像的部分特征用来输出新的特征图,通过卷积来提炼图片中突出的区域性特征,例如轮廓,边界,方向,颜色等。通过网络训练的过程重新连接参数的权值,卷积核的卷积操作是在特点图中和卷积核大小一致的局部范围运算卷积神经网络中的特征提炼由三方面考虑,第一是卷积层的卷积操作,卷积神经网络同时开始多种卷积操作得到的第一次映射。第二是关于激活函数,通过激活函数得到的映射可以进行从线性映射到非线性的转变,例如relu函数[15],这一步也可以涵盖叫做激活层。最后,对前面步骤得到的结果使用池化函数(poolingfunction)来对输入的特点图片进行下一步的采样操作。4.2算法改进在我们真实生活场景中,我们不能只去关注识别的精准度,也要把识别的时长因素考虑到位,因为实时性是决定计算机在判断图像时的关键因素。为了提高CNN算法的实时检测特性,需要对现有的虚拟数据进行剪枝,提炼出轻量型的网络模型。力求在维持原有的精确度不变的情况下,加速网络模型的识别速度,来提高检测识别系统的实时性。基于LeNet5网络识别算法[16],对卷积神经网络CNN进行改良,在对现有的算法改进之前,应先对LetNet5网络识别算法进行简单介绍。首先介绍一下LeNet5网络的总体结构,LeNet5网络有七层模型,最开始的两层是卷积层,之后是两层池化层,卷积层运用的是5*5的卷积核,与卷积层的卷积核大小不相同的是,池化层的内核大小仅仅为2*2。LeNet5网络最后三层为全连接层,三层连接层的节点数目分别为126,84,10。与传统的CNN卷积神经网络采用的激活函数不同的是LeNet5网络采纳的激活函数是signmoid激活函数[17]。最后LeNet5网络输出层采用的是SOFT分类器。为了提升识别时的精确性和实时性,本实验对原先的LeNet5网络模型做出了以下几个方向的改动:(1)首先是对卷积核的统一,先前卷积层的卷积核数不固定,我们将所有卷积层的卷积核替换为3×3卷积核。在此对卷积核的规律进行一个简单的介绍,正常情况下两个3×3的卷积层等价于一层5×5的卷积层,三个3×3的卷积层等价于一层7×7的卷积层,在网络层次越来越深的情况下,加入了从线性变化到非线性变化,网络自身的学习能力也会增强,对特征锁定会更加敏感和快速,于此同时网络本身的容积也在随之变大。相比于传统的5×5和7×7的大卷积核,3×3的卷积核参数数量大幅减少。(2)之后希望对网络的范围进行一个扩大,因此引入了Inception模块组。Inception模块[18]会把不同大小的卷积在相同的一层卷积上进行匹配和组合,此后可以利用更小的卷积核,例如1×1的卷积核对图像的特征进行遍历和判断,得到的结果进行初步的判断,若维度还是太高,再进行降维操作。在同一组参数数据下,我们可以判断出引入此模块的优点有:大大提升了计算的效率,特征提取液更加精确和充分,数据训练后得到的结果更为显著。(3)现在要应对的是输入的批量样本。在此我们引入批量归一化方法REF_Ref74314641\r\h[19]处理,在对卷积神经网络进行练习的过程中,每一层的网络参数会根据数据进行一个线性变化。为了统一每层网络的数据分布,于是在每一层卷积层后引入批量归一化,将每一层数据归一化到均值为0,方差为1。批量化归一公式为:xk=xk−E(4)在激活函数的选择这一步上,使用之前提到的ReLu激活函数对原先的Sigmoid激活函数进行代替σx=11+ⅇ在我们开始采用Sigmoid激活函数训练的过程中,有如下三个显而易见的缺陷:1)当网络的输入比较大或比较小时,神经元梯度会向0的方向无限地靠近,在反向传播的过程中神经元梯度会自动地消失,这最终会导致神经网络无法训练;2)Sigmoid激活函数的输出结果均值为0,上一层的神经元输出的非0结果会作为下一层的神经元系统的输入数据,当输入数据是正值时,梯度会一直向正方向更新;3)Sigmoid激活函数的计算非常繁琐,对范围大的深度学习网络神经会增加对网络的训练时长。ReLu激活函数公式为:YX=max0,X把Sigmoid激活函数和ReLU激活函数进行一个综合的对比后发现,在梯度传播的方向上后者的特性非常契合此传播方式。在总体计算量方面,后者的优势也能体现出来,ReLU激活函数只需要进行一次算数运算就可以比后者的效率高很多。ReLU激活函数的运算特性是把输出结果大于0的位置全部当做1,这样做的优势是可以稳定住梯度的范围,不会让梯度过小同时也不会发生饱和的现象,这样的优势又有助于在反向传播的情形下梯度能更有效地传递到前面的网络。说完了ReLU激活函数的优势,其也有不足的地方:ReLU激活函数也会有“失手”的时候,在确定情形下激活函数会失去对数据的激活现象,例如当一个庞大的梯度经过神经元时,激活函数失去原先的功能。所以在采用此激活函数时要注意的是先确定好激活函数的值稳定在一定范围内,以免会出现“DeadReLU”问题[20]。两种激活函数如图所示:图4-1两种激活函数如图上图所示,Sigmoid激活函数对中间的信号影响较大,对两侧的信号影响较小。ReLU激活函数是线性的分段函数,当信号不大于0时,输出信号为0,当信号大于0时,输入和输出信号保持一致。相比于Sigmoid激活函数,ReLU激活函数能比较好地契合模拟训练的数据,在反向传播过程中有助于将梯度传播到前面的网络,加速网络模型的收敛,所以对卷积神经网络模型的改进是采纳ReLU激活函数。(5)采用GlobalAveragePooling层4代替全连接。GlobalAveragePooling层计算上一层每张特征图所有像素点的均值,并将输出的特征点组合成特征向量,送入Softmax层分类识别。与全连接层相比,GlobalAveragePooling层的参数数目明显减少。在图片被输入到改进的卷积神经网络中模拟之前,需要对交通标志图像进行一个预解析,1)对数据集进行重新采样,使得每类的交通标志标识个数均匀分散。2)为了方便训练和测试,需要对图标的尺寸进行一个标准化,把所有图标大小都变为32*32。3)使用直方图均衡化对图像进行加强。其原理是通过改变像素的强度来增加对比度,将一副图像的直方图转变为均匀分布。4)图像的像素范围是0-255,将图像像素统一到[-1,1]之间。5)将图片翻转的角度设为10°,图片随机水平或垂直偏移幅度设为0.88,图片随机缩放的参数设置为0.2。4.3本章小结在互联网的大时代背景下,交通标志的检测识别离不开计算机视觉领域和深度学习的发展,此部分的发展也和计算机本身的硬件性能和大数据技术息息相关。在此部分简单介绍了卷积神经网络的基本构成和运行原理,卷积神经网络不再使用设计手工特点来提炼图像的轮廓,直接训练图像数据来了解特征。接着介绍了LeNet-5网络这种典型卷积神经网络模型的原理,并比较分析了这种网络结构的优缺点。在真实的生活场景中我们需要快速且精准地判断出交通标志的意义,同时发挥出识别精确度的长处,改进过程中我们以LeNet-5网络模型为基础的情况下,引入Incepion模块组来对网络的范围进行一个扩展,在我们综合AlexNet[21]和GoogleNet两种网络的特点和长处后,最终提出一个轻量级的网络模型。5.实验结果分析5.1交通标志图像检测实验5.1.1模型训练曲线利用CCTSDB交通标志图像,将不同派别下的各种交通标志图像分别放入训练集和测试集,用OpenCV进行标记后处理,并采用Darknet框架训练交通标志识别模型,识别率达标后完成训练。图5-1模型训练结果图5.1.2交通标志prohibitory类,warning类、以及mandatory类识别程序运行结果截图:可以看到程序优化效果明显,相较于原先的识别算法,改进后的图像抓取更为精确,识别准度也更高。图5-2对于两种不同类型的交通标志进行同时识别图5-3在光线较暗的环境下的识别图5-4对于三个交通标识的同时识别图5-5对于树木遮挡下的标志识别图5-6对复杂标识牌的识别5.2软硬件配置本实验使用的计算机实验环境如下:CPU(英特尔)Intel(R)Core(TM)i7-4720HQ,CPU主频是2.6Ghz,内存为8G,操作系统是Windows10,显卡配置是NVIDIAGeForceGTX960M,显存为4G,主板是宏碁AspireVN7-591G。软件平台为visualstudio2017,Qt-opensource-windows-x86-5.9.9,Opencv-4.5.1,DevC++。5.3总结在复杂多变的真实道路场景中,交通标志的识别检测是一项具有挑战性的工作。本实验改进的深度学习算法一定程度上提升了交通标志的检测识别性能,还有许多不足的地方等待进一步的改进:

1.识别虽然准确率和图像抓取实时性提升不少,但是无法识别出细节的指令,只能识别出交通标志大类。2.本系统虽然可以识别部分遮挡条件下的标志和连接在一起的标志,但不能识别出黑夜场景下和高速移动场景下的标志。3.本文采用的CCTSDB数据集中选取了较多的停止标志,人行横道标志,和限速标志。总共15687张图片,数据库图片数目还是不够,训练改进网络模型时略显不足,下一步可以采集一些不同场景下的交通标志图片来扩充数据集。结束语深度学习方法具有强大的特征表达能力,相比于传统的手工设计特征方法更加优越,在复杂路况和光线较弱的交通场景中检测识别交通标志应具有准确率和实时性都较好的优点。本设计的目的是对现有的卷积神经网络算法进行一点改进,实现对交通标志识别的更精确和更迅速的效果。在充分阅读各种参考资料和国内外文献后,又对相关的实验技术进行基础学习,搜索交通标志图像数据集,最后尝试将算法进行初步实现。在完成基本目标后对结果进行简单的总结和报告,并调试相应的程序。参考文献梁文龙.基于IVGG网络的交通标志识别算法研究[D]长沙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论