(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf_第1页
(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf_第2页
(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf_第3页
(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf_第4页
(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(计算机应用技术专业论文)面向环境分类的感知图像的特征提取方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文面向环境分类的感知图像的特征提取方法 摘要 在对智能车辆的相关技术研究中,导航技术是其核心技术之一。其中视觉导航需要 实时的分析智能车辆所感知的图像信息,并实时的对数据进行处理从而达到识别的目 的。面对图像信息的超高维数和庞大数据量,如何对图像数据提取有效的特征就成为分 类识别的至关重要的部分。本文重点研究感知图像的特征提取方法。 在分析了感知图像的统计特性之后,本文对图像采取分块策略,然后从颜色和纹理 两个视觉角度对小块区域内的感知图像进行研究。从颜色视觉角度,本文分析了颜色空 间的特性,实现了r g b 空间到h s v 空间的转换,并在h s v 空间提取了感知图像的颜色矩 特征。从纹理视觉角度,本文在分析了纹理特征分析方法之后,一方面实现了基于f f t 的纹理特征提取方法,提取了周向和径向的图像的频率谱特征;另一方面采用近似于人 类视觉皮层简单细胞感受野的二维g a b o r 滤波方法,对图像进行滤波,实现了基于g a b o r 滤波器的纹理特征提取方法。在对图像进行特征提取后,本文运用p c a 和i c a 变换实现 对特征向量的降维,使得特征向量保存了感知图像二阶和高阶统计特性。 本文最后对智能车辆所采集的多幅图像数据进行分析,首先提取了感知图像的颜色 和纹理特征,采用基于s v m 分类器的方法实现了对感知图像的分类识别;其次对特征进 行i c a 降维,对比特征向量降维前后的分类结果。 关键词:智能车辆、特征提取、颜色空间、主分量分析、独立分量分析、g a b o r 滤波器 a b s t r a c t i nt h er e s e a r c hf i e l d so fi n t e l l i g e n tv e h i c l e ,n a v i g a t i o ni so n eo ft h ek e ya p p r o a c h e s v i s i o n b a s e dn a v i g a t i o ns y s t e ms h o u l da n a l y z ea n dp r o c e s st h ei m a g e so b t a i n e df r o ms e n s o r s i nr e a l t i m es oa st oa c h i e v et h ep u r p o s eo fr e c o g n i t i o n f a c i n gt h eh i g hd i m e n s i o n a la n dl a r g e a m o u n to fi m a g ed a t a , h o wt oe x t r a c tt h ee f f e c t i v ef e a t u r e sh a sb e e nav i t a lp a r tf o r c l a s s i f i c a t i o na n dr e c o g n i t i o n t h i st h e s i sf o c u s e so nt h ef e a t u r ee x t r a c t i o nm e t h o d sf o r p e r c e p t i o ni m a g e s a f t e ra n a l y z i n gt h es t a t i s t i c a lc h a r a c t e r i s t i c so fp e r c e p t i o ni m a g e s ,t h i st h e s i sm a k e st h e i m a g e si n t op a t c h e s ,a n dc o n d u c t sr e s e a r c hf o r mt h ec o l o ra n dt h et e x t u r ev i e wt ot h ep a t c h i m a g e s f r o mt h ep e r s p e c t i v eo fc o l o r ,t h et h e s i sa n a l y z e st h ec h a r a c t e r i s t i c so fc o l o rs p a c e , t h e nr e a l i z e st h er g bs p a c et oh s vs p a c ec o n v e r s i o n ,a n de x t r a c t st h ec o l o rm o m e n t s f e a t u r e si nh s vs p a c e f r o mt h ep e r s p e c t i v eo ft e x t u r e ,t h i st h e s i s ,o nt h eo n eh a n d ,r e a l i z e s f f t b a s e dt e x t u r ef e a t u r ee x t r a c t i o nm e t h o d st oe x t r a c tt h ei m a g e sc i r c u l a rd i r e c t i o na n d r a d i a lc h a r a c t e r i s t i c so ff r e q u e n c ys p e c t r u m ;o nt h eo t h e rh a n d ,t h i s t h e s i su s e s t w o d i m e n s i o n a lg a b o rf i l t e r i n gm e t h o dt of i l t e rt h ei m a g e s a f t e rt h ei m a g ef e a t u r ee x t r a c t i o n ,t h et h e s i su s e st h ep c aa n di c at r a n s f o r m a t i o nt o r e d u c et h ed i m e n s i o no ft h ef e a t u r ev e c t o r t h en e wf e a t u r ev e c t o r sk e e pt h es e c o n d o r d e ra n d h i g h e r - o r d e rs t a t i s t i c so fp e r c e p t i o ni m a g e s f i n a l l y , t h i st h e s i ss t u d i e st h er e a li m a g e sd a t ac o l l e c t e db yt h ei n t e l l i g e n tv e h i c l e s ,f i r s t e x t r a c t st 1 1 e i rc o l o ra n dt e x t u r ef e a t u r e sa n du s e st h es v mc l a s s i f i e rm e t h o dt od ot h e e n v i r o n m e n tc l a s s i f i c a t i o n t h e nu s et h ei c at r a n s f o r m a t i o nt or e d u c et h ed i m e n s i o n a l i t yo f t h ef e a t u r e sa n dc o m p a r e st h ec l a s s i f i c a t i o nr e s u l t sb e f o r ea n d a f t e r k e yw o r d :i n t e l l i g e n tv e h i c l e 、f e a t u r ee x t r a c t 、c o l o rs p a c e 、p c a 、i c a 、g a b o r f i l t e r 声明尸明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名: 溺年6 肌日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 硕士论文面向环境分类的感知图像的特征提取方法 1 绪论 特征提取的基本任务是研究如何从原始数据空间的众多特征中提取出那些对分类 识别最有效的特征,从而实现特征空间维数的压缩。在特征空间中,如果特征点都是按 类群聚集在一起,那么分类器就会有很好的分类效果;反之,如果特征点都混合在一起, 分类就会比较困难,识别正确率也会大大降低。因此,在从原始数据空间中提取特征时, 要求所提取的特征不仅能够很好的代表原始信号信息,而且希望特征向量维数少,并具 有很强的类别信息,这样所提取的特征就会给后面的分类工作带来很大的方便,也会大 大的减少分类算法计算的强度。 1 1 研究背景 1 1 1 课题由来 本文的研究来源于“面向移动机器人环境感知的主动学习研究 项目,主要内容包 括以下四个部分:数据预处理、标记数据的自动选择、标记数据的监督学习、建议和评 价方法。本文的研究隶属于图像预处理阶段,重点在对环境感知图像的特征提取方法进 行研究,提取更有效的类鉴别特征,使得后期的环境分类和障碍物识别效果更佳。图1 1 1 简要描述了项目流程及本文的研究重点。本文属于机器学习研究领域,本人在项目组负 责特征提取部分,这也是本论文的由来以及重点所在。 虽然特征提取在模式识别领域中占有很重要的地位,但是到目前为止,还没有特征 提取的统一通用的方法。目前对特征提取方法的研究都是依赖于具体的问题,对于不同 的问题要使用不同的特征提取方法,即使对同一问题,不同的方法提取的特征对后期的 分类效果也都不一样。 本论文所使用的数据为智能车辆的车载摄像头所采集的真实野外环境感知图像数 据。由于智能车辆采集到的原始图像信息的维数相当高、数据量相当庞大。如果直接对 原始图象进行处理的话,将增加分类算法的难度,并且也会对计算机的硬件也带来沉重 的负担。因此对原始图像做特征提取就成为一个最基本也最重要的问题,提取有效的鉴 别特征是解决问题的关键。而项目通过引入主动学习技术,减少了需要大量标记的数据, 标记的训练样本数量的减少,就要求提高标记数据的可用性,标记数据可用性的提高即 要求所提取的特征更具类鉴别信息。正是基于此要求,本文重点对智能车辆所感知的野 外地表环境数据进行特征提取方法研究。 i 绪论 硕士论文 图1 1 1 项目流程图及论文研究重点 1 1 2 智能车辆概述 项目中涉及的移动机器at 3 5 , 3 6 1 为智能车辆,智能车辆是指能够在野外自主运动的一 类智能机器人;是一种集感知环境、动态决策与规划、行为控制与执行等多项功能于一 体的高智能化机器系统。它是建立在普通车辆系统的基础之上的,不同的是,它比普通 车辆系统多了传感器和计算机处理系统。这种类型的智能车辆是通过多个传感器从周围 的环境中收集数据,然后将数据送到计算机处理系统,计算机处理系统再对收集到的数 据进行分析处理,并建立起外部环境模型,最后智能车辆能够根据当下所建立的外部环 境模型自动调整自己的工作状态,实现自主导航、道路识别和障碍物检测等技术。 道路检测是智能车辆周边环境感知技术研究领域中的一个重要组成部分,而从多个 传感器获得的环境感知图像中提取有效信息是道路检测的前提。本文研究的智能车辆所 面对的工作环境是复杂多变的野外环境,因而面向环境的图像分类研究就极具挑战性, 其中的环境图像的特征提取方法的研究也一直是国内外智能车辆界的研究重点和难点。 1 1 3 本文研究意义及内容 2 十诒女面m 环境分类的感知例豫的特征捉职疔蛙 本文以智能车辆所采集的图像信息作为原始特征信息,然后针对智能车采集的图像 进行分析,研究图像的特征提取方法,提取有效的特征,使得后续的分炎效果更佳,便 于车辆自主驾驶。考虑到智能车辆主要在野外或非机构话道路的环境下运行,本论文将 重点针对智能车辆感知的野外地形环境进行特征提取分析,提取有效的地形类别信息特 征。由于野外环境的不定性,目前国内外对野外环境的研究大多数都足从自然图像角度 出发进行研究。本文从模拟人类视觉感知图像角度出发,研究智能车所感知的野外真 实环境图像。 目前国际上对移动机器人感知的图像的研究大多数都采用先分块策略,然后对小块 区域里的图像再进行进步详细研究,卡耐基梅隆大学日前对自主车感知剧像的研究都 采用将图像分成1 6 x 1 6 的块】。本文也采取此策略,考虑到项目中具体采集的罔像的分 辨率较低本文将图像分成8 8 的小块进行研究,重点是提取小块图像信息内使得地形 分类效果更佳的特征向量。 论文中智能车辆采集到的图像都是2 5 6 x 2 5 6 像素的,但图像的上方有摄像机盲区以 及下方有智能车自身的图像,这些都不是研究对象,文中截取原始图像中间的2 5 6 x 1 7 6 区域进行研究,如图ll2 所示。 睁翩 | l | ;囊誓 二- -。i 盘l - - 刚1 12 削像截取 由主动学习算法及标记的要求,本文先将图像进行分块处理。具体研究中,先将 2 5 6 1 7 6 大小的图像分成7 0 4 个8 x 8 的小块,如图113 所示。 缃论颤i 论女 国】13 图像分块策略 本文以块为样本点,针对每一小块图像,本文将其分别标记为路、草地和其它这三 种类型,如图4 所示,本文所研究的特征提取疗法正是针对每个小块区域进行研究的。 其它 草地 一路 圈i l4 翻像标记 考虑到智能机器人的自主导航系统模拟的都是人类的视觉神经系统,本论文选取了 符合人类视觉感知系统的特征提取方法对图像进行研究。 本论文首先分析了自然图像的统计特性,然后针对图像的统训特性,从颜色和纹理 两种视觉角度对分块后的小块图像进行特征提取方法研究,如罔115 所示。考虑到野外 的图像具有不可知因素太多,而且小块内的图像一般不具有捌则的形状,所以本文小考 虑图像的边缘、轮廓等形状特征。 颤色特征 图像 圈瓯三叵】【 。 iu i6 0 x ( g - b ) i 矿 肚1 6 0 2 + 紫 | 6 0 4 + 错 如果s = 0 如果v = r 如果v = g 如果v = b 如果h d ) ,如图4 1 2 所示,特征映射后样本的维数会有所增加。在这 个过程中,如何变换、变换到哪个空间,都是由核函数k ( 薯,x ,) = 缈( 毛) r 妒( x ,) 决定的,缈( x ) 就是相应的核函数映射。 图4 1 2 非线性空间分类面 4 1 2 核函数 对于线性不可分问题,v a p n i k 引入了核空间理论【5 2 】:将低维的输入空间数据通过非 线性映射函数映射到高维属性空间,将分类问题转化到属性空间进行。可以证明,如果 选用适当的映射函数,输入空间线性不可分问题在属性空间将转化为线性可分问题。这 种非线性映射函数被称之为核函数。核函数的作用是将线性不可分的输入空间变换为线 性可分的特征空间,支持向量机算法中选择不同的核函数会得到不同的最优分类面,不 同的核函数以及核函数的参数对支持向量机分类器的分类效果影响很大。从理论上讲, 只要运算满足m e r c e r 条件的对称函数都可以作为核函数。 目前常用的核函数主要包括以下3 种: ( 1 ) 多项式核函数( p u l y 核) : k ( x ,薯) = ( x t ) + 1 】叮 ( 4 1 1 ) ( 2 ) 多层感知器核函数( s i g m o i d 核) : k ( x ,薯) = t a n h v ( x x j ) + c 】 ( 4 1 2 ) ( 3 ) 径向基核函数( r b f 核) : 3 7 4 基于支持向量机的感知图像的分类 硕士论文 m ,班e x p 学 ( 4 1 3 ) l l , j 在三种常用的s v m 核函数中,应用最广泛的是r b f 核函数。r b f 核函数具有较宽 的收敛域,无论是低维、高维、小样本、大样本等情况都适用,是较为理想的分类依据 函数。s i g m o i d 核函数在某些参数上近似r b f 的功能,而多项式核函数参数较多,核函 数参数的数量影响模型的复杂度。因此本文中选用的是r b f 核函数。 4 2 基于独立分量分析的特征降维 由于自然图像大多数都服从超高斯分布,像素间存在高阶相关性。b e l l 、l e w i c k i 4 9 1 等人采用基于高阶统计量的i c a 方法分析自然图像的高阶统计特性,得到了与初级视觉 皮层简单细胞类似的特性。结果发现采用i c a 方法获得的自然图像的基函数与人类视皮 层简单细胞感受野的特性,如空间频域带宽的直方图、朝向调谐曲线的带宽、感受野的 长度和比值等都非常接近。鉴于i c a 的优势,本文将特征向量作为新的数据空间,再用 i c a 方法对其进行变换,提取独立分量特征。自然图像大多数都服从超高斯分布,像素 间存在高阶相关性,仅用p c a 提取特征是不够的。本文先对图像进行p c a 变换,用较 少数量的特征对样本进行描述,以此来降低特征空间的维数。再在此基础上对降维后的 特征向量进行i c a 变换,获取感知图像的高阶统计量信息。 4 2 1 主分量分析法 p c a l 2 0 1 ( 主分量分析,p r i n c i p l ec o m p o n e n t sa n a l y s i s ) 是非监督的基于统计学的图 像表示方法,提取在均方误差最小意义下的特征。当输入的数据服从高斯分布时,p c a 获取反映数据统计量的主要分量。但p c a 对特征基向量和系数除了正交并无其它约束, 这样得出来的结果没有明确的视觉上的意义。 首先对随机变量x = ( 毛,x :,) r 进行标准化处理,得到数学期望均为零的随机向 量。两个向量问若不相关则它们的协方差为零。计算它的协方差矩阵: e = e ( x x r ) ( 4 2 1 ) 对分量原本线性相关的随机变量x = ( ,而,毛) r 通过某种线性变换,不妨设为 4 。,可以生成一个新的随机变量y = ,儿,以) r ,即p c a 的线性可以表示为: 艺= ( 而一e ( x ) ) u = l ,2 ,m ) ( 4 2 2 ) i = 1 满足咒,y 2 ,以俩俩不相关。此时称m ,儿,以为原始变量五,而,焉的主分量。p c a 的重点在于构造满足乃,y 2 ,以俩俩不相关要求的线性变换矩阵4 。变换后的向量y 具有 零均值的特征向量,它的协方差矩阵和x 的协方差的矩阵的关系为: 3 8 硕上论文面向环境分类的感知图像的特征提取方法 q = a c , a r ( 4 2 3 ) q 长习 2 舢 以为c ,的特征值,又因为的非对角线元素都是零,所以y 的各个元素之间都是不 相关的。以若特征值对应的特征向量表示为,则特征向量组成的特征矩阵为: 4 2 2 独立分量分析法 i c a 1 8 】( 独立分量分析,i n d e p e n d e n tc o m p o n e n ta n a l y s i s ) i c a 的研究工作主要是 由两个不同的研究团体分别独立展开的。一个团体的工作是针对盲源分离问题展开的。 c o m m o n 2 3 】首次阐明了独立分量分析的概念,并且提出了基于累积量的目标函数。另一 个则是针对基于信息理论的无监督学习规则的研究。b e l l 和s e j n o w s k i t 3 2 j 提出了复杂的 梯度下降算法,使得输入和输出之间的交互信息量最大。从神经处理角度来看,这种方 法比基于累积量的方法更好一些。c a r d o s o 和l a l l e l d 【3 l 】也提出了类似的自适应算法。目 前主要的算法流派有最大似然估计方法、投影追踪方法、快速定点算法、自然梯度算法、 非线性i c a 方法等等【2 】。虽然i c a 模型最初主要用于解决盲源问题,但是随着研究的深 入,其应用范围在不断扩大,在图形和语音处理、数字水印、医学信号处理等方面显示 了其处理高维数据的能力,在金融预测、通信等领域也都取得了很好的研究成果。 只用p c a 提取自然图像的特征是不够的,从信号处理的角度分析,二阶统计量只 包含幅度谱信息,而高阶统计量包含相位谱信息。一幅图的能量谱与幅度有关,与相位 无关。相位谱反映了图像的结构信息,这一信息与人类视觉感知相关。通常对i c a 方法 的求解,可以按照以下几个步骤进行:首先是数据预处理,然后通过选择和定义非高斯 性的度量来建立目标函数,该函数取极值时,其估计出的独立成分间的非高斯性最大, 该函数代表了一种分离准则,根据不同的分离准则将可推导出不同的算法,最后用某种 最优化方法来求最大( 小) 化目标函数,即可推导出一种学习算法。 3 9 4 基于支持向量机的感知图像的分类 硕士论文 ( 1 ) 模型预处理:在实现i c a 算法前,需要进行如下预处理。 a 、统一中心。对训练样本工= ( 而,而,) ,将x 减去均值e ( x ) , 成为零均值矢量。 v = x e ( x ) 使每个x 和s ( 4 2 8 ) b 、白化。对矢量x 进行线性变换得 x :d 一1 7 2 e 7 y ( 4 2 9 ) 使得e ( x x r ) = i 成立。式中y 是原始信号,x 是经过白化处理过的数据。d 和e 分 别是y 的协方差矩阵r 矿= e ( v g r ) 的特征矩阵和特征向量矩阵。 ( 2 ) 模型描述:i c a 是一个分析高维数据的统计工具,其模型可以描述为:将观 察到的信号,也成为原始信号看做隐藏变量的线性组合;隐藏变量满足非高斯分布,且 相互独立。这样,原始信号可以表示为: x = a s ( 4 2 1 0 ) 式中,x = ( 而,而,) 是观察到的信号,本文中是p c a 降维后的特征向量, s = ( 而,s 2 9o * - 9 ) r 是n 个独立分量。彳是一个方阵,称为混合矩阵。 i c a 模型的一个关键假定就是分量s , 0 j 刀) 相互独立。另外要求必须满足非高斯 分布的特性( 或仅有一个分量为高斯分布) 。我们可以认为彳为一个可逆矩阵,则 s :w x( 4 2 1 】) 式中,形= a 。1 称为转换矩阵。 ( 3 ) p c a 降维后求解独立分量:p c a 变换后的特征已经具备零均值的前提。则直 接可求白化矩阵 一三 e = c ,d2 r ( 4 2 1 2 ) 其中c 。d 和为协方差矩阵的前d 个较大特征对应的特征值矩阵和特征向量矩阵。 为了降低维数是迭代递归w 时收敛速度快,针对白化后的训练样本,根据h y v 撕n e n i l 】 给出的一种估计负熵的方法【1 8 】,采用基于负熵的独立性判决准则和分离算法一快速固定 点算法用快速固定点算法( f a s t l c a ) 来求矿。 则i c a 独立基子空间s = 【墨,s z ,嘞】7 计算为: s = w e( 4 2 13 ) 则训练样本而的独立基子空间中的投影特征为: j ,= i x , 一层( x ) 】s 丁 ( 4 2 1 4 ) 硕士论文面向环境分类的感知图像的特征提取方法 对于任意测试样本图像,投影到独立基子空间中,即 = 【- e ( x ) s r 将测试样本在独立基子空间中的投影特征为 y t e s t = y l ,删,耽,删,均,舾,】 ( 4 2 1 5 ) ( 4 2 1 6 ) 4 2 3f a s t l c a 算法 f a s t l c a 是一种快速i c a 算法,它对任何类型的数据都是用,同时它的存在使运用 i c a 来分析高维数据成为可能。该算法通过系统学习,可以找到一个方向,即单位向量 w 使其投影方向形r x 具有最大的非高斯性。f a s t l c a 采用以下公式进行非高斯度量: ( y ) 陋 g ( y ) _ e g ( v ) ) 】2 ( 4 2 1 7 ) 其中 ,为零均值的单位方差的高斯变量。函数g 为非二次函数。文献【2 1 中给出了几 个好的选择: g l ( 甜) :1 - - l o g ( c 。s h 呸“) 咋 啪卜e 印( 一睾) 式中a i 为常数,1 q 2 该算法是基于定点递推算法寻找w r x 的非高斯性最大值, 分离出一个独立分量。 4 3 基于支持向量机的环境感知图像分类实验分析 ( 4 2 1 8 ) ( 4 2 1 9 ) 且每次只从观测信号中 4 3 1 实验步骤说明 由于没有公开的、相对标准的图像数据库,本文实验所用的图像都是来自项目中智 能车辆实地采集的图片,实验有应用价值。由于支持向量机涉及到大量的数学知识,编 程实现比较困难,再者有很多现成的程序,所以在做实验时,利用l i b s v m 工具箱进行 分类。 一 本实验根据具体图像,将样本数据分为三类,分别为路、草地和其它,使用s v m 分类器对多幅图像,不同训练样本点数量进行讨论。前两章的实验都是对训练样本自身 进行分类识别,本章所用的测试图像和训练样本图像不一样。具体的实验步骤说明如下: ( 1 ) 图像预处理:对图像进行去噪等操作,并对图像进行分块处理; ( 2 ) 图像标记训练样本:标记训练样本小块; 4 1 4 * 十支持自肚机的感“删像的升娄璇l 论文 豳髓鹭嘲 一一圆翻 马霸二 f _ 一 圜 其它 草地 路 图432 图像标记 ( 3 ) 对多幅训练图像进行标记,生成不同的训练样本特征文件;实验中标记8 幅 训练样本源图像中的8 8 0 个块做为训练样本,即训练样本大小为8 8 0 。表4 32 1 和图4 33 为8 幅源训练样本图像的标记块的数目和对应的样本标记图。 4 2 硬论文面向环境丹粪的感知图像的特征提取方法 4 3218 幅训练样本源图像的样本标记数目 训练图36 总训练样本数 标记的块鼓 标记为路的块数 3 0 标记为草的块数 标记为其它的块数5 0 - 鼠函卤 l 豳圈圈 鲎睡硼黼 【岛 图4 34 图像特征提取 ( 5 ) 根据训练样本,采用s v m 分类器对未知类别信息的图像进行分类预测,采用 l i b s v m 的默认参数。图4 35 为8 幅测试图像,图4 36 为测试图像的分类结果示意图。 4 基于支持向量机的感知图像的分类硕士论文 卜- 1 爹幽7 l 卫 图4 35 涮试样本 图43 6 铡试样本分类结果 ( 6 ) 对特征文件进行i c a 降维和提取独立分量。利用s v m 分类器对钡4 试样本进 行分类图437 为图像的降维过程。 特征向量 e 习【】坐笃臣丑 3 3 维1 8 维 阿4 37 图像特征降维 ( 7 ) 根据图4 33 标记的训练样本,采用s v m 分类器对未知类别信息的图像进行 分类预测。结果如图4 38 所示。 硕论文面向环境分豢的感知图像的特征提取方法 熏蕤熬翼蒸霹 誓:鬟| | | | 誊臻| | | | | 瓣| | | | | | | | | | i | | | | | | | i | | | | | 扩i 鬻:曩誊赛翼鬻瓣攀二、;。 圈4 3bi c a 降维后测试样本分娄结果 4 3 2 实验结果分析 在4 32 节的实验中将8 幅训练样本源图像分成5 6 3 2 块8 x 8 的区域,然后标记8 8 0 个块作为样本块,在这8 8 0 个标记样本中。标记为路类的为3 1 0 块,标记为草类 的为2 0 0 块,标记为其它类的为3 7 0 块。通过对标记样本的学习后,同样将8 幅测 试样本图像分成5 6 3 2 块8 8 的区域,然后对块区域做分类预测,分类结果如和图4 38 所示。 表4322 显示了h s v 颜色特征和g a b o r 纹理特征形成组合特征文件后的分类结果: 表4 323 显示了组合特征文件i c a 降维后的分类结果。实验过程中采用s v m 分类器, 并默认其参数。表中可以看出,颜色和纹理的组合特征对图像的分类识别正确率平均达 到8 0 9 1 ,但i c a 降维后的特征文件对图像的分类识别f 确率平均为7 05 5 。其中识 别正确率的计算是每幅图分对的块数比上总块数,例如测试圉1 的组合特征降维后s v m 识别识别正确率为( 7 0 4 一1 2 6 ) 7 0 4 - 8 21 0 。 从表中数据的对比可以看到,以每幅图为标准,i c a 降维后的特征向量识别正确率 比降维前有所降低。原始的组合特征维数为3 3 维,降维后为1 8 维,特征向量的维数较 小,i c a 降维后的特征向量可能丢失信息。 从分类结果图可以看出,在草和树这个区域容易错分。野外环境感知很复杂,标记 时,将草和树标电为不同的类别,而两者在有些图像中一般都混合在意义,人类肉眼也 无法从图像中精确划分草地还是树木。路和其它类容易错分,特别是路容 易划分为。其它类。对于每块图像识别的正确与否都是靠和人工处理的全标记图进行 比较来判别的,以上的实验所得的分类识别率结果并不是一个绝对精确的结果,但本文 的研究还是有一定的价值的。 4 基于支持向量机的感知图像的分类硕上论文 表4 3 2 。2 测试图像相对对特征向量分类结果 测试图 l23 4 56 7 8 组合特征s v m 识别的错 1 2 61 8 51 4 61 1 51 2 61 0 71 5 21 1 8 分块数 组合特征s v m 识别正确 8 2 1 0 7 3 7 2 7 9 2 6 8 3 6 6 8 2 1 0 8 4 8 0 7 8 4 1 8 3 2 4 率 表4 3 。2 3 测试图像特征向量i c a 降维后的分类结果 测试图 l2345678 组合特征降维后s v m 识 2 2 02 5 42 0 51 9 3 1 7 3 2 2 2 2 1 2 1 8 7 别错分块数 组合特征降维后s v m 识 6 8 7 5 6 3 9 2 7 0 8 8 7 2 5 9 7 5 4 3 6 8 4 7 6 9 8 9 7 3 4 4 别正确率 4 4 本章小结 本章首先简要介绍了支持向量机,考虑到支持向量机的复杂性和通用性,本文利用 l i b s v m 工具箱对图像进行分类。 经过前面章节的讨论后,本章首先选取了h s v 颜色的矩特征和g a b o r 纹理特征相 结合形成特征文件,利用s v m 分类器对图像进行分类识别,识别正确率平均为8 0 9 1 。 其次利用i c a 对特征文件进行降维,降维后的特征利用s v m 分类器识别,识别正确率 平均为7 0 5 5 。特征向量降维前后分类对比可知,本文提取的特征向量的维数较小, 利用i c a 降维后的特征向量可能丢失了部分信息,识别正确率有所降低。 本文识别正确率的计算是通过和人工全标记好的块类别信息进行比较,考虑到实验 中所用的图像分辨率不是很高,而且颜色接近灰度图,人工标记的时候,在草和树之间 很多图都很难界定,测试图像的分类结果与人工标记的图像比较难免会产生误差率。但 是从实验结果来看,本文针对自然图像特性及基于分块策略的特征提取方法有一定的研 究价值。 硕士论文面向环境分类的感知图像的特征提取方法 5 总结 考虑到智能机器人的自主导航系统模拟的都是人类的视觉神经系统,本论文选取了 符合人类视觉感知系统的特征提取方法对环境感知图像进行研究,环境感知图像由智能 车的车载摄像头所采集。论文详细的分析了感知图像的统计特性,然后针对环境感知图 像的统计特性从颜色和纹理两个视觉角度对感知图像进行特征提取方法研究。 本文主要做了以下几方面的工作: ( 1 ) 在研究过程中,对感知图像采取分块策略,然后对小块区域进行图像特征方 法研究,这是目前国际上研究比较多的方式; ( 2 ) 实现了r g b 空间到符合人类视觉特性的h s v 空间的转换,并在h s v 空间提 取了环境感知图像的三阶颜色矩特征; ( 3 ) 实现了快速傅立叶变换算法,从周向和径向角度提取了图像的频率谱,实现 了基于f f t 的纹理特征提取方法; ( 4 ) 采用近视人类视觉皮层简单细胞感受野的二维g a b o r 滤波方法,实验中使用 了4 个尺度4 个方向共1 6 组滤波器对图像进行滤波,实现了基于g a b o r 滤波器的纹理 特征提取方法; ( 5 ) 最后对智能车辆所采集的实际图像数据进行研究,将对图像所提取的h s v 空 间的三阶颜色特征和g a b o r 滤波器提取的纹理特征相结合,形成特征文件并采用s v m 分类器对图像进行分类识别;另外对组合特征进行i c a 降维后再采用s v m 分类器对图 像进行分类识别。对比了特征向量降维前后识别正确率。 本文的不足之处: ( 1 ) 在自然环境中,大多数被观察到的图像都处于不断变化中,从而产生了基于 时间变化的图像序列。值得注意的是,与图像在空间变化一样,图像在时间上的变化也 不是随机的,而是渐进变化的过程。本文的智能车自动导航系统面对的感知图像就是具 有时间变化的图像序列,文中只讨论了图像的空间特性,并没有考虑图像的时间特性。 因为不仅在空间上相近的两个像素之间的灰度值的变化不会很大,在时间上相邻的两个 像素之间的灰度值的变化也不会很大。这点这对移动机器人自动导航系统的研究也有很 大的价值。 ( 2 ) 本文只是单纯的从符合人类视觉的角度及紧跟时代的研究热点去讨论特征提 取方法,并没用实际去比较其它的特征提取方法,所以不否定有其它的方法更适合自然 图像的特征提取。 ( 3 ) 本文没有对所使用的支持向量机的方法的参数进行讨论比较,参数的选择会 影响分类结果。 4 7 5 总结 硕士论文 致谢 在论文完成之际,谨以此文,献给那些曾经关心、帮助过我并给予我无限支持的人。 首先衷心感谢我的导师胡雪蕾老师,本论文是在她的悉心指导下完成的,在此我对 胡老师表示深深的感谢和诚挚的敬意。从论文的选题一直到到论文的完成,自始至终我 都得到胡老师的悉心指导,她不断启发、开拓我的思路,培养我发现问题、解决问题的 能力,正因为她的指导,使得我能顺利地完成硕士阶段的学习,同时也锻炼和提高了我 的科研能力。胡老师孜孜不倦的求学态度,严谨的学风,敏锐的思维能力都给我留下了 深刻的印象。从她身上我学到很多东西,不仅仅是学业。我很庆幸能追随老师两年,她 的一言一行都影响我很多,这些对我今后的学习和工作都大有益处。 其次我要感谢我们项目组里面的所有老师和同学,特别是孙明明老师,和他们在一 起我学到很多,在项目中正是他们伴随我一起成长。 第三要感谢南京理工大学计算机系6 0 3 教研室老师们,特别感谢陆建峰、孙怀江老 师,他们都曾经给予过我关心和帮助。 在这两年的学习、课题研究和论文撰写过程中,还有许多人在学习和生活上给予了 我无私的关怀与帮助,这里也表示深深的谢意。 最后,再次向所有关心和支持我的师长、亲友和同学致以最诚挚的谢意。 硕士论文面向环境分类的感知图像的特征提取方法 参考文献 【l 】a a p oh y v a r i n e n ,j a r m oh u r r i ,p a t r i c ko h o y e r n a t u r a li m a g es t a t i s t i c s :ap r o b a b l i s t i c a p p r o a c h t oe a r l yc o m p u t a t i o n a lv i s i o nw i t l lm a t l a bc o d e s p r i n g e r f e b r u a r y2 7 ,2 0 0 9 【2 】 罗四维视觉感知系统信息处理理论北京:电子工业出版社,2 0 0 6 3 】洪子泉,杨静宇等统计模式识别中的特征提取数据采集与处理,1 9 9 1 ,2 :3 8 - - 4 3 【4 】左飞,万晋森,刘航v i s u a lc h 数字图像处理开发入门与编程实践北京:电子工 业出版社,2 0 0 8 【5 】求是科技编著v i s u a i c + + 数字图像处理典型算法及实现北京:人民邮电出版社, 2 0 0 6 【6 】周明全,耿国华,韦娜基于内容图像检索技术北京:清华大学出版社,2 0 0 7 【7 】 陈书海,傅录祥实用数字图像处理北京:科学出版社,2 0 0 5 【8 】 艾海舟,武勃等译图像处理、分析与机器视觉北京:人民邮电出版社,2 0 0 3 【9 】9陶亮,顾涓涓实值g a b o r 变换理论及应用合肥:安徽科学技术出版社,2 0 0 5 【1 0 】陈桂明,张明照,戚红雨应用m a t l a b 语言处理数字信号与数字图像北京:科 学出版社,2 0 0 0 【1 1 】c v a l l e s p i - g o n z a l e z ,a s t e n t z p r i o rd a t aa n dk e r n e lc o n d i t i o n a lr a n d o mf i e l d sf o r o b s t a c l ed e t e c t i o n r o b o t i c sp r o c e e d i n g si v , j u n e ,2 0 0 8 【1 2 】x i a o j i nz h u s e m i s u p e r v i s e dl e a m i n g l i t e r a t u r es u r v e y j u l y , 2 0 0 8 【13 】j i a ny a n g ,d a v i dz h a n g ,ef r a n g i ,j i n g y uy a n g t w o d i m e n s i o n a lp c a :an e w a p p r o a c ht oa p p e a r a n c e - b a s e df a c er e p r e s e n t a t i o na n dr e c o g n i t i o n i e e e ,2 0 0 4 【14 】k h a l e dh a m m o u d a , p r o f e dj e m i g a n t e x t u r es e g m e n t a t i o nu s i n gg a b o rf i l t e r s u n i v e r s i t yo fw a t e r l o o ,o n t a r i o ,c a n a d a , 2 0 0 0 【15 j i a n g t a or e n ,z h e n g y u a nq i u ,w e if a n ,h o n gc h e n ga n dp h i l i ps y u , f o r w a r d s e m i - s u p e r v i s e d f e a t u r es e l e c t i o n ,12 t hp a c i f i c a s i ac o n f e r e n c eo n k n o w l e d g e d i s c o v e r ya n dd a t am i m n g ( p a k d d ) o s a k a , j a p a n ,m a y , 2 0 0 8 ,9 7 0 9 7 6 【16 】a a p oh y v i i r i n e na n de r k k io j a i n d e p e n d e n tc o m p o n e n ta n a l y s i s :a l g o r i t h m sa n d a p p l i c a t i o n s n e u r a ln e t w o r k s ,2 0 0 0 ,13 ( 4 5 ) :4 11 - - 4 3 0 【1 7 】李钰,孟祥萍基于g a b o r 滤波器的图像纹理特征提取长春工业大学学报( 自然科 学版) ,2 0 0 8 2 9 ( 1 ) :7 8 81 【1 8 】甘俊英,李春芝2 d p c a - i c a 算法在人脸识别中的应用电路与系统学报,2 0 0 8 , 13 ( 4 ) :2 4 - - - 2 8 【1 9 】唐发明,王仲东,陈绵云支持向量机多类分类算法研究控制与决策,2 0 0 5 , 4 9 参考文献硕士论文 2 0 ( 7 ) :7 4 6 7 5 4 【2 0 】张晓飞,万福才,刘朋主元分析法( p c a ) 在图像颜色特征提取中的应用沈阳大 学学报,2 0 0 6 ,18 ( 5 ) :9 3 9 5 2 l 】向世明,刘国翌,陈睿,李华g a b o r 滤波器和i c a 支持的无监督纹理分割,2 0 0 4 , 16 ( 3 ) :2 8 4 - 2 8 9 【2 2 】林明秀,董学志,宋建中g a b o r 小波目标特征提取和跟踪方法的研究,光电工程, 2 0 0 4 3 1 ( s u p ) :2 6 - 一2 9 【2 3 】pc o m m o n i n d e p e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论