




已阅读5页,还剩51页未读, 继续免费阅读
(农业机械化工程专业论文)基于神经网络的图像识别系统的研究及实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南农业大学硕士学位论文摘要 捅要 阻像识别是近2 0 年来发展起来的一门新型技术科学,它以研究某些对象或过程( 统称图 像) 的分类与描述为主要内容。图像识别所研究的领域十分广泛,它可以从医学图像中进行 癌细胞的识别:可以从机械加工中识别出零部件;可以是从遥感图片中识别农作物、森林、 湖泊和军事设施;可以是自导引小车中的路径识别;可以是邮政系统中自动分拣信函;可咀 识别违章行驶的汽车牌照;可以进行银行支票的识别等,图像识别是上述课题中的最基础、 最重要的技术。本论文研究分析了传统的图像识别方法,发现传统的方法中具有一定的局限 性,不利于图像识别技术的广泛应用,因此提出了基于神经网络的图像识别算法,并依据神 经网络的特点对图像识别中的相应技术进行了适当地改进。 本论文的研究思路是按照图像识别的基本步骤进行的:( 1 ) 利用简单有效的算法公式, 将彩色图像进行图像的灰度化转换及二值化处理。实现图像的数字化处理;( 2 ) 采用平滑滤 波、中值滤波、和锐化滤波等算法去除图像中的噪声信息,对图像进行有效地增强;( 3 ) 通 过对边缘检测法中的r o b e r t s 算子、s o b e l 算子和正交算子的分析,得到了一种新的改进边缘 检测分割算法,使得图像分割算法具有一定的普遍意义:( 4 ) 根据神经网络识别的特点,研 究了不变矩的特性,发现其在离散状态下所具有的问题,通过对其比例因子进行适当得改进, 得到一种新的改进不变矩算法,该方法保证了图像特征提取的准确性:( 5 ) 确定b p 神经网络 的隐层数,在b p 神经网络中通过引入多次选择不同的初始权值和加入动量因子两种方法对其 进行改进,使神经网络的识别方法更迅速、更准确。其中图像分割、图像特征提取及b p 神经 网络识别是本研究的重点,另外本论文还利用上述算法设计出了基于b p 神经网络的图像识别 系统。本论文主要取得下列成果。 1 改进的边缘检测图像分割算法 图像分割是由图像处理转到图像分析的关键。本论文通过对边缘检测中的r o b o t s 算子、 s o b e l 算子及正交算子进行分析,发现每个算子在进行梯度计算时它们的模板中各个像素位权 重是给定的,这就决定了只能考虑空间上的某个方位,而实际上对于图像边缘的方位性质, 一般是事先不明确的。因此,本论文采用了一种更具有普遍意义的边缘检测算子。该算子选 用3 3 的模板,模板中各个像素点的权重,事先不给加以确定,因为图像边缘容易出现在图 像灰度突变的交界处,所以可以先确定模板中各个位置所对应像素的灰度值大小,这样就可 以粗略地判断边缘出现的方向,然后根据边缘可能出现的方向来决定各个方位上像素的加权 系数。本论文根据新算子的构造机理及大量实验,验证了新算子对边缘检测的经典算子是一 个很好的补充。 2 基于改进不变矩的图像特征提取算法 特征抽取是图像识别中的一个关键问题,其基本任务是如何从许多特征中找出那些最有 效的特征。对于基q - - j , 经网络的识别方法而言,其核心是利用图像的特征进行训练识别,理 西南农业大学硕士学位论文摘要 想的特征是对字符图像的平移、旋转与缩放都具有不变性,因此,如何选取字符图像的特征 是字符识别的关键所在。 通过研究了多种特征提取算法,本论文根据神经网络识别的特点采用了不变矩这种理论, 但是同时也发现虽然h u 定义的7 个不变矩尽管在连续情况下具有比例不变性,但是在离散状 态下并不成立。基于这种思想下,本论文采用一种改进的新的不变矩特征量的算法,该算法 通过改变比例因子来实现不变矩的特征量不仅在连续状态下具有不变性,而且在平移和旋转 的状态下也具有了不变性。另外本论文还利用了计算出的不变矩特征量来训练b p 网络,对待 识别对象的进行识别分类。实例计算表明这种识别方法有良好的分类效果。具有定的实际 价值。 3 b p 神经网络的图像识别 b p 算法是用于前馈多层网络的学习算法。b p 网络模型实现了多层网络学习的思想。当给 定网络的一个输入模式时,它由输入层单元送到隐层单元,经隐层单元逐层处理后再送到输 出层单元,由输出层单元处理后产生一个输出模式。如果输出响应与期望输出模式有误差, 且不满足要求,就需转入误差后向传播,即将误差值沿连接通路逐层向后传送,并修正各层 连接权值。 可见,相对于其他方法而言,利用b p 神经网络来解决图像识别问题比传统的分类器具有 下述3 个显著优点:神经网络对问题的先验知识要求较少;可以实现对特征空间较为复 杂的划分;适用高速并行处理系统来实现。虽然神经网络可以对图像进行直接识别但是其 有效性、高速性较差。主要是因为b p 网络存在局部极小值问题及当隐层神经元数目增多时网 络训练时间急速增长等问题。因此需提高网络的效率,提高识别率,提高稳定性。 针对上述问题,本论文采用两种较为可行的神经网络改进方法:多次选择不同的初始 权值。多次选择不同的初始权值,这样就有可能避开局部极小值以达到真正的全局最小值。 当选用不同的初始值的时候,网络的训练时间及误差曲线上可以得到较大改进。采用动量 法。即在权值增量中加入一个动量因子。这种方法的产生是基于对误差曲线振荡性的观察: 如果能平滑轨迹中的振荡性将能提高收敛性能,可以用一个低通滤波器来实现。该方法对于 网络误差曲线振荡等同题能够有效的解决。 4 b p 神经网络的图像识别系统的设计 本系统首先进行图像的预处理。预处理的步骤依次如下:灰度化、二值化、锐化、去离 散噪声、整体倾斜调整、字符分割、尺寸标准归一化、紧缩重排。通过预处理原先散落在图 像中的亮度不一、大小不一、斜度不一、粗细不一、同时还含有噪声的数字已经被提取出来, 亮度一致,尺寸标准化,去掉了倾斜,并且在很大程度上也去除了噪声。 然后进入b p 网络训练部分。训练之前首先要输入b p 训练的参数t 主要是训练步长和允 许误差。b p 训练的时候,首先要对字符分割的结果来进行特征提取,然后将提取的特征送入 b p 网络进行训练。 最后进入识别部分。打开一幅含有数字的图像,然后是预处理,然后是特征提取,最后 将提取后的特征送入b p 网络,通过网络的输出可以判定输入的字符,以实现数字字符的识别。 识别的结果显示在屏幕上,同时也存储在文件中并保存。 通过b p 神经网络图像识别系统的设计流程可以清楚的看到神经网络在图像识别中具有 比传统分类器优越的特点,改进的边缘检测算法及改进的不变矩特征提取算法都能从一定程 度上帮助神经网络更精确地识别图像,具有较好地效果。 关键词;图像识别b p 神经网络边缘检测不变矩 i i 西南农业大学硕士学位论文a b s t r a c t i i 曼舅目_ _ _ 墨量日| 量皇| 皇篡皇曼曼曼! 曼舅曼曼鼍鼍曼! 曼曼曼尝皇曼曼曼曼曼寡鼍皇曼曼曼曼曼! 曼! 皇! 蔓皇曼鲁曼皇曼| _ a b s t r a c t t h ei m a g e r e c o g n i t i o ni sd e v e l o p i n gi nt h el a s t2 0y e a r s t h ei m a g er e c o g n i t i o ni sb e c o m et h e m a i nc o n t e s to ft h ec l a s s i f i c a t i o na n dd e s e r i p t i o ni ns o m eo b j e c t so rp r o c e s s ( r e g a r d i n ga st h e i m a g e ) t h ei m a g er e c o g n i t i o nh a v em a n ye x t e n s i v er e s e a r c h ,s u c ha st h ei m a g er e c o g n i t i o nc a n r e c o g n i z et h ec a n c e rc e l lf r o mt h em e d i c a li m a g e ;i tc a nr e c o g n i z et h ef o r m ,f o r e s ta n dl a k ef r o m t h er e m o t es e n s i n g i m a g e ;i tc a nr e c o g n i z et h ec a rw h i c hm a d e t h et r a f f i ca c c i d e n tf r o mt h et r a f f i c i m a g ea n ds oo n t h i sp a p e ra n a l y z e st h et r a d i t i o n a l m e t h o d so ft h ei m a g er e c o g n i t i o n t h e ni t f i n d st h a tt h et r a d i t i o n a lm e t h o d sh a v es o m el o c a l i z a t i o nw h i c hi sb a rf o rt h ed e v e l o p m e n to ft h e i m a g er e c o g n i t i o n a tl a s tan e w k i n do ft h ei m a g er e c o g n i t i o ni s p u tf o r w a r dt ob yt h i sp a p e r w h i c hm a k es o m ei m p r o v e m e n ta c c o r d i n gt ot h en e u r a ln e t w o r kb a s e do nn e u r a ln e t w o r k t h er e s e a r c hw a yf o rt h i sp a p e r a c c o r d i n gw i t ht h eb a s i cs t e po f t h ei m a g e r e c o g n i t i o ni st h a t t h ef i r s t ,r e a l i z e st h ec o l o ri m a g et o r nt ot h eg r a yi m a g ea n dt h eb i n a r yi m a g eu s i n gt h ec u r r e n t f o r m u l a ;t h es e c o n d ,r e m o v e st h en o i s ef r o mt h ei m a g eu s i n gt h es m o o t h i n gf i l t e r i n ga n dm e d i a n f i l t e r i n ga n dt h es h a r pf i l t e r i n g ;t h et h i r d g e t san e we d g ed e t e c t i o nm e t h o d f o rt h ei m a g es e g m e n t w h i c hi st h er e s u l tt h a tr e s e a r c ht h er o b e r t so p e r a t o ra n dt h es o b e lo p e r a t o ra n dt h eo r t h o g o n a l o p e r a t o r , t h i sm e t h o dc a nm a k e t h ei m a g es e g m e n tv a l i d ;t h ef o r t h ,a n a l y s e st h ei n f l u e n c eo fs c a l e f a c t o ro nm o m e n ti n v a r i a n tf e a t u r e su n d e rt h es t a t eo fd i s c r e t ea n da d o p t sak i n do fm o d i f i e d a l g o r i t h mo fm o m e n t i n v a r i a n t st oa b s t r a c ti n v a r i a n t so fo b j e c t ;t h ef i f t hm a k e st h ec e r t a i no ft h e h i d d e nl a y e ra n dt h eh i d d e nu n i to fb pn e t w o r ka n di m p r o v e st h en e t w o r kb ym o d i f y i n gi n i t i a l w e i g h tv e c t o r sw h i c hc a nm a k et h e n e t w o r ke f f i c i e n t l y t h ep o i n to ft h i sp a p e ri st h ei m a g e s e g m e n ta n dt h em o m e n ti n v a r i a n tf e a t u r ea n dt h e n e u r a ln e t w o r k l a s t l yt h i sp a p e rm a k e sa p r o g r a m t or e a l i z et h ef u n c t i o n 1 ,an e wt h ee d g ed e t e c t i o nm e t h o d t h ei m a g es e g m e n ti st h em o m e n ts t e pf o rt h ei m a g er e c o g n i t i o n t h i sp a p e ra n a l y z e st h e r o b e r t so p e r a t o ra n dt h es o b e lo p e r a t o ra n dt h eo r t h o g o n a lo p e r a t o r , f i n d st h a tt h et h r e eo p e r a t o r m a k et h ec e r t a i ni n i t i a lw e i g h tv e c t o r sb u tt h i si n i t i a lw e i g h tm u s tn o tm a k ec e r t a i ni nt h ea c t u a l c i r c u m s t a n c e s ot h i sp a p e rp r o p o s e sau e w k i n do fe d g ed e t e c t i o nm e t h o dw h i c hm a k eu s eo ft h e3 3t e m p l a t e t h i so p e r a t o rc a nj u d g et h ed i r e c t i o no ft h ee d g e ,a n dm a k ec e r t a i nt h ei n i t i a lw e i g h t v e c t o r sa c c o r d i n gt ot h ee d g e t h ea n a l y s i so ft h ec o n f i g u r a t i o nm e c h a n i s mo f t h en e w o p e r a t o ra n d l a r g en u m b e r so fe x p e r i m e n t ss h o wt h a tt h e n e wa p p r o a c h ,w h i c hi sag o o ds u p p l e m e n tt oe d g e d e t e c t i o n ,i sf e a s i b l e 2 an e wt h em o m e n ti n v a r i a n t so nt h ee x t r a c t i n gc h a r a c t e r i s t i c t h e e x t r a c t i n gc h a r a c t e r i s t i ci sk e y o ft h ei m a g er e c o g n i t i o n t h i sp a p e ra n a l y z e st h em o m e n t 西南农业大学硕士学位论文a b s t i l c t i n v a r i a n tf e a t u r e sa n df i n d st h a tt h em o m e n ti n v a r i a n tf e a t u r e si sf i tt ot h ei m a g er e c o g n i t i o nb a s e d o nn e u r a ln e t w o r k s o ,t h i sp a p e ra n a l y s e st h ei n f l u e n c eo fs c a l ef a c t o ro nm o m e n ti n v a r i a n t f e a t u r e su n d e rt h es t a t eo fd i s c r e t ea n d a d o p t sak i n do f m o d i f i e da l g o r i t h mo fm o m e n ti n v a r i a n t st o a b s t r a c ti n v a r i a n t so f o b j e c t 3 t h ei m a g er e c o g n i t i o nb a s e do nb pn e u r a ln e t w o r k b p 0 s a c kp r o p a g a t i o n ) n e u r a ln e t w o r k i so n eo ft h em o s t w i d e l yu s e dm o d e l si nt o d a y sw o r l d o fs c i e n c ea n dt e c h n o l o g yw h i c hi sc h a r a c t e r i z e db yt h ep o w e r f u ln o n - l i n e a rm a p p i n gc a p a b i l i t y a n dt h ef l e x i b l en e t w o r ks t r u c t u r ew h i c hc a nh a n d l ep r o b l e m sa c c o r d i n gt ot h ec o n c r e t ec o n d i t i o n s t h e c o m p a r i s o no ft h en e u r a ln e t w o r ka n dt r a d i t i o n a lr e c o g n i t i o ni st h a tt h en e u r a ln e t w o r k h a st h r e ea d v a n t a g e s t h ef i r s t ,t h en e u r a ln e t w o r kn e e dl e s sp r i o rk n o w l e d g e ;t h es e c o n d ,t h e n e u r a ln e t w o r kc a nd i v i d et h ee i g e ns p a c ec o m p l i c a t e d l y ;t h et h i r d ,t h en e u r a ln e t w o r ki st h e p a r a l l e lp r o c e s s i n gs y s t e m t h i sp a p e ru s e st w om e t h o d so fi m p r o v i n ga r i t h m e t i c o nb pn e u r a l n e t w o r k s ,w h i c hi st h a tu s em a n y d i f f e r e n ti n i t i a lw e i g h tv e c t o r sf i r s t l ya n ds e c o n d l ya b s o r ba d d i n g m o m e n t u m w a y s , 4 t h ed e s i g no ft h ei m a g e r e c o g n i t i o nb a s e d o i lb pn e u r a ln e t w o r k f i r s t l y ,i m a g ep r o - p r o c e s s i n gi s d o n e i nt h i sp a r t ,g r a y i n g ,b i n a r yi m a g e ,s h a r p ,r e m o v et h e n o i s e ,i m a g es e g m e n t a n ds oo n s e c o n d l y , t r a i n e db p n e u r a ln e t w o r ka n di m a g e r e c o g n i t i o nb a s e do nb p n e u r a ln e t w o r k t h r o u g h t h ed e s i g no ft h ei m a g er e c o g n i t i o nb a s e do nb pn e u r a ln e t w o r k w ec a ac o m p r e h e n d t h a tt h en e u r a ln e t w o r kh a v em a n ya d v a n t a g ec o n t r a s t e dw i t ht h et r a d i t i o n a lm e t h o d s k e y w o r d s :t h ei m a g er e c o g n i t i o nb pn e u r a ln e t w o r k e d g ed e t e c t i o n m o m e n ti n v a r i a n t s v 西南农业大学硕士学位论文 第1 章文献综述 第1 章文献综述 1 1 图像识别的技术及意义 图像识别是近2 0 年来发展起来的一门新型技术科学,它以研究某些对象或过程( 统称图 像) 的分类与描述为主要内容。图像识别所研究的领域十分广泛,它可以是医学图像中的 癌细胞识别;机械加工中零部件的识别、分类:可以从遥感图片中识别农作物、森林、湖泊 和军事设施,以及判断农作物的长势,预测收获量等:可以是自导引小车中的路径识别:邮 政系统中自动分拣信函;交通管制、识别违章行驶的汽车牌照;银行的支票识别、身份证识 别等,图像识别是上述课题中的最基础、最重要的技术”1 。 1 1 1 图像识别系统的组成 一个图像识别系统主要包括3 部分:图像信息获取:信息加工和处理、抽取特征;判断 或分类等,如图1 - 1 所示。 圈1 - 1 圈像识别系统图 f i g 卜1 t h es y s t e mo f i m a g er e c o g n i t i o n 1 1 2 图像识别的方法及特点” 图像识别方法较多大体上可以归纳为两类方法:统计方法( 数学方法) 和语言( 或结 构) 学方法,后者亦称句法结构识别方法。 统计方法以数学上决策理论为基础,根据这种理论建立了统计学识别模型。其基本模型 是在对研究的图像进行大量统计分析,找出规律性认识,抽出反映图像本质特点的特征进行 识别。在这种方法中,大量工作在于如何抽取图像的特征或决定统计参数,即所谓参数法。 另外还有非参数决策法,如近邻法则,它是一种绕过概率的估计而直接进行决策的方法。 对于特征抽取必须把图像的大量原始信息缩减为少数的特征,例如采用方差分布、特征向 量法等。对文字、符号等可只抽取几何形状特征,对声波信号可抽取频谱特征。为了抽取特 征有时要对原始图像信息进行各种变换,空间投影,把多维的图像点简化n j l 个坐标分量 上。例如,在高空用多波段遥感仪得到的遥感照片,具有大量的图像数据为了进行识别, 可先将其划分成若干小的集群,将性质相近的数据点划为一个集群,进行聚合分析。利用梯 度法反复迭代计算,可把数据点的距离小于某一数值的点合并在一起。从而大大减少信息量, 只需研究这些集群的性质就够了,这就是集群分析。 句法结构识荆法立足于分析图像的结构,一幅图像可以模仿语言构造,用一些语句来表 旦南农业大学硕士学位论文第1 章文献综述 达语句的结构是由词、短语等构成,并按一定的语法表达出来。也就是说,语句由短语组 成,而短语由单词组成,其中最基本的元素的单词。那么一些语句又怎样和图像发生联系呢? 这可从舀像的形成谈起,任何一幅图像,总是由一些点、直线、斜线、弧线及环等组成,剖 析图像的这些基本元素,看它们按怎样的规则构成图像,这就是结构分析的课题。这些基本 元素就相当于语句中的单词:那些直线、曲线的某种组合可看成短语,它们的全体按怎样的 规则构成整个图像,就相当于语法规则。而对图像识别来说,就相当予检查图像所代表的某 一类句型,是否符合事先规定的语法。若语法正确,则认为识别出结果。 由上述可知,这种方法主要是利用了图像结构上的相互关系。这种语言学方法起始于2 0 世纪6 0 年代后期,发展较晚,在实用中还有一些问题。例如由于图像比语言要复杂得多,语 言中的词是一个接一个的一串符号排列,而要让图像的基本元素也排成一串,就不容易了。 因为图像的基本元素,其结构关系是上下左右交叉一起的,这就需要合理选择和设计基本元 素。 在图像识剐技术中,从识剐逻辑的蕊点来看,亦可分为两个类型:组合式的和顺序式的。 前者是把图像的特征全部抽出( 或足以判别一个圈像的很大一部分特征) 之后再进行判断, 给出结果。后者则按所抽出特征的次序,每抽出一次特征,都要进行一次判断( 不是对整个 图像) ,直至q 最终给出结果。这类逐步判断的方法,可认为是一种多阶段最优问题。 上述两类方法各有缺点:第一类方法很少利用图像本身的结构关系而第二类方法则没 有考虑图像在环境中所受的噪声干扰,必然使其元素或结构关系带有一定的随机性。上述方 法都是以特征提取为基础的识别方法。 在图像识别的技术领域中,驭特征提取为基础的方法遇到了极大的困难,如何表示和提 取特征需要多少特征,都存在很大的盲目性和低效率。识别过程必须经历从数据获取,特 征提取到判别分类几个阶段,所需的运算使得系统难咀满足实时性要求。为此,需用新的理 论和技术来解决这一问题。 近年来神经网络在图像识别领域中也得到了广泛应用。有很多问题利用神经网络的概念 进行识别可以获得快速准确的结果。因此本论文采用了基于神经网络的图像识别技术。 1 2 人工神经网络图像识别技术 人: 神经网络的研究是以人脑为基础的一门智能科学的研究。神经网络理论与识别理论 是相互渗透,几乎现有的所有神经网络物理模型都在识别领域得到了成功的应用。神经网络 理论所取锝的些许进步都会给识别理论的发展带来鼓舞;相反,识别理论的深入研究和进步 叉会大人推动神经网络理论的发展,它们的关系是相互影响、相互渗透的【”。如今,国际上 神经网络、机器智能和计算机视觉理论都是热门的课题。这些理论日新月异的发展都会给图 像识别理论带来新的希望。 图像识别理论的发展与计算机科学的发展是分不开的,人们研究中发现计算机科学随着 2 西南农业大学硕士学位论文第1 章文献综述 超大规模集成电路吣i ) 技术日新月异的发展,虽然取得了惊人的成就,但要它赢接感知声 音、文字、图像等外界信息仍然十分困难,因此,需要以人工智能、神经网络为核心开辟新 的研究领域来解决这一难题,开展神经网络图像识别理论的研究具有重要的意义和价值。 1 2 1 人工神经网络的主要特点” 人工神经网络技术就是用大量简单的处理单元来代替人脑神经细胞( 神经元) ,并把这些 处理单元按照某种方式互相连接组成网络来模拟人脑的一门科学。它是在现代神经科学研究 成果的基础上提出的,揭示了存在于大脑的大规模并行处理及分布表征的特性,它致力于按 照生物神经系统的同样方式处理真实世界的客观事物,是模拟人类形象思维的一种重要方法。 其最终目的就是试图模拟人脑的信息、处理机制,来设计新一代的智能型计算机。因此,神 经网络就具有一些与人脑处理信息时相似的特点这些特点明显优于其它的传统模式识别系 统。 ( 1 ) 具有商度的并行性人工神经网络是由大量的神经元广泛互连而组成的系统,这 一结构特点决定着人工神经网络具有高速信息处理的能力。人脑的每个神经元大约有1 0 3 1 0 4 个树突及相应的突触,一个人的大脑总计约形成1 0 “1 0 1 5 个突触。用神经网络的术语来 说,即人脑具有l o ”1 0 ”个互相连接的存储潜力。虽然每个神经元的运算功能十分简单 且信号传输速率也较低( 大约l o o 次,秒) ,但由于各神经元之间的极度并行互连功能,最终使 得一个普通人的大脑在约1 秒内就能完成现行计算机至少需要数1 0 亿次处理步骤才能完成的 任务。 ( 2 ) 分布式存储,存储与计算相结合在神经网络中,知识与信息的存储表现为神经元 之间分布式的物理联系。它分散地表示和存储于整个网络内的各神经元及其连线上。每个神 经元及其连线只表示一部分信息,而不是一个完挺具体概念只有通过各神经元的分布式综 合效果才能表达出特定的概念和知识。 ( 3 ) 具有良好的容错性、自适应性和联想记忆功能由于人工神经网络中神经元个数众 多以及整个网络存储信息容量的巨大,使得它具有很强的不确定性信息处理能力。即使输入 信息不完全、不准确或模糊不清,神经网络仍然能够联想存在于记忆中的事物完整图像。只 要输入的模式接近于训练样本,系统就能给出正确的推理结论。 ( 4 ) 系统具有健壮性这是由人工神经网络的结构特点和其信息存储的分布式特点决定 的,生物神经网络不会因为个别神经元的损失而失去对原有模式的记忆,人工神经网络也有 类似的情况。因某些原因,无论是网络的硬件实现还是软件实现中的某个或某些神经元失效t 整个网络仍然能继续工作。 ( 5 ) 具有高度的非线性处理能力神经网络系统是由大量简单神经元构成的,每个神经 元接受大量其它神经元的输入,通过线性或非线性输入,输出关系,产生输出影响其它神经 元。网络就是这样互相制约、互相影响,实现从输入状态空间到输出状态空间的非线性映射, 3 西南农业大学硕士学位论文第1 章文献综述 这使它可以很好地用于分类和预测问题。因此神经网络是一种具有高度非线性的超大规模连 续时间动力学系统。它突破了传统的以线性处理为基础的数字电子计算机的局限,标志着人 们智能信息、处理能力和模拟人脑智能行为能力的一大飞跃。 神经网络用于图像识别具有以下优点神经网络的信息分布式存储予连接权值系数中, 使网络具有很高的容错性,而图像识别中往往存在噪声或输入图像的部分损失,因此神经网 络可以较好地解决图像识别问题。另外神经网络的自组织和自学习功能,大大放松了传统 图像识别方法所需的约束条件,使其对图像识别问题显示出了极大的优越性。 1 2 2 与传统分类器对比帅1 现将用于模式分类的神经网络与传统模式分类器进行对比,假设均是用于将n 维的样品 分类归属m 类模式中的某一类。 图1 - 2 ( a ) 传统分类器包含两极:第一级选出具有最大匹配度的类别。第一级的输入是 用符号表示的n 个输入元素的值,它们顺序地译码为有利于运算的内部形式。然后要设计出 一种算法,以算出样品与每一类样本的匹配程度。显然每一样本应是该类模式的代表。而样 品则往往是由样本以某种随机方式产生的。在这种情况下,总是假设样品的分布具有某种函 数形式( 例如正态分布函数等) ,因为这使匹配度的计算较简单。然后匹配度被顺序加载到分 类器的第二级并选出具有最大匹配度的类。 由训练样品获得参数估计 输 入 样 品 习臣习臣 ( a ) 传统分类器 x o 输 出 y 1 y 口 ( b ) 神经网络分类器 圈卜2 传统分类器与神经霸络分类器的对比 f i g 1 - 2t h ec o n t r a s to ft r a d i t i o n a ic l a s s i f i e ra n dn e u r a i n e t w o r kc i a s s i f ie r 图1 2 ( b ) 是神经网络分类器。用n 个分量表示的样品被送入神经网络,这些分量可用 4 西南农业大学硕士学位论文第1 章文献综述 二值表示,或用连续值表示。神经网络的第一级实际上也是在计算匹配度,然后被平行地通 过m 条输出线送到第二级,在第二级中各类均有一个输出。并表现为仅有一个输出的强度为 “高”而其余的均为“低”。当得到正确的分类结果后,分类器的输出可反馈到分类器的第 一级,并用一种学习算法修正权重。当后续的测试样品与曾学习过的样本十分相似时,分类 器就会做出正确的响应。 通过比较可以清楚看到神经网络比传统分类器具有高效性、正确率高等显著的优点。 1 2 3 神经元基本模型” 如图1 - 3 所示,作为人工神经网络基本单元的神经元模型有三个基本要素:( 1 ) 一组连 接( 对应于生物神经元的突触) ,连接强度由各连接上的权值表示,权值为正时表示激活,为 负表示抑制。( 2 ) 一个求和单元,用于求取各输入信号的加权和。( 3 ) 一个激活函数,起线性或 非线性映射作用可将神经元输出幅度限制在一定范围内。此外,还有一个闭值郎。 图卜3 基本神经元模型 f i g 卜3 t h em o d e io fn e a r o u s 以上神经元的作用可以用数学式表达出来: 舭一w f 埘 y 叫小,( 酗 臼) n 1 上式中,x 1x 2 ,z 为输入信号,m ,w 2 ,_ 为调箍权值,“为输入的加权和( 也 称为激励电平) ,- r ( ) 为激活函数,y 为神经元的输出 神经元模裂中的激发函数,( ) 有多种形式,其中最常见的有阶跃型、线性型和s 型三 种形式。 对于阶跃型激发函数有:( 这种激发函数的神经元称离散输出模型) 5 巩 耽 岛 厂ii,。、lilil 输 入 信 号 卜。善嘲加洳 ,q ) 2 ”1 i 一1 “。, ;| ;w l x i 一日s o ( 1 2 ) y 一仁:麓 对于线性型激发函数有:( 这种神经元称线性连续型模型) ,( h f ) k u f ( 1 3 ) 对于s 型激发函数有:f 这种神经元称非线性连续型模型) ,以。) 一 ( 1 , 4 ) 鉴于上述神经网络的这些特点,在本论文的研究中,选择了改进的b p 神经网络作为识 别分类器。 1 2 ,4b p 神经网络 b p 算法是为了解决多层前向神经网络的权系数优化而提出来的;所以,b p 算法也通常 暗示着神经网络的拓扑结构是一种无反馈的多层前向网络。故而,有时也称无反馈多层前向 网络为b p 模型。1 9 8 6 年,r u m e l h a r t 提出了反向传播学习算法,即b p ( b a c kp r o p a g a t i o n ) 算法。 这种算法可以对网络中各层的权系数进行修正,故适用于多层网络的学习。b p 算法是目前最 广泛用的神经网络学习算法之一,在自动控制中是最有用的学习算法。 1 2 4 1b p 神经网络分类器 神经网络的分类过程如图卜4 所示。 图 图像特征 神经分图像 像变换数字网络类分类 判 结果 信 与特 规格分类 息征提化 器决 取 图卜4 神经网络分类过程 f i g 卜4 t h ec ia s s i f i c a t i o n sp r o c e s so fn e u r a in e t w o r k 12 4 2b p 神经网络模型“3 1 b p 算法是用于前馈多层网络的学习算法,如图1 5 所示是b p 神经网络的图像分类器。 6 西南农业大学硕士学位论文第1 章文献综述 围1 5 三层b p 神经网络圈协分类器 f i g ,1 5 t h ec ia s s i f i e ro fb pn e u r a in e t w o r k 网络共分为3 层;i 为输入层节点:j 为隐层节点;k 为输出层节点。层与层之间多采用 全互连方式。同一层单元之间不存在相互连接。网络的每个输入节点表示图像特征向量的一 个分量数据,输出节点表示分类序号,分类判决可以采用输出最大值法。 b p 网络模型实现了多层网络学习的思想。当给定网络的一个输入模式时它由输入层单 元送到隐层单元,经隐层单元逐层处理后再送到输出层单元。由输出层单元处理后产生一个 输出模式。如果输出响应与期望输出模式有误差且不满足要求,就需转入误差后向传播, 即将误差值沿连接通路逐层向后传送,并修正各层连接权值。 相对于其他方法而言,利用神经网络来解决图像识别问题有3 点优点:神经网络对问 题的先验知识要求较少;可以实现对特征空间较为复杂的划分:适用高速并行处理系统 来实现。虽然神经网络可以对图像进行直接识别但是其有效性、高速性较差,因此在本论 文的研究中需先进行丁预处理来完成特征的提取,再利用提取的样本对改进的b p 神经网络 进行训练识别。该方法对图像识别系统更为有效。 1 3 特征抽取 特征抽取是图像识别中的一个关键问题。其基本任务是如何从许多特征中找出那些最有 效的特征,对于基于神经网络的识别方法而言,其核心是利用图像的特征进行训练识别,理 想的特征是对字符图像的平移、旋转与缩放都具有不变性,因此,如何选取字符图像的特征 是字符识别的关键所在【”1 。如何寻求新的特征提取方法电是目前模式识别领域中的一个重要 研究方向。 1 3 1 不变矩 图像平移问题可以在利用字符归一化解决,对于旋转问题虽然有的研究者采取旋转校正 的方法解决,但由于很多情况下旋转角度或倾角是随机而不是先验知道的,而且旋转校正也 很麻烦,故提取对旋转角度不敏感的特征是一种更可靠与简便的方法。经过大量研究,人们 理论上己找到具有旋转不变性的一些变换,如傅立叶描绘子、梅林变换、矩变换等,这些变 换大多都是非线性的,变换后的模式中的特征信息会有所损失,但如果所使用的识别方法不 7 需要足够的信息或对这种损失不敏感,那么,这种变换还是很有必要的。但是由于在神经网 络的识别方法中,对于图像的识别需要足够的信息来训练网络因此在本论文中,透过对矩 不变量进行研究,选择了7 个不变矩作为字符的输入模式特征来进行特征的提取。 1 9 6 2 年mkh u 首先提出了连续函数矩的定义,给出了具有平移不变性、旋转不变性和 比例不变性的7 个不变矩的表达式,并在计算机上对字母二值化图像进行了匹配试验:在h u 的基础上,r y w o n g 进一步给出了离散状态下的各阶矩的计算方法,并且用图像进行了匹配 试验“1 。 不变矩是指物体图像经过平移、旋转以及比例变换仍保持不变的矩特征量,设物体的二 维离散图像函数用,o ,y ) 表示,其 + g ) 阶矩定义为m ,一x 9 y 9 ,o ,y ) - 相应的 ( p + g ) 阶中心矩为“,。 一) 9 ( ) ,一y o ) 4 , ,y ) :真中,l m ”m 0 0 , y o m 0 1 m 0 0 。对于二维图像而言,表示图像灰度在水平方向上的灰度重心;y o 表示图 像灰度在垂直方向上的灰度重心。中心矩是与图像的平移无关的。 用零阶中心矩对其余各阶中心矩进行归一化,可以得到图像的归一化中心矩为 ,7 w u w u 7 其中,r 一( p + q + 2 ) 2 ,p + q - 2 , 3 。 ( 1 5 ) 为使矩描述子与平移、大小、旋转等因素无关利用归一化中心矩可导出7 个不变矩虫 九a 一 分析这7 个不变矩发现由于在离散状态下由于比例因子的影响使得不变矩发生了一定的 变化,因此要想使得不变矩同时具有平移、旋转和比例变换的不变性,就需对其进行改进。 本论文根据文献 1 4 1 6 提出的改进算法来提取目标形状特征的7 个不变矩作为特征向量,将 提取的训练样本对b p 神经网络进行分类识别,实验表明具有较好的识别效果。 , 图像特征提取主要是提取那些具有区别性强、独立性好的特征,这些特征不仅与特征提 取的算法有关,还与图像分割的算法息息相关。因此,本论文为了使得神经网络能更为有效 对图像进行识别,也对传统的图像分割算法进行了改进。 1 4 图像分割 图像分割是由图像处理转到图像分析的关键。一方面,它是目标图像表达的基础,对特 定测量有重要的影响。另一方面,图像分割和分割的目标表达、特征提取和参数测量等将原 始分割的基本概念和分割所用的主要方法。 1 4 1 图像分割的定义1 8 西南农业大学硕士学位论文 第1 章文献综述 借助于集合概念对图像分割可给出如下比较正式的定义: 令集合r 代表整幅图像的区域,对r 的分割可看成将r 分成n 个满足以下5 个条件的 非空子集( 子区域) r 1 ,r 2 ,r 。: u r j ;r ; l - 1 对所有的l 和j ,有f # ,r f n 只一母; 对fz 1 ,2 ,有p ( r ) t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030中国牙科低速机头行业市场占有率及投资前景评估规划报告
- 2025至2030中国燃油沉积物控制剂行业产业运行态势及投资规划深度研究报告
- 2025至2030中国照明产品行业市场占有率及投资前景评估规划报告
- 2025至2030中国烷基胺行业市场占有率及投资前景评估规划报告
- 2025至2030中国潜水缸行业产业运行态势及投资规划深度研究报告
- 2025至2030中国游戏媒体行业发展趋势与前景展望战略报告
- 2025至2030中国渔船装造行业深度研究及发展前景投资评估分析
- 2025至2030中国混凝土喷浆机行业深度研究及发展前景投资评估分析
- 2025至2030中国液态金属市场供需现状与竞争前景研究报告
- 2025至2030中国液压托盘车行业发展趋势分析与未来投资战略咨询研究报告
- 国开期末考试《管理英语4》机考试题及答案第4套
- 产后出血的护理-课件
- 2023年春季国开《学前教育科研方法》期末大作业(参考答案)
- 上海科学院事业单位工作人员招考聘用笔试参考题库+答案解析
- EXCELVBA函数参考手册
- 成都石室中学初中学校新初一分班(摸底)语文模拟试题(5套带答案)
- SB/T 10279-2017熏煮香肠
- GB/T 3452.1-2005液压气动用O形橡胶密封圈第1部分:尺寸系列及公差
- GB/T 27065-2015合格评定产品、过程和服务认证机构要求
- GB/T 13384-1992机电产品包装通用技术条件
- SYB第一步:把自己作为创业者来评价课件
评论
0/150
提交评论