




已阅读5页,还剩102页未读, 继续免费阅读
(光学工程专业论文)基于神经网络的目标识别及定位方法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于神经网络的目标识别及定位方法的研究 吴川 导师:朱明 摘要 本文研究了简单背景下,发生尺度、角度、位置变化的目标的神经网络识别、 定位方法。内容涉及模糊分割技术、b p 神经网络、主元分析技术。 文章采用对整幅图像识别,同加窗匹配的方法相比,省略了逐行逐列搜索目 标的过程。当目标在图像中所占比例超过三分之二时,应用神经网络识别出目标, 便可大致找到目标位置,但当目标在图像中所占l :k f f l j 较小且不在中心附近时,则 除了识别出目标外还需要对目标定位。为此本文除了对神经网络目标识别方法进 行了研究外,还对目标定位方法进行了讨论。文章主要研究内容包括以下几个方 面内容: 详细分析了多层前馈神经网络的描述及b p 算法工作过程。介绍了隐层的选 择及隐层神经元数选择的一些经验方法。针对b p 算法存在的问题,从初始权值 的选取,网络训练过程参数调整等方面进行优化改进,实验证明加快了训练速度, 改善了b p 网络的学习效果。 表示目标的特征向量是否能恰当反映目标本质特性也对网络能否学习成功 至关重要,因此本文阐述了两种不同的目标表示方法,即基于不变矩的目标表示 法和基于主分量的目标表示法。针对对原始图像直接提取不变矩存在的问题,提 出一种先对图像预处理,再提取图像不变矩的处理过程。并且在图像预处理的环 节,分析了模糊阈值法原理,提出了一种基于模糊理论的阈值分割法,实验表明 该种方法同其他几种选取阂值方法相比,具有一定优势。 中国科学院博士学位论文:基于神经网络的目标识别及定位方法的研究 文章针对数学方法求取主分量困难的情况,采用神经网络提取主分量,简化 了求取过程,并以主分量作为b p 网络的输入特征向量,进行目标识别。 在利用神经网络目标识别时,当目标在图像中所占比例较小,且其位置不在 整幅图像中心附近时,仅仅识别出目标还不能确定目标位置,因此文章讨论了目 标定位方法,分析了多种定位方法的优缺点,尝试应用神经网络方法对目标定位, 该方法同其他数学目标定位方法相比,在于定位过程简单( 只有乘法和加法运 算) ,且不需要对图像预处理。 本文的创新点: 1 针对对原始图像提取不变矩存在的问题,提出先对图像预处理,再 提取不变矩的处理过程。并且在图像的预处理过程中,提出一种基于 模糊理论的阈值分割法,该方法能快速有效的实现图像分割。 2 提出在网络学习过程中加入可变的动量因子,减小了网络振荡,加 快网络收敛速度。 3 使用主元神经网络求取图像的主分量,提出以主分量作为改进b p 神 经网络的输入特征向量,进行目标识别。 4 提出对整幅图像识别,再通过定位网络进行目标定位的识别定位方 法。同在整幅图像内加窗匹配的识别定位方法相比,不需要在图像 中逐行逐列进行搜索。通过神经网络对整幅图像识别时,当目标在 图像中存在尺度、角度、位置变化时,定位是必要的,因此本文尝 试应用神经网络进行目标定位,只在确定图像中存在目标时进行定 位,省略了非目标定位过程。 关键词:模糊分割,b p 神经网络,主元分析,不变矩,初始权值 美文摘要 r e s e a r c ho nt h em e t h o do ft h et a r g e tr e c o g n i t i o na n d o r i e n t a t i o nb a s e do nt h en e u r a ln e t w o r k s c h u a n w u d i r e c t e db y :p r o f m i n gz h u a b s t r a c t t h ed i s s e r t a t i o ni st h es t u d yo ft h et a r g e tr e c o g n i t i o na n do r i e n t a t i o nw h i c hh a s c h a n g eo fa n g l e t r a n s l a t i o na n ds c a l eu n d e rt h es i m p l eb a c k g r o u n d ,b a s e do n t h e n e u r a ln e t w o r k s t h ec o n t e n ti n c l u d e si nt h ef u z z ys e g m e n t b pn e u r a ln e t w o r k sa n d p r i n c i p a lc o m p o n e n ta n a l y s i s t h em e t h o do ft h ew h o l ei m a g er e c o g n i z e di sp r e s e n tt h r o u g hn e u r a ln e t w o r k s i n o r d e rt of i n dt h et a r 2 e tt 1 1 ep a t t e mm e t h o dn e e ds e a r c he a c hl i n ea n de a c hr o w i ti s c o s tm o r et h a np r e s e n tt h em e t h o d m e l lt h et a r g e ss c a l ei st w o p a r to ft h ei m a g eo r t h et a r g e ti si nt h ec e n t e ro f 血ei m a g e t h er e c o g n i t o na n dt h eo r i e n t a t i o ni s i m p l e m e n t e dt o g e t h e rb yn e u r a ln e t w o r k s i ti sn e c e s s a r y t oc o m p u t et h et a r g e t p o s i t i o nw h e nt h et a r g e ti ss m a l l e rt h a nh a l fo fb a c k g r o u n da n di sn o tc e n t e r s ot h e d i s s e r t a t i o nn o to n l yd i s c u s s e st h en e u r a ln e t w o r k sr e c o g n i t i o nm e t h o db u ta l s o s t u d i e st h eo r i e n t a t i o nm e t h o d t h i st h e s i sm a i n l yc o n s i s t so ft h ef o l l o w i n gp a r t s m u l t i l y e rf e e d f o r w a r dn e t w o r k sa n dt h eb pn e u r a ln e t w o r ka l g o r i t h ma r ea n a l i e d t h es e l e c t i o no fh i d el a y e ra n dn u m b e ro fn e r v ec e l lo fh i d el a y e ra r ei n t r o d u c e d t h e w e i g h tv a l u ea n dp a r a m e ra r eo p t i m i z e d t h er e s u l ti st r a i nc o s ti ss m a l l e ra n dt r a i n e f f e c ti sb e t t e r t h ei n p u te i g e n v e c t o ri si m p o r t a n tf o rt h en e ts t u d i e ds u c c e s s f u l l y s ot h et w o e i g e n v e c t o r sa r ed i s c u s s e d 0 n ei s t h em o m e n ti n v a r i a n t t h eo t h e ri sp r i n c i p a l c o m p o n e n t t h ee x c e l l e n c ea n dd i s a d v a n t a g ea r ed i s c u s s e d t h ed i s s e r t a t i o np r e s e n t s e x t r a c t i n gt h em o m e n ti n v a r i a n to fp r o c e s s e di m a g ea n d ak i n do ff u z z ys e g m e n tw a y d u r i n gp r o c e s s i n gi m a g e t h ee x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h ep r o p o s e d a p p r o a c h i se f f e c t i v e t h ep r i n c i p a lc o m p o n e tc a r lb eg o t t e nf r o mt h eg r a yi m a g e i ti sd i f f i c u l t yt o g e t t i n gt h ep r i n c i p a lc o m p o n e t s ot h ep r i n c i p a lc o m p o n e tn e t w o r k i sp r e s e n t e dt og e t t h ep r i n c i p a lc o m p o n e t ! 业堕堡主兰堡垒叁! 墨! 壁垒璺兰生旦堑堡型墨查竺查堡竺! 壅 w h e ni ti sn o ti nc e n t e ro f t h e i m a g et h eo b j e c tl o c a l i z a t i o ni sd i s c u s s e db a s e do n t h en e u r a ln e t w o r k s i t se x c e l l e n c ei st h a tt h ec o m p u t ec o s ti ss m a l la n d t h em e t h o di s u s e df o rg r a yi m a g e m o s t l yr e s e a r c hf i n d i n g si sf o c u s e do n : i t h em o m e n ti n v a r i a mo f t h ep r o c e s s e di m a g ei se x t r a c t e d t h ef u z z y t h e o r y a n dm a x i m u me n t r o p yp r i n c i p l ea r ea p p l i e dt os e l e c tt h et h r e s h o l dv a l u ef o r g r a y l e v e li m a g et h ee x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h a tt h ep m p o s e d a p p r o a c hc a ns e l e c tt h et h r e s h o l da u t o m a t i c a l l ya n de f f e c t i v e l y 2i no r d e rt oa c c e l e r a t ec o n v e r g e n c es p e e do fn e u r a ln e t w o r k s t h ep a r a m e t e ro f s t u d yi so p t i m i z e d 3 t h ep r i n c i p a lc o m p o n e n to ft h e i m a g ei se x t r a c t e da n di sa st h ei n p u t e i g e n v e c t o ro f b pn e t w o r k st h r o u g ht h ep r k n c i p a lc o m p o n e n tn e t 4s o m e t i m e st h et a r g e tl o c a l i z a t i o ni sn e c e s s a r y s on e u r a ln e t w o r k si su s e dt o g e tt a r g e tp o s i t i o n k e yw o r d s :f u z z ys e g m e n t ;b pn e u r a ln e t w o r k s ;p r i n c i p a lc o m p o n e n ta n a l y s i s ; n v a r i a n tm o m e n t ;e i g e n v e c t o r s 中国科学院博士学位论叉基于神经网络的目标识别厦之垃方法古研究 图表索引 图】i 神经网络目标识别框图1 0 图21 升半梯形分布一2 5 图! 2 三角形分布2 6 图2 3 梯形分布”2 6 图2l 4 正态分布2 7 图25 呈升半梯形分布的隶属函数- 2 7 图26 呈降半梯形分布的隶属函数2 7 图2 7 几种阈值分割法分割效果图( 1 ) 2 9 表21 几种方法搜索次数比较及所得闽值( l ) 2 9 图2 8 几种阈值分割法分割效果图( 2 ) ”3 0 表2 2 几种方法搜索次数比较及所得阈值( 2 ) 3 0 表2 3 几种方法搜索次数比较及所得阈值( 3 ) 3 0 图2 9j l 种阂值分割法分割效果图( 3 ) 3 0 图31 前馈神经网络结构“3 3 图3 2 样本1 _ 4 1 图3 3 样本2 4 i 图34 识别网络结构图4 i 图35 普通b p 算法训练误差与学习次数关系曲线4 l 图36 优化初始权值的b p 算法训练误差与学习次数关系曲线4 2 图37 优化初始权值并采用改进b p 算法的训练误差与学习次数关系曲线4 2 图38 两类目标原始图像4 8 v i i 图标索 图39 不变矩曲线 表31 两类样本原图的不变矩数据- 表3 2 经过处理后样本的不变矩数据 图3 1 0 样本l 图3 1 样本2 图3 1 2 训练误差及学习次数关系曲线图 图31 3 样本3 图31 4 样本4 - 国3 1 5 训练误筹及学习次数关系曲线图- 图4 1 求取最大主分量的单层嘲络结构图 图42 求取多个主分量的单层网络结构图” 图43 求取主分量的洲练网络结构图 图44 主元网络学习框图 图45 ,了图像降维示意图- 图46 训i 练样本示意图 图47 测试样本示意图- 表41 输入层到隐层权值 表42 隐层到输出层权值 图48 训练样本原图及降维示意图 图49 测试样本原图及降维示意图 图41 0 待识别目标图像( 1 ) 图4 1 l 训练误差及训练次数关系曲线图( 1 ) 图41 2 待识别目标图像( 2 ) 图4 1 3 训练误差及训练次数关系曲线图( 2 ) 图41 4 主元网络训练流程图 图51 定位网络示意图- 图5 2 输入层行连接示意图 i x 嗍哪吲删吲吨幔喵峭咄嗡哪臻懈堋堋篇堋吲堋吨堋堋 |;|ii ! ! 翌兰垦苎主兰苎笙圭墨! 苎兰! 兰竺! 堑璺型兰墨垒互兰竺竺查 图53 输入层列连接示意图7 8 图5 4 定位网络所用部分图像8 0 图55 含0 0 2 的椒盐噪声g o 图56 含0 2 的椒盐噪声8 1 图5 7 含o 0 2 的高斯噪声一8 l 图58 含0 2 的高斯噪声8 l 表5 1 加噪声图像目标定位准确率“8 l 图5 9 实际采集的两类用于定位的图像8 2 x 第一章绪论 1 1 引言 第一章绪论 目标识别及定位一直是模式识别中一个研究热点问题,该问题的研究在军用 和民用领域中均具有重要应用意义。通常目标识别既要区分相近的不同目标又要 在同一目标发生姿态、尺度、位置变化时不致误判,此外目标识别算法还要对于 光照变化、噪声干扰、背景变化有一定的鲁棒性,有时为了达到实时性,目标识 别算法还必须在足够短的时间内完成。这导致识别过程非常复杂,信息量和计算 量都很大。目前在目标识别和定位方法中,还没有通用的方法能对不同情况的目 标均能准确识别定位,多是针对某一情况有效。 1 2 目标识别方法综述 目前,有些目标识别方法当识别出目标即能对目标定位,有些则不能,当识 别出来后,还需要对目标进一步定位。在图像识别的发展中,出现了几类有代表 性的理论和方法( 1 ) 匹配的图像识别方法;( 2 ) 句法图像识别方法;( 3 ) 模糊 图像识别方法:( 4 ) 神经网络图像识别方法 匹配的图像识别方法:匹配的图像识别方法,通常指的是针对目标本身,构造 一类有别于其他物体的特征,或者将一帧图像中的若干子图像直接作为所要辨识 目标的模板,对另一帧做搜索,以寻找对应的部分。目标识别的过程也就是匹配 的过程,可以在图像空间进行【2 直接利用像素灰度模板匹配【3 】 “,如最常见的 中国科学院博士学位论文:基于神经网络的目标识别覆定位方法的研究 相关模板匹配方法:也可以在特征空间进行,利用图像特征来匹配【5 】特征可以 是颜色、轮廓、频域特征等等。匹配可以在整个空间进行1 6 】,即通过对原始图像 加窗扫描,和目标模板图像匹配,实现目标的识别及定位,因为这种方法要在含 有目标的图像中逐行逐列进行匹配,因此计算量非常大。为了减少计算量,也可 以在整幅图像中的一个子空间内进行,一般选择含有目标状态的邻域为目标匹配 的搜索域。匹配准则一般包括最大互相关函数、最小均方差函数、最小平均绝对 差值函数、最大匹配像素统计等【7j 。不同的匹配准则的数学含义不同,计算代价 也不同。匹配有各种加速算法,比如s s d a 、三步搜索、菱形搜索、并行处理或 多分辨率匹配等方法 8 【9 1 。匹配的目标识别方法优点在于定位精度高。缺点为: 1 当目标发生旋转、平移或亮暗变化时常常导致识别及定位失败; 2 当目标较小时,背景不断发生变化时发生匹配失败; 3 相关计算量大: 由于以上缺点的存在,匹配的目标识别技术适于以下几种情况: 1 目标不发生旋转变化,即只有平移运动; 2 目标所在环境背景简单; 3 目标自身特征不存在较大变化: 由于在实际情况中,往往不能保证目标始终作平移运动,此外目标在图像中 的尺度和形状也不总是保持不变的。因此说,基于匹配原则的目标识别方法具有 一定的局限性,虽然许多学者针对其局限性提出了一些改进方法,取得了一定效 果,但算法大多比较复杂,并且不能从根本上改变其局限性。 句法( 或结构) 图像识别方法:句法图像识别方法是以形式语言理论的概念为基 础的。它分析图像的结构,把复杂结构的图像看成是由简单的子图像所构成,又 把最简单的子图像作为基元,从基元的集合出发,按照一定的文法( 构图规则) 去描述复杂的图像。这类似于英语中的句子由单词按一定的文法连接而成。给定 第一章绪论 一个输入模式基元串,判别其是否被文法识别器接受的过程就是图像识别。由于 提取图像的基元特征十分困难,句法图像识别方法应用得并不广泛。 模糊图像识别方法:模糊图像识别方法是模糊集理论在图像识别中的应用。 它是用模糊集合的概念代替确定子集,从而得到模糊的识别结果,或者说是识别 结果模糊化。因此,将模糊集理论用于图像识别系统,利用模糊信息进行图像模 式决策分类,使计算机或机器带有接近人类的智能,这是非常重要的研究课题。 目前模糊图像识别的主要方法有:最大隶属原则、接近原则识别方法和模糊聚类 分析方法。 神经网络图像识别方法:人工神经网络具有信息分布式存储、大规模自适应并行 处理、高度的容错性等优点【1 2 1 ,特别是其学习能力和容错性对处理图像识别 问题具有独到之处。神经网络目标识别,一般需要两个过程:训练过程和实际识 别过程。在训练过程通过有指导或无指导学习方式对大量有代表性样本学习,把 通过学习得到的经验存储在网络结构中,学习完毕即找到一组合适的网络连接权 值。在识别过程中当把未知模式输入到网络中时能根据学习到的知识对未知模式 进行判断。对于网络识别结果是否为目标或为何种目标,常用0 、1 组合的形式 表示。当然有时也采用最大或最小准则,即当神经网络输出层中输出最大( 或最 小) 的节点对应的图像属性为输入图像的属性。常用于识别的神经网络有b p 神 经网络与k o h o n e n 神经网络。应用神经网络进行目标识别,大多采用多种方法与 神经网络相结合,如应用g a b o r 小波进行滤波,确定目标尺度、位置、方向,然 后把提取的特征输入到已经训练好的前馈神经网络来识别目标。人工神经网络进 行目标识别的优势在于通过对有代表性的样本进行学习,能识别带有噪声或形变 的输入模式,能把识别处理和若干预处理融合成一体进行,此外经过学习后的神 经网络具有较高的容错性、推理能力和鲁棒性。神经网络因其智能性成为近年来 一个研究热点问题。 中国科学院博士学位论文:基于神经网络的目标识别及定位方法的研究 1 3 本文研究意义 人工神经网络是一种结构上模仿人脑处理功能的技术1 2 】,它不仅具有神经细 胞很多的局部功能,而且具有并行工作方式以及学习功能,这使得它在信息处理 和智能科学中有着极其重要的地位。各国对其的研究极为重视。如美国国防部预 研局资助的科学家和军事专家经过多方面周密的论证,决定把基于神经网络的自 动目标识别、声纳信号处理、语音识别、地震勘探信号处理等作为研究的重点: 日本政府也积极支持这方面的研究,提出了真实世界计算的研究目标,决心用 1 0 0 年或更多的时间研究神经网络:欧洲和其他一些国家也制定了研究计划,神 经网络成为各国十分重视的研究课题。近年来我国“8 6 3 ”计划、“攀登”计划和国 家自然科学基金等都对神经网络的研究给予了资助,吸引了大批的优秀青年人才 从事神经网络领域的研究工作,促进我国在这个领域取得领先地位。 尽管对人工神经网络的研究已经持续了几十年,并且已经充分认识到其在目 标识别领域中具有巨大的应用前景,但不可否认人工神经网络还处于其学科的初 级阶段,其理论还没有完善到能提供一套可以赖以遵循的设计方法,例如初始权 值的确定、网络层数的确定、每层神经元数目的确定、激励函数的确定都没有可 遵循的法则进行确定,目前的开发设计还侧重于实验,通过实验情况进行改进。 因此对基于神经网络的目标识别方法定位的研究具有一定的价值。 1 4 神经网络的发展及在目标识别中的应用 “人工神经网络”( a r t i f i c i a ln e u r a ln e t w o r k ,简称a n n ) 是在对人脑 组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工程系 统。早在上个世纪4 0 年代初期,心理学家m c c u l l o c h 、数学家p i t t s 就提出了 人工神经网络的第个数学模型,从此开创了神经科学理论的研究时代。其后, 4 第一章绪论 神经网络的研究经历了兴起、高潮与萧条、高潮及稳步发展的曲折道路【1 5 】。 具体的说神经网络主要经历了如下四个阶段: 第一阶段:启蒙期 通常把1 9 4 3 年认为是研究a n n 的起始年代,因为这一年w a r r e nm c c u l l o c h 和w a l t e rp i t t s 提出了神经元的第一个模型。他们用数学逻辑的方法,研究生 物神经网络,提出了人工神经元的数学模型,简称m - p 模型。该模型具有算术与 逻辑计算的功能。但在真空管年代里,要物理地实现该神经元是不可能的。尽管 如此,它为以后神经元模型的发展奠定了基础。 1 9 4 9 年心理学家d o n a l dh e b b 提出突触联接强度是可变的假说,他认为学 习的过程就发生在两个神经细胞相互连接的突触处。图触的连接强度随前后神经 元的活动而变化,并首次提出了神经元权值的修改方案,即著名的h e b b 学习规 则。这是生理学宏观研究的微观假设,它对以后a n n 的发展产生了深刻的影响。 1 9 5 4 年m a r v i nm i n s k y 建成第一台神经计算机。 第二阶段:第一次高潮的出现 1 9 5 7 年,计算机科学家r o s e n b l a t t 提出了著名的感知机模型,它的模型包 含了现代计算机的一些原理,是第一个完整的人工神经网络,第一次把神经网络 研究付诸工程实现。该网络模型通过训练可用作某些模式的分类器。尽管感知 器模型十分简单,但它己具备了神经网络的某些基本性能,如可学习性、分布式 存储和并行处理、一定的容错性等。由于可应用于模式识别,联想记忆等方面, 当时有上百家研究机构投入到此项研究,美国军方甚至认为神经网络工程应当比 “原子弹工程”更重要而给予巨额资助,并在声纳信号识别等领域取得一定成绩。 1 9 6 2 年美国斯坦福大学教授b e r h a r dw i d r o w 提出了自适应线性单元 a d a l i n e ( a d a p t i v el i n e a rn e u r o n ) 。它可用于自适应滤波、预测和模式识别。 同时,他还与m a r c i a nh o f f 一起提出了一种新的学习规则,称为w i d r o w h o f f 中国科学院博士学位论文:基于神经网络的目标识别厦定位方法的研究 学习规则。此规则可减少训练过程中神经网络输出的误差平方和。a d a l i n e 以及 由它扩展而来的m a d a l i n e 的早期应用有模式识别、天气预报和自适应控制。a n n 的第一个成功应用的实例是消除通讯中的回波,至此,人工神经网络的研究工作 进入了一个高潮。 第三阶段:低潮期 尽管六十年代中期以前a n n 取得了一些成功,但由于当时的学习规则还不够 完善,不能支持复杂的计算问题,a n n 的研究不论在理论认识还是应用实践方面 均遇到了一些困难。1 9 6 9 年,美国著名人工智能学者m m i n s k y 和s p a p e r t 编 写了影响很大的( p e r c e p t r o n 一书,从理论上证明单层感知机的能力有限,诸 如简单的感知器只能求解线性问题,其功能是如此的有限,以至于求解象异或这 样的简单的非线性问题都无能为力。他们提出了构造含有隐层的多层感知器的方 案,以增强感知器的学习能力。但对隐层神经元的学习规则尚无所知,因此没有 取得预期效果。他们认为神经网络的研究已经走到尽头。由于m i n s k y 在当时学 术界的权威地位,他的论断导致其后十年内a n n 研究进展缓慢。就此神经网络研 究进入了一个缓慢发展的萧条期。在此期间,芬兰学者r k o h o n e n 提出了自组织 映射理论模型,反映了大脑神经细胞的自组织特性、记忆方式以及神经细胞兴奋 刺激的规律;美国学者s a g r o s s b e r g 建立自适应共振理论( a r t ) :日本学者 k f u k u s h i m a 提出了认知机模型;s h u ni c h i m a r i 则致力于神经网络的有关数学 理论研究等等,这些研究成果对以后的神经网络的发展产生了极为重要的影响。 第四阶段:再发展时期 美国生物物理学家j j h o p f i e l d 于1 9 8 2 年、1 9 8 4 年在美国科学院院刊发 表的两篇文章,有力地推动了神经网络的研究,引起了研究神经网络的又一次高 潮。1 9 8 2 年,他提出了一个新的神经网络模型- - h o p f i e l d 网络模型,并首次引 入网络能量函数的概念,给出网络稳定性的判定依据。1 9 8 4 年,他又提出了网 第一章绪论 络模型实现的电子电路,为神经网络的工程实现指明了方向,它的研究成果开拓 了神经网络用于联想记忆的优化计算的新途径,并为神经计算机的研究奠定了基 础。1 9 8 4 年h i n t o n 等人将模拟退火算法引入到神经网络中,提出了b o l t z m a n n 机网络模型,b m 网络算法为神经网络优化计算提供了一个有效的方法。1 9 8 6 年, d e r u m e l h a r t 和j l m c c l e l l a n d 提出了误差反向传播算法,成为至今为止影响 很大的一种网络学习方法,该算法解决了多层网络的学习问题。误差反向传播算 法至今仍是a n n 领域中应用最多的一种算法。1 9 8 7 年美国神经计算机专家 r h e c h t n i e l s e n 提出了对向传播神经网络,该网络具有分类灵活,算法简炼的 优点,可用于模式分类、函数逼近、统计分析和数据压缩等领域。1 9 8 8 年l o c h u a 等人提出了细胞神经网络模型,它在视觉初级加工上得到了广泛应用。为了适应 人工神经网络的发展,1 9 8 7 年成立了国际神经网络学会,并决定定期召开国际 神经网络学术会议。1 9 8 7 年6 月i e e e 在美国加州举行了第届a n n 国际会议, 有干余学者参加,并成立了国际神经网络学会,掀起了用神经网络模拟人类智能 的热潮。此后,定期召开国际联合神经网络大会。并且两本反映神经网络研究的 刊物n e u r a ln e t w o r k ) 和i e e et r a n s a c t i o no nn e u r a ln e t w o r k 分别于 1 9 8 8 年1 月和1 9 9 0 年3 月问世。我国于1 9 9 0 年1 2 月在北京召开了首届神经网 络学术大会,并决定以后每年召开一次。1 9 9 1 年在南京成立了中国神经网络学 会。这些为神经网络的研究和发展起到推动作用,人工神经网络步入稳步发展的 时期。 今天,人工神经网络已发展成为涉及神经生理科学【i 6 1 ”】、认知科学、心理 学、数理科学、计算机科学、信息科学、微电子学以及光学等多学科综合的前沿 学科。尽管在8 0 年代神经网络在应用中很难与现有传统方法竞争,但到了9 0 年 代,神经网络在许多领域中己成为能提供较好结果并且容易实现的有力工具,特 别是对难以用公式描述的模型或参数的信息处理,诸如估计到达波方向( d o a ) 、 中国科学院博士学位论文:基于神经网络的目标识别及定位方法的研究 线性和非线性时变控制、大规模电信系统管理、复杂的实时优化问题、医学及其 它图像处理、指纹等特征提取、基因鉴别、雷达目标分类与识别、交叉极化雷达 目标增强、预测等等 1 8 1 【1 9 】【2 0 】【2 l 】【2 2 】【2 3 1 2 4 1 【2 5 】。目前神经网络主要应用到如下一些领 域: ( 1 )模式识别和图像处理印刷体和手写体字符识别、语音识别、签字识 别、指纹识别、人脸识别、人体病例分析、目标检测与识别、图像 压缩和图像复原等。 ( 2 ) 控制和优化化工过程控制、机器人运动控制、家电控制、半导体生 产中掺杂控制、石油精炼优化控制和超大规模集成电路布线设计等。 ( 3 ) 预报和智能信息管理股票市场预测、地震预报、有价证券管理、借 赁风险分析、i c 卡管理和交通管理。 ( 4 )通信自适应均衡、回波抵消、路由选择和a t m 网络中的呼叫接纳识 别及控制等。 ( j ) 空间科学空间交会对接控制、导航信息智能管理、飞行器指导和飞 行程序优化管理等。 神经网络之所以受到人们如此重视,主要是因为它具有如下特点: ( 1 )学习能力学习能力是神经网络具有智能的重要表现,即通过训练可 抽象出训练样本的主要特征,表现出强大的自适应能力。 ( 2 )分布式在传统的串行运行体系计算机中,信息分布在独立的存储单 元中,任何部分内存的损坏都将导致整个信息的无效。而在神经网 络中,信息则分散分布在神经元的连接上,单个的连接权值和神经 元都没多大的用途,但他们组合起来就能宏观上反映出一定的信息 特征。对个别神经元和连接权的损坏,并不会对信息特征造成太大 的影响,表现了神经网络的强大的鲁棒性( 受干扰时自动稳定的特 第一章绪论 征) 和容错能力。在输入信号受到一定干扰时,输出也不会有较大 的畸变。神经网络的信息分布特性,还是经过训练的神经网络具有 强大的联想能力。 ( 3 ) 并行性神经网络是对人脑结构和功能的模拟,但更偏重对结构的模 拟。各种神经元在处理信息时是各自独立的,它们分别接收输入, 作用后产生输出。这种并行计算的处理,使得它有可能用于实时快 速处理信息,成为下一代智能计算机的基础。 ( 4 ) 非线性神经网络可有效地实现输入空间到输出空间的非线性映射。 寻求输入到输出之间的非线性关系模型,是工程上普遍面l 临的问题。 对大部分无模型的非线性系统,神经网络都能很好地模拟。因此, 神经网络成为非线性研究的重要工具。 神经网络在信息处理中最典型、最有希望的领域就是模式识别。作为神经网 络的最初模型一感知器模型,就是为模式识别提出来的。神经网络( 特别是多层 神经网络) 的信息处理原理是建立在模式联想基础上的。通过自组织或学习的神 经网络,具有强有力的模式变换能力,这使得基于神经网络的模式识别系统与传 统的模式识别系统相比,表现出以下几个明显的优点: 1 通过对有代表性的样本的学习,能够识别带有噪声或变形的输入模式; 2 具有很强的自适应学习能力,通过对样本的学习,掌握模式变换的内在 规律; 3 能够把识别处理与若干预处理融合在一起进行; 4 识别速度快; 许多问题均属于模式识别问题。手写体字符( 数字、字母) 的识别,由于其 大小不均、位置不定、书写风格各异,对传统模式识别技术而言,是一个十分困 难的问题。但对人来说确是轻而易举的事。日本学者福岛邦彦潜心多年,开发了 中国科学院博士学住论文:基于神经网络的目标识别及定位方法的研究 一种称为认知机的神经网络,专门用于识别手写体字符,对字符的平移、畸变、 旋转和大小的变化有一定的适应能力。在此基础上,1 9 8 7 年福岛又研制了新认 知机,提高了识别率。人脸识别是研究的一个热点,近年来一些学者开始把神经 网络和其他方法结合起来用于人脸识别。如梁路宏【26 j 等把模板匹配和神经网络方 法相结合进行人脸识别。张林【27 j 等以子空间理论为依据,利用有代表性的人脸图 像样本构造正交基,并把正交基通过主元分析法得到特征向量,提高了神经网络 的识别能力。y u a n 和n i e m a n n 2 8 1 尝试利用神经网络对目标位置及运动姿态进行估 计。他们从利用神经网络识别人脸受到启发,提出了一种神经网络方法用于目标 位置及姿态的识别,此外w o l h e r 和a n l a u f 2 9 也对目标识别和姿态估计进行了研 究,他们提出了一种( a t d n n :a d a p t a b l et i m e d e l a yn n ) 网络结构,这种网络 结构在不需要预处理的情况下,能同时测定车辆的形状和运动信息。严柏军 等人把图像的矩特征、投影特征、直方图特征结合起来作为神经网络的输入向量 来识别货车车锁,从而达到计算火车车皮数的目的。b i s c h o f 和l e o n a r d i s l 3 1 1 1 3 2 1 提出的径向基网络利用二维图像信息来实现物体的识别。张庆文提出利用b p 神 经网络进行个性化车牌字符的识别算法,对容易混淆的字符,如“d 、“q ”、“o ”、 0 ,提出了设置一个容量较小的二级b p 神经网络,对这些容易混淆的字符在 灰度图上进一步区分识别。由于各种神经网络模型在应用于图像识别时有其相似 之处,只是应用于不同的任务对各有其优越性。下图给出了神经网络应用于图像 识别的一般模型 图1 1 神经网络目标识别框图 其中神经网络目标识别的重点在于表示图像的特征提取和神经网络识别两 部分。为了降低识别网络的结构,提高识别能力,必须对输入的目标图像进行模 第一章绪论 式简化,即从输入图像中提取出同类模式图像共有的不变特征,完成高维模式空 间向低维特征空间的映盎j - 3 3 】【3 4 1 1 3 5 1 3 6 1 3 7 1 1 3 8 】 3 9 1 4 0 】【4 l l 。不变性模式识别可简化识别网 络的结构,并且提高识别的准确性。 1 5 影响识别结果的几个问题的讨论 综上所述利用神经网络对目标识别关键在于两个方面: ( 1 ) 要识别物体的特征抽取。在早期研究中主要提取图像的不变矩作为特征 向量1 “l ,虽然该特性在连续图像条件下对旋转、平移和伸缩具有不变性,但受噪 声影响比较大,因此在提取前要进行一些必要的预处理。以傅立叶描述子作为要 分割物体的特性,文献【4 2 】表明它对噪声和具有比较复杂边缘的图像比较敏感。此 外基于边角、边缘的结构特性、基于几何学的特性、基于投影的特性分别在文献 4 3 1 4 4 】1 4 5 j 【4 6 1 1 4 7 1 被讨论,这些特性的提取不仅耗时,而且有时是不可能的。由文献 4 8 1 1 可知为保证识别结果的稳定性,所需样本大致按问题的规模( 输入变量维 数) 呈指数上升,并且特征向量维数太高不仅使网络结构复杂程度增高,还会降 低识别速度。可见当样本数量一定时,保证网络有效性的方法是采用降维的方法, 即将高维的特征模式用低维特征模式近似。但这也要根据实际情况而定,有些模 式在低维空间很难分开,则需要变换到高维空间,使模式变得线性可分。由此可 见,特征向量的选取是神经网络研究的一个重要问题,因此本文对表示目标的特 征向量也进行了深入的研究。 ( 2 ) 网络结构的构造及网络学习法则。一个好的网络结构及学习法则可使网 络在有限数据( 样本) 上学习后有泛化( 推广) 能力【5 0 1 【5 2 1 1 5 3 1 。泛化能力与网 络结构( 规模) 、给定样本数量以及与问题本身复杂程度有关。因为问题本身的 复杂程度是不可控制的,所以当给定样本数量一定时,网络结构的有效性决定了 识别结果的对错。一个网络结构的有效性不仅与网络结构本身有关,还与通过学 中国科学院博士学住论文:基于神经网络的目标识别厦定住方法的研究 习法则,进行权值调整有关。当前,对学习法则的研究比较多,如反向传播学习 法则( b p 算法) 用这种算法对网络参数进行调整,确实起到改善网络性能的作 用,但其存在需要较长训练时间、完全不能训练、局部最小值等缺点5 4 1 1 5 5 】【5 6 】, 针对b p 算法存在的缺点,一些学者提出了一些改进b p 算法,批处理一块处理反 向传播叠代算法对学习常数和动量因子采用文献【57 l 给出的自适应方法选择,尽管 算法将样本分块进行训练,减少了单个样本带来的噪声,但并没从本质上解决问 题。此外学者们又提出递推最小二乘反向传播算法 5 8 】【5 9 】【柏1 、径向基函数网络递 推最小二乘学习算法【5 0 】【5 l 】【5 2 1 【5 3 】、多层感知器网络r l s b p 6 1 】【6 2 i 学习算法等虽然这 些法则都起到一定的提高识别能力的作用,但也都或多或少的存在一定缺陷。常 见的神经网络结构有前馈网络、有跨越连接网络、有有序反馈网络、有无定形反 馈连接网络、有侧向连接
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京市通州区漷县镇觅子店社区卫生服务中心招聘非在编护理人员2人模拟试卷及1套参考答案详解
- 2025广东佛山市南海区狮山镇横岗小学招聘1人考前自测高频考点模拟试题及参考答案详解1套
- 2025深圳商品房买卖合同
- 2025技术开发委托合同标准范本格式
- 2025杭州市社区工作者合同范本
- 2025年西电集团医院招聘(57人)模拟试卷(含答案详解)
- 2025年甘肃省嘉峪关市胜利路小学招聘公益性岗位人员模拟试卷及1套参考答案详解
- 2025广西物流职业技术学院公开招聘副高及以上职称人员37人模拟试卷及完整答案详解一套
- 2025年度合同制员工的合同范本
- 2025年淮北濉溪县现代农业投资发展有限责任公司招聘5人模拟试卷及1套参考答案详解
- GB/T 16294-2010医药工业洁净室(区)沉降菌的测试方法
- GB/T 14486-2008塑料模塑件尺寸公差
- GB/T 14190-2017纤维级聚酯(PET)切片试验方法
- GA/T 487-2020橡胶减速丘
- 【精益人才培养系列教材】第3节:七大浪费
- 《国际公法》全册配套完整课件
- 第三单元名著导读《朝花夕拾-二十四孝图》课件(15张PPT) 部编版语文七年级上册
- 特种设备管理台帐(5个台账)
- l领导干部心理健康知识讲座课件
- 经口鼻吸痰技术新版
- 三甲级综合医院全科室岗位说明书汇编(专业完整模板)
评论
0/150
提交评论