(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf_第1页
(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf_第2页
(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf_第3页
(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf_第4页
(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(计算机应用技术专业论文)基于bp神经网络的数字图像边缘检测算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

p 甜3 艿6 基于b p 神经网络的数字图像 边缘椽测算法的研究 学科:诗算极应爰技术 研究生签名 指导教烀签 摘要 , | f 神经网络是一种具有大规模并行处理、分布式信息存储和高容错能力的自 适应、自组织与自学习的非线性网络。神经网络的理论及威用研究正在世界范围 内蓬勃发壤,同时可以对计算机视觉理论救发展和变蕊起麓重大的难魂作照e 边 缘检测是强缘分辑识别必不可少钓强节,楚一移耋要筑图像颈处理技本。餐俦绞 躺箨予算法存在繁噪声稻缀节之间等韵矛瓣。辫文基予b p 禧经溺络鹄数字鼙像 边缘梭测较好缝解决了上述问题。 本文首先介缁了数字图像边缘检测的国内外的发展状况,并介绍了利用神 经网络进行边缘检测的b p 神经网络,并阐述了b p 神经网络的算法:随后对传 统簿予算法进行了深入的研究并对传统算子算法进行了一些改进;即把原来2 个的方向模板增加为8 个方向模板,进一步提麓了利用传绕算予进行图像边缘检 测的效果;霉学详细她孵释了基予b p 毒孛经网终进零亍数字嚣豫边缘检测躲算法, 在进镗了大量实验之纛,确定了耱经弱络懿结橡以及溺络模型中的一些参数;最 屠+ 作者提出了稠霜数学期望、方差等统计特设参数对检测出采的透缘篷豫进行 质蟹评价翡方法。 在以上理论分析纂础上,以v i s u a lc 十+ 作为开发工具,制作了一个基于b p 神经网络的数字图像边缘检测的实验软件。 关键字:神经茹晦边臻函l 传统;斥数苷? 妊 e d g e d e t e c t i o na l g o r i t h mr e s e a r c hb a s e d o nb pn e u r a l n e t w o r k si nd i g i t a li m a g e d i s c i p l i n e :c o m p u t e ra p p l i c a t i o n t e c h n o l o g y s t u d e n ts i g n a t u r e - f 匕沁石 s u p 哪i 8 凹8 i g n 籼戢力氛p蓼吻巧吻 a b s t r a c t a r t i f i c i a ln e u r a ln e t w o r k sa r en o n l i n e a rn e t w o r k so fa d a p t a t i o n ,s e l f - o r g a n i z a t i o n , a n ds e l f - l e a r n i n g t h e yp o s s e s st h ec a p a b i l i t i e so fl a r g e s c a l ep a r a l l e lp r o c e s s i n g , d i s t r i b u t e di n f o r m a t i o nm e m o r ya nh i g i l l yf a u l t t o l e r a n t r e c e n t l y , t h et h e o r ya n d a p p l i c a t i o n so fa r t i f i c i a l n e t w o r k sh a v eb e e nd e v e l o p i n go v e rt h ew o r l da n dh a v e i m p o r t a n ti n f l u e n c eo n t h er e v o l u t i o n o f d i g i t a li m a g e e d g ed e t e c t i o ni s a ni n d i s p e n s a b l es t e pb e f o r ei m a g ea n a l y s i sa n dr e c o g n i t i o n , a n di sa ni m p o r t a n tt e c h n o l o g yi nt h ei m a g ep r e p r o c e s s i n gp r o c e d u r e h o w e v e r t r a d i t i o n a l a l g o r i t h m h a si t si n h e r e n t d i s a d v a n t a g e f o re x a m p l e i t h a st h e c o n t r a d i c t i o no f t h en o i s ea n dt h ee d g ed e t a i l s i nt h ep a p e r , e d g ed e t e c t i o na l g o r i t h m r e s e a r c hb a s e do nb pn e u r a ln e t w o r k si nd i g i t a li m a g ei so f f e r e d ,a n di tw o r ko u tt h e a b o v ec o n t r a d l o t i o n f i r s t , t h ed e v e l o p m e n to fe d g ed e t e c t i o nb o t hi nt h ec o u n t r ya n da b r o a di s i n t r o d u c e di nt h e p a d e r t h e nt h ew r i t e r s e tf o r t ht h en e u r a ln e t w o r k sa n dt h e a k o r i t h mo fb pn e u r a ln e t w 0 1 kw h i c hi sw i d e l yb e i n gu s e d s e c o n d l y ,t h ew r i t e r s t u d i e st h et r a d i t i o n a l a l g o r i t h ma n da m e n dt h e t r a d i t i o n a i a l g o r i t h m t h e 2 一d t e m p l a t ei sa l t e r e dt h e8 一d ,he n h a n c et h ee f f e c tb yt h et r a d i t i o n a la l g o r i t h m ;a tl a s t 、 t h ew r i t e rp u tf o r w a r dt h ee d g ed e t e c t i o na l g o r i t h mr e s e a r c hb a s e do nb pn e u r a l n e t w o r k si nd i g i t a li m a g ea tl e n g t ha n d a p p r a i s et h eq u a l i t yo fe d g ei m a g e d e t e c t e db y u s i n gt h eb pa l g o r i t h mw i t hs t a t i s t i c a im e t h o d s w h a t sm o r e ,b a s e do n u p w a r d m e t h o d s t h e e x p e r i m e n t a l s o f e w a r ei s p r o g r a m m e dw i t h v i s u a lc + + 6 o k e yw o r d s :e d g ed e t e c t i o n ;n e u r a l n e t w o r k s ;t r a d i t i o n a la l g o r i t h m ; d i g i t a li m a g e 1 绪论 1 1 边缘检测的研究背景和意义 人的视觉系统的感知部分视网膜所感受到的是三维客观世界可见部分的 二维投影图像并根据左右两个二维视图对物体进行三维的理解,计算机视觉所要 解决的是完全相同的问题。为了正确地理解图像,需要将以观察者为中心的输入变 换到以物体为中心的描述,而物体的物理边界是一类非常重要的描述元素,这些边 界有可能在成像过程中产生边缘信息,它在图像中表现为强度的突变形式。而二维 图像也可理解为是由不同的封闭区域组成,这些封闭的区域在统计意义上满足某种 一致性原则。区别这些封闭区域之间的分界线体现了重要的景物结构,这些分界线 在图像中也表现为强度的非连续性。因此,在图像分析的初始阶段,大量的处理是 涉及如何检测这些不连续性。但是,由于现实物体世界和成像过程的复杂性,以及 各种噪声源,使得被处理的图像信号相当复杂的,在这种情况下检测不连续性并不 是一件容易的任务,只有在考虑更多的全局结构关系的基础上,才能更有效地利用 所提取的局部特征:在实践上,边缘检测是在局部区域上针对“点”的一种运算, 表现为一种典型的信号处理问题,由于这些原因使得边缘检测在计算机视觉的处理 算法中有重要的地位”“。 在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分 常称为目标( 其他部分称为背景) ,它们一般对应图像某种特定的、具有独特性质的 区域。为了便于分析目标,需要将它们分离提取出来,图像分割就是把图像分成各 具特性的区域并提取出感兴趣目标的技术和过程“。它是图像处理和前期视觉中的 基本技术,是按照图像的某些特性( 如灰度级、频谱、纹理等) 将图像空间划分成 一些区域。在这些区域内部,其特性是相同的或是均匀的,两个相邻区域彼此特性 则是不同的”“。 边缘是图像的基本特征。所谓边缘是指其周围像素灰度有阶跃变化或屋顶变化 的那些像素的集合,它存在于目标与背景、目标与目标、区域与区域、基元与基元 塑塞三些堂堡堡圭堂堡篁些:= := 一 之间,因此它是图像分割所依赖的重要特征,也是纹理特征的重要信息源和形状特 征基础。边缘检测是图像处理、计算机视觉中最基础的内容,并在应用中起着重要 的作用,它是图像分析与识别重要的环节,是进行目标检测,图像分割所依赖的重 要特征。这是因为图像的边缘包含了用于识别的有用信息,所以边缘检测是图像分 析与模式识别的主要特征提取手段,而且在计算机视觉及图像处理系统中,许多问 题的解决都是从边缘检测开始;其次,通过对人类视觉系统的研究表明,图像的边 界特别重要,往往仅凭一条粗略的轮廓线就能够识别出一个物体。这个事实为计算 机视觉的研究提供了重要的启示;再者,边缘检测是图像分析的重要内容,边缘具 有能勾划出区域的形状,能被局部定义以及能传递大部分图像信息等许多优点,并 且在分析图像时大量减少了要处理的信息量,而且还保护了物体的边界结构,因而 边缘检测可以看作是许多问题的关键,也是图像预处理中的一个必要的步骤。即: 物体可用其边界来表示,由图像灰度不连续点组成的基元图携带了原始图像的绝大 部分有用的信息。 由于图像边缘检测作为一个低级视觉处理过程,至今仍没有圆满解决的这一类 问题”“,并且鉴于边缘检测技术的重要性,因此边缘检测方法的研究对计算机视觉、 图像处理具有重要的意义。边缘检测方面,前人已在这个领域进行了大量的科学研 究和探索,提出和推导了许多经典算法。虽然现在利用神经网络研究数字图像的边 缘检测有一些,但是神经网络的模型有很多,彼此模型有很大的不同,检测的效果 也各异。因此,我们认为进一步利用神经网络对数字边缘检测的算法的研究,具有 一定的价值。 1 2 边缘检测的发展概况 边缘反应了景物局部区域内特征的差别,它表示为图像信息的某种不连续性 ( 如坎度突变,纹理以及色彩的变化等) 。著名的“马赫带效应”指出“:人的视觉 对物体光度变化的部分有特殊的增强效应,即在不同光强度周围引起“过量调整”。 物体边缘特征是与图像中发生灰度跳变的部分相对应的。因此,基于狄度不连续性 特征检测的方法也就成为图像边缘提取的主要方法之一。 现有的边缘检测方法可分为两大类“:一类是基于某种固定的局部算法,如: 耍塞三些耋堕堡尘兰堡篁堡:= = = = = = = = = = 一 微分法,拟合法等,它们属于经典的边缘检测算法;另一类则是以能量最小化为准 则的全局检测方法,其特征是运用严格的数学方法对此问题进行分析,给出函数作 为最优检测的依据,从全局最优的观点提取边缘,如松弛法,神经网络分析法。 1 2 1 微分法 图像的边缘信息在频域中表现为高频分量,边缘检测的过程归根到底就是一个 高频增强的过程,因而传统的高频增强方法微分运算自然就成了提取边缘信息 的主要手段,例如:r o b e r t s 算子、s o b e l 算子、p r e w i t t 算予等就是利用微分运算 来提取边缘信息的。近十年来,利用平滑二阶微分的边缘检测算子是微分法中应用 最广泛的一类边缘检测算子。首先对图像作平滑,然后利用平滑图像的二阶微分零 交叉确定边缘位置。 1 2 2 拟合法 顾名思义,拟合法就是首先对图像进行某种形式的拟合,从而根据拟合参数求 得边缘。p r i w i t t 首先提出用曲面拟合方法作图像边缘检测,他用关于坐标的n 阶 多项式对原始图像作最j , - 乘方意义下的最佳拟合,多项式n 1 个参数有图像n n 个邻域灰度确定,从拟合的最佳曲面函数即可确定灰度梯度等参数,其实质是利用 了图像的统计特性来检测边缘,因而其计算量通常是很大;但在统计量的求取过程 中,常常得到很多的中间结果,这些结果可以直接用于以后的图像分类及景物分析 等方面,因而在一些大的视觉系统中,拟合法常常被采用的。 1 2 ,3 松弛法 首先利用简单的基于邻域的边缘检测算子对图像作初始的边缘检测,然后在利 用边缘间的空间分布关系来协调和增强初始检测结果,从而以全局最优的观点提取 边缘。这种以全局最优的观点思想是近代边缘检测技术的主要特点。1 9 7 6 年 r o s e n f e l d 首次将松弛算法引入图像处理领域,并提出了一般模型“1 。随后,不少文 献对松弛方法作了进一步的改进和发展,并将其应用到图像分割、模式识别及计算 机视觉等领域。松弛方法一般可分为离散松弛和概率松弛( 连续松弛) 两大类,而 壁塞三些堂堡堡圭堂丝垒塞:= = = = = = = = = 一 r o s e n f e l d 提出的松弛边缘检测法属于概率松弛法,其主要思想是首先根据图像梯 度运算确定每一像素的初始边缘概率和非边缘概率,然后根据邻点的边缘概率及边 缘方向确定它们之间的相容程度,通过迭代代理,使概率达到稳定,从而消除边缘 信息的模糊因素,克服噪声的影响。 1 2 4 数学形态学方法 自法国数学家m a t h e r o n 和s e r r a 等人提出数学形态学以来,在图像处理上的应 用却是近年来的事,而且也由单一地处理二值图像到处理灰度图像。数学形态学是 一门建立在集论基础上的学科。它是几何形态学分析和描述的有力工具,用于图像 处理的两种基本运算是腐蚀和膨胀,它们的不同组合形成开和闭,图像经边缘强度 算子作用后,在跳跃边缘处形成凸脊,在屋顶边缘处形成凹谷,再与原始图像作差 分得到边缘,利用形态学检测边缘,可针对具体的图像选择合适的结构元,检测出 特定的边缘“,。 1 2 5 小波分析法 时域和频域是信号分析的两大领域,傅立叶变换把信号的时域特征和频域特征 联系起来,能分别从时域和频域观察信号,但是却不能把两者结合起来。于是出现 了时窗法和频窗法,可反映频率特性随时间的变化,但是它们都存在时间和频率不 能同时具有高分辨率的缺陷,这正深刻地反映了时间和频率测量上的测不准原理。 近年来,小波分析在图像处理的各个方面都得到了应用。小波被誉为“数学显微镜”, 可以在不同的尺度上得到信号的细节。用小波变换提取边缘的思想如下:从信号处 理的角度,边缘表现为信号的奇异性,而在数学上奇异性由l i p s c h i t z 指数标志。小 波理论已经证明l i p s c h i t z 指数可由小波变换的跨尺度模值的极大值计算而来,所以 只要检测小波变换模值的极大值即可检测出边缘。利用小波的多尺度特性可以实现 在大尺度下抑制噪声,可靠地识别边缘“1 。 1 2 6 神经网络分析法 近年来,由于神经网络强大的非线性表示能力及学习功能,在模式识别等多方 塑塞三些兰堕堡圭兰堡垒塞:= = = = = = = = = = = = = = = = = := = = = 一 面取得了较多成功的应用,用神经网络提取边缘也逐步得到了应用。其基本思想是: 先将输入图像映射为某种神经网络,然后输入一定先验知识一原始边缘图,再进 行训练,直到学习过程收敛或用户满意为止。由于神经网络提取边缘利用了原图的 已有知识,是从宏观上认识对象,微观上提取细节、所以它具有比较强的抗噪能力a 边缘检测的实质是确定图像中边缘点和非边缘点的两类模式分类问题“,由于噪声 等因素的影响、单纯的基于局部灰度信息的边缘分类方法存在很大模糊性。利用景 物边缘的空间分布信息,用种种方法包括人工智能关于知识表达、自学习和推理等 手段作迸一步调整的思想已日益引起人们的重视。目前国外有很多的学者采用神经 网络的方法进行数字图像边缘检测的研究,但是尚处在试验阶段【8 】【3 6 】1 3 7 j ,用于图像 边缘检测的神经网络也有很多形式,许多人提出了许多的模型等进行边缘检测,但 真正构造模仿生物视觉系统的特征检测方法还有待进一步的研究“。 其它方法:除了上面介绍的外,还有分形理论法、自组织聚类法遗传算法、动 态规划法、矩不变边缘检测法、最小代价函数法等等p j 。 1 3 人工神经网络的研究现状与评述 人工神经网络。2 m ”( a n n a r t i f i c i a ln e u r a ln e t w o r k s ) 是指模拟人脑的结构 和功能,运用大量的处理部件,由人工方式建立起来的网络系统。显然,a n n 是在 生物神经网络的基础上建立起来的。人脑是a n n 的原型,a n n 是对脑神经系统的模 拟。a n n 是一门高度综合的交叉学科,它的研究和发展涉及神经生理科学、数理科 学、信息科学和计算机科学等众多科学领域。 5 0 年代末到6 0 年代初,神经网络在前面探索的基础上迎来了第一次研究热潮。 1 9 5 7 年,心理学家r o s e n b l a t t 设计制作了感知器试图模拟人脑的感知和学习能力, 这是最先提出的一种神经网络模型。1 9 5 9 年,w i d r o w 等提出的自适应线性元件网络, 通过训练后可用于抵消通讯中的回波和噪声,借以提高长途通信的通话质量和数据 通信的可靠性。1 9 6 2 年r o s e n b l a 在他的著作 t h ep r i n c i p l e so fn e u r o d y n a m i c s 中详细地介绍了感知器网络。虽然模型比较简单,但已经显示了神经网络的一些性 质。例如可学习性、分布式存储和连续计算等。这些性质与当时流行的冯诺依曼 型计算机的性质完全不同,因此引起了众多研究者的兴趣和关注。国外许多实验室 都展开了感知器在学习、文字识别、声音及声纳信号等方面的应用研究,并期望能 堑塞三些兰堕堡圭堂堡篁塞一 很快获得成功。 第一次研究热潮未能持续很久,自6 0 年代末至7 0 年代,神经网络的研究经历 了低潮时期。究其原因,主要是当时传统的计算机技术正处于迅速发展的阶段,并 在众多领域取得很大的成功:其次,限于当时的技术条件,用硬件直接实现网络也 是很困难的;此外,m i n s k y 等在1 9 6 9 年出版的“p e r c e p t i o n ”一书中对感知器功 能的悲观结论在当时的学术界产生了较大影响,以致使不少学者从神经网络领域 转向其它研究领域。 进入了8 0 年代,神经网络的研究开始复兴。1 9 8 2 年至1 9 8 6 年,美国物理学家 h o p f i e l d 陆续发表了几篇有影响的神经网络研究论文。他采用了全互连神经网络模 型,引入能量函数概念,成功地解决了旅行商问题( t s p ) 。1 9 8 6 年,r u m e l h a r t 和 m a r c e l o 提出了多层网络的反向传播学习算法( 即b - p 算法) 。利用该算法可以求解 感知器不能解决的问题,从而否定了m i n s k y 等人的错误结论。这些突破性的进展, 使人们再次认识到神经网络的巨大潜力。1 9 8 7 年6 月,首届国际神经网络学术会议 在美国圣地亚哥召开,与会代表有一千六百余人,会上成立了国际神经网络学会 ( i n n s ) 。1 9 8 8 年元月“神经网络”杂志创刊:1 9 8 8 年起,国际神经网络学会和i e e e 联合召开每年一次的国际学术年会;1 9 9 0 年3 月i e e e 神经网络会刊问世,各种期 刊的神经网络特刊层出不穷。关于人工神经网络理论、模型和算法方面的研究论文 大量涌现,神经网络模拟软件和实用芯片不断推出,应用领域不断扩大,标志着世 界范围内第二次神经网络研究热潮的蓬勃发展。 近几年,在许多工业化国家,纷纷成立了专门的研究机构,政府和企业投入了 大量的资金,制定和实施神经网络计划。如美国的d a r p a 计划、日本的h f s p 计划、 法国的“尤里卡”计划、德国的“欧洲防御计划”和俄罗斯的“高技术发展计划” 等。 神经网络研究热潮的出现,除了神经科学研究本身的突破外,更主要的是由于 计算机科学和人工智能发展的需要以及v l s i 技术、生物技术、超导技术和光学技 术等领域的迅速发展提供了技术上的可能性。它的应用和发展不但会推动神经动力 学本身,而且将影响新一代计算机的设计原理,有可能为新一代计算机和人工智能 开辟一条崭新的途径;同时它为学习的识别和计算提供了新的现代途径,有可能给 信息科学带来革命性的变化。 塑窒三些兰堕堡圭堂堡篁塞= = = = = = = = = = = = = = = = = 一 a n n 是模仿生物脑结构和功能的一种信息处理系统。虽然目前它的模仿还处 于低级水平,但己显示出一些与生物脑相似的特点:大规模并行结构,信息的分布 式存储和并行处理,具有良好的自适应性、自组织性和容错性,具有较强的学习、 记忆、联想、识别功能等等。神经网络已在信号处理、模式识别、目标跟踪、机器 人控制、专家系统、组合优化计算、网络管理等众多领域的应用中获得了引人注目 的成果。在我国,虽然神经网络研究起步较晚,但发展迅速,形势喜人a 1 4 人工神经网络在数字图像边缘检测中的应用概述 边缘检测属于早期视觉处理。目前用于图像边缘检测的神经网络有很多的形 式,p o g g i o 提出的正则化边缘检测模型是一个三层前馈网络,其价值函数的最小化 可用h o p f i e l d 网络来求解。l u 提出了一种多级神经网络法,对所检测的像素取5 5 邻域,用一个差分算子计算各像素梯度大小和方向,结果送入第一级网络,其目 的是根据邻域信息决定对检测结果增强或抑制,结果送入第二级w i n n e r t a k wa l l 网 络,由此选出某一个方向存在边缘可能的最大者,并送入第三级判断所选结果,最 终给出检测结果。 前面说过,边缘检测的实质是确定图像中边缘点和非边缘点的两类别模式分类 问题。神经网络技术是一种十分有效的分类识别技术,网络过程实质上是一种映射。 在神经网络训练过程中,需要对神经网络中各节点间连接的权值进行调整和修正, 训练数据所含关于类别和特征的知识体现在网络的权值上,这些权值反应了特征的 “效率”。与传统的图像边缘检测方法相比,神经网络由于其独特的大规模并行处 理、分布式信息存储、良好的自适应性和自组织性,以及很强的学习、联想和容错 功能特征,具有更强的学习功能,而且还具有记忆、选择、抽象和识别能力,以上 神经网络的优点是应用于边缘检测的重要原因。目前,利用神经网络来进行边缘检 测所采用的神经网络都是非常复杂的,例如:中国计量学院进行的边缘检测所采用 的网络模型是两种网络模型的混合模型,一种是自组织竞争神经网络模型,它的作 用为实现图像信息的压缩与编码;另外一个模型是b p 神经网络,其用于获取图像边 缘的矢量信息;还有东北大学采用的边缘检测神经网络是有采用非监督学习( a r t l ) 的自组织竞争子网络( a s c s n n ) 和采用监督学习的b p 子网络( b p s n n ) 构成。a s c s n n 用 于对边缘候选图像的二值输入模式进行聚类特征提取;b p s n n 用于获取图像的边缘 矢蹩信息。但是这种边缘梭测的网络模型比较复杂,都是采用的两种神经网络模型 组成的混合网络模涎。随繁神经网络的发展,有关神经网络应用于图像边缘检测的 醭究已经显示出了龙明的翦景,并在此豹纂础上,对享申经嬲终和图像边缘特点的深 入磷究,在冒熊取褥薪的突破,并遴一步提藏嬲络熬吝错等特性彝边缘检测的效象。 1 5 本文的主要工柞和凑容安捧 本文蘩子神经阏络的璎论,着重j l f 用传统算子产生的豳像,运甭神经网络进行 数字图像边缘检测的问题。 本文共分六章。第一部分为绪论部分,综述数字图像、边缘检测及神经网络发 展概况,指出了本文的工作。第二章介绍了神经网络中为何要采用b p 网络,并介绍 了应用非常广的b p 神经网络的基本算法。第三章详细地论述了r o b e r t s 、s o b e 算 孑等传统算子的理论以及实现驰方法,蒡对传统豹算予算法进行了一些改进。第暇 搴会绍运震b p 享孛经霹络送行数字图像熬边缘检测豹算法数及在运耀享睾经翊终黪避 程串遇戮鹊各稀闫遂;雨鬣提密了一种对边缘检测整像进行震塞评价静一种方法。 作者在第五章中给尚了根稻前面提出的运糟神经网络进行边缘检测的算法的检测结 果及质童评价的实验数据。最后,在第六章总结出了本次的设计得出的结论,并指 出了涉及桐课题相关的未来研究方向。 2 1 引言 2 神经网络模型及算法 最近几年,神经网络技术有了巨大的发展,其成果已广泛应用到图像、模式识 别等领域中。神经网络是采用物理可实现的系统来描述和模拟人脑神经网络的结构 和功能,按结构分为前馈型人工神经网络,反馈型人工神经网络,自组织竞争人工 神经网络和随机神经网络等,尽管神经网络的种类繁多但关键是网络结构和学习 算法的设计,如应用最广的非线形变换单元的b p 网络,就是把一组样本的输入输出 问题变成一个非线形优化的问题,即如果把经b p 训练的多层感知器看成一个是从输 入空间到输出空间的映射,则这个映射是高度非线性的,并且各处理单元还具有非 线性和强大的并行能力,由于它是建立在简单非线形函数复合的基础上,因而可以 表达客观世界中复杂现象。 b p 神经网络是一种前馈多层网络,由于网络的学习采用了误差反传 ( e r r o r b a c k p r o p a g a t i o n ) 的方法,是由r u m e l h a r th i n t o n ,w i l l i a m s 等人在 1 9 8 6 年提出的,简称b p 算法,用此算法的网络也称为b p 网络。由于b p 网络模型 简单,学习算法成熟,并且已成功的用于图形识别、贷款评估、预测、文本及数据 压缩等领域,成为当前广泛使用的网络模型之一,同时也是研究得最多的人工神经 网络之一。b p 网络即误差向后传播神经网络,由于能形成任意分类界面,具有很强 的模式识别和分类等优点,可以从环境中和自学习中获取信息来自动修改系统的网 络结构及其连接度,以适应知识推广和知识分类,成为模式识别中常用的神经网络 模型;其次b p 网络能够通过训练建立输入输出之间复杂的映射关系,并且b p 网络 能够根据样本学习,具有自组织性、自学习性和容错性等特性,这些特性使b p 神经 网络应用于图像的边缘检测时,可以通过大量的神经元及其连接权的分布表达特定 的图像边缘特征,通过学习获得非线性的边缘信息,使输入样本模式中的图像边缘 特征方便地存储于网络的结构和动态连接权中。因此在设计中采用的是b p 神经网 络,在算法运行过程中动态地学习个体之间的对应关系建立个体之间的合理映射。 本节重点介绍b p 模型和b p 算法。 2 2 神经网络模型介绍 b p ( b a c kp r o p a g a t i o n ) 神经网络又称为多层前馈神经网络。图( 2 1 ) 为三层 前馈神经网络的拓扑结构,这种神经网络模型的特点是:各层神经元仅与相邻层神 经元之间有连接;各层内神经元之间无任何连接:各层神经元之间无反馈连接。输 入信号先向前传播到中间层结点,经过变换函数之后,把中间层结点的输出信息传 播到输出结点,再给出输出结果。结点的变换函数通常选取s i g m o i d 型函数。 b p 神经网络的输入与输出关系是一个高度非线性映射关系,如果输入结点数为 n ,输出结点数为m ,则网络是从n 维欧氏空间到m 维欧氏空间的映射。通过调整b p 神经网络中的连接权值以及网络的规模( 包括n ,m 和中间层结点数) ,可以实现非 线性分类等问题,并且可以以任意精度逼近任何非线性函数。在确定了b p 网络的结 构后,利用输入输出样本集对其进行训练,也即对网络的权值和阈值进行学习和调 整,以使网络实现给定的输入输出映射关系。经过训练的b p 网络,对于不是样本集 中的输入也能给出合适的输出,这种性质称为泛化( g e n e r a l i z a t i o n ) 功能。从函数 拟合的角度看,这说明b p 网络具有插值功能。 2 3b p 网络的学习规则与计算方法 b p 神经网络结构,如图2 - 1 所示: n 个单元 p 个单元q 个单元 辕入层 中间层输出层 图2 1 多层前馈网络示意图 川如 堕塞三些耋堡堡圭矍堡篁塞:= = = = = = = = = = = = = = = 一 这是一个三层b p 网络,一般来讲,b p 网络是一种具有三层或三层以上的多层 神经元网络,输入层和中间层之间、中间层和输出层之问各个神经元实现全连接, 即输入层的每一个神经元与中问层的每个神经元都有连接,中间层的每一个神经元 与输出层的每个神经元都有连接,而上下层各神经元之间无连接。b p 网络按有导师 学习方式进行训练,当一对学习模式提供给网络后,其神经元的激活值将从输入层 经中间层向输出层传播,在输出层的各神经元输出对应于输入模式的网络响应。然 后,按减少期望输出与实际输出误差的原则,从输出层经中间层、最后回到输入层 逐层修正各连接权。由于这种修正过程是从输出到输入逐层进行的,所以称它为“误 差反向传播算法”。随着这种误差反向传播训练的不断进行,网络对输入模式响应的 正确率也不断提高。 由于b p 网有处于中间位置的中间层,并有相应的学习规则可循,可训练这种 网络,使其具有对非线性模式的识别能力:特别是它的数学意义明确、步骤分明的 学习算法;而且,b p 神经网络虽然只是具有三层的网络结构,但是它可以对任意函 数进行拟合,近似任意的连续非线性函数,使其具有某种函数的功能,更使其具有 广泛的应用前景。 2 3 1 b p 神经网络的学习训练过程 b p 网络的学习过程主要是由四部分组成: ( 1 ) 输入模式顺传播( 输入模式由输入层经中间层向输出层传播计算) , ( 2 ) 输出误差反向传播( 输出的误差由输出层经中间层传向输入层) , ( 3 ) 循环记忆训练( 模式顺传播与误差反向传播反复交替循环进行) , ( 4 ) 学习结果判别( 判定全局误差是否趋向极小值或者是否达到训练次数) 为了方便,首先把网络的变量设置如下: 输入模式向量4 = 【口,口:,口:】: 希望输出向量k = 【j ,y :,y :】: 中间层各单元输入激活值向量墨= 【s :,s :,”,s :】; 中间层各单元输出向量曰= 瞄,鹾,醚1 : 输出层各单元输入激活值向量厶= 吁,:,相: 输出实际值向量c 。= 【c :,c :,c :】; 输入层至中间层的连接权彬,: 中间层至输出层的连接权圪; 中间层各单元的阙值只; 输出层各单元的阈值j ,。; 其中:i = l ,2 ,1 3 ;j = l ,2 ,p ;t = l ,2 ,q ;k = l ,2 ,m 下面分别介绍和分析这四个过程: ( 1 ) 输入模式顺传播 这一过程主要是利用输入模式求出所对应的实际输出。 根据m p 神经元模型原理,计算中间层各神经元的激活值: q = 懈一q 激活函数采用s 型函数,即 f ( x ) = 丽1 ( 2 2 ) 这里之所以选s 型函数作为b p 网络神经元的激活函数是因为它是连续可微的 而且更接近于生物神经元的信号输出形式。 将上面的激活值代入激活函数中可得中间层j 单元的激活值为 b j = f ( s j ) = 1 + e x p ( 一q + 巳) i = 1 阈值在学习过程中和权值样也不断地修正。可求得输出端的激活值和输出值 设输出层第t 个单元的激活值为。则 = 屯- y , ( 2 4 ) j = l 设输出层第t 个单元的实际输出值c 。则 c ,= f ( 1 。)( 2 5 ) 利用以上各式就可以计算出一个输入模式的顺传播过程。 ( 2 ) 输出误差的反向传播 在第一步的模式顺传播计算中,得到了网络的实际输出值,当这些实际的输出 值与希望的输出值不一样时或者说其误差大于所限定的数值时( 如图所示) ,就要对 网络进行校正。这里的校正是从后向前进行的,所以叫误差反向传播,计算时是从 输出层到中间层,再从中间层到输入层( 如图所示) 。 一0 2 0 9 一o 6 0 5 _ o 8 输入模式 网络响应 图2 2 按误差进行逆传播计算 o ,5 0 5 0 5 to 5 j 希望输出 输出层的校正误差为: 彬= 一0 驴似)( t = 1 ,2 ,pk = 1 ,2 ,m ) ( 2 6 ) 中i 司层各单兀的校正误差为: ,、 e 矧钟肌;) ( j = 1 ,2 ,pk _ l 怎,m ) ( 2 7 ) 在这里,每一个中间单元的校正误差都是由q 个输出层单元校正误差传递而产 生的。当校正误差求得后,则可利用钟和p :沿反方向逐层调整输出层至中间层, 中间层至输入层的权值。 对于输出层至中间层连接权和输出层阈值的校正量为: = 口d ? b :( 2 8 ) 以= 口( 2 9 ) 其中: 输出层的校正误差。( j = 1 ,2 ,pt = l ,2 q k = l ,2 ,mo 口 1 ) 中间层至输入层的校正量为: = p p :口: ( 2 l o ) q = p p : ( 2 1 1 ) 式中:p 中间层j 单元的校正误差。( i 2 l ,2 ,no p - j i l l l 练。直至学习回数大于预先设定的 数值或者网络全局误差函数小于预先设定的值。 ( 1 0 ) 学习结束。 在以上的学习步骤中, ( 3 ) 一( 6 ) 为输入学习模式的“顺传播过程”: ( 7 ) 一( 9 ) 为阿络误差的“反向传播过程”和完成学习训练过程。b p 网络学习过程框图 和计算步骤如附录a 所示: 3 1 边缘的分类 3 传统算子算法 利用计算机进行图像处理有两个目的:一是产生更适合人观察和识别的图像; 二是希望能由计算机自动识别和理解图像。无论为了哪种目的,图像处理中最关键 的一步就是对包含有大量各式各样景物信息的图像进行分解。分解的最终结果是图 像被分解成一些具有某种特征的最小成分,称为图像的基元。相对于整幅图像来说, 这种基元更容易被快速处理”“。 图像的特征指图像场中可用作标志的属性。它可以分为图像的统计特征和图像 的视觉特征两类。图像的统计特征是指人定义的特征,通过变换才能得到,如图像 的直方图、矩、频谱等等;图像的视觉特征是指人的视觉可以直接感受到的自然特 征,如区域的亮度、纹理和轮廓等。利用这两类特征把图像分解成一系列有意义的 目标或区域的过程称为图像的分割。 图像的边缘是图像的最基本特征。所谓边缘( 或边沿) 是指其周围像素灰度有阶 跃变化或屋顶变化的那些像素的集合。边缘广泛存在于物体与背景之间、物体与物 体之间、基元与基元之间。因此,它是图像分割所依赖的重要特征。图像的边缘, 对应着图像强度产生突变、不连续的地方,体现了重要的景物结构,往往还携带了 - - n 图像的重要信息。在图像分析的初始阶段,大量的处理是涉及如何检测这类不 连续的;并且,图像中物体边界附近总存在灰度或纹理的变化,这种变化是一个物 体区间向另一个物体区间( 即所说的边缘) 所造成的。它具有能勾划出区域的形状, 能够被局部定义以及能传递大部分图像信息等优点;图像的边缘信息无论对人类或 机器来说都是非常重要的【4 ”。因此,边缘检测可以看作是处理许多复杂问题的关键, 也是图像预处理中的一个必要过程 4 0 l 。 物体的边缘是灰度不连续性所反映的。经典传统的边缘提取方法是考虑图像的 每个像素在某个邻域内灰度的变化,利用边缘邻近一阶和二阶方向导数变化规律检 测边缘。这个方法称为传统的边缘检测算子算法。 边缘的种类可以分为两种:其一是阶跃性边缘,它两边像素的灰度值有显著的 不同。其二是屋顶状边缘,它位于灰度值从增加到减少地变化转折点( 如图3 - 1 所示) 。 其中( a ) ( b ) ( c ) 分别是阶跃边缘点灰度变化曲线和一、二阶导数,( d ) ( e ) ( f ) 是屋顶状 边缘点左右灰度变化曲线和一、二阶导数。 y ( a 0 y ( b 0 y ( c o - i - ,( 而少 r 一1 y ( d o y “ 0 1 月力 爪。 。 一 八 图3 一l 两种边缘点和边缘旁图像 灰度方向的导数变化规律 x x x 如果一个像素落在图像中某一个物体的边界上,那么它的邻域将称为一个灰度 级的变化带。对这种变化最有用的两个特征是灰度的变化率和方向,它们分别以梯 度向量的幅度和方向来表示。边缘检测算子检查每个像素的邻域并对灰度变化率进 行量化,也包括方向的确定。绝大多数传统算子算法使用基于方向导数掩模求卷积 堑塞三些童堕堡圭耋堡篁塞 的方法。 3 2 传统算子 3 2 1 梯度模算子m 6 1 对于图像,在特征区域边界处,灰度要发生很大的变化,如果以灰度作为边界 检测的依据,可以运用微分的方法提取边界,微分的输出值作为该边界的强度。在 此基础上,可确定其是否为边界点,将边界点连接起来就形成边界。 设厂( x ,y ) 是可微函数,_ o f 、学分别给出了灰度厂在。、y 方向上的变化率, o x们 而方向a 上的变化率为: 要:o 。fc o s q + 罢s i r i 口 ( 3 1 ) a 口苏乱 ” 偏导数算子4 = 夏是一个线性算子,不同的q ( k - 1 ,2 ,) 的线性组合, d 。= 【厂g ,j ,) 】只和点g ,y ) 处的厂值及其邻域的厂有关,而与坐标无关,因此是位移 不便的。由于待检测的边界可能是任意走向的,因此希望所构造的微分算子是各向 同性的。 对于数字图像,应用差分代替相应的微分。一阶差分为: a ,厂( f ,_ ,) = f ( i ,) 一,( f l ,j )( 3 2 ) a ,厂( f ,j ) = f ( i ,) 一,( f ,_ ,一1 )( 3 3 ) a 。厂( f ,) = a 。,( f ,j ) c o s t z + a ,厂( f ,y ) s i n a( 3 4 ) 我们知道,函数的梯度g 给出了方向导数取最大值的方向: 口= a r c 觚i l 望a y 篆l ( 。s ) 叙j ”“7 而这个方向的方向导数等于梯度的模 i g i :f ( 要 2 + ( 考 2 1 必= g 陟c y ,】 c 。e , 式中,g 表示梯度模算子。g l 厂( x ,y ) 】不依赖于坐标轴的取向,即f ( x ,y ) 在点( f ,) 处 任意两个垂直方向上变化率的平方和都相同,表明它具有各向同性。因此,可以把 梯度模作为边界检测算子,梯度的模给出了边界强度,梯度指向给出了边界的方向。 对于数字图象,梯度模及方向为: g 【厂( 石,y ) i = i a ,f ( i ,别+ 卜f ( i ,刮 ( 3 7 ) g 驴( w ) 】= m a 5 ,f ( i ,州一b f ( i ,) j ( 3 8 ) g l ,( y ) 】= m a x 8 f ( i ,州一i f ( m , 0 1 】 ( 3 9 ) 其中:( m ,n ) 是( i ,j ) 的邻点。 以上各式中的偏导数需对每个像素位置计算,在实际中常用小区域模板进行卷 积来近似计算。对q 和g y 须各用一个模板,所以需要两个模板组合起来以构成一 个梯度算子。根据模板的大小和元素( 系数) 值的不同,提出了许多不同的算子。 3 2 2r o b e r t s 算子 r o b e r t s 算子是一种利用局部差分算子寻找边缘的算子。计算沿4 5 。方向的阶 差分,图像的梯度为两个4 5 0 方向梯度向量和,直接计算图像差分,不包含平滑, 故不能抑制噪声,对具有陡峭的低噪声图像响应较好。 由下式给出: g ( x ,y ) :蝻一了彳;j 1 :歹j 面f + l 了i 而一7 i 丽】z ”( 3 1 0 ) 其中f ( x ,y ) 是具有整数像素坐标的输入图像,平方根运算使该运算处理类似于在人 的视觉系统中发生的过程。 由于在计算机中,图像是基于像素存储的,是以离散的形式存储的。则梯度表 示的形式为: g l 厂( x ,y ) 】= l ,( f ,) 一f ( i + 1 ,j + 1 ) i + i f ( i + i ,) 一,( f ,+ 1 ) l ( 3 1 1 ) g 驴( ,y ) 】:m a ) ( 0 厂( f ,) 一f ( i + 1 ,+ 1 ) 妙( f + 1 ,_ ,) 一f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论