




已阅读5页,还剩72页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
工业现场字符识剐方法的研究 摘要 l 字符谖别技术楚稻祝器视觉逶行模式量爻麓的羹簧醑究方蠢之一。随着甏健笺 产融爨动毒 :程发越来越裹,谗多生产线上对产黯振号或编玛掌镱豹梭骏嚣要通过 枫器遴行窦动识裂。出于王、韭凌场强壤恶劣,光照不甥,蛰遴j 蓬程中产蒹霹糍发 生移动,诸多不剥因豢会融起赝拍摄熬图像失真、模糊、禽噪以及使字符产生缨 敖、乎移魏缝转的愦援。罗本文痒者主蘩擞了以下凡方嚣硬究工薅_ 势耀m a t t a b 谖 言对棚应算法进行实现:( 1 ) 对图像进行了前期预处理;( 2 ) 提出了种基于大 浮竣麴图像分块二值傀方法,实验诞明该方法对光照不均和模糊图像的二僵化效 果比较好;( 3 ) 对于字符特征的抽取,本文重点研究了理论上对旋转具有不变性 的矩特征,对字符进行归一纯后最终选择蹴i 8 个z e r n i k e 矩作为字符特征,另 外述提取了字符的网格特征进行研究;( 4 ) 针对两种字符特征,用改进的b p 算法 设计了三个神经网络谈鄹系统;( 5 ) 对采集蓟的车输字符避行设莉实验,实验表 明了网格特征与神经阅络稽结合具有较好的椒盐类噪声容锚性,z e r n i k e 矩特 正 与聿牵经网络褶结合其裔较好熬疑转不变性,撼两个特徭糖结合霞雳设诗的一个两 缀神经网络分类器率缀集成识澍系统对车轮字符识剐祥本的正确识稍率达9 8 。 本课题蹙裂安徽省卡玉竣关瑷瓣特殊互嚣异形整嚣在线检测系统戆资韵。 关键涸字符识囊二缎化特征$ 灏7b p 黟潺“”识i 嘭 基 t h er e s e a r c ho nc h a r a c t e rr e c o g n i t i o nt e c h n i q u e i nt h e f i e i d w o r ko fi n d u s t r y a b s t r a c t t h ec h a r a c t e rr e c o g n i t i o nt e c h n i q u ei so n eo ft h e m o s ti m p o r t a n tr e s e a r c h d i r e c t i o n si n t h ef i e l do f p a t t e r nr e c o g n i t i o nb y m a c h i n ev i s i o n w i t ht h e i m p r o v e m e n to fa u t o m a t i c l e v e li nm o d e r np r o d u c t i o n ,m a n yc h a r a c t e rs i g n so f p r o d u c t sn e e d t ob er e c o g n i z e do n l i n eb ym a c h i n ea u t o m a t i c a l l y i nt h ef i e l d w o r k o fi n d u s t r y , m a n yd i s a d v a n t a g e s ,s u c ha sa b o m i n a b l ee n v i r o n m e n t ,u n b a l a n c i n g i l l u m i n a t i o n ,d i s p l a c e m e n to fc a r r i e dp r o d u c t s ,e t c ,w i l l c a u s et h a tt h eo b t a i n e d i m a g e sa r ef u z z y ,n o i s yo rw i l lb r i n gc h a r a c t e r si n t os c a l i n g ,s h i f ta n dr o t a t i o n w h a t t h ea u t h o rh a ss t u d i e da n dr e a l i z e db ym a t l a bp r o g r a m m em a i n l ya r ea sf o l l o w s :( 1 ) t h ep r e p r o c e s s i n gf o ri m a g e ;( 2 ) p r e s e n t i n gan o v e lb i n a r i z a t i o nm e t h o db a s e do n i m a g ep a r t i t i o nd e r i v e df r o md a j i n g e x p e r i m e n t sh a sd e m o n s t r a t e dt h a tt h ef u z z y i m a g e w i t h u n b a l a n c i n gi l l u m i n a t i o nc o u l d b eb i n a r i z e dp e r f e c t l yb yt h i sm e t h o d ( 3 ) f e a t u r ee x t r a c t i o n t h i s p a p e rm a i n l y s t u d i e dt h em o m e n tf e a t u r e sw h i c ha r e i n v a r i a n tt or o t a t i o ni n t h e o r y a f t e rn o r m a l i z i n g t oc h a r a c t e r sw es e l e c t e d18 z e m i k em o m e n t sa sf e a t u r e f i n a l l y o t h e r w i s e t h e g r i d d i n g f e a t u r ew a sa l s o e x t r a c t e d ;( 4 ) d e s i g n i n gt h r e en e u r a ln e t w o r k ( n n ) r e c o g n i t i o ns y s t e m su s i n gt h e m o d i f i e db pl e a r n i n g a l g o r i t h m f o rt w of e a t u r e s ;( 5 ) u s i n gt h r e e s y s t e m s t o r e c o g n i z et h ec h a r a c t e r sf r o mt h et r a i n w h e e l t h ee x p e r i m e n t sd e m o n s t r a t e dt h a tt h e g r i d d i n gf e a t u r en e t w o r kh a sag o o da b i l i t yo fr o b u s t f o rs a l t & p e p p e rn o i s e ;t h e z e m i k em o m e n t sn e t w o r kc a nb e e m p l o y e ds u c c e s s f u l l y f o rr o t a t i o n i n v a r i a n t c h a r a c t e r s c o m b i n i n gt w o f e a t u r e sf o rt w o - l e v e ln nc l a s s i f i e r st o r e c o g n i z e c h a r a c t e rc a no b t a i nt h ec o r r e c tr e c o g n i t i o nr a t eo f9 8 t h i sp r o j e c ti ss u p p o r t e db yt h es c i e n c e & t e c h n o l o g yr e s e a r c hf o u n d a t i o no f a n h u ip r o v i n c e : k e y w o r d s :c h a r a c t e rr e c o g n i t i o nb i n a r i z a t i o nf e a t u r ee x t r a c t i o n b pn e t w o r k r e c o g n i t i o n r a t e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作放取得的研究 成聚。据我所知,除了文中特别加强标注和致谢的地方外,论文中不龟含其他人已 经发袭或撰写过的研究成果,也不包含为获得 佥她王些太堂 或其他教肖机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明井表示谢意。 学经论文作者签名: 承3 签字医掰溯年妒f f 瞄 学位论文版权使用授权书 本学位论文作者完全了解盒鲤王些盍激有关保留、使用学位论文的规定, 有数保窭著超国家寄关部门或扭秘邀交论文匏复印仔秘磁纛,克许论文鼓鸯澳稳 借阅a 本人授权盒8 b 王些太堂可以将学位论文的全部或部分内容编入有关数据 痒进行检索,鞋袋强影露、缡印藏拓接等复裁零莰保存、汇编孥证论文。 ( 保密的学位论文在解密后适用本授权书) 学垃论文谵翥徽:套) 导j | l ;签名 签字魏期:拓哆年争麓f f 墨 签字基絮:2 啦3 年争胃;炉 学位论文作者毕业聪去向: 三竺量谴:四帅奄涉毋疙静钆 通讯地址: 电话 邮编 致谢 本论文是在恩师邓善熙教授与吕国强教授的悉心指导下完成的,在攻读硕士 学位期间,他们在课程学习、研究和论文撰写阶段都给了我极大的指导与帮助, 使我能够j i l 曛n 地完成所研究的课题;在学习上对我循循菩诱、不厌其烦;工作上 对我严加要求,一丝不苟;生活上对我百般关心、爱护。邓老师与吕老师对科学 研究敏锐的洞察力、清晰的科研思路、丰富的实践经验、严谨的治学作风以及胸 怀豁达的学者风范令我永远难忘,并将受益终生。在此,向邓老师与吕老师表示 我最忠心的感谢,并致以深深的敬意。 感谢邓善熙教授、吕国强教授、杨永跃副教授和丁兴号博士在我课题研究中 提供的热情帮助以及对论文撰写的良好建议;在检测技术研究所学习的三年中, 还得到了所里其他老师的指导与帮助,以及周涛、于厚云、杨家强、蔡晴等同学 和好友的鼓励与帮助,在此一并表示感谢:同时感谢研究所里提供的良好学习气 氛和生活环境。 此外,还要深深感谢我的先生叶开军以及我的父母,是他们在经济上、生活 上和精神上给了我莫大的支持与鼓励,使我能够安心学习,顺利完成硕士学业。 谨以此文献给所有关心、帮助过我的家人、老师和朋友们! 第一章窿言 l 。l 谍逶研究的舀酶和意义 光学字符识别( o p t i c a lc h a r a c t e rr e c o g n i t i o n - - o c r ) 愚机器视馓( 也称 计算机谠觉或图象分褥鸟理解等) 研究的一个薰要分支。由于工业现场的环境缭 构、照明等因素可以得到严格的控制,机器视觉在工业生产和装配中得到了成功 静应躅,鲡霹生产线上戆零锌谈瘸与定穰,对产赫匏表露形获遴行缺陷检验等诸 多方面。其中很多情况下都需要对字符进行识别,例如,许多微小电子元器件、 集成电鼹叛、一些大型王舞( 魏零瀑嚣疆究蛰霹熬火车轮) 上懿骞字慧栋号或缡 码,如果用人眼对这些字符进行观察识别,一是不能满足生产自动化的要求,二 是壹予掌籍在王孛上鲍经墨缀多涎犊都不便予入鼹褒察( 觅强1 1 ) ,鬟不能遴 行正确识别了。 图1 1 需要识别字符的工业现场 除了在工业现场霈要机器对字符遴芎亍自动识别,在其它谗多方面也罴瘦用字德识 掰技术。如对文件进行囱动分检,对情报、图书等进行自动检索,可大大减轻各 相关部门工作人员的劳动;当前研究比较热门的车牌识别系统、信件分检系统、 对手写字体斡自动识剐系统等均薯经应丽于实际生活中;其它,在银行姚务如票 据识别、法律事件与教育等方面也有非常广泛、非常宽的应用。字符识剐技术已 经是模式谖饔中个穰鬟要酌磺究方商瑟盈有羲广泛的藏霜前景,因瑟,我们选 择本课题进行研究,目的在于通道对从某钢铁厂火车轮生产现场采集的车轮字符 拣号嚣浚孳亍字簿谈聚方法翡磷究,筏瑙一耱在疆滋环境恶劣及枣子工俸稔置偏差 而使字符发生平移、旋转的情况下仍然能够很好地识别字符的方法,并使该方法 在解决其它类似的字符识别问题时具有一定的参考性。 1 2 字符识别技术简介及国内外的概况”0 l 字符识别属于图像模式识别的范畴,对于一个字符识别系统,可以用以下三 方面的指标表征系统的性能: 正确识别率:a = 正确识别样本数全部样本数1 0 0 错误识别率:s = 误识样本数全部样本数1 0 0 拒识率:r = 拒识样本数全部样本数x1 0 0 三者的关系是:a + s + r = 1 0 0 研究o c r 最重要的任务就是如何提高正确识别率,降低误识率与拒识率。一个字 符识别系统通常包括以下几个部分:图像采集、图像输入、图像前期预处理、字 符分割、字符特征抽取、分类器分类识别与结果输出。 1 2 1 字符识别技术的分类” 字符识别可以从不同角度进行分类,目前主要基于以下两种途径进行分类: 1 ) 基于字体和联机状态进行分类: 字符识别技术可分为印刷体字符识别和手写体字符识别两大类,后者又可分 为联机( o n 一1 i n e ) 字符识别和脱机( o f f l iv i e ) 字符识别。一般认为,联机识别较 脱机识别相对容易些。 2 ) 基于特征抽取和分类器的设计方法进行分类: 目前,主要有四种字符识别方法,它们是结构识别方法、统计识别方法、统 计与结构相结合的识别方法和神经网络识别方法。在o c r 发展初期,研究者将精 力主要集中在如何准确地抽取基元、轮廓、特征点等能够反映字符结构信息的特 征上,并且在假设这些特征已经比较准确地抽取完毕的前提下,研究各种匹配算 法。然而,单纯采用结构模式识别方法的字符识别系统,识别率较低,这就促使 人们将目光转向了统计模式识别方法。与结构法相比,统计法具有良好的抗噪声、 抗干扰的性能,其鲁棒性主要体现在统计特征的抽取和模式匹配方法上。根据抽 取特征的不同,可以选用不同的匹配方法,常用的统计匹配方法有模板匹配、相 关匹配等,常用的距离度量有欧氏距离、马氏距离等。统计与结构相结合的识别 方法包括两个方面:特征的结合和识别方法的结合。人工神经网络方法用于字符 识别的研究主要包括两个方面:a ) 神经网络用于特征抽取与选择:通常直接将字 符点阵信息送入网络进行学习训练,由网络抽取得到的特征不具有明显的物理含 义。b ) 神经网络用于学习训练及分类器的设计:这是目前人1 5 十经网络在字符识 别领域的主要研究方向,也是最为成功的应用。 1 2 2 当前的字符识别技术研究热点及国内外概况 当懿瓣字籀识别技术磅究主簧毒以下是个热点: 1 ) = 值化殿字符分割方法 无论罴嬲褪秘字符识别方法,题蔻熬研究j c 童象绝大部分都是对予单个字德嚣 言的,因此,对于采集到的含有多个字符的图像要经过一系列的前期预处理,把 单个字符分割出来。除了真接用图像的灰度德 乍为特锺,其窀特征的接取大多是 针对灰度二值化后的图像避行,二德化的效果直接影响到后期的识别效栗。目前 用得最多的二值化方法主要商基于门限化的方法、基于边缘梭测的方法、基于形 态学区域增长的图像分割法、基于人工神经网络的方法等。如文献 1 s 】 3 9 】中介 绍了各种方法的实际应用并针对不同图像获得较好的二值化效果。至于把单个字 符镯韵密来粥多数情况要裉精所处臻的舀像特征,鲡嚣在研究较多的车牌字褥切 割问题,多熄先找到车牌的边缘,荐通过车牌的先验知识用投影的方法进行分割 汪8 l | 4 l | l ”】【4 3 1 。有的文簸提出运愆区域囊长算法釉连逶褥毪壹接撼字符二毽佬并觚背 景中提取出来【2 9 3 ”,这种方法可以不考虑先验知识,具有一定的通用性,但计算 过程稳当费辩。 2 ) 特征的摄取与分拼 憋薤捶取是模式识裂豹一个重要嚣苓,搀数稳定曼有效豹黪缝是谖别系统戒功 的关键。除了神经网络的方法,结构特征和统计特征都反映了字符的物理特性。 如今对结构特征的碳究主要集中在斌不同的方法来挞取鸯絮 “j ,提取宽度与褰 度,分析交叉点町等能够反映字符拓扑结构的特征点与线。用得更多的是统计特 征,如字符的投影特征1 4 3 】,轮廓特征删5 l 5 2 ”,矩特征删5 6 卿驯,尤其对于 矩特征的研究已经从一些经碘的矩运算发展至u 针对字符改进的矩运算,如文献 5 6 探索了一种对随机噪声不敏感的矩运算。有的时候人们把多种特征综念起来使用 以蘩这至g 特饺互补的效果。 3 ) 分类器的选择与设计 在荦赣静字符t 瑟剐磷究中大多是餍横板匿醚的方法来完成分类,该方法对嗓声 非常敏感。随着神经网络研究的快速进步,目前,神经网络用于分类是模式识别 研究领装豹一大热点,其孛,耢究重杰主要集中在各耱两络岛字符特,镬结舍傻精 及寻找更优化的算法1 6 2 1 ”】【6 4 艄忡1 1 6 7 删f ,4 l 【7 ”。 1 b 研究中需要解决的问题 1 ) 现场于扰 因为工业现场环境恶劣,外界干扰较大,可能有大幅度的震动,或者杂质覆箍 工彳孛袭面等情况,这照影响都会造成艨糖摄的凌像失囊,我嬲霉要解决在一定噪 声和模糊范阐内能够征确识剃字符标号或编码。 一 2 ) 图像位置的不确定性 由于工件在传送过程中可能发生位置移动,或在旋转过程中采集图像,这些都 会造成被测件与摄像镜头的相对位置不确定,使所获得的图像发生偏转或平移。 3 ) 速度带来的影响 工业现场识别字符存在速度带来的问题。一、由于被测件是在运动过程中被拍 摄,所采集到的图像可能会失真或带噪声;二、如果生产流水线上的工件运动速 度较快,则需要识别系统的处理速度快。 1 4 本论文研究的主要内容 本课题需要解决在上述工业现场情况下对字符进行识别的问题,包括对字符识 别技术进行理论研究和实验验证,本论文完成了以下主要工作: 1 ) 对数字图像处理技术的常用算法进行了软件实现; 2 ) 对灰度图像二值化的方法进行研究,提出了一种以大津法为基础的分块二值化 方法,该方法对光照不均匀或模糊图像的分割效果较好,可适用于一般情况。 3 ) 通过对字符进行归化并对z e r n i k e 矩特征进行研究与选择,解决了字符的平 移、缩放及旋转问题; 4 ) 鉴于神经网络具有良好的抗噪、容错能力,选择b p 神经网络作为分类器并对 其算法进行了改进,提高了网络的收敛速度并克服局部最优的缺点; 5 ) 针对字符的网格特征与矩特征设计了两个神经网络识别系统和一个两级神经网 络分类器串级集成识别系统; 5 ) 利用上述理论成果对工件( 火车轮) 的标号进行识别应用。 第二章模式识别理论及应用 字符识别技术属予模式识别的范畴,故本章宠介绍摸式识别的基本理论及其 主要应用领域,在此基础上概述了神经网络模式识别技术。 2 1 模式谈剐技术鹩基本理论 * 1 1 2 1 模式识别是信号处理与人工智能的一个藏要分支。人工智能是专门研究用机 器入模撅入酶动彳乍、感觉和憨维过程与规律静- f - j 科学,蔼模式谖鬃凳l 是剩焉诗 算机专门对物理量及其变化过程进行描述与分类,通常用来对图像、文字、相片 淡及磐音等铵怠进符处理、分类和谈喇。它鬣宝予2 0 嫠纪2 0 年代,隧着4 0 零代 计算机的出现,5 0 年代人工错能的兴起,模式识别在6 0 年代初迅速发展为一门科 学。它掰骚突戆理谂秘方法农缀多秘掌察技本镶域孛褥舅了广泛豹重撬与应援, 推动了人工镏能系统的发展,扩大了计算机应用的可能性。我们在生活中时时刻 刻都在进行骥式识别,如识物辨声辩爨等行梵均属予模式识别熬范骧,诗算橡窭 现后,人们众图用计算机来实现人或动物所嶷备的模式识别能力。当前主要是模 拟人的视觉能力、踞觉能力秘嗅觉能力,熟现在疆究魄较热 j 弱国攘议嬲技术黟 语音识别技术,这些技术已被广泛应用于军事与民用工业中。模式识剐的理论和 方法还广泛皮用于工她控制系统、地质地理、气象、化工、环境、生物医学等领 域中去。 2 1 1 模式谈稍的萋本概念鸯系统戆褐 广义上说,模式( p a t t e r n ) 是供模仿用的完美无缺的标本,通常,我们把通 过对黧体静个稍事耱遴行蕊察掰得到瓣具有辩闻和空间分布的信息稔之为模式; 而把模式所属的类别或同一类中模式的总体称为模式类。模式识别( p a t t e r n r e c o g n i t i o n ) 篾萃蘧滋,载楚愁一释磷究对象,撮蕹它瓣菜些萼等钲逡嚣浚麓著分类 的- i - 1 综合 生新兴技术,其作用和目的就在于词对某一具体事物时将其正确地归 入芸一类别。 模式识别系统主要由4 个部分组成:数据获取,预处理,特征提取和选择, 分类决策,如图2 。1 耩示。 为了使计算机能够对各种现象进行分类识别,要用计算机可以运辣的符号米 表示髓研究的对象。邋常输入对象弱售息寿下捌3 静类型: ( 1 ) 二维黼像。如文字、指纹、地图、照片这类对象。 ( 2 ) 一维波形。如心电图、脑电圈、震动波形等。 ( 3 ) 物理参量和逻辑值。 训练过程 照2 。l模式识爨蓉绞的基本擒成 通过测霪、莱榉和量偬,可以月矩阵藏向量表示二维强像或一维波形。这藏是数 据获取的过程。预处理的目的是去除嗓声,加强有用的信息,并对输入测量仪器 或其它因素所避成的遐化现象进行复滕,通常蹋的方法恁括消除稳态分爨、榉本 数据平滑及幅度归一亿。由图像或波形获取的数据量怒相当大的,为了有效地实 现分类识别,就要对原始数据进行变换,褥到最能反映分类本质的特征。一般我 们把舔始数据组成的空闽嘲徽测量空间,把分类识别赖以进行的空间口q 做特征警 间,通过变换,可以把在维数较高的测疑空间哼l 表示的模式变为在维数较低的特 锺空淄审表示豹模式,这就是将征的穗取和选择过程。分类决策就是在特征空间 中用所设计的分类器把被识别对象归为某一类别。基本做法是磁样本训练基础上 确定菜个叛决艉爨,经按这秘潮决鬟噩l j 对被谖对象进行分类耩遮成豹错误识嗣率 最小或引起的损失最小。 2 1 2 模式识剐方法及分类 铮对模式特援戆不霜选择及其判剃凌策方法瓣不裁,模式谈裂方法大致哥潋 分为五炎,即统计决策法、句法结构法、模糊判决法、逻辑特征法和人工智能法。 2 1 2 1 统计决策法 统计决策法建立在概率论与数理统计基础上。它撮姆短囱爨搓述模炎,不爨 模式蠲不同条件概率分布表示,然后判决未知模式属于哪一种分布。此方法比较 成熟,能考虑干扰、噪声等的影响,识别模式基元能力强,但对结构复杂的摸式 摘取特征困难;不能爱浃模式的结梅特征,难戳描述模式豹性质;难以从整体角 度考虑识别问题。统计模式识别方法可分为以下不同类测: a ) 整督分类和菲箍餐分类。惹已知所藕獒剐静学习样本( 稍练集) 或已知先验概率 的学习样本去训练分类器,确定分类判别函数,然后用这个分类器对待识样本 逶零亍分类谖嶷,这静方法称为箍督分类,或霄教瘫分炎。常蘑的如受时斯决策 法、非参数统计法、几何分类法。有必识别问题,并未给出训练集或先验知识, 仅绘蝰一攫您谖对象,列熹l 要投据各特征彝璧之润熬鞭离分散情琵予激聚类, 这种方法称为非监督分类,或无教师分类。常用的如聚类分析法、非监督参数 6 统计法。 b ) 参数方法和非参数方法。当模式样本的类概率密度函数形式已知,而确切的函 数参数未知,或从训练集只能估计出类概率密度的近似形式,这时,就需要根 据已知样本,对概率密度的参数进行估计,这种方法称为参数方法,如最大似 然估计和贝叶斯估计方法。 2 1 2 2 句法结构法 句法结构法的理论基础是形式语言。它把模式分解为较简单的子模式,再分 解为最简单的子模式( 称为“基元”) ,并将基元进行组合和相互关联,即可以 用符号串、树、图来描述模式。同一类模式用一种句法规则表示被识符号串之间 的联系,然后判别未知模式属于哪一种句法规则,从而实现分类。这种利用语言 学中的文法句法知识来作模式的结构分析或分类的方法称为结构方法。该方法具 有统计模式识别方法所缺乏的结构处理能力,识别方便,可从简单的基元开始, 由简至繁:能反映模式的结构特征,能描述模式的性质,对图像畸变的抗干扰能 力较强,但当存在干扰及噪声时,抽取基元困难,且易失误。 2 1 2 3 模糊判决法 模糊判决法是在上述两种方法中引入模糊数学形成的判决法。模糊模式分类 有两个原则,一是隶属原则,指在模式识别时直接由计算样本的隶属度来判断其 归属的方法:二是择近原则,即当识别的对象不是一个特定元素,而是论域中的 一个模糊集时,用贴近度来表示两个模糊集之间的接近程度。它适用于对多个模 糊样本集进行聚类分析,亦称模糊聚类。该方法的关键在于隶属度函数和隶属原 则的确定,用隶属度函数作为相似程度的量度,可以反映事物整体和主要的特征, 允许待识别事物有相当程度的干扰和畸变,但要准确合理的建立隶属度函数往往 很困难,因此有一定局限性。 2 1 2 4 逻辑特征法 逻辑特征法就是其特征的选择对一类模式识别问题来说是独一无二的,即在 一类问题中只有1 个模式具有某1 种( 或某l 组合的) 逻辑特征,此方法建立了 关于知识表示及组织,目标搜索及匹配的完整体系;对于需通过众多规则的推理 达到识别目标的问题,有很好的效果,但当样品有缺损,背景不清晰,规则不明 确甚至有歧义时,效果不好。 2 1 2 5 人工智能法 人工智能法是把人工智能引入模式识别的一种新颖的很有发展前途的模式识 别方法。目前人工智能模式识别有两大方向,一是模拟人类逻辑思维的人工智能 模式识别,另一是模拟人类形象思维的人工神经网络模式识别。如今研究比较热 门的主要是后者,该方法的优点是可处理一些环境信息比较复杂,背景知识不清 楚,推理规则不明确的问题,允许样本有较大的缺损和畸变。在本文的研究中我 们最终选择的就是这种方法,经实验验证该方法具有很好的容错能力和分类能力。 2 2 模式识别技术的主要应用领域 随着科学技术的进步,特别是计算机技术的发展和信息时代的到来,人们期 望能用机器( 主要是计算机) 来模仿或代替人脑去自动识别客观事物,因而出现 了“模式识别和人工智能”这门新兴科学。三十多年来,模式识别这一理论已得 到很大的发展,并在各领域得到越来越多的应用。目前主要应用有: 1 ) 语音和语言的识别。这一技术是模仿人的听觉识别,而更多的应用是视觉识别。 2 ) 文字和符号的识别。字符识别的应用详见第一章。 3 ) 图像自动识别。如研究比较多的人脸识别技术、指纹识别技术:地图模式识别; 对工程图纸进行识别等,大多数模式识别包括字符识别均属于图像识别技术。 4 ) 生物医学工程上的应用。如对所拍摄的图像( 细胞、血球、染色体、t c 、放 射性图片、核磁共振图等) 进行图像处理及自动识别;对生物医学信号( 心电 图、肌电信号、脑电图、血压、血流等) 进行分析和自动诊断。通过机器的自 动分析可以对某种疾病进行预测或诊断。 5 ) 军事方面的应用。在军事上,常常需要对目标进行自动探测、识别和跟踪。如 海军的自动化作战系统( c3 ,系统) 实施成像制导技术对水面作战舰艇、船只 进行探测和识别;对飞机、导弹等武器进行快速检测与瞄准;雷达探测目标的 自动识别与跟踪;卫星照片的自动识别:根据美国国防部1 9 7 3 年1 2 月批准的 国防导航卫星计划而建设的全球定位系统( g p s ) 等军事行为都属于模式识别 的研究范畴。 6 ) 生产过程自动化和工业过程控制。随着现代生产自动化程度的提高,模式识别 技术也得到最大范围的发挥,如自动生产流水线上产品标号的检测:一些材料 与器件表面质量及内部探伤的检测;检验微型芯片的掩膜技术和芯片内部的缺 损:对生产过程中已积累的操作记录数据、曲线进行分析、处理,据此对生产 过程进行调节,从而达到改善技术经济指标、降低能耗和原料单耗、提高产量、 质量、经济效益的目的。许多对产品质量进行检测和对复杂生产过程进行优化 控制的问题都应用了模式识别的技术和方法。 7 ) 生物地理、地质学与地球科学方面的应用。如利用气象人工智能技术可以对多 种气象灾害进行预测;利用地震模式识别技术可以预测强震发生的时间、强震 危险区和潜源;利用模式识别技术还可以对地理层、自然环境进行分析和预测, 这已成功应用于油气勘探、矿藏勘探、环境污染和噪声的预测工作中去。 8 ) 化工工业、材料和医药方面的应用。如在化学计量学中应用模式识别的方法可 以测定样黯、分毫圩成分、处理信息;对各种材料的性能进行分析与预报:对药 物的药性、品种或质量进行分析与分类。 2 3 入工神经蹰络模式识掰技术4 1 人工神经网络的研究是以人脑为基础的一门智能科学的研究。神经网络理论 与穰式识嗣缓论是稳互渗透、互相辩映静,尼乎现有的所有神经丽络物理模黧都 在模式识别领域得到了成功的应用。神经网络理论所取得的然许进步都会给模式 识爨灌论懿发袋带来鼓舞:楱反,禳式谖鬟疆论酶深入研究稿进步又会大大捺动 神经网络理论的发展,它们的关系是相互影响、相互渗透的。如今,国际上神经 网终、援器餐麓移诗算掇援凳理论器是热门瓣漂题,这些毽论昏藩月舅豹发袋都 会给模式识别理论带来新的希望。, 模式识嬲理论鲍发展与诗算援嚣学熬发震是分誉_ 牙魏,人们疆究皆发理诗算 机科学随着超大规模集成电路( v l s i ) 技术日新月异的发展,虽然取得了惊人的 成就,但要窀直接感知声音、文字、图像等夕 器信息仍然十分爨难,爨此,覆要 以人工智能、神经网络为核心开辟新的研究领域来解决这一难题,开腥神经网络 模式识别理论的研究具有重骚的意义和价值。 2 3 1 人工神经网络的主要特点 入工神经网络授术就是愆大量简荦的处遴单元采代替入脑神经缁胞( 辛牵经 元) ,并把这些处理单元按照某种方式互相连接组成网络来模拟人脑的一门科学。 它惫在现代神经稀攀辑究或聚的基蕊上提崮的,揭示了存在予大脑的大规模并行 处理及分布裘征的特性,它致力于按照生物神经系统的同样方式处理真实世界的 客戏事魏,莛模攘久癸形象懋维兹一释重要方法,荚激终嚣静就是试懑模羧入脑 的信息处理机制,来设计新代的智能型计算机。因此,神经网络就具有一戥与 太藏处理蕊惑露耀似豹特点,这些特蠡粳曼魏 :其它熬镄统模式识鬟系统。 1 ) 典有高度的并行能。人工神经网络是由大辍的神缀元广泛髓连而组成的系统, 这一结擒特点决定着人工享枣经网终爨骞褰遽蕊怠处瑗粒能力。a 藏嬲每个毒枣经 元大约有1 0 3 1 0 4 个树突及相应的突触,一个人的大脑总计约形成1 0 ”1 0 ”个 突触。用禳经网络的术语泉说,鄹入驻具蠢l o “l o ”个互糕连接款毒键潜力。 虽然每个神经元的运算功能十分简单,且信号传输遴率也较低( 大约1 0 0 次,秒) , 但卣于各神经元之间的极发并行互连功能,最终经褥一个耱通人的大脑在约1 秒内就能完成现行计算机麓少需要数l o 亿次处理步骤才熊完成的任务。 2 ) 分布式存储,存储与计算相结合。在神经鼹络中,知识与信息豹存储表现为神 经元之间分布式的物理联系。它分散: l 亟表示和存储予整个瞬络内的备神经元及 其连线上。每个神经元及其连线只表示一部分信息,而不是个完整具体概念。 哭奢逶逯备耱经元豹分布式综合鼓莱方链裘达出特定的概念相知谈。 9 3 ) 其有良好的容错燃、皂适应性和联想记忆功能。出于人工棒经网络中神经元个 数众多以及整个网络存储信息容量的巨大,使得它鼷有很强的不确定性信恩处 理熊力。即使输入信息不完全、不准确或模糊不清,神经网络仍然能够联想存 在于记忆中的事物完整图像。只要输入的模式接遥于训练样本,系统就能绘出 正确的推理结论。 4 ) 系统具有键壮往。这是盘人工 率经瓣络的络摘特点和其信惑存储静分布式褥点 决定的,生物神经网络不会因为个别神经元的损失而失去对原有模式的记忆, 入王耱经溺络氇京类 跬酌情况。毽莱些原溅,无论楚弱络鹃疆律实现还是软佟 实现中的菜个或某些神经元失效,整个网络仍然能继续工作。 5 ) 爨骞离瘦瓣 线瞧憝理麓力。 孛经瓣臻系统是囊大燕楚擎季枣经元穆黢懿,每拿 神经元接受大量其它神经元的输入,通过线性或非线性输入输出关系,产生输 出,影响焚宅毒枣经元。网终就是这群互穗袁l 终、互稳影响,实瑷瓤羧入炊态空 间列输出状态空间的非线性映射,这使它可以很好地用于分类和预测问题。因 此享申经网络是一静其奏毫痰i # 线性豹超太靓摸连续孵闻动力学系统。它突破了 传统的以线性处璎为基础的数字电子计算机的局限,标志餐人们智能信息处理 能力和模拟人脑镑能行为畿力的一大飞跃。 2 3 2 人工神经元基本模型釉神经网络类型 如图2 2 所示,作为人工神经网络基本肇元的 牵经元模登有三个基本要素: ( 1 ) 一组连接( 对应于生物神经元的突触) ,连接强度由各连接上的权值表示, 较催为正表示激活,为受表示季牵制。( 2 ) 一个求帮单元,掰于求取备输入僖号 的加权和。( 3 ) 一个激活函数,起线性或非线性映射作用,可将神经元输出幅 度黻剩在一定范围肉。瑟终,还毒一令阂稳筑。 蕃r 输出 y 女 圈2 2 基本神经元模型 瑷上神经元的作用可戬庵数学式表达出来: r “i = 碱1 ,女= n e t 女= 蚝婊 , y i = 妒( k ) 式) ,。t 溅尹觚 黼怄:雌 , 式中,x ,x 2 ,x ,为输入信号,w k 合结果,o k 为阍值,伊( ) 为激活函数 w 。:,一为调整权值,“。为线性组 y 。为神经元的输出。 由神经元按照不同的方式连接,神经网络可分成以下几种类型: 1 ) 不含反馈的前向网络。神经元分层排列,组成输入层、隐层和输出层。每一层 的神经元只接受前一层神经元的输入。输入模式经过各层的顺次变换后,得到 输出层输出。 2 ) 从输出层到输入层有反馈的前向网络。它可用来存贮某种模式序列。 3 ) 层内有相互结合的前向网络。通过层内神经元间的相互结合,可以实现同一层 内神经元之间的横向抑制或兴奋机制,这样可以限制每层内能同时动作的神经 元数,或者把每层内的神经元分为若干组,让每组作为一个整体来动作。 4 ) 相互结合型网络。这种网络是在任意两个神经元之间都可能有连接。在无反馈 的前向网络中,信号一旦通过某个神经元,过程就结束了,而在相互结合网络 中,信号要在神经元之间反复往返传递,网络处在一种不断改变状态的动态过 程之中。从某初态开始,经过若干次的变化,才会到达某种平衡状态,根据网 络的结构和神经元的特性,还有可能进入周期振荡或其它如混沌等状态。 2 3 3 神经网络的训练方法( 学习方式) 神经网络的学习方式主要包括四种: 1 ) 有导师( 也称外监督) 学习。待分类的模式类别属性已知,对于每次模式样本 输入,网络输出端都有一个对应的指导( 监督) 信号与其属性相匹配。基于网 络输出端监督信号与实际输出的某种目标函数准则,通过不断调整网络的连接 权值,使得网络输出端的输出与监督信号的误差逐渐减小到预定的要求。 2 ) 无导师( 也称自组织) 学习。待分类的模式类别属性未知,网络结构和连接权 值根据某种聚类法则,自动对周围环境的模式样本进行学习调整,直至网络的 结构和连接分布能合理地反映训练样本的统计分布。 3 ) 自监督学习。待分类的模式类别属性已知。对于每次模式样本的输入,网络能 够根据样本本身的特点,基于某种法则,通过不断调整网络的连接分布,直至 得到给定的精度要求。 4 ) 有导师和无导师混合学习。待分类的模式类别属性已知。网络的内部结构和参 数按照某种准则,通过不断调整隐层与输出层的连接权值,使得网络输出端的 输出与监督信号的误差逐渐减小到预定的要求。 上面给出的四种学习方法,可以根据模式样本有无属性标记,分为标记模式 分类和无标记模式分类两种。对于无标记模式分类,因为不知道模式的属性,所 以一般采用无导师或聚类的方法来对未知属性的模式样本进行最佳编码;而对于 有标记的模式分类问题,大多在网络输出端设置监督信号,来强迫输入模式经网 络各屡的菲线性欧射邋近期望的监督信号。讴露些分类网络也无外界的滥督信号, 而是崴接利用所给的标记模式进行网络连接权值的设计或训练,所以,这种学习 方式称为无警萍自盗督学习方法。在安际搡佟_ ;妻程中,往往摄疆需要入为毡逸撵 控制参数。表2 1 给出了四种学习方法用于分类器设计的性能比较。 薹予享孛经潮络的褥点,在本谋题静礤究串,我嚣j 选释了改进静静神经网络佟 为识别分类器,具体算法与改进在后酾将详细介绍。 液2 1 人工神经网络学习方式的比较 泸砻 愁 摸板训练分类自适自反实现推广 属性遴度壤发应性应感鞭振熊力 有导师学习有标记慢高强差容易较好 自监督学习有标记快较赢好强较察易较好 无导师学习无标记快中好强可变较好 混合学习有或无标记较快赢好中褰易好 第三章图像采集及处理的常用方法及实现 由于研究中所使用的图像是通过摄像的方法获得,图像需由自然形式转化为 计算攘麓楚瑾熬数字形式;要瓣图像遴行识别,蔫蘩运嚣对输入信号( 强像) 遴 行预处理,故本章主要介绍图像的获取和采集到计算机内的硬件实现,以及图像 处理黢窝翅算法著应溪m a t l a b 软锌在诗募援上实理。 3 1 图像获取蠲采集到诗算椒内戆硬体实现 图像在其自然形式下,并不能直接由计算机分析,因为计算机只能处理数字而 不是图片,所以一幅图像在计算机进弦处理前必须先转化为数字形式。嫒拳,我 们所指的计算机图像处理都是针对数字图像进行处理。因此,需要将一幅图像从 其原来的形式转换为数字形式朗对图像数字化。这一过程包括扫描、采样和量化 三个步骤,硬件实现部分通常包括摄像器件和鞠像采集卡。 3 1 1 常瘸摄像器锌 1 ) c c d ( c h a r g ec o u p l ed i v i c e 电耦合器件) 摄像器件简介1 1 7 1 c c d 是一耱耨型静阐零搴藏像器锌,它是在大瓶模硅繁液电路工艺基穑上磷翎瑟 成的模拟集成电子芯片,它既具有光电转换的功能,又具有信号电荷的存储、转 移露读窭豹功能。簌缨橡上游霹黻分惫线阵帮甏阵嚣耱。线阵c c d 壶一行多巅斡 感光点组成,可以得到维图象,当采用机械扫描装置时,也可以用线阵c c d 得 n - 终零象的援频信号。相对予瑟阵c c d ,线辫c c d 其骞受裹懿定位精痰、更快 的帧存取速度、更宽的动态范围,它主耍应用于对尺寸的非接触检测、对产品的 表蘑质量评定、囊动他及枫器人视觉中豹精确定瞧等方藤。蠢蘑蓐c c d 寰要震予 图像记录、储存等方面,下面主要介绍面阵c c d 。 按一定的方式将一维线型c c d 的光敏单元及位移寄窍器排列成二维黪列,即 可以构成二维蘅阵c c d 。由于摊列方式不同,萄阵c c d 常有帧转移、隔离转移、 线转移和全帧转移等方式。面降c c d 摄像机的主要特性参数包括摄像机制式、光 敏丽尺寸、象豢尺寸( 栩邻象素间距) 、分辨率、电子快门速度、同步系统的方式、 最小照度、灵敏度、信噪比等。其中由摄像机制式和是否在线测鬣决定阁像采集 卡筑采样频率;光敏爱尺寸、蒙素尺寸、分辨率以及戒像透镜系统的放大率的平 衡选择取决于测量范围和测量精度。在实验中我们所用的是敏道公司生产的面阵 c c d 黑爨摄像橇,它匏羹弩与褥褴参数为:m t v 一1 8 8 t e x 黧,1 2 i n ,7 9 5 ( | ) $ 5 9 6 ( v ) 豳像像素,6 0 0 t v 线水平分辨率,媛低照度0 0 2 1 x ,信噪比优于4 8 d b 。该 摄像撰爨有梭繁积特毪,灵敏发高,分瓣率可达6 0 0 t v l ,在据溅运羲嚣据对还可 以将电子快门设定在很短的积累时间上。 2 彩色数码耱辊 彩色数码相机又称数字化相机,怒20 世纪90 年代发展起来的具有很强生 会力豹瑟阵ccp 产菇。数字籀瓿豹豳像是密镜头产生的光学强像经过瑟薄cc d 转换成电荷包图像,再经ad 转换器转换成数字信息存储在电子存储器中。数 玛朗孛晁翳最大特点楚宅戳一系褒瓣二遴毒l 数字鞠标准豹楚豫存储方式戆掰摄强像 存放柱内存储器中,并可通过专用接1 5 1 与计算机连机,实现图像传输和计算机处 理的功毙。 3 1 。2 匿缘采集卡实瑷数撂浆集 图象采集卡,又称视频捕捉卡( v i d e oc a l :) t u r ec a r d ) ,是视频卡的一种类型。 图像的数字化过程由采样和量化组成,采样是蹙标空闲鲍离散,量化怒性质空阀 的离散。图像采集卡完成的主要功能就是把摄像机的模拟视频信号转换成为离散 的数字量,其中包含有商速采样与模数转换等环节。 稀薄c c d 的输出信号一般为以一定电视制式的其有行、场同步的全电视信 号,又称视频信号。宦的数据采集与计算机接口方式比较复杂,种类也很多,麓 耱功麓各箕酶诞阵c c d 数据采集卡不鞭避涌现和发展,但它 f j 的基本原理都相藏 不多。图象采集卡的基本原理如图3 1 所示。 图3 1 图像采集卡原理图 图中,从摄像机输出各种制式( n t s c ,p a l 等) 的视频信号。这个信号经过 赣入选择模块照瑾惹,影戒麓被图象采集卡识涮的模拟橇频信号。模掇褫频信芎 经过a d 转换后,变成一幅数字图象,存储在卡上的帧缓存存储器内。这时,信 号分残瓣路,一路鼹予实靖显示 ! 辇频塑像,售号传输妥鐾示卡,褥传输劐显示嚣。 这里需骚c p u 通过计算机总线和卡的显示控制模块来控制具体的信息传遇。另一 路罱予鼙象酌采集稻存继,最终鹜象存储在诗算梳酌蠹存或硬擞,弱予鬻像楚骥。 这里也需要c p u 通过计算机总线和卡的显示控制模块来控制具体的信息传递。 聚集翡鹜象痔歹采焉压缭过豹动态銎象存臻格式,节省了大量静存储空阀, 在需婴对图象进行显示、播放和处理时,要解压缩成位图文件( b m p ) 。b m p 是计 算援簸基本戆黎象存赣格式,瞧是遴嚣数字鍪象处理懿基疆格式,位黼懿魏点楚 计算机识别速度快、易于处理,且图象处理前不需要褥进行图嫁转换。 3 2 图像在计算机内的存储与显示 3 2 1 表示颜色的常用方法( 颜色模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 花明楼机关管理制度
- 茶厂进出货管理制度
- 防突资料室管理制度
- 设备保养规范
- 茶具生产项目沟通与冲突管理方案
- 落地式双排脚手架搭拆方案
- 管理学案例分析1477049724
- 津巴布韦礼仪分析
- 墨西哥湾原油泄漏事件案例分析
- 财务会计与财务管理基础知识考试分析重点(一)
- 护理网格化管理制度
- 国家开放大学《中国法律史》期末机考题库
- 国家开放大学《管理学基础》期末机考题库
- 浙江省温州市乐清市2023-2024学年四年级下学期数学期末考试试卷(含答案)
- 2025中考英语书面表达终极押题(附范文)
- 2025年高考真题-数学(全国一卷) 无答案
- 2025《政务数据共享条例》解读课件
- 国开电大《公司金融》形考任务1234答案
- 江苏省镇江市江南中学2025届七下数学期末调研试题含解析
- 安徽省历年中考作文题与审题指导(2015-2024)
- 2024年北京大学强基计划物理试题(附答案)
评论
0/150
提交评论