




已阅读5页,还剩63页未读, 继续免费阅读
(控制理论与控制工程专业论文)基于区域特征及拓扑结构的图案识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于区域特征成拓扑结构螅幽案识别 摘要 x 8 7 6 2 9 0 c a d 技术在图象设计方藏的广泛应爆改变了传统舱图案设计方式,极大地提 高了设计效率,位大量花样瀚产生对图案的识剐提出了新的要求。特划晨领带图 案,千变万化,融类繁多。如何在提供了花型小撵贻煺提下,快速地从花撵库中 找到曾经设汁过静稻尉的花祥,觚而避免重复设计,提高漫计效率,是一个亟待 解决的问题。 本课熬针对镞带墨案仅幽有限个色浚组成,龟彩有搅律的特点,提出了基于 区域特征及拓扑结构的图案识别算法,刹用各色块的面积和色块蝴的空间关系作 为领媸图案的特矩进行分类,并建立了褶应的谖剐系统。系统主要分为三大模块: ( 1 ) 预处理模块,主要包括单位花样的提取,图案平滑、r g b 真彩图转次 度图、色块归并和灰度变换,姆包含大= 霆噪声兹织物扫搓图转换为与配色过程无 关静住琰图。 ( 2 ) 特征提取模块,提墩了包含位置信息的蠢方图特铤鄹色块耀籀亨 结搦 特征分别用于描述图案各色块的面积及色诀间空问关系。 ( 3 ) 特征分类模块,基于最小距离分类的愚想,对照方图特缝嚣1 拓扑结构 跨经逐基与花样痒中的花样进行跣较,对待识嗣花样逐行分类。 在包含2 0 0 个记录的花样库罐础上,对本文提如的汲别方法和其他常用驰识 弭方法遴行比较,试验表明,基予区域特程及拓扑结构静胬案谈稍方法对领带图 茬的谈剐更有效。 关键字:基色;色块;归劳;坎度变换;特矩提取;特征分类;三元缩 臻l 一选域特挺发褊毒 缝瓣赫鹫畿谈裂 a b s t r 魏c t 衲ea b r o a da p p l i c a t i o no fc a d t e c h n o l o g yj np a t t e md e s i g nh a sc h a n g e d f f a d i t i o n a lp a t t e md e s 缸弘n l o d ea n da d v a n c e dt h od e s 如蛋e f 蠡c i e n c y h o w e v e f ,t h e r ei s n e w q u e s t 奴p a l t 8 臻 e 韶i t i o 珏k e 勰s e 髓瓣a m o 珏狂to fp 稚e 嫩s a m p l ee s p e c 主翻y f b rt i es a m p l ew h i c hi sv a r j o u 8 s oi ti sap r o b l e ml h a tp e o p l ec a nf i n dt h et i ep a t t e r n d e s j g n e do rs i m i l a ri nt h ec o n d i t i o nt h a tt h et i es a m p l ei dp r o v i d e d i fj tc a nd o ,t i i e w a s 地w i l lb ea v o i d e da n de 腋c i e n c yw i nb ei n c r e a s e d 强弧p 警e fp f o 筘u n d 穗a 笋鑫l 垂e 攫f e e o 努主重主o 蕤a l g o 矗壤m 娟i 穗i sb 嚣o 羲a r e a 凳a t h r e sa n dt o p o l o g yo n i ep 缸t e m sc h a r a e t e r i s t 溉o f 孙b l o c k sa n dr e g u i a rc o l o f p a t t e m 1 1 1 ea l g o r i t h ms o r t e dm et j ep a t t e n lu s i n gc o l o rb l o c k sa r e aa 1 1 ds p a c e r e l a t i o na si t sc h a r a c t e r i s t i c s ,a n de s t a b l i s h e dc o r r e s p o n d i n gr e o o g n i t i o ns y s t e m s , w h i c bi n c l u st | l f e em a i nl 鞋o d u 圭e s , ( 1 ) p 豫| r e a 镪l 。n lp a 怒1 lm a 主n l yi 赴l 珏d e d 穗os e l e & i o n 基s a 搬瘿eu 癍t ,p 永挺m s m o o t 量l n e s s ,t h ec h a n g ef r o mr g bi m a g et o 科a yi m a g e ,m e r g c ro fc o l o rb l o c ka n d g r a yt r a l i s f b 肿t h r o u g ht h i sp a r tt h es c a ni m a g ci n c l u d i n gl o t s0 fy a w pc h a i l g c dt o c o l o f b l o c ki m a g ea i l dh a s n ta n yr e l a t i o nw i t hc o l o fm a t c hc o u r s e ( 2 ) e 醯豫c 据f 螽羹f 建娃i 娃器p 搬。a 拄p o s 秘。拄獭e s s a g ei 珏d 珏d e d 羚礴a 鞋g u | a rf e a 瓣f e a l l ds t r h c t u 璋f e a t u r 。w e f eu s e d 幻d e s c r i b et h ea r e ao fe a c hb l o c ka n d 出es p a c e r e l a t i o no fc o l o rb l o c k s ( 3 ) c l a s s i f j c a t i o np a r c a c c o r d i n gt ot h en l l eo f t h e l e a s to fd i s t a n c ef u n c t j o n ,t h e f e c t 拄娃g h l a ff e a t u f ea n ds l r u c t u 辖f e 醴u 碍w e 辩m p a f e dw i t hs a m p l e 讯壤ed a 纽b a s e 辩p 甜a | e l yl od a s s i 每氇ep a 持豫 0 nt h eb a s eo fd a t a b a s ew i t h2 0 0r 己c o r d i n g ,t h er e c o g n t i o nm e t h o dp r o p o u n e d i nt h j sp a p e rw a sp r e p a r e dw i t ho t h e rc o m m o nm e t h o d sa n dw eg o lt h ec o n c l u s i o n t h a tt h er c c o g n i t i o nm e t h o db a s e do na r e aa n ds t f u c l u r ef e a l u f ei sf n o r ee 矗e c t i v et o f e 鬈砖l i o 建o f | 耙p a l 沧撙+ k e yw o r d :b a s i cc o l o ec o l o r b l o c k ;c o l o ri n f u s i o n ;g r e yt r a l l s f b a t i o n ;f e a t u r e a b s t f a c t ;f e a t u r ec l a s s i f i c a t i o n ;t r i g r o u pm e i h o d ; 2 基于区域特征及托扑结构的幽案识别 1 1 课题研究的背景 第一章绪论 1 1 1 图像识别技术的发展及其任务组成 1 图像识别技术的发展 图像识别诞生于2 0 世纪2 0 年代,随着信息技术的飞速发展和全球数字化的 不断逼近,图像识别技术f 在发挥着越来越重要的作用,并正在向传统的学科甚 至社会科学等领域不断地渗透。 图像识别技术发展迅速,目前研究者们已经提出了多种工具和方法,主要归 纳为统计方法( 数学方法) 和句法结构识别方法”1 。统计方法表示形式建立在一 个坚实的方法和公式基础上,在对研究的图像进行大量统计分析后,利用概率统 计模型得到各类别的特征向量分布,以取得分类的功能。第二种是句法结构识别 法,此类方法的实质是,将图形进行结构化描述,并把图形结构同语言句法进行 类比,从中找到与不同句法结构相比拟的图形结构,实现对图形模式的识别。用 结构化方法不仅可以把观察对象归于某一模式,而且还可以描述出该对象不属于 其他模式的那些性质。 两类方法各有优缺点。第一类方法很少利用图像本身的结构关系,忽视了结 构对图像的影响。而第二类方法则没有考虑图像在环境中的所受的噪声干扰,必 然使其元素或结构关系带有一定的随机性。因此,在应用中需要根据图像的特点 选择适当的方法。 除了这两类识别外,近些年来由于模糊数学的发展,模糊数学在图像识别领 域中也得到了广泛应用。有很多问题利用模糊数学的概念进行识别可以获得快速 准确的结果。 2 图像识别的任务组成 图像识别属于模式识别的范畴,是根据被研究的图像特征进行分类识别。对 于图像识别而言,无论什么识别方法,什么形式的识别目标,识别的过程都主要 包括以f 三个步骤”( 图1 1 卜1 ) : 基十区域特征及打 扑结构的图案识别 图1 1 1 1 图像识别的一般流程 1 图像预处理 预处理的目的是去处噪声,加强有用的信息,并对输入、测量或其他因素所 造成的退化现象进行修复,为自动识别打下基础,或对图像进行压缩以减少对存 储空间或传输时间、传输通路的要求。主要包括图像大小或格式转换、图像变换、 图像增强( 模糊和锐化) 、复原、修复等。 2 特征提取“” 特征提取是从许多初始特征中选取一些最有利于分类器测度的特征子集。通 常,相关程度高的初始特征或者噪声大的初始特征都是可以去掉的初始特征。因 此,特征提取可以看作是一个彳i 断剔除无用特征和聚合相关特征的过程,最终结 果是使分类其的性能最好。目前,图像识别中比较常用的图像特征有以下一些: ( 1 ) 颜色特征:真彩色的r g b 三种颜色可分别处理,也可以通过某种加权 的方法转换成灰度图像进行处理。其中对灰度直方图进行分析是一种最常用的方 法。灰度直方图( h i s t o g r a m ) 是图像中不同灰度信息的统计,从中可以得到大量 有关图像颜色及灰度方面的信息,如亮度、饱和度、对比度、颜色的均值与方差 等。 ( 2 ) 纹理特征:纹理特征反映的是像元灰度值的空问分布情况,是由纹理 基元按照某种确定性的规律或者某种统计规律排列组成的,是识别不同物体的重 要特征之+ 。纹理特征的提取方法又很多,常用的有空间自相关函数法、傅立叶 频谱法、灰度共生举证法、灰度差分统计法等。 ( 3 ) 形状特征:图像或图片中的线条,以及由线条与线条相交引起的角点 是经常被利用的形状特征。角点的最大优点是,它所代表的局部结构关系信息彳i 会因为视角的不同而改变。这在三维物体识别中很有用。此外,角点特征也常用 在汉字识别、染色体识别等应用系统中。 特征的选取没有固定的格式,对于不同的识别对象,通常会选择不同的特征, 良好的特征应该具有以下四个特点”“: 可区别性:所选特征对属于不同类别的对象具有明显的差异。 罐于区域特钲及拓扑结构的幽案识别 可靠性:所选特征对于同一类对象应尽可能一致。 独立性:所用的各特征之问应该彼此不相关。 维数较低:模式识别系统的复杂程度随特征向量的维数迅速增长,所以特别 要求对特征向量维数的控制。 3 学习和分类 分类器是识别系统中的一个关键部分,包括建立分类器的逻辑结构和分类的 算法( 分类原则) 。基本做法足在样本训练集基础上确定某一个判决准则,使按 照这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失 最小。 1 1 2图像识别技术在纺织行业的应用 图像谚 别是目前信息科学研究的热点,被广泛应用于社会科学各个领域。概 括起来主要有:宇宙探测、遥感、生物医学领域、指纹识别、人脸识别、字符识 别、信件包裹的自动分拣和归类等。 图像识别技术应用于纺织领域是在近十年才逐渐发展起来的,但它的发展速 度是非常迅速的“。1 。特别是大规模集成电路技术和计算机软件技术的发展,使图 像处理技术所具有的运算速度快、测试精度高、处理数据量大、结果再现性好的 优点得以充分的发挥,从而提高了识别的精度和速度。现在,图像识别技术已经 波及到纺织工业的各个领域,特别是在纺织材料图像分析方面,已经取得了显著 的成果。主要应用包括: ( 1 ) 织品质量检测“1 利用计算机解决纺织行业中的诸如纤维材料性能检测、纱线性能检测、半制 品检测等各种技术问题,可获得比人工检测更迅速、更精确的结果,成为提高劳 动生产率、保证产品质量的重要手段。 ( 2 ) 织物图案的识别 通过对花样库的检索识别,避免图案的重复设计,提高了c a d 设计的效率, 并有利于花样库的管理。 基十区域特征及拓扑结构的辟案识别 1 1 3c a d 纺织图案设计技术 计算机辅助设计( c o m p u t e ra i d e dd e s i g n ,简称c a d ) 是指利用计算机技术 完成设计过程中的信息检索、分析、计算、综合、修改及编制工作,是进行产品 设计和工程设计的一种新技术“。 在纺织图案设计生产中,c a d 技术的应用最早可追溯到6 0 年代。当时l b m 公司首先成功地研制了纹织1 艺自动化系统,使提花织物生产过程中的花型设计 从原先的手工方式设计、画图、冲板,变成用交互方式的屏幕作图和自动冲制纹 板,使自动化设计在纺织行业中的应用成为现实。目前,我国的纺织图案设计 c a d 技术的发展和国际上基本同步,某些方面还领先于国际水平。 图案设计属于智能模拟系统,即将资料、素材、基本数据收集贮存与计算机 构成素材库,又将有关规则构成知识库,计算机依据知t 库和素材库,高速全面 比较,寻求最佳答案。浙江大学和上海印染技术研究所在c r o m e c 0 i i 微机上 研制的计算机彩色平面图案创作系统,是具有智能模拟的图形系统。它由构图系 统、色彩协调系统和底纹库系统三者组成。 c a d 在纺织图案设计的应用,为纺织业的发展丌创了新的纪元,t 程技术 人员可以通过人机交互方式进行必要的干预,从而使设计、制造和管理过程处于 最佳状态,使得人们摆脱单调、机械的体力劳动,而且也可以摆脱繁琐、重复的 手工方式的脑力劳动,从而大大提高了产品设计和工程设计的效率。 1 2 课题研究的目的与意义 纺织业作为我国的传统行业,一直处于世界领先水平。特别是近几十年来纺 织c a d 技术的迅速发展及其在图案设计方面的成用,使图案设计的速度大为加 快,设计效率得到了很大提高。 对于领带这种对款式、花样的要求变化较快的织物,纺织c a d 的出现无疑极 大地推动了领带市场的发展。但是随着花样的f 1 益增多,领带图案的识别也变得 f i = l 益重要。尽管识别技术发展迅速,与之相关的各学科也提供有很好的工具、方 法,但是它仍然是而向对象的研究课题。针对领带图案颜色种类少,色彩分布有 规律的特点,如何选择有效的识别方法,使得在提供了花样的情况卜,快速地从 坫于区域特征及拓扑结构的幽案识别 花样库中找到曾经设计过的相同的或相似的花样,从而避免重复设计,提高生产 效率,是一个亟待解决的问题。 1 3 论文的创新点和结构安排 1 3 1 论文的创新点 本课题针对领带图案颜色种类少,色彩有规律的特点,提出区域特征及拓扑 结构的图像识别算法,并建立了图像识别软件系统。主要创新点有: 1 对c a d 设计的领带图案和领带织物图案进行比较的基础上,提出色彩归 并和灰度变换的图像处理方法,降低织物实物在光学一电子转换过程中产生的噪 声,并消除了配色过程对领带图案的影响。 2 针对传统图像直方图只包含图像灰度统计信息而没有体现位置关系的 缺点,提出了一种改进的直方图方法,将图像的灰度和位置信息有机地融合起来。 3 利用图像各色块之间的位置关系,构造山图像的拓扑结构,并利用三元 组法( 由数组和链表组成) 对其进行描述,提高了计算速度。 1 3 2 论文的结构 本文主要由四部分组成。绪论部分主要介绍了课题研究的背景及意义。包括 图像识别的发展和任务组成,c a d 技术在图案设计方面的应用以及课题研究的目 的和意义。 第二章给出了系统的整体解决方案。对系统的硬件结构,软件组成进行了介 绍。其中重点介绍了软件的各子模块及其功能。 第三章针对性地介绍了系统相关的理论基础和关键技术。 第四章针对系统的实现方法进行了描述,主要介绍了本系统中基f 统计量的 色块归并和狄度变换,基于区域特钲及拓扑结构的特征提取算法。 第五章介绍了软件的功能结构及操作,并对识别结果进行了分析。 最后一章是课题的总结和展望。这罩对课题的研究成果和经验进行总结,同时也 提出了一些使系统进一步完善的、技术进步升级的改进建议。 丝十区域特征及拓扑结构的图巢识别 第二章领带识别系统整体设计方案 2 1 领带识别系统软件设计方案 2 1 1 系统体系结构 领带识别系统应用面向对象的思想和数据结构相关知识而建立,叮以运行在 w i d o w s 操作系统下,有较理想的识别速度和精度。该识别系统主要由图案识别 主程序和数据库系统组成。结构框图如图2 1 卜l 所示 图案识别主程序 2 1 2 图案识别主程序 图2 1 1 1 系统体系结构框图 领带识别主程序主要分为三个模块:图像预处理模块、特征提取模块、特征 分类模块( 包括对数据库的操作) 。下面对各部分分别进行介绍 1 图像预处理模块 图像预处理模块的目的是去处噪声,加强有用的信息,提高识别的精度。主 1 0 基于区域特缸及拓扑结构的图策识别 要功能包括获得单位花样,获得图像基色数,图像平滑( 对织物图案) ,r g b 图 像到2 5 6 色灰度图的转化,色块的聚色以及灰度变换等。由于织物领带图案在纺 织、扫描过程中引入了多种噪声,与c a d 设计的图案花样产生区别,失去了色彩 种类少,色彩分布无过渡的特征( c a d 图案与织物扫拙图的区别在4 1 中介绍) , 因此该模块要对织物领带图案进行图像增强( 利用平滑滤波) 处理。同时,注意 到领带图案是单位花样的周期循环,如果直接对单位循环图像进行识别,将会降 低识别精度。因此必须提取出单位花样,在本模块中这个问题丰要通过人机交互 来解决。通过该模块,把待识别图像由包含多种过渡色及噪卢的真彩图转化为仅 包含有限个色块的灰度罔,方便后续处理,这一阶段在整个识别过程中是非常重 要的。 2 特征提取模块 该模块是图像识别系统的关键部分。主要是通过对原始数据进行变换,去除 冗余信息,提取出最能反映分类本质的特征,并降低特征空间的维数,从而降低 计算量,提高识别精度和速度。本模块主要功能包括求取图像直方图,直方图归 一化,提取包含位置信息的直方图统计特征,求耿图像的拓扑结构,对拓扑结构 进行特征选取。针对领带花样主要由几种色块按某种规律组成的特点,本模块主 要提取了两组特征:包含位黄信息的归。化直方图特征,用于描述各色块的相对 面积和同色块的位置分布信息;领带拓扑结构特征,用于描述各色块间的空间拓 扑关系。由于色块之间的相对位置是稳定的,所以这两组特征对图像的位移,旋 转等具有一定的鲁棒性。 3 特征分类模块 分类模块的中心任务就是寻找合适的分类规则,并根据分类规则计算出待识 别对象与数据库中每类花样之问的相似程度,进而确定该对象属于哪类。这是 系统中唯。埘数据库进行操作的模块。由于特征提耿模块中提取了两组特征,同 时预处理中得到的基色数也是分类的重要依据,因此本课题中采用多层次分类器 进行分类。 2 1 3 数据库系统“”“6 在当今的信息时代,我们每天都要与各种各样的信息打交道。在计算机中实 1 1 恭卡毽域播嚣及捧挣缨稳熬燃襄谖爱 现对信息的存储、处理、套询等操作都离不,f 数据库技术的支持。本课题中,数 据库主霹用来存储c a d 花样罔基本信息,花样图的特征等,以便识别过程中直接 将待淤剐图像同库中各花梯的特征进行比较,不但便于花样的管理,电提高了识 澍戆速发。下嚣对鼗鬃瘁系统遂牙。下余绥 1 数据库管理系统的概念 ( 1 ) 数据库 数据麾简单的定义是:由蕴含蓿一定的意义的数据,一些按照一定的规律组 织起来的辑组成鲍数据袋合。在数据库中除了瘸一些作为乡 部信惑躲数握之外, 还有一些内部信惠鼗蕹。这整数据定义了数攒痒的翔户及其相应鹣权限,数据库 表单的定义等等,通常把存放这些数据的地方叫做数据字典。数据字典是由数据 库系统囱行创建并自动维护的。 ( 2 ) 关系数据库 关系数囊瘁麴基本数攒缀援裁是二缝表,铎一张二缝表麓疲麓一蘩袋系。表 的每一行称为记录( 也 q 元组) ;表的每一捌称为属性( 字段) ;域就是属性的取 值范围。宅码是对于这张袭的唯一标识一即一个列或几个列的组合,主码最显著 的特点就是在任何给定的时问,没有两个主鹤包含相同的值,这个称为丰码的唯 一性琢列。固瓣,主码中每一个属瞧都不能被去簿,两同孵仍够绦耱主码的唯 一程,这个我稻称 乍主鹃静缀小性琢弱。 关系型数据库系统其有很多优点: 关系数据库有深厚的理论基础,它是濑于关系代数和关系理沧的模型。 以二维表的形式波示数据 表与表之蘑夔联忝不是疆缡璃嚣 不需要用,o 了解它在计算机中的物理存储形式 用系统表来提供簸本身的内容和结构。 可以通过s 0 l 语毒来操纵。s q l 语占怒专门用于操作这种模型的语言。 支持空值艴概念。 燕怒由于关系数摇簿横疆的诸多优点,搜褥它成为当今数箍撵的主流模型。 ( 3 ) 数据库管理系统( d b m s ) 数掘痒管理系统是一个用来管理数据库的软件包,是数据库能够正常v t = 作的 撼十区域特征及拓扑结构的图案识拍 核心。它对于数据库就如同操作系统对于硬盘,对数据库的所有操作,包括创建 斧种数据库的数据类型、表单、视罔、存储过程,以及其他的数据库应用程序对 于数据库中数据的读取和修改,都是经由数据库管理系统完成的。数据库应用程 序接触的只是数据据的接口,这个接口电就是数据库管理系统的接l i 函数,当数 据库应用程序把对于数据库数据的操作指令通过数据库管理系统的接口函数发 送给数据库管理系统后的一切工作都只是数据库管理系统的了,数据库应用程序 所要做的就只是等候数据库管理系统把它所需要的数据给它,然后进行加一i :处 理。 2 数据库设计过程 ( 1 ) 数据库的建立 创建一个数据库工程时,首先应当全面地分析工程的特点,根据工程的需要 确定要建立的数据库。在确定数据库的需求后,要将这些需求划分成合理的数据 表格。所谓合理的数据表格,通常要满足以下几点: 数据表格中的字段所描述的内容有1 定的联系、 数据表格中至少要有个字段的记录是不重复的 一个数据表格与数据库其他的数据表格中至少一个能够关联 一个数据表格与数据库其他的同一数据表格不要有多对多的关联 ( 2 ) 数据表格的结构 在划分了合理的数据结构之后,就町以建立数据表格的结构。在为字段命名 时,应使字段名能够反映字段的内容。字段的数据类型及数据宽度的选择要合理, 既要满足使用要求,又要少占用内存。在数据表格结构中需要。个关键字段,数 据表格中的数据就是按主关键字段的顺序存放的,而且利用主关键字段能够高效 地与其他数据表格建立关联。索引也是数据表格常用的,在数据库中,利用索引 可以加快访问速度。在表格中每一行成为一条记录。 3 数据库应用程序的丌发步骤 数据库应用程序丌发的目标是建立一个满足用户长期需求的产品,在开发的 初期要分析用户的需求,程序开发的几个步骤如下: 初步设训 功能实现 幕于区城特钎及拓扑结构的蹦案识删 运行和维护程序 ( 1 ) 初步设计 设计阶段要根据用户的需求,定义数据库和应用程序的功能,确定刷户的需 求功能哪戥在设计阶段实现,哪螳在程序中实现。 ( 2 ) 功筑实囊 将客户需求功能分成几个合邂的功能块,分剐遴行程序设计、调试。常见的 划分方法上分成四个功能块; 信息处理 数据库管理 系绕维护 辅助功能 信息处理是建立数据库应用程序的目的。设计数据库应用程序的目的是为客 户提高所需黉的信息服务,辅助管理工作,提高工作效率和水平。信息处理最基 本豹功戆毽旗骞类羡惠查询,统计缀表等功麓,对予特定熬应弱程序还司+ 蔽有蒋 定的功能。数据库管理的主要功能是负责数据库的聪新、修改等。一个特定的数 据库管理操作要由它的用户的权限决定,这个权限鼹i ;= j 有权的用户指定。系统维 护的功能是保证数据库应用程序送行的可靠性和安全性,一般包括用户餐理,口 令设甏,各类系统受量和数摄字凌瓣维护等。 ( 3 ) 遮行和维护程序 一个应用系统性能的优劣鼹由用户的使用来作出判断。用户在使用应用程序 的过程中会对应用程序提出一必建议和要求,根据用户的建议和要求对数据库应 用程序进行适当的修改和完善,从丽提高程序的性能。 2 2 系统的硬件结梅 领带图案识别系统的硬件组成部分主要包括工作端、图形输入设备部分。其 中工作虢起核心控制作用,其饿的设备分剐执幸亍输入、照相、存储、显示识别结 栗等任务。 所谓识别系统的工作端,愚图形显示设备、软件相主机结合在一起的一种高 性能的单用户计算机,适合用于人机交互。工作端计算机具有处理速腹、虚拟存 i 4 拱十区域特征及拓扑结构的幽粜识别 储、图形处理等方面的优势,支持多任务、多媒体的多窗口平台。本系统采用基 于w i n d o w s 操作系统的p c 兼容机,实现图像预处理、识别及数据库的管理和操 作等功能。 系统用到的图形输入没备主要是扫描仪( s c a n n e f ) 。扫描仪是种将图片通 过投射光线和镜头传输到感光元器件上,并把读取的一行行象素转换成数据存入 计算机的设备。在本领带识别系统中,其作用是将领带织物输入计算机以用来识 别,并协助建立图片数据库。经过这种光一电转换过程,图像一般会产生某些寄 生效应,如噪声等,因此扫描图像要经过图像预处理才能进行识别。 毖十区域特 _ | | = 及拓扑结构的幽寨识别 3 1 b m p 位图图像 第三章系统理论基础 计算机中数字图像可粗分为两大类:位图图像和矢量图像“7 ”1 。本课题都是 以b m p 格式的位图图像为基本操作对象的,在这早对其进行简要介绍。 3 1 1b m p 图像格式 b m p 图像文件格式足微软公司为其w i n d o w s 环境设置的标准文件格式。它 的主要特点为:每个文件只能存放一幅图像;图像数据是否采用压缩格式存放, 取决于文件的大小与格式。其中,非压缩格式是b m p 图像文件所采用的一种通 用格式。同时,b m p 图像文件格式可以存储单色、1 6 色、2 5 6 色以及真彩色4 种图像数据,它以图像的左下角为起点存储图像。w i n d o w s 种定义了两种位图文 件格式,即。般位图文件格式与设备无关位图文件格式。其中,设备无关位图 ( d i b ) 文件格式具有更强的灵活性与完整的图像数据压缩方式。 b m p 图像文件结构可分为四个部分“:位图文件头、位图信息头、调色板 数据以及图像数据。 位图文件头b i t m a p f i l e h e a d e r 用于说明b m p 文件的类型、大小和打印 格式等信息,是定义在w i n d o w s h 中一个数据结构: t y p e d e f s t r l j c t t a g b i t m a p f i l e h 卧d e r w o r d b f t y p e : d w o r db f s i z e : w o r d b f r e s e r v e d l : w o r db f r e s e r v e d 2 : d w o r db f o f f b it s : 1b i t 姒p f i l e i e a d e r : 位图信息头b i t m a p i n f o h b d e rl j 包含b m p 文件的尺寸定义等信息, 用于说明位图的大小。其结构如图所示: 苎! 堕望堑堡丝堑盐丝塑堕鬯塞塑型 t y p e d e fs t r l l c la g b i t m a p l n f 0 1 1 e a d e r d w o r db i s i z e : 1 0 n ( ;b i w i d t h : 1 o n gb j h e i 曲t : w o r db i p 】a n e s : w o r db i b i t c o u n t d w o r db i c o m p r e s s i o n : d w o r db i s i z e i m a g e : 1 o n g b i x p e ls p e r m e t e r ; i o n gb i y p e l s p e r m e t e r : d w o r db i c l r u s e d : d w o r db i c l r i m p o r t a n t : lb i t m a p i n f o h e a d e r : 第三部分为调色板( p a l e t t e ) 。当然一些位图是不需要调色板的,例如真彩 色图,b i t m a p i n f o h e a d e r 后直接是位图数据。调色板实际上是一个b i c l r u s e d 个元素的数组( 如果b i b it c o u n t 为零,则有2 的b i b i t c o u n t 次方个元素) 。数 组中每个元素的类型是一个r g b q u a d 结构,其定义如下: t y p e d efs t r u c tt a g r g b q u a d b y t e r g b b l u e : b y t e r g b g r e e n : b y t e r g b r e d : b y t e r g b r e s e r v e d : )r ( ;b q u a d : 第四部分是实际的位图数据。对于用到调色板的位图,图象数据就是浚像素 颜在调色板中的索引值,对于真彩色图,图象数据就是实际的r 、g 、b 值。 3 1 2b m p 图像类型 在计算机中,按照颜色和灰度的多少可以将b m p 图像分为二值图像、灰度 图像、索引图像和真彩色r g b 图像4 中基本类型。目前,大多数图像处理软件 培于区域特征及拓扑结构的目案识别 都支持这4 种类型的图像。 ( 1 ) 二值图像 - 幅二值图像的_ = 维矩阵由0 、1 两个值构成,“0 ”代表黑色,“1 ”代表白 色。由于每一像素( 矩阵中每一儿素) 取值仪有0 、1 两种可能,所以计算机中 :值图像的数据类型通常为1 个:进制位。而知图像通常由于文字、线条图的扫 描识别( o c r ) 和掩膜图像的存储。 ( 2 ) 灰度图像 灰度图像矩阵元素的取值范围通常为【0 ,2 5 5 】,因此其数据类型一般为8 位 无符号整数( b v t e ) ,这就是人们经常提到的2 5 6 灰度i 訇像。“0 ”表示纯黑色, “2 5 5 ”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。 ( 3 ) 索引图像 索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称 之为颜色索引矩阵( 调色板) m a p 的二维数组。m a p 的大小由存放存放图像的 矩阵元素的至于决定,用m a p = 【r g b 】表示。图像每一像素的颜色与存放在矩 阵中该像素的灰度值作为索引通过检索颜色索引矩阵m a p 得到。索引图像的数 据类型一般为8 位无符号整型( b v t e ) ,相应索引举证m a p 的大小为2 5 6 3 , 因此索引图像只能同时显示2 5 6 种颜色,但通过改变索引矩阵,颜色的类型可以 调整。 ( 4 ) 真彩色图像 r g b 图像与索引图像一样都可以用来表示彩色图像。与索引图像样,它 分别用红( r ) 、绿( g ) 、蓝( b ) 三原色的组合来表示每个像素的颜色。但与索 引图像不同的是r g b 图像每一个像素的颜色值( 由r g b 三原色表示) 直接存 放在图像矩阵中。对于大小为m n 的图像,r g b 图像的图像矩阵是一个三维 矩阵,可用m n 3 表示。 3 1 3b m p 图像模式的转换 实际应用中,通常需要对b m p 图像进行类型转换。例如当图像颜色不是很 多时,利用r g b 图转索引图,可以降低图像的存储空问;当对图像进行识别时, 通常需要将图像转化为灰度图等。下面对本文中用到的类型转换进行简单。 摧十区域特征及拓扑结构的图案识刷 1 r g b 图转索引冈n r u ec o i o rt o2 5 6i n d e x e dc o l o r ) 真彩图利用r 、( ;、b 三个分量的组合来表示颜色,每个分量在计算机中山一 个8 位的无符号数( b y t e ) 来表示,因此真彩图中可以同时包含最多达2 的2 4 次方种颜色。而索引图的r 、g 、b 分量存储在调色板中,每一幅图像的调色板颜 色个数最多由2 5 6 种,因此索引图像同一时间最多只能显示2 5 6 种颜色。为了在 转换过程中尽量减少失真,通常采用下面的方法: 对每一个r g b 颜色值,分别取其最高四位,拼成一个1 2 位的整数,共有4 0 9 6 种组合。同样取图像每一像素颜色r 、g 、b 分量的最高四位,统计这4 0 9 6 种颜 色的使用频率并按从大到小的顺序排列。前2 5 6 种颜色就是用的最多的颜色,将 其作为调色板上的基本颜色。对于剩下的颜色,根据最小平方误差原则,用前 2 5 6 种颜色中的一种来代替。索引图中的每一个像素,其位图数据就是该颜色( 或 替代颜色) 在调色板中的索引值。下面的两幅图,左图是原真彩图,右图是用上 面的算法转成的索引图,可见索引图像与原图相比,显示效果几乎是+ 样的,但 是它的存储空间只有真彩图的三分之一。 图3 1 3 1r g b 图 图3 1 3 2 索引图 2 图象灰度化 图像由彩色转化为灰度的过程叫做灰度化, 般图像识别都是在灰度图上进 行的。基本方法是利用y u v 空间中y 分量,其物理含义就是亮度,它包含了灰度 图的所有信息。y u v 和r g b 之间有如下的对应关系: 刚撩撩瓣 皋j 一区域特 i f 及拓扑结构的幽案识丹 g r a y = y = o 2 9 9 r + 0 5 8 7 g + o 1 1 4 b 公式( 3 卜2 ) 灰度图是一种特殊的真彩色图,只不过调色板中的r 、g 、b 值都是一样的 而已,在d e l p h i 巾,可以利用公式( 3 12 ) ,求my 值后,将r 、g 、b 值都赋给 y ,就能表示出灰度图柬,下图为图2 2 3 1 转化的灰度图。 3 2 图像增强 图3 1 3 3 灰度图 图像的增强是图像处理的基本内容之,通过图像的增强处理可以突出某些 特征信息,改善图像的视觉效果,为图像的信息提取取以及其他图像分析技术奠 定良好的基础”“”1 。图像增强的基本方法有: ( 1 ) 空域处理:包括图像灰度变换、直方图均衡、伪彩色处理,线性、非 线性平滑和锐化等。 ( 2 ) 频域处理:主要方法有高、低通滤波,同态滤波等。 图像增强与感兴趣的物体特征、观察者的习惯和处理目的相关,因此,图像 增强算法应用是有针对性的,并不存在通用的增强算法。此处只对本课题中使用 的中值平滑滤波,灰度变换进行介绍。 3 2 1 中值滤波 中值滤波是在1 9 7 1 年由j w j u k e y 首先提出的,开始主要用于一维信号处理 技术中,后来被引入到二维信号处理技术中。中值是一种非线性的图像平滑处理 方法,能够降低图像的锐度,在一定程度t 消除噪声。中值滤波对滤除脉冲干扰 信号和图像的扫描噪声效果很好,与均值滤波和最小均方滤波等平滑方法滤波器 相比,中值滤波在某些情况下可以做到即去除噪声又保护图像的边缘。中值滤波 皋下区域特征及打,扑结构的剧案识别 在运算过程中无需要图像的统计特性,因此计算很方便。 中值滤波是把数字图像中的一点的值用该点的一个邻域的各个点的值的中 值代替,中值的定义如下: 一组数x 、托、x 。假设排序如f : t 1 蔓薯2s 3 。 y = & d 缸l ,z 2 ,x 3 ,。一,x 。) = z ,m 、n 为奇数 f j 玳) 爿卜数 y 称为石t 、工。、x 。的中值。 把一个点的特定长度或形状的邻域称为窗口,在一维的时候,中值滤波器是 一个奇数个像素的滑动窗口,窗口正中间的值用窗口内各个像素的中值代替。设 输入为 x 。,) ,则滤波器的输出为: y2 胁d “) ;胁d “一,屯,+ 。) 公式( 3 2 2 ) 如果推广到j 维,则可以定义输出为: y2 m 甜) = 肘耐扛( m m 一) ,( r ,s ) 爿,o ,j ) j 2 , 公式( 3 2 3 ) 根据不同的图像,可以选用不同的窗口,二维中值滤波的窗口可以是线状、 方形、圆形、十字形等,一般采用3 3 或者5 5 的矩形窗口来进行滤波。如图 3 3 1 1 是本课题采用3 3 的窗口对织物扫描图像r 、g 、b 的三个分量分别进行 中值滤波的前后对照,可以看出,中值滤波的效果明显,消除了原图中的大量噪 声( 扫描线和孤立点) ,对于扫描图采用中值滤波是合理的,满足研究要求。 图3 2 1 1中值滤波效果图 摧于区域特 :i i ! 发打- 扑结构的幽案识别 3 2 2 灰度变换 在图像空问所进行的灰度变换是+ 种点处理方法,它将输入图像中的每一个 像素( 墨y ) 的狄度值,0 ,y ) ,通过映射函数f ( ) ,变换成输出图像的r r l 的灰度值 g o ,y ) ,即: g ,_ ) ,) ;r 【,0 ,y ) 】公式( 3 2 _ 4 ) 常见的灰度变换的方法有: ( 1 ) 直接灰度变换,应用确定的变换公式一次对每个像元进行处理 ( 2 ) 基于图像的直方图进行灰度变换; ( 3 ) 对两个以上的图像进行代数运算实现灰度变换; 由于本系统都是对单幅图像进行变换,没有设计到多图像的代数运算,又因 为直方图在本系统中是特征提取的重要组成部分,对其的提取和处理将在3 4 中 详细介绍,此处只介绍直接灰度变换的变换方法。 1 直接狄度变换“” 直接灰度变换包括传统的光学增强方法,如亮度调节、对比度调节、图像反 转等技术和基于数学映射关系实现的线性( 非线性) 拉伸两大类。当然,前者也 可以通过数学变换实现,下面首先介绍线性拉伸的变换方法。 ( 1 ) 线性拉伸:是将输入图像( 原始图像) 的灰度值的动态范围按线性关系 公式拉伸扩展至指定范围或整个动态范围。对于常见的拍打灰度图像而言,其动 态变化范围是【o ,2 5 5 】。线性拉伸的变换公式一般为: 占0 ,y ) = ,( z ,y ) + c + r 公式( 3 2 5 ) c 、r 的值由输出图像的灰度值动态范围决定,线性拉伸可分为按比例线性 拉伸和分段线性拉伸。 按比例线性拉伸:假定原始输入图像的取值范围为【,巾。,m 。 ,输出图像的 取值范围为【g m m ,g 。】,则其变换公式为 g ,_ ) ,) 2 糌( g 一占。m ) + 占。;。公式( 3 2 6 ) 丛于区域特征及拓扑结构的幽案识别 对丁8 b i t 狄度图像则有 g ( x ,_ ) ,) 2 馓2 5 5 公式( 3 2 7 ) 分段线性拉伸:按比例线性拉伸可以将原始图像中的坎度值不加区别的扩 展,在实际应用中,常常要求局部扩展拉伸某范围的灰度值,或对不同范围的 灰度值进行不同的拉伸处理。一般来讲,分段线性拉伸实际上是仅将某一范围的 灰度值进行拉伸,而其余范围的灰度值实际上是被雎缩了。图3 3 2 1 给出了常 用的几种分段线性拉伸的示意图,其中图3 3 2 1 ( c ) 对应的变换公式如式( 6 5 ) 所 可i 0 g ,y ) = 生;,0 ,y ) n 粤+ ( ,o ,y ) 一a ) + n d 一口 筹w ) - 6 ) + 6 o s , ,y ) n 6s ,( x ,y ) 彳 f 公式( 3 2 8 ) 图3 2 2 1 分段线性拉伸 ( 2 ) 非线性拉伸:不是对图像的整个灰度值范嗣进行扩展,而是有选择的 对某一灰度值范围进行扩展,其他范围的灰度值可能被压缩。非线性拉伸在整个 灰度值范围内采用统一的变换函数,利用变换函数的数学性质实现对不同灰度值 区间的扩展和压缩。通常用到的方法为对数扩展和指数扩展 占0 ,_ y ) = c l g 【,0 ,y ) + 1 】 公式( 3 2 9 ) 9 0 ,_ y ) = 6 7 0 ,一一1 某于区域特征及拓扑结构的图案识别 ( ”光学增强:是一类比较传统的方法,在数字图像处理技术诞生以前, 计:多光学增强方法就已经在模拟图像处理中得到了应用。如图像的反转很早就已 经在照相技术中使用,普通黑白底片和照片的关系就是一个相互反转的关系,所 谓图像反转就是使图像的灰度值反转,即“黑白颠倒”。其他方法如亮度调整, 对比对调节等也在图像的处理中得到了广泛的应用。当然,这些传统的增强方法 都可以通过具体的数学变换公式来实现。 2 图像的代数运算 图像的代数运算是对两幅以上图像的相应像元进行加、减、乘、除等。本系 统中没有用到任何多图像的运算,因此此处不作过多介绍。 3 3 图像直方图及其处理 在数字罔像处理过程中,我们常常需要得到图像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 勇气战胜困难的钥匙记事作文6篇
- 2025安徽固镇县连城镇招聘村级后备人才3人考前自测高频考点模拟试题附答案详解(突破训练)
- 2025-2026学年黑龙江省鸡西市某中学高二上学期开学考试英语试卷(解析版)
- 2025年河北衡水市第三人民医院招聘见习人员49名考前自测高频考点模拟试题及答案详解(各地真题)
- 2025黑龙江齐齐哈尔市富裕县富海镇招聘公益性岗位人员2人模拟试卷及答案详解(考点梳理)
- 2025年河北外国语学院人才招聘考前自测高频考点模拟试题及答案详解参考
- 2025贵州省计量测试院参加第十三届贵州人才博览会引才4人模拟试卷及答案详解(有一套)
- 2025河南省水利厅厅属事业单位招聘47人模拟试卷及答案详解一套
- 江苏省常州市2024-2025学年高三上学期1月期末质量调研地理试题(解析版)
- 2025湖北襄阳市中医医院(襄阳市中医药研究所)招聘急需专业技术人才55人考前自测高频考点模拟试题附答案详解(模拟题)
- 初中九年级化学课件元素周期表“衡水赛”一等奖
- 投标货物质量标准的详细描述
- 《大学生军事理论教程》第五章
- 中国建筑色卡
- 北师大九年级物理上册 (组装电路)简单电路 课件
- 2023年普通高中学业水平合格性考试音乐试卷
- 第八章世纪美国政治思想
- 起重机司机Q2(限桥式起重机)题库题库(1727道)
- 木质纤维素的生物分解及其转化技术
- 冠寓运营管理手册正式版
- GB/T 39473-2020北斗卫星导航系统公开服务性能规范
评论
0/150
提交评论