




已阅读5页,还剩53页未读, 继续免费阅读
(电力系统及其自动化专业论文)基于小波矩的图像内容识别技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学硕士研究生学位论文第1 | 页 a b s t r a e t a p p l i c a t i o no ft h ei m a g eh a sb e e nd e e pi n t oa l la s p e c t so fp e o p l e sl i v e s ,h o wt oo b t a i n t h en e e d e di n f o r m a t i o nf r o mt h ec o m p l e xi m a g e si sd i m c u l tt oc o m p l e t em a n u a l l y i no r d e r t or e t r i e v ei m a g e sa u t o m a t i c a l l y , t h ek e yo ft h a ti st h ei m a g ec o n t e n tr e c o g n i t i o n 1 1 1 ec o n t e n t o fi m a g e si n c l u d ec o l o r , t e x t u r e s h a p ea n do t h e rv i s u a lf e a t u r e f o rt h ew a v e l e ta n a l y s i sh a sg o o dt i m e f r e q u e n c yl o c a l i z a t i o np r o p e r t i e s ,i th a sb e e n w i d e l yu s e di nt h ee x p r e s s i o no ft h ei m a g ef e a t u r e f o rg e o m e t r i ci n v a r i a n c eo ft h ei n v a r i a n t m o m e n t ,i th a s b e e n u s e di n p a t t e mr e c o g n i t i o n ,c o m p u t e r v i s i o na n d i m a g e r e c o n s t r u c t i o n t h ew a v e l e tm o m e n ti sac o m b i n a t i o no ft h ew a v e l e ta n a l y s i sa n dt h e i n v a r i a n tm o m e n t ,i th a st h ea d v a n t a g e so ft h eb o t h o ft h e m ,s oi ti sv a l u a b l ef o rt h e e n g i n e e r i n ga p p l i c a t i o n s t h er e s e a r c hw o r kf o c u s e so nt h ew a v e l e tm o m e n ta n dc o n t e n t b a s e di m a g e r e c o g n i t i o n am e t h o do fi m a g er e c o g n i t i o nb a s e do nw a v e l e tm o m e n ti sp r o p o s e d t h e p r i n c i p a lr e s e a r c hw o r ka r el i s t e da sf o l l o w s : 1 n l e t y p i c a ls y s t e mo fi m a g er e t r i e v e a r ei n t r o d u c e d 1 1 1 e i rc h a r a c t e r i s t i c sa n d a p p l i c a t i o na r e a sa r ea n a l y z e d ma d v a n t a g e sa n dd i s a d v a n t a g e so ft h ec o l o r ,t e x t u r e ,s h a p e f e a t u r eo ft h ei m a g ea r ec o m p a r e d 1 1 1 em e t h o d so fh o wt oe x t r a c tc o l o r ,t e x t u r e ,s h a p ef e a t u r e o f t h ei m a g ea r ea n a l y z e da n dt h et y p i c a lm e t h o d sa r ei n v e s t i g a t e d 2 t os o l v et h el a c ko ft r a n s l a t i o n , r o t a t i o na n ds c a l i n gi n v a r i a n c e w h e nw a v e l e ta n a l y s i s u s e di nc o n t e n t - b a s e di m a g er e c o n s t r u c t i o n t h ew a v e l e tm o m e n tt h a tc o m b i n e do ft h e w a v e l e ta n a l y s i sa n dt h ei n v a r i a n tm o m e n ti si n t r o d u c e d t h ew a v e l e tm o m e n ti su s e dt o e x t r a c tt h ef e a t u r eo fi m a g e s n l es o f t w a r eb a s e do nt h ew a v e l e tm o m e n t si sd e s i g n e da n dt h e p a r to fi m a g ef e a t u r ee x t r a c t i o ni sc o m p l e t e d 3 t y p i c a li m a g e st h a ta d d e dn o i s ea n dr o t a t e da r eu s e di nt h ee x p e r i m e n t 1 1 1 ei m a g e f e a t u r e sa r ee x t r a c t e db yt h em e t h o do ft h ew a v e l e tm o m e n t c o m p a r e dw i t ht h ez e r n i k e m o m e n t t h ew a v e l e tm o m e n tf e a t u r e so fi m a g eh a v eab e t t e rr o t a t i o ni n v a r i a n c ea n dn o i s e i m m u n i t y 4 t h ei m a g ed a t a b a s eu s e di nt h ee x p e r i m e n ti ss e tu p t h ew a v e l e tm o m e n tf e a t u r e so f i m a g ea r ee x t r a c t e d e u c l i d e a nd i s t a n c ei su s e dt om e a s u r et h es i m i l a r i t yo fd i f f e r e n ti m a g e s t h ee x p e r i m e n tp r o v e dt h a tt h ei m a g ec o n t e n tr e c o g n i t i o nb a s e do nw a v e l e tm o m e n ti s f e a s i b l ea n da d v a n c e d i nt h ec a s eo fn o i s e ,t h em e t h o do ft h ew a v e l e tm o m e n tp r o v i d e s h i g h e rr e c a l lr a t ea n dp r e c i s i o nr a t et h a nt h ez e m i k em o m e n t k e yw o r d s :i m a g ec o n t e n tr e c o g n i t i o n ;i n v a r i a n tm o m e n t ;w a v e l e ta n a l y s i s ;w a v e l e t m o m e n t 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密日,使用本授权书。 ( 请在以上方框内打“”) 学位论文作者签名:舌f 2 谰 日期:- y oc dt “! i 指导老师签名三鸾茄l - 乏 日期:二刃扫 西南交通大学硕士学位论文主要工作( 贡献) 声明 本人在学位论文中所做的主要工作或贡献如下: 1 、将小波分析和图像的不变矩结合起来,利用小波矩来进行图像特征的提取,设 计了小波矩的算法软件,编制了基于小波矩的图像特征提取软件; 2 、以典型图像为研究对象,对其进行加噪、旋转,并用本文算法提取其图像特征, 分析图像小波矩特征的特性; 3 、建立实验图像库,提取图像的小波矩特征,利用欧氏距离来度量图像的相似度, 通过实验证明基于小波矩的图像内容识别的可行性和先进性。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名:钾键 日期:矽沪、s 、3j 西南交通大学硕士研究生学位论文第1 页 1 1 引言 第1 章绪论 随着科学技术的进步,图像的应用已经深入人们生活的方方面面,例如:医学图 像、自然风景图像、人脸图像、电力设备图像等。每天面对极大量的图像,如何对它 们进行存储、识别、分类等已经成了一个很大的问题,单靠人工的处理已经远远不能 满足人们的需要。如何让计算机能对图像内容进行自动识别也就成了现今图像研究领 域的热点。 将小波变换用于图像内容识别,现在已有很多学者对其进行了研究。其主要优点 在于小波分析强大的时频分析能力,使得图像的特征能得到很好的表征。但是小波变 换用于图像内容识别中有个很大的缺点,那就是缺乏平移不变性,只要图像很小的移 动就会导致各尺度上的小波系数发生较大变化,从而影响识别的准确性和效率。 图像的不变矩1 2 j 特征在图像识别上也有大量的应用。一个从一幅数字图像中计算出 来的矩集,通常描述了该图像形状的全局特征,并提供大量的关于该图像不同类型的 几何特性信息。如果一幅图像被认为是一个二维密度分布,那么与空间位置有关的像 素值的几何矩 3 1 函数就能够提供该图像的形状信息,例如,图像矩心的坐标以及图像的 方位。这些形状特点能被进一步用于构造特征矢量,而这些特征矢量在图像的平移、 旋转和缩放时保持不变1 3 j 。 为了解决图像的平移、旋转及缩放不变性问题,本文把图像的不变矩用于小波变 换中,将小波变换与图像的矩特征结合起来,得到图像的小波矩【4 】特征,从而很好的弥 补小波变换用于图像内容识别缺乏平移不变性的不足,又能抵消图像的高阶矩对噪声 敏感的弱点。因此,将小波矩特征用于图像内容识别中能提高识别的效率和准确性, 特别是在图像发生位置变化或含有噪声的情况下,能达到较好的识别效果。 1 2 国内外研究现状 1 2 1 图像内容识别研究现状 图像识别就是在图像的物理内容中找出图像之间的共性,把具有同一共性的分为 一类,而具有另一种共性的归为另一类。一个典型的图像识别系统可以分为四个主要 西南交通大学硕士研究生学位论文第2 页 , ii _ i ii - 一 i 舅曼曼曼曼曼曼曼曼曼! 曼皇曼曼曼曼曼! 舅曼皇曼量 部分。第一部分是图像信息的获取,它相当于对被研究对象的调查和了解,从中得到 数据和材料,也就是把图像等信息经过系统输入设备数字化后,输入计算机以备后续 处理。第二部分是图像预处理,其目的是去除干扰和噪声,将原始图像变成适合于计 算机进行特征提取的形式。第三部分是图像特征的提取,它的作用在于把调查了解到 的数据材料进行加工、整理、归纳以及去伪存真,抽出能反映事物本质的特征。第四 部分是判断,也就是匹配,即根据提取的特征参数,采用某种分类判别函数和规则, 对图像信息进行分类和辨识,得到识别的结果【5 j 。 图像识别的应用非常广泛,如在犯罪与安全预防、医学和遥感图像分析和处理、 数字图书馆、知识产权保护等方面的应用。 l 、犯罪与安全预防 安全部门可以将人的主要特征( 如指纹和人脸) 的图像存储在数据库中,通过指 纹识别和人脸识别就可以从大量的指纹库或者人脸库中自动识别出特定的目标。 互联网的发展带来了一个负面的影响,即网上不健康内容的大量增加,特别是黄 色图片。在一些情况下需要对这些信息进行过滤,图像内容识别就完全可以应用到类 似的图像过滤中。 2 、医学和遥感图像分析和处理 尽管传统的图像处理领域早就开始涉足医学和遥感图像分析和处理,但医学和遥 感图像的大量应用使图像规模大幅度的增加,因此有效、快速的图像分析和处理重要 性日益突出。无论是民用还是军用,医学和遥感图像的计算机自动图像内容识别都具 有重大的现实意义【6 】。 3 、数字图书馆 网络已经渗透到人们的日常生活中,除了文本资源外,网上还存在非常丰富的图 像资源。新一代的网上搜索引擎应该能使用户从海量且无序的网上图像资源中寻找出 所需的图像。因此,图像内容的识别是数字图书馆不可或缺的部分。 4 、知识产权保护 许多知识产权的载体都是图像,最明显的就是商标和艺术作品。商标知识产权体 现在专用的文字描述和专用的图形标记两个方面。为了防止侵权,就要严格防止商标 图形的抄袭和过分相似。图像内容的识别可以对商标图形进行自动的审查,实现知识 产权保护。 西南交通大学硕士研究生学位论文第3 页 由于图像识别的重要性和广泛应用,近年来国外已经投入了大量的人力物力来进 行研究,开发出了一些比较成熟的基于图像内容的图像检索系统,主要有:i b m 公司 开发的q b i c 7 1 、v i r a g e 公司开发的v i r a g e 引、哥伦比亚大学开发的v i s u a l s e e k 9 1 和 w e b s e e k 9 】等,下面介绍一些具有代表性的图像检索系统。 1 、q b i c 国际商用机器公司i b m 的图像内容查询系统q b i c ( q u e r y b y i m a g ec o n t e n t ) 是第 一个商业化的基于图像内容查询的系统,已经在一些场合进行使用。例如:旧金山的 艺术博物馆中采用q b i c 以帮助查询艺术图片;加州大学d a v i s 分校的艺术和艺术历史 系利用q b i c 让学生和公众了解教师的信息。 它的系统结构包括图像入库、特征计算、查询阶段。它容许用户给出希望查询图 像或目标的形状、颜色、纹理等特征,然后系统以此为依据从图像数据库中搜索、浏 览和提取出库中满足条件的图像。 在q b i c 中,图像入库有三个步骤:采集图像,制作微缩图( t h u m b n a i li m a g e ) , 加入文字信息。特征计算时,特征可以是颜色特征、纹理特征或形状特征。q b i c 中使 用的颜色特征有彩色直方图和平均值;纹理特征使用的是粗糙度、对比度和方向度的 结合,这种表示方法是t a m u r a 提出的纹理表示的一种改进;形状特征主要有目标的面 积、各阶矩、圆形性、离心率和主轴方向等。 q b i c 支持基于例子图像、手绘图像查询,也可以直接利用颜色、纹理、形状特征 进行查询。查询可对整幅图像进行,也可针对图像中的某一目标。在使用颜色特征进 行查询时,用户可以指定各种颜色的百分比。在利用纹理特征进行查询时,用户可以 用给定的纹理库中选取有代表性的纹理图案;如果使用形状特征进行查询,q b i c 容许 用户指定已有目标,或者勾画草图来表示形状。如果以上查询方式都不能满足需要, 用户还可利用它们的组合来进行查询。 2 、v i r a g e v l r a g e 7 1 是由v i r a g e 公司开发的基于内容的图像搜索引擎。与q b i c 相似的是,它 支持颜色、颜色布局、纹理和结构的查询。但v i r a g e 更优越的地方在于,它支持上述 四种查询的任意组合。用户可以根据自己的查询需要调整4 个查询的权重。 v i r a g e 的核心是v i r a g ee n g i n e 以及在图像层上的操作。v i r a g ee n g i n e 主要有图像 分析、图像比较和图像管理三方面的功能。它能将查询引擎作为一个插件,既可以应 西南交通大学硕士研究生学位论文第4 页 曼皇曼曼皇曼曼曼量曼曼巴曼量曼曼曼! 曼! 皇曼皇蔓曼曼曼曼曼璺! 蔓l l ll l l | m m | l m 蔓 用到通用的图像查询中,也可以对其进行扩展并应用到特定的领域,因此,它在应用 上具有更高的灵活性。 3 、v i s u a l s e e k 和w 曲s e e k v i s u a l s e e k 是基于视觉特性的识别工具,其姊妹系统w e b s e e k 是一种面向互联网 的文本图像搜索工具,两者都是由哥伦比亚大学开发的。系统所采用的视觉特征是颜 色集和基于小波变换的纹理特征。为了加速识别过程,采用了基于二叉树的索引算法。 在系统结构上,v i s u a l s e e k 采用了与q b i c 相似的结构,但是v i s u a l s e e k 支持基 于视觉特征和它们之间的空间关系的查询。例如需要查找“日出“的草图,用户可以 把项部设置为红色,把底部设置为蓝色区域,这样比设置颜色百分比的查询方法有着 更高效的查询结果。比q b i c 更进一步的是,v i s u a l s e e k 还有着高效率的w e b 图像信 息识别检索,人机交互界面也更加友好,并支持用户直接下载信息。 目前国内图像内容识别的主要研究单位有中科院自动化所、浙江大学计算机系、 清华大学、国防科技大学多媒体实验室等,但都没有推出成熟的商用图像内容检索系 统。中科院计算机技术研究所开发的图像检索原型系统i m a g e s e e k l l o 】,实现了图像颜色、 纹理特征的自动提取及在此基础上的图像检索,同时该系统还能进行基于文本的图像 检索及标注功能,但是其对形状特征的图像检索尚未实现,还不能进行基于目标和区 域的图像检索功能。 虽然目前国内基于内容的图像检索系统还处在原型开发阶段,但是在图像内容识 别的应用上,很多学者做出了大量努力。王克如u l j 将图像识别用于作物病虫草害识别, 对作物的病虫草害做出快速诊断,研究实现了作物病虫草害的远程图像识别与诊断。 黄胜副1 2 】在矿物加工行业利用图像识别对浮选泡沫和精矿图像进行识别,对选矿厂进 行离线或者在线的控制,实现选矿的自动化操作。陈健美【1 3 j 提出了基于密度聚类的医 学图像识别方法及其算法,多特征融合的医学图像识别方法及其算法、基于融合特征 的医学图像关联识别方法及其算法等创新性研究成果,对医学图像识别研究、医学图 像自动诊断和临床医学早期诊断都具有重要意义。为了研究光照对人脸图像识别的影 响,胡元奎1 1 4 j 在对当前人脸识别技术中解决光照变化问题的方法进行分析的基础上, 提出了一种人脸图像的低维光照空间表示方法,并在此基础上实现了可变光照和可变 姿态下的人脸识别原型系统。邱振卫【l5 】为了提高别克车架焊接的检测速度,保证焊接 的质量,从而提高汽车生产线的自动化程度,针对焊缝图像识别中面临的容错性和检 西南交通大学硕士研究生学位论文第5 页 测速度问题,提出了一种新型的焊缝图像识别方法。 1 2 。2 小波矩的研究现状 自从1 9 6 2 年由h u l l6 j 利用代数不变量理论提出矩不变量的概念,并且将其运用到 自动特征识别中,矩不变量就开始在图像识别中被广泛的应用,但是能很好描述图像 细节的高阶不变矩计算量大,且对噪声敏感,因此限制了图像矩不变量在图像识别中 的应用【2 1 。 为了克服高阶矩不变量容易受到噪声干扰的的缺点,d s h e n n 等首先提出了小波矩 不变量,其优越的辨别力和对噪声的低敏感性,很快就应用到多个领域,例如:医学、 智能交通和军事等各方面。 刘刈文【17 】在智能交通系统中利用小波矩进行自动车型识别,并通过实验证明yd , 波矩特征在自动车型识别中的有效性。 张琦、樊养余利用小波矩对海上军事目标进行自动识别。实验证明,小波矩特 征在海上目标识别中具有稳定性、可行性和有效性,为研制智能判读系统提供了参考。 孙晓丽【1 9 等通过实验提取发生平移、旋转、缩放和含有噪声的飞机目标图像的h u 矩、z e m i k e 矩【2 0 】和小波矩,统计其数据。证明了小波矩的特征变化率比h u 矩和z e m i k e 矩低,且小波矩特征拥有更好的识别率。 杨蕊红【2 1 】等引入小波矩不变量用于飞机图像的识别,并针对小波矩不变量特征维 数多的情况,采用结合离散度和顺序前进法的特征选择方法。先离线选取一组较优特 征量,再将这组特征用于飞机在线识别中,取得了较好的识别效果。 姚玉荣,章毓晋【冽等用小波模极大值法提取出亮度函数的特征向量,实验结果表 明,该算法用于服装图像数据库能较好地描述图像的形状及空间分布信息,并具有较 好的平移、缩放、旋转不变性。在更为复杂的花卉图像数据库中也得到了较好的结果。 季虎,孙即祥,姚伟【2 3 j 等从一般特征矩的定义入手,导出极坐标系下图像的小波 矩,进而给出对图像进行多分辨小波变换后,利用任一尺度下的逼近系数构造小波矩 和基于小波模极大值边界图像构造小波矩两种方法。 吴建华,王铮【2 4 】将小波矩不变量引入零水印技术中,提出了一种基于小波矩的零 水印算法,并给出了算法的具体实现过程和实验结果,实验表明算法对于常见的几何 攻击、压缩攻击和噪声攻击等具有较好的鲁棒性。 西南交通大学硕士研究生学位论文第6 页 王耀明,刘挺【2 5 1 介绍了在r a d o n 变换下的图像不变矩特征的抽取方法,并得到图 像的不变矩特征矩阵;进而对不变矩特征矩阵按行向量进行小波变换组成矩小波描述 子特征矩阵,采用矩阵的加权欧氏距离作为人脸图像的匹配识别算法,产生较好的结 果。 李晓兵,潘泓,夏良正【2 6 】等提出了一种基于投影的多尺度小波矩快速算法。该方 法通过投影变换将二维图像小波变换低频分量信息投影到一维空间中,从而降低了多 尺度小波变换不变矩的计算复杂度,提高了计算速度,同时也使计算精度得到保证。 秦磊【2 7 】利用h a a r 小波【2 8 】函数和三次b 样条小波例函数来构造小波矩不变量,将 它们应用到汉字识别中,在z e m i k e 矩识别效果进行比较后,得出了小波矩在汉字识别 中比z e m i k e 矩识别能力好的结论。 高立志,方勇,林志航【3 0 】等对图像进行了多分辨分解,并利用某一尺度的小波逼 近系数对矩进行了描述,在对图像进行小波分辨分解过程中得到了图像的小波矩不变 量,并把小波矩的概念推广到n 维多分辨空间中,给出了小波矩的通用表达式。 1 3 本文的主要内容 本文研究的重点是基于小波矩特征的图像内容识别技术,将结合了小波分析和不 变矩特点的小波矩用于图像内容识别。利用图像小波矩特征的平移、旋转、缩放不变 性和良好的抗噪声干扰能力【2 1 1 ,对图像进行特征提取,并计算特征的欧氏距离度量图 像的相似度,对图像进行识别。具体的工作分为以下几个步骤: 1 、介绍图像识别的应用和常用的图像检索系统,分析图像颜色、纹理、形状特征 的提取方法,并对典型的图像特征提取方法进行探讨,比较、分析它们的优缺点和应 用范围。 2 、阐述传统不变矩理论,介绍几种常用的不变矩,探讨将小波分析用于传统不变 矩的构造,给出了构造小波矩的三种方法,并说明小波矩用于图像内容识别的优点。 3 、将结合小波分析和不变矩特点的小波矩用于图像内容识别,介绍小波基的选取 原则和几种常用的小波基。 4 、以典型图像为研究对象,对其进行加噪、旋转,并用本文算法提取其图像特征, 与z e r n i k e 矩图像特征进行比较,结果表明:小波矩图像特征具有较好的图像旋转不 变性和抗噪能力。 西南交通大学硕士研究生学位论文第7 页 曼曼曼曼曼曼曼曼曼曼舅曼曼皇曼曼曼曼曼曼詈曼曼曼! 皇曼曼i i ; 一一一。鼍曼曼曼曼曼曼曼曼皇曼曼曼曼曼皇曼曼曼皇曼蔓曼曼 5 、建立实验图像库上,提取图像的小波矩特征,利用欧氏距离来度量图像的相似 度。通过实验证明了基于小波矩的图像内容识别的可行性和先进性。在噪声干扰的情 况下,小波矩方法比z e r n i k e 矩方法有着更高的识别率。 西南交通大学硕士研究生学位论文第8 页 第2 章图像内容识别技术 图像能够提供丰富的内容以供识别,图像内容识别的基本方法是先建立图像库, 对图像库中的图像进行图像分析,然后提取图像或目标的特征向量,并将图像对应的 特征向量也存入与图像库相连的特征数据库。然后通过对样本的特征向量按照一定的 对应关系与特征库中的特征向量进行匹配,根据匹配结果就可以在图像库中搜索出所 需要的图像。 目前常利用图像的颜色、纹理、形状等特征来进行图像内容识别。 2 1 基于颜色特征的图像内容识别 颜色特征是人们能够获得的最直观、最明显的特征,是图像内容组成的基本要素。 颜色特征对图像本身的尺寸、方向依赖性较小,具有天然的平移、旋转不变性 9 1 ,并且 颜色特征的提取相对纹理和形状特征要容易一些,因此颜色特征也是图像识别中应用 得最多的一种特征。要利用颜色特征来进行图像识别,首先需要确定两个问题【3 1 】: 1 、选择合适的颜色模型; 2 、确定表达图像颜色信息的特征; 2 1 1 颜色模型 要对颜色特征进行表达,首先需要建立颜色模型。通常,一种颜色可用三个基本 量来描述,建立一个三维坐标系统就可以建立一个颜色模型。三维坐标系中的每个空 间点都代表一种颜色。 c m y k 颜色模型是印刷输出经常使用的,其中包含青( c y a n ) 、品红( m a g e n t a ) 、 黄( y e l l o w ) 、和黑( b 1 a c k ) 四种基本色,用减色法来混合出各种颜色。 常用的c r t 显示屏使用的是r g b 颜色模型,即利用红( r e d ) 、绿( g r e e n ) 、蓝 ( b l u e ) 三种基本颜色,配制出人眼所能看到大部分的颜色。r g b 颜色模型可以建立 在笛卡尔坐标系上,三个轴分别为r ,g ,b ,见图2 1 。原点对应黑色,离原点最远 的顶点为白色。在这个模型中,从黑到白的灰度值分布在从原点到离原点最远顶点间 的连接线上,而立方体内其余各点对应不同的颜色,可用从原点到该点的向量表示【3 2 1 。 西南交通大学硕士研究生学位论文第9 页 i ii i _ a m_ i r a ml。 一 皇! 曼曼曼! 曼! 曼曼曼曼曼曼曼曼鼍曼曼曼曼曼曼曼曼皇曼曼曼曼曼曼曼曼! ! 曼! 曼曼 b g r 图2 - 1r g b 的彩色立方体模型 h s v 模型,即色度( h u e ) 、饱和度( s a t u r a t i o n ) 、亮度( v a l u e ) 是基于人类感知 所建立的颜色模型【3 3 】。在h s v 颜色模型中,色调h 表示从一个物体反射过来或透过 物体的光波长;亮度v 是颜色的明暗程度;饱和度指的是颜色的深浅,如同样是蓝色, 会因浓度不同而分为深蓝和浅蓝。 y u v 颜色模型是被电视系统所采用的一种颜色编码方法,其中的y 、u 、v 几个 字母不是英文单词的组合词,y 代表亮度,u v 代表色差,u 和v 是构成彩色的两个 分量。模型中颜色的向量可以由r g b 模型通过线性变换得来。 不同的颜色模型用于图像识别有着不同的识别效果。y u v 颜色模型对亮度不敏感, 可以减少亮度的变化对图像识别造成的影响,因此,颜色模型用于光照条件变化 较大的图像中有着更好的识别效果。 2 1 2 颜色特征的表达 对颜色特征的表达有许多种方法,如颜色直方图、颜色布局法,中心矩法等。其 中颜色直方图计算简单,且具有旋转、比例等不变性【3 4 】,因此被广泛的应用于图像识 别中。下面对颜色直方图进行简单的介绍。 颜色直方图的核心思想是在一定的颜色空间中对图像中各种颜色出现的频率进行 西南交通大学硕士研究生学位论文第1 0 页 统计,直方图的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的像素 在整幅图像中所占的比例。它实际上是一个1 d 的离散函数,即 日( 垆斋 ( 七= 0 ,1 ,上_ 1 ) ( 2 1 ) 式中七代表图像的特征提取,三是特征可取值的个数,仇是图像中具有特征值为k 的像素的个数,是图像像元数。 颜色直方图可以基于不同的颜色模型,其所描述的是不同色彩在整幅图像中所占 的比例,而不关心每种色彩所处的空间位置,也就是说无法描述图像中的对象或物体 【3 5 1 。因此颜色直方图适用于描述那些难以进行自动分割的图像和不需要考虑物体空间 位置的图像。 2 1 3 颜色关联图方法 由于颜色直方图无法捕捉颜色组成之间的空间关系,j i n gh u a n g 提出了颜色关联图 0 6 的方法。用颜色关联图来表示像素对随距离大小呈现的分布状态。 1 、特征提取及描述 对一幅图像,颜色量化数目为m ,q ,c :,c ,表示不同的颜色值。对一个像素点 尸( x ,y ) ei ,丁0 ) 表示该像素的颜色值。令疋垒l 丁0 ) = c ) ,则p 疋等价于p , r ( p ) - - c 对于任意两个像素p l = g ,y 。) ,p := g :,y :) ,定义 七= l a p :坠m a x x 1 - - x 2 i ,i 乃一儿i 。用符号k 】代表 1 ,2 ,玎) 。 定义:v c ,f k 】,令皿,u ) 代表图像,中颜色为q 的像素的总个数。设图像大小 为玎,z 。 则颜色直方图定义为: 怍尸b 旺 :掣 ( 2 2 ) 式中,h e ( ,) 表示图像,中任意一个像素的颜色值为c ,的概率。 (,)表示图像中颜,he, 色为c 的像素的个数。从考虑颜色概率分布角度出发,提出:从图像,中任取一个颜色 西南交通大学硕士研究生学位论文第11 页 为c ,的像素p 。,在和p l 相距为k 的任意一点p 2 ,p 2 的颜色为c j 的概率是多少? 即可以 通过定义条件概率来描述像素颜色间的空间关系。 k 表示像素间距,对于f ,k 】,图像i 的颜色关联图定义为: r 2 , ( z ) 竖t p :疋,i p ,一p :l = k i p 。t c jj ( 2 3 ) 颜色自关联图定义为: 口箩( ,炒篡( ,) ( 2 4 ) 它只捕获相同颜色间的空间联系,更易于计算。 2 、颜色关联图的计算 唑乞( ,途l 扫,t c z9 段i ,i i p 。一p :l = 七j ( 2 5 ) 上式统计了距离为k 的颜色分别为c ,c ,的颜色对的个数。在统计时,只有直方图 大于所设阂值的值才参与运算( 阈值随着k 值的增大而增大) 。采用阈值是为了消除由 于噪声引起的颜色干扰,这些干扰通常是随机的,值也很小。 如果忽略边界条件,设c 1 ,c :分别代表任意两个像素p 。,p :的颜色,则 p g - = = 印卜仍l = 七) = 羔 ( 2 6 ) 分母表示图像,中距离为k 的像素对的总个数,分子即是式( 2 5 ) 的统计值。对于 每一个像素,和它距离为k 的像素的个数为8 k 。由此得到条件概率: e ( c 2 - - c jp 。一p :l = 七l q = q ) = ! 丛鱼二二生薏乏掣 :i , 2 雨掣:善盟 7 ) = l 一= - 二_ 一 z ,j 皿o ) 胛2x 8 kh 。( i ) x 8 k “7 上式即所要计算的y 缫,的值。 颜色关联图方法,考虑到相邻像素之间的位置关系,是一种更合理的颜色统计分布 描述。与传统直方图方法相比,颜色关联图方法既结合了图像空间信息,又保留了颜 色直方图的优点,是一种适于识别医学影像图片的图像识别算法【3 7 】。 西南交通大学硕士研究生学位论文第12 页 2 1 。4 基于颜色特征的图像内容识别存在的主要问题 目前大多数基于颜色特征的图像内容识别采用的是h s v 颜色模型。h s v 颜色模型 和人对颜色感知是基本相一致的,但关于两种颜色之间相似度的定义和人眼对相似颜 色的判定仍有一定的差距。各种形式的颜色直方图是表示颜色特征最常用的方法,一 般指定相同的颜色集,采用几十到几百维的高维直方图,但实际上人眼对两图像画面 的颜色相似性判定主要考虑少数几种主要的颜色。不同的图像有不同的颜色集,对包 含不同颜色集的两图像之间的相似性判定仍需要进一步研究。 另外,颜色特征对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不 能很好的捕捉图像中对象的局部特征。 2 2 基于纹理特征的图像内容识别 一谈到纹理,人们可能会想到木制家具上的木纹,也可能想到衣服布料上的花纹。 木纹是天然纹理,花纹是人工纹理,它们都反映了物体表面颜色和灰度的某种变化, 而这些变化又与物体本身的属性是相关的【3 8 】。例如:同一个树种的木材有相同或相近 似的纹理,人们可以通过识别木纹来识别木材的树种和材质。又如沙漠的图像和森林 的图像有着明显不同的纹理特征,沙漠的灰度变化较慢而森林的灰度变化较快。 虽然人们每天都在应用大量的纹理特征,然而目前仍然没有对纹理给出确切的定 义【3 9 】。一般认为,纹理有三个主要标志: ( 1 ) 某种局部的序列性在比该序列更大的区域内不断重复; ( 2 ) 序列是由基本部分非随机排列组成的; ( 3 ) 各部分大致都是均匀的统一体,在纹理区域内的任何地方都有大致相同的结 构尺寸。 这个序列的基本部分通常被称为纹理基元。因此,也可以认为纹理是由纹理基元 按某种确定性的规律或者某种统计规律排列组成的。按照确定性规律排列组成的纹理 称为确定性的纹理,由某种统计规律排列组成的纹理则称为随机性纹理。 2 2 1 纹理特征的描述 从人类的感知经验出发,纹理特征有粗糙性、方向性和对比度等 4 0 1 ,这些也是用 西南交通大学硕士研究生学位论文第13 页 - - m n蔓n n m o 曼曼 于图像识别的主要特征。目前主要的纹理描述方法有统计法、结构法和频谱法三种。 统计法通过统计图像中灰度的分布来提取纹理特征。结构法主要是针对规则的结构纹 理。频谱法借助于傅利叶频谱的频率特性来描述周期的或者近似周期的2 d 图像模式 的方向性【4 1 】,这些方法也常常结合起来使用。 1 、统计法 统计法常用于分析像木纹、沙地、草坪等细致而不规则的物体,并根据关于像素 间灰度统计性质对纹理规定出特征及特征与参数间的关系。 人眼所观察到的图像中的纹理基元对应于一定概率分布的灰度直方图,它们之间 存在着一定的对应关系。根据这个特点,可以让计算机来进行两个适当大小的图像窗 口的纹理基元的分析和计算。其具体步骤如下: ( 1 ) 选择合适的邻域大小; ( 2 ) 对每一个像素,计算出其邻域中的灰度直方图; ( 3 ) 比较求出的直方图与已知的各种纹理基元或含有纹理基元的邻域直方图间的相似 性,若相似,则说明图像中可能存在己知的纹理基元; ( 4 ) 比较不同像素所对应的直方图间的相似性,从中可以发现纹理基元排列的周期性、 疏密性等特征。 2 、结构法 结构法的基本思想是假定纹理模式由纹理基元以有规律的形式重复排列组合而 成,于是特征提取就变为确定这些基元并对它们的排列规则进行定量分析。结构分析 法适用于像布料的印刷图案或砖瓦等图像。因为这一类图像的纹理基元排列比较规则, 可以根据纹理基元及其排列规则来描述纹理的结构及特征、特征与参数间的关系。 3 、频谱法 频谱法是将图像由空间域转化到频域,进而由频域特征进行处理的一种方法。此 种方法在提取图像纹理特征方面得到了成功的应用,并取得了较好的效果【4 2 1 。由于传 统傅立叶变换在分析中的缺陷,g a b o r 改进了传统傅立叶变换,为分析加上一个“窗口”, 这样正好适用于图像纹理的提取。但是g a b o r 窗口一旦确定就不能改变,不能很好地 聚焦到信号的任意细节。小波分析是在傅立叶分析的基础上发展起来的,弥补了傅立 叶分析在应用中的许多缺点和不足,其在图像纹理识别上的应用十分普遍。 下面介绍一种利用灰度共生矩阵的各种统计量来进行纹理识别的方法。 西南交通大学硕士研究生学位论文第1 4 页 2 2 2 利用灰度共生矩阵统计量的纹理描述方法 h 锨l i c k f 4 3 】首先提出用灰度共生矩阵表示纹理特征的方法。灰度共生矩阵是一种经 典的纹理描述方法,它的构造在众多文献中都有详细描述【4 4 ,4 5 1 。该方法的基本思路是: 首先建立一个基于像素间方向性和距离的共生阵,然后从矩阵中提取统计量作为纹理 特征。下面介绍一种利用灰度共生矩阵的反差、能量、熵、相关等4 个特征量来进行 纹理描述的方法【4 6 1 。 将图像的灰度级定为级,那么灰度共生矩阵为n xn 矩阵,可表示为m 触,m 触表 示位t - ( h ,七) 的元素,所触的值表示一个灰度为h ,而另一个灰度为| | 的两个相距为 ( 血,少) 的像素对出现的次数。 ( 1 )反差 c o n = ( 办一尼) 2 m 触 ( 2 8 ) 厶一一、 ,“ k ( 2 ) 能量 a s m = ( 掰触) 2 h k 能量是对图像灰度分布均匀性的度量。 ( 3 ) 熵 肿= 聊船l o g m 船j 一一 。“ h七 ( 2 9 ) ( 2 1 0 ) 当灰度共生矩阵中各m 船数值相差不大且分散时,厨订值较大;若m 船的数值较集 中时,e 口值较小。 ( 4 ) 相关 c 锹2 古c 莓;忍砌船鸭叫 ( 2 1 1 ) 式中,a ;,以和仃,仃y 分别是聊。,m y 的均值和标准差。m ,= 聊船是矩阵m 膏 中每行元素之和;m y = m 船是矩阵m 中每列元素之和。相关是用来描述矩阵中行或 列元素之间相似程度的,它是灰度线性关系的度量。 在纹理特征的提取中,先把图像的亮度分量图分成6 4 个灰度级,并构造四个方向的 西南交通大学硕士研究生学位论文第15 页 共生矩阵即m ( o ,1 ) 、m ( 1 ,o ) 、m ( 1 ,1 ) 、m ( 1 ,一1 ) ,然后分别计算四个共生矩阵的上述4 个纹 理特征,最后以各参数的均值和标准差即c d 、仃c d 、删、仃删、肿、盯肌、 i 比c o r 、o c o r 作为纹理特征向量中的各个分量。 对特征向量进行归一化后,即可按照欧氏距离匹配算法来进行图像识别。 文献 4 6 1 利用上面介绍的纹理识别方法,对花卉图像进行识别。在花朵的形状大小 相差较大的情况下,此方法能达到比较好的识别效果,但是在花朵的形状大小相差不 大的情况下,识别能力不足。 2 2 3 基于纹理特征的图像内容识别存在的主要问题 基于纹理特征的图像内容识别技术目前存在的主要问题是纹理特征的具体性,即 各种方法所选择的纹理特征集依赖于具体的纹理图像,往往是一种方法所选择的纹理 特征集对表达一个纹理图像库比较有效,但如果换为另一个纹理图像库来说也许就达 不到好的识别效果。因此,对于不同的纹理图像库之间如何进行纹理特征集的自动切 换,即纹理图像库之间的通用性,仍需要大量的研究。此外,当图像的分辨率变化时, 所计算出来的纹理可能会有较大的偏差【3 2 | 。 2 3 基于形状特征的图像内容识别 形状特征是图像内容的一个明显特征【3 羽。同一种物体可能有各种不同的颜色,但 其形状总是相似的,所以很多识别可能并不针对图像的颜色,而是针对图像的形状。 例如:识别某种汽车的图像,汽车可以是不同颜色的,但同种类的汽车形状一般不会 相差太大。另外,对于一些简单的图形来说,形状可以说是它唯一重要的特征。例如: 由简单线条组成的图形。 2 3 1 形状特征的描述 如何实现基于形状特征的图像内容识别,关键在于对形状特征的描述【4 7 】。目前对 形状特征的描述大多从形状的轮廓特征和形状的区域特征来入手。形状的轮廓特征是 从图像中提取的目标边缘。对轮廓特征的描述主要方法有:边缘方向直方图、傅里叶 西南交通大学硕士研究生学位论文第16 页 形状描述子和边缘曲线等。形状的区域特征利用区域内的灰度分布信息。其描述方法 有不变矩方法、小波重要系数法。下面对傅里叶描述子和小波重要系数法两种经典的 描述方法进行介绍。 ( 1 ) 傅里叶形状描述子 傅里叶形状描述子的基本思想是用对象的傅里叶变换作为其形状描述。假设一个二 维对象的边界是由一系列坐标为g ,y s ) 的像元组成,其中0 s n 一1 ,n 是边界上像 元的总数。对象的三种形状表达:曲率函数( c c u r v a t u r ef u n c t i o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江西吉安市青原区司法局招聘2人考试备考试题及答案解析
- 2025甘肃中铁西北科学研究院有限公司评估中心招聘考试备考试题及答案解析
- 2025年康复医疗服务体系与康复医疗设备产业协同发展报告
- 2025年数控机床智能化升级技术路径与产业变革报告
- 2025年消费金融用户画像精准营销策略与行业动态报告
- 合肥市二手房市场价格的多维度解析与影响因素探究
- 合成孔径雷达快速时域成像算法:原理、优化与应用探索
- 合作学习:开启高中生物教学的新征程
- 2025年足彩胜负彩过滤服务协议书范本3篇
- 教师招聘之《幼儿教师招聘》能力检测试卷附答案详解(黄金题型)
- 当代世界经济与政治第二章课件
- 初级社会工作实务全本课件
- PS考试试题及答案
- 新都区文化产业发展建议报告
- 时代邻里4度°服务美学品质关怀体系
- 养老机构行政值班查房记录表格
- EPC合同条件(银皮书)-1999
- 外研版五年级上册英语(全册)单元教材分析
- 华为-计划、预算和核算
- 细胞凋亡和细胞自噬(课堂PPT)
- 第一章光的电磁理论ppt课件
评论
0/150
提交评论