(系统理论专业论文)基于粗糙集理论的图像检索.pdf_第1页
(系统理论专业论文)基于粗糙集理论的图像检索.pdf_第2页
(系统理论专业论文)基于粗糙集理论的图像检索.pdf_第3页
(系统理论专业论文)基于粗糙集理论的图像检索.pdf_第4页
(系统理论专业论文)基于粗糙集理论的图像检索.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要随着计算机硬件的发展,图像作为一种信息载体,越来越多地应用于信息技术。从而基于图像内容的检索也逐渐成为人们的研究热点。本文主要有两部分的内容。第一部分是基于颜色的记忆性图像检索,另外一部分为基于粗糙集理论的形态学算子。第一部分避开图像相似度大小的定义,通过决策表理论解决图像的分类与检索问题。颜色的特征提取主要依据颜色的面积排序,同时考虑了颜色的空间分布关系。然后基于关系理论,得到一种图像的约筒方法。第二部分从数学形态学算子与粗糙集中的上下近似算子的关系入手,指出了形态学运算膨胀与腐蚀,开与闭,分别可视为相似关系下的两对上下近似算子,并构造出新的形态学算子。实现该算子,发现该算子的良好性质。关键词:图像检索图像约简基于粗糙集的知识获取决策表数学形态学基于内容的图像检索a b s t r a c ti m a g ei sa p p l i e di ni n f o r m a t i o nt e c h n o l o g ym o r ef r e q u e n t l ya so n ei n f o r m a t i o nc a r r i e ra l o n gw i t ht h ed e v e l o p m e n to fh a r d w a r e t h u sc b i rb e c o m eh o tr e s e a r c hs p o t so fp e o p let h i sp a p e risf o r m e do ft w op a r t s t h ef i r s tp a r tisak i n do fs t o r ei m a g er e t r i e v a lb a s eo nc o l o r a n o t h e ri sa b o u tm o r p h o l o g yo p e r a t o r sb a s e do nr o u g hs e tt h e o r y t h ef i r s tp a r ta v o i d st h es i m i l a rd e g r e ed e f i n i n go fp i c t u r e s s 0 l v i n gc i a s s i f i c a t i o no fp i c t u r e sa n ds e a r c hp r o b l e mt h r o u g hr e l a t i o nt h e o r yc 0 1 0 r sa r ea r r a n g e db ya r e ai no r d e r w eu s em a i nc 0 1 0 ra st h ec h a r a c t e r i s t i co ft h ep i c t u r ea n dc o n s i d e rt h es p a c ed is t r i b u t i o no fc 0 1 0 r sa tt h es a m eti m e t h e nb a s e do nr e l a t i o nt h e o r y ,w eo b t a i nam e t h o do fi m a g er e d u c t i o n 。t h es e c o n dp a r ts t a r t sw i t ht h er e l a t i o nb e t w e e nm a t h e m a t i c sm o r p h 0 1 0 9 yf i l t e ro p e r a t o r sa n dh p p r o x i m a t i o no p e r a t o r sp o i n t i n go u tm o r p h 0 1 0 9 i c a ld 1l a t ea n de r o d e ,o p e na n dc l o s ec a nb er e g a r d e da sd u a la p p r o x i m a t i o no p e r a t o r si nr o u g hs e tt h e o r y ,a n dp r e s e n t ss o m en e wo p e r a t o r s g o o dq u a liti e sa r ef o u n do ft h en e wo p e r a t o r sk e yw o r d s :i m a g er e t r ie v a l :i m a g er e d u c t i o n :k n o w l e d g eo b t a i 1e db a s e do nr o u g hs e t ;p o l i c yd e c is i0 nt a b l e :m a t h e m a t ic a lm o r p h o lo g y ;c b i ri i昆明理工大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下( 或我个人) 进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不合任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在论文中作了明确的说明并表示了谢意。本声明的法律结果由本人承担。学位论文作者签名:黼矜日期:伽材年月侈日关于论文使用授权的说明本人完全了解昆明理工大学有关保留、使用学位论文的规定,即:学校有权保留、送交论文的复印件,允许论文被查阅,学校可以公布论文的全部或部分内容,可以采用影印或其他复制手段保存论文。( 保密论文在解密后应遵守)导师签名:肄论文作者签名:酶系:哈日期:丝! 篁生(旦l 旦1 1 引言第一章绪论近年来随着网络技术应用的普及和硬盘存储能力的增长,图像已经成为因特网上日渐重要的信息载体,人们越来越多地接触到大量的图像信息。媒体有大量新的信息并不断产生( 如卫星、医疗、安全等部门) ,对这些信息进行有效地组织、检索、管理显得越发重要,因而成为人们研究的课题。因特网上存在着海量图像,搜索引擎从网上搜索图像并建立图像库供用户检索。然而浏览这样太规模的图像库对用户来说是不可能的。对图像库中的图像进行分类使得大规模图像库的访问更为有效。传统上图像语义的表达方法是对图像或图像的某个区域进行文本注释,然后通过关键词来索引图像阳3 ( k b b ) 。这种方法对于以数字、字符为基础的传统数据库的管理来说不失为一种有效的方法。但是,基于文本的检索存在的主要问题是:查询时需要指明图像的文本特征,要求用户对文本特征的描述具有定的准确性和规范性。而大多图像的文本信息难以描述,不同的人对同一幅图像的描述往往大相径庭。因而,文本描述具有二义性。另一方面,图像内容丰富,人们对于图像的描述难免失之片面。这样,由于图像注释的主观性和不完备性,不能保证检全率。目前引起人们重视的另一种方法是基于相似性的检索( s b r ) 。基于相似性的检索方法提取查询图像的特征向量并搜索图像库,寻找特征向量与之最相近的图像。其主要思想是根据图像所包含的色彩、纹理、形状以及空间特性等信息,建立图像的特征矢量作为索引。该方法允许可视化形式检索并适用于计算机,近年来有较广泛应用。极大地推动了图像数据库的发展。1 2 课题研究现状及前景所谓基于图像内容的检索c b r ( c o n t e n t - b a s e di m a g er e t r i e v a l ) 就是以图像内容语义为依据,在图像或多媒体数据库中查询与用户提供的参考图像、纹理、形状、颜色等能够反映图像内容特征相似或相同的图像的一种对数据库的查询技术。是从图像或多媒体数据库中快速获取所需图像的关键技术。基于内容的图像检索研究的问题主要有以下三个方面:l 、恰当的图像特征选取。1基于内容图像检索的基本框架b a s i cm o d e lo fc o n t e n t b a s e di m a g e r e t r i e v a l目前,对于通用的静止图像检索,用于检索的主要特征有颜色( c o l o r ) 、纹理( t e x t u r e ) 、草图( s k e t c h ) 、形状( s h a p e ) 等,其中颜色、形状、纹理应用比较广泛。现有的图形检索方法中应用最广泛的特征向量是各种形式的颜色直方图,如在1 r g b 或h s i 空间的直方图、累加直方图等作为区别图像之闻差异的特征向量。近年来在图像检索领域中的研究出现很多新的研究成果,这些研究大都有一个共同的特点,就是应用现有的各种工具和方法,如小波分析、概率论框架、模糊理论等,利用图像的多种综合特进行检索。国内外均已经开始了这方面的研究。国外许多大学、研究单位和公司投入了大量的人力物力进行了研究和开发。一些著名的大学和数据库商业公司也已经实现了一些基于内容的图像检索的有效系统。然而对于匿像相似度的度量是一个难以解决的问题。大量专家学者对此做出很多努力,提出了许多的方法。本文试着从另外的角度出发,避开相似度大小的定义,通过粗糙集理论解决图像的分类问题。粗糙集的特点是不需要预先给定某些特征或属性的数量描述,如统计学中的概率分布、模糊集中的隶属度或隶属函数等,而是直接从给定集合的描述出发,通过不可辨关系和不可辨类确定给定问题的近似域,从而找出问题的内在规律。在用户的信息不完整、不确定的前提下,仍能完成对事物的认识、分析、推理和决策。第二章图像的原始特征元素特征的提取是c b i r 的基础。c b i r 的特征主要是指视觉特征,如颜色、纹理、形状和对像的位置关系等。我们主要是按照图像的原始特征对图像进行分类。一般来说基于特征向量的图像分类算法通常从以下的思想出发“:每幅图像与特征空间中的一个点即特征向量相对应,图像之间的相似度由特征向量之间的距离来度量。已经标注的图像作为所属类的样本,对每个未标注的图像计算其特征向量与样本图像特征向量之间的距离,将它分到距离最近的样本所属类中。这其中有两个问题需要解决:特征向量的提取和特征向量之间的距离度量。然而基于特征向量的图像分类方法计算出的图像之间的距离有时候在视觉上很不直观。寻找合适的度量方法有相当的难度。本文不具体地定义图像之间的距离,利用特征元素表示图像,通过粗糙集的分类能力对海量图像进行分类管理。充分利用图像自身的信息,尽量少地加入主观因素,发挥客观因素的主导作用。基于内容特征的图像检索除了上述三个特征外,还包括物体的空间位置以及多尺度下的变换域系数等。2 1 颜色特征颜色是识别物体的重要特征之一,兼之与图像大小、方向无关,且对图像背景不敏感,因此被广泛应用于c b i r 。在文献中,很多种利用图像的颜色特征检索图像的方法已被提出”“”“”。根据不同的应用场合,图像的颜色表示方式各不一样。印刷输出是使用c m j b颜色模型,使用青色( c y a n ) 、品红( m a g e n t a ) 、黄( y e l l o w ) 和黑( b l a c k ) 4种基本颜色,用减色法来混合出各种颜色;而c r t 显示屏使用的是r o b 模型,利用红( r e d ) 、蓝( b l u e ) 、绿( g r e e b ) 三种基本颜色,可以配制大部分人眼所能见到的颜色,r g b 模型的混色原理是以加色法来混合,即各种颜色越加越亮;l * a * b模型是使用亮度和两个颜色分量a 、b 来表示颜色,a 分量表示颜色由红到绿,b分量则表示由黄到蓝的演变。另外一种基于感知的颜色模型是h s v 模型。它把彩色信号表示为三种属性:色调( h u e ) 、饱和度( s a t u r a t i o n ) 和亮度( v a l u e ) 。这种颜色模型用m u ss e l三维空问坐标系统表示。m u s s e l 颜色空问具有以下优点:坐标之f 白j 的心理感知独立性和线性伸缩性。所谓坐标之间的心理感知独立性是指各坐标可以独立地感知各颜色分量的变化。而线性伸缩性是指可以被人感知的颜色差与颜色分量相应样值上的欧几里德距离成正比。h s v 模型的色调h 表示透过物体的光波长,通俗来说是由颜色类别来辨别的。它在颜色轮上用角度来度量,通常取值范围为0 3 6 0 。亮度s 是是指颜色的明暗程度,通常用百分比度量。色度或饱和度s 则是用来表征颜色的深浅程度,通常也用百分比表示。给窟图像的r g b 颜色值,可以转换到h s v 空间。在这里我们给出转换公式盯1 :令v = m 旺( r ,g , b )则炉去f 。v - m i n ( r , g , b )i ff = m a x ( r ,g ,b )i fr - - m a x ( r ,g ,b )i fr = m a x ( r ,g ,b )i fg = m a x ( r 。g ,b )i fg = m a x ( r ,g ,b )a n dg f m i n ( r ,g ,b )a n dg m i n ( r ,g ,b )a n db = m i t l ( r ,g 。b )a n dg = m i n ( r ,g ,b )a n dr = m i n ( r ,g ,b )h = 6 0 x h 其中,r 、g 、6 定义为:r 。i i 面v i _ 丽r,g 。z i 五p - - 丽g,6 。而面v - - b 丽这里,r ,g ,6 0 , 2 5 5 涨嘶o 。濉【嘲,y m根据h s v 空间的特性,在降低直方图维数并保留足够多颜色信息的前提下,可以通过减少颜色的维数来达到节省存储空间的目的。我们对h s v 空间进行非均匀量化,得到5 2 种颜色“”。具体量化方法准则如下( 见图1 ) :( 1 ) 对于y s3 0 的颜色认为是黑色。c o d e = l( 2 ) 对于js 1 0 且v 2 0 的颜色按亮度v 划分为三种灰度:深灰( 2 0 ,5 0 、浅灰( 5 0 ,8 0 、白色( 8 0 ,1 0 0 。c o d e = 2 ,3 ,4( 3 ) 其它颜色认为是彩色,共划分为4 8 种颜色。c o d e = 5 + 6 h + 2 s + v( 4 ) 对于色度h 【0 ,3 6 0 。 划分为赤、橙、黄、绿、青、蓝、紫等八种色彩。门限分别为:3 0 ,6 5 ,1 0 0 ,1 6 5 ,2 0 0 ,2 7 0 ,3 3 0 。令h 取值为o 、1 、2 、3 、4 、5 、6 、7 。( 5 ) 对亮度v 划分为暗色( 2 0 ,5 0 和明色( 5 0 ,1 0 0 。v = 1 、2 。4) ) ) )扣掣扣扣+一+一+51133l(,、,li lh( 6 ) 对于饱和度s 划分为淡色( :1 0 ,3 5 1 ,中色( 3 5 ,7 5 和浓色和( 7 5 ,1 0 0 。s = o 、l 、2 。这样,按照上面的方法,薅们将颜色空间划分了4 + 8 。2 sx 3 ,;5 2 种颜色。每种颜色用对应区域中颜色的平均值表示。这5 2 种代表颜色的量化有效地压缩了图像的颜色特征并较好地符合人眼对颜色的感知特性。我们就以此表示图像的颜色特征。算法1 :1 将原图像由r g b 空间转化到h s v 空间;2 定义和原图像工大小相同的三维矩阵r ( m x l l 3 ) 和另外四个两维矩阵c o d e ( m n ) ,h h ) ,s ( m n ) ,y x n ) 3 i = l ,j = 1 验证h 、s 、v 在( i ,j ) 点的取值分别所在区间,令h ( i ,j ) ,s ( i ,j ) v ( i ,j ) 取值分别为我们给定的相应区间代码( h = 0 、1 、2 、3 、4 、5 、6 、7 ,s = 0 、1 ,v = 1 、2 、3 ) ,i =i + 1 ,j = j + 1 。w h i l ei = m ,j = n ,结束循环4 i = 1 ,j = l ,i fvs2 0 ,c o d e = o :i fss 1 0 且y 2 0 ,按v 划分为三个区间( 2 0 ,5 0 、( 5 0 ,8 0 、( 8 0 ,1 0 0 。c o d e 分别为t ,2 ,3 ,e l s e ,c o d e = 4 + 6 h 十2 s 十v ;令y ( i ,j ) 的h s v 取值为各区间的h 、s 、v 的平均值i = i + l ,j = j + 1 w h i l ei = m 或j = n ,结束循环5 返回矩阵几c o d e我们实现该方法,用代表颜色对图像进行了离散化曹。干面是运行结果:图1 利用了代表颜色后图2 原图f i g li m a g ei nr e p r e s e n tc o l o r sf i 9 2o r i g i a a li i l i a g e显然,图像按照这5 2 种颜色所构成的直方图维数相对降低,而且较符合人眼对颜色的感知。52 2 纹理和形状特征纹理是图像表面所具有的性质。我们将图像中局部具有不规则性,而宏观有规律的特性称之为纹理“。它也是图像的底层特征,但也被集中广泛地应用于基于内容地图像检索中。尽管纹理特征多种多样,但归纳起来为统计方法和结构方法。在应用时可根据图像的不同纹理特性选择相应的方法。人们通常选择以下统计量来描述图像的纹理特征。反差( 主对角线惯性矩) g :g 一暑乏( 一七) 2 川n对于粗纹理,由于研。的数值较集中于主对角线附近,此时( h k ) 的值较小,从而相应的g 值也较小。相反,图像的纹理较细的g 值也就相对较大。( 1 )能量j :卜;墨卅址|这是一种描述图像灰度分布均匀性的度量。当肌。的数值分布较集中于主对角线附近时,其相应的j 值较大:反之,若册。值较分散,则j 值较小。( 3 )自相关系数a :爿= 罗罗 l b ,l j 单一自相关用于描述图像矩阵中行或列元素之间灰度的相似程度。( 4 )熵s :sa 玳* l o g ( m n )当图像的灰度共生矩阵中各j ,l 。数值相差不大且较分散时,s 值较大;反之,若m 。的数值较集中时,s 值相应较小。间距( 缸,衄) 的选择可以根据目标图像的特点而加以调整。也可以选择多组( 血,a y ) 共同刻画图像,其特点是运算量大,但相对描述更精确。形状的概念相对而言比较明确。由形状特征来区别物体亦非常直观。形状特征表达的一条重要准则就是要求物体的平移、旋转和比例不变性。一般地,图像的形状特征也包括两类:全局特征与局部特征。全局特征指整个物体的圆度、环状度、中心矩、离心率以及矩不变量等。局部特征包括形状的外边界。傅立叶描述符用经过傅氏变换后的边界作为形状特征,用较少的参数可以包纳很复杂的边界。弹性变形模板、边界的方向直方图、小波描述算子等也是常用的描述形状特征的方法。3 1 粗糙集理论第三章理论基础1 9 8 2 年,波兰学者z p a w l a k 提出的粗糙集理论是一种数据分析理论“。该理论在数据的决策与分析、模式识别、机器学习与知识发现等领域已经有了非常成功的运用。作为一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问蹶的决策或分类规则。首先明确知识和知识库的概念。设u 一中是我们研究对象的集合,称为论域。任何子集x ,称为u 中的一个概念( 中也视为一个概念) 。称u 的概念族为u 上的知识。u 上的一族划分称为关于u 的知识库。设u 为论域,r 为u 上的一个等价关系。则r 决定了u 的一个划分u r 。定义x e u 的r 等价类为:【叫z := ( 雁,i ( 与力r )显然,等价关系r 决定u 的划分u r 是关于u 的一个知识库。这样,个知识库就是u 上的一个关系系统k = ( t j ,r ) ,其中u 为非空有限集( 论域) ,r 是u 上的一族等价关系。若p r ,且p 垂,则o p ( p 中所有等价关系的交) 也是一个等价关系,称为p上的不可区分关系,记为i n d ( p ) ,且有:( ,) = n i x 。月p设u 为论域,r 为u 上的一个等价关系,定义x e ,的r 等价类为:【石】。:= ( y e ui ( 丑力r )则p a w l a k 粗糙集石的上下近似分别为:a p r t x ;( xb 】rn x 西)a p rn x 一 xi 【工】ncx )( 1 )或a p rn x u 口】一t 陋】aa x 中)a p tn x ufhnm * c x ( 2 )称a p rw x 为x 的正域,u a p rn x 为x 的负域,a p rn x a p rn x 为x 的边界。则正域是根据知识r 能够将对象归入集合的元素组成的集合;负域是根据知识r 有不能归入集合j 的元素组成的集合;边界是不确定能否将对象归入集合j 的元素组成的集合。a p r 。x 则是所有可能划入集合的元素的集合。83 1 粗糙集理论第三章理论基础1 9 8 2 年,波兰学者z p a w l a k 提出纳租糙集理论是一种数据分析理论。该理论在数据的决策与分析、模式识别、机器学习与知识发现等领域b 经有了非常成功的运用。作为一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。首先明确知识和知识库的概念。设u 一中是我们研究对象的集合,称为论域。任何子集x ,称为u 中的一个概念( m 也视为一个概念) 。称u 的概念族为u 上的知识。u 上的一族划分称为关于u 的知识库。设u 为论域,r 为u 上的一个等价关系。则r 决定了u 的一个划分u r 。定义z e u 的r 等价类为:【z 】。:= ( y e e l ( 墨力r )显然,等价关系r 决定u 的划分u r 是关于u 的一个知识库。这样,一个知识库就是u 上的一个关系系统k = ( u ,r ) ,其中u 为非空有限集( 论域) ,r 是u 上的一族等价关系。若p r 。且p m 则np ( p 中所有等价关系的交) 也是一个等价关系,称为p上的4 ;可区分关系,记为y n d ( p ) ,且有:i z k 秭= n 防】一月p设u 为论域,r 为u 上的一个等价关系,定义x u 的r 等价类为:k 1 。:= 雁ul ( 丑力r )则p a w l a k 粗糙集x 的上下近似分别为:a p tr z ;( x i i x 】- n 丑# 由)叩r 。x h f b 】一c 并j( 1 )或a p tn z u k 】一1 p sn x 中)缈n xau ( 纠tmt c x )( 2 )称一a p t 。x 为x 的正域,u 一面,x 为t 的负域,万一x a p t 。x 为x 的边界。则乖域是根据知识r 能够将对象归八集合的元素组成的集合;负域是根据知识r 有不能归入集合j 的元素组成的集合:边界是不确定能否将刑象归八集合_ 的元素组成的集合。面。x 则是所有可能划入集合j 的元素的集合。元素组成的集台。面。x 则是所有町能划入集合j 的元素的集合。r如果集合j 满足a p r 。x a p r 。x ,称为精确集。粗糙集的不可定义性( 不确定性) 是由于粗糙集的边界不确定引起的。集合j 的边界越大,其确定性程度就越小。3 2 基于粗集理论的知识获取:决策规则【1 8 】人之所以有智能行为是因为人有知识。同样,要让机器有智能行为也必须让机器具有相应的知识。信息表知识表达系统的基本成分是研究对象的集合,关于这些对象的知识是通过指定对象的属性( 特征) 和属性僮( 特征值) 来描述的。一般地,一个信息表知识表达系统s 可以表示为:s = 。这里,u 是对象的集合,也称为论域;r = c u d 是属性的集合,子集c 和d 分别称为条件属性集和决策属性集;v = u r 是属性值的集合;k 是属性r 的值域:,:u r y 是一个信息函数,是丛指u 中每一个对象j 的属性值。对于每一个属性予集口r 我们定义不可辨二元关系i n d ( 口) :n p ) 一 y ) i o ,y ) e v 2 ,v b e b ( b ( x ) ;b ( y ) ) )在基于粗集理论的知识获取研究中,主要是通过归纳学习和观察发现式学习来得到知识的。归纳学习是通过对大量的实例进行推理归纳和对共性的分析,抽象出一般的概念和规则。通常,决策表包含了某一领域中的大量数据记录,是领域的实例数据库。知识获取的目的就是要通过分析这个实例库来得到该领域中有用的规律性的知识。定义公式如下:1 ( a ,v ) ( 表示属性a 的取值为v ) 是原子公式;原子公式是公式。2 如果a 和b 是公式,那么,a ,a - - , b ,a b ,( a ) ,av b 都是公式。3 只有按定义1 、2 所组成的公式是公式。公式a b 的逻辑含义称为决策规则,a 称为规则前件,b 称为规则后件,它们表达的是一种因果关系。事实上,a 表达的是决策表中的条件属性,b 表达的是决策表中的决策属性。决策表是一个信息表知识表达系统s = 。r = c u d 是属性的集合,子集c 和d 分别是条件属性集和决策属性集,d ,。在此我们只考虑袂策属性单的情况。4 公式( 口1 ,v 1 ) a ( 口2 ,v 2 ) ( 4 。,v 。) 称为p 基本公式,此处,v ,一9 a 1 ,口2 。) e p ,p c 。5 a b 是决策规则,如果a 是p 基本公式且b = ( d ,d ;) ,则a b 是基本决策规则。实际上,决策规则是基本决策规则的逻辑组合形式。任何一个决策规则都可以分解成一个或多个等价的基本决策觌则。在决策表s 中,如果所有的实例都满足决策规则a b ,则称决策规则a b在决策表s 中是协调的。我们就是要在决策表中寻找协调性较高的决策规则。让我们通过例子来看一下决策表的规则提取。下表给出了一个关于流感病人的决策表。其中u = ( e 1 ,e 2 。e 8 ) ,c = ( 头痛。肌肉疼,体温) ,d = ( 流感) 。c 1 = 取整( h , m 3 ) ,结束循环:j = 取整数 ( k - 1 ) * n 3 + l ,若j 取整数 k , n 3 ,结束循环;i fx ( i j ) = s ,z ( h ,k ,s ) = z ( h ,k ,s ) + 1计算h ,k 块处颜色s 的面积z ( h ,k ,s ) ;i = i + l ,j = j + 13 关于( h ,k ) 对z ( h ,k ,s ) 排序;h k l 、h k 2 、得到h ,k 块处的颜色排序( 关于面积)4 对于s ,求了z 伪,k ,s ) 得到颜色s 的总面积,排序枉5 将总面积的前三种颜色、各( h ,k ) 面积的前两种颜色代码赋值给y ;( 若颜色不足,赋值o ) 返回j ,;程序结束考虑图像中颜色的位置期望。此处我们不把图像颜色的具体期望点求出来,而是利用四叉树的思想,找出第一颜色与整体第一颜色一致的图像区。视该区为第一颜色的位置期望。同样也可以寻找其他颜色的位置期望。这样,我们提取的属性就更能够反映图像颜色的空间布局了。设图像整体颜色面积最大的颜色为f i ,我们把原图先行分成四个区域,对每一个区域的颜色按照面积排序。如果某个区域的面积最大的颜色就是c ,返回该区位置代码。否则计算每一个区域颜色c 的面积,取面积值最大的区,设为2 区;把2 区分成四个区域,重复上述步骤。至某个区域的颜色是c 为止。认为这个区的位置代码就是颜色c 的位置期望。( 如下表2 )表三:位置期望示意表t a b s :( l o c am 一一l 一一r如此,我们又得到了一组等价关系。2 2 、1 2 1 l 、1 2 1 2 、1 2 2 2 、2 1 l l 、2 1 2 l 、t i o no fc 0 1 0 r )此属性值的取值可能值为:1 1 、l2 、2 l 、2 1 2 2 、2 2 2 2 算法31 h = 1 ,2k = l ,2 ( m ,n ) = s i z e o f ( 舯:( m l ,n 1 ) = ( m ,n )2 i = 取整数( ( h - 1 ) * m 2 ) + 1 ,若i 取整( h , m 2 ) ,结束循环;j = 取整数 ( k 1 ) * n 2 + l ,若j 取整数 k , n 2 ,结束循环:f o r ( s = 1 ,s 5 3 ,s + + )i fx ( i ,j ) = s ,z ( h ,k ,s ) = z ( h ,k ,s ) + l 计算b ,k 块处颜色s 的面积z ( h ,k ,s ) :i = i + 1 ,j = j + 13 对于每一个块,关于面积对颜色排序。判断是否与整体第一颜色c一致,是转5 ,否转44 关于颜色c 的面积对块排序,令该块为j 转l5 返回该块位置代码程序结束我们把算法2 、3 计算出的结果排列,视为图像的属性。即属性r ( 肋= ( 整体最大颜色代码,整体第二颜色代码,整体第三颜色代码,区( 1 ,1 ) 最大颜色代码,整体第一颜色位置期望)实现算法2 ,3 我们计算出图b ) 的属性值为:r ( b ) = ( 4 4 ,1 ,0 ,4 4 ,4 6 ,1 ,4 4 ,4 4 ,1 ,4 4 ,4 ,l ,8 ,4 4 ,5 0 ,1 ,4 ,8 ,1 0 ,4 4 ,8 ,1 2 )如此,每一幅图。像可以用一个2 2 维数组表示。而这些元索的取值均为从自然数。由此,我们把对图像的分类转化为对一维数组的分类。这样我们便很容易实现图像的分类了。在实际的应用中,我们往往会选择把一幅图分成更多块的形式。那样也更能反映颜色的空间分布关系。但是随着分区个数的增加,算法将更复杂。将增加每一幅图像的处理时间。这对于图像检索来说影响是很大的。因此人们可以根据需要来决定自己的图像属性个数。4 2 图像分类4 2 1 分类规则获取图像数据库( i m a g ed a t a b a s e ) 是这样一个系统,它能够将一大批图像及其有关信息存储在一起,并对它们进行有效管理,以保证数据的一致性、完整性支持各种应用。首先我们建立与图库一一对应的图片资料库。在3 2 节中我们已经用一个2 】维数组来描述图像,因此我们相应的图片资料库罩的元素就是图片库中图片的相应属性数组。如下列图像与其对应编码:r ( 1 ) = ( 4 ,l ,1 0 ,1 ,1 0 ,1 0 ,l ,1 0 ,2 0 ,1 ,2 0 ,1 0 ,4 ,4 ,2 0 ,4 6 ,l ,4 ,8 ,4 ,2 0 ,2 1 )r ( 2 ) = ( 4 ,1 ,1 0 ,1 ,1 0 ,l ,1 0 ,1 0 ,2 2 ,l ,4 ,l o ,4 ,4 ,2 0 ,4 6 ,1 ,4 ,1 0 ,4 ,2 0 ,2 1 )r ( 3 ) = ( 1 ,2 2 ,1 0 ,2 2 ,2 0 ,1 ,1 0 ,2 2 ,l ,1 ,1 0 ,1 ,1 0 ,1 ,2 2 ,1 ,2 0 ,l ,4 ,1 ,4 ,2 1 )r ( 4 ) = ( 1 0 ,2 0 ,8 ,1 0 ,2 2 ,1 0 ,1 ,1 0 ,8 ,1 0 ,2 0 ,t o ,8 1 0 ,l ,2 0 ,8 ,4 ,8 ,2 0 ,1 0 ,1 1 )r ( 5 ) = ( 1 ,4 ,1 0 ,4 ,1 ,1 0 ,l ,1 ,1 0 ,4 ,1 ,1 ,4 6 ,4 6 ,1 ,1 ,1 0 ,1 0 ,2 2 ,1 ,4 ,2 1 1 2 )r ( 6 ) = ( 4 ,4 4 ,8 ,4 4 ,4 ,5 0 ,1 ,4 ,4 4 ,4 ,4 4 ,8 ,1 0 ,4 ,3 8 ,4 ,l ,4 ,3 8 ,4 ,3 8 ,1 2 )我们利用决策表s = 来对图像进行分类。设图库中所有图为论域u ,每一幅图像为研究对象。首先我们对每一幅图像的颜色根据面积进行排序。r = c u d 是属性集。其中条件属性为图像相应面积大小序号对应的颜色,决策属性d 是根据人的知识对图像进行的分类。例如上述六幅图片,我们主观上认为图1 和图2 为同一类,我们记为第l 类;图3 、4 、5 、6 各自为一类,分别记为2 、3 、4 、5 类。建立决策表。通过决策表知识获取决策规则。1 4圈条件属性决簸片属性rrrrrrrrrrrrrrrrrrrrrrrl234567891 0i l1 21 31 4l51 61 71 81 92 02 l2 22 31 0i】o1 01ld2 012 d】0442 04 6l4b42 02 il24l1 01l011 0102 2】41 0442 04 6l4l o2 02 l3l2 2l o2 22 0ll o2 21l1 0l1 012 2l2 0l4142 l24l o2 0bl o2 21 011 08】02 01 081 0l2 0848z o1 01 135l4l o4ji o1l】o4114 64 6lll ol o2 2142 111 26l4 484 445 0144 444 48l o43 8l3 843 81 25利用3 2 中决镶表知识,分别求出u c 、u d 、p o s 。d ,如果在此过程中处理海量数据,可以得出融入人的主观经验的决策规则。在决策规则获取时可能会出现一些不协调规则。我们要选取的是一些协调性高的规则。4 2 2 应用分类规则对一个图像集合或者图像数据库进行分类,当然我们可以直接利用我们所定义的属性组分类;但是这样分类的结果往往是分类过细。在4 2 1 中,我们得到了图像分类的决策规则。把这些规则应用于图像数据库。则可以完成计算机对于图像的智能分类。也就是说,我们对于图像分类事实上是利用了训练集中得到的知识,我们的分类是具有记忆性的。随着方法应用此数增多,我们或得越来越多的知识。这是一个长期积累的过程。4 3 图像检索一般情况下,图像检索需要利用图像的视觉特征来进行图像相似度匹配,这样就要定义图形的相似度量,但相似度量过多地融入了入的因素。受不同度量方法的影响较大。在上节中,我们已经给出了图像的一种分类方法。该方法避j r了相似度量的定义。作为一个基于内容的图像检索系统,一般来说必须具有交互的查询界面供1 5e曲+ l1 1s1 c拈表吖策决阢四表h用户提交查询特征和反馈查询结果。一般来说,查询的交互模式有以下几种:1 按例查询。用户提交一个已经显示的图像或对象,查询与所提交的图像或对象相似的图像或对象。囊直接查询。为用户提供一个直接定义所要的内容特征( 颜色、形状、纹理、略图等) 的区域和工具。在这里用户利用工具直接定义所需要特征,并提交给检索系统从_ 图像数据库进行相似性匹配。并反馈结果。3 细化查询。是对反馈结果的进一步搜索。缩小查询范屡。基于4 2 2 中对图像已经完成的分类,对于按例查询,我们只需要把图库中与用户提交图像在同一个分类中的图像反馈给用户即可。对于直接查询也可以根据用户定义的条件搜索满足条件的图类反馈给用户。另外,我们要支持细化查询,也为了提高图像分类的适应性,我们可以选择适当属性对图像分类。例如:我们可以只考虑图片整体特征的前2 种颜色和局部图像的前1 种颜色,表示为:记图片特征属性组为:r ( 肋= ( r 1 ,r 2 ,c 1 1 ,c 2 1 ,c 3 1 ,c 4 l ,c 5 1 ,c 6 l ,c 7 1 ,c 8 1 ,c 9 1 ) ,然后可以先增加属性c 5 2 :再增加c 2 2 ,c 4 2 ,c 6 2 ,c 8 2 ;最后增加属性c 1 2 ,c 3 2 c 7 2 ,c 9 2 。随着属性的增多,我们的分类可以做到由粗到细。4 4 图像约简一般来说,我们希望在图库或因特网上搜索到尽量简洁的结果。我们要达到这个目的,可以对搜索到的图像集会y 先行约筒。仍然利用我们在4 2 3 中的图像分类方法对y 先行较细分类。考虑l ,中每一幅图像所在的类,随机地把他们所在类用代表元素表达。即用一幅图片来代表一类图片集合。这样,将大大减少用户需要亲自辨识的图像。若用户确定对某一幅图像感兴趣,则选定后反馈给用户该幅图像所代表的图像类。完成对图像的约简预处理,等待用户的进一步搜索或直接应用。第五章粗集逼近算子与形态学滤波的关系暨新形态学算子5 1 粗糙集性质在第三章中,我们介绍了p a l a w k 粗糙集模型。p a l a w k 粗糙集有着很好的数学性质。如下:“们r 1r 2a p rn x - ( a p r i ( x 。) ) a p rr ( u ) = ur 3a p rr ( zny ) = 缈r xna p r - ya p rr ( zny ) 一a p rr xo a p rr yr 4r 5r 6r 7a p r l ( zn 】,) 。a p r 。xna p r - ya p rr ( zuy ) = 面i 。xu 乏孑r ya p r i 盖z a p rrxx a p rr ( y ) 。ye a p rr ( x )a p rr ( a p rr x ) = a p rrxa p r l ( a p rr x ) = a p rr x这些性质的证明在文献1 9 中有详细论证,此处不再赘述。5 2 数学形态学数学形态学在= 十世纪六十年代中期诞生于法国的枫丹白露科学研究中心。数学形态学是一门建立在严格数学理论上的学科“。其基本思想和方法对图像处理的理论和技术均产生了很大影响。从某种意义上讲,形态学图像处理是以几何学为基础的。它着重研究图像的几何结构,这种结构表示的可以是分析对像的宏观性质,也可以是微观性质。数学形态学是一门新兴的图像分析学科。作为一门特殊的图像处理学科,它已从法国的枫丹自露数学形态学研究中心走向了世界,发展成为了图像处理的一个主要研究领域。形态学的应用覆盖了图像处理的几乎所有领域,包括文字识别、医学图像处理、图像编码压缩、视觉检测、材料科学以及机器人视觉等,不胜枚举。形态学图像处理的基本思想是利用一个称作结构元素的“探针”收集图像的信息“1 。下面我们简要介绍一下二值形念学。1 7令。表示图像z 沿b 平耪,主表示图像j 的反射。即:j - = ( 口+ bl 口j )x = 一口l 口舯设jcu 为图像,b 为结构元素,形态学中基本滤波算子膨胀,腐蚀分别定义为“1 :0 b = x lb ,n 盖中朐b = x f b ,c x )对图像作膨胀相当于把图像上的每一点扩大为结构元素;而对图像作腐蚀是把图像中相当于结构元素的部分缩为结构元素的中心点。因此结构元素融入了人的主观因素。此处用朐b 表示由结构元素b 对图像j 进行腐蚀,因为。在传统上表示的是m i n k o w s k i 差。形态学运算开、闭分别定义为v舶b = ( 朐口) o bj b = ( 朐b ) o b形态学的这两对滤波算子分别是对偶算予。5 3 形态学算子与粗糙近似算子的关系5 3 1 p a l a w k 粗糙集在一般关系下的推广t y l i n 和y y y a o 用二元关系r 来构成元素的r 一邻域,从而推广了z p a l a w k 的粗糙集概念。设r u u 为二元关系,定义x 的r - 邻域为r ( 妁:= ,l ( 并,j ,) r )对于v x c u ,定义广义逼近算子:面。x 一( xr ( 曲n 石,垂)a p _ i ”z = xr ( j ) cx ( 3 )此逼近算子满足粗糙集公理体系中的公理r 1 ,r 2 ,r 3 ,r 4 、。当r 为相似关系时,此逼近算子还满足公理r 5 ,r 6 。证明在文献( 1 9 ) 中,此处不再赘述。对于p a l a w k 模型的定义形式( 2 ) ,我们在一般关系下,也类似得到:a p rr x ;utr ( x ) lr ( 曲n x 西)a p rn x u r ( 曲lr ( 神c x )但是这一对近似算子并不如我们想像中那么完美,甚至连粗糙集公理体系中最基本的公理对偶律都不满足。为此,我们有以下两种改进形式:“”a p r t x = u ( r ( 曲lr ( n x 中)a p rr x 一( a p r t ( f ) ) 。( 4 )a p r t xzuf r ( 曲1r ( 曲cx a p r x 一( a p rr ( r ) ) 。( 5 )改进形式( 4 ) 满足粗集公理体系中的r l ,r 2 ,r 3 ,r 4 :改进形式( 5 ) 满足r 1 ,r 5 ,r 7 。且当r 为逆串行时,( 5 ) 满足r 2 i 另外,这两对近似算子均满足单调性。5 3 2 粗糙集近似算子与形态学算子的对应设jcu 为图像,b 为结构元素。在数学形态学滤波运算中,令关系r 为:vvvxry oy e b ;则r ( = ( ,ljry ) = ( y 1y e b ,) = b ,此r 为一般关系,文献( 4 3 ) 中视此类关系为等价关系是不合适的。因为结构元素b 作为关系未必满足自反律,对称律,及传递律。事实上,b 只能作为邻域算子,不具备传递性。当结构元素包含原点时,满足自反律;当结构元素对称时,满足对称律。故该关系至多只能是相似关系。按照我们所定义的关系r ,基于广义粗集逼近算子,我们有:a p r 。x = zr ( 曲n x 中) = x1 日,n x 垂 = 瑚0 ba p r x = xr ( c x _ hb ,cx ) _ 朐b( 6 )由此,我们可以看出:以结构元素b 膨胀图像和以结构元素占腐蚀图像这两种形态学滤波恰是以上述关系r 对图像做广义上下逼近( 3 ) 。同样,丌运算和闭运算也构成了一对近似算子。我们知道,l :运算有另一种表示形式:x o b = u 曰,缸c 善我们来看粗集近似算子改进形式( 5 )咿。謦:u r ( ir ( 曲c z ) :u 占,i 售,c x :u b z :j 。占一盖j 工万。x ( 咿。( r ) ) 。= ( f 。占) c而闭运算正是开运算的对偶算子”,即有:加b = ( x o b 。) 。,所以印rrx - x b( 7 )这样,形态学的开与闭运算也是一对对偶逼近算子。上述两对滤波算子对应于p a l a w k 粗糙集近似算子的代数性质在文献( 3 ) 有系统地阐述,此处也不再赘述。我们发现,般关系下p a l a w k 粗糙集模型中的上下近似算子及其扩展形式( 5 )分别对应了不同的形态学滤波算子。我们不禁要问,一般关系粗集模型的扩展形式( 4 ) 又对应了怎样的滤波算子呢?5 4 新的形态学算子5 4 1 强膨胀与强腐蚀设jcu 为图像,b 为结构元素。在数学形态学滤波运算中,我们依然令关系r 为:xr ,。y e b ,考虑2 1 中的改进形式( 4 ) :印r x = u ( r ( 曲ir ( 神n x 中) = u (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论