




已阅读5页,还剩54页未读, 继续免费阅读
(通信与信息系统专业论文)基于人工免疫系统的自然图像分类算法与技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
太原理工大学硕士研究生学位论文 摘要 网络和多媒体技:术的飞速发展为数字图像的存储和传播提供了极大的便利, 仅依靠人力无法完成海量图像数据的及时归档、组织和管理。如何利用如此众多 的图像信息并从中定位感兴趣的材料,是对图像信息的查询技术提出的重大挑 战。作为计算智能的一个崭新分支,a i s 算法还没有一个通用的算法框架,而且 免疫系统的许多优良特性还有待应用于a i s 算法的设计与应用,人工免疫算法 的发展和应用空间是相当广阔的。论文借鉴a i s 在其它领域的用法,不断完善 其对图像分类的应用。 首先,论文在相关理论与算法的基础上,提出了基于人工免疫系统的自然图 像分类算法。设计了利用人工免疫算法进行自然图像分类之前,首先需要将待解 决的问题抽象成符合它能处理的抗原形式。同时分析了抗原捕获和亲和度度量。 进行了抗原刺激方式及识别策略与克隆选择与变异分析,最后进行了算例分析, 算例环境选取了图像库由1 0 0 0 幅自然图像组成,包括非洲生活、车、恐龙、花、 马、风景、食物、摩托车、飞机、人脸1 0 类题材。通过分块权值与特征权值的 分析,证明了本算法具有最高的平均正确率为8 8 6 8 ,分类效果令人满意。 其次,论文提出- = 基于颜色分布熵的自然图像分类技术。首先论文分析了颜 色空间分布熵,其次分析了图像信息熵,包括了颜色的空间分布熵、加权的空间 分布熵与基于颜色分布熵的自然图像分类算法。为有效地利用两种特征进行图像 分类,在度量向量相似性时可采用加权综合距离法。最后是技术实验分析,实验 证明,该特征同时顾全了图像中颜色的整体特性和分布特征,比全局直方图和 i c d e 具有更好的分类性能。而且相比i c d e ,该方法的计算复杂度更低,大大 节约了提取特征的时间。 a i s 作为一种基于生物免疫系统的智能计算方法,为分类提供了一种新颖的 解决方法和途径。在此基础上,论文引入了分块权值以消除熵对称性的影响。实 验表明,结合分布熵与全局颜色直方图作为图像分类的特征向量,分类准确率有 所提高。 关键词:图像分类;图像内容描述;人工免疫系统;克隆选择 太原理工大学硕士研究生学位论文 a b s t r a c t t h er :l p i dd e v e l o p m e n to fn e t w o r ka n dm u l t i m e d i at e c h n 0 1 0 9 yp r o v i d e s 伊e a t c o l e n i e n c ef o rd i g i t a li m a g es t o r a g ea n dd i s s e m i n a t i o no fm a s s i v ei m a g ed a t ac a n n o tb ec o m p l e t e dt i m e l yf i l e do n l yr e l yo nt h eh u m a n ,o 略a n i z a t i o na n dm a n a g e m e n t h o wt ot a k ea d v a n t a g eo fs u c ha1 a 昭en u i i 】【b e ro fi m a g ei n f o m a t i o na n dt o1 0 c a t et h e m a t e i i i a lo fi n t e r e s t ,am a j o rc h a l l e n g et om eq u e 巧i m a g ei n f o m a t i o nt e c h n 0 1 0 9 y a s an e wb r a n c ho fc o m p u t a t i o n a li n t e l l i g e n c e ,a i sa l g o m h mi sn o tag e n e r i ca l g o r i l i i l f r a m e w o r k ,a n dm a r l yo ft h ee x c e l l e n tf e a t u r e so ft h ei m m u n es y s t e mh a v ey e tt ob e a p p l i e dt o t h ed e s i g na n d 印p l i c a t i o no ft h ea i sa l g o r i t ,a n i f i c i a li m m u n e a l g o r i m m l e v e l o p m e n ta n da p p l i c a t i o no fs p a c ei sq u i t eb r o a d t h ep a p e r sd r a wo n t h eu s a g eo fa i si no t h e ra r e a s ,a n dc o n s t a n n yi m p r o v ei t si m a g ec l a s s m c a t i o n f i r s t ,t 1 1 ep a p e ri nt h et h e o 巧a n da l g o r i m m sb a s e do nn a t u r a l i m a g ec l a s s i f i c a t i o n a l g o r i t h m b a s e do na m f i c i a li m m u n es y s t e m d e s i g n e d f o rn a t l l r a l i m a g e c l a s s i f i c a t i ) nu s i n ga r t i f i c i a l i m m u n ea l g o r i m m ,y o uf l r s tn e e dt ob es o l v e db e f o r et h e a b s t r a c ta si tc a nh a n d l et h ea n t i g e ni nt h ef o m a n t i g e nc a p t u r ea n da m n 时m e t r i c s a n t i g e ns t i m u l a t i o na n di d e n t i 母s 仃a t e g i e sa n dc l o n es e l e c t i o na n dm u t a t i o na n a l y s i s , f i n a l l y ,ai 【u m e r i c a l e x a m p l e ,s e l e c tt h ei m a g e1 i b r a 巧e x a m p l ee n v i r o n m e n tb yl0 0 0 n a t u r a l i m a g e s ,i n c l u d i n ga 矗i c a nl i f e ,c a r s ,d i n o s a u r s ,n o w e r s ,璋o r s e ,l a l l d s c a p e ,f o o d , m o t o r c y c l e s ,a i r c r a f ! c ,p e r s o n sf a c em e1oc a t e g o r i e so fs u 切e c im a t t e r t 【l r o u g ht h e a n a l y s i so ft h eb l o c kw e 蟾h t sa n df e a t u r ew e i g h t s ,p r o v e dm a t ! m ea l g o r i m mh a st h e h i g h e s ta v e r a g ea c c u r a c yr a t eo f8 8 6 8 ,a n dt h ec l a s s i f i c a t i o n 北s u l t sa r es a t i s f a c t o r y s e c o n d l y ,t h ep a p e rp r e s e n t st h en a t l l r a li m a g ec l a s s i f i c a t i o nt e c h n i q u e sb a s e do n c o l o rd i s t r j 【b u t i o n e n t r o p y f i r s t ,t h ep a p e ra n a l y z e st h ec 0 1 0 rs p a t i a ld i s t r i b u t i o n e n t r o p y ,f o u o w e d b ya n a l y s i so ft h ei m a g ei n f o m a t i o ne n t r o p y ,i n c l u d i n gt h ec o l o ro f t h es p a t i a ld i s t r i b u t i o no fe n t r o p y ,t h es p a t i a ld i s 仃i b u t i o no ft h ew e i g h t e de n 仃o p ya n d n a t u r a li m a g ec l a s s i f i c a t i o na l g o r i t h mb a s e d o nc 0 1 0 rd i s t r i b u t i o n e n t r o p y f o r e f r e c t i v eu s eo ft h et w of e a t u r e sf o ri m a g ec l a s s i f i c a t i o n ,t h ew e i 曲t e dd i s t a n c e m e 也o dc a nb eu s e d i nt h em e 廿i cv e c t o rs i m i l a r i t y f i n a l l ym et e c h n o l o g y e x p e r i m e n t a la n a l y s i s ,e x p e r i m e n t ss h o w ,t h ec h a r a c t e r i s t i c sa tm es 锄et i m es h o w c o n s i d e r a t i o nf o rt h eo v e r a l lc h a r a c t e r i s t i c sa n dt h e d i s t r i b u t i o n c h a r a c t e r i s t i c so f i m a g ec o l o rh i s t o g r 锄a n di c d eh a sb e 仕e rc l a s s i f i c a t i o np e r f - 0 m a n c et h a l lg l o b a l a n dc o m p a r e dt om ei c d e ,m ec o m p u t a t i o n a lc o i n p l e x i 哆o f t h em e t h o d1 0 w e r ,t i m e i i 太原理工大学硕士研究生学位论文 s i g n i f l c a n t l ys a v i n gf e a t u r ee x 仃a c t i o n a i sa sa ni n t e l l i g e n tc o m p u t i n gm e t l l o db a s e do nt h eb i 0 1 0 9 i c a l i 眦u n es y s t e m , p r o v i d e san o v e lm e m o da i l dm e a n sf o rc l a s s i f i c a t i o n o nt h i sb a s i s ,m ep a p e r i n t r o d u c e st l l ev a l u eo fm er i g h tt ob l o c ki no r d e rt oe l i m i n a t em ee 仃e c t so fe n 仃o p y s y m m e 奶,t h ee x p e r i m e n t ss h o wt h a t ,c o m b i n e dt h ed i s 仃i b u t i o ne n t r o p yw i mg l o b a l c o l o rh i s t o g r a ma st h ef e a t l l r ev e c t o ri m a g ec l a s s m c a t i o n ,c l a s s i f i c a t i o n a c c u r a c y i m p r o v e d k e yw o r d s :c l o n a ls e l e c t i o no fi m a g ec l a s s i f i c a t i o n ;d e s c r i p t i o no ft h ei m a g e c o n t e n t ;la r t i 6 c i a li m m u n es y s t e m ;c l o n a ls e l e c t i o n i i i 太原理工大学硕士研究生学位论文 1 1 研究背景与意义 第1 章绪论 人类可以通过视觉获取很多重要信息,现代心理学研究表明,一个人在接 受外界信息时,视觉信息占到了全部信息量的8 3 【1j 。图像作为一种内容丰富、 表现直观的视觉信息载体,一直受到人们的关注,在各个领域都得到了广泛的 使用。网络和多媒体技术的飞速发展为数字图像的存储和传播提供了极大的便 利,仅依靠人力无法完成海量图像数据的及时归档、组织和管理。各行各业有 越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。 但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的 目的。因此如何利用如此众多的图像信息并从中定位感兴趣的材料,是对图像 信息的查询技术提出的重大挑战。本研究希望通过计算机对图像的内容进行分 析描述,并根据这些描述将图像数据快速、规范、自动地进行归类和管理,图 像分类就是在这样的背景下产生的。 图像分类技术的研究主要围绕分类方法和特征提取两个方面进行。分类方 法是图像分类的核心,迄今为止已涌现出大量的分类算法,如k 近邻算法、统 计学理论、模糊c 均值、贝叶斯理论以及支持向量机等【2 】。随着计算机技术和 其它科研领域之间的交叉作用越来越大,许多新技术、新方法不断涌现。受自 然免疫系统启发的人:工免疫系统( a r t i f i c i a l i m m u n es y s t e m ,a i s ) ,不仅结合了分 类器、神经网络和机器推理等学习系统的一些优点,还具备噪声忍耐、无教师 学习、自组织、记忆等进化学习机理,近年来成为各个领域中的研究热点。本 研究可以借鉴a i s 在其它领域的用法,不断完善其对图像分类的应用。作为计 算智能的一个崭新分:支,a i s 算法还没有一个通用的算法框架,相关算子的设 计也不够完善;而且,由于对生物免疫机理的认识还不完全,免疫系统的许多 优良特性还有待应用于a i s 算法的设计与应用。因此人工免疫算法的发展和应 用空间是相当广阔的i 引。 为了提高图像分类准确率,提取能有效表达图像内容的特征是分类前的必 须步骤。图像自身包含有丰富的视觉信息,包括颜色、纹理、形状以及目标的 位置和空间关系等。基于内容的图像分类就是量化这些视觉特征,并对量化后 的数据进行相似匹配,从而将内容相似的图像归为一类。好的特征不仅可以表 太原理工大学硕士研究生学位论文 达人对图像的视觉感受,还能形象地描述图像内容,有利于图像分类。 1 2 相关研究的评述 1 2 1 图像内容描述的研究现状 有关图像分类的研究始于2 0 世纪7 0 年代,早期的图像分类主要是利用人 工分析、标注图像特征,然后根据描述文本对图像进行分类,把图像分类转化 为文本分类问题。然而其存在较多缺陷:第一,图像的标注由手工完成,费时 费力,尤其是标注规模庞大的图像库时,其工作量可想而知;第二,文本标注 无法充分描述图像信息,简单的词汇很难将图像的内容描述完全;第三,文本 标注实质上是人对图像的感知,所以存在相当大的主观性和不确定性,这直接 关系到分类的准确性。随着多媒体技术的蓬勃发展,图像数量的日益增长,这 些弊端也越来越突出,基于文本的图像分类已无法满足分类需要 4 】。 在9 0 年代初,出现了一种对图像内容进行分析和分类的技术,即基于内容 的图像分类方法。该方法通过机器自动分析、提取图像自身所蕴含的视觉信息, 然后根据所提取的特征分类图像【5 j 。不同于基于文本的图像分类方法,该方法 不需要对每幅图像进行人工标注,节省了大量的人力劳动;直接利用图像的视 觉特征来描述图像,从而避免了人类感知的主观性和不确定性。因此,基于内 容的图像分类迅速成为了国内外学者的研究焦点。目前,大部分对图像内容的 描述都是基于底层特征的,主要包括颜色、纹理和形状三大类 6 。 颜色作为图像最直观的视觉特征,在图像分类中的应用最为广泛。1 9 9 1 年, s w a i n 和b a l l a r d 提出颜色直方图( c 0 1 0 rh i s t o g r a m ) ,其核心思想是统计某种颜色 空间中每种颜色在整幅图像中所占的比例【_ 7 1 。颜色直方图凭借其提取快速简单、 平移、旋转不变性等优点成为图像分类中最常用的颜色特征。s t r i c k e r 和0 r e n g o 提出对颜色直方图进行累积,此外他们认为颜色信息主要集中在颜色的低阶矩 中,又提出了颜色矩( c 0 1 0 rm o m e n t ) ,即在颜色直方图的基础上统计每个颜色分 量的一阶、二阶和三阶矩( 均值、方差和偏差) 。用这些统计量来表示颜色的分 布特征具:有特征量少、处理简单的特点。h u a n g 等提出颜色相关图( c o l o r c o r r e l o g r a 】n ) ,统计了颜色对的空间分布,同时反映了局部颜色分布和总体颜色 分布的相关联系。p a s s 等人提出的颜色一致性矢量( c o l o rc o h e r e n c ev e c t o r s ) 2 6 实质上是一种改进的直方图方法,它统计了图像中颜色相似的像素所占最大连 续区域的像素数量,保留了颜色的空间信息【8 。 纹理特征方面,最著名的是h a r a l i c k 于1 9 7 3 年提出的灰度共生矩阵 太原理工大学硕士研究生学位论文 ( g r a v 1 e v e lc o o c c u 仃e n c em a t r i x ) 【9 】。h a r a l i c k 通过统计在特定方向上相隔特定距 离的像素对出现的概率构造了一个对称矩阵,并基于该矩阵提取出多种参数组 成特征向量,如能量、熵、逆差矩等。t a m _ u r a 从心理学角度提出粗糙度 ( c o a r s e n e s s ) 、对比度( c o n t r a s t ) 、方向度( d i r e c t i o n a l i 够) 、线像度( l i n e l i k e n e s s ) 、 规整度( r e g u l 耐妫和粗略度( r o u g h n e s s ) 六个分量,很好地对应了人类对纹理的 视觉感知。v a c h a 采用马尔可夫随机场进行纹理分析,用这种方法提取的特征 不会受光照变化影响。近年来,随着小波( w 打e l e t ) 变换理论的建立和发展,出 现了许多通过小波变换分析图像纹理的研究。a n v a z h a g a i l 等对图像进行一层小 波变换后,从小波系数中提出小波统计特征和小波共生矩阵用于纹理分类。t s a i 采用g a b o r 滤波器和小波变换来提取景物图像的特征,用于分类景物图像【l 。 形状是图像的另一重要特征。h u 基于笛卡尔坐标下的标准化中心矩给出了 一组代数矩不变量,:并证明这些矩具有平移、旋转和比例不变性。f r e e m a n 提 出了一种对曲线或形状边界进行编码的表示方法链码,该方法利用一系列 特定长度和方向的直线来表示边界【1 1 1 。随后,他又推广了原来的定义提出了广 义链码。z a l l l l 的傅立叶描述法则是将边界坐标看成是复数序列,然后对其进行 离散傅立叶变换,利用变换后的系数描述边界特征。由于该方法是在频域中描 述边界信息,所以能克服噪声和边界变化所带来的影响。曲率尺度空间描述子 ( c u r v a t i l r es c a l es p a c e ,c s s ) 用不同的g a u s s i a n 核来平滑形状轮廓,逐步滤除了 细节但保留了显著特征,然后计算轮廓曲率【l2 | 。h o u 曲提出了一种经典的用于 检测直线段、圆和椭圆的方法霍夫变换( h o u 曲t r a n s f o m ) 。在图像空间( 直 角坐标系) 中共线的点对应于参数空间中相交的线( 直线、圆、椭圆等) ,反之 亦然。霍夫变换就是利用这种关系把图像空间中的形状描述转换到参数空间里 1 3 】 o 1 2 2 人工免疫系统在图像分类领域中的应用 人工免疫系统( a i s ) 的建立与发展是以生物免疫系统为基础的,继承了其强 大的认知学习能力和智能特性。免疫系统的理论研究历史较短,始于2 0 世纪 5 0 年代末【l4 | 。1 9 5 8 年,由澳:大利亚学者b u m e t 提出的克隆选择学说是最早与 免疫系统有关的理论,他也因此获得了1 9 6 0 的诺贝尔奖【1 5 】。1 9 7 3 年,j e m e 根 据克隆选择学说开创了独特性网络理论,给出了免疫网络的数学框架,成为第 一个免疫系统模型。之后,p e r e l s o n 更深入地阐述该学说,进一步给出了独特 性网络的概率描述法,现已被广泛应用于白适应控制和故障诊断【l6 1 。1 9 8 6 年 f a m e r 等人基于免疫网络的假说构造了一个免疫系统的动态模型,利用微分方 太原理工大学硕士研究生学位论文 程建立a i s 。他们首次提出了“免疫算法 的概念,并探讨了免疫系统与其它 人工智能:疗法的联系,为建立基于免疫原理的计算系统和智能系统开辟了道路, 具有重要意义【1 7 】。从此以后,免疫算法在国际上引起了广泛的关注和研究。相 关会议的举办和期刊收录文章的增加,也证明a i s 已经成为研究热点。1 9 9 6 年, 在日本举行的首届免疫系统国际专题会议上,a i s 的概念首次被提出并确认【1 8 】; i e e es y s t e m ,m a na n dc y b e m e t i c s 和c o n g r e s so ne v o l u t i o n a 巧c o n l p u t a t i o n 分 别自1 9 9 7 年和2 0 0 1 年起每年举办一届a i s 研讨会;第一届a i s 国际学术会议 i c a i u s ( 1 s ti n t e m a t i o n a lc o n f e r e n c eo na n i f i c i a li m m u n es y s t e m s ) 于2 0 0 2 年9 月 在英国k e n t 大学召开;许多国际期刊,如e v o l u t i o n 哪c o m p u t a t i o n ,i e e e t r a n s a c t i o no ne v 0 1 u t i o n a 巧c o m p u t a t i o n 等也将a i s 作为其重要议题。 经过多年的发展,a i s 主要有以下三大分支。一是f o r r e s t 等研究人员提出 的否定选择算法( n e g a t i v es e l e c t i o na l g o r i t h m ,n s a ) ,该算法模拟t 细胞需要经 历否定选择去除那些对自体产生应答的免疫细胞的成熟机制挑选检测器,通过 检查检测器与抗原是否匹配,达到识别异常信息的目的;二是c a s 仃。和z u b e n 根据克隆选择学说提出的二进制克隆选择算法( c 1 0 n a ls e l e c t i o na 1 9 0 r i t h , c s a ) 。c s a 通过克隆操作可加快算法的收敛速度,通过变异操作则可增加解的 多样性、抑制早熟现象,并在模式识别、组合优化和多目标函数优化中得到了 验证。三是免疫网络算法,其中j e m e 的独特免疫网络得到了广泛的继承和发展 【1 9 j ,如c o o k e 工程免疫模型、资源有限的人工免疫系统( r e s o u r c el i m i t e d a n i f i c i a l1 1 1 l i l l u n es y s t e m ,r l a i s ) 、自稳定人工免疫系统( s e l f - s t a b i l i z i n ga n i f i c i a l i m m u n es y s t e m ,s s a i s ) 、多值免疫网络模型( m u l t i p l e v a l u e di m m u n en e t w o r k m v i n ) 等。 近年来,越来越多的学者将人工免疫算法引入到图像分类领域当中,其中 克隆选择算法的应用最多。zh o n g 利用抗体浓度更新记忆细胞,改进了克隆选 择算法并应用到汽车图像分类当中【2 0 1 。同时他还提出根据抗体群和抗原群的取 值范围计算两者中心距离的方法。马文萍等将量子交叉操作引入a i s 中的克隆 选择优化,有效地克服了早熟现象【2 1 1 。钟燕飞提出了一种基于a i s 的分类方法, 该方法首先应用a i s 的克隆选择算法对样本进行自学习,得到全局最优的聚类 中心,然后利用学习得到的聚类中心对整幅影像进行分类 2 2 1 。传统克隆算法在 每次迭代中都会产生随机抗体来取代低亲和度抗体,考虑到这一做法不利于算 法收敛,ni s a 则从克隆变异后的抗体集中选取亲和度高的抗体。 其它u s 算法也得到了人们的应用与改进。2 0 0 1 年,罗彻斯特理工学院的 s a t h y a n a t h 等人运用否定选择算法来识别美国一木材加工企业提供的不同颜色 4 太原理工大学硕士研究生学位论文 和不同纹理的木材图像【2 3 1 。李广琼利用否定选择算法对汽车图像进行分类,在 算法的研究过程中为了提高图像识别率,提出多字段r 连续位匹配规则。钟燕 飞等人对胁g 的多值免疫网络进行了改进并将其应用于多光谱遥感影像分类。 该方法提取训练样区的灰度信息作为抗原训练m v i n 模型,将得到的t 细胞对 整幅遥感图像进行分类,分类精度较传统方法有明显提升。刘若辰提出了一种 基于人工免疫网络的分类算法,该算法中每种类别对应一个b 细胞,这样有效 地减少了b 细胞的冗余性和同类b 细胞之间的抑制操作,从而减小了计算复杂 度 2 4 】。同时根据b 细胞对训练样本的正确识别率改进抗体亲合度函数,提高了 本类别抗原的优先级。钟将提出了一种全新的动态聚类算法,达到了在聚类数 不确定的情况下的聚类分析的目的。新算法首先使用人工免疫网络算法快速获 得聚类可行解,然后在可行解的基础上利用遗传算法进行动态聚类,实现了人 工免疫网络和遗传算法的结合。b e z e r r a 深入研究了密度信息对聚类结果的影 响,提出了“自适应抑制半径”的概念以及与之相关的自适应半径免疫算法, r o “g u e s 将该算法应用到了鱼群图像分类当中【2 5 。 上述内容都是有关免疫算法作为分类方法的成果,通过查阅国内外相关文 献资料发现,人工免疫算法也可用于提取特征。j i ef e n g 重点研究了图像特征 表示,结合了视觉词袋( b a g o f _ v i s u a l w o r d s ) 描述和克隆选择算法。韩敏提出了 一种g a b o r 变换与克隆选择算法相结合的遥感图像分类算法【2 6 1 。该算法首先对 遥感图像进行离散g a b o r 变换,以g a b o r 变换系数模的平均值作为该图像的纹 理特征,然后利用克隆选择算法对纹理特征进行优化,得到最优纹理特征。同 时他还在克隆选择算法中采用自适应变异算子改进算法对变异概率进行调整, 防止因变异概率选择不当对算法的收敛速度产生影响。李海芳基于整体和分块 颜色直方图提取图像的特征向量,该方法捕获了颜色的空间布局信息,比较完 整地从颜色角度描述了一幅图像。 1 3 研究目标和主要内容 本文研究的是基于a i s 和内容的自然图像分类。基于内容的图像分类就是 利用计算机对图像的视觉特征进行定量分析,把图像或图像中的每个像元或区 域划归为若干个类别中的某一种,以代替人的视觉判读;而a i s 作为一种基于 生物免疫系统的智能计算方法,为分类提供了一种新颖的解决方法和途径。通 过查阅国内外大量文献资料,在对这两种技术进行总结分析后,主要完成了以 下工作:从生物免疫系统入手,针对性的学习了免疫学中一些与a i s 相关的重 太原理工大学硕士研究生学位论文 要概念和机制;通过学习两者之间的映射关系,研究了其对a i s 的启示和a i s 的基本原理1 2 。 学习了图像分类的基本框架,侧重研究了基于a i s 的图像分类原理;总结 了表达图像内容的视觉特征以及度量特征相似度的方法。通过介绍这些预备知 识,为本:丈的研究作好了理论上的支持。着重研究了克隆选择算法,发现其寻 优能力相当出色,但易导致抗体冗余。因此,根据其缺陷改进了抗原提呈方式 和识别规则,同时对免疫系统中的其它关键算子进行了改进,有效地减小了抗 体网络规模,从而加快了算法收敛速度。最后,将该算法与改进前后同类算法 进行仿真对比,验证了其最优解搜索能力。研究了全局直方图以及对它改进的 算法,针对它们存在的问题提出了一种基于信息熵的图像特征。首先对图像进 行不均匀分块,统计每种颜色在各分块中的分布,然后计算颜色的分布熵作为 颜色的空间分布特征。在此基础上,引入了分块权值以消除熵对称性的影响。 实验表明,结合分布熵与全局颜色直方图作为图像分类的特征向量,分类准确 率有所提高【2 引。 太原理工大学硕士研究生学位论文 第2 章相关理论与算法阐述 2 1 相关概念的界定与说明 2 1 1 图像分类 基于内容的图像:分类始于上世纪9 0 年代,该方法通过机器提取图像特征、 分类图像,以自动性和准确性的优势被广泛使用。图像分类( i m a g ec l a s s i f l c a t i o n ) 是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图 像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或 区域划归为若干个类别中的某一种,以代替人的视觉判读。 与人类视觉处理过程类似,图像分类的基本过程是先建立对图像内容的描 述,即提取能够有效表示图像属性的特征,然后利用机器学习方法学习不同类 别的图像特征,最后利用学习得到的模型对未知图像进行分类,如图2 1 所示【2 引。 测 图2 1 图像分类的基本过程 f i g u r e2 1i m a g ec l a s s i f i c a t i o np r o c e s s 目标类别 由上述分类过程可知,图像分类主要与分类方法和图像特征密切有关。分 类方法是图像分类的核心,最终的分类准确性与其密切相关;图像特征则是图 像分类的基础,提取的特征应该能够反映图像的内容和各种不同属性。 2 1 2 人工免疫系统 人工免疫系统( a i s :a r t i f i c i a li m m n es y s t e m ) 是根据免疫系统的机理、特 征、原理开发的并能解决工程问题的计算或信息系统。a i s 在不同的工程问题 有不同的映射和定义,根据莫宏伟人工免疫系统原理与应用的定义,所谓a i s 太原理工大学硕士研究生学位论文 就是借鉴和利用生物免疫系统( 主要是人类的免疫系统) 的各种原理和机制而发 展的各类信息处理技术、计算技术及其在工程和科学中应用而产生的各种智能 系统的统称。自然免疫系统是一种复杂的分布式信息处理学习系统,具有免疫 防护、免疫耐受、免疫记忆、免疫监视功能,且有较强的自适应性、多样性、 学习、识别和记忆等特点,其特点及机理所包含的丰富思想为工程问题的解决 提供了新的契机,引起了国内外研究人员的广泛兴趣,它的应用领域也逐渐扩 展到模式识别、智能优化、数据挖掘、机器人学、自动控制和故障诊断等诸多 领域。a i s 是继进化算法、模糊系统及神经网络之后又一研究热点 3 0 。 生物免疫系统是负责执行免疫功能的防御系统,具有完善的机制来抵御外 来病原体的入侵,主要包含三层防线,生物免疫系统是机体内结构最为错综复 杂、功能最为强大独特的自适应系统。从信息处理这一角度来看,免疫系统蕴 含着自学习、自记忆、高度识别、动态平衡等多种信息处理机制,深刻启发了 广大科研学者如何使用计算机实现智能信息处理。目前,许多基于生物免疫系 统的a i s 模型和算法已被相继提出,并成功应用于模式识别、故障诊断、机器 学习、优化计算、数据分析和自动控制等领域。a i s 将生物免疫系统的组成元 素映射成为解决普通工程问题的对应模型,力图通过模仿生物免疫系统的免疫 机理为解决实际工程难题提供一条途径。表2 1 给出了a i s 与生物免疫系统之 间的近似映射关系,从中可以发现a i s 对生物免疫系统的模仿和借鉴。 表o 1 生物免疫系统与a i s 的映射关系 1 、a b l e2 1b i o l o g i c a l i m m u n es y s t e ma n da i sm a pr e l a t i o n s h i p 生物免疫系统 免疫算法 抗原 抗体 抗原识别 亲和力 抗体间的浓度抑制 克隆增值 免疫应答 优化问题 最优候选解 确定问题类型 模式匹配的程度 冗余解的删除 对优解经过复制、交叉、变异产生新解 识别外部入侵数据并清除 太原理工大学硕士研究生学位论文 2 2 图像内容描述的理论 图像内容描述是基于语义的图像分类技术的基础,也是人们研究基于内容 的图像分类的切入点。,描述图像内容就是提取与表达图像特征,纹理、颜色和 形状是图像最基本的特征。图像的种类很多,属性很多,分类方法也很多。从 生成方式上分拍摄类和绘制类,从颜色上分彩色、灰度和黑白图像,从内容上 分人物、动物、植物、建筑、自然景观等,从视觉和绘制手法上分油墨画、电 脑绘画、书法、印章等,从功能上又分流程图、结构图、原理图、方框图等, 等等。可见,图像分类是多角度的,难以穷尽列举。本文研究的目的就在于对 图像内容进行学习,并用于分类。本节将给出这些视觉特征的定义与相应的提 取方法【3 0 】。 2 2 1 图像视觉特征 ( 1 ) 纹理特征 纹理效果比较明显而且不依赖于颜色或亮度。由于纹理的变化很多,而且 与心理效果相联系,因此很难精确描述。目前尚无统一的定义,一般认为纹理 反映的是图像像素间的灰度重复或者变化规律,需要通过分析各像素及其邻近 像素的灰度分布关系描述纹理。由于纹理反映的是区域属性,因此观察区域的 大小会影响纹理分析,需事先确定观察尺度。目前,常用的纹理特征包括灰度 共生矩阵、t a m u r a 纹理特征、白回归模型、小波变换方法等。接下来将对本文 所利用的纹理特征一一局部二进制模式( l o c a lb i n a r yp a t t e m s ,l b p ) 进行详细描 述【3 l 】。 0 j a l a 等人为了辅助度量图像的局部对比度提出了l b p 算子【3 2 】。由于该方 法计算复杂度小、具有多尺度特性和旋转不变特性,后来提升成一种有效的纹 理描述算子。l b p 描述的是像素点与其邻域像素点的关系。邻域的定义通常可 以由一对值( ,尺) 来表示,尸表示区域内包含的采样点个数,尺表示邻域的半 径大小。图2 2 表示i r 不同的p 、尺值对应的局部邻域像素分布。 9 太原理工大学硕士研究生学位论文 匿匪鏖 p = 8 ,尺= 1p = 1 2 ,尺= 2 5p = 1 6 ,r = 4 图2 2 不同( 只r ) 对应的局部邻域 f i g u r e2 2c o r r e s p o n d st on e i g h b o d l o o d 简单描述l b p 算子,就是先定义一个模板,对原图中的每个点都使用该模 板进行操作。将模板中心点与其邻域的像素点进行比较,不同位置的比较结果 被赋予不同的权值 3 3 】。这样,变换图像中对应点的值就由这些比较结果的权和 表示。可用公式( 3 1 ) 表示标准l b p 算子: 口一1 螂,r = s ( g ,一g 。) 2 ( 2 1 ) f _ o 其中, f 】x 0 s ( x ) 。1i x 初始化程序参数,选择样本、输入抗原; 随机产生若干抗体作为初始抗体群彳6 ,并随机抽取一部分抗原加入抗 体集; 抗原以随机顺序刺激抗体集,按4 1 3 节所述规则被抗体识别; 所有抗原刺激完毕后,删除识别数为零的抗体,以及识别了过多异类 抗原的抗体; 计算抗体的刺激度,按一定比例选择激励度大的若干抗体以e w 执行克 隆变异操作,将每个抗体变异得到的抗体集c 加入记忆抗体集m 中; 将m 添加到彳6 中,对抗体集彳6 进行抑制:如果两个抗体过于相似, 则保留识别半径小的抗体,因为识别半径大的抗体容易覆盖稠密区域 的抗体。本章将距离阈值设定为0 3 。 当迭代次数达到设定值时,算法结束,输出抗体;若不满足,令朋。 , 转到步骤3 继续执行; 对每个类别重复步骤( 1 ) 到( 7 ) ; 分类图像:完成所有类别的训练后,计算测试集中的每个图像特征向 量和所有抗体的距离,将抗原判决到距离最近的抗体所属的类别。 2 4 太原理工大学硕士研究生学位论文 该算法的流程图如图3 1 所示。 图3 1 基于人工免疫系统的自然图像分类算法流程图 f i g u r e3 1n a n t u r a l i m a g ec l a s s i f i c a t i o na l g o r i t l i lb a s e do na r t i f i c a l i m 埘u n es y s t e m 2 5 太原理工大学硕士研究生学位论文 3 2 抗原捕获 颜色特征采用分块颜色直方图来描述。首先将图像转换到h s v 空间,利用 非均匀量化将h 、s 、v 3 个颜色分量合成7 2 柄的一维矢量;然后对图像的长宽 按1 :2 :1 进行不均匀分块,如图4 1 所示,提取每个分块的颜色直方图。这样, 每幅图像的h s v 特征向量共有7 2 木9 维。 纹理特征也采取同样的分块策略。在3 3 邻域基础上对图像进行统一模式 l b p 运算,然后对每个分块进行归一化直方图统计,获得每个分块的5 9 维归一 直:方图。每幅图像的l b p 特征向量共有5 9 水9 维。 形状特征则基于熵的7 个不变矩来表示。该方法将图像转化为由单元熵构 成的熵矩阵。再利用h u 的7 个不变矩来描述该熵矩阵的形状特征。提取完所 有特征后,每幅图像均由1 1 8 6 维特征向量表示。 3 3 亲和度度量 图3 2 不均匀分块 f i g u r e3 2u n e v e nb l o c k 亲和度是度量抗体和抗原相似度的唯一标准。距离远的亲和度小,反之距 离近的亲和度较大,所以可直接通过距离来度量亲和度。 3 3 1 子特征距离 个体之间的颜色、纹理特征距离为对应分块直方图距离的加权和,如公式 ( 4 1 ) 。其中d f ( q ,r ) 为分块直方图距离,可通过直方图相交法来度量;6 为各 分块的权值。 9 d ( q ,r ) = 6 w 口( q ,r ) ( 3 1 ) 2 6 太原理工大学硕士研究生学位论文 形状特征距离的计算贝0 采用欧几里德法。不l 司于前两种特征的归一化直方 图,该特征向量的各个分量幅度变化较大,会对距离计算产生偏差,所以应事 先对特征向量进行内部归一化,使各个分量在计算时地位相同。设 ,t ,z ,k 代表m 幅图像,图像对应的形状特征向量为 e = z ,z z ,- ,厶) ,这样由m 幅图像可以得到一个m 的特征矩阵f2 石。 f 的每一列是长度为m 的特征序列:巧2 石j ,五一如 ,表示m 幅图像在第, 位上的特征值。计算该列的均值m j 和标准差,利用公式( 4 2 ) 对该列进行归一 化。 ,j , z ,= 业( 3 2 ) 3 3 2 综合特征距离 计算出颜色、纹理、形状三种特征距离后,对三者进行线性加权求和可得 综合特征距离:d = c d 1 + c w 2 d 2 + c w 3 d 3 。q 、d 2 、d 3 分别对应颜色、 纹理、形状距离,吣、咣、c 比分别表示三种特征的权重。然而,不同的子 特征具有不同的物理意义,不具有可比性,需要对每种特征距离进行外部归一 化处理。外部归一化实际上是对抗体集中所有抗体对之间的相似距离进行归一 化。根据以下步骤分别将颜色、纹理、形状的距离归一化到 o ,1 】上。 ( 1 ) 计算抗体集彳6 中任意一对抗体口包和a q 的某种特征所对应的特征向量 0 和,之间的相似距离: d f ,f = 如t a n c 8 ( z ,) ( f ,= 1 ,2 ,m 且f )( 3 3 ) (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 谁的花园大课件
- 2025年二手房买卖居间服务合同范本(含税费承担)
- 2025版防火玻璃防火卷帘门购销及安装合同
- 2025年度水路货物运输与船舶维修保养合同范本
- 2025版绿色金融融资中介服务合同范本
- 2025版船舶维修保养劳务合同范本
- 2025年智能电网用柴油发电机采购及监控合同
- 2025版墙体租赁与绿色生态保护合同
- 2025年度房地产项目投资合作协议
- 2025版科研机构研究员聘用合同书
- 2025-2030再生胶产业规划专项研究报告
- 完整的离婚协议书打印电子版(2025年版)
- 2025年人教部编版小学三年级语文上册全册单元测试题及答案(全套)
- 碧桂园物业管理
- 新时代中小学教师职业行为十项准则
- 去极端化教育宣讲
- 《走进物联网》课件
- 2023-2024学年浙江省杭州市钱塘区六年级上期末数学试卷(附答案解析)
- 2025年农村土地承包权补充协议
- JJF(皖) 175-2024 电子辊道秤校准规范
- 2025年人教版(2024)高一化学下册阶段测试试卷含答案
评论
0/150
提交评论