




已阅读5页,还剩54页未读, 继续免费阅读
(计算机系统结构专业论文)图像分类和图像语义标注的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 随着多媒体技术的发展和i n t e m e t 的普及,人们获得各种多媒体信息越来越 容易,其中图像是数量最多的一种,如何有效地、快速地从大规模图像数据库中 检索出所需要的图像已成为人们日益关注的问题。 基于内容的的图像检索技术( c o n t e n t b a s e di m a g er e t r i e v a l ,c b i r ) $ i j 用图像 的底层视觉特征( 颜色,纹理,形状等) 代表图像的内容,由于图像的底层视觉 特征与图像的语义表达之间存在“语义鸿沟”,传统的c b 瓜技术不能满足人们 按语义检索图像的需求。如果事先对图像集合按语义进行合理地分类或者标注, 会极大提高c b i r 系统的性能。本文主要研究基于图像底层视觉特征的图像语义 分类和语义自动标注。本文的主要贡献在以下几点: 1 提出了一种基于g a b o r 变换和支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 的纹理分类算法,该算法具有旋转不变性。在实验过程中,为确保分类器对旋转 后的图像特征“一无所知”,训练集和测试集分别选自不同旋转角度图像的上半 部分和下半部分,保证了本实验是一个真正意义上的旋转不变实验。在b r o d a t z 和u u c t e x 两个数据集中的实验表明,该纹理分类方法是有效可行的,在某些 类别上的分类准确率可以达到1 0 0 ,分类准确率和时间复杂度均优于k n n ( k n e a r e s tn e i g h b o r s ) 算法。 2 提出一种基于s 并综合m p e g - 7 视觉描述子的图像分类算法。由于图 像集中有多个语义类别,使用多类分类策略构建一个多类s v m 分类器。图像特 征使用m p e g - 7e x p e r i m e n t a t i o nm o d e l 软件从图像中提取。在实验中用到了多种 颜色和纹理描述子,对比了各种描述子结合s v m 分类器在c o r e l1 k 图像集中的 分类准确率和时间复杂度。实验同时表明,合理地综合使用多种视觉描述子可以 取得更高的分类准确率。 3 提出了一种基于s v m 分类器的图像语义自动标注算法。图像特征是基于 m p e g 7 颜色和纹理描述子的全局特征。每个标注词对应一个二分s v m 分类器, 针对多个语义词,利用多类分类策略构建一个多类分类器,这就建立了图像底层 特征与语义词之间的关联。s v m 分类器的输出采用后验概率形式,以方便地比 较图像属于各个语义词类别的可能性。实验在c o r e l5 0 0 0 数据集中进行,首先使 山东大学硕士学位论文 用p o r t e rs t e m m i n g 算法对所有语义词进行s t e m m i n g 操作,并舍弃图像数过少的 语义词,共有8 2 个词可用于构建分类器。实验过程中采取了两种策略选取标注 词,并对比了两种策略的实验结果。评价标注结果时,使用了分别针对图像和标 注词的准确率和召回率,结果评价更加客观、全面。 关键词:基于内容的图像检索图像分类图像语义图像标注纹理分类支 持向量机m p e g - 7 l i 山东大学硕+ 学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to fm u l t i m e d i at e c h n o l o g ya n dt h ep o p u l a r i z a t i o no f i n t e m e t , p e o p l ec a na c q u i r em u l t i m e d i ai n f o r m a t i o ni nl a r g ea m o u n t h o w t or e t r i e v e t h ei m a g e sf r o mi m a g ed a t a b a s ep r e c i s e l ya n de f f i c i e n t l yh a sb e e na ni m p o r t a n ti s s u e i nt h ef i e l do f i m a g er e t r i e v a l c o n t e n t b a s e di m a g er e t r i e v a l ( c b i r ) e x t r a c t sv i s u a lf e a t u r e sa sr e t r i e v a l f e a t u r e s ,s u c ha sc o l o r ,t e x t u r ea n ds h a p e ,e r e f o rt h ee x i s t e n c eo fs e m a n t i cg a p b e t w e e nl o w l e v e li m a g ef e a t u r e sa n dh u m a nu n d e r s t a n d i n gt oi m a g e s ,c b i rc a r l t g e ts a t i s f i e dr e t r i e v a lr e s u l t s c l a s s i f y i n gi m a g e si n t or e a s o n a b l ec a t e g o r i e su s i n g l o w - l e v e lf e a t u r e so ra n n o t a t i n gi m a g e sw i l lg r e a t l yi m p r o v et h ep e r f o r m a n c eo f c b i rs y s t e m s t h i st h e s i sd o e sas t u d yo fi m a g ec l a s s i f i c a t i o na n di m a g ea n n o t a t i o n t h em a i nc o n t r i b u t i o n so ft h i st h e s i sa r ea sf o l l o w s 1 p r o p o s eam e t h o do fr o t a t i o ni n v a r i a n tt e x t u r ec l a s s i f i c a t i o nu s i n gg a b o r t r a n s f o r ma n ds u p p o r tv e c t o rm a c h i n e ( s v m ) t om a k es u r et h ec l a s s i f i e rk n o w s n o t h i n ga b o u tt h ec h a r a c t e r so fr o t a t e di m a g e s ,w ec r e a t et h et r a i n i n gs e tf r o mt h e s u b i m a g e sf r o mt h et o ph a l fo fn o n er o t a t i o ni m a g e t h es u b i m a g e sf r o mt h ef o o th a l f o fr o t a t e di m a g e sa r eg r o u p e dt ot h et e s t i n gs e t t h i sm e t h o di st e s t e do nb r o d a t za n d u i u c t e xd a t a s e t sa n dt h ee x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h a ti ti se f f e c t i v ea n d e f f i c i e n t t h ep r e c i s i o nc a nb ea sh i g ha s10 0 i ns o m ec l a s s e s 2 p r o p o s eam e t h o do fi m a g ec l a s s i f i c a t i o nb a s e do nm p e g - 7c o l o ra n dt e x t u r e d e s c r i p t o r s ,u s i n gs v m a sc l a s s i f i e r f o rt h e r ea r es e v e r a lc l a s s e si ni m a g ed a t a s e t ,t h e a p p r o a c hc o n s t r u c t st h em u l t i c l a s ss v mw i t ht h eh e l po fm u l t i - c l a s sc l a s s i f i c a t i o n s t r a t e g y i m a g e f e a t u r e sa r ee x t r a c t e du s i n gm p e g - 7e x p e r i m e n t a t i o nm o d e l s o f t w a r e t h ee x p e r i m e n tw i t hc o r e l1ku t i l i z e ss e v e r a lc o l o ra n dt e x t u r ed e s c r i p t o r s c l a s s i f i c a t i o np r e c i s i o na n dt i m ec o m p l e x i t ya r eg i v e n t h er e s u l t ss h o wt h a ti fw e p r o p e r l yf u s et h em p e g - 7d e s c r i p t o r st h eh i g h e rp r e c i s i o nc a r lb ea c h i e v e d 3 p r o p o s eam e t h o do fi m a g ea n n o t a t i o nu s i n gm p e g - 7d e s c r i p t o r sa n ds v m t h ei m a g ef e a t u r e sa r eg l o b a lf e a t u r e sb a s e do nm p e g - 7c o l o ra n dt e x t u r ed e s c r i p t o r s t h em e t h o db u i l d sab i n a r ys v ma c c o r d i n gt oe a c hw o r d f o rt h e r ea r eal o to fw o r d s u s u a l l y , t h em e t h o dc o n s t r u c t st h em u l t i c l a s ss v mw i t hh e l p o fm u l t i - c l a s s c l a s s i f i c a t i o ns t r a t e g y t h e r e f o r e ,t h i sm u l t i - c l a s ss v me s t a b l i s h e sam a p p i n gf r o m i i i 山东大学硕士学位论文 i m a g e st ow o r d s t h eo u t p u to fs v mc l a s s i f i e ri sm o d i f i e dt op o s t e r i o rp r o b a b i l i t y f o r ms ow ec a ng e tt h ep r o b a b i l i t ye s t i m a t e s i nt h ee x p e r i m e n tw i t hc o r e l5 0 0 0 d a t a s e t ,t h em e t h o du s ep o r t e rs t e m m i n ga l g o r i t h ma st h ef i r s ts t e p b ye l i m i n a t i n gt h e w o r d s 、i ms of e wi m a g e s ,8 2w o r d sa r eu s e dt ob u i l ds v mc l a s s i f i e r t h em e a n p e r - w o r dp r e c i s i o na n dr e c a l la sw e l la sm e a np e r - i m a g ep r e c i s i o na n dr e c a l la r e a d o p t e df o re v a l u a t i n ga n n o t a t i o ne f f e c t i v e n e s s k e y w o r d s :c b i r ;i m a g ec l a s s i f i c a t i o n ;i m a g es e m a n t i c ; i m a g e a n n o t a t i o n ;t e x t u r ec l a s s i f i c a t i o n ;s v m ;m p e g - 7 i v 原创性声明和关于论文使用授权的说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本 论文不包含任何其他个人或集体已经发表或撰写过的科研成果。 对本文的研究做出重要贡献的个人和集体,均已在文中以明确方 式标明。本声明的法律责任由本人承担。 论文作者签名:。至廷冱五 e l期:型:堕! 笙: 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同 意学校保留或向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或其他复制手段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:弓狠磊 导师签名: 山东大学硕士学位论文 曼曼皇曼曼曼曼鼍曼曼皇曼鼍m l j! i_ 。 。 m 皇曼曼皇曼曼曼曼皇皇 第一章绪论 本章主要介绍本论文的研究背景、国内外研究现状、论文的主要工作以及整 篇文章的组织结构。 1 1 研究背景和意义 图像的语义分类和自动标注是近几年来信息检索和多媒体领域的研究热点, 也是基于内容图像检索( c b i r ,c o n t e n t - b a s e di m a g er e t r i e v a l ) 领域中重要的 组成部分和新的突破口。近十年来,随着更强大计算能力的处理器、超高容量的 存储设备、更高速的计算机网络的出现,以及语音、图像和视频信号处理技术的 发展,人们希望可以用更高效的方法来存储和检索令人感兴趣的视听内容,人类 对多媒体系统有了更强的需求和依赖。 很多组织和机构都有非常庞大的图像和视频收藏,这些收藏往往都是以数字 化的形式存储的,并且可以通过计算机网络存取。数码摄影和数码摄像等数字化 技术也使得越来越多的普通人能够拥有个人的数字多媒体集合,i n t e r n e t 中的 图像数量正以极高的速度增长。面对如此巨大数量的数字化信息,搜索和查询感 兴趣的信息会变得越来越困难。 早期传统的图像检索是基于文本的检索,它首先对图像进行人工标注,然后 通过对文本( 关键词) 进行匹配得到检索结果。这种方式存在两大难题n 1 :一是 对图像进行人工标注费时费力,尤其面对海量的图像库时,人工标注工作量巨大: 二是文本标注存在主观性和不确定性,直接影响到检索结果的准确性。 近二十年来c b i r 技术的出现,从一定程度上解决了基于文本的图像检索所造 成的局限性。c b i r 使用可以直接从图像中获得的客观的视觉内容特征,如颜色、 纹理、形状等来判断图像之间的相似性瞳1 。就图像特征的作用域而言,c b i r 系统 可分为:基于全局特征的检索和基于区域特征的检索口1 。c b i r 使用例子查询 ( q u e r yb ye x a m p l e ) 、指定图像各种特征属性的方式以及草图、相关反馈等多种 可视化的查询方法来代替关键词进行检索,是一种直观的检索方式h 1 。 但是传统的c b i r 系统并不挖掘图像表达的语义知识,只是直观地比较图像特 山东大学硕士学位论文 征的相似度,不能完全满足人们按语义分类和检索图像的需求。因此语义图像分 类及检索技术是一个值得深入研究的新兴领域。近年来,语义图像分类和标注技 术已经成为与c b i r 密切相关的研究热点h 1 ,并成为数字化图书馆等重大研究项目 中的关键技术。 基于语义的图像分类和标注具有广泛的应用前景,包括: ( 1 ) 数字化图书馆的建立和管理。大量的图像数据的存储和检索可以利用图 像语义分类及标注的研究成果。 ( 2 ) 家庭数字照片的自动分类嵋1 。 ( 3 ) 医学图像分类叫。 ( 4 ) 图像检索。图像按语义进行分类或标注后,可以方便的按语义进行检索 c 7 3 o ( 5 ) 视频检索。图像检索是视频检索的基础,如果将视频看成一系列图像的 集合,那么视频检索就成为以关键帧为图像库的图像检索阳1 。 ( 6 ) 卫星遥感图像处理b 3 。 1 2c b l r 系统的国内外研究现状 从2 0 世纪9 0 年代以来,c b i r 得到了广泛的研究,各大研究机构和公司也 都相继推出自己的系统,典型的图像检索系统主要有:o b i c 系统,p h o t o b o o k 系 统,v i s u a l s e e k 和w e b s e e k 系统,n e t r a 系统,m a r s 系统,s i m p l i c i t y 系统等 等。下文将对这些系统作简单的介绍。 ( 1 ) q b i c 系统 q b i c 系统n 们是由i b m 公司a l m a d e n 研究室开发的c b i r 系统,它的系统框架和技 术对后来的图像检索系统具有深远的影响。它的系统结构由图像库、特征计算和 查询三个部分组成,主要支持范例查询、草图查询、图像特征模板查询等多种查 询方式。系统中使用不同颜色空间的颜色直方图作为颜色特征,所采用的纹理特 征为改进的t a m u r a n l l 表示:粗糙度、对比度和方向性等,其形状特征包括目标面 积、离心率、各阶矩和主轴方向等。此外,q b i c 系统还是极少数考虑到高维特征 索引问题的系统之一。 2 i | j 东大学硕士学位论文 ( 2 ) p h o t o b o o k 系统 p h o t o b o o k 系统n 2 1 是m i t 媒体实验室在1 9 9 4 年开发的,它是一套交互式图像 数据库浏览和查询工具,主要功能是纹理识别、形状识别和人脸识别。用户可以 在每个子系统中按照对应的特征进行查询。在p h o t o b o o k 的扩展版本中,引入了 相关反馈技术,突出了交互式语义查询和系统学习能力,提高了系统性能。 ( 3 ) v i s u a l s e e k 和w e b s e e k 系统 v i s u a l s e e k m l 和w e b s e e k “3 是由美国哥伦比亚大学数字视频和多媒体实验室 开发的,前者是c b i r i e 具,后者是面向w e b 的文本图像搜索工具。其主要的特点 是实现了图像区域的空间关系查询和从压缩域中抽取视觉特征。系统所采用的特 征是全局颜色特征,区域的二进制颜色集和基于小波变换的纹理特征。在索引技 术方面,系统采用了二叉树索引算法。 ( 4 ) n e t r a 系统 n e t r a 系统n 钉是由加利福尼亚大学s a n t ab a r b a r a 分校开发的图像检索系统。 该系统是基于区域的,即对图像的检索是建立在对图像的对象分割,并提取这些 分割区域特征的基础上的。相比于其它系统,它考虑到了图像中的对象概念,贴 近用户查询时的思路。它的关键技术主要有:基于g a b o r 滤波器的纹理分析,基 于神经网络的图像辞典结构,基于边缘增长的区域分割技术。 ( 5 ) m a r s 系统 该系统是由美 u i u c 大学开发的n 6 l 。它基于人机交互的思想,充分考虑用户 的需求,通过相关反馈来猜测用户的查询意愿,根据用户的需求及时调整用于检 索的图像特征和相似性度量准则,以缩小底层视觉特征和高层语义之间的差距。 系统检索的结果显示,结合相关反馈之后的图像检索系统性能有了较大提高。 ( 6 ) s i m p l i c i t y 系统 由j a m e sz w a n g 等人开发的s i m p l i c i t y 系统( s e m a n t i c s - s e n s i t i v ei n t e g r a t e d m a t c h i n gf o rp i c t u r el i b r a r i e s ) n 利,是一个结合了图像语义的图像检索系统。它的 关键技术有:语义分类技术,基于小波变换的特征提取,基于图像分割的联合区 域匹配。系统中的图像由粗略对应于对象的区域集合组成,这些区域由颜色、纹 理、形状和位置等特征表示。系统分类器将图像分成不同的语义类别。它应用区 域匹配策略将图像所有区域的属性联合起来,以用作图像相似性度量,这减小了 山东大学硕士学位论文 由于错误图像分割所带来的负面影响。 除上文介绍的几个典型系统之外,还有很多其他图像检索系统,例如 p i c h u n t e r 1 钔,v i r a g e 公司的v i r a g e 1 引,w a l r u s 系统2 们,i m a g e s e e k m l 等。 一个典型的c b i r 系统框架如下图: 。广 : i ; 图像存储 ; l : 。 : i 特征提取 ; f - - - - - _ - - ; 匹配机制 - - - - - - - i i ; 用户系统 ; - i 图1 1 一个典型c b i r 系统的框架图 然而,人类所理解的图像与用底层视觉特征来表达的图像之间存在着很大的 差距,即在图像语义和视觉特征之间横亘着“语义鸿沟”。图像的语义研究目前 尚处于探索阶段,图像语义研究的焦点主要集中在语义对象获取、语义表述、语 义提取以及语义处理等方面【2 2 1 。可以预见,图像的语义分类和自动标注是一个颇 具生命力的研究方向,具有重大的理论价值和广泛的应用前景。 1 3 论文的主要工作 本文是对c b i r 领域中的一个前沿研究领域:图像分类和图像标注问题的一 个研究。介绍了传统c b i r 技术中用到的图像颜色、纹理、形状和位置关系的提 取方法,诠释了m p e g - 7 标准及其视觉描述子,给出了图像语义和图像标注的基 本概念,全文的主要贡献有: ( 1 ) 提出了一种基于g a b o r 变换和支持向量机( s u p p o r tv e c t o rm a c h i n e ,s ) 的旋转不变的纹理分类算法。 ( 2 ) 提出一种综合m p e g - 7 描述子和s v m 的图像语义分类算法。 4 山东大学硕十学位论文 ( 3 ) 提出一种基于s v l v l 的图像标注算法。 1 4 论文的组织结构 全文的章节安排: 第一章介绍了研究的目的和意义,回顾了国内外研究现状,并概括了本文的 主要工作。 第二章介绍了图像纹理特征的基本概念和主要的分类算法,并给出了一种旋 转不变的纹理分类算法。因为纹理图像是较为特殊的一类图像,有其特殊的应用 背景,所以在此独立成一章。 第三章介绍了图像语义的基本概念,并介绍了m p e g - 7 标准及其视觉描述 子,提出了一种基于s 订的图像语义分类算法。 第四章介绍了图像语义自动标注的概念,并给出了一种使用s v m 分类器的 图像语义标注算法。 第五章总结全文,并对下一步研究工作进行展望。 山东大学硕士学位论文 2 1 纹理的基本概念 第二章纹理图像分类 在人类的日常生活中,纹理现象无处不在,从大自然的天空、草地到生活中 常见的砖墙、布匹等都具有明显的纹理特征。纹理是图像中一个重要而又难于描 述的特征,至今还没有公认的精确定义【2 】。 观察下图可以发现,纹理图像在局部区域内呈现不规则性,而在整体上表现 出某种规律性。习惯上,把图像中这种局部不规则的、而宏观有规律的特性称之 为纹理。纹理还可以认为是灰度在空间一定的形式变化而产生的图案模式,是图 像区域固有的特征之一。根据t a m u r a 等人进行的人类对纹理的视觉感知心理学研 究,纹理反映了物体的六个视觉属性【1 1 1 :粗糙度( c o a r s e n e s s ) 、对比度( c o n t r a s t ) 、 方向度( d i r e c t i o n a l i t y ) 、线相似度( 1 i n e - l i k e n e s s ) 、规整度( r e g u l a r i t y ) 以及粗略度 ( r o u g h n e s s ) 。 纹理的研究可以细分为基于纹理的图像检索与分类、图像分割和纹理合成等 几个方面,本文关注的是纹理图像的分类问题。 6 山东大学硕士学位论文 豳麟鬻 2 2 纹理分类的应用 图2 1 纹理图像示例 随着图像获取技术和多媒体数据库的不断发展,纹理分类逐渐成为近年米的 研究热点之一,在众多应用领域得到了广泛的应用,如: ( 1 ) 景物识别:利用纹理将自然景物分类开来,如在道路探测中,并j j f i j 纹理 特征将道路与旁边的树木、花草等分开f 2 3 1 。 ( 2 ) 遥感图像分析:纹理分类在遥感图像处理过程中有很多应用,在世星遥 感图像中,利用纹理特征可以识别出陆地、森林和湖泊等1 2 4 1 。 ( 3 ) 医学图像分析:x c t 、b 超和x 光等医学图像都有很强的纹理特性,纹理 删霪 山东大学硕士学位论文 分类在判断病变组织和检查人体内部结构等方面都有很多应用【2 5 1 。 ( 4 ) 基于内容的图像检索:图像都可以看成是由纹理组成,纹理是图像统计、 结构等信息的综合反映,是图像最显著的特征之一,因此,纹理特征是基于内容 图像检索的有效手段2 ,4 ,2 6 】 2 3 纹理特征提取方法 只有用有效的描述纹理特性的方法去分析纹理图像,才有可能真正描述与理 解纹理。现有的纹理分析方法大致可以分为四类:统计方法、结构方法、模型方 法和频谱分析的方法【2 7 1 。 ( 1 ) 统计法通过计算图像像素的局部特征分析灰度级的空间分布,根据确定 局部特征的像素数可以分为一阶、二阶和高阶统计特性。一阶统计特性估计单个 像素特性而不考虑像素间的空域关系,二阶和高阶统计特性根据像素间的相关空 间信息估计两个或多个像素特性。常用的统计特性有灰度共生矩阵和自相关函数 等【2 引,这类模型的缺点是需要大量的统计特性数据。 ( 2 ) 结构方法将研究重点放在分析纹理基元之间的相互关系和排列规则上 【2 9 1 ,以基元特征和排列规则作为特征用于纹理分类和分割,该类方法一般只适用 于规则性较强的人工纹理,在分析自然纹理图像时较难取得满意的效果。 ( 3 ) 基于模型的方法首先假设纹理按某种模型分布,通过求模型参数提取纹 理特征,例如马尔可夫链和马尔可夫随机场3 0 1 ,仍然需要大量的计算来确定合适 的参数。 ( 4 ) 信号处理的方法:首先对纹理图像进行变换和滤波,然后提取谱特征。 将输入纹理图像用c r a b o r 滤波器、小波滤波器分解成不同尺度和方向的子波段, 然后对各自波段进行处理得到特征向量,最直接的方法是计算子波段能量分布的 均值和标准方差【3 1 1 。 2 4 分类算法介绍 分类算法( c l a s s i f i c a t i o n ) 就是把一组对象分成几类的过程,对象可以是任何 可分类的客体包括文本、统计数据、图像、产品等等3 2 1 。分类算法大致可分为两 类:有监督分类( s u p e r v i s e dc l a s s i f i c a t i o n ) 和无监督分类( u n s u p e r v i s e d 山东大学硕士学位论文 c l a s s i f i c a t i o n ) 。 有监督分类是示例学习。给定n 个例子( x i ,f ( x 0 ) ( i = i ,2 ,n ) ,通过学习得 到分类函数f ( 提出一个用以判别该函数的规则) 。无监督分类可以看作为观察学 习( l e a r n i n gf r o mo b s e r v a t i o n ) 。对无监督分类器给定一些对象x ,即有一群未分 类的客体。无监督分类研究的目标是寻找模式的相似性,也即自动把这群客体分 成若干小组。属于同一组的客体,彼此相似:属于不同组的客体,彼此相异。也 就是说,无监督分类的目的是对数据进行方便而有效的分组,而不是寻找日后对 数据进行分类的规则。两种分类算法均可用统计、机器学习和神经网络方站实现。 给定了一组对象,选用哪种( 或哪几种) 分类算法最合适,这是一个特别值得研 究的问题。 有监督分类算法发展至今,所包含的内容已非常丰富。大体上包括统计、机 器学习和神经网络等三大类。文献【3 3 1 考查了几乎所有有名的监督分类算法,共计 1 8 种。其中有统计算法8 种( n a i v eb a y e s ,k n e a r e s tn e i g h b o r s ,k e r n e ld e n s i t y , l i n e a rd i s c r i m i n a n t ,q u a d r a t i cd i s c r i m i n a n t ,l o g i s t i cr e g r e s s i o n ,p r o j e c t i o n p u r s m t ,b a y e s i a nn e t w o r k s ) ;机器学习算法7 种( c a r t ,c 4 5 ,n e w l d ,a c 2 , c a l 5 ,c n 2 ,l t r u l e ) 以及3 种神经网络算法( b a c k p r o p a g a f i o n ,r a d i a lb a s i sf u n c t i o n , k o h o n e n ) 。该项目研究把上述算法用于8 种大型实际分类问题上,结果表明,没 有一个算法对每个数据集合都是最好的。该项目的研究者认为,哪个算法是最好 的因其数据集合的特性而定。然而,根据数据集合的什么特性决定采用什么类型 算法最好却是个问题,要彻底解决这个问题尚有许多理论分析和实验工作要做, 该项目只得到一些初步的结论。最快的算法是一些统计算法,如l i n e a r d i s c r i m i n a n t 和n a i v e b a y e s ,机器学习算法也比较快。 无监督分类也被称为聚类算法,聚类可以定义为将一群数据组织为若干个内 部成员相似的群体的过程。典型的聚类算法如k 均值、j 均值、增长细胞模型等。 2 4 1 支持向量机 s v m 是近年来广泛应用于图像分类的分类算法。 s v m 3 4 1 基于结构风险最小化原理,在解决小样本、非线性及高维模式识别 问题中表现出很多优势。s v m 通过在原空间或经投影后在高维空间中构造最优 9 山东大学硕士学位论文 分类面,将给定的属于两个类别的训练样本分开,构造超平面的依据是两类样本 离超平面的距离最大化【3 5 】。 在线性可分的情况下,设样本集( t ,只) ,f - 1 ,2 ,n ,r d , 只 一l ,+ l 是类别 标志,d 维空间中线性判别函数的一般形式是g ( x ) = w x + b ,相应的分类面方程 为w x + b = 0 。 求解最优分类面等效于最小化州l ,目标函数为: m i n 舢) = 扣1 2 = 丢( w s u b j e c tt o :咒( w t + 6 ) 一l o ,i = l ,n 鼍是位于分类间隔面上的样本,这些训练样本被称为支持向量,此时分类函 n 数为:厂( x ) = s 印 口j 只( x ) + 6 ) 。 对于线性不可分情况,s v m 一方面引入松弛变量和惩罚因子,使目标函数 变为:( w ,善) = 三( w w ) + c ( 喜专) ,另一方面,通过非线性变换将输入空间变换 到高维空间,然后在高维空间中求解最优分类面,这种非线性变换可以通过定义 适当的核函数来实现。最终得到的分类函数为:( x ) = s 印 y , k ( x ,t ) + 6 。 常用的核函数有线性核函数、多项式核函数、r b f 核函数和s i g m o i d 核函数。 很多实验 3 6 , 3 7 1 表明,r b f 核函数可以取得更优的分类准确率并且易于筛选最优参 数,我们在以下的实验中都使用i m f 核函数:k ( x i ,x ,) = e x p ( 一圳薯一x l l ) ,y 0 。 多类问题可以转化为两类问题处理,有两种转化模式:一种是 “1 - a g a i n s t r e s t ,将n 类问题转化成n 个两类问题,即第k 个分类器由第k 类样本 和剩下不属于第k 类的所有样本构成两类,这种模式的训练时间较长:另一种是 “1 - a g a i n s t - ”,每两类间构造分类器,得到堕冬坐个分类器,用投票法组合这 上 些分类器,得票最多的类为最终结果,f r i e d m a n 证明这种方法是贝叶斯最优的【3 引。 l o 山东大学硕士学位论文 _ 一i 一_ i i i i i i 一一l i i ;i; i i 曼曼曼量曼皇曼曼曼量曼鼍曼皇皇 2 5 纹理分类的研究现状 在提取图像特征之后,可以使用神经网络方法、k n n 、各种聚类算法、模糊 算法、s v m 方法等各种模式识别方法进行纹理分类或者聚类。在以往的研究中, 文献f 3 6 】对比了多种小波变换在纹理分类中的应用,使用的是l v q 分类方法。文献 鲫提出了一种旋转不变的纹理图像检索方法,文献【3 8 ,3 9 1 使用s v m 方法对纹理图 像进行分类。文献 4 0 1 使用基于遗传算法的训练区域选择法进行无监督纹理分类, 文献【4 l l 将模糊聚类方法应用于纹理分类中。 2 6 基于g a b o r 变换具有旋转不变性的纹理分类方法 本章提出一种基于g a b o r 变换和s v m 的具有旋转不变性的纹理分类方法。 2 6 1 基于g a b o r 变换的纹理特征提取方法 通过一组共3 0 个g a b o r 滤波器对纹理图像进行滤波,计算滤波后图像的平均 能量和标准差,并考虑原始图像在空间域的平均能量和标准差,以此6 2 个特征 值构成纹理特征向量。g a b o r 变换能够较好的兼顾信号在时域和频域中的分辨能 力,用于纹理图像的检索要优于小波变换4 2 1 。具体计算过程如下: 设g ( x ,y ) ,g ( u ,功分别是2 维g a b o r 函数及其傅里叶变换,对一幅大小为 尸q 的灰度图像i ( x ,y ) 做2 维g a b o r 变换: 既。( z ,y ) = f f ,( 五,m ) g 。 一葺,j ,一y , ) d x i d y , 表示复共轭,其中 g 砌( 工,y ) = a - = g ( x 。,y ) ,口 l ,m ,2 为整数( 1 ) x 。 ,j ,- 口- m ino+os0)a-rn(xcos0+ysino)(-xsmo y c o s o ) ,0 = 詈 , x= ,j ,= 口嘲 + , = 詈 , m = o ,1 ,s l ,刀= 0 ,l ,k 一1 ,s 和k 分别为尺度数和方向数。g 。( z ,y ) 是 对g ( x ,y ) 进行s k 次伸缩和旋转,设定s = 5 ,k = 6 。 定义频域的平均能量和标准差分别为: 【东大学硕士学位论文 :百j f l w t x y ) l 出a y 迹笔竽塑 空间域的平均能量和标准差分别为: 如:亘墨p ! q 丝,:盟! = ! ! 型p ! 二q 垒! :丝 则图像的纹理特征向量为: 从d ,o s d ,a 0 0 ,1 ,c r 0 1 ,心,吼5 2 6 2 纹理特征的旋转不变性 因许多通过数码相机等获取的图像信息,由于摄影的角度不同,作者想突出 的艺术效果不同和剪裁的角度不同,同一物体可能在视觉上有很大的差异。所以 实现具有旋转不变性的图像分类,在某种程度上是真正具有语义的图像识别,是 把图像的分类和识别走向实用的重要一步。 为了取得旋转不变性,采用文献【3 7 1 中的思想,并将其应用于上一节已得到的 特征向量:分别计算6 个方向上5 个尺度的平均能量之和,取能量最大的方向为 主方向,然后把主方向上的特征值( 平均能量和标准差) 移到第一位,并对其它 方向上的特征值进行相应的环形移位。对熊。,仃。不做变动。 算法i 获取图像纹理特征向量的旋转不变形式 输入:图像的纹理描述特征向量 从d ,吒d ,脶l ,c r o ,地5 , 输出:输入特征向量的旋转不变形式 s t e pj ,计算6 个方向上5 个尺度的平均能量之和: f o r 滓o t o k 1 f o r j = 0t os - 1 k = 6 ,6 个方向 s = 5 ,5 个尺度 e n e r g y i 】- e n e r g y i 】+ 一f ; s t e p2 - 求e n e 聊【】的最大值及其索引值d ; s t e p3 ,把d ,吼d ,鸽d ,o l 护,以d ,吼d 分别前移到同尺度特征值的第l 位, 对其它方向上的特征值作环形移位: f o ri = ot od 1 若d 等于0 则不必作移动 1 2 山东大学硕士学位论文 把,吼;,m ,q ,心,仃。,分别后移到第k d * 位; f o r i = d t o k 1 把硒,吼。,“,q f ,心f ,q ,分别前移到第i - d 位; 下面证明此算法具有很好的旋转鲁棒性口刀。设图像,( j ,) 的主方向为号, 在特定尺度m ,其能量在各个方向上的分布为: ( 已 0 ,已,l ,已,巴,川) ( 2 ) ,( t y ) 为,( z ,y ) 旋转一号后得到的图像,它的主方向为o 。,。( x ,y ) 的能量分 布为: - ( e 。,一i ,e 。j 一e 。o ,e 。,一1 一f ) ( 3 ) 其中有已。= e 乙,印民,。= e 。t 1 _ l ,依此类推。因为图像旋转1 8 0 。后能量分布 情况与原图像一致,所以有e 。,。= e 。彤,于是得到 e 乙一“= e - 中已l _ “ ,= e 乙1 _ ,依此类推,负方向都加了n 。于是,( 五y ) 可 以表示为:伍乙,讲,e ,1 _ 州,e 椰,e 二。一。) ( 4 ) 将( 4 ) 式按主方向重新排列,得到: ( e 。,o ,e 。1 ,e 。,_ 却e m , n - ie 。- l + l ,e 。- 1 ) ,这正是( 3 ) 式环形移位后的结 果。因此图像旋转后的能量分布可以等效于原能量分布的环形移位,如果固定其 最大能量的位置( 例如第一位) ,则旋转后的能量分布同旋转前。 2 6 3 基于g a b o r 变换具有旋转不变性的纹理分类方法 算法2s v m 实现旋转不变的纹理分类 繇印f ? 按照2 6 1 节介绍的方法,对纹理图像做一组c r a b o r 变换,得到其特 征向量: s t e p2 ,按照算法l ,对特征向量作环形移位,得到旋转无关的特征向量; s t e p3 7 对训练集和测试集中的数据归一化到【一l ,1 】; t li 东大学硕十学位论文 s t e p4 7 使用i m f 核函数,在训练集中使用交叉验证技术( c r o s s v a l i d a t i o n ) 4 3 1 筛 选参数c 和y 的最佳值; s t e p5 ,用参数c 和y 的最佳值在训练集上构造分类器; s t e p6 7 使用分类器进行测试并统计分类结果。 2 7 实验与结果分析 2 7 1 纹理数据集 实验在两个纹理数据集上进行:b r o d a t z “,4 5 1 和u i u c t e x 4 6 1 。b r o d a t z 纹理数 据集共有1 3 个类别的纹理图片,每个类别含7 幅5 1 2 5 1 2 像素的灰度图像,其 中第1 幅为没有旋转的图像,另外6 幅分别为旋转3 0 、6 0 、9 0 、1 2 0 、1 5 0 、2 0 0 度后的图像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年轨道交通工作人员安全生产知识考试试题及答案
- 全国电力行业(风力发电运维岗位)技能竞赛决赛试题库及答案
- 2024-2025年新能源储能行业在储能电站储能系统安全性中的应用场景报告
- 高炮合同模板(3篇)
- 高粱合同模板(3篇)
- 城市地下管线探测视频拍摄与数据分析协议
- 环保行业工伤赔偿协议模板
- 家居建材店店长任期管理与市场拓展合同
- 江南大学产学研合作技术转化实施合同
- 文秘专业笔试试题及答案
- 2025中国农业科学院棉花研究所第二批招聘7人备考考试题库附答案解析
- 部编版2025-2026学年三年级上册语文期中测试情境卷A卷(含答案)
- 做更好的自己课件-2025-2026学年统编版道德与法治七年级上册
- 2023年贵州贵州贵安发展集团有限公司招聘考试真题及答案详解(夺冠)
- 移动照明车夜间施工租赁协议
- 重庆西南大学附中2025-2026学年九年级上学期开学考试语文试题
- 2025年大宗商品贸易业务流程优化计划
- 情感表达+课件+2025-2026学年人教版(2024)初中美术七年级上册
- 借名购车协议贷款协议书
- 2025年小升初数学考试试题(附答案)
- 2025年6月四川省高中学业水平合格性考试地理试题(解析版)
评论
0/150
提交评论