已阅读5页,还剩47页未读, 继续免费阅读
(教育技术学专业论文)www图像分类方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
w w w 图像的分类方法研究 中文摘要 随着信息技术的快速发展、信息高速公路的建设和互联网技术的推广应用, 人们正快步走近信息化社会。在信息化社会中,网络为用户提供了大量的可用资 源,如文本、图像、视频、音频等。互联网资源也成为教育资源库建设的重要来 源。但是互联网上的信息种类繁多,排列错综复杂,这就给相应的信息检索带来 一定的困难。 近几年来,基于内容的图像分类检索技术有了长足的发展,主要是基于低层 次视觉特征的图像检索,比较成功的例子有美国i b m 公司的q b i c 系统等。在基 于内容的多媒体信息分类检索技术研究中,基于理解的文本分类检索已经有比较 好的研究成果,但基于视觉特征和语义特征的图像、音视频分类检索尚处于研究 的初始阶段。目前,在图像分类方面,还没有比较成熟的算法能够对所有的图像 类型都进行有效的分类。因此研究图像分类的有效算法对于图像检索技术发展具 有十分重要的意义。本文即针对w w w 图像分类方法进行了研究。 本文将w w w 图像按功能分为图标类图像和图片类图像两大类。图标类图像一 般尺寸都较小,它的功能在于给使用者一个简单提示或标识。而图片类图像一般 为包括具体内容的图像,比如山水、风光、人物、绘画等。图片类图像按内容又 可继续分为照片类和图画类。照片类图片可以继续细分为人造景物类图片和自然 景物类图片,图画类图片可分为绘画类和图表类。对不同的图像类型分析其特征, 从图像中提取相应的参量,利用参量设计算法对图像进行分类。在图片类图像继 续分类中,采用了颜色数参量和相对颜色直方图参量结合使用的算法。本文还对 h o u g h 直线检测方法进行了改进,并将其作为照片类和图画类图像分类的重要参 量。 另外,本文对纹理图像分类也进行了一定的研究。首先利用霍夫变换直线检 测方法识别比较简单规则的条纹状、网格状纹理。对于较复杂的纹理,将神经网 络引入到纹理图像分类中,利用g a b o r 滤波器提取纹理特征参数并结合t a m u r a 纹理特征参量作为图像的分类参量,利用神经网络的自适应、联想记忆和非线性 转换能力处理提取的参量数据,实现对纹理图像的分类。 整个试验平台是在w i n d o w s2 0 0 0 操作系统下,以v i s u a lc + + 6 0 开发的。 以a c e s s 作为图像特征数据库进行分类验证。实验结果表明,本文提出的分类算 法具有良好的可行性,实验的正确率较高。 【关键字】图像分类颜色相对直方图b p 神经网络 h o u g h 变换g a h o r 滤波器 【分类号】g 4 3 4 i i r e s e a r c ho nm e t h o do fi m a g e s c i a s s i f ic a t i o n nw o ri dw i d ew e b a b s t r a c t w i t ht h er a p i dd e v e l o p m e n t o fi n f o r m a t i o nt e c h n o l o g y ,t h e c o n s t r u c t i o n o fi n f o r m a t i o nt h r u w a y a n d t h eb r o a d a p p l i c a t i o n o f i n t e r n e t ,p e o p l e h a sb e e n i n s o c i e t y o fi n f o r m a t i o n i n i n f o r m a t i o n s o c i e t y ,i n t e r n e th a ss u p p l i e dp e o p l e l o t so fu s a b l er e s o u r c e s ,s u c ha s t e x t ,p i c t u r e ,v i d e o a n da u d i oe e t a n d i n t e r n e th a sa l r e a d yb e e nt h e i m p e r r a n t r e s o u r c e so fe d u c t i o n b u tk i n d so fi n t e r n e ti n f o r m a t i o na r r a n g e c o m p l e x t h i sw i l lb r i n g d i f f i c t u l tt ot h er e t r i e v a lo fi n f o r m a t i o n n o w a d a y s ,c o n t e n t - b a s e di m a g e r e t r ie v a lh a sb e e ni m p r o v e d r a p i d l y ,m a i n l yb a s e do n t h el o w l e v e lf e a t u r e sf r o mi m a g e s ,b u tp r o d u c t b a s e do nt h eh i g h l e v e lf e a t u r e sh a s ts u c c e s s d t h et h e s i s f o c u so nt h e c l a s s i f i c a t i o no fi m a g e sc o l l e c t e do nt h e w o r l dw i d ew e b t h ec l a s s i f i c a t i o nc o n s i s t s i n s e p r a r a t i n g t h e i m a g e s i n t ot w o c l a s s e s :i c o na n dp i c t u r e t h es i z eo fi c o n su s u s a l l yi ss m a l l ,t h ee f f e c t o ft h e mi s t op r o v i d ec l u ea n di d e n t i f i c a t i o nt ou s e r s a n dp i c t u r e s u s u a l l y c o n t a i nc o n t e n t s p i c t u r e s c a nb ec l a s s e di n t ot w o c l a s s e s :p h o t o g r a p ha n dg r a p h i c a n d p h o t o g r a p h c a nb es e p r a r a t e di n t o t w oc l a s s e s :a r t i f i c a ls c e n e r ya n dn a t u r a ls c e n e r y c h a r t a n db r u s h w o r k f o r mg r a p h i c f o rd i f f e r e n ti m a g e s ,a n a l y s et h e ma n d d r a wt h ei m p o r t a n t p a r a m e t e r s ,u s e t h e p a r a m e t e r s t oc l a s s i f i c a t i o n t h i st h e s i sa l s oh a s i m p r o v e dh o u g ht r a n s f o r m a t i o n ,a n dh a sa p p l i e d i tt ot h ec l a s s i f i c a t i o n o fg r a p h i c t h et h e s i sh a sa l s om a d es t u d yo nt h ec l a s s i f i c a t i o no ft e x t u r e u s i n g g a b o rf il t e r st oe x t r a c tt e x t u r ef e a t u r e sf r o mt h et e x t u r ei m a g e ,w i t h t a m u r af e a t u r e s ,a p p i yt h eb pn e u r a ln e t w o r kt oc l a s s i f i c a t i o n t h ew h o l et e s tp l a ti sb a s e do nw i n 2 0 0 0o s ,a n de x p l o r e db yv i s u a l c 十十6 0 t h e r e s u l to ft h et e s ti n d i c a t et h a tt h ea r i t h m e t i co fi m a g e c l a s s i f i c a t i o ni se f f e c t i v e i 【k e yw o r d s 】c l a s s i f i c a t i o no fi m a g e s h i s to fc o l o r sb pn e t w o r k s h o u g ht r a n s f o r m a t i o n g a b o rf i i t e r s 【c a t e g o r y g 审辱 独创声明 y 5 9 8 4 80 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特另, j m 以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得( 注:如没有其他需要特别声明的,本栏可 空) 或其他教育机构的学位或证书使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢 意。 学位论文作者签名:矗l 嘏1 荔 导师擗多彳辱七秀 签字目期:2 0 0 4 年牛月灯日签字日期:2 0 0 4 年中月拥 妻黧乍聋、导师同薏 身皱公布 一 w w 幽像分娄方法研究 1 1 引言 第一章绪论 随着信息技术的快速发展、信息高速公路的建设和多媒体技术的推广应用, 人们正快速的进入一个信息化社会。在信息化社会中,信息处理的对象和方法都 有了很大的改变。大量各种类型的信息在全球范围内采集、传输、流通和应用。 如此海量、排列错综复杂的信息怎样组织才能更有效的发挥其作用昵? 我们知道 信息天生是多重模态分布的,人们可以同时从不同角度上有效的组织信息。信息 的多种模式基本上可以归类为:文本、图像、动画、视频、音频等。现今,人们 正逐渐将研究的兴趣转移到多媒体数据的数字存储、检索和传输上。这主要得益 于技术突破,比如有效的编程工具、高速发展的网络、大容量存储设备、压缩算 法的发展以及文本、图像、视频、音频信号编解码技术的提高等。技术的飞速发 展使多媒体信息的数字化、存储和传输交得更加快速高效。 现代技术已经能运用各种手段大量的采集和产生各种类型的多媒体信息数 据。目前,许多商业组织已经将大量的新闻片断、体育信息、绘画、艺术品等视 频、图片信息数字化,使其更容易通过网络被获取。同时,数码照片和数字化视 频的出现,也使得越来越多的人可以将个人的图片、视频资源上传到网络上,实 现资源共享。数字化数据库已经不再是梦想,而是正在逐渐的变为现实。将数字 化数据库重新组织、分类,为浏览、检索、获取信息提供有效的索引目录已成为 当今研究的热点课题。 现今分类是很多领域都需要研究的问题,具有非常广泛的应用。众所周知, w w w 中存在着海量的图像,搜索引擎可以从网上搜集图像并建立图像库供用户检 索,然而对如此巨大的图像库进行浏览、检索,显然是一件既费时又费力的事情。 因此,需要对图像库进行相应的处理,尽可能的使检索方便、快捷。目前,面向 因特网的搜索引擎和检索技术成为因特网技术发展最快的技术之一,因特网中多 媒体资料的分类技术也成为信息检索技术中的关键技术之一。对图像库中的图像 进行分类可使得对大规模图像库的访问更为快捷、有效。另外,通过分类剔除不 相关类别的图像也可缩短检索时间【5 】。 1 2 图像分类系统简介 随着互联网技术的飞速发展,互联网用户可以通过网络获得大量的信息。为 了更快更好的获取信息、利用信息,常常需要对信息进行预处理加工。本文讨论 的预处理技术即为图像分类技术。图像分类技术兴起于7 0 年代,它的必起主要 w w w | 墨| 像分类方法研究 得益于两种技术的发展:一种是数据库技术,另一种是计算机显示技术【l j 。从这 两种技术角度来看,图像分类技术可以分为基于文本的图像分类系统和基于图像 自身内容的分类系统。 二十世纪7 0 年代,图像分类主要依靠人工标注的方法,使用的是基于文本 的图像分类模式。随着视频资源、图片杂志、地理图片、艺术时尚等视频、图像 资源的发展,对图像库进行复杂检索和操作已经成为当今研究领域的重要课题。 到目前为止,许多检索系统在查找图像或是视频的时候,仍然要求人们输入关键 字进行查询。很显然,这种方法并不能很好的实现检索要求,因为不同的人对其 所要检索的内容有不同的描述,即使是同一个人也可能因为检索的目的不同而对 相同的内容有不同的描述。也恰恰因为这些问题,刺激了基于内容检索分类技术 的不断发展。进入到9 0 年代,随着计算机技术和数字化图像技术的发展,图像 数据库的规模越来越大,完全依靠人工对图像进行分类已不可能,人们开始逐渐 将研究的重点转移到基于图像内容分析的自动分类研究上。 1 基于文本的图像分类系统 基于文本的图像分类技术可以追溯到7 0 年代。一直以来,图像分类系统主 要依赖于文本特征,利用文本来注释、检索图像数据库。但是基于文本的图像分 类和查询系统具有很多的不足:首先,图像需要人为地描述并为其选定关键字, 由于大部分的图像都包括几个可参考的物体,每个物体也都有自己的特性,而且, 为了了解图片的内容还要表述图像中各物体之间的关系,因此如何客观的描述图 像内容成为基于文本的图像分类技术的一个瓶颈。随着图像数据库的增大,关键 字不仅变得复杂而且显然不足以描述所有的图像。另外,如果图像数据库是全球 开放的,语言障碍也将成为造成关键字查询使用效率不高的一个重要原因。基于 文本的图像分类的另一个缺点为:描述颜色、形状、布局、纹理等图像属性的关 键词有限。 2 基于内容的图像分类系统 9 0 年代初,出现了大规模图像数据库,传统的基于文本的图像分类技术的 局限性就显得越来越突出。为了克服传统图像分类技术的局限性,人们开始寻求 新的图像分类检索方法,于是出现了基于内容的图像分类技术,即使用图像本身 的颜色、形状、纹理等视觉特征代替传统的手工填加关键字信息进行分类的技术。 基于内容的分类检索突破了传统的基于文本表达式分类检索的局限,它直接对图 像内容进行分析,抽取特征和语义,利用这些特征和语义进行分类并建立索引, 进行检索。目前,人们已经将研究重点转移到从图像的视觉内容中自动提取图像 2 w 晰图像分类方法研究 特征用于分类及检索上,并且已经开发了各类基于内容的图像视频分类检索系 统。其中较著名的有q b c 、p h o t o b o o k 、f o u r e y s 等。这些系统主要利用了图像 的低层次信息,如颜色、形状、布局、纹理等1 】【2 1 。 1 3 国内外研究现状 近几年来,基于内容的图像分类检索技术有了长足的发展,主要是基于低层 次视觉特征的图像分类检索,比较成功的例子有美国i b m 公司的q b i c 系统等。 但是针对高层次语义特征的图像分类检索系统还没有成熟的产品。在基于内容的 多媒体信息分类检索技术研究中,基于理解的文本分类检索已经有比较好的研究 成果,但基于视觉特征和语义特征的图像、音视频分类检索尚处于研究开始阶段。 目前,在图像分类方面,还没有比较成熟的算法能够对所有的图像类型都进行有 效的分类。因此研究图像分类的有效算法对于图像检索技术发展具有十分重要的 意义。从不同的角度,图像可以分为不同的类别。本文将图像根据功能不同分为 图标类图像和图片类图像。其中,图片类图像还可以继续细分。在分类技术上, 采用提取图像的颜色数,主体颜色,色彩的饱和度等图像基本特征的方法,根据 图像低层次的可见特征进行分类。这些种类不同的图像在视觉特征上有较大的区 别,结合因特网中网页的相关文本信息可以实现语义级的分类。图像的合理分类 对提高基于内容的图像检索结果的准确性具有十分重要的作用。 w w 翻像分类方法研究 第二章删w 图像的类别及其特点 2 1 图像基本类别 w w w 图像各式各样、种类繁多,因此可以从不同的角度进行分类。本文将图 像按功能分为图标类图像和图片类图像两大类。图标类图像一般表现的内容都较 为简单,通常图像尺寸都较小。常见的图标类图像有:商标、快捷键、简单标识、 按钮等。它的功能在于给使用者提供简单提示或标识作用,比如常用爨表示 退出。图片类图像则比较复杂,它通常都有表现的内容,表现的内容可以是山水、 风景、动物、人物等。图片类图像还可以进一步分类。本文讨论的重点就是关于 图片类图像的分类。在图片类图像继续分类上,大致形成这样的观点,图片( i m a g e ) 类图像总体上可划分为照片类图片( p h o t o g r a p h ) 和图画类( g r a p h i c ) 图片两大类 。照片类图片又可以进一步细分:从图片成因角度看,照片类图片可分类为真 实照片( r e a lp h o t o ) 从自然界采集或是通过扫描得到的图片;类照片图片 ( p h o t o l i k e ) 主要指通过某些专门的图片处理软件,比如p h o t o s h o p 、3 dm a x 等生成的图片或是由计算机游戏产生的屏幕图片【4 。从图片内容角度分析,照片 类图片可分为自然景物类图片和人造景物类图片。图片类图像的另一类图画类图 片则可以继续细分为图表类图片和绘画类图片,这两类还可以继续细分为卡通 画、国画、油画、徽标、艺术字、表格、原理图、流程图等等。这些图像在视觉 特征上有较大的区别,结合因特网中网页的相关文本信息可以实现分类。具体分 类可见下图( 图2 1 ) : 如下图所示,本文的重点集中在图片类图像上,所以,下面我们就具体分析 一下图片类图像的主要特点。图片类图像主要分为照片类图片和图画类图片两大 类,图片的颜色、纹理、形状各具特点,下面就具体分析一下这图片类图像的两 大类的特点。 w w 吲像分类方法研究 图2 - 1 图像分类示意图 2 2 照片类图片( p h o t o g r a p h ) 特点 照片类图片通常指具有纹理或纹理趋势的实物图片或通过某些专门软件( 如 p h o t o s h o p 、3 dm a x 等) 处理产生的图片。照片类图片包括照片( 从自然界采集或 通过扫描得到的图片) 、类照片( 主要指通过某些专门的图片处理软件生成的图片 或计算机游戏的屏幕图片) 等。此类图片的特点为:图片中使用的颜色数多,颜 色逼真、鲜艳,颜色层次丰富,并且颜色之间过渡比较缓慢,能够表现出颜色、 阴影的细微层次变化。照片类图片通常都有比较明显的纹理或纹理趋势,边缘一 般模糊不清晰,且在大小比率( 长$ 高) 上差别也较小1 l 叫。常用来显示真实的场景。 如果从照片内容上分类,照片类图片可以分为自然景物类和人造景物类图 片。自然景物类图片一般颜色比较鲜明,但是纹理趋势不明显,而人造景物类图 片中一般为城市高楼、宗教庙宇、室内物件之类的图片,图片中包含的线条比较 多,有较明显的纹理趋势。 2 3 图画类图片( g r a p h i c ) 特点 图画类图片通常都是具有良好边界的设计图片,它一般是通过绘图软件或 是手工绘制而成。图画类图片主要包括:卡通画、国画、油画、图表、徽标、艺 术字等。与照片类图片相比,图画类图片中使用的颜色数较少,但是区域颜色的 饱和度通常都比较高,多使用纯色或是饱和度较高的颜色,并且颜色间的过渡也 较照片类图片快,颜色层次单薄。图片中纹理趋势不明显,通常有清晰的线条和 光滑的边缘。另外图画类图片在大小比率上差别较大【1 j 吼 图画类图片还可以进一步分类,本文将图画图片分为图表类( c h a r t ) 图片和 绘画类( d r a w i n g ) 图片两类。绘画类图片包括国画、油画、卡通画、地图等等, 而图表类包括表格、原理图、流程图、统计图等。很显然,图表类图片中一般都 包含大量的线条,并且图片使用的颜色通常也比较简单,而绘画类图片中则鲜有 或只有很少的线条,但是颜色通常都比较复杂,有时甚至接近于照片类图片。 根据照片类和图画类图片的不同特点,我们可以从中提取出具有价值的参 量,然后根据参量对图片进行分类。 第三章图像分类方法研究 大部分基于内容的图像分类系统使用颜色、形状、纹理特征来表征图像,并 且分类的基础也是从图像中提取的相似特征【3 】。 ( 1 ) 颜色特征:颜色是图像的个重要视觉性质。对颜色特征的表达方法有 许多种,如直方图法、积累直方图法、局部累计直方图法、颜色分布法、中心矩 法等。各种方法的共同点都是用较有效和紧凑的方式来表达彩色信息。这些特征 描述了图像的全局属性,并且很容易从图像中提取出来。目前对颜色特征的研究 大部分都集中在颜色直方图上。颜色特征的一个主要的缺点在于它不能够恰当的 描述物体的形状和位置1 4 】。 ( 2 ) 纹理特征:关于纹理,至今国际上尚无一个公认的标准定义。通常我们 谈到图像的纹理时,意指图像像素灰度级或颜色的某种变化,而这种变化和空间 统计相关。因此纹理特征可以用来对图像中的空间信息进行一定程度的定量描 述。对纹理特征的描述通常借助纹理的统计特性或结构特性进行【”。 ( 3 ) 形状特征:形状常和目标联系在一起,有一定的语义含义,因而形状 特征可以看作是比颜色或纹理更高层的一些特征。但是,从本质上说对形状的表 达要比对颜色或纹理的表达复杂的多。为获得有关目标的形状参数,常要先对图 像进行分割,所以形状特征的提取会受图像分割效果的影响。另外,目标形状的 描述也是一个非常复杂的问题 3 1 1 4 1 。 3 1 图标类和图片类图像分类算法 3 1 1 分类参量 为了能够成功的分类,需要精确的程序来获取图像的分析信息并根据这些信 息进行分类,这些分析信息通常被称为参量。 图标类图像主要包括按钮、商标、标识等一类小图像。此类图像的主要功能 是给使用者提供标识、参考、快速操作等简单的提示。根据观察分析可知,图标 类图像一般尺寸较小,如图3 1 所示。所以可以选择图像尺寸作为图标类图像和 图片类图像的分类参量。 冒圜圈 图3 - 1 图标类图像 3 1 2 分类算法分析 图标类图像和图片类图像的分类算法相对比较简单一些,主要是如何确定尺 寸参量问题。尺寸参量有多种取法,比如图像长宽尺寸、面积大小、对角线尺寸 等等。经实验分析,本文取图像对角线尺寸作为分类参量。 i f s i z e ( f l a g c l a s s = “图标类图片”; e n d 其中,s i z e 为图片对角线尺寸, l a g 为参考阈值,本文参考阂值昭= 1 0 0 。 3 1 3 实验结果 1 正确率 为验证图像分类的正确性,有必要计算正确分类的图像在整个图像库中所占 的比例,可以通过下面的公式计算分类正确率川: 正确率( a c c u r a c y ) = 正确分类的图像数目 ( 3 - 1 ) 应正确分类的图像数目 我们对1 1 0 0 幅图像( 其中包括5 0 0 幅图标类和6 0 0 幅图片类类图像) 进行试 验,结果8 6 4 ( 4 3 2 5 0 0 ) 的图标类图像和8 7 5 ( 5 2 5 6 0 0 ) 的图片类图像可以被 正确分类。 2 误差分析 虽然图标类图像一般都尺寸较小,但是不排除个别图标尺寸较大的情况,比 如商标,所以在分类时肯定会产生定误差。图片类图像分类误差产生原因同图 标类图像误差原因类似,即个别图片类图像尺寸较小,因此在分类时,被误认为 图标类图像。 3 2 图片类图像( 照片类和图画类) 再分类算法 如前所述,本论文讨论的重点在于图片类图像再分类,根据图片的内容不同, 可以将其分类为照片图片和图画图片两大类。这两类又各有特点,可以从其中提 取出分类参量,依据参量进行分类。 3 2 1 分类参量 图片类图像分类是本论文讨论的重点,同前面结构类似,对于图片类图像分 类,首先也要确定分类参量。常用于图片类图像分类的分类参量有: ( 1 ) 颜色数参量:通常情况下,照片类图片使用的颜色数较多,颜色比较鲜 艳。因此,简单的2 色、1 6 色的颜色分辨率多用于图画类图片,而一般不用于 照片类图片,所以可以将颜色数作为一个参量对图片进行简单的分类。 ( 2 ) 颜色直方图参量:根据图像特点可以知道,照片类图片的颜色分布比较 均匀,颜色数多,颜色之间变化比较缓慢,因此,颜色直方图一般都比较均衡。 而图画类图片的颜色分布跳跃性大,颜色数较少,通常很大一片区域都具有相同 的颜色值,因此,颜色直方图分布不均衡,跳跃性大。 ( 3 ) 相对颜色直方图参量:由于图片的大小不一,所以颜色直方图并不能直 接用来作分类参量,需要将其归一化,得到的新的直方图就是相对颜色直方图参 量。 ( 4 ) 颜色种类数参量:即图片中不同颜色的总数。通常图画类图片用色都比 较简单,使用的颜色种类较少,而照片类图片颜色一般都比较丰富,使用的颜色 种类较多,所以我们使用颜色种类参量,计算出现在图片中的不同颜色种类数。 ( 5 ) 主色调参量:图片中出现频率较高的颜色【l 】【2 1 。 前面已经阐述了图画类图片和照片类图片的特点,可以根据其特点从上述的 的常用参量中选择有价值的参量: 颜色数参量 相对颜色直方图参量 颜色种类数参量 可以根据这些参量对图片进行照片类和图画类图片的基本分类。 3 2 2 分类算法分析 首先,可以依据颜色数对图片类图像进行简单分类。根据前面论述的图片特 点可知照片类图片一般颜色比较丰富、饱满,经常使用2 5 6 色或2 4 b 颜色数。而 对于图画类图片来说,其用色一般都较为简单,颜色数较少。由于2 色、1 6 色 颜色分辨率低,所以照片类图片一般不使用2 色或1 6 色颜色数构造。因此,可 以直接将2 色、1 6 色的图片归为图画类图片。( 图3 2 ) 9 超 w 炖l ) 飞,e 少 ( a ) ( b ) 图3 - 2 图画类图片 ( a ) 2 色图画类图片;( b ) 16 色图画类图片 i fc o l o r = 2o r1 6 c l a s s = “图画类图片”; e n d 注:c o l o r 为颜色数。 利用颜色数参量对图片分类的方法只适用于简单图片。对于构造复杂的图 片,我们使用相对直方图参量对其进行分类。首先来看一下什么是颜色特征统计 直方图。图像颜色特征统计直方图简称为直方图,它实际上是一个一维的离散函 数1 5 。即: h ( k ) = 仇 k = 0 ,1 ,三一l( 3 2 ) 上式中k 代表图像的特征取值,对于颜色直方图来说,k 就表示具体的某种 颜色。工是特征可取值的个数,即颜色总数,例如:对2 5 6 色图片来说,三= 2 5 6 。 仇是图像中具有特征值为k 的象素的个数,即图片中具有某种具体的颜色值的象 索个数。示例图如下,其中有8 个直方条,对应图像中8 个灰度象素数目。 图3 - 3 直方图示例 下图分别为2 5 6 、2 4 b 颜色分辨率的颜色直方图。其中国3 4 ( a ) 、( b ) 、 l o w w w 图像分类方法研究 ( c ) 、( d ) 为2 4 b 颜色分辨率的图画类和照片类图片及其颜色直方图,3 - 5 ( a ) 、 ( b ) 、( c ) 、( d ) 为2 5 6 色颜色分辨率的图画类和照片类图片及其颜色直方图。 ( c ) ( d ) 图3 - 42 4 b 图片颜色直方图 ( a ) 2 4 b 图画类图片;( b ) 对应的颜色直方图 ( c ) 2 4 b 照片类图片;( d ) 对应的廊色直方图 ( a ) ( b ) w 胛图像分娄方法研究 ( c )( d ) 图3 52 56 色图片颜色直方图 ( a ) 2 5 6 色图画类图片;( b ) 对应的颜色直方图 ( c ) 25 6 色照片类图片;( d ) 对应的颜色直方图 对上图进行比较分析我们可以发现,不论是2 5 6 色还是2 4 b 颜色数的图片, 照片类图片的颜色直方图中颜色分布比较均匀,颜色种类数目较多,具体某种颜 色的像素总数一般都不大;而图画类图片则颜色分布相对比较稀疏,图片中用到 的颜色数较少,但具体某种颜色的像素总数较大。基于图画类和照片类图片的直 方图特征,可以选择颜色直方图作为二者分类的参量进行分类。 在分类时,需要按照颜色数将图片分为两部分分别进行处理,部分为2 4 b 颜色数,另一部分为2 5 6 色颜色数。我们知道2 4 b 颜色分辨率图片的调色板中的 总颜色数目为2 “= 1 6 x 1 0 6 种,很显然,如果作2 4 b 颜色数图片的颜色直方图,计 算量相当大,是一件十分费时费力的事情。因此需要先对其调色板进行简化,再 作简化后的调色板的颜色直方图。这样,计算量就会相对小一些,计算速度会相 对加快些,但是误差可能会增大。对2 4 b 颜色图片的调色板进行简化时,可以 采用抛弃部分颜色的方法。对2 4 b 颜色数的图片来说,图片在构建调色板时, r ,g ,b 三种颜色分量分别使用八位二进制表示,在简化调色板时,我们采用分别 抛弃r 、g 、b 颜色分量的后四位的方法,即每一种颜色分量都只使用前四位二进 制表示。这样,2 4 b 颜色的颜色总数将缩减为2 1 2 = 4 0 9 6 种。如此处理之后,再进 行颜色直方图计算,计算量将大减,计算时间也大大缩短,而且对正确率的影响 不是很大。 对于2 5 6 色颜色分辨率的图片来说,调色板的颜色总数为2 5 6 种,所以在建 构颜色直方图时比较简单。因此,不必对其进行预先的简化处理,对其直接进行 计算即可。 2 w 唧圈像分类方法研究 在算法设计过程中,还需要考虑的一个问题是就是图片的尺寸。由于图片的 尺寸大小不等,尺寸大的图片自然颜色数目就比较多、直方图尺寸也有可能大, 所以,不能直接使用绝对颜色直方图作为分类的标准。本文中我们对颜色直方图 进行量化处理,即将直方图中的数值都归一化,生成相对颜色直方图。利用相对 颜色直方图参量进行分类。 分类时,需要计算图片中使用频率较高的颜色数目,即超过某门限值的颜 色直方图中直方条的数目。本文将图片分为2 5 6 色和2 4 b 颜色分辨率处理,因此, 2 5 6 色和2 4 b 颜色分辨率的门限值也不同。经过实验分析,本文中将2 5 6 色图片 门限值设为0 3 ,而2 4 b 图片的门限值取0 1 4 。如果超过门限值的颜色直方条数 目大于设定闺值,则图片为照片类图片,否则,图片为图画类图片。 在对大量的图片进行实验分析之后,可以为其选择恰当的闽值。不同颜色分 辨率的图片的分类阈值不同。 i fc o l o r = 2 4 b 颜色数目预处理; 相对颜色直方图处理; i f h “,”) f l a 9 1 c l a s s = “照片类图片”; e l s e c l a s s = “图画类图片”; e n d e n d i fc o l o r = 2 5 6 相对颜色直方图处理: i f 胛“, f l a 9 2 c l a s s = “照片类图片”; e l s e c l a s s = “图画类图片”; w w w 图像分类方法研究 e l l d ) e n d 注:c o l o r 为颜色分辨率类型;珂聊2 为超过分类门限值的颜色直方条的数目: f l a g l 为2 4 b 颜色数图片分类阈值;f l a 9 2 为2 5 6 色颜色数图片分类阈值。本文中 取f l a g l = 2 5 0 ,f l a 9 2 = 1 8 。 3 2 3 实验结果 1 正确率 我们仍采用前面已经介绍过的图片分类正确率的定义,即 正确率= 正确分类的图片数目 应正确分类的图片数目 ( 3 3 ) 我们对1 0 5 6 幅图片( 其中包括5 7 6 幅照片类和4 8 0 幅图画类图片) 进行试验, 9 1 6 7 ( 5 2 8 5 7 6 ) 的照片类图片和8 8 1 3 ( 4 2 3 4 8 0 ) 的图画类图片可以正确分类。 2 误差分析 照片类图片被误分为图画类图片的原因是:图片中颜色数少,如图3 6 ( a ) , ( b ) 所示,超过分类门限值的颜色数目n u m = 2 8 。图画类图片被误分为照片类图片 的原因是:一些图画类图片颜色丰富,超过分类门限值的颜色数目较大。如图 3 6 ( c ) ,( d ) ,n u m = 2 8 7 。 ( )( b ) w 州蚓像分娄方法研究 ( c )( d ) 图3 6 错误分类实例 ( a ) 照片类误分为图画类;( b ) 对应的颜色直方图 ( c ) 图画类误分为照片类:( d ) 对应的颜色直方图 3 3 照片类图片( 人造景物类和自然景物类) 再分类算法 照片类图片可以进一步分类,分类的角度不同,分类的类别就不同。本文依 据图片内容将照片类图片分为自然景物类图片和人造景物类图片。 3 3 1 分类参量 自然景物类图片大都为自然风光、动物、植物等图片,通常图片颜色鲜明, 颜色之间过渡缓慢,图片中没有明显的纹理趋势。而人造景物类图片一般包括城 市高楼、宗教庙宇、室内物件之类的图片,图片中包含的线条相对较多,有较明 显的纹理趋势。对人造景物类和自然景物类图片分析之后可以发现,自然景物类 图片极少包含直线条,而人造景物类图片则不同,通常含有的线条数目较多,因 此,本文将线条作为人造景物类和自然景物类图片的参量。 3 3 2 分类算法分析 首先看一下直线检测方法。直线检测方法有许多,本文采用霍夫变换来检测 并提取直线。 1 霍夫( h o u g h ) 直线检测算法基本原理: 霍夫( h o u g h ) 变换的基本思想是点一线的对偶性( d u a l i t y ) 。此变换是种点 线描述方法,它可以将平面坐标空间中的线变换为参量坐标空间中的点。其原理 如下: w w w 图像分类方法研究 假设有直线方程为 v = f x + c ( 3 4 ) 此方程中,x 和y 为变量,m 和c 表示参数。如果已知参数值,则该点坐标 之间的关系即可确定。如果将上述方程重新表示为: c = v m x ( 3 5 ) 在式3 - 5 的方程中,m 和c 交为我们感兴趣的变量,而x 和y 变为常数。上 述方程表示的是( m ,c ) 空间中的一条直线。则空间0 ,y ) 中的一条直线对应( m , c ) 空间中的一点,如图3 7 ( a ) 。需要指出,参数空间曲线的形状取决于用于表 示曲线的原始函数。所以,在实际应用中,常常使用直线的极坐标形式,而不是 其显式表示,这样可以避免直线是垂直线时带来的问题。直线的极坐标方程表示 如下1 6 】: p = x c o s o + y s i n 曰 ( 3 6 ) 则在,y ) 空间中共线的点映射到( p ,口) 空间中便成为具有共同点的一簇 曲线,如图3 7 ( b ) 。由此,可推导出不同坐标系中的点和线之间的相对关系。 ( 1 ) ,y ) 域中的一点对应于变换域( p ,们中的一条正弦曲线。 ( 2 ) ( p ,臼) 变换域中的一点对应0 ,力域中的一条直线。 ( 3 ) ( x ,y ) 域中一条直线上的”个点对应于变换域( p ,口) 中经过一个公共 点的”条曲线。 ( 4 ) 变化域( p ,中的一条曲线上的n 个点对应于,y ) 域中过一公共点 的”条直线。 拦 1 6 聊w | 璺i 像分类方法研究 ( b ) 图3 7h o u g h 变换示意躅 ( a ) 一条直线对应一个点; ( b ) 一条直线上的多个点对应多条交于一点的正弦曲线 由以上的性质可知,在图像空间中共线的点对应于参数空间里相交的线。反 过来,在参数空间中相交于同一点的所有直线在图像空间里都有空间的点与之对 应。这就是点一线的对偶性。根据点一线的对偶性,当给定图像空间的一些边缘点, 则可通过霍夫变换确定连接这些点的方程,霍夫变换把在图像空间中的直线检测 问题转换到参数空间里对点的检测问题,通过对参数空间里进行简单的累加统计 完成检测任务f 7 1 。 霍夫直线变化可以用如下方法实现: 将( x ,y ) 域中的每一离散数据点变换为( p ,们。将p 和毋分成许多小段, 每一个p 小段和每一个目小段构成一个小单元( p ,p ) 。对应于每一个小单元 可设一个累加器。在( x ,力域中可能落在直线上的每一点对应变换域中的一条曲 线p = x c o s 8 + y s i n 8 。分别使口为0 ,口,2 口,3 口,便可求出相应的p 值。 分别计算落在各小单元中的次数。待全部( x ,y ) 域内数据点变换完后,可对小 单元进行检测,这样,落入次数较多的单元,说明此点为较多曲线的公共点,而 这些曲线对应的0 ,力平面上的点可以认为是共线的。检测出0 ,y ) 平面上n 点 后,将曲线交点坐标( p 。,吼) 代入p = x c o s o + y s i n o ,便可得到逼近n 点的 直线方程 7 】o 在实际实现过程中,变换域小单元( p ,护) 的大小直接影响( x ,y ) 域中逼 近直线的精度。霍夫变换的一个实用弱点是未考虑点的相邻性,有时得到的最佳 逼近直线可能会由于邻近的点的影响而产生扭曲。 2 具体分类算法 以上叙述的是霍夫直线检测方法的原理,在实际应用中,需要先将彩色图像 + 奉i十,t上i 跹一 w 州图像分类方法研究 转换成灰度图像,利用c a n n y 算子取图像边缘,对边缘灰度图进行二值化处理, 得到图像边缘点二值图像,然后使用h o u g h 直线检测方法检测图像中直线。 在具体计算时,需要建立参数空间( p ,臼) 的二维累加数组,设这个累加数 组为4 ( p ,日) ,如图3 8 所示: 图3 8 二维累加数组示意图 根据式3 6p - i 失n ,p 值范围为【- l ,l ,( l 为图像对角线长度) 。所以在设 置数组过程中,需要将p 值转化为正值,本文中使用p = p 十l 将p 值转换为正 值。转换之后p 值范围为 o ,2 * l ,则p 。f 2 + l 。护。为臼最大值1 8 0 。,p 的 量化间隔a p = 1 ,0 的量化间隔移:1 0 。开始时设数组a 为零,然后对图像空间 中的边缘像素点,使0 = 0 ,口,2 臼,3 目占。,根据式3 - 6 算出对应的p 值,再根据p 和口的值( 设都经过量化,已经取整) 对a 进行累加:a ( p ,们= a ( p ,们+ 1 。累加结束后,根据彳( p ,0 ) 的值,就可知道多少点是共线的, 即a ( p ,0 ) 的值就是在( 卢,0 ) 处共线点的个数。通过实验,取恰当的阈值来 确定直线忙j 。 f o r ( p = 0 ,p f l a g c l a s s = “人造景物类图片”; e 1 s e c l a s s = “自然景物类图片”: e n d 注:r e l a _ t h r e a d n u m 为图片中相对直线数目参量,f l a g 为人造景物图片和自 1 9 w w w 图像分类方法研究 然景物图片分类闽值,文中f l a g = 0 4 。 3 3 3 实验结果 1 正确率 我们对2 4 0 幅照片类图片( 其中包括1 2 0 自然景物类和1 2 0 人造景物类图片) 进行实验,结果的8 5 ( 1 0 2 1 2 0 ) 自然景物类图片能够正确分类,8 1 6 7 ( 9 8 1 2 0 ) 的人造景物类图片分类正确。 2 误差分析 由于一些建筑物是和自然风光结合在一起的,所以在分类时不好辨别。如图 3 一1 0 ( a ) ,此幅图片主要表现的是建筑,可是在图片分析过程中,检测出的直线 数目却较少,所以将其归为自然景物类。 一些风光类图片比如树木
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中化学选择性必修一第一章 综合检测
- 传承环境设计
- 金融理财投资科普
- 《跨学科实践:为节约能源设计方案》课件
- 门票设计模板应用规范
- 课桌教学设计模板
- 手工设计汇报
- 班干部竞选自我介绍
- 郫县商业计划书
- 服装品牌设计策划
- 第六章-初始适航管理-民用航空器适航管理教学课件
- DB44∕T 2830-2026 艾滋病病毒感染者及艾滋病患者手术室管理规范
- 黑龙江省哈尔滨市2025届中考物理试卷(含答案)
- 2026年中国中车集团软件岗面试常见问题及嵌入式系统考点
- 储能行业压缩空气储能电站经济性调研报告
- 长租公寓盈利模式与成本结构优化
- 2026年自贡市自流井区社区工作者招聘笔试参考试题及答案解析
- 2026年初级经济师之初级经济师工商管理从业资格考试真题及参考答案详解AB卷
- 雨课堂学堂在线学堂云审计法律研究与案例(西南政法大学)单元测试考核答案
- 2026安徽合肥市发展和改革委员会上半年招聘事业单位工作人员20人考试备考试题及答案解析
- 2026年危险化学品重点县专家指导服务自查表
评论
0/150
提交评论