




已阅读5页,还剩58页未读, 继续免费阅读
(计算机应用技术专业论文)常用图象文件颜色特征提取的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
辽宁工程技术大学袋学位论文 攘娶 睫麓多媒体技零及i n t e r n e r 技术的遮遽发展,各嚣器业黠辫象躲 使用越_ 来越广泛,图琢信息资源的管理和梭索盛得越来越重要。如何 脊效欧管理窥检索图象数据爨多媒体鼓及数据痒技术瓣瓣一瑗猕竣。 在图象内容的几种特征中,例如纹理特征、形状特征、颜色特征、 空阕特征等,颜色是掰簿图象中最懑接靼簸篙零躲特惩,也楚强象爽 密特性中个很疆要的特征,基于颜色特征的这赡优点,本文通过对 嚣霜墨敷文传熬交辞络梭深入分援的基磷上,蹲b m p 、p c x 、t g a 等 黼象文件颜色巍方图嗣累积盥方图的提取方法进行了研究,形成了基 本豹算法,鏊农菇秀效豹餐耀鹫象秘据塞翔蒙鹣梭索效率抒下紧实懿 基础,最后溺m i c r o s o f tv i s u a lc 十+ 6 。0 验诞了算法的正确性。 燕键词;图象数挺痒图象文件颜媳塞方溪累积蹇方圈颜邈空翔 辽宁工程技术大学硕士学位论文 a b s t r a c t a l o n gw i t h t h er a p i dd e v e l o p m e n to fm u l t i m e d i at e c h n i c a la n d i n t e r n e tt e c h n o l o g y ,t h ei m a g eu s ei sw i d e l yu s e di ne v e r yw a l ko fl i f e , t h em a n a g e m e n ta n dr e t r i e v a lo fi m a g ei m f o r m a t i o nr e s o u r c e sb e c o m e i n c r e a s i n g l yi m p o r t a n t h o wt h ei m a g ed a t ac a nb ee f f e c t i v e l ym a n a g e a n ds e a r c hi sac h a l l e n g et om u l t i m e d i a ,a sw e l la st h ed a t a b a s e t e c h n o l o g y i ns e v e r a lk i n d so fi m a g ec h a r a c t e r i s t i c s ,t h ec o l o ri sm o s td i r e c t a n dt h es i m p l ec h a r a c t e r i s t i ci na l li m a g e s ,a sw e l la sav e r yi m p o r t a n t c h a r a c t e r i s t i co ft h ei m a g ec o n t e n t ,f o re x a m p l e ,t e x t u r ec h a r a c t e r i s t i c , c o l o rc h a r a c t e r i s t i c ,s p a t i a lc h a r a c t e r i s t i ca n ds oo n b a s e do nt h e s e m e r i t so fc o l o rc h a r a c t e r i s t i ca n di n d e p t ha n a l y s i so nt h ef i l es t r u c t u r e s o ft h ei m a g ei nc o m m o mu s e ,t h i sa r t i c l ef o r m sb a s a la r i t h m e t i ct h r o u g h s t u d y i n gt h e e x t r a c t i o nm e t h o do fc o l o rh i s t o g r a ma n da c c u m u l a t i o n h i s t o g r a ma b o u ti m a g ef i l es u c ha sb m p 、p c x 、t g a ,a n ds oo n i tb u i l d s as o l i df o u n d a t i o nf o rt h ee f f e c t i v em a n a g e m e n ti m a g ea n di m p r o v e m e n t o nt h er e t r i e v a le f f i c i e n c y a tl a s t ,t h ea c c u r a c yo fa l g o r i t h mi sb e e n c o n f i r m e db yu s i n gm i c r o s o f tv i s u a lc + + 6 0 k e y w o r d :i m a g ed a t a b a s e ,i m a g ef i l e ,c o l o rh i s t o g r a m ,c o l o r sp a t i a l , c u m u l a t eh i s t o g r a m 辽r 工程技术大学硕士学位论文 台| j 新点声明 本人声明所呈交的学位论文是我个人在导师指导下进行 的研究工作及取得的研究成果:本文通过对常用图象文件的 文件结构深入分析,研究了这几种图象文件颜色直方图和累 积直方图的提取方法,形成了基本的算法,为有效的管理图 象和提高图象的检索效率打下坚实的基础。 作者:景墀日期: 辽宁工程技术大学硕士学位论文 1 绪论 1 1 选题的依据 随着科学技术的快速发展和推广应用,特别是计算机技术和网络 技术的发展,信息高速公路的建设,以及多媒体的推广应用,现代信 息处理的对象和方法都有了很大的变化。这几年比较显著和重要的一 点就是大量的各种类型的信息在全球得到了采集、传输、流通和应用, 人们正在快速地进入一个信息化的社会。各种信息工具、技术、载体、 方法和手段的综合集成产生了许多他们原来没有的新功能和新概念, 例如出现了数字图书馆,数字博物馆,虚拟博物馆,数字电影,交互 电视,视频会议,点播视频服务,远程教育,远程医疗等许多新的服 务形式和信息交流手段。 近年来随着需求的增长,工艺技术的进步,以各种方式获取的多 媒体信息的数量得到了飞速增加。例如,美国加洲旧金山医院多年前 已将医学x 光图片数字化。每幅图是2 0 0 0 2 0 0 0 像素,每个像素的 灰度需1 6 b i t ,所以每幅图需要2 0 0 0 2 0 0 0 1 6 b i t = 8 m b 来存储。考 虑每天需做约1 0 0 0 片,而一般x 光图片需保存7 年,这样一来每年 这类图象数据的数量都将在10 1 3 b 的量级。进入新世纪后,有人估计 仅世界上每年产生的新图象己达到8 0 0 亿幅【1 1 。 视觉数据的爆炸性增长使得对图象的管理和检索成为关键。如何 快速有效地管理和寻找相关图象信息已变得日趋困难,所以,迫切需 要对海量数据实施有效管理,目前图象和视频的检索主要是借助于一 些著名的搜索引擎如y a h o o 、a l t a v i s t a 和g o o g l e 等采用关键字和描 述文本进行查询。它们虽然取得了成功的应用,但也存在着一些无法 回避的问题: 由人手工建立图象的内容描述,带有很强的主观性,当数据 库规模很大时,耗事费力。 图象中可能存在多个需要予以描述的对象,而且对象自身的 属性和彼此之间的空间布局关系都需要予以描述,随着库规模的增 大,关键字集合变得庞大、复杂,通常关键字集合的选择是与某一个 辽宁工程技术大学硕士学位论文 具体应用相关的,通用性不好。 目前自然语言理解技术研究还不成熟,限制了基于文本描述 的检索应用。 首先如何管理这些图象数据。如何使得图象数据的获取变的简单 有效,是对多媒体技术以及数据库技术的一项挑战。是改造原有的关 系数据库系统,使其具有处理图象数据的能力,还是设计一个全新的 多媒体数据库系统是人们大胆的尝试的两个方向。 然后如何有效的进行图象检索,针对这问题,基于内容的图象检 索技术( c o n t e n t b a s e di m a g er e t r i e v a l ,简称c b i r ) 应运而生。9 0 年 代初,建立在计算机视觉和图象理解基础之上,综合人工智能、模式 识别、面向对象技术、认知心理学、数据库等多学科知识,人们提出 了基于内容的图象和视频检索技术。图象的内容描述不再依赖于人的 手工标注,而是借助于从图象中自动提取的视觉特征;检索的过程也 不再是关键字匹配,而是视觉特征间的匹配。 1 2 图象数据库的研究现状 图象数据库是数据库技术和图象处理技术相结合的产物,是多媒 体数据库的一种,它存储的是与图象有关联的数据集合( 包括图象的 特征,图象内某一对象的意义,图象之间的逻辑关系等) ,并对它们 进行有效的管理,以保证数据的一致性、完整性,从而支持诸如检索 等各种具体应用。 早期的图象数据库主要研究图象的基本处理技术和基本方法,随 着图象获取手段和处理方法的发展,图象的存储和管理的重要性1 2 益 突显,如今的图象数据库不仅作为存储和检索手段,而且广泛应用于 多媒体图书馆、卫星遥感图象、罪犯识别系统、商标版权的管理和 c a d c a m 、c a s 、g i s 、o a 、医用图象档案和通讯系统以及科学数 据库等。具体的应用实例有:智能图象数据库( i n t e l l i g e n ti m a g e d a t a b a s es y s t e m ) ,g r a i n ( g r a p h s o r i e n t sr e l a t i o n a la l g e b r a i n t e r p r e t e r ) 和r e d i ( r e l a t i o n a ld a t a b a s ei m a g e s ) 等。图象信息系统已经 发展成为基于某一领域的知识的智能系统,通过存取和利用领域知 识,这种系统可以完成较复杂的任务,图象信息系统将是导向形象思 辽t i _ - e 程技术大学硕士学位论文 维、智能计算机和智能机器人的必经之路。 1 2 1 图象数据模型 图象数据通常采用关系数据模型和层次数据模型来对图象数据 建模。如早在1 9 7 7 年,m c k e o w n 和r e d d y 在m i d a s 中采用层次数据结 构逐层细化的方法存储图象,k u n i i 在i n f a d s 系统里把图象解释为一种 关系属性,还有将关系模型和层次模型混合共同进行图象建模的方 式。图象处理领域的研究者使用广义图模型,例如,g r i m d b m s 【7 1 中使用属性关系图作为数据模型。数据库领域的研究者使用扩充关系 模型,还有人提出图象对象语义模型i s d m 。 1 2 2 图象数据库的体系结构 传统数据库系统的结构分为三级模式和两级映射:外模式、模式、 内模式( 用户视图) 和从外模式到模式的映射、从模式到内模式的映 射。较完善的图象数据库体系结构有五层结构,分别为用户视图、语 义特征视图、图象特征视图、特征表达、特征的组织和检索,如图1 1 : ( a ) 模式及映射 空问推理 图像知识 形成结构 图像理解 图像数据 形成结构 图像数据 存储检索 图1 1 图象数据库体系结构7 辽宁: 程技术大学硕士学位论文 4 1 2 3 图象数据库索引和检索技术 对于图象数据的索引要从三个方面进行研究:索引的表示、索引 的组织和索引的提取。 图象索引的表示可分为: ( 1 ) 关键字索引: 主要方法是对图象文件建立关键词或文本标题以及一些附加描 述信息,然后将图象的存储路径和图象关键词之间建立联系,从而实 现图象数据的检索。 ( 2 ) 色彩特征索引: 颜色是图象中最重要的一种底层特征,基于颜色的图象表示方法 自然就成为主要的图象索引技术并得到相当广泛和深入的研究。常用 的颜色索引技术包括颜色直方图、颜色矩、颜色相关图等方法。 ( 3 ) 形状特征索引: 形状表示了图象中有意义的的区域或相关对象,基于形状的图象 索引技术允许用户查询具有形似对象的数据库图象。目前有效的技术 方法如不需分割的图象直方图方法、区域近似分割方法以及图象的空 间结构方法等。 ( 4 ) 纹理特征索引: 纹理是图象的一个重要属性,关于纹理的定义和纹理的量化方法 有许多,其中主要有两种:一种是结构方法:一种是统计方法。前者 是将图象中非常具有结构规律的特征加以分析,后者则是对图象中的 色彩强度的空间分布信息进行统计。 ( 5 ) 对象空间关系索引: 用空间关系特征来进行图象检索一直是图象数据库检索的重要 研究方向。 图象检索是多媒体数据库中最重要也是最普遍的要求,是图象数 据库的核心技术。早期的图象检索是基于文本方式的,由于文本标注 工作量大,而且很难真正表达图象的内容含义,因此,提出了基于内 容特征作为图象的索引,计算查询图象和目标图象的相似程度,按相 似度匹配进行检索,其目的是试图解决图象数据库系统中手工建立文 本标注信息的缺点。 辽宁工程技术大学硕士学位论文 1 3 课题研究的实际意义 8 0 年代后期以来,数据库界新的热点是多媒体数据库,新型数据 模型的发展,特别是扩展的关系模型和面向对象模型,为解决非结构 化数据的应用需要更丰富结构表示的问题提供了手段。随着图象存储 费用的减少,强有力的工作站的出现以及一些图象压缩技术的提高, 使得图象作为一种存储手段在越来越多的领域得到了应用。尽管多媒 体数据库还应支持其他媒体,如文本、视频、音频等,但事实上所有 这些都需要图象管理,并且都倾向于图象。图象数据库管理系统越来 越激发了人们的兴趣,也越来越被人们认为是解决图象管理问题的好 办法。 图象数据库将有非常广泛的应用。其中,医药图象、遥感卫星数 据的管理与处理、地理信息系统、办公自动化中的档案管理以及电子 图书馆等,都需要图象的存储与获取技术。若解决了图象的快速准确 获取问题,对实际应用将是一个了不起的贡献。 不管是图象数据库的建立还是检索,提取图象的特征是必不可少 的,虽然对于图象的研究现在已经取得了很大的进展,但是距离真正 走向实用还有很长的路要走,我希望我可以尽自己所能为这项技术的 发展尽绵薄之力。 1 4 本文的论文安排 第一章绪论。本章主要介绍了选题的背景,图象数据库的研究 方法和发展现状,本课题的研究的意义及论文安排。 第二章基于颜色特征的检索。介绍了研究基于颜色特征检所得 的基础知识和颜色特征的提取方法。 第三章图象文件分析。详细分析了每个图象文件格式的文件结 构,根据图象数据得出不同文件格式的统计直方图和累积直方图。 第四章结论。总结本文主要工作,并对后续工作进行了展望。 致谢 参考文献 辽宁工程技术大学硕士学位论文 6 2 基于颜色特征的检索技术 2 1 概述 基于内容的图象检索( c o n t e n t b a s e di m a g er e t r i e v a l , c b i r ) ,是指根据图象中物体或区域的颜色、形状或纹理等特征 以及这些特征的组合来查询图象,这是计算机图象处理、图象理 解、计算机视觉、模式识别和数据库技术的有效结合。基于内容 图象检索基本思路是:先通过对图象内容的分析,自动或半自动 的从中抽取形状、颜色、纹理等特征,并利用基于这些特征定义 的相似度量函数计算或评价特征之间的相似性,将最相似的一些 图象作为检索结果返回给用户。如图2 1 图象数据库检索模块图象数据库创建模块 图2 1 基于内容图象检索系统框图 图象的内容是通过图象的特征来反映的,可以将图象的特征 分为两大类,即低层视觉特征( 如颜色、纹理、形状、图象内容 的空间关系和时间关系等) 和高层语义特征( 是人们对图象内容 概念级的反映,一般是对图象内容的文字性描述) ,如图2 2 。基 于内容的图象检索所用到的基本特征主要有颜色、纹理、形状、 图象字符、空间关系、图象的语义等。目前,基于内容的图象检 索技术还主要停留在对低层视觉特征的研究上。本章将简要地一 一介绍。 辽宁z 程技术大学硕士学位论文 高层语义特征 低层视觉特征 2 2 颜色空间 翻象的语义信息 t | 图象的特征 颜色、纹理、形状等 千 图象的像素信息 图2 - 2图象的特征服次 藩象豹每一个像豢可竣蓍作是3 维颜恕空闰率豹一个煮,颜 色空间有多种,如r g b 、c m y k 、c i el a + b ( c i ex y z 、c i el + u + v ) 、 h s v ( o r h s l 、h s b ) 。颜色空溺豹一个重要瘸佳就是撬激一致瞧, 它熄指在颜色空间中定义一个颜色度量函数,如果在这个颜色度 量下,久的视觉薅觉差异琵较大豹羧色之间距离瞧夫,褫觉感觉 差异比较小的颜色之间距离也小,具有这种性质的颜色空间b 日为 其脊褫觉致槛的颜色空闻。撮据不同的斑蠲场合,应涟强不同 的颜色空间。 2 2 1r g b 颜色空间 r g b ( 红色、绿色、蓝色) 颜色空间用于发光的设备,例如; 电褫荧光赞和计冀枧的监视器。它搬三种基本颜色混台在一怒, 可以配置大部分人眼所能看到的颜甑,r g b 模型的混色原理是以 加像法来混合,瞧就是说各秘颜色蛉光会越热越蹇。把这三秘颜 色1 0 0 的混合在一起生成白色,三种颜色o 的混合在一起,生 成黑色,如图2 - 3 a 。r g b 被广泛地使用,但它特别依赖于设餐。 如果设备改变,颜色也将改变。r g b 颜色空间简单通用,适于 c r t 设备鼹示图象,它鲍缺点是;绘定某r g b 僮,人们纛法 感知所对成的颜色;改变个颜色时,三个通道上的颜色全部需 要修改;宅不具蠢援觉一致性,颜彀空阀上的距离,并不代表入 眼视觉上的颜色形似性。 辽宁工程技术大学硕士学位论文 2 2 2c m y k 颜色空间 印刷品和漆品,通过吸收一定波长的光,反射其它的光来形 成色彩。印刷输出是应用c m y k 颜色模型,使用青( c y a n ) 、 品红( m a g e n t a ) 、黄( y e l l o w ) 、黑( b l a c k ) 4 种基本色,用 减色法来混合出各种颜色,如图2 3 b 。三种基本颜色c m y 混合 在一起时,生成黑色。由于实际的染料或墨水质量不可能是理想 的,因而不会生成纯正的色彩,黑色( k ) 作为独立的色彩被包括 进来,这种模式被叫做c m y k 。这种颜色空间可生成的色彩范围 比r g b 颜色空间窄。从r g b 到c m y 的转换公式为: c = 255 足 ,= 25 5 y = 2 55 一b 从c m y 到c m y k 的转换公式为: k 5 m i n ( c ,m ,】,) c = c k m = m k y = y k ab 图2 3r g b 颜色空间和c m y k 颜色空间 ( 2 - 1 ) ( 2 - 2 ) 辽宁工程技术大学硕士学位论文 9 2 2 3c i el * a * b 颜色空间 国际照明委员会( c i e ) 于l9 7 6 年提出的l + a + b 模型是使用亮 度l i g h t 和2 个颜色分量f l 和b 来表示颜色,f 1 分量是由绿色演 变到红色,b 分量是由蓝色演变到黄色,如图2 - 4 。c i el a + b 是 独立于设备的,被称为设备无关的色彩空间,成为进行色彩转换 的标准色空间。虽然c i el + a + b 的视觉一致性较c i ex y z 有很 大改善,是c i e 推荐的视觉一致性颜色空间,但实际上对于人眼 的色彩感觉来说还不完全具有视觉一致性。从r g b 到c i el a b 的转换公式为: r g b 到c i e x y z 的转换公式为: 0 1 7 4 0 5 8 7 0 0 6 6 c i ex y z 到c i el + d4 6 的转换公式为 rl ,1 j 1 1 6 l i j 当三 0 0 0 8 8 5 6 y 9 0 3 3 l否则 yn a = 5 0 0 伊c 毒m i y , i m 2 0 0 矿c 毒m 争 i t “3 当t o 0 0 8 5 6 这里f 例= 【7 7 8 7 t + 1 6 1 1 1 6否则 其中x n 、y n 、z n 为c i e 标准照明体的三刺激值。 ( 2 - 3 ) ( 2 - 4 ) 1,j r g b = i i i i i 儿 h m 2 1 l o 0 1 7 9 o o 9 o 6 2 o o o o l = 1j x y z l 辽宁王程技零太学磺士攀证论文 0 2 2 。4 薹差s v 颜热塑阚 霞2 - 4c i el * a * b 豢谯奎窝 h u e 裘承羰也憝色谰,楚鼓一个秘俸蔽麓过来戆或遮:遗秘体 酶光波长,熏般地说,色调是由颜色名称来辨潮的,如缸、穰、 绿,它用角度1 8 0 。18 0 。或0 。3 6 04 度壤,对应与颜色轮 ( c o l o r w h e e l ) 土静角疫 s a t u r a t i o n 表示蒙魏豹稳灏囊,霹表示一 种麟色中嬲入了多少白光,反映颜色被白色、砷淡的程度,邋常鼹 百分比来度爨,从0 辅完全饱和的1 0 0 ;v a l u e 表示辩度,是 颜媳静骥嬷稔发,它也爝吾分比度爨,麸摸0 到自1 0 0 。由 予色调壬至爨泼04 3 6 04 建壤度爨,霞藏潮辩稻s 塞霹良穗造 一个颜色轮。在颜色轮上,主要颜毯沿一个圆均匀分布,次要颜 色位于主要激毪之间。铡鲡爝黄色和青色产生绿镪,困纰绿色往 予黄色嚣餐龟之瓣。每耱颜色与它的季 色煮犊凌轮上鹾髓。长辕 表承亮度v ,离开长轴的方向表示诹和度s ,这样h s v 颜色空间 就可以简单地用一个倒爨的贰锥表示了,如图2 - 5 赝示。 辽宁z 毪技术大学臻学位论文 圈2 5h s v 颜色空间 h s v 颜魏燮涎其有藤下将熹:璧菰之蠲懿,理巷辩独立镶, 即可以独焱感知备颜色分量的变化,适合颜色的相似性比较;县 鸯麓觉一致拣,霹感翔瓣毅惫麓是与颜色分量熬鹣欧死誉德渊度 之渊豹距囊威魄铡熬;舄r g b 颜识空闰豹转换怒线搜豹,蕊纂 莰遮。铁装g 瑟裂h s v 懿转换公式舞: 矗生 a 蝴* 6 0 珏埔* 一m l n s 鞋撼x 麴巢r = m a x 妇巢g=max(2-4) 如果b = m a x ( 2 5 ) ( 2 - 6 ) ( 2 7 ) 这里m a x = m a x ( r ,g ,b ) ,m i n = m i n ( r ,g ,b ) ,艿- - m a x m i n ,( r ,g ,b ) 【0 ,1 0 】,h 蒜【0 ,3 6 0 】,( s ,v ) 毫【0 ,1 0 】 如一 妒一 麓一 一器卜一艿学等警 厂;,c,;l 辽宁工程技术大学硕士学位论文 2 3 颜色特征的提取 颜色是所有图象中最直接和最简单的特征,也是图象内容特 性中一个很重要的特征,利用颜色特征进行图象检索技术因而受 到重视,并最早得到应用。对颜色特征的表达方法有许多种,如直 方图法、累积直方图法、局部累加直方图法、颜色布局法、中心矩法 等。在此研究前两种方法。 2 3 1 颜色直方图( c o l o rh i s t o g r a m ) 颜色直方图具有与生俱来的旋转不变性( r o t a t i o n i n v a r i a n c e l 、 尺度不变性( s c a l e - i n v a r i a n c e ) 和平移不变性( t r a n s l a t i o n - i n v a r i a n c e ) , 因此它被广泛的应用到图象检索中。颜色直方图是表示图象中颜色 分布的一种统计值,它的横轴表示颜色值,纵轴表示具有相同颜色值 的像素个数在整幅图象中所占的比例。 为利用图象的特征描述图象,可借助特征的统计直方图( 一般简 称直方图) 。图象特征的统计直方图实际上是一个1 一d 的离散函数, 即有 h ( 尼) = 静i :0 l ,一1 ( 2 - 8 ) 上式中k 代表图象的特征取值,三是特征可取值的个数,m 是图 象中具有特征值为k 的像素的个数,是图象像素的总数。 对彩色图象,可对其3 个分量做直方图。 累积直方图也是一个用于图象特征统计的1 d 的离散函数,即有 七 m ) = 静,1 ( 2 - 9 ) f = 0 上式中k 代表图象的特征取值,l 是特征可取值的个数,船是图 象中具有特征值为k 的像素的个数,| v 是图象像素的总数。 本文第三章将详细介绍不同图象文件颜色直方图和累积直 方图提取方法。 辽宁工程技术大学硕士学位论文 2 3 2 颜色矩( c o l o rm o m e n t s ) s t r i c k e r 和o r e n g o 提出了颜色矩的方法f 1 0 】,认为颜色信息 集中在图象颜色的低阶矩中,他们主要对每种颜色分量的一阶、 二阶和三阶矩进行统计。对于图象检索来说,颜色矩是一种简单 有效的颜色特征表示方法。一阶( 均值) ,二阶( 方差) 和三阶( 斜 度) 等颜色矩被证明可以很有效地表示图象中的颜色分布。这三 个颜色矩的数学定义如下: 舻专善厶 盯 = 丽 酾 ( 2 - 1 0 ) ( 2 q 1 ) ( 2 1 2 ) 其中厶表示像素的颜色值为i 的概率,为图象中像素点 的个数。 颜色矩已经成功地应用于许多基于内容图象检索系统( 如 q b i c ) ,特别是对于图象中只包括一个目标的时候非常有效,由 于采用9 个数值( 三个颜色坐标轴,每个坐标轴包括三个颜色 矩) ,所以相对于其他颜色特征而言,采用颜色矩表示颜色特征 是一个非常紧凑的表示方法。也是因为这种简单性,使得采用颜 色矩的检索效果不是很好。通常采用颜色矩来进行第一次过滤, 去掉那些在颜色上不相似的图象,从而缩小范围。 2 3 3 颜色聚合矢量f c o l o rc o h e r e n c ev e c t o r ) p a s s 等【1 2 】提出以图象的颜色聚合矢量c c v ( c o l o rc o h er e n c e v e c t o r ) 来作为图象的颜色特征,它是图象直方图的一种演变,其 核心思想是当图象中颜色相似的像素所占据的连续区域的面积 辽宁工程技术大学硕士学位论文 大于一定的阀值时,该区域中的像素为聚合像素,否则为非聚合 像素,这样统计图象所包含的每种颜色的聚合像素和非聚合像素 的比率称为该图象的颜色聚合矢量,在图象检索过程中匹配目标 图象的聚合矢量和检索图象的聚合矢量,聚合矢量中的聚合信息 在某种程度上保留了图象颜色的空间信息。令a 定义为第f 个聚 合像素,卢。码为第,个非聚合像素,那么颜色聚合矢量( c c v ) 定 义为: ( 2 - 1 3 ) 可以看出 为图象的颜色直方 图。 由于加入了空间信息,采用颜色聚合矢量c c v 比采用颜色 直方图检索的效果要好,特别是对于大块的均匀区域或者图象中 大部分为纹理的图象检索效果更好。但是同时增大了计算量。 2 3 4 颜色相关图( c o l o rc o r r e l o g a r m ) 颜色相关图是颜色直方图在空间中的一种延伸2 1 1 。颜色相 关图是指对于颜色值为c ,的像素点p ,与像素点pr 相距距离为 七的另一个像素点p 2 的颜色为c ,的概率的大小。其数学定义为: 设一个距离d r ,( f ) i ,2 ,) ,并且七 d ,定义图象, 的颜色相关图为: 稻毛( ,) - p r p z t ,i p 一一p 2 i = 七,p 乇 陆1 4 1 由于颜色相关图的计算量很大( d ( 2 d ) ) ,为了减小计算量, 一般只考虑相同颜色之间的相关性,即颜色自相关图为: 口竽= 怫( ,) f 2 1 5 1 相对于颜色直方图和颜色聚合矢量c c v ,颜色相关图大大提 高了检索效率,但是由于高维数而使得计算量同样很大。 2 3 5 局部颜色特征 以上各种颜色特征是基于全局颜色特征索引捕获了整幅图象颜色 辽宁工程技术大学硕士学位论文 分布的信息,但是丢失了许多局部的颜色空间信息。f u h 等1 2 0 1 试图结 合图象的颜色信息和颜色的分布空间信息检索图象,其主要思想是从 图象中选择一些代表颜色,然后将图象划分成一定的矩形区域,每个 区域中以一种主要的单一颜色作为代表,两个图象之间的相似性是两 个图象之间具有相似颜色区域的重叠程度。s m i t h 和c h a n g 采用颜色 的自动分割方法【22 1 ,形成一个二进制颜色索引集,在图象匹配中,比 较这些图象颜色集之间的距离。 辽宁工程技术大学硕士学位论文 1 6 3 图象文件颜色特征提取的研究 3 1b m p 文件颜色特征提取方法 3 1 1b m p 文件结构 b m p 图象文件是w i n d o w s 所采用的标准图象文件格式,几乎所 有w i n d o w s 上的应用软件都支持这种图象文件,在w i n d o w s 下能够 很容易地把其它的图象文件转化为b m p 图象文件格式。 1 b m p 文件组成 b m p 文件由文件头、位图信息头、颜色信息和图象数据四部分 组成。文件头主要包含文件的大小、文件类型、图象数据偏离文件头 的长度等信息;位图信息头包含图象的尺寸信息、图象用几个比特数 值来表示一个像素、图象是否压缩、图象所用的颜色数等信息。颜色 信息包含图象所用到的颜色表,显示图象时需用到这个颜色表来生成 调色板,但如果图象为真彩色,既图象的每个像素用2 4 个比特来表 示,文件中就没有这一块信息,也就不需要操作调色板。文件中的数 据块表示图象的相应的像素值。 2 b m p 文件头 b m p 文件头数据结构含有b m p 文件的类型、文件大小和位图起 始位置等信息。其结构定义如下: t y p e d e fs t r u c tt a g b i t m a p f i l e h e a d e r w o r d b f t y p e ;位图文件的类型,必须为“b m ” d w o r db f s i z e ;位图文件的大小,以字节为单位 w o r d b f r e s e r v e d l ;位图文件保留字,必须为0 w o r d b f r e s e r v e d 2 ;位图文件保留字,必须为0 d w o r d b f o f f b i t s ;位图数据的起始位置,以相对于位图文件头 的偏移量表示,以字节为单位 b i t m a p f i l e h e a d e r ;该结构占据1 4 个字节。 3 位图信息头 b m p 位图信息头数据用于说明位图的尺寸等信息。其结构如下: 辽宁工程技术大学硕士学位论文 t y p e d e fs t r u c tt a g b i t m a p i n f o h e a d e r d w o r db i s i z e ; 本结构所占用字节数 l o n g b i w i d t h ; 位图的宽度,以像素为单位 l o n g b i h e i g h t ; 位图的高度,以像素为单位 w o r d b i p l a n e s ;目标设备的平面数,现为1 w o r d b i b i t c o u n t ;每个像素所需的位数,必须是l ( 9 2 色) , 4 ( 1 6 色) ,8 ( 2 5 6 色) 或2 4 ( 真彩色) 之一 d w o r d b i c o m p r e s s i o n ;位图压缩类型,必须是0 ( 不压 缩) ,l ( b i r l e 8 压缩类型) 或2 ( b i r l e 4 压缩类型) 之一 d w o r d b i s i z e l m a g e ; 位图的大小,以字节为单位 l o n g b i x p e l s p e r m e t e r ;位图水平分辨率,每米像素数 l o n g b i y p e l s p e r m e t e r ;位图垂直分辨率,每米像素数 d w o r d b i c l r u s e d ;位图实际使用的颜色表中的颜色数 d w o r d b i c l r i m p o r t a n t ; 位图显示过程中重要的颜色数 ,b i t m a p i n f o h e a d e r :该结构占据4 0 个字节。 注意:对于b m p 文件格式,在处理单色图象和真彩色图象的时 候,无论图象数据多么庞大,都不对图象数据进行任何压缩处理,一 般情况下,如果位图采用压缩格式,那么1 6 色图象采用r l e 4 压缩 算法,2 5 6 色图象采用r l e 8 压缩算法。 4 颜色表 颜色表用于说明位图中的颜色,它有若干个表项,每一个表项是 一个r g b q u a d 类型的结构,定义一种颜色。r g b q u a d 结构的定 义如下: t y p e d e f s t r u c tt a g r g b q u a d b y t er g b b l u e ;蓝色的亮度( 值范围为0 - 2 5 5 ) b y t er g b g r e e n ;绿色的亮度( 值范围为0 - 2 5 5 ) b y t er g b r e d ;红色的亮度( 值范围为0 - 2 5 5 ) b y t er g b r e s e r v e d ;保留,必须为0 ) r g b q u a d ; 颜色表中r g b q u a d 结构数据的个数由b i t m a p i n f o h e a d e r 中的b i b i t c o u n t 项来确定,当b i b i t c o u n t = 1 ,4 ,8 时,分别有2 ,1 6 ,2 5 6 辽宁工程技术大学硕士学位论文 个颜色表项,当b i b i t c o u n t = 2 4 时,图象为真彩色,图象中每个像素 的颜色用三个字节表示,分别对应r 、g 、b 值,图象文件没有颜色 表项。位图信息头和颜色表组成位图信息,b i t m a p i n f 0 结构定义 如下: t y p e d e fs t r u c tt a g b i t m a p i n f o b i t m a p i n f o h e a d e rb m i h e a d e r ;位图信息头 r g b q u a db m i c o l o r s 1 ;颜色表 ) b i t m a p i n f o ; 注意:r g b q u a d 数据结构中,增加了一个保留字段r g b r e s e r v e d , 它不代表任何颜色,必须取固定的值为“0 ”,同时,r g b q u a d 结构 中定义的颜色值中,红色、绿色和蓝色的排列顺序与一般真彩色图象 文件的颜色数据排列顺序恰好相反,即:若某个位图中的一个像素点 的颜色的描述为“0 0 ,0 0 ,f f ,o o ”,则表示该点为红色,而不是蓝 色。 5 位图数据 位图数据记录了位图的每一个像素值或该对应像素的颜色表的 索引值,图象记录顺序是在扫描行内是从左到右,扫描行之间是从下 到上。这种格式我们又称为b o t t o m u p 位图,当然与之相对的还有 u p d o w n 形式的位图,它的记录顺序是从上到下的,对于这种形式 的位图,也不存在压缩形式。位图的一个像素值所占的字节数:当 b i b i t c o u n t = l 时,8 个像素占1 个字节;当b i b i t c o u n t = 4 时,2 个像 素占1 个字节:当b i b i t c o u n t = 8 时,1 个像素占1 个字节;当 b i b i t c o u n t = 2 4 时,1 个像素占3 个字节,此时图象为真彩色图象。当 图象不是为真彩色时,图象文件中包含颜色表,位图的数据表示对应 像素点在颜色表中相应的索引值,当为真彩色时,每一个像素用三个 字节表示图象相应像素点彩色值,每个字节分别对应r 、g 、b 分量 的值,这时候图象文件中没有颜色表。上面已经讲过了,w i n d o w s 规 定图象文件中一个扫描行所占的字节数必须是4 的倍数( 即以字为单 位) ,不足的以0 填充,图象文件中一个扫描行所占的字节数计算方法: d a t a s i z e p e 儿i n e = ( b i w i d t h + b i b i t c o u n t + 31 ) 8 ;一个扫描行所 占的字节数 辽宁工程技术大学硕士学位论文 位图数据的大小按下式计算( 不压缩情况下) : d a t a s i z e 2d a t a s i z e p e r l i n e + b i h e i g h t 。 上述是b m p 文件格式的说明,搞清楚了以上的结构,就可以正 确的操作图象文件,对它进行读或写操作了。 3 1 2b m p 文件统计直方图的求解方法 读取一个b m p 文件时候。位移5 9 个字节开始,便是图象数据。 依据前面介绍的文件结构,可以得出图象数据的每个像素点的像素值 以及r g b 的值,在此需要指出的是,图象记录顺序一般在扫描行内 是从左到右,扫描行之间是从下到上。下面根据压缩分两种情况阐述。 单色图象和真彩色图象 处理这两种图象的时候,无论数据有多么庞大,都不对图象进行 压缩处理,所以位图数据记录的便是该像素的颜色值。 当b i b i t c o u n t = l 时,8 个像素占1 个字节,即为单色图象,表示位 图最多有两种颜色,黑色和白色,只用0 和1 来表示,图象数据阵列 中的每一位表示一个像素。5 9 个字节开始便是图象数据,第一字节 假如表示为a 7 、a 6 、a 5 、a 4 、a 3 、a 2 、a 1 、a 0 位( 从高位到底位) , 则a 0 表示第b i h e i g h t 行( 最后一行) 第一个像素点的像素值,存入 数组c o l o r b i h e i g h t 1 儿0 ,a 1 表示这行第二个像素点的像素值,存入 数组e o t o r b i h e i g h t 一1 】【1 ,第b i h e i g h t 行的所有像素点的像素 值可以得出,存入数组c o l o r b i h e i g h t 一1 1 。从5 9 + d a t a s i z e p e r l i n e 字节 开始便是第b i h e i g h t - l 行的像素点,算法同第b i h e i g h t 行的。依此类 推,这些像素值可以存入数组c o l o r b i h e i g h t 】 b i w i d t h 】中,由0 和l 组成,0 表示黑色,1 表示白色。 当b i b i t c o u n t = 2 4 时,1 个像素占3 个字节,此时图象为真彩色图 象。每个像素用三个字节表示图象相应像素点彩色值,每个字节分别 对应的r 、g 、b 分量的值,这时候图象文件没有颜色表。图象数据 的第一个字节是第b i h e i g h t 行第一个像素的r 值,第二个字节是g 值,第三个字节是b 值,一个像素点共占用三个字节,然后是第二个 像素的三个值,根据此方法,可以得到每个像素点的三个值,分别保 存到r 【】【 、g 儿】、b 【儿_ - - 个数组,每个数组都有b i h e i g h t b i w i d t h 辽宁工程技术大学硕士学位论文 2 0 个元素。 1 6 色图象和2 5 6 色图象 这两种图象一般都需压缩,所以在处理它们时必须根据压缩算法 解压,然后再寻找每个像素的像素值。这时候把像素值作为颜色表的 表项来查找该像素的颜色值,在此我们先根据上述寻找单色或者真彩 色图象像素值的方法来查找1 6 色图象和2 5 6 色图象的每个像素的像 素值,有了这个像素值就可以做如下工作。 1 6 色图象,寻找每个像素点的像素值同上面介绍的单色图象和 真彩色图象。每个像素用4 位表示,并用这4 位作为彩色表的表项来 查找该像素的颜色。例如,如果位图中的第一个字节为0 x 1 f ,它表 示有两个像素,第一像素的颜色就在彩色表的第2 表项中查找,而第 二个像素的颜色就在彩色表的第1 6 表项中查找。第二个字节存放的 便是第三和第四个像素点的像素值。 2 5 6 色图象,每个像素用8 位表示,并用这8 位作为彩色表的表 项来查找该像素的颜色。例如,如果位图中的第一个字节为0 x l f , 这个像素的颜色就在彩色表的第3 2 表项中查找。 根据此方法就可以得到这两种图象的彩色值,分别存入数组r 、 g 、b 中。 统计单色图象c o l o r 数组中0 和1 的个数,其他三种图象的三个 数组取每一个值的个数。 根据统计直方图的公式, 日( 尼) = 静 | i :0 ,1 ,三一1 其中k 代表图象的特征取值,比如0 、l ,三是特征可取值的个数, 胁是图象中具有特征值为k 的像素的个数,是图象像素的总数,在 此为b i w i d t h b i h e i g h t ,知道每一个变量的值,就可以得出统计直 方图。 3 1 3b m p 文件累积直方图的求解方法 累积直方图的求解方法和统计直方图的类似,也必须知道每个像 素点的颜色值,以及颜色特征可取值的个数,每一个可取值的个数。 需要分析b m p 文件的每一种图象,把像素值存到数组中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030动力电池回收利用体系建设与经济性评估研究
- 新员工入职培训方案及知识点总结
- 小学数学教学计划与教案范本
- 社会责任管理体系执行手册
- 企业员工薪酬体系设计与管理
- 幼儿园托班期末综合评语模板
- 个性化用药方案开发应用-洞察及研究
- 人工智能在环境监测中的潜力-洞察及研究
- 投资策略在新兴技术行业的应用-洞察及研究
- 数据分析优化航空货运流程-洞察及研究
- 数据中心基础设施标识标志
- 工程质量精细化管理思路、关键点及控制方法课件
- 《情满今生》读书笔记模板
- 胸痛中心网络医院STEMI患者绕行急诊和CCU方案流程图
- 2021年一级注册消防工程师继续教育试题答案
- 甲醇理化性质及危险特性表MSDS
- GB/T 7216-2009灰铸铁金相检验
- GB/T 5796.3-1986梯形螺纹基本尺寸
- 华北理工大学2016年《互换性及技术测量》期末考试复习题
- 医学影像学总论-X线课件
- 大班科学《神奇的洞洞》课件
评论
0/150
提交评论