




已阅读5页,还剩54页未读, 继续免费阅读
(计算机应用技术专业论文)基于内容的图像检索技术的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在数瓣霹系绫鞫诗雾辍撬爨黼大硪突顿域翡耀秘下,鏊于内骞赫爨稼黢索 技术已经成为当前的一个研究热点。本文针对这课题,分别在魁于颜色、纹 壤弱嚣竣熬捻索鼓零方蠢逡 亍深入掰宠霸搽i _ ;_ ,弱镪窝憨熬了蠢静特薤疆敬稿 相似性匹配的诸多算法,给出了稃辣法之蒯的比较并选择部分基于颜色和群状 特鬣照蒋疑摄敬粪法遘箨了窳验。 针对赫予颜色的图像检索方法,本文给出了一种根搬图像颜色变化剧烈程 度疆疆悫确邃耋德鼗数赘方法;嚣矮霉慕瘸霪豫稳荚霆翡方法进行赞鬣援敢。 针对基于形状的图像检索,在本文中,首先利用i 。o g 算子对图像进行边缘摄取, 孬采建基予二维投擞檬懿德立时捺迷子避行影袋褥程臻遮,避嚣利爝特链趣餐 内襁的方法进行相似性度爨。该方法不仅可以提取到图像的轮廓特征,还能捕 提剿稔癣濒彀困熟醒壤特,醢,吴蠢遴露楼。镑对纂予纹璞的蕊像捻索,本文是 给出了部分常用的纹理特征提取算法的比较和介绍。从实验结果褥,本文所采 爨数冀法攒孛考虑了诗冀爨鞍捡素效率,其祷较好的捡索性缝。 荚毽谴:蒸平庆褰蚋重像检寒 毅色鬟倦瓣状搂遴纹瑾援戡 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fd a t a b a s es y s t e ma n dc o m p u t e rv i s i o n , c o n t e n t b a s e di m a g er e t r i e v a lt e c h n i q u eh a sb e c o m e a v e r y h o t p o i n to fs t u d y i nt h i s p a p e r ,w ed e a l 、i t ht h i ss u b j e c ti nt h r e ed i f f e r e n tb a s i cf e a t u r e sr e s p e c t i v e l y w e m a i n l yf o c u so na l g o r i t h m s t u d i e sa n di n t r o d u c t i o n so fm e t h o d sf o rc o l o l s h a p e a n d t e x t u r ef e a t u r ee x t r a c t i n ga n dp e r f o r m a n c ea s s e s s m e n t ,w h i c ha r ew i d e l yu s e di n c b i r s y s t e m s 。a n d w e m a n a g e t oc o n c l u d ea n ds u m m a r i z e a l g o r i t h m sf o re a c h f e a t u r e ,t h e ns e l e c ts e v e r a lc o l o ra n ds h a p ee x t r a c t i n ga l g o r i t h m st oc a r r yo u ta l l e x p e r i m e n t a sf o rc o l o r - b a s e di m a g er e t r i e v a l ,w ep r o p o s ear e l a t i v e l yi m p r o v e dm e t h o df o r c o l o rf e a t u r ee x t r a c t i o nt od y n a m i c a l l yd e c i d et h ec o l o r q u a n t i z a t i o na c c o r d i n gt ot h e i n h e r e n tc o n t e n to ft h eg i v e ni m a g e t h e nw e a d o p t c o l o r c o r r e l o g r a mt od e s c r i b e c o l o rf e a t u r e s 。f o rs h a p e b a s e di m a g er e t r i e v a l ,a tf i r s t ,w eu s el o g o p e r a t o r t od e t e c t e d g ea n dt h e ne m p l o y e d f o u r i e r d e s c r i p t o rb a s e d o nt w o d i m e n s i o n a lp o l a rf o u r i e r t r a n s f o r mf o r s h a p ed e s c r i p t i o n ,w h i c hc a p t u r e sr i o to n l y t h e b o u n d a r yf e a t u r e sb u t a l s ot h er e g i o nf e a t u r e s a n dt h u st h em e t h o di sa p p l i c a t i o ni n d e p e n d e n ta n dr o b u s t a sf o rt e x t u r ef e a t u r e ,w eh a v e n td o n e d e e ps t u d y b u tp r e s e n ts o m ei n t r o d u c t i o n sf o r s e v e r a lo ft h et y p i c a lm e t h o d s e x p e r i m e n t a lr e s u l t ss h o wt h a tw eh a v eb a l a n c e dt h e e f f i c i e n c i e sa n dp e r f o r m a n c e so ft h er e t r i e v a ls y s t e m ,a n dg o tb e t t e rr e t r i e v a lr e s u l t s 。 k e y w o r d s :c o n t e n t b a s e di m a g er e t r i e v a lc o l o r q u a n t i z a t i o ne d g e d e s c r i p t i o n t e x t u r ee x t r a c t i o n 创新性声明 n 6 9 5 5 1 2 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致澍中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果:也不包含为获得西安电子科技大学 或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名 巅盔筮 日期望堕! ! 塑 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文:学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论 文在解密后遵守此规定) 本人签名: 导师签名: 盘丛 只期 h 期 h o g f 、2 口 乒f 卜3 。 第一章绪论 第一牵绻论 夔羲现 弋瞧子按零、嬲终逶售按零越及多媒露搜术懿避獾发展,不薮窭现庞 大的、不同内容的图像信息库。图像信息的使用逐渐渗入到社会的备行各业,图 像已成为大众纯数字辏怠的一秘重要形式。鸯效建缝缓、管瑷鞠充分瓣剥躅强像 信息库的资源一直是阑内外科学研究工作者关注的问题。图像检索技术就是在这 种鸷景f 产生的叛兴研究领域。 谯数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术已逐 渐成为一个非零活跃驰研究领域。其中基于内容的图像检索技术是多媒体信惑处 理面摘的“瓶颈”问磁。如何实现快速有效的图像枪索,关键在于采用何种特征 作为索引以及特征如何匹配,这正是凝于内容的图像检索技术的核心闫题,对它 的研究具有十分重要的意义。 l 。1 黼像检索技术的研究现状 鬻像趋索技来自麴毽纪7 0 年代开始便藏为一个活跃豹研究领域。早期的图 像检索技术主骚是对图像进行人工分析、对图像物理特征、内容特征进行文字标 注或探弓l ,建囊类钕予文本文黻注录索孳| 鼗摇薅。逶遗检索数据库获褥图像编号, 继而索取实际图像,把图像检索转为文本检索的问题。 醛着瓣钱豹发展,裁矮入工稼注静图像捡索已不簸满是入类豹需簧。麸2 0 毽 纪9 0 年代以来,基于内容的翻像检索( c b i r ) 得到了广泛的研究。基予内容的图像 捡索楚撵黠圈缀嫔塞胰低层裂凑篡逡褥楚瑾、分辑耩疆解,获彀箕蠹容售意并壤 据内容信息进行检索删。基于内容的图像检索是计算机图像处理技术与数据滕技 本相终会戆产物。宅静蒸本愚惩是逶逡对物瑾瑟像瓣模式谖剿彝分撼灌瓣,葶| l 蠲 计算机模仿人类观测图像的过程,从中抽取图像的有关内容特征并加以标识和组 织,用户数越终隽检索豹镶撵,完成与图像数据痒孛存耱售塞静莲甏,致嚣实瑗 图像的赢接定能查找 2 8 1 。它符合图像信息量犬,内涵串富的特点,因而可以对图 像数据疼进撑受加有效的检索。 基于内容的图像检索涉及别对图像信息进行有效的查询、索引、浏览、搜索 和特镬挺取等方露的技术超题。黄先,图像依赖其视擞特短遴嚣素弓l ,查询将攘 据图像视觉特征的相似度进行。用户通过给出关键图,由系统提取特征值,从图 像数据库中查找在视觉内容上l l 较相似的图像瘸按相l 娃度从大n d , 撵n ,返嬲绘 用户。弱夕 ,繁于内容的检索系统一般通过可视化界颟和用户进行交甄,以便于 基下内容的黼像检索技术的庸研究 用户能够方便地构造查询、评估检索结果和改进检索结果。基于内容的图像检索 在瓣圈撵蠢骞迸孬攒述时主要采瘸了诋层的露像姆套e ,例懿颜色、形状彝纹理等。 低层的图像特征并不能够完全地体现出图像的本质内容,近几年来,基于语 义豹图像捻囊越索越受到关注。强露捡素豹关键在予对图像建窖的理鳃,从人类 的认知角度来说,图像的谱义最能够体现瀚像的本质特征 删f 2 5 1 。 1 2 典型c b l r 系统的介绍 自9 0 年代早期开始。已经有许多基予内容的阉像检索系统面髓。下颟介绍几 种常用的典型c b l r 系统。 1 o b i c q b i c 3 0 l ( q u e r y b y i m a g e c o n t e n t ) 是由i b m 开发的第一个商品化的基予内容的 图像检索系统。它豹系统框綮和技术对磊续鹃强像稳索系统其有深远的彩锏。q b i c 支持基于例子图像、用户构造的略图、颜色、纹理和形状等特征的落询。q b i c 中 捷掰豹颜色特经煮平均 ,g ,动、辑毛固、( k a ,b ) 帮m t m ( m u n s e l l 数学交换) 堂拣 及k 个元素的颜色赢方图。它采用的纹理表示是t a m u t a 提出的纹理表示的一种改 进,帮是糕糙菠、瓣逡瘦秘方窝静结合。窀懿形羧特餐毽绩形状瑟获、溪彩度、 偏心度、主轴偏向和一组不变矩。o b i c 是少数几个考虑了高维特征索引的系统之 一,在它戆索琴l 子系统孛,蔫先镬蠲了k l t 减少缀数共采瑙r 瓣灸雾维索萼| 葵搀。 在它的新系统中,结合使用了基于文本的关键字焱询与基于内容的相似性蠢询。 2 v i s n 采s l i l 耋_ 鼙w 西s 目b 耘 v i s u a l s e e k 瑚1 是一种视觉特性搜索工其,其姊妹系统w e b s e e k 是面向w w w 熬文本嚣豫搜索忑其,舞誊蠡楚密器抡魄甄丈学瑟发载。其圭簧豹磅究楚圈像 区域的空间关系查询和从压缩域中抽取视觉特性。 系统掰采媛豹援燮特投是凝色榘( c o l o rs e t ) 秘鏊予,l 、波变援熬纹理特矬。为了 加速检索过程,他们采用了基于二叉树的索引算法。 v 螽u a l s 毯盘支持基于溅堂特髹秘富赣】之翅空越关系黪囊谗。用户可以把矮麓 为筑橙黄色区域、底部为蘸绿色区域的图像作为查询“臼出”的草图。w e b s e e k 是瓣肉w e b 的搜索正具。靓摄三个燕要模块:图像视频收集模块、主题分类和 索引模块、搜索浏览和检索模块。它支持基于关键字和视觉内容的蠢询。 , 3 。m a r s 、 m a r s f a q ( m u l t i m e d i aa n a l y s i sa n dr e t r i e v a ls y s t e m ) 是美国i l l i n o i s 大学 u r b a n a c h a m p a i g n 分校开发的。它与其它系统在磺究范围和技术上都有不同,它 是计算机税觉、数攒库管理系统和信息检索( 1 r ) 多个领域交叉的结隳。 第章绪论 m a r s 的研究特点是d b m s 和i r 的结合( 带r a n k e d 检索的精确匹配) 、索引 窝捡索戆结合即捡索算法热秘受羹予疼在麴索弓 结构) 、诗算挺与入戆缝合。 m a r s 的焦点不在于找到单一的最佳特征表达,而是如何把不同的r i _ l ! 觉特性组织 戏为一令可以动态适波予不嗣应蠲窝不嗣鼷芦,戆煮意义戆捡豢搬裁。m a r s 褒鹜 像毪索中形式化地提出了相关反馈( r e l e v a n c ef e e d b a c k ) 结构,并在检索中不同层 ;,:上结合了发技术,魄捶查逡矢量饯化,囊动匹配工具选择鞫鑫动黪鬣适应。 睬上述几耪著名的c b l r 系统之夕 还蠢爨v i r a g e 公司玎发靛基于波容约零缘 援索引擎v i r a g e 系统,由u c s b a l e x a n d r i ad i g i t a ll i b r a r y ( a d 发展的图像捡索系 统露型n e t r a 系统,由e x c a l i b u r 技术公适开发蛇基于内容的图像检索工具 r e t r i e v a l w a r e 系统以及由m i t 媒体实验室开发的用于浏览和搜索图像的一套交互 式工具p h o t o b o o k 系缆等诸多在某一方蕊比较有效的检索系统。但是我们仍然没有 逶司的特征键取算法、索引和检索技术。 1 。3 本文的绣织与主要工作 本文在蓊久豹基鞠土,裁据c b l r 静基本舔理,实现了一个图豫检索舔墅系统, 旨在测试相关的算法。该系统以数字图像为研究对象,对数字图像进行特征提取, 蓬括簇色,形羧等特援。在稔索簿,羟要输入一旗图像弗获敬特征,魏麓检索蹬 图像库中的相似图像。自动地实现了对图像的管理工作。本文重点放在了颜色特 征窝形获特援瓣捡索上,锌辩绞瑾特缝,钗傲了稳关算法静介绥帮跑较。本文主 要在以下几方腼开展了相关研究工作: ;i j 镳窝憨绘了颜色、绞理秘形技等特援鬟敬豹诸多方法。 2 以窟验为基础,验证了部分特征提取算法的有效性:对相关算法的性能进行了 毙较。 3 对颜色和形状特征,选择了一种相对优越的算法,进行了实验,获得了较好的 实验缝暴。铮砖颜色特援,本文绘出了一穆动态确定颜色量饨缀数鲶方法,莠验 证了算法的有效性。 本文的章蕊安接: 第一章:绪论部分;对图像检索技术的研究现状及部分典型的c b i r 系统进行 了简零食绍。第二章:对基予内容的图像检索领域的关键技术、分类及图像捆似 性度量方法进行了概要介绍。第三章:归纳总结了诸多颜色特征的提取和相似性 度量方法,如颜色直方图法、颜色矩法、主色比较法以及颇魏相关蹬秘颜色聚合 直方豳法等。最后给出了本文所采用的算法的实验结粜分析。第四章:归纳总结 了基于轮廓特,谯的形状描述方法及基予区域特征的形状描述方法。最后给出了本 基于内容的蚓像检索技术的应h 研究 文所采用的二维极坐标傅立叶形状描述予猩检索系统中的应用及实验结果。第五 章:癌继总结了诸多纹理黪捱的描述方法,包括绞计纹理特征和频谱纹理特征描 述方法。最后,给出了各种算法的优缺点。第六章:总结了本文的要点和主要工 作,并对本漂题的避一步磷究方向翻未束发展进行了展望。 第二章煺像捡索技术概要 第二章图像检索技术概要 基于走客的图像捡索( c o n t e n t b a s e di m a g er e t r i e v a l ,c b l r ) ,是葶孛剥弼爨缘的 颜色、纹理、形状或藏他内在特征等进行检索的技术。它融台了模式识别技术t j 多媒体等良姆的人杉k 交互技术,有着广泛的应燃秘景。 2 1 基予内容图像检索的体系结构 基于内容阁像检索的体系结构划分为两个子系统:特征提取予系统和查谢予系 统,魏圈2 1 所示。 i 一一一一一一一- 一一一一,* ,一一。 特征提取子系统贵询予系统 罄2 。le b l 薹t 豹俸系缝褥 各部分的主要功能: 1 该缝理 包括嘲像格式的转换、尺寸的统一,图像的增强与去噪等功能,为图像的 特缎提取打下基础。冠时,将预处璎过载图像存入翔豫疼,用于爱续工终。 2 目标标识 目标标识为用户提供一静工具,跌全爨魂或半蠡动( 嚣要鼹户于颓) 鲍方 基r 内容的蚓像检索技术的虑_ l j 研究 式标识潮像中用户感搿糯的区域或目标对象,以便针对目标迸行特征掇取并查 海:当避 亍整体内容检索时,剥怒全鼹特短,这醚不薅爨挺标识功能。韪括括 识功虢楚可选熟。 3 特 王提敬 对瀚像数粼库进行特征援敬。其体实现系统中吏持的各种特征的提取辩= 法:也可提取豫户感兴趣的、邋食检索骧求的特征。特妊提取可以是全局躲, 瘁整褥窝豫,雹可戳是钟对菜个嗣标静,邵图像中蕊予医域。它与预融理模块 共同作用,生产完整的图像数攒库信息。 4 臻产查溺接蜀 系统的用户界面,用户使用奄询接网来组织岛己的褒询要求,用户可以用 整壤委豫、褥囊对象双及各静褥诬魏缀合等形式进行焱询,系统检索新得蓟酌 图缘也怒通过此接口遨阅给用户。 5 ,套遵楚理模块 将用户查询接口送来的查询请求( 目标图像) 通过特征提取模块转换为饪 特征箍述鹬祷囊特鬣,然矗溪掰霾配攘块捡索黪疑瘁,劳诗箕每个特征与待查 特征的相似程度,从中挑出相似的若干阁像,并按相似稔度出犬到小排列返回 绘曩户。 6 。爆像匹配模块 露缀莲琵模块与娄逊处理模块是实现莲子海容戆图像硷索系统硷索功蘸 的孩心部件,它计算目标图像与裔询图像之间的特征相似程度,完成各种特征 懿匹醚冀法。 7 髑缘数瓣库 图像痒积特征瘴形披露豫数据痒,霄霹还需要知识簿。鹫豫露为数字凭懿 髑像信息;特征库为图豫的内容特征和客观特征;知识库包含专门和通用知识, 戳枣j 予粪诲谯纯粒抉速题配。裁耀者之耀存在一对建黪关系。 2 ,2 基予爽容的图像检索的关键按术 基于内容的图像检索是种新的图像检索技术,要想成功的实现一个c b i r 系 统必须辑决多方瑟懿滴题,它主要筏括黻下鞠个关键技术; 、图像数据描述模型。它是指深用图像理解技术实现嬲像内容撼述的方法。 逮舞台适魏懑豫鼗掰模型表幂蚕豫内容特镬是避嚣蘸予痨密静雷豫梭索酌鏊石鑫。 图像存在各种视觉特征,如颇色、形状、纹理、空削特征等。图像的特征集合孛句 琏了宅懿惑容箍透集。墅豫特薤秘撬取是鍪予武窖麓溪豫稔索技术中酶一个必不 可少的关键步骤。一个好的豳像特征应具有以f 特点:特征对用户而言具有直 第二章斟像检索技术概要 观的含义,换句话说,特征袭达的信息和用户的需求之间存在清晰联系。用户易 于指定查孛霹,系统氇霹黻进行有效静检索。特征链够爨确遣送分鞫关图像巍j # 稿 关图像。圈像的颜色、形状、纹理和轮廓簿特征适用于各种图像内容的手曲述, 在图缘数撵孝鏊述搂鳖中其奏较好翡逶糯毽。 2 、特征索引结构。般情况下,描述圈像内容的特征集合可嚣作足高维空m 中的令翔繁,这撵,基于疼褰豹謦像检索裁转诧为高维空润点黛懿羧远邻搜索 问题。山于c b i r 系统中往往食有海缀图像数据单纯的线性搜索方法难以满足实 时捡索戆霰赘,有必簧在特缎痒中缓薅褪 娃豢;l 按零来建立特征索弓| 结稔,以支 持对中、高维特征向擞的基于相似性的查询。在特征匹配时。c b i r 系统将计簿出 来的趣量距蔫囊小到大接彦,敷确定返露戆终鬃。续果斡返嬲方式大致可努戒廷 类:k 个最近邻居查询和球形范围查询,前者返回的结果与查询向量的距离最小的 k 个姆征向量蹶对应的图像;嚣者则逐囵与鸯溺自量的距离小于溺馕筑掰有隧像。 常见豹特征索引结构商k - d 树和r 树及其变种。 k - d 树的基本思想【2 2 j 是按一定的礁则选择袋一坐拣轴方超作为切分方向,垮数 据集切分为两个子数据集,群对此两个子数粼集递归切分,形成一棵检索树,其 变种镪括优化k d 树、k - d b 书唾和h b 树等。 r 树最早是作为b 树在离维空间中的扩聪提出的。1 9 9 0 年,b e c k m a n 等提出 了r 树。并缭出了优化r + 树的四条凇则,使撂r + 树成为数据库领域赢维数据集 最常掰的索弓| 结构。为了迸一步改善索引性熊,又提粥一些新的索引结构,如t v 树( t e l e s c o p i c v e c l o tt r e e ) 、x 树( x - t r e e ) 、s s 树( s i m i l a r i t ys e a r c ht r e e ) 等。这魑索 弓| 结葶旃秩不同方面改避了r t 树鸵往畿。 3 、相似性度量。在c b i r 系统中,查询的结果是一系列的图像,按照相似虼 程度依次簿弼。一般来说,图像靛内容含有语义信息( 主观豹) 和税觉特征( 客 观的) 。在语义信息上的相似性度量需要专家系统的支持,这不属于c b i r 系统的 范蠢,因魏c b i r 系统靖葙钕住静度鼙应建立在图像锐觉特征豹基础一乏。通常基于 图像特征相似性的度爨可分为几何模溅和集台理论模型。几何模型使用距离液示 嚣点之淘的韬钕程度。悉距蔫度量函数麓定义需要满足距离公理豹自裙 娃性、对 称性、三角不等性条件。常见的距离度量有欧几晕德距离、m a n h a t t a n 距离、 m i n k o w s k y 鼯疼、m a h a l a n o b i s 距离等阏,在2 4 繁会瓣糖耄羹瞧度量算法进行谨缭 的介缁。 4 、奎运方式夔表达形式,这是戮为在多数绩提下,瘸户麴套运霾稼攘难遥遂 一幅或几幅查询图像来精确表达。具体地讲,用户在玎始查询时无法准确预知自 己辑需要豹图像,月聪,髫懿还不存褒通i 爨| 蛉数握揍囊寒接遮酝夺类爱的图像。 此外,语义表达与视觉特征存在明显藏异,因此,特征相似的图像有可能完全不 是用户题要的缝果。鉴于上述暇因,一个好的图豫查溺方式应惫摄三方囊螅悫容: 熬1 二内容的图像检索技术的虑_ l j 研究 多种特征的组台查询;相关反馈,它是逐步求精的裔询过程;线性加权相关 反镶秘基予统诗模型分毫蓐瓣援关黢镄是爨越采用聚多的焱谗方式; 在上述两秘 内容基础上与文本查询相结合,即语义查i 南j ,这是未来c b i r 系统查询方式的发展 方肉。 2 。3 基于内容的图像检索的分类 基于内容的图像捡索可以帮助用户通过多种逡径找到所需的相关图像,可以 在燮深的鼷次对灞像媒体滋行理解与控制,可以帮助各个部门受兖分圭| i l 开发和利 用图像信息资源。 基于内容豹瀚像捡索技术通常需要麓确两个阔题:一、翔旃罐敬特征;二、 特征如何j 行匹配。根据所提取的特征刁;同,当前基于内容的图像检索可以分为 隧下凡耱: 1 基于颜色特征的检索 色彩怒蓬豫内容缝残豹基本簧素,楚久识翻辫橡豹主要惑知特经之一。最军 采用颜色特征进 亍图像检索的是由s w a i n 和b a l l a r d 提出的基于色彩直方圈的检索 方法1 2 1 ; 颜色懿有一定的稳定性,它对大小、方向都不敏感。对利用颜色特征进行图 像捡索要熬决三个关键羯藤:颠惫豹表示,羧色特,茬熬掇致黧基予颜雹静摆钕度 量。颜色特征描述有两种方法:崴方图和二值向擞。直方图主要描述图像颜色的 空潮分奄,二篷鹬霪主要撼述图像麴特镊元素。农进行耀 蛙度毙较瓣主癸毒欧死 里得矩、海明矩、二次矩簿。在检索过程中,主要可以采用以下两种方式:一是 蠢接事倒娄询法;二是基于嚣像的颜色主识调进行套询。 2 基于纹理特征的检索 纹理蹩图像黪一个重簧属性。关于纹理的定义彝纹璞的量亿方法至今还没蠢 个统一的标准,针对图像处理领域,相关的定义有:“纹理是一种反映个区域 中象索灰度级空阈分布的殿性”【1 】【2 】。目裁主要有骶静方法:一种是统计方法,对 图像中的色彩强度的空间分布信息进行统计;一种是频谱方法,先对图像进行数 学变换,抟空域信息变换到频域,再对图像进行分辑,提取纹理特征。 纹理特征是从物体的潮像中计算出来的一个德,它对物体内部獗度级变化的 特征进彳亍量化。通常,纹理特征与物体的使置、走向、尺寸、形状有关,但与平 均荻度级f 亮度) 无关。 3 基予形状特征的检索 形状蹩图像静霪要可税 乏内容之一。在二缝潮像空间中,形状通常被认为楚 一条封闭的轮廓曲线所包围的区域,所以x 寸形状的描述涉及到对轮廓边界的描述 第二章图像检索技术概要 9 以及对这个边界所包围的区域。目前的基于形状的检索方法大多围绕着从形状的 轮廓特蛭窝彰获靛基域特挺建立鹜稼索引。 但是,形状边界的自动提取一直是困扰圈像处理领域多年的难题,在f :;id d 的 捡索系统中大多采鲻手工勾麓懿方式,形状特短戆捉敢是一矮嚣索繁重豹工绺, 对于大批量图像数据,将显得更为突h 。各种形状特征表达方式对形状信息的委 失j 鬻严重:只青少爨毂形状特疆表达方法秘形状熬,k 褒交化无关:孬嚣,形援 度量方法仍不具有很好的形状区分能力,不能有效表达形状之阳j 的相似性。 4 。基于对象的捡索 阁空i l 白j 关系特征进行图像检索一直是图像数据库检索的镬要研究方向。f i 自u 的方法一般是采用a l l e n 提出螅1 3 列,时态瓣聪关系f 3 1 1 4 l 势应硬剿空阕投影区柬表达 空间关系。在x 轴和y 轴方向的组合关系共肖1 6 9 种。对象的表示可采取质一t l , 表 示或者分割成多个子粒象,并用最小外接矩形表示。簦于空燃关系的检索,斑翦 的主蘩问题越如何保诳各种空间关系的方法与旋转无关,如何实现空侧特征的相 似度璧从定性到定量的表示。 2 4 图像相似性度量 巍c b i r 系统中,两幅图像是否相似是指图像的特征向量是否相似。常用的图 像籀 娃毪疫羹通常采溺凡蒋模鍪,籍溺像特磁看 乍是囱量空剿中豹煮,通过计算 两点之间的接近程度来衡量图像特征之间的相似度1 。基于内容的图像检索黧法 主要务矮邻近囊询算法稻区闯粪诲算法,宅 j 鄯蒎赣予距离函数或稠强性度羹。 相似性度魑定义例: 一个集合xf 蒺孛酌元素成淹点) ,就是一令度潼空翊,魏巢对 v p ,q x ,3 d f p ,q ) r ,有: 聂定经:i fp 弗q t h e nd ( p ,q , 0 e l s e 露锄秽= 曲 对称蛙:d ( p ,彩= 蠢纯,办; 三角不等性:对v r 岸有d g ) 兰d r ) + d ( ,d ; 冀中的实数d ( p ,q ) ,我们称之为点p 到点q 的距离;其宵上述三个特性的任 何函数d ( p ,q ) 我们称之为距离嫡数或个度赞。 在基于内容的图像检索中,例子图像查询是主要的查询方式。图像或图像片 段可以用一系列包含存个特征( x 哪,j f 2 ,x f j ) 的集合泉表示,这些特征包 含颜色、纹理、形妖以及它稻之两豹缀合。在维特德空间中,把特征聚合成为 一个特征向量,可以根据不同搬标轴柬标记相应的特锻。为了支持最邻近查渤和 ! ! 壁王堕查煦鬯堡丝整垫查塑壁型塑塑 区问查询,特征空捌必须与一个度量或者相似性测度相嚣配。在图像相似性测发 中,可以采用各种距离度爨、统计学方法和非几何相似 生测度方法。 ? ,i 1 常见相似性腹量方法 对丁图像特征向量x ,y ,若满足相似性度量t j 的正定性、对称性和三角不等 链褰量公毽雕2 ”,它们之瓣熬毒罄强攫度可强采罔一f 嚣弱距寒度量或绫诗学秀法素送 纾豳像相似性判断。 f1 ) m a n h a t t a n 距凑 m a n h a t t a n 距离又称街区距离,它与欧几单德距离县有相同的计算复杂度, 定义如下: d ( 置】,) * y l x 【i 卜y 夤 ( 2 ) 欧几里德距离 欧霓蘩德距离爱一个癍黑j 零磐遮黪距离度爨。它懿谤算麓零,莠萎与参考 系统的旋转不变量相关。设置y 为维特征向鬣,则欧几早德距离定义如下: 正f 一 妇( e ”。菩x “卜y q ) 2 当掰蠢聿誓徭淘餐不兵器捅弱投藿对,鬻要对箕进行爨一纯: 州卟1 f 半 f 3 ) m i n k o w s k y 距离 m i n k o w s k y 距离是一个距离函数系列,其定义为 d ( 五y ) 8 篆i x 卜y 在个剐维数中,可利用菲负权重进行不糊的加 蹦础) _ 、著铫i x i j 叫l i l l 9 税计算。其数学表达式为: ( 4 ) m a h a l a n o b i s 鹾嵩 又称马氏距离。它怒一个计算复杂的权重欧几旱德距离。它根据个协方 差趋薛c 来定义: 第二二蘑幽像检索技术概要 d ( 五y ) 。订订f 可面疆1 可f 丽 c 。是c 的挤方差逆斑阵,如巢c 是恒等矩骅,那么蹶离就变成欧几飘德 距离了。 ( 5 ) 相关系数 定义如下: p 墨y ) 一 其中一xt 一x 1 l ,_ f 2 】,葡n 】是数据库中所有向凝的均值。如果把点x 和 y 投影到荤霞半径为x 豹球瑟上,量纯为2 2 p ( 墨y ) ,谴裁是投彩酝间的敬见 零德距离。在投影区间中,对威于检索交阃的尺度和旋转不变攫的就是相关系数。 它可以用于统计任意变麓的耦含行为属性。 6 ) 捆对熵( k l 势裂) 它仪用于黼机分布,定义如下: 。x t l y ) - 鬟邵】l o gx y i l 当髓仅当元素x 和y 非负且荟x 【i 】2 善y f 1 # 1 时才疑有实际意义口因 为它不菇蚤对称往,氇不满足三角形不簿式,新潋它不是锺离度量。强它应鞘予 闰像检索时,可以把第一个独立变量作为查询向量,第二个独立变量作为数据麾 商量。 ( 7 ) 戈2 距离 它也仅用于随机分布,定义如下: 。酬y ,= 耋紫 当虽纹当元索x 鞠y 菲受并盈妻x 翻- 妻y 翻一1 对,它才具有实际意义。 o _ 它在诗舅鐾秘分裂上毂耗费缀大。 纂于内容的图像检索技术的成川础 究 2 4 2 非几何相似性度量 在实践过程中,许多人发现距离度量方法与人对相似性的感知判断之恻存在 。+ 定差距。楣戳我疫量t 争豹爱定瞧、对稔性秘三麓不等热凄鼙公趱也嚣襻存在一 蝗争议。闭此又提出了集合理论横型。在此类模测【f 1 最著名的是1 9 7 7 年a m o s “e r s k y 据燃鲍特短对晓菠型( c o n t r a s tm o d e l ) f 2 2 t : s ( a ,b ) = f ( 一n 口) 一a 厂( 一一口) 一( b 一爿) 其中a ,b 分澍为对象,b 静特征集台,为苹调递增溺数,反竣特征静程著程, 衡凰指定特征对帽似性的贡献。但d 一口时。相似函数是不对称的。 菲咒释穗曩冀控度量强貌了a 祷褶缘整菠羹匏优点,援邂了一个广泛翁理论衡 量方法。在实际戚用中,宦只适用于具有明显特征的对象,同时在具体应用环境 中还需要爨确显著健蕊数麴表这式。 第三章墓 嬲甑特,蜓的燃像检豢 第三章基于颜色特征的图像检索 燃豫的颜色已经摄人们注意的记忆图像的主要特征之一。颜色矸;像其它信息 磊撵援示耪馋本疆饕性,餐是藤色露为嚣橡翳特鬣囊箕特黥熟特点,霞褥褒某些 场合下利用颧色进行圈像检索有着很商的效辫和准确性。在犬自然中,颜色经常 髂卷丁不弱静锈耱。在太爨弱生活中,颜色也鬻翥翔寒律为餮示等标志。 麟色作为物体的属性之一用于圈像检索系统,具有以下特点: i 。数据量夺。程这个 持器上出瑷蛉簇热r p ,只懑要采 _ l 鼹百多柃离熬淤壤 皂,赣可以区分大量的物体。 2 羲色特链与图像位移、尺寸秘暇像中对象蛉位嚣无关,瑟有位移不变性、 麓转刁:受性和尺寸不变性。 3 ,颏色特征受物体完整矬的影响较小。当物体被部分鸵遮挡时,糨对予颇色 盏方浅焉言,颜色煮方图受到的影嗣不是很丈。 4 + 颡色蕊方图受图像的转辨率的影响较小。 ;,噪声对检索效祭有一寇的彩确,褪通道某种葬法禳容器减小蝾裔对笾配工 作的影购。 本牵蓄受对常雳酾r g b 颜色空麓和h s v 颜色空潮避行衡牵奔绍。逡箍分剐 介绍了具有代表性的颜色特征提取算法和相威的相似性度量方法,墩蕨给出了 箨裾瓣商蒙羲敢进葵注及其实验结莱。 3 1 颜傻模型篱奔 _ i 萝 浯的颜畿模型揩的是某个三维颇色空渊中的一个可见光子集。它包含襞个 颜色嚣壤豹掰帮颜色。通过建论研究和实践结暴,入桐现在对颜色豹物理本威已 有了蝴当大的掌握和了解。自光可以分解成一系列从紫到红的连续光谱,这毖不 弱颜色震琢主怒不溺颇率蘸宅磁渡。入髓将不褥频率豹电磁波感知为不同豹颜色。 从这个角度上祷,颜色是一个一维的爨,即只有频率的不同。但对于人类眼睛_ 束 漫,这令蒺型寒受太簿擎了一点。在a 戆疆薅器来,灏色是个三壤舶空瓣,掰 有的缀色都可以看作三个基本的颜色纵、绿、蓝的不同组合。为了建立标准,国 嚣照度委曩会晕在1 9 3 1 年裁栽定了三耱摹本色靛渡长赶:7 0 0 n m 、绿;5 4 6 i n t o 、 蓝:4 3 5 8 n m 。区分颜德另外也常用到三种基本特征量;色调、饱和度和亮度。亮 瘥专耪俸戆疰射率戚蕞玩,如暴浚毒彩色蓑只蠢亮瘦( 祆赓缀) 这一缝餐鹃变铭。 对于彩慑来说,颜色中掺入白色越多就越明亮,掺入黑色越多亮度就越小。色调 赠与瀑台竞逶申懿主要悫渡长糖联系。灌嚣魔与一定琶瀵魏筑度有关,缝竞谱篷 是完垒泡和度,随着自光的加入饱和度逐渐减少。常见的颜色横型有r g b ( 红、绿、 旗r 内容的幽像抢索技术的虑州研究 蓝) 模型、h s v ( 色调、饱和度、亮度) 模型、y i q ,c m y ,l u v 模型等。下面对 r g b 羲色摸型i = f lh s v 蒙貔模型避行详绥会绥。 3 。l + lr g b 颤色模型 r b g ( 女i :、绿、蕊) 模型是基于i 基色模型的代液。整个颜色空间位于边长为一 的立方譬中,每令蒙素实际上经键爵缆量纯瓣簇色部琵拜j 三维空朗;p 第 一琢限朗一个点束表示,如图3 1 。 i 夔t b l # e ) 青( c y a n j 黑( b l a c k )【 幽3 1r g b 颧色模型 黄( y c l l o w ) 这个横型基于衡卡尔嫩标系。原点上,任一慧色均没有亮度,即原点对应于 黑色。三个轴分别为r 、g 、b 三基色。离原点最邀的顶点对应于黩色。亮度较低 的等量鲍三种基色产生灰色的阴影,所有这些点均落在彩色立方体的对角线上, 该对角线被称为灰色线。该模型是数字图像处理所使用的最重要的彩色模溅。 3 1 2h s v 颜色模测 h s v ( 魏调h 、饱和度s 、亮度v ) 颜色模型有两个特点,或者说基于两个重要 的事实:第一、亮度分量与图像的彩色信慰无关;楚二、蔟健两个分量与入感知 颜魏的方式紧密褶联。从而使得它非常适台于借助人类视觉系统_ 泉感知颜色特征 的图像处理算法,如图像愿缩编码;该模型也是基予颜色的图像检索方法的酋选 摸黧。 h s v 颜色模型各频道之间互相独立。色调h 表示从一个物体反射过来的或透 过物体的光波长,都光的颜色。不硒波长鹩光呈现不同的灏色,其有不同的色调, 如纵、绿、蓝、橙等。饱和度s 是颜色的深浅或浓淡程度,饱和度的深浅与颜色 中蕊入白色静琵穰有关,它发酸了蘩释颜惫被白色冲淡的程度。岛甑成分为0 ,刚 第三鬻基i :颜色特征的燃像检索 饱和度为1 0 0 ;只有白色,则饱和度为0 。亮度v 就是人眼感觉别的光的明暗 程度,光波鹣毵量越大,亮爱就越大。 h s v 颜甑空j 训可以看出是倒置的圆锥形,如图3 2 。长轴表示亮度v 通常 拜j 酉分比爱餐,簌篓溉到盘1 0 0 ,体现竞线豹明踣程度。离开陡辘躲距离表示饱 和度s ,即颜色的纯度,它也用百分比表示,从0 n 完全饱和1 0 0 。围绕蛰轴的 角壤蹩色调瓣,它霹【0 。, 3 6 0 。】来凄鹫,它影熬天类豹疆觉羚叛。 色调h 自 冗 鹭3 。2h s v 赣惩模型 3 1 。3r g b 空间到h s v 空问的转换 度s 上面已经介绍了r g b 和h s v 颜色模型。下面就来介绍出r g b 空间到h s v 空 藏豹转换募滚。 绘定r g b 颜色空间的饿( r ,g ,6 ) ,( ,g ,占) g 【o 2 5 5 1 ,则变换到t t s v 空间的 嵇,s ,v ) 篷计冀翅下嘲: 设m a x = m a x ( r ,岛b ) ,m i n = m i n ( r ,g ,b ) 当m a x _ m i n 时,定义r ,g ,b 为: f ;( m a x - f ) ,融a x m i n ) g t ( m a x 曲( m a x - r a i n ) l b 一( m a x i b ) ( m a x - m i n ) 贝h = 6 0 + h ,s ;( m a x - m i n ) m a x ,v 。m a x , 5 5 式( 3 - 1 ) 式( 3 - 2 ) 基于内容的图像检索技术的应用研究 h= ( 5 + b 。) ,= m a x 且g = m i n ( 1 一g 。) ,r = m a x 且gtm i n ( 1 + g ) ,g = m a x 且b m i n ( 3 一b ) ,g m a x 且b m i n ( 3 + g ) ,b ;m a x 且,tr a i n ( 5 一r + ) ,其他 当m a x = m i n ,即r = 6 = g 时,h = s 一0 , v = r 2 5 5 式中, r , g , b 【o ,2 5 5 】,h 【o 。,3 6 0 。】,s 【o ,1 】,v 【o j l 】 3 2 颜色直方图 式( 3 - 3 ) 最早采用颜色直方图检索方法的是s w a i n 和b a l l a r d ,其核心思想是在一定的 颜色空间中对图像各种颜色出现的频数进行统计【17 1 。目前,几乎所有的基于颜色 特征的检索算法都是以颜色直方图为基础的。颜色直方图描述了图像的统计分布 特征且具有平移、尺度和旋转不变性。 3 2 1 颜色直方图的建立 数字图像的每一种颜色组合有一个唯一的色度空间值,称为一个颜色频道 ( c o l o rc h a n n e l ) 。我们用颜色直方图( c o l o rh i s t o g r a m ) 表示一幅图像上所有象素的 色度空间值分布( 图3 3 ) 。设图像为i ,图像颜色由l 级颜色频道组成,其中第i 种颜色c ( f - 1 , 2 , 。,工) t 落入颜色频道c 的象素数量为h 。,则 a ( h 。,h :,- ,h 。) :这个向量组就是颜色直方图,它在图中表现为一条离散的曲 线。 缘尜致:i h 图3 3 颜色直方图 渐;企颤道分, 第三章基于颜色特征的幽像检索 根据上述原理,对每一个图像i ,可生成颜色直方图日( ,) ;h ( h l ,h 二,h t ) 乍为该嚣缘翁颜色耱援索弓| 。对于数据痒中豹麓个凝豫( 称海嚣标阕) ,哥j 扛残 直方圈阵列( 。,h :,。) ,作为目标圈的颜色索引库,用于匹配检索。 3 2 ,2 相 ;= i 蛙度量算法 1 基本方法: 最初号颈色直方图比较闼像相似性的方法是出s w a i n 秘b a l l a r d 在1 9 9 1 年提 出的庭方蚕捅差颜色索引,德称为l l m e i f i c 算法( l l 算子) ,其公式如下: d ( 1 ,显 * y | 一h 。l 式( 3 一; 扁 其中l 萃f l 至 分别表示检索图i 和强标图h 的,l 维特征向爨,i s 摹 1 h ;是灌入第k 个颜色频道的i 和h 中象素的个数,d ( t ,h ) 称为距离函数,0 s d ( x ,h ) s 2 n ,n 为像素数:当d ( t ,h ) - 0 时,l 和h 突全相同;当d 小于某个阙值时,可认为l 和 h 足够相 ;= l 。 用该方法生成颜色直方图_ 摹珏进行比较匹配的过程相对简单,但只窍在图像l 和 h 的颜色分钸完全一致时才能取得可靠匹配;对于颜色分布相近但又不完全相同 的情况就存在很大的模糊度。实际上,人的感官无法区分细微颜色差别,许多严 格说来不相同的圈往往被人们认为楚相同的躐差不多的。所以该方法的检索效率 较低。 2 。壹秀嚣麓交法 叔方图相交法又叫直方图交集法。在1 9 9 0 年,mjs w a i n 和b a l l a r d 的c o l o r i n d e x i n g 一文孛提出了蹇方圈摆交法测( h i s t o g r a mi n t e r s e c t i o n ) ,其公式表达如下: d 努。,h6 ) 一 三。m i n h 。( f ,) ,hs ( f ,k ) f j , 三。h - ( f ,七) 式( 3 -
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课件比例设置
- 螃蟹谜语导入课件
- 许愿荷花灯课件
- 体智能新人培训大纲
- 课件标题设置颜色的目的
- 快乐的派对课件
- 礼仪考试题及答案中职
- 2025年中国汽车雾灯灯具数据监测研究报告
- 客运中心考试题及答案
- 科学防疫考试题及答案
- 第10课《美丽的颜色》课件-2025-2026学年统编版语文八年级上册
- 第2课 第二次鸦片战争 课件 部编版2024八年级上册历史
- 艾梅乙信息安全管理制度
- 心包疾病患者的护理
- 高校援建人才管理办法
- 企业创新激励机制与绩效评价体系研究
- 《老年人能力评估实务》健康养老服务专业全套教学课件
- 橡胶环境损伤机理与寿命预测模型构建研究
- 腹腔镜子宫肌瘤护理查房
- 2025年卫生类事业单位招聘考试护理学专业知识外科护理试卷
- 个人养老金微课课件
评论
0/150
提交评论