




已阅读5页,还剩59页未读, 继续免费阅读
(教育技术学专业论文)基于形状的图形检索系统及其在教育中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于形状的图形检索系统及其在教育中的应用研究 摘要 图形是一类特定的图象,它的主体由外部轮廓线条及其内部区域构成,背景颜色 单一,形状是它的主要视觉特征。在教育领域,图形资源日益丰富且使用广泛,所以它 的有效检索就变得尤为重要。基于形状特征的图形检索系统是利用形状特征间的相似度 实现图形的检索。以为教育人员在教育图形检索方面提供便利为目的,研究了图形的形 状分析与检索技术,建立了应用于教育领域的基于形状的图形检索系统。 主要通过文献调查法与实验法,对图形的形状特征分析与基于形状的图形检索技 术进行了较为深入的研究。主要工作、成果与结论如下: ( 1 ) 总结了当前形状特征描述参数,实现了多种形状特征描述参数,有不变矩、 z e m i k e 矩、边缘方向直方图、矩形度、圆形度、偏心率、轮廓曲率直方图、内角直方 图与傅立叶描述子。 ( 2 ) 实现了基于形状的图形检索系统,由四个模块组成:特征索引数据库生成模 块、用户输入模块、系统检索模块与结果输出模块。用户通过查询界面提交查询目标图 形,系统对目标图形进行预处理、提取形状特征,同时从特征索引数据库中提取形状特 征,将两者进行相似性计算,按相似性的大小顺序排序过滤,结果显示给用户。 ( 3 ) 通过对m p e g 7s h a p eb 图库的试验,对多种形状参数进行了检索性能的比 较。实验证明z e m i k e 矩的检索效果最好,其次是边缘方向直方图与不变矩,而矩形度、 偏心率与圆形度检索效果极差。在此结论基础上,提出了效果更好的综合检索方法。 ( 4 ) 基于形状的图形检索系统在教育中的应用主要体现在教育图形库的建立与对 教育图形库的检索。建立了包含有6 0 0 0 多幅图形的教育图形库,内容包括教学用图、 动物、植物、用品、自然界等。教育图形库共分为1 6 5 类,每类从中挑选1 0 幅图形, 组成图形样本库。选择综合检索方法分别应用于图形样本库与教育图形库的检索,由于 图形类别和数量的大量增加,检索效果都随之下降。实验表明,单纯基于形状的图形检 索,在图形数1 0 0 0 幅左右的情况下,检索效果令人满意,适合于特定专题的检索。而 如果是大规模的图库检索,需要与其它特征结合。 论文使用v i s u a lc h6 0 开发工具,基于w i n d o w sx p 操作系统和m i c r o s o f ta c c e s s 2 0 0 3 数据库,开发了基于形状特征的图形检索系统,对多个图形库分别实验,取得了 比较令人满意的结果,并应用于教育图形的检索。另外,完善了数字图象分析与处理系 统的图形处理菜单和形状描述菜单下的部分功能,添加了多种形状特征参数的提取功 能。 研究表明,采用综合检索方法的基于形状的墨形检索系统,取得了比较好的检索 效果;基于形状的教育图形检索系统,丰富了教育图形资源,也为师生查询教育图形提 供了新的途径。对图形的形状分析与检索技术的研究还是初级的,希望有更多人来关注 技术在教育中的应用。 【关键字】形状;检索;图形;教育 【分类号】g 4 3 4 i l s t u d yo ft h es h a p e - b a s e dg r a p h i c sr e t r i e v a ls y s t e m a n di t sa p p l i c a t i o ni ne d u c a t i o n a b s t r a c t t h eg r a p h i c si sak i n d o fs p e c i a l l yi m a g e ,w h i c hm a i nb o d yi sc o m p o s e do ft h eo u t s i d e c o n t o u ra n dt h ei n s i d er e g i o n ,w i t ht h es i n g l eb a c k g r o u n dc o l o r ,a n ds h a p ei si t sm a j o rv i s u a l f e a t u r e i ne d u c a t i o n a lf i e l d ,t h eg r a p h i c sr e s o u r c e sa r er i c h e ra n dr i c h e ra n du s e de x t e n s i v e l y , s ot h ee f f e c t i v e l yr e t r i e v a lo fg r a p hb e c o m e se s p e c i a l l yi m p o r t a n t t h es h a p e - b a s e dg r a p h i c s r e t r i e v a ls y s t e mr e t r i e v e sg r a p h i c sb ys h a p ef e a t u r e ss i m i l a r i t y w i t ht h ep u r p o s eo fh e l p i n g t h ee d u c a t i o nw o r k e r si ng r a p h i c sr e t r i e v a l ,t h i st h e s i ss t u d i e dt h es h a p ea n a l y s i sa n dr e t r i e v a l t e c h n o l o g yo fg r a p h i c sa n db u i l t as h a p e b a s e dg r a p h i c sr e t r i e v a ls y s t e ma p p l i e di n e d u c a t i o n m a i n l yb yd o c u m e n ti n v e s t i g a t i o na n de x p e r i m e n t a t i o n , t h et h e s i sc a r r i e do u tad e e p e r r e s e a r c hi ns h a p ef e a t u r ea n a l y s i sa n ds h a p e - b a s e dg r a p h i c sr e t r i e v a lt e c h n o l o g y t h em a i n j o b s ,a c h i e v e m e n ta n dc o n c l u s i o na l ea sf o l l o w s : f i r s t l y , w es u m m a r i z e dd e s c r i p t i o np a r a m e t e r so fs h a p ef e a t u r ea n d r e a l i z e dm a n yk i n d s o fd e s c r i p t i o np a r a m e t e r so fs h a p ef e a t u r e ,i n c l u d i n gi n v a r i a n tm o m e n t s ,z e r n i k em o m e n t s , e d g e o r i e n t a t i o nh i s t o g r a m ,r e c t a n g u l a r i t y , c i r c u l a r i t y , e c c e n t r i c i t y ,c o n t o u rc u r v a t u r e h i s t o g r a m ,i n t e r i o ra n g l e sh i s t o g r a mf o u r i e rd e s c r i p t o r s s e c o n d l y , w er e a l i z e dt h es h a p e - b a s e dg r a p h i c sr e t r i e v a ls y s t e m ,w h i c hf o r m sb yf o u r m o d u l e s ,i n c l u d i n gt h em o d u l eo fg e n e r a t i n gf e a t u r ei n d e xd a t a b a s e ,t h em o d u l eo fi n p u t t i n g b yu s e r , t h em o d u l eo fs y s t e mr e t r i e v a l ,t h em o d u l eo fo u t p u t t i n g t h eu s e rs u b m i t st h eq u e r y g r a p h i c st h r o u g ht h eq u e r yi n t e r f a c e ,a n dt h e nt h es y s t e me x t r a c t si t ss h a p ef e a t u r ea f t e r p r o c e s s i n gt h eq u e r yg r a p h i c sa n ds h a p ef e a t u r ef r o mt h ef e a t u r ei n d e xd a t a b a s e ,c a l c u l a t i n g t h e i rs i m i l a r i t y t h es y s t e ms o r t sa n df i l t e r st h e mb ys i m i l a r i t y ,a n dt h e nt h er e s u l t sa r e s h o w e dt ot h eu s e r t h i r d l y , w ec o m p a r e dm a n ys h a p ef e a t u r ee f f e c ti nt h eg r a p h i c sr e t r i e v a lb yw a y o ft h e e x p e r i m e n to fm p e g 一7s h a p ebl i b r a r y z e r n i k em o m e n t sa r e t h eb e s ti nt h er e t r i e v a l p e r f o r m a n c e ,e d g eo r i e n t a t i o nh i s t o g r a ma n di n v a r i a n tm o m e n t sa r eb e t t e r ,r e c t a n g u l a r i t y , e c c e n t r i c i t ya n dc i r c u l a r i t ya r ev e r yb a d o nt h i sc o n c l u s i o nf o u n d a t i o n ,w ep r o p o s e dt h e i c o m p r e h e n s i v er e t r i e v a lm e t h o dw h i c hi sb e t t e rt h e na 1 1 f o u r t h l y ,s h a p e b a s e dg r a p h i c sr e t r i e v a ls y s t e m sa p p l i c a t i o ni nt h ee d u c a t i o ne m b o d i e d i nm a i n l yi nt h ee s t a b l i s h m e n ta n dr e t r i e v a lo ft h ee d u c a t i o n a lg r a p h i c sh b r a r y w eb u i l ta n e d u c a t i o n a lg r a p h i c sl i b r a r yw h i c hc o n t a i n sm o r et h a n6 0 0 0g r a p h i c s ,i n c l u d i n gt e a c h i n g p i c t u r e ,a n i m a l s ,p l a n t s ,s u p p l i e sa n dn a t u r a l ,c t c t h ee d u c a t i o n a lg r a p h i c sl i b r a r yc o n t a i n s 1 6 5c l a s s e s ,s e l e c t i n gt e np e rc l a s st of o r mt h e g r a p h i c ss a m p l el i b r a r y w eu s e dt h e c o m p r e h e n s i v er e t r i e v a lm e t h o dt or e t r i e v a lt h et w ol i b r a r i e s ,t h ee f f e c to fr e t r i e v a ld e c r e a s e d o w i n gt oal a r g en u m b e ro fi n c r e a s e so fg r a p h i c sc l a s sa n dq u a n t i t ya tt h es a m et i m e t h e e x p e r i m e n ti n d i c a t e st h a ts i m p l ys h a p e - b a s e dg r a p h i c sr e t r i e v a l se f f e c ti ss a t i s f i e du n d e rt h e c i r c u m s t a n c e so fa b o u t10 0 0g r a p h i c s ,s oi ti sf i tf o r t h er e t r i e v a li ns p e c i a ls u b j e c tr e t r i e v a l i fi ti st h el a r g e s c a l el i b r a r yr e t r i e v a l ,i tn e e d st oc o m b i n ew i t ho t h e rf e a t u r e u s i n gt h ep r o g r a md e v e l o p m e n tt o o lo fv i s u a lc + + 6 0 ,b a s e do nw i n d o w sx po sa n d m i c r o s o f ta c c e s s2 0 0 3d a t a b a s e ,w ed e v e l o p e dt h es h a p e b a s e dg r a p h i c sr e t r i e v a ls y s t e ma n d d i de x p e r i m e n to ns e v e r a l g r a p h i c sl i b r a r i e s ,w h i c hg o ts a t i s f i e dr e s u l ta n di m p l i e d i n e d u c a t i o n m o r e o v e r , w ep e r f e c t e ds o m ef u n c t i o n su n d e rt h em e n u so fg r a p h i c sp r o c e s s i n g a n ds h a p ed e s c r i p t i o ni nt h es y s t e mo fd i g i t a li m a g ea n a l y s i sa n d p r o c e s s i n g ,a n da d d e dm a n y f u n c t i o n so fe x t r a c t i n gs h a p ef e a t u r ep r o g r a m m e r t h er e s e a r c hi n d i c a t e st h a tt h es h a p e b a s e dg r a p h i c sr e t r i e v a ls y s t e mu s i n gt h e c o m p r e h e n s i v em e t h o dg a i n sg o o dr e t r i e v a le f f e c t ,a n di tr i c h e se d u c a t i o ng r a p h i c sr e s o u r c e s , p r o v i d i n gan e ww a yf o rt e a c h e r sa n ds t u d e n t st or e t r i e v a le d u c a t i o ng r a p h i c s t h er e s e a r c h o nt h es h a p ea n a l y s i sa n dr e t r i e v a lt e c h n o l o g yo fg r a p h i c si se l e m e n t a r y , b u tw eh o p em o r e a n dm o r ep e o p l ep a ya t t e n t i o nt ot e c h n o l o g ya p p l i c a t i o ni ne d u c a t i o n k e yw o r d s s h a p e ,g r a p h i c s ,r e t r i e v a l ,e d u c a t i o n c a t e g o r y g 4 3 4 i v 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得( 注:如没有其他需要特别声 明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 稍酋 导师签字: 学位论文版权使用授权书 密夏张 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权羔 撞一可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:赤即南 导师签字: 锄坼 签字日期:2 0 0g 年呼月2 r 日 签字日期:2 0 0 矿年p 月巧,日 山东师范大学硕士学位论文 第一章绪论 1 1 课题研究的背景和意义 2 0 世纪9 0 年代以来,随着计算机技术、多媒体技术和网络技术的发展,以及现代 教学理念变革,世界各国都在加快教育信息化的建设,其中教育多媒体资源的建设与利 用是教育信息化重要的基础内容。教育多媒体资源为师生提供教与学的材料,为开展自 主学习奠定了基础。 教育多媒体资源是各种教育资源的整合,它一般包括多媒体素材、课件、试题和网 络课程等。其中多媒体素材是教育多媒体资源最基本的元素,无论是制作课件、编制试 题还是建设网络课程,无不要用到多媒体素材,所以多媒体素材库建设与利用既是教育 多媒体资源建设与利用的基础也是工作的重点。多媒体素材可分为文本素材、图象素材、 音频素材、视频素材和动画素材等。其中图象素材以其生动的形象、易于理解的表现形 式,被广泛应用于教学及课件开发、软件制作中。所谓“一幅画胜过千言万语”这表 明了图象相对于文本的优越性,而且文本技术目前已经较成熟;音频素材无论在数量上 还是使用上,相对图象都要少,所以对图象的研究比文本或音频更有意义。视频和动画 归根结底是由一幅幅图象组成的,所以对图象的研究也为视频和动画的研究打下基础。 综上所述,图象在多媒体素材中研究意义非常大。 随着数码成象技术和数字处理软件的飞速发展,在包括教育行业在内的各个领域中 都产生了大量的数字图象,而对图象的使用更是越来越频繁。在这种情况下,如何对大 量的图象数据进行既快速又有效的检索成为研究者迫切需要解决的问题。 2 0 世纪7 0 年代以来,在数据库和图象处理技术的共同推动下,图象数据库检索技 术已逐渐成为一个非常活跃的研究领域。目前应用最多的图象检索技术是基于文本的图 象检索技术( t b i r ) 。基于文本的图象检索技术将图象作为数据库中存储的一个对象, 使用关键字或自由文本来对每幅图象的名称、尺寸、内容、作者等方面进行描述。然后 在这些文本标注基础上应用成熟的文本搜索算法,以输入关键词的形式查询图象,或者 是根据等级目录的形式浏览查找特定类目下的图象,从而为用户搜索预期的图象。关键 字或自由文本是通过分析图象文件名及文件路径、所在网页的标题、周围文本等外部信 息来获取的,并辅助以人工标注。由于已有的文本检索技术和网络搜索引擎技术已经比 较成熟,所以基于文本的图象检索技术实现较简单,检索结果比较准确,而且速度快。 基于以上的优点,基于文本的图象检索技术应用广泛,仅在互联网上就存在大量的基于 山东师范大学硕士学位论文 文本的图象搜索引擎,著名的如g o o g l e 、y a h o o 、b a i d u 和a l t a v i s t a 等。 但是,随着图象数据库规模的增大,基于文本的图象检索存在的缺点显露出来。首 先,人工对图象进行标注不仅费时费力而且因为人的主观性使得标准具有不确定性,表 现为对于同一幅图象,不同的人或同一个人在不同时间给出的标注可能不完全相同。其 次,从图象所在网页获取的图象文件名及文件路径、网页标题、周围文本等外部信息, 经常存在这些外部信息和图象内容不相符的情况,其准确性不能保证。再次,图象的某 些内容是难以或无法用文本描述清楚的,如图象的纹理,不规则物体的形状等。另外, 基于文本的图象检索系统不能接受按图象样例检索图象。并且,人们不仅要求能对图象 进行存储以及基于关键字的检索,还要求能对图象内容进行自动分析、描述和深层次的 检索。于是,基于内容的图象检索技术应运而生。 自二十世纪九十年代迅速发展起来的基于内容的图象检索( c b r ) 成为图象检索 领域的一个研究热点。区别于基于文本的图象检索系统中对图象进行人工标注或从网页 中提取相关外部信息的做法,基于内容的图象检索系统利用计算机对图象的内容进行自 动分析,获得必要的图象内容特征参数,建立索引数据库,然后按图例、相应的特征参 数或者语义来检索图象,这样可以避免人工标引的巨大劳动量和人为引起的主观偏差 【l 】。图象的内容包括底层的图象颜色、纹理、形状与姿态等视觉特征和高层语义特征。 基于形状特征的图象检索是基于内容的图象检索的一个重要方面,它主要是检测出 目标的轮廓线或分割出目标的轮廓,并针对轮廓进行形状特征的提取;或直接针对整个 图象寻找适当的形状特征,然后利用形状特征间的相似度经排序筛选后输出检索结果, 以实现图象的检索。形状特征比其他底层特征有着比较显著的优点。首先,形状是物体 的稳定特征,表现在许多物体具有不同的颜色和纹理,但其形状总是类似的,如不同品 种的狗,颜色有黑色、白色和棕色等,纹理有斑纹和乱纹等,但狗的形状大体是一样的。 其次,形状在认知上更接近人对图象内容的理解。再次,对于颜色和纹理特征不够丰富 的图象,基于形状的图象检索可以弥补基于颜色和纹理检索的不足。另外,形状既可以 与颜色、纹理等特征结合起来实现通用领域的图象检索,又可以针对专用领域实现对形 状特征比较明显的特殊图象库的检索。 目前专门针对教育图象的基于内容的图象检索系统产品还很少,因为图象分析、特 征提取和语义获取等关键技术还需要进一步研究,而且它又涉及到教育的特定要求。基 于内容的图象检索系统在教育中的一个典型应用是数字图书馆。美国“数字图书馆创始 2 山东师范大学硕士学位论文 研究项目 中,有许多内容是关于图象处理的【2 1 。如柏克莱加州大学数字图书馆计划中, 就有大量对加州水资源方面的照片和加州野花图片进行数字化处理并进行基于内容查 询的研究。随着教育信息化的发展,基于内容的图象检索无疑是教育图象资源检索的一 个趋势。 而教育领域中,有些图象形状特征既明显又是最主要的特征,这些图象适合于基于 形状的图象检索,如几何图形、展示图、标志、简笔画、漫画等。这类图象大都来源于 数码拍摄和图形图象处理软件制作,数量相当多。所以有必要针对这类教育图象,研究 建设基于形状特征的图象检索系统。我们把这类图象称之为图形,图形中的目标物体由 一条或多条封闭的边界曲线及其内部区域组成,背景颜色单一,背景和目标物体容易分 离。图形样例如图1 1 。研究图形的形状特征提取和教育图形资源的检索,要比研究一 般图象简单的多。首先,研究图形避免了对图象的分割,因为对形状的描述通常先分割 图象得到各目标区域,但分割技术目前还不成熟。其次,研究图形可只考虑其形状特征。 下文中对图象的分析均适用于图形,而对图形的分析不一定适用于一般图象。 图1 一l 图形样例 该课题通过对m p e g 7s h a p eb 库和自建图形样本库的实验,对形状特征的描述方 法和图形检索技术进行了研究。通过本课题的研究,比较了各形状特征的检索性能,提 出了综合检索方法,对他人研究形状特征在图象分类、识别和检索中的应用具有借鉴作 用。自建了包含6 0 0 0 多幅图形的教育图形库,它的建立大大地丰富了教育图形资源。 将基于形状的图形检索系统应用于对教育图形库的检索,可以极大地方便师生在教与学 中,根据形状的相似度来有效的查找图形。基于形状特征的图形检索系统,也为基于内 容的图象检索提供了基础,特别是为教育领域中的图象检索提供了基础。 1 2 研究现状及发展方向 1 2 1研究现状 近年来,国内外的一些院校和科研机构在基于内容的图象检索领域进行了大量的研 究,取得了一些成果并开发出了一些应用系统,但还有许多问题需要解决。基于内容的 山东师范大学硕士学位论文 图象检索在国外研究的比较早,其研究机构有美国加州大学、麻省理工学院和新加坡国 立大学等。我国对这方面的研究起步较国外晚,现在基本还处于研究层次,国内的研究 机构有清华大学、浙江大学和中科院等。目前基于内容的图象检索的研究内容主要包括 图象特征的提取、图象检索数据库的建立、图象特征的相似性度量、图象检索系统的性 能评价、图象检索系统的反馈以及图象检索网络化应用等。其中图象特征的提取和描述 是基于内容的图象检索的关键和基础。 图象特征包括底层视觉特征和高级语义特征。尽管图象的底层视觉特征不可能完全 描述图象的语义内容,但可以检索到一些视觉上相似图象。人们常采用一些稳定的且易 于机器抽取的底层特征来进行近似性内容描述,每种视觉特征都具有多种描述方式,每 种方式从不同的角度对视觉特征进行了可计算性描述。最常用到的视觉特征有颜色、纹 理和形状。 1 颜色 在图象的底层视觉特征中,颜色是最显著和最有区别性的特征; 对图象的颜色进行合理的分析与提取的基础是颜色模型的正确选择。目前存在多 种颜色模型,主要有:面向设备的颜色模型,如r g b 、c m y 等;面向视觉感知的颜色 模型,如h s v 、h i s 等;均匀的颜色模型,如c i el a b 等。不同的颜色模型在图象颜色 分析中需要相互转换【3 】。 颜色特征的描述方法主要有颜色直方图、颜色聚合矢量和主色调等【4 1 。颜色直方图, 【5 1 是最简单也是最常用的颜色特征,描述了图象颜色的统计分布特性。颜色一致性矢量 【6 】本质上是一种引入空间信息的改进的直方图算法,其核心思想是当图象中相似颜色的 象素所占据的连续区域的面积大于系统所给定的阀值时,该区域中的象素为聚合象素, 否则为不聚合象素,这样统计图象所包含的每种颜色的聚合象素和不聚合象素的比率称 为该图象的颜色聚合矢量。将颜色聚合矢量作为特征向量提取的检索方法比直方图的检 索精度要高。彩色图象的主色调反映了图象的大概颜色风格,一般只需少数几种颜色就 可以表示图象的颜色信息。 2 纹理 目前纹理还没有一种确切的定义,可以认为纹理是物体表面某种变化或分布规律的 表现,也很难用语言对人类所感知和识别的纹理进行描述。 常用的纹理分析方法有:统计分析方法、频谱分析方法和结构分析方法【7 1 。统计分 4 山东师范大学硕士学位论文 析方法利用图象的统计特性求出特征值,基于图象特征空间一致性进行分析。其中基于 统计的方法是应用最多的一种方法,主要包括灰度共生矩阵【8 】和t a m u r a 的视觉纹理描 述参数:粗糙度、对比度、方向性、线象性、规则性、毛糙度【9 】等。频谱法是利用图象 的g a b o r 变换【1 川或小波变换【l l l 等的系数来描述纹理图象的特征值。小波变换、g a b o r 滤波法适应了纹理本身的多尺度特性,是目前发展较快,应用较多的方法。结构分析方 法认为纹理是由许多纹理基元组成的某种重复性的分布规则,将图象中具有结构规律的 特征加以分析,识别纹理元,用纹理元的分布规律描述图象的纹理。 3 形状 与其它基本图象特征相比,物体的形状特征带有特定的语义信息,它是刻画物体的 本质特征之一,也是人类视觉系统进行物体识别与检索时所需要的关键信息之一。 对形状的描述可以从区域和边界两个互补的方面进行。区域形状描述子是使用了图 象中构成物体形状的所有象素信息来描述物体,区域形状描述子不仅可以用来刻画个别 独立的连通区域,也包括一些不连通区域所构成的复杂图形。边界是指将物体包含在内 的二维封闭曲线。基于区域的形状特征描述方法典型的有不变矩、z e r n i k e 矩、傅立叶 变换、边缘直方图、小波描述子、几何参数等。基于边界的形状特征描述方法典型的有 边界曲率、傅立叶描述子和逼近多边形的参数等。形状特征参数要能充分反映目标物的 形状,或者能有效区分目标物之间的形状差异,并且能方便、快速的获取。好的形状特 征应当具有平移、尺度、旋转变化不变性。 基于形状特征的图象检索,无论是在通用领域还是在专业领域,都有着非常广泛 的应用。通用领域,主要是形状结合颜色、纹理等图象特征的综合查询。具有代表性的 图象检索系统是m 公司开发研制的q b i c ( q u e r y b y i m a g ec o n t e n t ) 2 1 ,其中使用的形 状特征有形状面积、圆形度、偏心度、主轴偏向和一组代数矩不变量,还有由u c b e r k e l e y 开发的b l o b w o r l d 等。专业领域,主要是对商标、服装设计图、医学图象、 指纹图象等形状特征明显的图象进行检索。将基于形状特征的图象检索系统应用于教育 领域的研究,在国内研究较少。 1 2 2发展方向 基于内容的图象检索,研究方向是综合特征的利用以及不同检索方式的结合。单个 视觉特征,往往只适用于特定领域的图象检索,为了增强在通用领域特征的检索识别能 力,往往将以上多种特征加以互补组合,以形成新的更加全面的描述性特征向量。例如 山东师范大学硕士学位论文 q b i c 图象检索系统,它在用户输入图象、筒图或影象片段时,q b i c 对输入的查询图 象进行颜色、纹理、形状等特征的分析和抽取,然后根据用户选择的查询方式分别进行 不嗣的处理。q b i c 中的颜色特征是由直方图表示的;纹理特征根据t a m a r a 提出的纹 理表示方法进行了改进,结合了粗糙度、对比度和方向性这几种方法。单凭视觉内容的 本身无法完全解决图象检索问题,c b i r 必须与其它检索方法( 如文本检索) 相结合。 基于形状特征的图象检索是基于内容检索巾的难点,因为很难准确的对图象的形 状特征进行描述,这使得它成为一个极具挑战性的研究课题。基于形状特征的图象检索 目前还很不成熟,如何找到更有效的形状特征描述方法,提高形状识别和检索的有效性, 成为基于形状的图象检索研究的热点。在研究教育图象检索中,将更多地研究如何把图 象的形状等内容特征和网页中的外部文本信息相结合,真正提高凰象检索的有效性上。 1 3 论文的主要内容 本论文主要建立基础教育图形资源痒,提取图形的形状特征,建立基予形状的图形 检索系统,从而提供检索基础教育图形资源的新途径,并提高检索的准确率。 论文的具体章节安摊如- g : 第一章:绪论。介绍了论文的选题背景和课题研究对教育的意义,以及基于内容的 图象检索的研究状况帮发展方向,并概括了论文的主要内容。 第二章:图形预处理。阐述了在提取图形的形状特征前对图形进行的二值化、消除 嗓声、形态学运算和填充等处理。 第三章:图象形状的特征描述。归纳和总结了图象的形状特征的描述参数,包括: 不变矩、z e m i k e 矩、边缘方商蛊方图、矩形度、匿形度、偏心率、轮癣盐率直方图、 内角直方图和傅立叶描述子等。 第四章:基于形状的匿形检索系统的实现。设计了图形检索系统,由四个模块组成: 特征索引数据库生成模块、用户输入模块、系统检索模块和结果输出模块。通过对 m p e g 一7s h a p eb 的测试,证明z e r n i k e 矩的检索效果最好,其次是边缘方向和不变矩, 提出了效果更好的综合检索方法。 第五章:基于形状的图形检索在教育中的应用研究。建立含有1 6 5 种类别共计6 0 0 0 多幅图形的教育图形库,并在每类中挑选出l o 幅组成图形样本库,将综合检索方法应 用于教育图形的检索。单纯基子形状的图形检索,在图形数1 0 0 0 幅左右的情况下,检 索效果令人满意,适合于特定专题的检索,随着图形数大量增加,检索效果随之下降, 6 山东师范大学硕士学位论文 需要和文本信息等特征结合,才能进行大规模的图库检索。 第六章:总结与展望。对全文的工作做了总结,提出下一步的工作思路。 7 山东师范大学硕士学位论文 第二章图形的预处理 在提取图形的形状特征之前,需要先对图形进行一些处理,称之为图形的预处理, 包括对图形进行二值化、消除噪声、形态学运算和填充等。图形预处理是必不可少的最 基本的前期处理,这一部分处理的结果直接影响后续形状特征的提取质量及检索效果。 2 1 二值化 图形形状特征的提取往往都是在黑白二值图形的基础上进行的,所以首先要对图形 或图象进行二值化处理。通常二值化的方法是设定某一阈值l 用r 将图象的数据分为 两部分,一部分置白( 2 5 5 ) ,另一部分置黑( o ) ,此方法被称为固定阈值法。此外,二 值化的方法还有简单的非零元素取一法和稍微复杂些的双固定阈值法。双固定阈值法是 预先设置了两个阈值刀和刀( 丌 ,2 ) 个值的颜色范围视为背景颜色,将此范围内的点置 2 5 5 即白色,否则为0 即黑色,对应双固定阈值法中7 1 = c - n ,t 2 = c + n 。第m 行m 列点 容易受噪声影响,可在边框m 个象素宽度内求灰度均值作为c 。如果二值化后面积为o , 说明背景颜色范围过大,即万取值过大,重新读入图形进行二值化,这次n 取值设定为 2 。我们取m = 5 ,n = 3 2 ,对挑选的1 0 0 0 幅图象进行二值化,采用第m 行m 列点的方式, 达到理想效果的占9 0 2 ;采用边框m 宽度内均值的方式,达到理想效果的占9 4 6 。 我们将此方法命名为边框二值化法,此方法的优点是简单有效,但只适用于背景颜 色较单一或者说背景颜色相近的情况,其中大多数绘画类图形都符合这种情况。对于目 标物体的轮廓处颜色自然过渡到背景色的那些图形,二值化后轮廓处容易出现模糊和杂 点,需要通过后续的形态学运算来平滑轮廓,其中部分拍摄类图形由于光照的阴影,还 有部分绘画类图形为了追求某些效果,都属于此种情况。二值化后的图形中难免存在噪 山东师范大学硕士学位论文 声,还需要经过后续的噪声消除来解决。 二值化前的原图和二值化后的图形样例见图2 1 ,( a 2 ) 、( b 2 ) 和( c 2 ) 分别是( a 1 ) 、 ( b 1 ) 和( c 1 ) 二值化后的图形。( a 1 ) 是绘制类图形,轮廓清晰,二值化效果理想;( b 1 ) 也是绘制类图形,轮廓模糊且含有噪声,二值化后轮廓处杂乱,效果不理想:( e 1 ) 是拍 摄类图形虽轮廓处有少量醋影,二值他螽鬻影消除,僵也损失了轮瘁部分缨节,效果基 本可以。对国2 ) ,需要进行后续的除噪和平滑处理。 ( b 1 )( c 1 ) 、(a2)q 2 )( c 2 ) 图2 1 二值化样例图 2 2 消除噪声 二值化后的图形中存在的噪声会影响到形状特征的提取,需要消除它。中值滤波器 是消除噪声的常用方法,它是一种非线性平滑滤波器。它的算法如下: ( 1 ) 将模板在图中漫游,并将模板中心与图中某个象素位置重合。 ( 2 ) 读取模板下各对应象素的亮度值。 ( 3 ) 将这些亮度值从小到大排成l 到。 ( 4 ) 找出这些值里排在中阆的1 个。 ( 5 ) 将这个中间值赋给对应模板中心位置的象素。 9 山东师范大学硕士学位论文 对于黑8 - 值图形,( 3 ) 到( 5 ) 可改为计算模版下对应黑白点的个数,较多者的 值赋给对应模板中心位置的象素。 中值滤波器在消除孤立的极小面积的噪声的同时,却更改了图形边缘的细节,一些 边缘点被消除,同时增加了一些边缘点。模版越大,可消除的孤立噪声面积越大,但对 边缘的修改也越大,所以中值滤波器通常不用于孤立噪声面积较大的情况,只采用3 x 3 或5 x 5 的模版用于小面积噪声的消除。 我们首先计算图形中目标对象数及各对象面积,当对象面积小于阈值时,此对象视 为噪声,赋以背景值予以消除,我们称这种方法为阈值去噪。其中阈值是动态设定的, 我们将阈值定为目标对象最大面积的a = d j ) 倍。 计算图形中目标对象数的原理是首先对图象进行水平扫描,当找到一个物体区域对 象时,将其赋予一个标号,继续寻找下一个物体区域对象。在扫描完毕后,根据区域的 连通性将相连区域的相同标号归并,这样图象中的每一个物体对象都将具有一个唯一的 标号,物体对象就被区分开来了。 阈值去噪和中值滤波( 3 x 3 的模版) 的对比结果如图2 2 所示,其中( a ) 即图2 1 中 ( b 2 ) 。可见,阈值去噪后原图形中孤立的小面积区域视为噪声被消除,图形中主要对 象的边缘信息没有改变,边缘可能存在的毛刺、杂点等依然保留,需要后续处理。在噪 声达到一定面积的情况下,阈值去噪法比中值滤波器要好,中值滤波还可能导致边缘处 区域断开。另外,阈值去噪的同时,也可以继续将最大面积的对象或各个对象分离出来, 分别进行特征提取。 , l o ( a ) 原图形( b ) 阈值去噪后的图形( c ) 中值滤波后的图形 图2 2 阈值去噪和中值滤波对比样例图 2 3 形态学运算 数学形态学( m a t h e m a t i c a lm o r p h o l o g y ) 是分析几何形状和结构的数学方法,1 9 8 5 山东师范大学硕士学位论文 年后,它逐渐成为一种应用于图象处理和模式识别领域的新的方法【1 7 】。形态学运算就 是针对二值图象,依据数学形态学集合论方法发展起来的图象处理方法。通常形态学图 象处理表现为一种邻域运算形式,采用邻域结构元素的方法,在每个象素位置上邻域结 构元素与二值图象对应的区域进行特定的逻辑运算,逻辑运算的结果为输出图象的相应 象素【1 引。其基本思想就是用具有一定形态的结构元素去度量和提取图象中的对应形状 以达到对图象分析和识别的目的。 数学形态学的基本运算常见的有:膨胀、腐蚀、开启、闭合、击中、细化和粗化, 用这些运算及其组合可以进行图象形状和结构的分析和处理。数学形态学算法易于实 现,处理速度快。在这里,我们应用数学形态学来对去噪后的二值化图形做一些后续处 理,改善图形质量。 。1 腐蚀 图2 - 3 结构元素的三种位置 对于一个给定的目标图象x 和一个结构元素s ,将s 在图象x 上移动,在每个当 前位置x ,s + x 只有三种可能状态,如图2 3 所示: ( 1 ) s + xsx ; ( 2 ) s + x x ; ( 3 ) s + xnx 与s + xn 牙均不为空。 他们分别对应s + x 与x 相关很大、不相关和部分相关三种情况。满足( 1 ) 式的 点x 的全体构成结构元素与图象的最大相关点集,这个点集称s 对x 的腐蚀,记为 x s 。 腐蚀也可以用集合的方式定义,即 x o s = xs + xc _ x ) ( 2 1 ) 山东师范大学硕士学位论文 2 膨胀 腐蚀可以看作是将图象x 中每个与结构壳素s 全等的子集s + x 收缩成点x 。与之 相反,膨胀是将z 中每个点x 扩大为s + x ,记为xos 。 角集合表示定义为 xo s = x ls + x f ix 茹g )( 2 。2 ) 从上面豹说萌可以看出,腐蚀可以消除图象中小的噪声区域,膨胀可以填补物体 中的空洞。但是膨胀和腐蚀并不互为逆运算,因此它们可以级联结合使用,由两个运算 的复合与集合操作组合可以构造出形态学运算族。 3 开运算 s 对x 徽开运算,即s 对x 先腐蚀后膨胀,记为x 。s ,定义为 x 。s = ( x s ) os( 2 3 ) 4 闭运算 s 对x 做闭运算,基曩s 对x 先膨胀后腐蚀,记为x s ,定义为 x s ;( x0s ) 0s ( 2 4 ) 开、阔运算是形态学运算族中两个最为重要的组合运算。开和闭运算都可以去除 比结构元素小的特定图象的细节,并保证不产生图象全局的几何失真。开运算作用有将 比结构元素小抟突褰l 滤
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华为编程考试题及答案
- 护士换水考试题及答案
- 护航中考试题及答案
- 高级电工技师考试题库及答案
- 前端面试题及答案
- 幼儿考编试题及答案
- 言语试题及答案
- 饮食文化试题及答案
- 心理学试题库及答案
- 海蒂考试题及答案
- 手术室护士自我简介
- 地下管线保护和加固措施
- 广告公司分支机构合同
- 2024年新课标培训2022年小学英语新课标学习培训课件
- 2024年北京第二次高中学业水平合格考地理试卷真题(含答案详解)
- 计算机网络与信息安全(2024年版)课件全套 李全龙 第01-10章 计算机网络与信息安全概述- 网络安全协议与技术措施
- 创建二级甲等医院实施方案
- 跨学科实践活动2 制作模型并展示科学家探索物质组成与结构的历程-九年级化学上册同步高效课堂(人教版2024)
- 广东版-开心学英语六年级下册教案
- 中班科学课件《神奇的磁铁》
- 山西省太原市万柏林区多校2023-2024学年二年级下学期期末语文试卷
评论
0/150
提交评论