警告本文档只供参考不得使用以免影响学业_第1页
警告本文档只供参考不得使用以免影响学业_第2页
警告本文档只供参考不得使用以免影响学业_第3页
警告本文档只供参考不得使用以免影响学业_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、无忧毕设网: 联系QQ:375279829警告:本文档只供参考不得使用以免影响学业附件4:本科生毕业论文(设计)文献综述论文题目: Web中图像的检索技术研究 . 学生姓名: 童宏梁 年级(学号): 9906528 .二级学院: 信息工程学院 专业: 电子信息工程 .指导教师: 张 量 职称: 副教授 . 填表日期: 2004 年 2 月 25 日杭 州 师 范 学 院 教 务 处 制一、查阅中外文献资料目录,所查阅的中外文献资料不得少于5篇(含作者、书名或论文题目、出版社或刊名、出版年月或期号及页码等,未经本人查阅的文献资料目录不得列上)(1) 张量,詹国华,袁贞明, 基于Web的图像搜索,

2、计算机工程,2002.5(2) 朱学芳, 多媒体信息处理与检索技术M,电子工业出版社,2003(3) 陈滢 ,徐宏炳 ,王能斌,协作式Web资源发现系统模型,计算机学报,1998.4 (4) 阳小华, 周龙骧,World Wide Web 的索引与查询技术,计算机科学 ,1997 (5) 吴立德等,大规模中文文本处理,复旦大学出版社,1997(6) 李唐, 解读网络图像搜索引擎,Internet网络,2001(7) 陈立娜,Internet上的图像检索技术,天极yesky,2001.5(8) 黄博士,网络环境下的图像检索技术,中国计算机用户,2003.12.30(9) Dunlop M.D.

3、(1991). Multimedia Information Retrieval,Ph.D. Thesis. Computing Science Department, University of Glasgow, Report 199l/R21.(10) Ellen M. Voorhees and Yuan-Wang Hou, "Vector Expansion in a Large Collection”, First Text REtrieval Conference (TREC-1), 1993.(11) Frisse M.E, (1988). Searching for i

4、nformation in a hypertext medical handbook. Communications of the ACM, 3 I(7), pp.880-886.(12) R.Price, T.S Chua, and S.Al-Hawamdeh, Applying relevance feedback on a photo archival system. Journal of Information Science, 18:203-215, 1992(13) W.Niblack, R.Barber, and W.Equitz. the qbib project:queryi

5、ng images by content using color, texture, and shape. Technical report, IBM RJ 9203(81511), Feb, 1993(14) Shih-Fu Chang, William Chen, and Hari Sundaram,Semantic Visual Template - Linking Visual Fetures to Semantics. IEEE Intern Conference on Image Processing, Chicago IL, Oct 1998(15) A.E. Cawkell,

6、Imaging systems and picture collection management: a review. Information Service & Use, 12:301-325, 1992(16) T.S. Chua and W.C. Low, and Ch.X. Chu, relevance feedback techniques for color-based image retrieval. In Proceeding of Multimedia Modelling98, IEEE Computer Society, Oct, 1998.二、文献综述(含本选题

7、国内外研究现状、研究主要成果、发展趋势、存在问题等内容,字数不少于3000字,力求内容切题,具综合归纳性)研究现状:随着网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,特别是图像信息,己经成为表示网页内容不可缺少的组成部分。因此人们对多媒体信息的检索需求也就随之随之变得特别迫切。但由于图像检索系统涉及了多学科的知识,实现和应用的难度相当高,所以已有的图像检索系统都有这样或那样的缺陷。 而传统的信息检索主要集中于文字的检索,在多媒体方面的研究并不是很多。互联网上的多媒体以图像为主,因此图像的检索就成为了目前研究的热点。 图像检索经历了两个阶段:第一阶段是以文本为基础

8、的检索。第二阶段是以图像自身的内容为基础的检索。上个世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术利用文本描述的方式描述图像的特征。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索技术。而无论是什么引擎,它首先都必须遵循以下几个要点:(1)索引文档的容量:现在最大的搜索引擎可能包含了超过100,000,000个链接,但这也只是整个Web网上的一小部分。因为收集资料的Robot,只能从“已知”的链接开始收集网页资料,而只有一小部分Web网页和这些“已知”的网页有连接;现在还没有一个搜索引擎能够随网

9、页内容的更新比较及时地更新索引;(2)覆盖面:地理覆盖面和主题覆盖面;(3)索引更新频率:不同的搜索引擎,索引更新频率相差很大,有的是几周,有的是一年。索引更新频率有两种定义,一种比较少用的定义是新的网页能被收录进索引数据库中,另一种是同一页多少时间才被检查一次,有必要时更新索引。有的搜索引擎会对经常更新的网页和多人访问的网页进行更频繁的重建索引工作;(4)采集过程:采集过程有宽度优先、深度优先两种算法;一般认为宽度优先对扩大内容的覆盖面有利,深度优先算法有助于提供更多的细节资料;(5)索引算法:有的搜索引擎只处理元标记和一小部分文档内容,而有一些搜索引擎则是对全文进行索引;(6)结果显示:有

10、的搜索引擎只显示网页的标题,有些则有更详细的一些信息,比如网页的内容,更新日期等;(7)查询算法:一个优秀的查询算法是很重要的,最基本的布尔查询,短语查询,有的搜索引擎还提供指定属性的查询,比如可以指定对网页的作者、主题进行查询。另外有的搜索引擎还采用了相关度反馈、概念查询等算法;(8)用户界面:很多搜索引擎都提供了简单查询和高级查询两个界面。并且提供了必要的帮助和范例。在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面

11、是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。为了进一步提高检索的准确性,许多系统结合相关反馈技术来收集用户对检索结果的反馈信息,这在CBIR中显得更为突出,因为CBIR实现的是逐步求精的图像检索过程,在同一次检索过程中需要不断地与用户进行交互。基于文本和基于内容是图像检索发展的两个分支,不过从目前图像检索研究的趋势而言,尤其结合网络环境下图像的特征嵌入在具有文本内容的Web文档中,出现了三个不同的研究着眼点。立足于文本,对图像进行检索。试图将传统的文本检索技术移植于对多媒体信息的检索上,因为基于文本的检索技术发展已经成熟

12、。如Page-Rank方法、概率方法、位置方法、摘要方法、分类或聚类方法、词性标注法等,不仅技术发展较为成熟,同时分析和实现的难度略小。但是因为受控词汇本身的局限,易歧义,更新慢,所以不太容易应对网络上日新月异的各类图像。立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。结合文本和内容,进行融合性研究。发挥各自的优势促进图像的高效、简单检索方式的实现,尤其是网络环境

13、下,结合图像所在Web文档的特征分析,推断图像的特征,同时结合对图像的内容分析,共同标引达到对图像的分析和检索。可以说,三个方向都是相互影响和促进的,任何一个方向的进展都会促进图像检索技术向前更进一步。发展趋势:由于传统的搜索引擎在设计方面存在局限性(集中式的体系机构,通过网络爬行器收集信息),因此他们无法提供高准确度、搜索实时更新的数据库的服务。因此,开发一个新的搜索框架,支持“点对点”,按照层次进行分布式搜索成为今后搜索引擎发展的趋势。这种新的搜索框架包含了对个人文档、局域网以及互联网三个层次的搜索。当搜索局域网或者是互联网的时候,搜索将以分布方式执行。同时,系统将能够自动地把用户的查询分

14、发给相似的用户或者是互联网上最为合适的搜索引擎,以获得更好的结果。 基于内容编码技术的研究,目前,国际上还没有通用的基于内容的编码标准。20世纪90年代初,国际上就开始了对基于内容的图像信息检索方面的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,大量原型系统已经推出,其中,部分已投入到实际应用中以检验其有效性。同时,MPEG-7标准作为基于内容的多媒体编码标准也正在制定当中,即将成为国际标准中的一员。因此,应尽快对MPEG-7标准进行研究,分析其编码的实质,在此基础上进一步研究基于内容检索的系统,使我国基于内容的图像检索尽快走向实际应用阶段。对用户查询接口的研究,这涉及到用户对图像内

15、容的感知表达、交互方式的设计、用户如何形成并提交查询等方面。现代多媒体信息系统的一个重要特征就是信息获取过程的可交互性,人在系统中是主动的。除了提供示例和描绘查询基本接口之外,用户的查询接口应提供丰富的交互能力,使用户在主动的交互过程中表达对图像语义的感知,调整查询参数及其组合,最终获得满意的查询结果。用户的查询接口应该是直观易用的,底层的特征选择对用户是透明的。这里涉及到如何把用户的查询表达转换为可以执行检索的特征矢量,如何从交互过程中获取用户的内容感知,以便选择合适的检索特征等问题。一个优秀的搜索引擎必须处理以下几个问题:(1)网页的分类(2)自然语言的处理(3)搜索策略的调度和协作 (4)面向特定用户的搜索。因此,现在有很多的网络检索工具,也就是说搜索引擎采用了智能的检索手段来增强它的检索能力,而图片检索正是其中的一大块内容。随着网上多媒体的广泛应用,对图像的检索需求将会越来越迫切。未来的图像检索技术将是网络技术和基于内容的图像库检索技术的结合。随着多媒体信息处理技术的日益发展和深化,图像信息的加工、处理和检索标准的出台,网上的图像检索技术将会日趋完善,而图像搜索引擎也将成为Internet上的新宠。网络检索新技术还有:层级式导航浏览器、自动辅助编程、信息过滤器、主题检索、三维世界的进入及其检索、智能检索代理等等。存在的问题:由于搜索引擎技术的开发牵涉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论