网络搜索论文.doc_第1页
网络搜索论文.doc_第2页
网络搜索论文.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络搜索引擎的现状及发展研究年级:08级 专业:软件专业 姓名:钟少天 摘要:目前的搜索引擎可实现信息发现、信息处理、个性搜索、知识挖掘、协同整合等。但在搜索效率、检索方式、多媒体内容检索、自然语言的理解、个性化服务等方面仍显不足。今后,将在检索结果深加工、个性化服务、基于内容的多媒体信息检索及搜索引擎智能化等方面进行研究。关键词:网络;搜索引擎;信息检索;个性化服务1、引言:网络搜索引擎在网络信息资源查找中起到了重要的作用, 它可以帮助人们从浩如烟海的网络信息中找出自己想要的信息。网络搜索引擎一般由信息收集软件、索引数据库和查询接口三部分组成。信息收集软件从一个已知的文档集中读取信息, 并检查这些文档的链接指针,找出新的信息空间, 然后, 取回这些新空间中的文档, 将它们加入到索引数据库。查询接口通过索引数据库为用户的查询请求提供服务。但现有的搜索引擎在信息维护、信息重复、网络及站点负载方面还存在很多的不足, 索引数据库往往很大, 检索的查准率不高。2搜索引擎的概念简述搜索引擎( Search Engines) 是指在WWW 中能够主动搜索信息、组织信息并能提供查询服务的一种信息服务系统。搜索引擎主要通过网络搜索软件或网站登录方式将WWW 上大量网站的页面信息收集到本地, 经过加工处理后建成数据库, 从而能够对用户提出的各种查询请求作出响应, 提供用户所需要的信息地址。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务, 因此搜索引擎也被称为“网络门户” 。3搜索引擎的现状分析现代意义上的搜索引擎鼻祖是1990 年由蒙特利尔的麦吉尔大学学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie。随着Ieternet 的快速发展, 出现了专门用于检索信息的Robot 程序, 该程序能自动地不断重复地在网络上检索信息, 这种行为很像一只蜘蛛在Ieternet 上爬来爬去, 所以又称为Spider 程序。1994 年7 月, 世界上出现了最早的真正意义上的搜索引擎! ! ! Lycos。同年4 月, 美国斯坦福大学的两位博士生DavidFilo 和美籍华人杨致远共同创建了Yahoo! , 并成功地使搜索引擎的概念深入人心, 从此搜索引擎进入了快速发展的时期。自1998 年开始, 出现了一个搜索引擎空前繁荣的时期。随着Google 的出现, 第二代搜索引擎诞生。它们不仅拓展了搜索引擎的生存空间, 而且还极大的提高了搜索的质量和效率。经过多年的探索和市场 历练 之后, 全球第三代搜索引擎呈现出两个发展方向: 一个是以Google 为主的 技术驱动型 理念; 一个是以Jwmguagua( 精武门呱呱为主的 服务驱动型 理念。第三代搜索引擎是智能搜索引擎, 呈现出多元化、智能化、个性化的发展趋向4搜索引擎存在的问题(1) 逻辑运算符现有的搜索引擎提供的提问函数是相当有限的, 大多数的搜索引擎只提供关键词间最基本的布尔连接。例如Yahoo 只提供AND 和OR 运算, 并且一旦选用了一个逻辑运算符, 它必须应用于所有的关键词。Open Tex t Index 允许用户用不同的布尔运算符, 但仅允许4 个运算符且必须按出现次序运算。像SQL 语言那样复杂的查询语言在现有的搜索引擎中还不能应用。(2) 仅使用关键词提问现有的搜索引擎仅允许用一组关键词及逻辑运算符组成提问。但关键词检索不能完全满足用户的要求, 而且它是一种盲目的匹配。而自然语言理解又是非常困难的任务, 现在仍在研究之中。(3) 不能用检索历史信息用户的每次检索都是从头开始的检索, 不能从原有的查询结果中作进一步的提炼。(4) 简单的结果表示方法大多数的搜索引擎都只返回一张长长的检索结果表, 一般有几页。该表中可能包含成千上万个指向WEB 站点的连接指针。用户可能只选择一小部分, 而放弃其余部分。因为用户不可能有这么好的耐心。结果是他们可能丢失了很多有用的信息。(5) 单个引擎的限制由于现在WEB 上的信息量变得越来越大, 单个的搜索引擎不可能包括整个网络的轨迹。索引机器人的能力, 索引数据库的大小, 系统维护开销等, 都限制了一个搜索引擎的能力。因此, 用户必须尝试用所有搜索引擎去找出他所要的信息。最坏的是每个引擎互相覆盖, 用户会重复发现一条信息。现在已出现了一些解决方法, 如元搜索引擎和分布式搜索引擎。另外, 据文献 1 报道, 主要的商业性的搜索引擎每分钟要收到15 2 万个提问, 这对索引服务器也是一种很大的压力。5搜索引擎未来发展的建议(1) 向智能化方向发展智能化是网络信息检索未来的主要发展方向。随着网络用户对检索精确度和效率的不断提高, 越来越多的搜索引擎重视自身在检索功能和检索服务上的智能化程度, 将涌现出智能搜索引擎。智能搜索引擎可以通过自然语言与用户交互, 最大限度地了解用户的需求, 它能为用户提供了一个真正智能化的、个性化的信息过滤和推送服务。因此,智能搜索引擎成为今后搜索引擎的发展趋势。(2) 向个性化、特色化方向发展个性化是指各网络检索工具注重内容的特色化和服务的个性化。个性化的核心是跟踪与分析用户的搜索行为,充分利用这些信息来提高用户的检索效率, 并为用户提供全程帮助和服务, 使得个性化搜索更符合每个用户的需求。搜索引擎的个性化还体现在提供特色的服务和功能。(3) 向多媒体化方向发展未来的搜索引擎将在技术上更加成熟, 在搜索内容上向多媒体化发展。视频、音频等多媒体信息的检索数据量高速增长, 多媒体搜索引擎的发展迫在眉睫。同时, 搜索引擎在向用户提供检索结果时仍可以向多媒体方向发展, 使得检索结果形式多样化、生动化, 更好地满足用户的需求。向多媒体化方向发展是搜索引擎发展的又一个新趋势。(4) 向功能多样化方向发展首先表现在可以检索的信息形态多样化, 如文本、声音、图像、动画; 其次表现在搜索引擎已不仅仅是单纯的检索工具, 正在向其他服务范畴扩展, 提供站点评论、天气预报、新闻报道、股票点评、各种黄页( 如电话号码、航班和列车时刻表、地图等) 、免费电子信箱, 以多种形式满足读者的需要。(5) 向商业化方向发展随着互联网上信息服务和电子商务的发展, 用户基数的不断增长, 为电子信息的增值服务提供了广阔的空间。在这里汇集了最新的思想、最先进的技术和最大的潜在市场。搜索引擎已经不仅仅是一门技术, 一门服务形态, 而且成为一项产业, 它的商业利益成为推动系统完善和扩展的主要动力, 网络信息的检索与利用由公用性转向商业化。( 6 ) 向专业化方向发展由于用户千差万别, 对信息搜索往往有不同的要求。综合性的搜索引擎收录的范围太广、太大、无法满足某一特定的需求。而垂直性专业搜索引擎则可解决这一难题。垂直性专业搜索引擎只面向某一特定的领域, 专注于自己的特长和核心技术, 能保证对该领域的信息的收录齐全与更新迅速。(7 )向可视化方向发展可视化信息检索是把文献信息、用户提问、各类检索模型以及利用检索模型进行信息检索的过程, 展示在一个可视化空间中, 并向用户提供信息检索服务。可视化搜索避免繁琐的操作过程, 使用户更直接、方便、快速、高效地获取信息和知识。随着网络技术的不断发展, 以及XML、RDF、GRID 在信息中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论