网络信息的检索_第1页
网络信息的检索_第2页
网络信息的检索_第3页
网络信息的检索_第4页
网络信息的检索_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息的检索一、网络信息的特点 1.信息源数量庞大、增长迅速 2.信息内容丰富、多样,覆盖面广 3.传输速度快、共享程度高 4.交叉性强、分布广泛而不均匀 5.变化频繁、动态性强 6.信息使用成本低 7.信息质量良莠不齐二、搜索引擎 网络搜索引擎的历史最早可以追溯到 1991年,尽管搜索引擎发展时间并不长,但其观念却是深入人心的。 第 22次中国互联网发展状况统计报告 显示,在中国 2 . 5 3亿网民中,搜索引擎的使用率为 6 9.2 ,达 1 .7 5亿。目前为中国第五大网络应用技术。从数据中不难看出,网络搜索引擎所发挥的作用是非常大的。工作原理 搜索引擎是互联网上的分布式搜索系统,它在传统数据库检索技术基础上,增加了自动收集和更新数据库信息的功能,并采用人工智能方法对检索结果进行区分和排序。主要由信息采集器、查询表和检索接口三大模块组成。搜索引擎系统的分类1.机器人搜索引擎由一个称为蜘蛛 (Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器将用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。2.目录搜索引擎以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确,导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。严格意义上算不上真正的搜索引擎。Dmoz: open directory project:是世界上最大也是最好的网站分类目录主页3.元搜索引擎也称集成搜索引擎。是对搜索引擎进行搜索的搜索引擎。它可以没有自己的资源库和机器人,仅充当一个中间代理的角色,接受用户的查询请求,讲请求翻译成相应搜索引擎的查询语法。在向各个搜索引擎发送查询请求并获得反馈后,进行综合相关度排序,然后把整理后的查询结果发送给用户。Dogpile共收集了26个搜索引擎,包括 WEB检索、新闻组检索、FTP检索、新闻检索、股市检索、黄页检索、白页检索、地图检索、天气检索等。/弥补了用单一搜索引擎寻找到的内容不全面的缺憾。常用搜索引擎介绍1.百度 1999年底,百度成立于美国硅谷,2000年 1月创立于北京中关村,是目前全球最大的中文搜索引擎。百度的起名,来自于 “众里寻她千百度 ”的灵感,它寄托着百度公司对自身技术的信心,象征着百度对中文信息检索技术的执著追求 。百度除数据库的规模及部分特殊搜索功能外,其他方面可与当前的搜索引擎业界领军人物 Google相媲美,在中文搜索支持方面有些地方甚至超过了 Google,是目前国内技术水平最高的搜索引擎之一。 成为 “最受欢迎的中文搜索引擎 ”和 “全球最大的 中文搜索引擎 ”(百度自称),其数据库中存有 3亿页网页。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。百度主页百度国学和端午相关的诗词古代典籍对普洱的描述古诗 静夜思 2.Google www.G 成立于 1997年 9月,几年间迅速发展成为目前规模最大的搜索引擎,目前 Google每天处理的搜索请求已达 2亿次!而且这一数字还在不断增长。 Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从 10到 100条任选。提供网站内部查询和横向相关查询。 Google允许以多种语言进行搜索,在操作界面中提供多达

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论