大型综合性搜索引擎介绍.ppt_第1页
大型综合性搜索引擎介绍.ppt_第2页
大型综合性搜索引擎介绍.ppt_第3页
大型综合性搜索引擎介绍.ppt_第4页
大型综合性搜索引擎介绍.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章网络信息检索,第一节网络信息检索工具与方法第二节搜索引擎及其检索,第一节网络信息检索工具与方法,一、网络信息检索的特点二、网络信息检索工具三、网络信息检索的方法,一、网络信息检索的特点,1、存取范围覆盖Internet上所有资源2、传统检索方法与全新检索技术相结合3、用户界面友好且操作方便4、具备良好的导航和编辑功能5、用户透明度,二、网络信息检索工具,网络信息检索工具按照不同标准可以划分不同类型:1、按照网络信息资源类型划分:WWW检索工具、非WWW检索工具2、按照检索机制划分:关键词检索工具、分类目录检索工具、混合型检索工具3、按照包含检索工具数量划分:单一型检索工具、多元型检索工具4、按照检索内容划分:综合型检索工具、专题型检索工具、特殊型检索工具,二、网络信息检索工具,查Usenet新闻组资源的WAIS查FTP资源的Archie查Gopher资源的Veronica查Telent资源的Hytelent查WWW资源SearchEngine(搜索引擎)其中SearchEngine应用最为普及,主要搜索引擎的建立时间及网址,建立年月搜索引擎的名称及网址1994年4月WebCrawler1994年5月Lycos,1994年底Yahoo!1995年初Infoseek1995年10月AltaVista,第二节搜索引擎及其检索一、搜索引擎的构成及工作原理,用户检索策略,搜索引擎用户接口,搜索引擎本地的摘要信息数据库,各万维网站点资源,访问,详细信息反馈,摘要信息反馈,各记录链接,信息资源搜集,二、搜索引擎的功能,搜索引擎有两个主要的功能:1、收集网络信息资源,对其进行索引并建立数据库。2、提供网络的信息导航与检索服务(主要的功能)。,搜索引擎的基本检索功能,1、布尔逻辑检索逻辑与(与、and、AND、)AandBAB逻辑或(或、or、OR、|)AorBA;B;AB;逻辑非(非、not、NOT、!)AnotBAAB,2、完全字符串检索采用双引号“”代表字符串精确查找“知识经济”知识经济,3、截词检索(*)前方一致检索扩大检索范围nutri*nutria+nutrient+nutrilitei+nutriment+nutrition,4、字段限制检索限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。如:URL限制(url:)主机名限制(host:)标题限制(title:),5、位置检索目前只有AltaVista能提供邻近位置运算near运算。,6、+、-检索+:放在检索词前,表示该检索词在检索结果中必须出现。-:放在检索词前,表示该检索词在检索结果中不能出现。几乎所有的搜索引擎都支持这种功能。如:+computer+virusCIH,搜索引擎的高级检索功能,1、自然语言检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业HowhasWTOdeveloped?,2、模糊检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。相关性检索如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎”、“引擎”等相关的检索词一并列出。,3、概念检索用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。如:Excite,4、区分大小写检索大多数搜索引擎在查询中要区分大小写小写匹配大小写字符大写只匹配大写字符,5、管道(|)检索用管道符(|)连接两个或者多个检索词,如apple|disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。,6、相关信息反馈检索提供与检索结果类似的检索结果。如:雅虎中国的“相关网站、相关网页、相关新闻”。Lycos的“MoreLikeThis”Excite的“Searchformoredocumentslikethisone”,7、范围限制检索在某一范围内检索指定的检索词。分类范围、时间范围、地域范围、信息来源、检索词位置、语种范围、特殊范围,三、搜索引擎的分类,1、根据信息检索方式分类:分类搜索引擎、关键词搜索引擎、混合搜索引擎2、根据信息覆盖范围及适用用户群分类:综合性搜索引擎、专用性搜索引擎3、根据搜索范围分类:独立搜索引擎、集成搜索引擎,四、搜索引擎常见的查询方式,按照搜索引擎提供的分类目录逐级查询,用户一般不需要输入检索词,而是按照查询系统提供的几种分类项目,选择类别进行查询,这种方式也叫分类检索。用布尔逻辑组配方式查询,这种方式也叫定制搜索。(多个关键词),五、搜索引擎检索的步骤,1、输入URL地址,登陆到搜索引擎的主页。2、输入检索提问式或点击分类目录,进行实时的交互式的信息检索。3、搜索引擎输出HTML文件,并且翻译HTML,显示检索结果。,六、搜索引擎的选择技巧,查全率、查准率更新速度、死链接易用性、稳定性搜索速度高级搜索的支持能力,七、常用搜索引擎简介,1、主要中文搜索引擎2、主要英文搜索引擎3、各具特色的专用搜索引擎,主要中文搜索引擎,百度是世界上规模最大的中文搜索引擎,拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。,百度高级搜索,主要中文搜索引擎,一搜()是雅虎公司基于全球领先的YST(YahooSearchTechnology)技术,在中国推出的搜索门户。一搜具有简洁专业、海量、客观精准、国际化、稳定高速等特点,是值得依赖的专业搜索门户。,主要中文搜索引擎,主要中文搜索引擎,一搜高级搜索,主要中文搜索引擎,雅虎中国,主要中文搜索引擎,雅虎中国高级搜索,主要中文搜索引擎,新浪,主要中文搜索引擎,搜狐,主要中文搜索引擎,网易,主要中文搜索引擎,主要中文搜索引擎,263搜索,主要英文搜索引擎,AltaVista:,主要英文搜索引擎,Excite:,主要英文搜索引擎,Hotbot:,主要英文搜索引擎,Hotbot:,主要英文搜索引擎,Lycos:,Google搜索引擎和百度搜索引擎,Google搜索引擎百度搜索引擎,2.1Google搜索引擎网址:Google是一个全自动搜索引擎,它是利用计算机程序直接在网页中抓取相关字串。“Google”一词来源于“googol”(仍然是英文),是10的100次方,表示是一个非常巨大的数字的概念。正如其名,Google是一个功能强大、使用方便的搜索引擎。,与其他搜索引擎相比Google的优点:1)对于用户所输入的关键字,Google会最大程度的寻求语义匹配。例如想查找有关某人的网页,但输入“同音不同字的名”,Google也能找到你想要得信息。或者,在查询框中输入作者的名字,所有文章与网页都会被检索,连那个网页有转载都会显示出来。此外,Google还包含有汉字的相关性,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。2)Google还提供网页快照(Cached)功能。Google将检索的网页都做了一番“快照”,然后存放在自己的服务器上,当被搜索的内容站点当前不存在时,用户可以用网页快照功能。,Google检索须知,当检索结果过多,需进一步缩小时,可选择“缩小搜索”或在“结果中搜索”。只要输入更多的关键词即可,或在不需要的关键词前“-”号。注意“-”后应留一空格。Google不支持OR检索,也不区分英文大小写,所有字母均当小写处理。在专用词语上加双引号可以进行精确查询,这在查找某个产品或专用术语时特别有用。,“-+=,”等也作为短语连接符。例如,尽管Micro-computer,不加引号,仍作为专用词语处理。Google会忽略http和com等字样,以及数字和单字,因为他们出现过频繁,因此无助于检索,还会减低速度。Google的“手气不错”功能将自动连接到Google推荐的网页,无需再查其他结果,快速方便,Google检索示例,2.2百度搜索引擎,网址:,百度搜索引擎特点,1)中国人自己开发研制的,适合中文网站搜索2)“网页的相关检索功能”例如输入“手机”,在检索的上方还会出现“手机的价格”、“手机铃声”等与“手机”相关的词,此时再点一下“手机铃声”,则会检索出“手机铃声”的结果3)在百度的检索结果中,用户可以选“重新查询”;也可选“在结果中再查”则将在第一次的结果中在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论