Five搜索引擎及国际联机检索.ppt_第1页
Five搜索引擎及国际联机检索.ppt_第2页
Five搜索引擎及国际联机检索.ppt_第3页
Five搜索引擎及国际联机检索.ppt_第4页
Five搜索引擎及国际联机检索.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章 搜索引擎及国际联机检索,主要内容,5.1 搜索引擎 5.2 国际联机检索,5.1 搜索引擎,1、网络信息资源检索概述 2、基于搜素引擎的网络信息检索 3、常用的搜索引擎介绍 4、使用搜索引擎的相关问题及发展趋势,5.1 搜索引擎,1、网络信息资源检索概述 (1)网络信息检索特点 1)交互式作业方式 2)用户透明 3)信息检索空间的拓宽 4)友好的用户界面操作方便,5.1 搜索引擎,1、网络信息资源检索概述 (2)网络信息检索的进入方式 从方法上来看,用户访问WWW系统,搜索和利用网络信息资源的方法有两种: 1)已知URL地址的查找方法 2)未知URL地址的查找方法,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 1)按检索机制划分 分类目录检索工具 搜索引擎型检索工具 混合型检索工具,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 2)按检索内容划分 综合型检索工具 专题型检索工具 特殊型检索工具,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 3)按包含检索工具数量划分 单独型检索工具:拥有独立的网络资源采集标引机制和相应的数据库。 多元型检索工具:是一种能够利用多个检索工具进行网络信息查询的检索工具,它通过一个统一用户界面帮助用户在多个检索工具中选择和利用合适的检索工具来实现检索操作。,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 4)按检索资源类型划分 万维网检索工具:主要检索万维网站点上的资源。 非万维网检索工具:主要检索特殊类型的信息资源,如:检索FTP文件的Archie、FileZ和T等。,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (1)搜索引擎概述 1)搜索引擎的基本类型 按分类检索:Yahoo、Infoseek、Galaxy、GNN等。 按检索词检索:Webcrawler、Lycos、Alta Vista、excite、Open-Text,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (1)搜索引擎概述 2)搜索引擎的工作原理 搜索引擎一般主要由搜索软件、索引软件和检索软件三部分组成。 信息的采集和存储 信息索引的建立 检索界面的建立 搜索结果的相关性处理,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (2)搜索引擎的技术分析 1)搜索引擎的Robot技术分析 2)搜索引擎的索引技术分析 3)搜索引擎的接口技术分析,5.1 搜索引擎,3、常用的搜索引擎介绍 (1)常用的单个搜索引 1)Alta vista- Excite- Lycos-,5.1 搜索引擎,3、常用的搜索引擎介绍 (1)常用的单个搜索引 1)Alta vista- Excite- Lycos-,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 可以在不降低系统效率的前提下,把多个 搜索引擎的检索结果综合起来,从中选取与用户查询相关度较大的,排除掉重复的和相关度较低的检索结果,并将检索结果以统一的界面呈现给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 1)基本体系结构 (1)用户接口部分:指用户的浏览器和多元搜索引擎系统交互的界面,任务是接收用户的查询要求,生成适用于不同独立搜索引擎的特定请求。 (2)查询代理部分:指多元搜索引擎和相应的单元搜索引擎的交互,以获得用户需要的查询结果。其中,包括查询、网页分析、汇总输出并调整。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 2)工作原理 多元搜索引擎实际上是一种网络查询接口工具。用户向多元搜索引擎发出检索请求,它将该请求整理为相应的检索指令发往多个单搜索引擎。给单搜索引擎执行检索指令后将检索结果传送给多元搜索引擎,经过整理后再传送给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 3)主要功能 搜索引擎的选择 功能较强的多元搜索引擎一般能采用并行和串行处理相结合的方式 检索指令的转换 检索结果的转换 查询操作大多仅支持简单的布尔逻辑运算 查询界面逐渐致力于满足用户进行查询操作的个人特制化要求。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 4)多元搜索引擎的类型 按照工作方式可以分为两大类: 并行处理 串行处理,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 5)多元搜索引擎的优势 由于没有网页索引数据库的建立和维护,多元搜索引擎可以集中更多的精力和财力完善检索要求的分发和检索结果的技术处理。 同时链接多个独立的搜索引擎,并充分使用数据库,因而避免在多个系统之间的切换及重复输入查询要求,特别是一些采用并行处理方式的多元搜索引擎,查询的速度也会更快。 使用多元搜索引擎可以省却各个独立搜索引擎在检索语法、指令差异,可由系统为用户统一处理检索的规则、语法和指令。 多元搜索引擎可以很方便地配置客户端,用户可以按照自己的习惯配置成具有个人风格的WEB查询工具。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 6)多元搜索引擎的评价与选择 是否允许用户浏览并选择要调用的独立搜索引擎。 是否覆盖多种区资源类型,是否可提供主题范畴的目录服务。 是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。 是否提供了足够多的检索选项和功能设置。 是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 7)多元搜索引擎的局限性 检索性能的局限性。 调用搜索引擎的局限性。 是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。 是否提供了足够多的检索选项和功能设置。 是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 1) Mamma ( ) 1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。 其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。 另外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过Email传输检索结果的特色功能。 检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎,Mamma主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 2)ASK Jeeves 3) Search ,ASK主页,Search主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 4) MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。,MetaCrawler主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 5)Profusion 6) ByteSearch ,其他著名元搜索引擎,Ithaki ( /dir.html) 支持包括中文在内的14种语言检索 Ixquick ( /) 可搜索网站、MP3、新闻、图象等多种网络资源 InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能 SavvySearch ( :2000/) 支持二十种语言(不包括中文),可调用全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目,可进行目录检索,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (1)使用搜索引擎的相关问题 1)使用搜索引擎的主要要点 2)使用搜索引擎的主要事项 3)搜索引擎的检索策略 4)搜索引擎的检索技巧,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 1)搜索引擎技术的最新研究 在使用智能代理技术跟踪用户检索行为。 采用人工智能技术,不断地分析用户的检索行为。 采用集中式体系结构和分布式体系结构,以提高系统性能。 使用交叉语言信息检索,让用户能在母语检索词的背景下,能检索到所有语言的检索结果。,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 2)搜索引擎的最新技术发展内容 提高了搜索引擎对用户检索提问的理解 提高了对检索结果的处理能力,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 3)搜索引擎的研究发展方向 智能化搜索 个性化搜索 结构化搜索 垂直化专业领域搜索 本土化的搜索,5.2 国际联机检索,1、联机检索系统 2、国际联机检索:Dialog联机检索系统 3、国际联机检索:OCLC的FirstSearch联机检索系统,5.2 国际联机检索,1)联机检索,就是人们将终端设备通过通信网络与计算机检索系统相联,采用人机对话方式,从主机中查找所需信息的过程. 2)联机检索的主要步骤 与主机系统联机,并输入用户号和密码。 使用选库指令进入数据库。 输入检索式,开始进行检索。 打印检索出来的记录内容。 关机,结束检索。,5.2 国际联机检索,1、联机检索系统 (1)联机检索系统的结构 包括检索终端、通信网络和联机检索中心三个部分。 (2)国际联机系统 国际联机检索中数据库系统在国外的,检索结果可提供国外文献信息。 四大国际联机检索系统:DIALOG、ORBIT、ESA-IRS、DATA-STAR,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 美国DIALOG是目前世界上最强大的国际联机检索系统,所拥有的近600个联机数据库都是质量很高、权威的数据库。DIALOG现有60亿页文字信息和300万个图像象文件共9万亿字节的文字信息量,是目前万维网上信息量的50倍。其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊。DIALOG数据库信息量大,检索方式灵活,适用于做比较全面的文献调研检索。如:科研课题开题立项时进行文献回溯检索、课题中期跟踪检索和课题结题时的查新检索等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 DIALOG学科覆盖面广,几乎涉及全部学科范围,包括综合性科学、自然科学、应用科学和工艺学、社会科学和人文科学、时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。其数据形式包括:文献型文献的题录和文摘;数值型统计表、商业财政数据等;名录字典型手册、指南、名录等;全文型论文、报告、新闻报道的全文等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 DIALOG的近600个数据库中有许多极具代表性的和常用的数据库,著名的数据库如INSPEC、MEDLINE、MATHSCI、BA、NTIS等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI、EI、ISTP、SSCI、AHCI(艺术与人文科学引文索引)等也都可从DIALOG系统中检索;再有世界著名的DERWENT专利数据库以及美国专利、欧洲专利、日本专利等数据库也都可在DIALOG中查询。DIALOG更有一些全文数据库,如IAC的计算机全文库、纽约时报和华盛顿邮报等的全文库等。,5.2 国际联机检索,二DIALOG系统的Internet Web界面的检索方法 1利用eb直接上网检索。其eb网址为http:/www.DialogW 这种方式检索费用最低,仅在主要是运行和调用数据一刹那计算Internet费用,缺点是如果用户 需要将所有检索过程存盘,就要一屏一屏的存盘,否则随着检索指令的变化,一及时存盘,数据容易丢失。 2.特别为专业人员推出的Web界面。其网址为http:/www.DialogC 这是最新推出界面。速度快,检索过程每一屏幕均保留不丢失数据,便于存盘,界面是专 业人员熟悉的界面,能很快的从旧检索方式转入适应新的Web界面。,5.2 国际联机检索,3.非专业检索人员Web界面。其网址为http:/www.dialogS DialogSelect作为在Internet上的傻爪界面主要针对最终用户,而非专业人员。对于初 学者、最终信息用户和不愿学习Dialog检索指令的人可使用其傻瓜界面。 4.数据库兰页网址:/bluesheets/ 你可以按数据库名称、文档号、主题浏览兰页。数据库兰页提供有每一种数据库的收 录范 围,可供检索的字段、打印格式、记录样式及收费情况等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 使用说明 1)检索方式 DIALOG国际联机检索系统的使用方法不像面向最终用户的数据库那么简单,它具有一套完整而功能强大的指令系统以保障检索的快速性及检索结果的查全率和查准率。这些检索指令和检索技巧需经过培训才能掌握,加之DIALOG用户号在同一时间内只能提供给一个用户使用,不能多用户共享,因此,读者使用DIALOG国际联机系统必须与图书馆联系,由用户将检索课题提交给图书馆的情报检索人员,并由专业人员来进行检索,否则会有耗时、耗费、甚至检索不到结果的可能。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统 2)收费方式 本馆是DIALOG的授权用户。DIALOG系统的服务是收费服务,其费用主要包括: (1)每年的会费; (2)数据库的使用费(按时间)和记录的显示费(按数量)。不同的数据库有不同的收费标准。 鉴于DIALOG系统的检索是按次收费,且费用较高,而且检索方式较为复杂,为使读者更充分地利用该项资源开展教学科研工作,但又不造成资源的浪费,现决定参考兄弟院校的做法,在校内读者进行DIALOG检索时,按DIALOG系统实际发生的全部费用的30%收取“DIALOG数据库使用及检索服务费”,而校外读者则收取全部检索费用的100%。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 OCLC简介 OCLC全名为 Online Computer Library Center(联机计算机图书馆中心), 是世界上最大的提供网络文献信息服务和研究的机构,它创建于1967年,总部在美国俄亥俄州都伯林。 OCLC是一个面向图书馆、非盈利性质、成员关系的组织,以推动更多的人检索世界范围内的信息、实现资源共享并减少信息的费用为主要目的。 OCLC主要提供以计算机为基础的联合编目、参考咨询、资源共享和保存服务。 据最新统计,使用OCLC产品和服务的用户已达86个国家和地区的45,000个图书馆和教育科研机构。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch系统简介 FirstSearch联机信息检索服务是OCLC从1992年开始推出的一个新产品,此后,发展迅速,深受欢迎。1999年8月,OCLC完成了新版的FirstSearch(当时,称为New FirstSearch)。新版 FirstSearch以Web为基础,采用了当前信息通讯领域的高新技术,提供给用户一个便捷、友好、世界范围的参考资源。目前通过该系统可检索70多个数据库,其中有30多个库可检索到全文,总计包括11,600多种期刊的联机全文和4,500多种期刊的联机电子映象,达1000多万篇全文文章。这些数据库涉及广泛的主题范畴,覆盖了各个领域和学科。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 新FirstSearch实现了和OCLC 的联机电子出版物数据库ECO的完全整合,增强了联合编目数据库WorldCat的馆藏信息,实现了各库间的联机全文共享。通过一个简单适用的界面,FirstSearch可完成:对OCLC ILL(馆际互借)的无缝访问;数千种印刷型和电子期刊的全文文章的跨数据库的联机显示;帮助使用者选择合适的数据库;灵活的检索功能;在记录表中显示用户所在图书馆的馆藏标识等。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch的主要特色 (1) 易于获取联机全文(与ECO整合;标识全文库;各库间全文共享;限制检索全文;用户馆文献标识;联机的馆际互借)。 (2) 强大的检索手段(选库;多种检索界面及检索式;检索限制;结果屏幕的标识;扩展、限制、主题词和作者的再检索等)。 (3) 灵活多样的检索索引(索引随数据库变化、数量多、形式多样)。 (4) 专门配置了Web界面的管理模块(管理帐号,进行系统和数据库参数的设置) (5) 包含馆藏信息,目前该系统共收集了8亿多个馆藏地点。 (6) 信息量大,更新快,覆盖了广泛的主题范畴。 (7) 面向最终用户。收费低,按检索次数或年订购收费,而不是按机时收费。 (8) 服务时间长。周一至周六,24小时服务。周日,服务20小时(北京时间下午37点维机)。 (9) 多语种界面,包括简体中文界面。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch应用环境 用一台安装有基于Web的浏览器(IE或Netscape均可),且以各种方式联入Internet或OCLC指定的其他远程通讯网的工作站或微机就可进行检索。地点不限。 OCLC建议的浏览器和软件: (1) 4.0或以上版本的IE或Netscape 浏览器,且支持JavaScript语言。 (2) 浏览电子出版物时需安装: Adobe Acrobat Reader3.0或更高级软件(浏览 PDF格式的电子映象文章)。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch检索网址 帐号方式:/ IP方式:/FSIP 注:由于OCLC已付费,CERNET用户可像检索国内网站一样,不必付通讯费。,5.2 国际联机检索,3、国际联机检索:OCLC的FirstSearch联机检索系统 FirstSearch检索付费的方式 用户可采用两种付费方式检索FirstSearch的数据库: (1)按检索的次数 使用此方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论