




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复习,信息获取的一般过程,定位信息需求,选择信息来源,确定信息获取方法,获取信息,评价信息,如何通过因特网获取信息,信息获取一般过程,WhenWherewhat,文献型口头型电子型实物型,直接法间接法,权威性准确性客观性时效性,信息获取典型案例,因特网信息的查找,常用的因特网信息检索方法,知道信息所在网页的地址或网络实名,可快捷地检索到结果,利用分类目录或关键词,在特定的搜索引擎中查找所需的信息,利用网上的在线数据库进行查询,搜索引擎(SearchEngine),搜索引擎是指专门用于因特网信息查找的网络工具,资料:搜索引擎是何时产生的呢?,就是在Internet上执行信息搜索的专门站点,它们可以对主页进行分类与搜索。如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单。,一、搜索引擎发展史,1990年以前,没有任何人能搜索互联网。万维网还没有出现,人们通过FTP来共享交流资源,但是由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便。,应运而生,1990年,加拿大一所大学的师生想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。这个系统被认为是现代意义上的搜索引擎的祖先。,由于Archie深受用户欢迎,美国一所大学于1993年开发了相似的搜索工具Gopher,不过此时的搜索工具除了索引文件外,已能检索网页。当时电脑“机器人”是指某个不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。随着互联网的迅速发展,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。,崭露头角,现代意义上的搜索引擎大家现在熟知的Lycos出现于1994年7月。,飞速发展,趣味小资料:不经意中诞生的雅虎,同年4月,斯坦福大学的两名博士生,DavidFilo和杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。,目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!,二、搜索引擎的工作原理,搜索引擎是对互联网上的信息资源进行搜集整理以供用户查询的系统,它包括信息搜集、信息整理建立索引数据库和用户查询三部分。,网络,用户系统,检索代理软件,数据库database,巡视程序(或人工采集),搜索引擎的工作原理,元搜索引擎:辅助工具,三、搜索引擎的类型,全文搜索引擎:关键词检索,目录索引类搜索引擎:分类目录检索,搜索引擎按其工作方式主要可以分为:,小结:两类搜索引擎的比较,本课练习,搜索引擎将不断收集到的网页及网址以数据库的形式组织存贮。查询时用户输入关键词,搜索引擎便会从数据库中检索与之匹配的相关记录,按一定的排列顺序返回给用户。,搜索引擎收集,整理信息,以分类目录的形式链接起来,供用户检索,用户通过逐级层层点击浏览这些目录,寻找自己所需的站点信息。,可提练关键词的明确信息。基本原则是:构建关键词时,我们尽量不要用自然语言,某一类的主题信息,1、通过网络了解著名搜索引擎“yahoo”的诞生过程。2、味精是调味料的一种,请问它的鲜味来自哪一种物质,它最早发现于什么汤中?3、我们生活的城市扬州是个历史悠久的城市,在中国历史上,扬州曾有过三次鼎盛时期,请列出三个时期。4、位居世界第二的高峰是什么?位居世界第二的洼地又是什么?它们之间的高低落差多少米?,课堂实践:因特网信息的查找,请将搜索的结果以word文件的形式上传至FTP服务器上。,1、全文搜索引擎(关键词索引),使用自动索引软件来发现并标引网页,建立数据库。它的Spider自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万乃至亿万条记录的数据库;它以Web形式提供给用户一个检索界面,供用户输入检索关键词(词组或短语等检索项),以其特定的检索算法找出相关记录,按相关度排序输出。关键词就是您输入搜索框中的文字,例1、1982年世界杯足球赛冠军得主是谁?,例2:地震又称地动、地振动,是地壳快速释放能量过程中造成振动,期间会产生地震波的一种自然现象。多少级以上的地震会造成破坏?a)4.5级b)5级c)6级,关键词:震级造成破坏,例3:请问位居世界第二的高峰是什么?位居世界第二的洼地又是什么?你知道它们之间的高低落差是多少米?,全文搜索引擎的优缺点,优点:收集、加工信息的范围广、速度快,能及时地提供新增信息给用户。每个搜索引擎都提供了多种检索功能,有利于提高检索效率。适合于检索特定的信息及较为专业、具体或类属不明确的课题。缺点:一次检索输出的结果可能很多,但当中包含了许多重复、虚假的信息,因此要过滤一大堆与检索主题互不相干的检索结果。(建议在结果中进行二次检索),2、目录索引类搜索引擎,一般采用人工方式采集和存储网络信息,是由专业人员在广泛搜集网络资源,进行加工整理,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个目录大类及其子类下提供相应的网络资源站点地址,并附有简单的介绍。用户能在目录体系的引导下,通过浏览目录,逐级查找,检索自己感兴趣的主题。,目录索引类搜索引擎,例:查找上海的相关旅游信息,目录索引类搜索引擎的优缺点,优点:查准率较高(查全率较低)。适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。缺点:专题指南的局限性在于其信息更新速度慢,跟不上网络信息的发展。数据库的规模相对较小,收录的网页数量和深度都相对不足,比较容易遗漏交叉相关信息。,3、元搜索引擎,元搜索引擎没有独立的索引数据库,在接受查询请求时,同时在其他多个引
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政法学量化研究试题及答案
- 熟悉计算机二级VB考试的总结与试题及答案
- 风险管理框架设计原则试题及答案
- 2025法学概论考试挑战与试题及答案
- 硅谷科技创业的成功案例分析试题及答案
- 2025年编程实践考核试题及答案
- VB程序调试技巧解析题及答案
- 敏捷开发实践中的挑战试题及答案
- 延续学习2025年软件设计师考试试题及答案
- B语言基础试题及答案详解
- 2023版煤矿安全管理人员考试题库及解析
- DBJ04T 289-2020 建筑工程施工安全资料管理标准
- 互联网金融(同济大学)知到智慧树章节测试课后答案2024年秋同济大学
- 宏观经济学知到智慧树章节测试课后答案2024年秋浙江大学
- 2024年中考数学复习:中点模型专项练习
- 旅行社企业章程范本
- 2025年宁波余姚市直属企业招招聘笔试参考题库含答案解析
- 《心理健康测试》课件
- 《心房颤动》课件
- 静脉输液操作考试流程
- 校园艺术团指导教师聘用合同
评论
0/150
提交评论