选修3《因特网信息检索》ppt课件1 高中信息技术_第1页
选修3《因特网信息检索》ppt课件1 高中信息技术_第2页
选修3《因特网信息检索》ppt课件1 高中信息技术_第3页
选修3《因特网信息检索》ppt课件1 高中信息技术_第4页
选修3《因特网信息检索》ppt课件1 高中信息技术_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节第三节 因特网信息资源检索因特网信息资源检索 一、因特网中的信息检索一、因特网中的信息检索 搜索引擎搜索引擎是一种用于帮助因特网用是一种用于帮助因特网用 户查询信息的搜索工具,它以一定的策户查询信息的搜索工具,它以一定的策 略在因特网中搜集、发现信息,对信息略在因特网中搜集、发现信息,对信息 进行理解、提取、组织和处理,并为用进行理解、提取、组织和处理,并为用 户提供检索服务,从而起到信息导航目户提供检索服务,从而起到信息导航目 的。的。 1.常用的两种检索方式常用的两种检索方式 1.目录索引类搜索引擎目录索引类搜索引擎 搜狐搜狐 2.全文搜索引擎(关键词)全文搜索引擎(关键词) 谷歌、

2、百度谷歌、百度 注:一些中文搜索引擎可提供中、英注:一些中文搜索引擎可提供中、英 文选择文选择 北大天网北大天网 2.特色信息检索工具特色信息检索工具 这些检索工具专门搜集某一类的信这些检索工具专门搜集某一类的信 息资源,内容丰富,数据量大。息资源,内容丰富,数据量大。 专业性质的搜索引擎:专业性质的搜索引擎: SOSIG-专门搜集社会科学信息的信息专门搜集社会科学信息的信息 检索工具(检索工具(www.sosig.ac.uk)P18 3.其他信息检索工具其他信息检索工具 还有一类以还有一类以FTP、Telnet、 Usenet等资源为检索对象的检索工等资源为检索对象的检索工 具,如北大天网、

3、具,如北大天网、Archie等。等。 Archie Archie Archie是第一个自动索引因特网上匿是第一个自动索引因特网上匿 名名FTPFTP网站文件的程序,当时因特网还网站文件的程序,当时因特网还 未出现,但网络中文件的传输频繁,由未出现,但网络中文件的传输频繁,由 于大量文件散布在各个分散的于大量文件散布在各个分散的FTPFTP主机主机 中,查询起来非常不便。中,查询起来非常不便。 19901990年年McGill UniversityMcGill University的学生的学生Alan Alan EmtageEmtage等想到了开发一个可以用文件名等想到了开发一个可以用文件名 查

4、找文件的系统,于是便有了查找文件的系统,于是便有了ArchieArchie。 4.元搜索引擎元搜索引擎 1995年就出现了元搜索引擎。年就出现了元搜索引擎。 元搜索引擎元搜索引擎是一种调用其他多个是一种调用其他多个 独立搜索引擎的引擎,是对多个独立独立搜索引擎的引擎,是对多个独立 搜索引擎的整合、调用、控制和优化,搜索引擎的整合、调用、控制和优化, 能能方便地检索多个搜索引擎,扩大检方便地检索多个搜索引擎,扩大检 索范围,提高检索的全面性索范围,提高检索的全面性。 8 金手指考试网 http:/ 2016年金手指驾驶员考试科目一 科目四 元贝驾考网 http:/ 科目一科目四仿真考试题C1 G

5、rammar 元搜索引擎的特点元搜索引擎的特点 元搜索引擎在搜索的时候,用户只需元搜索引擎在搜索的时候,用户只需提提 交一次搜索请求交一次搜索请求,而且可以,而且可以同时搜索多个同时搜索多个 数据库数据库,并根据多个搜索引擎的检索结果,并根据多个搜索引擎的检索结果 进行二次加工进行二次加工,如对检索结果进行重排和,如对检索结果进行重排和 标明检索结果来源等,输出给用户。标明检索结果来源等,输出给用户。 缺点:缺点:一般支持一般支持ANDAND、OROR、NOTNOT等操等操 作,一般只使用简单、直接的搜索策略,作,一般只使用简单、直接的搜索策略, 并且检索速度也慢。并且检索速度也慢。 5.因特

6、网信息检索的发展趋势因特网信息检索的发展趋势 1 1、多媒体信息检索、多媒体信息检索 传统的多媒体数据库中,除了文本和数字还包括图传统的多媒体数据库中,除了文本和数字还包括图 形、图象、声音、视频、动画等各种媒体组合。但多形、图象、声音、视频、动画等各种媒体组合。但多 媒体信息具有丰富的内涵,如:媒体信息具有丰富的内涵,如:图象的颜色、纹理、图象的颜色、纹理、 形状形状,动画中的运动、声音和音调动画中的运动、声音和音调等。例如歌曲的等。例如歌曲的旋旋 律、音调、音质律、音调、音质等难以用文字描述。这正是基于内容等难以用文字描述。这正是基于内容 的音频检索需要研究和解决的问题,以期达到更深的的音

7、频检索需要研究和解决的问题,以期达到更深的 检索层次和更好的检索效果。检索层次和更好的检索效果。 2 2、专业垂直搜索引擎、专业垂直搜索引擎 专业垂直类搜索引擎只面向某一个专业垂直类搜索引擎只面向某一个 特定的领域特定的领域,专注于自己的,专注于自己的特长和核特长和核 心技术心技术,能够保证对该领域信息的,能够保证对该领域信息的完完 全收录和及时更新全收录和及时更新。 二、信息检索工具的工作原理二、信息检索工具的工作原理 搜索引擎是如何搜索信息的呢? 你听说过“网络机器人”、“爬虫”、“蜘蛛” 吗? 他们只是搜索引擎的一个部分,叫“搜索器” 1、全文搜索引擎的工作原理 全文搜索引擎的工作原理:

8、全文搜索引擎的工作原理: 2、目录索引类搜索引擎的基本工作原理、目录索引类搜索引擎的基本工作原理 目录索引类搜索引擎一般目录索引类搜索引擎一般采用人工方式采集和存储网络信息采用人工方式采集和存储网络信息, 依靠手工为每个网站确定一个标题,并给出大概的描述,建立依靠手工为每个网站确定一个标题,并给出大概的描述,建立 关键词索引,将其放入相应的类目体系中。关键词索引,将其放入相应的类目体系中。 网络目录通常按网络资源的主题性质进行分类,以某种分类体网络目录通常按网络资源的主题性质进行分类,以某种分类体 系为依据,将信息资源分为若干领域的主题范畴,然后再细分系为依据,将信息资源分为若干领域的主题范畴

9、,然后再细分 为各科专题目录,最后列出具体的相关网站(资源),形成一为各科专题目录,最后列出具体的相关网站(资源),形成一 个由信息链组成的树状结构:个由信息链组成的树状结构:总目录总目录专题目录专题目录链接链接网站网站。 目录索引类搜索引擎最大的特点就是在查询信息时,目录索引类搜索引擎最大的特点就是在查询信息时,不用事先不用事先 确定信息检索目标(即关键词)确定信息检索目标(即关键词),可以通过浏览主题了解某一,可以通过浏览主题了解某一 主题的相关资源。主题的相关资源。 目录索引类搜索引擎的网页由人工精选,目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术网页内容丰富,学术 性较强性较强。但由于人工编制和维护要花费大量的人力和时间,所。但由于人工编制和维护要花费大量的人力和时间,所 以以更新速度慢更新速度慢。 三、信息检索的一般策略三、信息检索的一般策略 1.如果想大致了解某一领域的信息资源,可使用如果想大致了解某一领域的信息资源,可使用 目录索引类搜索引擎;目录索引类搜索引擎; 2.如果对需要检索的信息资源目标比较明确,可如果对需要检索的信息资源目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论