网络信息检索技术8上课_第1页
网络信息检索技术8上课_第2页
网络信息检索技术8上课_第3页
网络信息检索技术8上课_第4页
网络信息检索技术8上课_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络资源获取途径: 途径 之一:搜索引擎 工作原理:由网 络 搜索 软 件( Robot、 Spider、 Worm等)自 动 定期遍 历 各 类 网站,自 动 搜集网 页 信息 进 行索引建库 并提供全文 检 索。不 仅 可以快速地搜集全球各网站的信息, 还 及 时发现 新的网站内容并剔除已 废 弃的网站网页 ,及 时 更新完善自身数据 库 。数据 库规 模可以做得相当 庞 大,数据的 时 效性也可以得到有力保障,大大提高了网 络 信息的 查 全率、及 时 性及有效性。 。 优 点 :信息量大;信息更新速度快;方便普通用 户 使用。 缺陷:信息噪音 较 大。 途径之一:搜索引擎 第一代 :以网络、网页的数量 多少为标准,结果不按相关性排序,代表为 Lycos, Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一。 第二代: 以 检 索 结 果的 质 量 为 目 标 , 检 索思想、方法 发生 转变 , 检 索 结 果排序并 进 行超 链 分析,代表 为 Google、 Baidu 。 第三代 :未来 趋势 智能化搜索工具, 进 行概念分析。 根据检索提问,进行智能化分析与搜索,并对检索结果进行分析、筛选、排序、链接和提示等。 Google主页网络资源获取途径之二: 网 络 地址 一个城市如果没有街道、 门 牌号,要找到一个地方很 难 ,网 络 也如此。 在国 际 互 联 网上有成千百万台主机, 为 了区分它 们 , 给每台主机都分配了一个 专门 的 “ 地址 ” 作 为标识 ,称 为IP地址。每个 IP地址的 长 度 为 32位( bit), 每段数字范围为 1 254Bit, 段与段之 间 用小数点分隔。如 由于 IP地址是数字型的,使用起来不方便,于是人 们 又 发明了另一套字符型的地址方案,即域名地址。入网的每台主机都具有 类 似于下列 结 构的域名: 如, 。 在掌握网 络 地址的情况下,可以利用地址 栏进 行 检 索,直接、 简 便。 商都信息港域名网络资源获取途径之三: 主题指南( Subject Directory, 网络目录 ) (如搜弧 雅虎 Yahoo! ) 工作原理:将网络信息利用人工分类的方法组织成一个树状目录结构,用户根据主题类目和子类目逐层深入查找所需信息。 优点: 搜集的信息经过人工筛选,质量较高,结果更具有参考价值。 缺陷:信息量小;类目不易确定;信息更新速度慢。 例如:搜狐于 1998年推出中国首家大型分类形式的主题指南。 18个部类、近 10万条链接构成的树型网页结构 。每日页面浏览量超过 800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。 主题指南主题指南网络资源获取途径之四: 网 络导 航 网 络导 航就是通 过 一定的技 术 手段, 为 网站的 访问 者提供一定的途径,使其可以方便地 访问 到所需的内容。 相当于 传统图书馆 信息部 门 的目 录 索引。 网 络导 航 有 许 多 类 ,重点学科 导 航是其中一 类 。如各高校重点学科 导 航,北大、清 华 。 学科导航网络资源获取途径之五: 网 络 资源链接、超链接 检索到某一信息资源,往往有许多相关链接、推荐连接、热点连接等,顺链而下,可以查找到许多相关有价值信息。相关链接网络资源获取途径之六: 网络数据库 网络数据库(免费、购买使用) 免 费资 源:参考下面网站推荐的免 费资 源/files/2page-xszdtj.htm 购买 的如: CNKI 、 万方学位论文数据库、 EI 、 SCI 等中外文数据库。网络资源获取途径之七:其他方法与途径 网络会议、专业博客网站。 免费纯网络期刊网站,如神州学人 (/) 网络地址的获得 :网络指南、 因特网适用网址速查 国外电力常用网址名录 中国工商网址黄页 中国医学网址 、 “ 中国精彩网址 ” 、 “ 企业网址大全 ” 等或运用网页地址历史记录、收藏夹直接进入相关站点,可以省去输入网址的时间。神州学人月刊简介(纯电子期刊) 神州学人 杂志历经 14年的发展,围绕着 “加强对广大在外留学人员进行爱国主义教育,鼓励他们回国工作或以适当方式为国服务,为我国改革开放和社会主义现代化建设事业做贡献 ” 的办刊宗旨,经过多年的探索,其主要内容框架已基本形成,即:走近中国了解祖国的窗口; 留学视野联络感情的纽带;学人园地表达情思的园地;留学服务提供服务的媒体。网络信息检索中的一些常用基本概念 初级检索 初级检索 是面向一般读者提供的检索方式。利用初级检索系统能进行快速方便查询,适用于不熟悉多条件组合查询的普通用户。它为用户提供了详细的导航内容,最大范围的选择空间。对于一些简单查询,建议使用该检索系统。 该查询的特点是方便快速,执行效率较高,但查询结果有很大的冗余,会检索出一大批检索者所不期望的结果。如果能在检索结果中进行二次检索或配合高级检索命中率会大大提高。 简单检索界面网络信息检索中的一些常用基本概念 高级检索 高级检索包括布尔逻辑检索、位置检索、截词检索、限制检索等。利用高级检索系统能进行快速有效的组合查询,优点是查询结果冗余少,命中率高。缺点是必须掌握一定的检索技术。对于命中率要求较高的查询,建议使用该检索系统。 高级检索界面检索入口网络信息检索中的一些常用基本概念 检索入口 检索入口 , 又称检索途径(或可检字段),是用户作为检索依据的文献特征,包括文献的内容特征和外部特征。这些特征在数据库中以字段的形式表现 , 所以检索入口也称检索字段。全文数据库中常用的检索途径有:关键词、刊名、作者、题名、分类号、文摘、分类号、任意字段。读者可根据所掌握的文献特征情况及检索目的选择适当的检索入口。 网络信息检索中的一些常用基本概念 检索范围 为了提高检索效率和满足特定需求,用户检索时可以先设定检索范围。 用户常设的检索范围有:学科范围、期刊范围、时间范围、语言范围、地域或国家范围等,在下一节的数据库检索中我们将具体介绍如何选择检索范围。 网络信息检索中的一些常用基本概念 二次检索 所谓 二次检索 就是在前次检索的基础上进行的再次检索,一般的二次检索的结果与第一次检索存在一定的关联性;通过二次检索可以缩小检索范围,优化检索结果。 网络信息检索中的一些常用基本概念 全文阅读器 /浏览器 全文阅读器 是一种用于打开具有某些特定格式的全文的一种浏览软件。由于有些数据库的全文使用的是特定格式的文件,必须由相应的阅读器进行阅读,所以,在使用相应的数据库时,必须先下载相应的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论