利用搜索引擎开发图书馆网络信息资源的方法.docx_第1页
利用搜索引擎开发图书馆网络信息资源的方法.docx_第2页
利用搜索引擎开发图书馆网络信息资源的方法.docx_第3页
利用搜索引擎开发图书馆网络信息资源的方法.docx_第4页
利用搜索引擎开发图书馆网络信息资源的方法.docx_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

利用搜索引擎开发图书馆网络信息资源的 方法 (包头市图书馆,内蒙古 包头 014030) 摘 要: 文章阐述了搜索引擎的含义及类型,分析了 网络信息资源特点,提出了搜索引擎开发网络 资源的方法 及注意事项。 关键词:搜索引擎;网络信息;资源开发 中图分类号:G250.73 文献标识码:A 文章编号: 10076921(XX)18015102 随着数字化、网络化的不断发展,特别是互联网的迅 速普及,网络信息资源以惊人的速度膨 胀,人们庆幸能够 用搜索引擎在几秒钟之内找到信息的同时,也发现了其庞 大的数量,动辄 便是上万条、上千万条甚至上亿条,而许 多都是一些无用的垃圾信息。如何快速地、有效地 从庞大 的网络信息中抽取出潜在的、有价值的信息,使其更加方 便地为读者利用,从而真正 发挥出图书馆社会信息中心的 作用。本文就利用搜索引擎开发网络信息资源做一粗浅的 论述 。 1 搜索引擎的含义和主要类型 1.1 搜索引擎的含义 搜索引擎是基于 WWW 的信息处理系统,是对网络资源 进行标引和检索的工具。它通过一定的 机制和方法对网络 信息进行搜索,将搜索到的信息进行理解、提取、组织和 处理,由索引器 建立索引,并储存于可供检索的大型数据 库中。 1.2 搜索引擎的主要类型 搜索引擎检索系统包括目录型搜索引擎、全文搜索引 擎、多媒体搜索引擎和元搜索引擎。 1.2.1 目录型搜索引擎是最早出现的搜索引擎,它以 人工方式或半自动方式搜集信息,大 多面 向网站,提供 目录浏览服务和直接检索服务。其特点是搜索的信息准确、 导航质量高,但信 息量少,信息更新不及时且维护量大。 主要以 Yahoo、Sohu 为代表。 1.2.2 全文搜索引擎是很常用的一种搜索引擎,是利 用网络机器人自动搜索技 术对 网络各种资源进行抽取、 标引、归并、排序,创建可按关键词查询的网页数据库, 搜索结果 直接从自身的数据库中调用。其特点是数据量多、 数据的涵盖范围大,更新速度有保障,但 返回信息过多, 有很多无关信息,用户必须从结果中进行筛选。主要以 Google、Baidu 为代 表。 1.2.3 多媒体搜索引擎是专门搜索图形、图像、音频、 视频、动画等多媒体信息的搜索引 擎, 它与目录式搜索 引擎和多媒体搜索引擎部分交叉重合,采用的技术与文字 搜索引擎基本相同 ,是用专门的处理工具对多媒体信息进 行分析、理解,创建出多媒体信息库。 1.2.4 元搜索引擎是将多个搜索引擎集中在一起,提 供一个统一的检索界面,接收并处理 查询提问。元搜索引 擎可以同时检索多个独立搜索引擎,大大提高网页覆盖率, 可以说是一 种搜索引擎的搜索引擎。 2 网络信息资源的特点 2.1 信息丰富、形式多样、覆盖面较广 网络信息资源内容极为丰富,涵盖了各个学科领域 。 来源较广,有正式出版的、非正式出版的,学术机构提供 的、个人提供的都交织在一起; 形式也多样化,有全文数 据、题录文摘、图片资料、多媒体信息等等。 2.2 学术性和权威性强 网络中各种专业网站和大型数据库都极具学术性和权 威性,所收 录的资料全面系统,整理加工专业化,参考价 值很高。 2.3 检索快捷迅速 网络信息是通过节点以超文本链接,构成一个立体网 状的信息链。人们 无须预先知道某种信息的网址,就可访 问分布在世界各地的服务器上的信息,检索快捷迅速 。 2.4 信息时效性强 网络信息的发布省去了传统文献编辑、出版和发行等 环节,实现了读者 与编辑不受时空限制的即时交流,读者 能够快速查到最新的可利用信息,大大缩短了信息编 辑出 版的时间,使信息具有较强的时效性。而纸制资源由于受 到出版时间和加工过程等因素 的影响,时效性受到制约。 2.5 信息资源的共享性 网络系统最大限度地突破了时空限制,使读者可以享 受网络条件下 “图书馆”信息资源,这样的信息资源与服 务大大超过了传统意义上的图书馆馆藏,真正实 现了图书 馆资源的共建共享。 3 利用搜索引擎查询网络信息资源的方法 网络文献信息资源纷繁复杂、杂乱无序,因而需要图 书馆提供文献信息导航服务。同样,搜 索引擎主要由计算 机和网络工作者设计开发,学科之间的差异,使得知识理 解能力和处理方 式不同,会导致分类体系不统一、不规范 等问题。读者要查的信息明明网上有,但用搜索引 擎就是 查不到。图书馆工作人员借鉴传统分类法、目录组织、主 题法等理论知识,借助自身 在信息处理方面的优势来构建 信息服务系统, 以提高网络信息的有序化程度, 拓展图书 馆馆 藏资源,方便读者利用网络信息资源。 3.1 分析检索对象,正确选用搜索引擎 在使用搜索引擎查找信息前,首先要确定想要搜索的 对象,如网址的搜索、标题的搜索、主题的搜索、责任人 搜索等,然后再考虑搜索引擎的选用。随着各种搜索引擎 的不断涌现, 搜索引擎提供的功能也在日趋完善,在查询 范围、检索功能等方面各具特色,检索目的不同 搜索引擎 不同。如果我们想要找到某个问题的广泛性信息或方向性 问题,一般使用 Yahoo、S ohu 这样的目录式搜索引擎。对 于一些细节性问题或带有交叉性的问题,我们可以利用全 文 搜索引擎,如 Google、Baidu 等。 3.2 确定搜索引擎的搜索途经和方式 搜索引擎通常支持分类检索和主题检索两种搜索途径。 根据不同的检索目的确定的不同检索 途径,才能达到预期 的检索效果。 3.2.1 分类检索是分类搜索是基于人工标引的检索方 法。它以科学、实用的分类目录为工 具, 以规范化的自 然语言为类名,在对网络信息归纳、概括的基础上,以网 站为单元,提供人工 整序的网络信息。分类搜索是循序渐 进的检索方法,进行分类检索方式搜索信息时,首先使 用 搜索引擎查阅到一个大致的范围,在得到的一些网址中先 选出一些具有代表性的网站进 行浏览,包括网页中的一些 超链接,直到找到适合的结果。 3.2.2 主题检索也可以称为关键词检索,提供关键词、 题名、著者等多种检索途径。选用 的 主题词要明确、适 当地反映课题内容,正确表达主题检索,首先要明确检索 需求,对检索课 题进行主题分析,从不同角度将其划分为 几个最能表达课题内容的概念,分析出最有检索意 义 的 主题词;其次要控制主题词的内涵和外延,避免使用专指 度过高和主题范围过于宽泛的检 索词。 3.3 正确使用搜索引擎的各种搜索功能 搜索引擎的使用实际上就是对数据库的访问,可以使 用数据库搜索的基本语法来组织搜索条 件。搜索引擎通常 提供布尔检索、词组检索、截词检索、字段检索、加权检 索等检索功能。 但并非每一种搜索引擎均能提供各种功能, 每种检索功能在各个搜索引擎中的表现形式也不 相同,需 要正确使用搜索引擎的各种搜索功能对搜索内容进行缩小 检索范围或扩大检索范围 等操作。 3.3.1 缩小检索范围。网络信息数量非常庞大,当输 入检索词时,常常发现返回的检 索 结果是数以万计、亿 计的相关网页,绝大多数是对于我们来说是毫无意义的信 息,为了提高 查准率,需要缩小检索范围。经常要用的方 法有:减少同义词或近义词等相关词;增加 限制概念, 用“与”将它们连接起来;使用字段限制,或者限制检 索词在指定的 基本字段出现,或者指定辅助字段,限制结 果的文献类型、语种、出版国家;使用适当的 位置算符; 使用“非”算符,排除无关概念。 3.3.2 扩大检索范围。为了尽可能全面地搜索相关信 息,提高查全率,我们需要扩大检索 范 围。调整策略的 方法有:减少“与”算符,增加同义词或近义词等相关 词并用“ 或”来限制将它们连接起来;在词干相同的单 词后使用截词符“?”;去除已有 的字段限制、位置算 符限制(或者改用限制程度较小的位置算符)。 4 搜索引擎开发网络信息需要注意的问题 4.1 选择优质的搜索引擎 优质的搜索引擎数据库容量大,搜索速度快,“死链” 、“错 链”“重链”少,信息的来源有一定的可靠性,可 以避免一些粗制滥造的无价值信息。 4.2 选用多种搜索引擎 各种搜索引擎数据库采集的信息都有各自的特色,尤 其是一些专业 信息,只使用一种或几种搜索引擎,很难找 到真正的信息源。因此,联合选择多种搜索引擎 ,可以提 高信息资源的获取量。 4.3 开发特色网络信息资源 对网络资源的开发要根据本馆的性质、任务、服务对 象、发展 目标等进行,同时充分考虑本地区社会发展和学 术研究的需要,确定网络资源的收集方向, 有的放矢,提 高网络信息的准确性和价值性。 4.4 注意知识产权的保护 图书馆网络信息资源的开发必须维护著作权法, 遵守 中华人民共和国计算机信息网络国际互联网管理暂 行规定等与知识产权有关的法律。 5 结束语 利用搜索引擎开发图书馆网络信息资源,不仅能够实 现图书馆的网络化、现代化,而且为网 络信息搜集与整理 创造了一个的可持续发展的空间。不同性质的图书馆,可 以建立具有各自 特色的网络信息库,而图书馆馆员同样可 以根据读者的咨询信息,有针对性的进行个性化的 服务。 参考文献 1 马文峰 人文社会科学信息检索MXX :XX 图书馆出版社,XX

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论