主题网关对网络信息资源的组织探讨.docx_第1页
主题网关对网络信息资源的组织探讨.docx_第2页
主题网关对网络信息资源的组织探讨.docx_第3页
主题网关对网络信息资源的组织探讨.docx_第4页
主题网关对网络信息资源的组织探讨.docx_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主题网关对网络信息资源的组织探讨 (南京图书馆,江苏 南京 210002) 摘 要: 文章认为,主题网关的发展给网络信息资源 的组织和导航带来了新的模式,主题网关与搜索 引擎优势 作用的互补,极大地提高了信息资源的发现的检全率与检 准率,为图书馆情报界等 传统信息服务机构提供了争取网 络信息服务主动权的机遇。 关键词:主题网关;信息服务;图书馆 中图分类号:G250.73 文献标识码:A 文章编 号: 10076921(XX)04014202 随着互联网络信息资源的曾几何级数的增长,兴起于 20 世纪 80 年代的搜索引擎作为一种网上 资源发现工具, 逐渐暴露出检索结果冗余度过大、检准率不高的缺点,想 通过它们检索出关 于某一学科的较系统、较专业的信息是 非常困难的。同时,信息服务界开始面临着数字时代 到底 是占有资源还是指引用户有效利用资源的局面,信息服务 者需要开发有效的导航服务工 具。导航服务的重要内容之 一是对网络信息资源进行优选和整序,将筛选出的优质资 源按照 一定的体系结构进行整理并提供给用户,起到提高 检索效率的作用。图书馆学情报学、计算 机科学和相关学 科的专家,在传统文献信息组织技术的基础上结合现代的 信息技术,开创的 主题网关服务模式正是符合这种网络信 息资源服务 模式的导航工具。 1 主题网关概述 1.1 主题网关的涵义 Traugott Koch 最早对主题网关进行定义:“主题网关 是支持系统化资源发现的因特网服务 。通过因特网提供对 资源文献、对象、网站或服务的链接。该服务建立在资源 描述的基础上 , 可以通过主题结构浏览访问资源是其重 要的特征。” 主题网关作为一种新的网络信息资源组织和服务模式, 许多专家根据其特征对其定义进行了 有益的探讨,并提出 了基于自己专业领域的见解。在欧美主要以 DESIRE 计划中 的定义为代表 :“主题网关是有以下特征的质量信息控制 服务:提供因特网上大量网站或文献的链接 的在线服务; 根据制定的质量标准和范围标准人工选择资源;主要 依靠人的智慧完成 内容描述(排除利用计算机自动抽取文 摘);人工构建浏览分类结构;至少部分是人 工为 每个资源创建书目源数据。”国内的一些学者如张晓林、 王玮、黄如花等都对主题网关 的定义进行了介绍和比较分 析。认为主题网关是针对特定学科或主题领域,按照一定 的资源 选择和评价标准、规范的资源描述和组织体系,对 具有一定学术价值的网络资源进行搜集、 选择、描述和组 织,并提供浏览、检索、导航等增值服务的专门性信息网 关。主题网关是“ 致力于将特定学科领域的信息资源、工 具与服务集成到一个整体中,为用户提供一个方便的 信息 检索和服务入口。” 综合起来看对于主题网关的涵义,可以从以下几点来 理解。主题网关是围绕某个主题而 建立的网络信息资源 导航服务,通过因特网向用户提供对文献、网站和服务的 链接,实现网 络信息资源的增值和开发利用。被引导的 信息资源是由专家按照一定的选择标准和质量 标准进行严 格的质量控制,因而由主题网关引导的链接都是高质量的。 信息资源的描述 是图书馆学情报学、计算机科学和信息 科学专家对图书馆应用、实践与数据库技术有机结合 的结 果,而不是计算机自动抽取文摘,因此信息资源的描述更 为准确和完整,便于信息用户 利用。按照一定的分类体 系对被引导的内容进行组织,同时大部分主题网关服务还 提供 主题检索功能。 1.2 主题网关的发展背景 主题网关的提出和兴起于 20 世纪 90 年代中期,最初 是英国电子图书馆计划(the Electronic Libraries Program,eLib),项目的第一阶段计划里包括的一个项目 网络资源存取(Access t o Network Resources,ANR)的一 部分,它的运作开始于 1995 年,其中社会科学主题网关 SOS I G 在 eLib 资助之前就已经建立起来。目前,国外建 设的著名 SIG 达 50 多个,英国、美国、北欧 国家、荷兰、 德国和澳大利亚 SIG 的建设比较活跃。处于主导地位的是 1996 年建立的 DESIRE “欧洲研究与教育信息服务之发展 (Development of a European Service for Information on Research and Education, DESIRE)”项目。该项目由 来自欧洲的四个国家(荷兰、挪 威 、瑞士、英国)的十个 协会联合工作,主要目的是通过增强现有的欧洲信息网络, 提高对资 源的存储、发现、组织等服务。在欧洲 Renardus 的出现真正实现了主题网关的联合和共享。 Renardus 是在 欧盟范围内开展的信息开发计划,成员包括丹麦、芬兰、 德国、荷兰、瑞典、 英国的图书馆与研究中心,其服务的 目的是为欧洲高等教育的教学和科研提供一个精选的、 高 质量的网络信息的值得信赖的信息源;提供一个集成化的 网络信息资源门户站,能够为用 户提供整合检索和浏览途 径,可以检索全欧洲各个参与主题网关的记录。美国加州 大学图书 馆和加州其他馆开发的“图书馆员因特网索引 (LibrariansIndex to the Internet, LII )”是图书 情报学科主题网关的典型。LII 是一个可供检索的、提要性 的学科信息资源目录, 收录 30 000 多个经过选择和评价 的网站,基本收录了网上重要的图书情报类资源,它以公 共 图书馆用户、图书馆员和图书情报领域的研究者作为明 确的目标用户群。目前,国外 SIG 已 经从单纯的学术研究 和课题项目发展到大规模建设阶段,我国在 XX 年底正式启 动中国国家 科学数字图书馆(Chinese National Science Digital Library,CSDL)项目,起步较晚,但 是在 SIG 建 设方面已经做了大量的研究和开发工作,取得了一定的成 绩和经验,特别是科学 院文献情报中心的 SIG 建设,在国 内具有示范作用。目前已经由 CSDL 资助建成并投入使用的 有物理数学(PHYMATH)、生命科学(LSSIP)、图书情报(LIG)、 化学(CHIN)、和资源环境科学( RES)等 5 个主题网关。 2 主题网关建设的关键问题 2.1 主题网关的关键技术 主题网关的关键技术包括资源选择技术、资源描述技 术、资源排序技术和资源浏览和检索技 术。 资源选择由三种方式:由图书馆员或领域专家根据 资源选择标准进行人工选择;根 据主题需要,设计某种 程序,专门采集和评价领域主题;接受用户推荐的主题 资源网 站。 资源描述就是主题网关资源款目的著录和标引,经过 资源描述形成一条完整的网上资源著录 款目。目前的资源 描述普遍采用元数据方式,经人工描述形成。 资源排序就是采用一定的分类体系进行组织,组织成 有序的资源。目前,资源排序的方式主 要有:按资源类型 排序,按学科专业排序,按字顺排序。通常,这几种方式 混合使用。 资源浏览和检索。浏览是利用某一个通用的分类法或 自编分类法,结合超链技术组织资源, 从而向用户提供浏 览途径的查询方法。 2.2 主题网关资源的选择标准 主题网关与搜索引擎最大的区别是“质量控制”问题, 解决质量控制问题的关键需要制订 一定的标准,按照精 选标准对资源进行筛选,精选资源的标准制定包括以下方 面: 2.2.1 内容标准:资源的内容应当符合本主题网关的 收集范围,从资源类型来说,可以 包括网站、网页及其他 类型的文档,如 DOC、PDF、TXT 以及图像、音像资源等。 2.2.2 质量标准:质量标准是保证资源基本质量的前 提,除了要考虑用户需求的相关性 、未来用户的满意度、 资源本身的可持续性等因素外, 还需要大量的人工干预, 需要寻找 相关的专家和图书馆专业的工作人员来协助。 2.2.3 维护标准:跟踪已有资源,定期检查资源的动 态变化,发现新资源,并用质量标准 衡量该资源是否可以 选入本主题网关。 2.3 主题网关的资源描述和元数据标准的选用 主题网关的资源描述和元数据标准的选用经过选择评 价的资源, 必须经过资源描述形成一 条 完整的网上资源 著录款目。简单地说, 就是主题网关资源款目的著录和标 引。目前对资源 的描述普遍采用一定的元数据标准。 主题网关的元数据标准的选择和制定一般遵循标准、 开放、实用、可扩展的原则。大多数国 家的主题网关采用 Dublin Core (DC) 这一元数据标准。但许多主题网关制定 了比 DC 更简明 的元数据格式。例如英国的 BUBLLINK 只有 资源的题名、描述、作者、主题、分类、文献类型 和网址 七个元素。而 SOSIG 采用的元数据, 与 BIB-1Z39.50 标 准最主要的属性集和 GILS ( the Government Information Locator Service) 等多种标准具有良好的相 容关系, 同时 采 用资源描述框架(RDF) , 使它的元数 据在进行编码、交换、重用时有了基础。RDF 的使用 也 提供了交换受控词表数据的语法和其他应用服务, 增强了 元数据的互操作, 从而便于在跨 网关检索时实现互操作 和数据共享。 目前,主题网关资源描述元数据的生成主要依赖人工 的方式。随着主题网关的发展, 需要 开发一定的工具对 资源进行初步的加工, 通过自动标引, 自动生成资源描 述元数据。 3 主题网关对我国信息服务业的启示 主题网关技术的出现为图书馆等传统信息服务机构提 供了争取网络信息服务主动权的机遇。 我国图书馆应该积 极行动起来, 为主题网关服务在我国的发展与应用积极努 力。 我国“资源环境学科信息门户”在其项目宗旨中提出: “实现资源环境学科专业领域各种文 献信息数字资源系统 (包括二次文献数据库、全文数据库、联合目录、馆藏目录、 馆际互借 和全文传递等相关服务系统) 的横向整合,逐步 实现同构和异构数据库的统一检索服务。逐 步实现不同文 献类型数据库和不同信息服务系统间按照用户信息检索或 利用流程开放地无缝 连接,形成系统的有机联系的多层次 文献信息资源使用体系。” 这项宗旨对于图书馆来说也具有很强的现实意义,当 然要完全实现主题网关与本地图书馆资 源的无缝式存取, 还需要有关各方的重视和付出极大的努力。政府部门及 科研、教育或 合作组织应注重加大资金投入,将其作为国 家的社会公益事业大力扶持;注重新技术的 开发与应用, 在主题网关建设中应当充分借鉴应用分布式、自动化等构 建技术,提高速度, 降低成本;注重协作协调,在确定 主题网关的应用范围和新建主题网关时,充分融合利 用现 有主题网关中的资源,分工协作,最大限度地发挥各自的 作用。 参考文献 1 曹玲,侯汗清.文献分类法在主题网关互操作中 的应用研究J.图书馆杂志 ,XX,(1):2528. 2 王玮.网络信息资源组织的新模式主题网关 J.大学图书馆学报,XX ,(2):6670. 3 徐佳宁,赵洋. 国外学术信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论