




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9章 网络信息资源管理内容提要:网络信息资源概述网络信息资源管理的相关技术 网络信息资源的检索 网络信息资源管理与应用 9.1 网络信息资源概述信息资源的含义有很多不同的解释,但归纳起来主要有两种:一是侠义的理解,认为信息资源就是指文献资源或者数据资源,或者各种媒介和形式的信息的集合,包括文字,声像,印刷品,电子信息,数据库等,这都是限于信息本的身。二是广义的理解,认为信息资源是信息活动中各种要素的总称,包含了信息相关的人员,设备,技术和资金等各种资源。网络信息资源可以理解为“通过计算机网络可以利用的各种信息资源的总和”。作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式
2、记录的、以多媒体形式表达的、存储在网络计算机的磁介质,光介质以及各类通讯介质上,并通过计算机网络进行传递信息内容的集合。简言之,网络信息资源就是通过计算机网络可以利用的各种信息资源的总和。网络信息资源有狭义与广义之分。广义的网络信息资源指所有互联网上的信息资源,包括技术,各种设备、标准规范等,而狭义的网络信息资源通常指在各种网络(包括互联网、局域网)上可以利用的、能满足广大用户科研与工作需求的各种信息资源的总和。网络信息资源的特点:网络信息资源作为一种新型的信息源,有不同于传统信息资源的特点,主要表现在数量、结构、分布、类型、传播范围、载体形态、控制方式等方面。 9.1.1 网络信息资源的分类
3、与组织以网络为传播媒体:1传播迅速,数量大,增长快2.内容丰富、形式多样3.信息组织的局部有序性与整体无序性并存4.信息质量良莠不齐5.结构复杂、分布广泛6.信息资源组织方式非线化7.分布式存储、但关联程度强网络信息资源的分类:网上信息资源浩如烟海,可以从不同的角度进行划分和归类。依据不同的标准,网络信息资源可分成不同的类型,较典型的有如下几种。按信息资源的媒体形式,分为:文本信息.图片信息音频信息视频信息三维虚拟影像按照人类信息交流方式,可将网络信息资源分为:非正式出版信息半正式出版信息正式出版信息。按信息内容的表现形式和用途,可分为:全文型的 事实型的数值型实时活动型其他类型:如图形、音乐
4、、影视、广告等各种媒体 按信息来源划分,可分为政府信息资源公众信息资源商用信息资源按信息时效划分,可分为电子邮件型信息资源图书馆目录资源书目与索引资源全文资料及电子出版物资源数据库信息资源按网络传输协议划分,可分www信息资源 Telnet 信息资源 FTP 信息资源 用户服务组信息资源 Gopher 信息资源 其他分类方法:IDG Book World Wide1996 年出版的WWW指南就将网络信息资源进行混合分类,它以学科领域为依据将网络信息资源分为57 类,日本的户田慎一把网络信息资源分成 7 类 网络信息资源按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等9.
5、1.2网络信息资源的组织方式网络信息资源的组织:是指人们根据网络信息本身的特征,运用各种工具和方法,对网络信息资源进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。网络信息资源组织与开发形式归纳:超文本方式、搜索引擎方式、指引库方式、元数据方式、图书馆编目方式等。文件方式:文件方式是网上数字化信息资源的一种主要存储形式。以文件方式组织网络信息资源有如下优势:简单易操作,文件是存储非结构化信息的单位.文件方式是网络信息资源组织的简单方式。随着网络信息、资源利用的不断普及和信息量的不断增多,以文件为单位共享和传输信
6、息的不足逐步显现。随着网络信息资源利用的普及和信息量的增加,以文件来传递信息会使得网络的负载量越来越大。对结构化信息组织与管理显得不足。随着以文件形式保存和管理的信息资源的增多,文件本身也需要作为对象来管理。超文本方式:超文本是一种将网上相关文本的信息有机地组织在一起,以节点为基本单位,节点间以链路相连,将信息组织为网状结构的组织方式。人们可以通过高度链接的网络在各种信息库中自由航行,找到所需要的各种媒体形式的信息。超媒体的优势在于:非线性编排,符合人们思维联想和跳跃的习惯;节点中的内容可多可少,结构可以任意伸缩,具有良好的包容性和扩充性;可组织各类媒体的信息,方便地描述和建立各媒体信息之间的
7、语义联系,超越了媒体类型对信息组织的限制;通过链路浏览的方式搜索信息,将信息控制机制融合进系统数据中,避免了检索语言的复杂性。 超文本方式同样有它的局限性 :它在文本之间的来回跳跃链接,很容易打断读者的思路,分散读者的注意力,甚至可能使读者被五花八门的链接牵着鼻子走而偏离了信息浏览查询的初衷。 由于超文本方式本身的特点,一组逻辑与联系较强的信息往往由各个节点,多个web页组成,从而导致用户在浏览和查询时,难以从整体上把握节点和页面的完整的逻辑关系,检索结果往往失去整体性和全局性。 很难保存遍历过程中所有的历史记录,故无法在需要时立即返回到曾经浏览过的某一节点,即出现“迷航”现象。数据库方式:所
8、谓数据库方式,就是将网络信息资源以固定的记录格式存储,并提供一些检索入口,用户通过检索入口,就可以找到所需要的信息线索,并利用超级链接功能直接链接到相关站点或一次信息本身的方式。利用数据库技术组织网络信息资源优势 :对大量的结构化数据的处理效率有了很大的提高 数据的最小存取单位是信息项(字段),可以根据用户需求灵活地改变查询结果集合的大小,从而大大降低了网络数据传输的负载 以数据库技术为基础已建立了大量的信息系统,形成了一整套系统分析、设计与实施的方法,为人们建立网络信息系统提供了现成的经验和模式 以数据库方式组织网络信息资源,其不足之处在于:对非结构化信息的处理困难较大,对网络环境中日益增加
9、的多媒体信息及表格程序、大文本等非结构化信息的组织处理能力较差无法有效处理结构日益复杂的信息单元 缺乏直观性和人机交互性 为了满足利用数据库技术处理非结构化文本信息的需要,人们试图对全文文本进行结构化处理,并用数据库技术对经过处理的文本信息进行管理,称之为“全文数据库”。 搜索引擎方式 :自动搜寻工具主要有自动搜寻网络资源、自动索引、自动摘要、提供检索方法和用户界面等功能。故这种方式的不足之处是:收录的信息良莠不齐耗费大量的计算机资源查全率高但查准率低搜索引擎“命中”的网上一次信息动辄上百成千,因此越来越多的搜索引擎提供二次检索功能,以及对检索结构进行再处理的功能。 目录指南方式: 目录指南方
10、式,又可称为主题树方式,组织信息资源的方法是将信息资源按照某种事先确定的主题分门别类地加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息的线索,再链接到相应的网页。 目录指南方式的优点:信息的专题性较强,信息质量高,且能较好地满足族性检索的要求用户按照规定的范围和分类体系,逐级查看,按图索骥,目的性强,查准率高 屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面,并且具有严密的系统性和良好的可扩充性 目录指南方式的不足主要体现在 :很难确定一个全面的范畴体系作为目录指南结构的基础来涵盖所有的网络信息资源。用户为了迅速地找到所需信息还须对相应的体系
11、有较全面的了解,这就增加了用户的智力负担。 要保证目录结构的清晰性,每一类目下的条目也不宜过多,这就大大限制了所能容纳网络信息资源的数量。因此,目录指南结构不适合建立大型的综合性的网络资源系统 。但在建立专业性或示范性的网络信息资源体系时,就显示出其结构清晰、使用方便的优点。 图书馆编目方式 :目前,图书馆编目已成为一种组织网络信息资源的重要方式,它用传统的机读目录格式来组织整理网络信息资源。网上资源编目需要精干的咨询机构、自动化系统的专门知识、馆藏发展与参考部门的共同合作,才能为用户提供最为有效的目录产品。采用馆内合作的方式对网上资源进行编目,分为三个步骤:由负责馆藏建设的馆员选择网上资源,
12、填写“网络资源著录申请表”;由编目人员根据 MARC/AACRII对网上资源进行编目;由自动化系统工作人员将确切的网址和检索方式添加到856 字段中。由于网上信息常常修改、变动,故人们要时刻关注 856 字段相关内容的变化,这并不是一件容易的事。数据库与超媒体结合方式 :数据库技术与超媒体技术的结合,是网络信息资源组织与开发技术的发展趋势 两者的结合途径从当前来看,通常是将数据库作为超媒体系统的一个节点来进行处理。在这中方式中,数据库看成超媒体系统中一个独立的特殊节点,由特殊的链接将数据库节点和其他的超媒体节点相连。其具体实现方法有: CGI (Common Gateway Inter-fac
13、e)方法 Web API (Application Program Interface)方式 Active X技术 JDBC(Java Database Connectivity)技术网络信息组织对象的范围看,网络信息组织的模式可以划分为4个层次: 第一个层次为微观的组织模式第二个层次为中观的组织模式,第三个层次为宏观的组织模式,第四个层次为对网络信息进行分布式组织的数字图书馆,其组织的资源己经远远超出网上信息的范围。9.1.3 网络信息资源组织的三个层次:语法信息、语义信息和语用信息分别对应着信息的形式、内容和效用三个层次,与此相关,语法信息组织、语义信息组织和语用信息组织也就形成了网络信息
14、组织方法的三个层次。语法信息组织是以信息的形式特征为依据序化信息的方法。语义信息组织是以信息的内容或本质特征为依据序化信息的方法。 语用信息的组织是以信息的效用特征为依据序化信息的方法。9.1.4信息系统资源组织的发展趋势:理想的网络信息组织模式应是以用户为中心,遵循系统性、实用性、易用性原则,综合运用自然语言和人工语言,充分利用新兴技术和人们经验的积累,朝着更符合用户需要的方向发展。网络信息资源组织模式的发展呈现在以下几个方面。信息描述标准化组织技术智能化 用户界面可视化 组织方法多样化 面向内容的信息组织 面向对象的信息组织 组织活动合作化 9.2网络信息资源管理的相关技术超文本标记语言(
15、HTML):HTML是一个简单的标记语言,它主要用来描述Web文档的结构, HTML文档由两部分组成:一种是HTML标记(tag);另一种是普通文本。HTML的弊端主要表现在:难以扩展交互性差语义性差 它包含了关于如何显示信息的标签,但是标签和数据是结合在一起的,很难进行分割 不允许用户对数据进行变换以便进一步进行处理 对数据只提供了一个“视图,如果你想要得到不同的视图的话,你必须重新生成一个HTML网页;格式既不适合机器分析也不适合人阅读它的源码,而且它的格式要求比较松散,HTML解释器采用的是尽量解释的机制。 可扩展标记语言(XML)XML的组成元素 模式(Schema) 可扩展样式语言(
16、XSL,Extensible stylesheet Language) 可扩展链接语言(XLL,Extensible Link Language) XML是建立在数据由它的创建者和维护者管理这一信念的基础上的,对于那些准备提供内容的个人或团体将可以从中得到最好的数据格式服务。因此,它被认为是“21世纪Web领域的世界语”。 XML的出现大大弥补了HTML和SGML的局限性,主要表现在: XML可以用于本地计算的数据 XML可以为用户提供正确的结构化数据视图 XML允许集成不同来源的结构化数据 XML描述来自多种应用程序的数据 XML通过粒度更新来提高性能 XML的特点 跨平台性 自描述性 灵活
17、性 XML的优势 设计与特定领域有关的标记语言异质系统间的通信开发灵活的Web应用软件 在Web上发布数据 更有意义和更准确的搜索 提供多语种支持 元数据(Metadata) 元数据的概念:元数据即英文的Metadata。是关于数据的数据(data about data)。 IFLA将Metadata定义为:“描述数据的数据,可用来协助对网络电子资源的辨识、描述、指示其位置的任何数据”。 目前出现了很多种元数据规范 ,还有许许多多应用于各个专业领域的Metadata标准 。在众多的元数据标准中,都柏林核心元数据已成为国际上最通用的元数据,也是万维网联盟( W3C)推荐的元数据标准口。元数据在网
18、络信息资源整合方面的作用有: 描述(Description)定位(Location) 发现(Discovery) 评估(Evaluation) 选择(Selection) 从系统的角度审视元数据,元数据的功能:还包括提供浏览及检索的功能、管理功能以及组合各个对象以及藏品的再呈现等。 资源描述框架(RDF) 为多种元数据的交互操作性提供平台。资源描述框架使用XML作为交换和加工元数据的通用语法。 RDF是由W3C组织开发的一种元数据格式,它的模型结构包括资源(Resources)、属性(Properties)和声明(statement)三种对象,采用“资源一属性一属性值”的“主谓宾”结构(或称三
19、元组),提供一种框架容器,并通过XML定义了一套形式化的方法,为机器语义理解的结构基础。目前RDF应用于:资源发现,以使搜索引擎功能更强定位(Location) 智能软件,实现知识的共享与互换 描述站点及其相关的内容,即站点编目等RDF有两个重要特点:1.独立性 ,它可以嵌入DC元数据,也可以嵌入别的类型的元数据。 2.使用XML作为其描述语法,xML摒弃了SGML过于复杂及不利于在Web上传送的选项功能,又弥补了HTML过于简单的不足,是目前最具发展前景的标记语言。 本体(Ontology)是共享概念模型的明确的形式化规范说明。这包含4层含义:概念模型(conceptualization)明
20、确(explicit)形式化(formal)共享(share)Ontology的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。9.3.1 网络信息资源的检索网络信息检索自身的特点主要表现在:必须借助网络检索工具基于超文本结构检索方法的多样性多媒体检索网络信息检索的一般步骤有七个主要过程:明确检索需求确定检索范围确定有效的检索词构造合适的检索表达式选择合适的检索工具正式检索评价检索结果网络信息资源的一般查询方法有:基于超文本的信息检索基于目录的信息检索基于搜索引擎的信息检索影响网络信息检
21、索的因素:信息资源质量检索软件用户水平等 信息资源质量对信息检索的影响 :1.信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。2.信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。3.信息资源分散、无序、更换、消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。4.信息资源由于版权和知识产权问题,也给信息检索带来麻烦。5.信息的语言障碍问题。检索软件对信息检索的影响 :1.互联网上的信息存放地址转换和更名频繁,根据检索工具检索的结果并不一定就能获得相应的内容2.基于一个较广定义的检索项,往往会获得数以千万计
22、的检索结果,而使用户难于选择真正所需的信息。3.每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。用户水平对信息检索的影响 :1.用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。2.用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率。3.用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。4.用户的外语水平影响着信息检索的广度与深度9.3.2 网络检索工具;搜索引擎是一种信息搜索的软件。狭义理解,它是利用网络自动搜索技术(Robot)对网络资源进行搜集、标引、储存和检索的一种技术和系统。广义上,搜索引擎可以看作是提供
23、搜索和分类导航信息查询服务的一系列网站。 搜索引擎的类型(按检索机制划分) :1.检索型搜索引擎 2.目录型搜索引擎 3.混合型搜索引擎 网络信息检索工具的核心是其检索功能。从现有的检索工具来看,它们都已具备诸如布尔检索、截词检索和邻近检索这些基本检索功能。布尔检索指通过标准的布尔逻辑关系词来表达检索词与检索词间逻辑关系的检索方法。 截词检索指在检索式中用专门符号(截词符号)表示检索词的某一部分允许有一定的词形变化,因此检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词,结果中只要包含其中任意一个就满足检索要求。 邻近检索(proximity search):通过检索式中的专门符号来规定检索词在结果中的相对位置。 准字段检索 :虽然网络信息实际上不分字段,但是以万维网为用户界面的网络信息检索工具设计了类似于字段检索的功能 。许多网络检索工具可让用户选择是否要求分辨检索词的大小写。区分大小写检索功能尤其有助于对专有名词的查询。 高级检索功能:加权检索自然语言检索 相关信息反馈检索 模糊检索 概念检索 与检索相关的功能:检索提问的修改与限制按相关度排列结果 检索与浏览相结合 检索结果的翻译和多语种检索 英文综合型网络信息检索工具 :检索型网络信息检索工具浏览型网络信息检索工具 集
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商业车库租赁合同及停车场安全管理服务协议
- 公共设施环境保护管理体系与维护措施
- 活动策划与执行及宣传物料制作合同
- 2025年康家滩小学食品采购标准计划
- 旧村改造项目彩钢板房拆除及补偿协议书
- 厕所施工安全监管与责任协议
- 户外探险活动参与者健康保障措施
- 医院墙面瓷砖铺贴技术措施
- 残疾人协会专职委员职务聘用协议书
- 彩票站与公益慈善机构合作协议
- 大象版小学科学三年级下册科学全册教案
- 水电站水库蓄水安全鉴定工程施工自检报告
- 2024版土石方工程居间合同协议书范本
- 岗位履职能力评估表
- Unit 1 Section B(1a-Project)课件人教版2024新教材七年级上册英语
- DL∕T 516-2017 电力调度自动化运行管理规程
- 湖南定额说明及计算规则
- DZ∕T 0399-2022 矿山资源储量管理规范(正式版)
- 2024糖尿病酮症酸中毒诊断和治疗课件
- 中国传统艺术-篆刻、书法、水墨画体验与欣赏(黑龙江联盟)智慧树知到期末考试答案2024年
- MOOC 计算机系统局限性-华东师范大学 中国大学慕课答案
评论
0/150
提交评论