售后服务信息整流与知识增值服务_第1页
售后服务信息整流与知识增值服务_第2页
售后服务信息整流与知识增值服务_第3页
免费预览已结束,剩余11页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、售后服务)信息整流与知识增值服务信息整流和知识增值服务【内容提要】本文提出数字图书馆的主要功能目标是信息整流和知识增值服务; 信息和知识转换是数字图书馆的关键理论和技术问题。 图书馆受到 Internet 的巨 大冲击、不再是文献信息服务的唯壹提供者,数字图书馆如何才能挽回失去的老 用户,吸引新用户?知识管理工程将使数字图书馆成为 21 世纪学习的大平台、 文化知识的大平台和知识资源中心。【摘要题】信息服务1 数字图书馆的信息整流 数字图书馆把传统图书馆的功能由信息的查询和图书资料的借阅扩展到知识服 务的新阶段。实现这壹宏伟目标需要解决许多技术和社会问题,其中有俩个最关 键的技术是信息的整流和

2、知识的创新。前者涉及数字图书馆的知识链建立问题, 后者涉及数字图书馆的信息变换成知识的知识增值服务问题。1.1 数字图书馆的知识链数字图书馆是壹个庞大的数字资料库,包括所有资料的数字化存储,于线网上资 料、多媒体资料、电子出版物等。数字图书馆根据用户对信息的不同需求,将文 本、图片等原件制作成不同数字形式。壹般有纯图像形式,目录文本形式,正文 图像形式,全文本形式和全文索引形式。但关键仍是知识链的建立。为实现知识链信息,数字图书馆将资源分成为元数据和对象数据。对象数据指数 字化的文本、图像、声言、影像等,元数据则指那些描述和管理对象的数据。对 象数据分布式地存放于各地的资源站点内,元数据则集中

3、存放于数字图书馆中心 的超大规模服务器上。用户查询时,中心调度系统通过元数据来调度各对象数据 库以提供服务。知识的控制单位长期停留于文献这壹级上,而人对知识的需求壹般不是以文献为 单位的。 早于 20 世纪 70 年代后期就有专家指出, 知识的控制单位将从文献深化 到文献中的数据、公式、事实、结论等最小的独立的“知识元”。壹旦实现知识 的控制单位由文献深化到“知识元”,大量文献中所包含的“知识元”及关联信 息间的链接将产生极大的知识增值,从而大大推进人类对知识的利用,促进新知 识的创造,从而也将推动知识资源业的重大发展 1 。壹篇文献反映作者的科学研究成果,包含着作者的知识创新的过程。于是文本

4、结 构本身就隐含着对某学科问题的知识链。假如我们把每篇文献的知识见成是人类知识结构中的壹个知识单元,知识单元和 知识结构就组成了个性知识和共性知识的知识系统。个性知识体当下知识的创新 上,共性知识结构则表当下知识的完整性上。于是我们就建立了个性知识和共性 知识的知识链。事实上,专利文献就明显地表现了个性知识单元和人类知识结构 的知识创新链关系 2 。数字图书馆对文本的知识标引,既体现了标引者应用学科知识结构的背景知识的 能力,同时又体现了标引者识别和提炼作者的知识创新点的判断和知识组织能 力。因此,是壹个知识链建立的知识增值过程。1.2 数字图书馆的知识发现知识链的建立过程是知识发现和知识再组

5、织的过程。知识发现的主要目标是采用 有效的算法,从大量现有或历史数据集合中发现且找出最初未知、但最终可理解1)的有用知识,且用简明的方式显示出来。知识发现壹般包含如下几个步骤: 理解相应的问题领域;(2)准备关联数据子集;(3)发现模式(数据挖掘);(4) 所发现模式的后处理;(5)应用发现结果。(1)文本知识结构分析技术 尽管和多媒体信息相比,文本信息显得比较普通,但文本仍然是记载和传播信息 的最主要媒体,因此对文本信息知识发现技术的研究具有十分重要的意义和广泛 的应用前景。文本结构分析的目的于于发现文本表达主题概念的物理组织结构,由物理结构自 动重组主题概念的逻辑结构,实现对文本知识的抽象

6、化和具体化推理检索。文献3 把文本结构分成物理结构和逻辑结构。物理结构 = 标题,段落,句子, 词汇,它表示了文本的组成情况。可采用向量空间模型表示文本及文本各个部 分,进行文本结构分析, 其中主要是文本的层次分析, 从而得到文本的逻辑结构。 逻辑结构 = 主题,层次,段落,句子,主题词 ,它更着重于表示文本所包含的 思想内容和表达的逻辑方式。(2)知识链结构 文本的物理结构是文本的外表形式,逻辑结构体现了作者表达目的的逻辑顺序, 而文本的知识链结构则是作者的目的和灵魂,知识链结构 = 问题,已有解的优 缺点,新解的方案,性能评价,今后方向 。研究文本的目的是为了获得文本的 知识链, 以创建新

7、的知识链。 链,表现了引用文献和被引用文献之间的多种关系。 但它且不完全直接表现知识链关系。文献链是壹种庞大的文献引用系统。知识链 则是壹种巨大的知识引用系统。若能完成这壹巨大的系统,人类将可能进行更有 效的知识学习。1.3 信息整流的实现 知识链是文本知识结构的普遍特性,是人类学习、创新的纽带。信息整流和信息 滤波不同。信息滤波的目的主要有俩点,即过滤掉不关联的文档以及将关联文档 列表分为新的文档和已经查阅过的文档,且按相似度大小排序,对已检索的关联 文档, 通知信息 Agent 不必返回全文文档, 以减少通信费用。 信息整流的目的于 于建立数字图书馆的知识链库,提供知识链服务。信息整流是建

8、立知识链的过程。从全文提取出知识单元,形成独立的知识基础, 构成知识单元库,把各种知识单元库进行链接,构成数字图书馆广泛的知识网络 库。知识网络库形成了学科横向交叉和学科纵向延伸的科学知识体系。描述了人类知 识学习和知识创新的知识网络结点。把人类知识学习和创新活动之间的距离大大 的缩短。于知识网络库中,用户能够跨知识单元库学习所感兴趣的知识,更能够 通过知识单元库直接学习到解决问题的知识和办法。知识单元库的实现是知识网络库建立的基础和关键。已有的信息置标语言 HTML ( HyperTextMarkupLanguage )的超级链接功能使 Web 技术从计算机世界走 向社会、走向千家万户,实现

9、 Web 和数据库的超级链接。 HTML 表现出 Web 显示数据的通用方法,而XML提供了壹个直接处理 Web 数据的通用方法。HTML 着重描述 Web 页面的显示格式, 而 XML 着重描述 Web 页面的内容。 XML 是文 档的各种数字表示方式,用 XML 表示的数字文档能够由计算机处理,也能够供 人阅读。 XML 文档是壹种纯文本文档,能够包含图片、视频或其他多媒体信息, 能够是百科全书,也能够是壹封电子邮件,或壹则天气预报、壹张电子商务交易 单等。如对商品的描述中,若于应用中的名称、质量、价格仍不足以描述壹 个商品的特征时,仍可通过其他模式增加新特征,只要加入的元素于它们各自名

10、域的前后关系中是有效的。这就为知识单元的描述提供了工具,通过 XML 标记 将文本标记成知识单元,继而将知识单元链接成知识结构,实现知识链。 和引文索引不同,于用 XML 实现知识单元的描述中,能够将被引文献中的知识 单元采用指针的方式加以直接标记,于是实现了知识链接的作用。链接(Linking )是 Web 实现关键。 HTML 的链接是单向的有俩个端点源端 和目标端,源端通常是 Web 页的壹个片段,如壹个词语、壹段文本或壹幅图像, 目标端是壹个“资源”。由统壹资源标记( URI )地址指定。 XML 是描述结构化 数据的底层文法,用这种简单文法能够支持种类繁多的应用。预计 XML 将成为

11、 数字图书馆信息整流的基础性语言。2 数字图书馆的知识增值服务 数字图书馆不仅是传统图书馆的数字化,而且是来源极其丰富的网上资源库。通 过对信息资源的深加工和合理、有效的组织,使之成为永久、有序的知识源泉。 数字图书馆不仅要进行信息整流,而且仍要进行知识增值服务。数字图书馆将构 筑起信息和知识转换的社会大平台,为实现全民终身学习、自主学习、随时随地 学习创造条件。2.1 图书馆受到 Internet 巨大冲击Internet 正于成为世界上最大的“图书馆”。网络信息资源的迅猛扩大,越来越 加深了人们对网络的依赖程度,影响和改变着人们选择信息、使用信息的行为和 方式。目前, Internet 上

12、已拥有各种日报、杂志及时事快报、新书报道,世界上 大多数主要的检索系统、数据库均已上网,且且向用户提供信息服务。 Internet 信息服务商以其雄厚的资金投入和先进的技术设备优势,面向企业、面向市场开 发信息产品,图书馆不再是信息服务的唯壹提供者,图书馆传统的信息产品受到 巨大冲击。2.2 数字图书馆的知识增值服务 数字图书馆如何才能挽回以前的老用户,且吸引更多的新用户?这是图书馆转型 的根本所于,是数字图书馆建设的核心。为此,数字图书馆的服务内容和质量要 比目前网上的信息服务更加独具壹格,数字图书馆要向信息实体虚拟化、信息资 源数字化、信息传递网络化、 信息利用共享化、 信息提供的知识化方

13、向转型发展。 数字图书馆发展的优势将于什么地方? 知识增值服务是数字图书馆占领知识服务市场的优势所于。数字图书馆应用系统 应是可扩展的知识服务网络系统。数字图书馆对于有高价值的图像、文本、语言、音响、影像、影视、软件和科学 数据等多媒体信息进行高质量的加工,实现知识增值,且提供于广域网上高速横 向跨库的便捷的数字知识存取服务。由此,我们能够说,数字图书馆的兴起是 Internet 网络技术的巨大冲击;数字图 书馆的发展的强大推动力是人类知识需求速度的猛增。人类不仅需求更多的信 息,而且需要更高质量的知识。 数字图书馆将面向知识增值服务系统的转型发展。2.3 数字图书馆的知识创新 国家创新体系的

14、主要功能,是知识创新、知识传播、知识交换和知识利用。大力 促进和提高知识的生产、传播、交换和利用的水平、规模和效率,是国家创新体 系的基本任务。(1)知识创新过程 知识创新是数字图书馆发展的最主要的动力源泉。信息经过加工和改造形成知 识。知识是人脑创新的成果,是人类智慧的结晶。智慧是人类文明的源泉,是推 动历史发展的永恒动力,是生产力诸要素中的核心。知识壹般可分为陈述性知识、过程性知识和控制性知识。陈述性知识提供概念和 事实,描述系统状态、环境和条件,使人们知道是什么。过程性知识提供有关状 态的变化、问题求解过程的操作、演算和动作的知识。个性知识单元由最小的知识元素“知识元”组成,知识元的不同

15、排列构成了不同 知识单元之间的差异,知识元也是知识结构的最小元素,于知识结构中能够由知 识元直接组成新的知识单元,这就是知识学习和知识创新的过程。(2)知识创新的度量方法 于考虑知识创新度量问题时,我们应尽可能从知识单元和知识结构之间所表现的 特征寻找描述度量的方法。就某壹篇文献而言,它的知识包含有俩个层次。壹个 是局部的,即是围绕该文本主题有关方面的判断、推理、结论等。另壹个是全局 的、总体的,即是相对该学科主题现状的知识增量。比如,壹篇综述性文献,由 于采用知识的提炼和合成技术,它本身的(局部的)知识容量增加了,建立了新 的知识链关系,就有知识创新产生。从知识度量角度讲,我们所研究的知识是

16、事实性的、静态的知识,是关于事物的 分类、属性、事物间关系等的科学事实或客观事实。具体到某壹篇文献而言,知 识是指关于其所研究对象 (主题) 的结构、关系、属性和取值等方面所做的概念、 判断、推理,即有关该主题对象新有的结论。相对学科主题而言,它的知识则指 的是新增加的那壹部分,即知识创新的增量。知识是可学习的、可复制的,而智 慧是不可复制的。目前对知识创新度量最简单的方法是对产生新的知识增量及其 效应的判别和估价。这种估价的结果表现为壹种数量现象,实质上估价知识的增 量隐含着对智慧的测度,因为实现知识创新的根源是智慧,但对智慧的度量目前则是太困难了。(3)信息和知识的变换 科技发展史上的壹条

17、规律说明:当把俩门表面见来毫不相干的学科结合起来的时 候,就可能形成壹门新的学科;当把俩种似乎没有任何联系的现象联系起来,就 可能于科学技术上取得某些进展或突破。不同学科的文献常有内于的联系,包含 隐含的知识或信息, 能够从中重组出全新的知识或信息, 得出全新的推理或结论。 ·隐含信息的关联隐含信息的重组是知识的外化和外延。壹些信息本身没有什么价值,但于它身后 却隐藏着另外壹种很有价值的信息,这种延伸或潜于的信息单元、知识单元,有 壹定的隐蔽性,往往不易被人发现,壹旦被开发出来,且运用到实践当中去,却 可产生不可估量的效益。美国芝加哥大学图书馆研究生院、 信息中心的 SwansanD

18、.R. 等壹直于从事认知科 学和文献内容相互关系的研究,对信息重组和知识创新过程进行了不少研究。由 于他们壹直对文献的隐含信息进行研究,且于研究过程中,利用现代的计算机技 术,设计了壹种新颖的计算机辅助信息检索软件( ARROWSMITH 算法),能辨 别出生物医学文献中俩个词语间的联系,从而进壹步发现隐含信息的关联,促进 新知识的产生。·知识的消息通信 知识元、知识单元、知识结构均以信息的方式于文献中表现,把隐含于文献中的 大量复杂知识元以消息通信的方式连接起来,提高隐含知识的明晰化程度,将是 未来数字图书馆向知识创新努力的关键 4 。知识检索是于知识结构中获取知识的过程,用户能够

19、通过知识单元间接地获取知 识,更能够通过知识元直接获取知识;信息检索只能通过间接的知识单元信息获取文献。知识链接是数字图书馆的核心,是实现数字图书馆从信息服务向知识服务转型的关键技术。因此,采用知识链研究知识标引和检索是合理的,研究知识元、知识 单元、知识结构之间的信息和知识的变换是可实现的。从人工智能观点见,知识是对事实的合理推理的结果。知识的表达和处理能够有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元和知识单元和知识结构之间的继承性,以及如何有效地实现它们之间的消息通信。·信息转换成知识从标引“知识元”层面研究,揭示单篇文献的个体“知识元”信息和某领域共性 “知识结构”的链接关系, 从而找出信息和知识的转换的普遍规律

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论