




已阅读5页,还剩95页未读, 继续免费阅读
(通信与信息系统专业论文)基于xml的智能信息处理研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 x m l已 成为w e b 上数据表示和交换的通用语言。 然而作为一种描述文档结构 的语言, x m l 对语义的表达和处理能力不足,难以 建立智能应用系统。 本论文的 目的就是增强x m l 表达和处理信息的能力,主要针对x m l 的智能信息处理展开, 工作的重点是语义信息的表示、查询和推理。主要做了以下工作: i . 提出了框架到 d t d 的映射方法,将框架的抽象性、表达能力与 x ml的通 用性、灵活性和可扩展性结合起来。提出了由框架模型生成 x d d模型的方 法,用 x d d模型中的单元子句或非单元子句表示框架模型的结构、框架间 的关系以及约束条件。提出了由e -r模型生成x d d模型的方法,用x d d 模型中的单元子句或非单元子句表示e -r模型中的实体、联系和完整性约 束。 z 提出了根据关系代数表达式构造查询子句的方法, 关系代数表达式可以用若 干个x m l 子句描述,并通过等价变换得到查询结果, 证明了该方法的正确性。 提出了利用关系代数运算实现x m l 查询子句求值的方法,并证明了该方法的 正确性。 3 将证明论方法引入到x ml中,建立了基于x ml的证明论。主要内容包括: 建立了基于 x ml的公理系统;给出了假言推理在x d d中的应用形式;论 证了假言推理在x d d中有效性和完备性; 给出了应用证明论方法实现x ml 问题求解的方法和步骤。 4 将归结原理引入到x n l l 中。主要内容包括: 句, 给出了归结原理在x d d中的应用形式 换的过程, 论证了应用归结原理实现x ml 定义了合一指定和x n r 归结子 证明了归结的过程是一个等价变 问题求解的可行性: 给出了应用归 结原理实现x n ii . 问 题求解的方法和步骤。 在此基础上, 建立了一个基于x ml 的智能决策支持系统。定义了该系统的结构,用x d d 描述问题和决策系统中 的知识,并通过归结原理实现决策问题求解。 关键词: x m l , x d d , 框架, e - r 模型, 数据查询, 关系代数, 证明论,问题求解 归结原理,智能决策支持系统 ab s t r a c t x ml h a s r e c e n t l y e m e r g e d a s a s t a n d a r d f o r d a t a r e p r e s e n t a t i o n a n d i n t e r c h a n g e o f we b c o n t e n t s . b u t x ml i s s o l e l y a d e s c r i p t i o n la n g u a g e a n d n o t c a p a b l e o f a l l o w i n g i n t e l l i g e n t a s w e l l a s a u t o m a t i c we b s e r v ic e s . t h e d i s s e rt a t i o n g o e s i n t o s e v e r a l k e y p r o b le m s o n t h e i n t e l l i g e n t i n f o r m a t io n p r o c e s s i n g b a s e d o n x ml . t h e ma i n wo r k s a n d r e s u l t s a r e l i s t e d a s f o l l o ws . l . b y d e r i v i n g d o c u m e n t t y p e d e f i n i t i o n fr o m a f r a m e , t h e f r a m e i s m a p p e d t o x m l d o c u m e n t t o i n t e g r a t e c o n c e p t u a l m o d e l i n g , i n h e r it a n c e a n d i n f e r e n c e m e c h a n i s m w i t h t h e p o p u la r i t y , s i m p l ic i t y a n d fl e x i b i l it y o f x m l . a m e a n s o f r e p r e s e n t i n g f r a m e b a s e d o n x d d ( x ml d e c l a r a t iv e d e s c r i p t i o n ) i s p r o p o s e d . t h e f r a m e s c o m p o n e n t s a r e c o n t e n t s , c o n s t r a i n t s , a n d r e l a t i o n s h i p s , a ll o f t h e m c a n b e r e p r e s e n t e d b y x d d . i t s s e m a n t i c i s a s e t o f x m l e l e m e n t s , w h i c h a r e e x p l i c i t l y d e s c r i b e d b y t h e f r a m e i n s t a n c e s o r i m p l i c it l y d e r iv e d fr o m t h e r e l a t i o n s h i p s a n d s a t i s f y a l l t h e c o n s t r a i n t s . a m e t h o d o f m a p p i n g e - r r e p r e s e n t a t i o n s o n t o c o r r e s p o n d i n g x d d r e p r e s e n t a t i o n i s p r o p o s e d , w h i c h n a t u r a l l y c o m b i n e s t o g e t h e r t h e c o n c e p t u a l m o d e l a n d t h e s t r u c t u r a l m o d e l o f xml d o c u me n t . 2 . a n a p p r o a c h t o f o r m a l i z e a n d e v a l u a t e r e l a t i o n a l a lg e b r a o p e r a t io n s b y m e a n s o f x d d i s p r e s e n t e d . a q u e ry i s f o r m a l i z e d a s o n e o r m o r e x ml c l a u s e s a n d e v a l u a t e d b y e m p l o y m e n t o f e q u iv a l e n t t r a n s f o r m a t i o n o f x d d . a n a p p r o a c h t o f o r m a l i z e x ml c l a u s e s b y m e a n s o f r e l a t i o n a l a l g e b r a i s p r e s e n t e d . a c l a u s e i s f o r m a l i z e d a s a r e l a t i o n a l a l g e b r a e x p r e s s i o n a n d e v a lu a t e d b y e m p l o y m e n t o f r e l a t io n a l a l g e b r a o p e r a t i o n s . 3 . t h e p r o o f t h e o ry b a s e d o n x m l i s p r e s e n t e d . t h e s u b s u m p t io n a n d r e q u e s t o f p r o b l e m i s f o r m a l i z e d b y x d d a n d t h e p r o b l e m i s e v a l u a t e d b y m e a n s o f p r o o f t h e o ry 4 . a n a p p r o a c h t o x m l p r o b l e m s o lv i n g b y m e a n s o f r e s o lu t i o n p r in c i p l e i s p r e s e n t e d . t h e s u b s u m p t i o n a n d r e q u e s t o f p r o b l e m i s f o r m a l i z e d b y x d d a n d t h e p r o b l e m i s e v a lu a t e d b y e m p l o y m e n t o f r e s o l u t i o n p r i n c i p l e . a n i n t e l l i g e n t d e c i s i o n s u p p o rt s y s t e m b a s e d o n x ml i s p r e s e n t e d . t h e p r o b l e m w h i c h s h o u ld b e s e t t l e d a n d t h e k n o w le d g e i s r e p r e s e n t e d i n ) ( d d , a n d t h e p r o b le m i s s o l v e d b y r e s o lu t i o n p r i n c ip l e . t h u s , t h e i n f o r m a t i o n o n t h e we b c a n b e u s e d i n t h e d e c i s i o n p r o c e s s a n d it b e c o m e s e a s y t o s h a r e a n d e x c h a n g e d a t a i n o r a m o n g t h e s y s t e m . k e y w o r d s : x ml , qu e ry d e c l a r a t i v e d e s c r i p t i o n , f r a me , e - r d a t a mo d e l , d a t a r e l a t i o n a l g e b r a ,p r o o f t h e o ry,p r o b l e m s o l v i n g r e s o l u t i o n p r i n c i p l e , i n t e l l i g e n t d e c is i o n s u p p o r t s y s t e m 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。 尽我所知, 除了文中特别加以标注和致谢中所罗列的内容以外, 论文中 不包含其他人已经发表或撰写过的研究成果; 也不包 含为获得西安电子科技大学 或其它教育机构的学位或证书而使用过的材料 与我一同工作的同志对本研究所 做的任何贡献均已 在论又中 做了明确的说明并表示了 谢意 中请学位论文与资料若有不实之处,本人承担一切相关责任 l 内 本人签名: 人7 日 期 y o l f . / . 乡 - 关于论文使用授权的说明 本人完全了解西妥电子科技大学有关保留和使用学位论文的规定,即:研兀 生在校攻读学位期间论文工作的知识产权单位属西妥电子科技大学。 本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学 学校有权保留送又论文的复印件, 允许查阅和借阅论文: 学校可以公布论文的全 邵或部分内容,可以允许采用影印、缩印或其它复制手段保存论文 本 人 签 名 : )l i;e 等 导 师 签 名 : 考, 林 日 期2 ,w. 码- 日 期 z o v 4/ 子 第一章绪论 第一章绪论 1 . 1研究 背景 与 现状 信息技术的发展贯穿 着人类发展的历史, 信息的交流和共享的 程度,代表着 人类文明的发展程度。互联网的出现,极大的促进了 信息的交流和共享。为了充 分发挥互联网的作用,不仅需要更快的处理器和更宽的带宽,还需要建立一种更 有利于交流和对话的机制。为此,需要开发促进相互理解的基本技术。这种技术 必须从最基本的数据表示和信息交换开始, 排除一切平台、 语言的 分歧,以自由、 平等和开放为原则,以人类对现实世界的一致理解为基础,为全人类提供一种全 新的高质量的信息服务。在这种机制下,数据的语义会独立出来,数据不再只是 数据,而是带有语义的信息;处理数据的程序不再是专有的、唯一的,而是共享 的、开放 的。w 3 c ( w o r l d w i d e w e b c o n s o r t i u m ) 开发的可扩展标识语言 x m 0 3 ( e x t e n s i b l e m a r k u p l a n g u a g e ) 就 是 这 一目 标 的 产 物 。 x m l 具 有 简 洁 、 结 构 化 和可扩展的优点,具有良 好的 应用前景,被看作是未来的通用的 数据格式1,” , 。 w e b 是由简单的协议控制的松散的、 开放的资源集合。 x m l 适应w e b 的要求,能 够建立真正的、由开放标准和自 描述数据控制的多层分布式系统。 传统的w e b 体系 结构中,客户端的浏览器将请求发送给h t t p 服务器,服务器通过c g 工 脚本或a s p 代 码来动态生成h t m l 文件以 满足要求。这种结构受到了诸多的限制。如果在客户端 和服务器之间传输的是x m l 文档,那么系统可以 任意的控制数据,还可以设置其样 式以便在浏览器中显示,也可以交给一个代理进行后台处理,无需假设数据的最 终用途。在这种机制下, 服务器与客户机的祸合度要松散的多,系统可以根据客 户的要求编写各类文档, 无需为处理每一类文档编制软件。由此, w e b 开发将由客 户机/ 服务器计算体系迈向 真正的多层模式。 x m l 的出 现和发展将把w e b 推向一个新高 潮, 即第二代w e b -语义网4 t . 4 3 )第一 代w e b 使人们能够通过浏览器对信息进行访问,是一种非自 动化的有限集成的w e b . 语义网使计算机和人类都能够访问信息和服务,是一种自 动化的、支持智能检索 的,由多种主体构成的w e b 。其基本思想是通过在w e b 信息的制作和发布中嵌入机 器可理解的、代表某类知识的标注,使w e b 上的数据不仅能够被机器用于显示, 而 且能够被机器所理解, 从而能够提高信息服务的质量,开拓各种崭新的、智能化 的服务。x m i. 被认为是语义网的基础之一。 x m l 的结构化特性使得它可以保持数据的结构。现有的主流数据库,如s q l 博士学 位论文: 基于x ml 的智能信息处理研究 s e r v e r , o r a c l e , i n f o r m i x 等都提供了 对x m l 的支持,能够直接保存或生成x m l 文 档。 x m l 使得数据在数据库间的交换很容易实现,将成为在数据库之间交换数据的 标准形式。 x m l 有利于数据交换和共享的 特性将为电 子商务, 尤其是b 2 b 带来了 革命性的 冲 击。开放的、基于文本的 x m l 非常适合于服务器之间交换商务信息。 x m l 的可扩展 性和自 描述性使得电子文档可以 在企业的应用程序中自 动传输、处理及存储。不 同 厂商的电子商品目 录可以在一个使用者界面同时显现,信息的搜索变的更为精 确快速,不同网站之间的资料得以 动态共享,强化了使用者与系统之间的聚合性。 m p e g - 7 是m p e g 专家组制定的一 个基于内 容的多媒体描述方案, 对不同 类型的 多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速 有效的搜索 - : a x ,m l 是制定m p e g - 7 中的描述定义语言d d l ( d e s c r i p t i o n d e f i n i t i o n l a n g u a g e )以及描述方案d s ( d e s c r i p 七 1 o n s c h e m a )的基本工具。 x m l 也可用于w e b 上的多媒体应用。w 3 c m a t h m l 工作组制定的m a t h m l 1 . 0 实现了 在w e b 上编写数学公式,促进了数学和科学内容在w e b 上的使用和重用。 x f o r m s 是 基于x m l 的新一代w e b 表单语言, 支持手持设备、电视、桌面的浏览器以及打印机 和扫描仪,满足商业、消费者和设备控制应用的需求。可缩放矢量图形s v g ( s c a l a b l e v e c t o r g r a p h i c s ) 是一 种采用x m l 描述二维图 形的语言,支持矢量图 形、图像和文本。同步性多媒体集成语言s m i l ( s y n c h r o n i z e d m u l t i m e d i a i n t e r g r a t i o n l a n g u a g e ) 是 w 3 c 开 发的 一个x m l 应用, 能 够编排多 媒体 显示, 通 过 进度表实时合成视频、 音频、文 本和图形。 v o i c e x m l 是由 a t 从 语义角 度, x m l 文档相当 于一个由 基本单 元子 句构成的说明 描 述, 因 而支持 x d d 的 应用系统也 可以 处理普通的 x m l 文 档。 x d d 的 这 种 特性以 及它 所具有的 表达和推理能力 使得建立基于 x m l 的智能 信息系统成为可能。目 前, x d d 己 被 用于构 建 语义网 模 型 351 、 建 立 x m l 数 据库中 的 数 据模 型5 1 、 用 于 x m l 数 据查 询 以及建立x m l 规则语言斌。 1 .2 论文的主要内 容与组织结构 w e b 环境下的智能信息技术是w e b 技术发展的主流, 无论是语义网还是m p e g 一了 , 其目的都是使w e b 上的数据不仅能够被机器显示,而且能够被机器理解,从而提供 智能化的信息服务,提高信息服务的质量。尽管x m l 在诸多领域中得到了广泛的应 用,然而x m l 只是从形式上统一了语法表示。作为一种定义文档结构的描述语言, x m l 在实现计算机信息交换的过程中存在很多局限。由于x m l 没有定义应用层语义, 不支持语义完整性约束声明,x m l 对复杂对象语义的描述能力非常有限,而x m l 处 理器本身也不能理解文档的语义。本论文的目的就是增强x m l 表达和处理信息的能 力,主要针对x m l 的智能信息处理展开,工作的重点是语义信息的表示、查询和推 理。各章的具体内容安排如下: 第二章介绍基于x m l 的智能信息处理的基础知识。 包括x m l 的起源、 优点、 基本 语法和应用现状;说明 描述理论中的基本概念和计算模式;x d d 语言的构造过程、 主要特点、基本概念和求解问题的模式。 第三章研究基于x m l 的语义信息模型。基本思路是根据语义信息模型中的概念 集合和概念之间的关系集合构造x m l 的文档结构模型,使得x m l 的文档结构模型与 语义信息模型相关联, 在利用x m l 的文档结构模型与x m l 文档之间的关系使得x m l 文 档与语义信息模型相关联,从而使得x m l 文档能够表示对象的语义信息。主要内容 包括框架模型到x m l 文档类型定义的映射方法和可行性论证;由框架模型生成x d d 模型的方法和可行性论证:由e -r 模型生成x d d 模型的方法和可行性论证。 第四章研究基于关系代数的x m l 数据查询。 目的是在x d d 的计算模式框架内提供 一种高效可行的数据查询方法。主要内容包括由关系代数表达式构造查询子句的 方法和正确性证明;利用关系代数运算实现x m l 查询子句求值的方法和正确性证 明。 第五章研究基于x m l 的证明论。 证明论是数理逻辑中求解问题的基本方法之一。 本章的目的是将证明论引入x m l 中,为基于x m l 的问题表示和求解提供一种系统的 博士学位论文:基于 x m l 的智能信息处理研究 方法。主要内容包括建立基于x m l 的公理系统;假言推理在x m l 中的表达形式、应 用方法和该方法的正确性证明; 应用证明论方法求解x m l 问题的步骤。 第六章研究基于归结原理的x m l 问题求解。 主要内容包括归结原理在x m l 中的应 用形式、求解问题的方法和正确性证明。 第七章将x m l 引入到智能决策支持系统中,建立了 基于x m l 的智能决策支持系 统。主要内容包括该系统的结构、基于x d d的语言 系统、知识系统的构造方法以 及在问题求解系统中应用第六章中提出的基于归结原理的x m l 问题求解方法获得 决策问题的解。该系统不仅能够利用w e b 信息辅助决策,而且便于实现系统内部和 系统之间的信息交换和共享。 第二章基于x ml 的智能信息处理的理论基础 第二章基于x ml 的智能信息处理的理论基础 2 . 1 x ml 语言 2 . 1 . 1 x ml 的发展回顾 x ml 的全称是可扩展标识语言。所谓标识,就是为了处理的目的,在数据中 加入的附加信息。应用标识法描述结构化数据的形式语言称为标识语言。 首先回顾一下x ml 的发展历史。 x ml 有两个先驱一一s g ml 和h t ml . s g ml ( s t a n d a r d g e n e r e l i z e d m a r k u p l a n g u a g e )的全称是标准通用标识语言。s g ml 的 前身是i b m公司为解决公司内部大量文档的交换和存储, 于1 9 6 9 年发明的通用标识 语言 g m l ( g e n e r e l iz e d m a r k u p l a n g u a g e ) 。 经过十年的改 进, 由 g m l 发 展成s g m l , 并在1 9 8 6 年被国际标准化组织公布为国际标准i s 0 8 8 7 9 . s g ml 可用于创建各种不 同的标识语言,为语法标识提供了强大的工具,同时具有良 好的可扩展性,因此 在分类和索引数据中非常有用。目前,s g ml 多用于科技文献和政府办公文件中。 但是, s g ml 非常复杂, 其复杂程度不适应互联网上的应用。为此, 在1 9 9 0 年产生 了h t ml 语言。 h t ml 是一个非常简单的s g m l 语言,最早应用于网 络信息传输, 为推动互联网的发展以及信息和知识在互联网上的交流发挥了不可替代的作用。 但h t m l 自 身的缺点限制了 它的进一步发展。 h t ml 难以描述信息语义及其内部结 构, 不能适应日益增长的信息检索要求和存档要求。 h t ml 5( j 表现形式的描述能力 也不足, 无法描述矢量图形、 科技符号和一些特殊的显示效果。 h t ml 松散的语法 规范使得文档结构混乱而缺乏条理。为此,从1 9 %年开始,万维网协会wk专门 成立了一个s g ml 专家小组致力于创建一个新的标识语一言, 它既具有s g ml 的强大 功能和可扩展性,同时又具有h t ml 的简单性。 将s g ml 中所有非核心的、未被使 用的和含义模糊的部分都删除,就得到了短小精干的标识语言一一x ml 。尽管篇 幅只有s g ml 的二十分之一,x ml 却具备了s g ml 的绝大多数优点。1 9 9 8 年2 月, wk正式批准了 x m l 的1 .0 版本6 2 . 1 . 2 x ml 的特点 x ml 以s g ml 子集的形式出现,它克服了 h t ml 的种种不足, 将互联网上的文 博士学位论文:基于 x m l 的智能信息处理研究 档规范化, 赋予标记一定的含义, 并 保留了 h t m l 所具有的简洁、 适于传输和浏览 的优点, 集s g ml 和h t m l的优势于一身,成为下一代互联网发展的核心。具体 的说,x ml 具备以下一些优点: 1 ,良好的扩展性 x ml 允许用户根据自己的需要制定标记,不要求所有浏览器都能处理这些标 记,也不要求标识语言的制定者制定一个非常详尽全面适合各种应用的语言,这 种方法有利于标识语言 在各个领域中的应用。 2 、形式与内容分离 在x ml 中,显式样式从数据文档中分离出来,放在样式单文件中。这样,如 果需要改动信息的表示方式,无需改动信息本身。x ml 具有自 描述性,x m l 文档 中的标记能够表达一定的语义信息,从而提高了检索的效率。此外,信息之间的 某些复杂关系,如树状结构、继承关系等也在x ml 中得到了实现。 3 ,严格的语法规范 x ml 具有严格的语法要求,提高了文档的可读性和可维护性。 4 、便于不同系统之间的信息传输 x m l 不仅简单易读,而且可以 标识各种文本、图像甚至二进制文件,各种不 同系统之间可以采用x ml 作为交流媒介,使得x ml 成为一种非常理想的通用语 由于这些优点,x ml 自发布之日起,就受到了业界的普遍欢迎和支持,确立 了 其在互联网应用领域数据标准的主流地位。 x m l 已 经渗透到电子商务、网络出 版、移动通信、网络教育等互联网的各个领域,为互联网的进一步发展提供了新 的可能。 2 . 1 .3 x m l 文档的结构is -9 1 1 , x m l 文档的 逻辑结构 一个x ml 文档最基本的构成是: x ml 声明 处理指令 x ml 元素 第二章基丁 = x ml 的智能信息处理的理论基础 ( 1 ) x ml 声明 一个x ml 文档一般以一个x ml 声明开始。x ml 声明是处理指令的一种,用于 为 “ v e r s i o n 属性 ( 指明所采用的x ml 版本号) 、 s t a n d a l o n e 属性 ( 表明x ml 文 档是 否与一个外 部文 档类型定义 相关 联) 和“ e n c o d in g 属性( 指明 x m l 文档所采 用的编码标准)赋值。 ( 2 ) x ml 指令 处理指令为处理x m l 文档的应用程序提供信息。 x ml 解析器不处理这些指令, 而将它们原样传给应用程序。应用程序解释这些指令,按照它们提供的信息进行 处理。 ( 3 ) x ml 元素 元素是x m l 文档的基本单元。某个元素代表文档中一个逻辑组件。元素可以互 相嵌套,形成树形结构。包含所有其它元素的元素称为根元素,包含在根元素中 的元素称为根元素的子元素,子元素还可以包含自己的子元素。 一个元素包含一个起始标记、 一个结束标记和标记之间的数据内 容。 标识是x m l 语言的精髓, 因而标记是x m l 文档的重要组成部分。 为了组织数据更加方便、 清晰, 可以 在x m l 文档中引入c d a t a 数据块,其中所有的内容都可以 看作字符数据。 此外, 还可以在x m l 文档中加入一些用作解释的字符数据,x m l 处理器不对它们作任何处 理。这种类型的文本称作注释文本。 2 , x m l 文档的物理结构 x m l 文档由一个或多个存储单元组成, 这些存储单元称为实体。 所有的x m l 文档 都包含了一个根实体,又称为文档实体。 这个实体是由 x m l 本身给出的, 无需显式 定义就可以使用,它事实上就是由x m l 本身给出的,是x m l 文档解析器的起点。此 外,还需要用到其它一些实体,这些实体都用名字来标识,在文档类型定义中给 出定义。 实体可以分为已分析使用和未分析实体。x m l 语法解析器在处理己分析实体时 把它们作为文档整体的一部分。而未分析实体多用于引用非文本的数据,如二进 制文件、图 像文件或j a v a a p p l e t 程序。 2 . 1 .4 x ml 的应用现状 作为互联网的新技术,x ml 的应用非常广泛。人们已 经普遍认识到了x ml 的 作用和巨大的潜力。 作为s g m l 的简化子集, x ml 在s g ml 的应用领域依然可以发 挥作用,如文档管理、出版系统等。另外,x ml 自 身的特点决定了它在更多的领 博士学位论文:基于 x ml 的智能信息处理研究 域有广阔的应用前景。 1 、设计标识语言 由于x ml 是元标识语言,用户可以利用它定义自己需要的任何标识,形成自 己领域特定的标识语言。该领域的用户可以通过该标识语言交换数据和信息,而 无需担心接收者无法查看。人们已 经利用x ml 为一些领域定义了 领域内的标识语 言 $ 1 。 如化学领域的 c m l ,数学领 域的 m a t h ml ,移动通信领域的w m l 等。 2 、文件保值 x ml 作为一种文件格式,它能用于保存一些需要保值的文件,如政府文件、 公文、 科学 研究报告等。从根本上说, x m l 文 件实际上是包含标识的文本文件, 无需特殊工具支持就可以自由读取。此外,x ml 具有自 描述性。只要阅读者能够 理解定义标记使用的语言,就可以理解文档的含义。 3 ,数据交换 数据交换是x ml 最重要的应用, x ml 使得不同计算机和不同应用系统之间能 够交换数据。数据交换的核心问题是信息的标准化,主要解决信息的可理解性问 题,包括人和机器对信息的理解。而且,更重要的是机器对信息的识别,并能够 根据数据进行自 动处理。 x m l 的出 现, 为信息的标准化提供了有力的工具。 由 于不同的应用领域对数据的要求千差万别, 因此想制定一个通用的数据交换 标准是不现实的。最典型的方法是在同一应用领域制定一个标准,参与者按照这 个标准组织数据,就可以 进行数据交换。 x m l 在数据交换领域的作用主要体现在 以下两个方面。 ( 1 )替代传统的e d i . 电子数据交换 ( e l e c t r o n i c d a t a i n t e r c b a n g e , 简称e d i ) 是x ml 出 现以前的数据 交换标准,它用于在异构系统间交换数据,并进行事务处理,提供了一系列的消 息和格式。 但由于e d i 难以使用和实施费用昂贵等缺点使得它没有成为数据交换的 主流技术。x ml 的出现,使得数据交换更为廉价和方便。 ( 2 )智能代理 智能代理能够理解接收到的数据, 然后做出相应的处理。 如果数据是结构化的 x ml 文档, 智能代理就能够非常容易的利用已有的知识库理解数据。 x ml 的出现, 为智能代理的发展提供了新的推动力。 4 , w e b 应用 由于x ml 是由s g ml 专门为w e b 简化的。 因此x ml 文档将成为we b 资源的重要 第二章 基于x ml 的智能信息处理的理论基础 组成部分, x m l 使得搜索引擎更为智能和准确。 x m l 还可以用于建立多 层w e b 应 用。 ( 1 )集成不同数据源 x ml 文档可以用来描述包含在不同应用中的数据,从w e b 页面到数据库记录 等,w e b 应用的中间层服务程序将这些用x ml 表示的数据整合起来,然后交给客 户端或卜 一步的应用。 x ml 还提供了客户代换包含机制,可以将多个来源的数据 集成在一个文档内显示。 ( 2 )本地计算 x ml 数据传输到客户端后,客户端可以利用x ml 分析器对数据进行解析和操 作,来完成系统所需要的功能。这样就可以合理分配客户端和服务器的负荷。比 如,可以 将数据库记录直接传输到客户端,然后进行排序。 ( 3 )数据的多种显示 由于x ml 将内容和表示分离,x m l 只描述数据的结构和语义,而显示形式可 以通过样式单文件进行描述。因此只需在显示时配置不同的样式单就可以实现多 种显示效果。 ( 4 )网络出版 随着互联网的发展, 网络己经成为一种新的媒体, 人们在网络上发布各种信息, 信息的发布形式和发布语言也多种多样,其中 基于x ml 的显示技术和显示语言发 挥了重要的作用。 ( 5 ) 支持w e b 应用的 互操作和集成 基于x ml 语言, we b 应用可以自 动存取we b 资源和企业应用。 5 、 知 识 表示 i g 5 ) x m l 为人工智能,尤其是知识工程方面的研究成果在w e b 环境中的广泛应用奠 定了基础。 x m l 能够为分布于互联网上的知识提供一种统一的存储和交换格式,真 正实现互联网上知识的交互、重用和共享。建立基于x m l 的知识表示系统,实现要 确立知识表示系统的模型, 再采用x m l 语法描述该模型。基于x m l 的知识表示系统 的具有 一 以下的优点: ( 扮 语法独立,通过x m l 提供统一的语法表示和存储格式。 ( 2 )可扩展性,通过扩展x m l 文档结构模型增加系统的知识表示能力。 ( 3 )可实现多种知识表示方法的综合。 ( 4 )可以 对不同 信息源的信息进行集成,形成统一的文档。 ( 5 )实现不同系统间的数据交流。 ( 6 )标准化,w 3 c 为x m l 制定了标准的数据格式。 博士学位论文:基于x ml 的智能信息处理研究 2 . 2 说明 描述理论 2 . 2 . 1 说明描述理论 说明 描述理论 ( d e c l a r a t i v e d e s c ri p t i o n t h e o ry)是由 逻辑程序设计体系演化而 来的一种公理化理论,它的论域中的数据可以具有复杂的结构。说明描述理论屏 蔽了各种逻辑程序型知识表示语言中原子公式的差异,提取了这些原子公式的共 性,并代之以 一个称为专指系统 ( s p e c i a l i z a t i o n s y s t e m ) 的数学抽象形式。 专指系统 不仅简洁,而且能够用于定义说明 描述及其语义3 6 1 说明描述理论提供了一个为不同数据域中的说明描述定义语义的模板。因此, 通过为数据域创建合适的专指系统,就得到了一个对数据域中的数据进行表示和 计算的框架。 2 .2 . 2 说明描述理论中的基本概念 专指系统是说明描述理论的数学基础,下面给出专指系统的定义。 定义2 -1( 专指系统) :令a , g , s 分别表示对象、基本对象和指定,u 表示s 到p ( a ) 的映射( p ( a ) 表示a 上所有偏射的 集合) 。 满足下列条件的四元组i = - 0 , 称为子句体, ( 说明描述) 下 上的子句c 形式如下: .,llr h ea , b是a 中元素或:上的约束。h 称为子句头, ( b , , b z ,, 助 记 做b o d e ( c ) o t 上的一个说明描述就是t 上的一个子句集。 令c 表示 : 上的子句( h -b , b , ,一, b j a若n = 0 ,则c 称为单元子句,若n 0 , 则c 称为非单元子句。c 的子句头记做h e a d ( c ) ,子句体中的对象和约束分别记为 o b j e c t ( c ) 和c o n ( c ) ,令b o d y ( c ) = o b j e c t ( c ) u c o n ( c ) 。若有。 es 使得c =c 0 , 则c 称为c 的实例。若c 中只包含基本对象和基本约束,则c 称为基本子句。 令p 表示t 上的一个说明 描述。 2 上的映射t , 定义为: 对于每个x c g ,基本对象8 包含在t , ( x ) 中当且仅当存在子句c e p ,以及0 es 使得c o 是基本子句且其子句头是b ,子句体中的对象和约束分别在x 和t - 。 中,即 t , ( x ) = h e a d ( c 。 ) i c e p ,。 e s , c 0 为基本子句,o b j e c t ( c 0 )二 x , c o n ( c 。 ) 二 t - 定义2 -3( 说明描述的语义) : 若p 是定义在: 上的一个说明描述, p 的语义m ( p ) 定义为: m( p ) =u军( 0 ) 其中,中 表示空集; t p l ( 中 ) = t ,p ( ( ) t , ( 小 ) = t , ( t 一 ( (w n 0 2 . 2 . 3等价变换4 2 11 15 6 -5 7 1 说明描述理论中的计算描述是等价变换, 等价变换通过多次使用语义性的等价 变换规则得到问题的解。令p 是问题的描述,m ( p ) 是其语义。问题描述的语义是 博十学位论文:摹 tx ml 的智能信息处理研究 一个语句的集合,其中每个语句都代表应用领域中一个客观存在的、具体或抽象 的对象或关系。求解问 题时, 对p ; 应用等价变换规则得到p 2 . p 。 二,并满足条件: m ( p ) =m ( p i ) =m ( p , ). , , 直到得到p . , p 中包含需要的解。 等价变换规则的一般形式如下: h e a d - - b o d y;b o d y , ; 二; b o d y 其中, h e a d 中包含对象或条件,每个b o d y 中包含过程或对象序列。因此,等价变 换规则也可以表示为: o b j e c t , c o n d i t i o n e x e c u t i o n ,o b j e c t l i s t ; e x e c u t i o n ,o b j e c t l i s t , ; e x e c u t i o n ,o b j e c t l i s t , . 如果h e a d 中的对象与目 标对象匹配并且条件满足, 那么b o d y 被激活, 执行b o d y 中的过程或用其中的对象序列替代h e a d 中的对象。 2 . 2 . 4小结 说明描述理论的子句和说明描述与h o rn 子句和逻辑程序很相似, 但是表达能力 和效率则完全不同。从本质上说,说明描述理论的表达能力更强,应用领域也更 加广泛。在传统的逻辑程序设计体系中,原子公式是唯一的数据表示形式,而说 明描述理论突破了这一限制,允许通过定义合适形式的专指系统来直接表示应用 领域中的数据对象。显然,传统的逻辑程序也可以 看作定义在某些特定专指系统 上的说明描述,因而说明描述理论也可以看作传统的逻辑程序设计体系的一种抽 象。此外,等价变换模式为说明描述理论提供了一种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动物毛发工艺品创新创业项目商业计划书
- 眼动追踪广告效果分析创新创业项目商业计划书
- 园艺植物染色技术创新创业项目商业计划书
- 2025年生态修复工程中生态系统服务功能评估与生态修复工程后期生态修复项目合作模式报告
- 2025年环保产业园循环经济模式与绿色供应链管理报告
- 2025年绿色建材市场推广政策及实施效果评估报告
- 2025年电气工程师考试试卷 电气设计专项训练:电气安全与防护知识
- 2026届江苏省五校化学高三上期中检测试题含解析
- 2025年考研英语(一)阅读理解冲刺押题 高频词汇与长难句分析
- 现代农业科技课件
- 塞力斯招聘在线测评题
- 西方现代思想讲义
- 在线教育行业智能学习与个性化教育方案
- 工程变更流程ECN
- LED电子显示屏系统设计方案
- 高中英语人教新教材选择性必修一全册词汇表和默写表(分单元编排)
- 矿床学全套教学课件
- HG-T 6038-2022 聚乙烯蜡微粉
- 全册(教案)人教精通版英语五年级下册
- 2024年山东高速投资控股限公司校园招聘9人重点基础提升难、易点模拟试题(共500题)附带答案详解
- 中石油吊装安全经验分享
评论
0/150
提交评论