(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf_第1页
(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf_第2页
(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf_第3页
(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf_第4页
(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机应用技术专业论文)基于xml数据展现技术的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 商、韭系统的智能纯是一种发展趋势,它主蒙靠数据挖掘工县对企娥中的数据进行 分析来协助决策。而x m l 的出现使得w e b 电子商务中的数据分析带来了很大的便利。 传统的数据展现制作时繁琐、表现形式单一、缺乏动态交互功能等问题。本文提 出了一种基于x m l 的数据展现方案,洋细分析了) 洲l 技术在信息传递与交慝方面 静优势,并在i n t c m e t ,i n t r a n e t 环境下建立了萋于x m l 的数据藤现生成模型。利用基 于x m i ,技术定义的数摄模型,将展示界面与数据内容分离,降低了数据展现模块与 实际数据源的耦合度,提高了数据展现模块的分析能力和可操作性,同时也为硷业资 源规划系统中,数据展现模块与其它应用系统之间实现应用集成和数搌集成提供了便 利。商务智能中展示盛与数据艨的有效分离也楚该领域直存在的问臌,该方法较好 的解决了企业实际应用的需要。 x m l 具有简单、开放、自我描述舷力、可扩展性以及将内容与显示分开的特性。 通过实际应用项尽证明,建立慕于x m l 的数据展现平螽,并以w e b 应用服务为中心, 利用n e t 平台描绘商务智能下埽订l 展现数据的方法,可以满足企业资源斌划系统 中决策层对数攒展现的实际需要,具有较大的蕊用粒度,能够褰效地掇赢w e b 数据 展现开发的质擞和效率。 关键词:扩展标记语言,商务错能,联机事务处理 华中科技大学硕士学位论文 a b s t r a c t t 1 1 eb u s 血e s ss y s t e mw h i c hp r o v i d e sm ea s s i s t a c ef o rd e c i s i o n m a :k i n gb ya i l a l 河n g d a 慨i nt l l ee n t e r p r i s eu s i n gd a t am i i l i l l gt 0 0 1b e c o m e sa 订c n d h o w e v e r ,也e 印p e a r a i l c eo f x m l t e c h n o l o g ym a k e sd a t aa n a l y s i so ne - b u s i n e s sb a s e do nw e bm o r ec o n v e n i e n c e t h e 昀d i t i o n a lm 弛o do f p r e s e n t i n gd a t ah a ss o m ep r o b l 嘲ss u c ha st h ec o m p l i c a t i o n i nr e a l i z a t i o n ,m el a c ki nc h a n g e so ff o m l a ta n dt l l e1 a c ki nt l l em n c t i o nf o rd y i l 跚i c i n f b m l a t i o ni n t e m c t i o n 1 1 1 ef o l l o 谢n gd o c u m e m 谢l lp r e s e mas o l u t i o no f p r c s e m i n gd a t a , 锄a l y z ct 1 1 ea d v 跗t a g eo fu s 血g ) ( m lt e c l l l l o l o g yf o ri n f o i m a t i o nt r a n s f e ra i l di n f 抽m a t i o n i n t e r a c t i o na i l da tt h es a m et i i n cp r o v i d eam o d e lg e n 髓a t e db ym e a i l so fx m l t e c l l i l o l o g y u 1 1 d e ri n t e m e “i n t r a l l e te n v i r o m e n t t h em o d e ld e n n e db yx m lt e c l l n o l o g yr e d u c e s c o u p l 血gb e t w e e n 1 em o d e lf o rp r e s e n t i n gd a t aa n da c t i l a ld a 恤s o u r c e ,i m p m v e s 也ea b i l i t y o fa i l a l y z i n gd a t ao ft 1 1 em o d e la n dt 1 1 em a n c u v e m b i l i 谚o fs y s t e m ,a n da l s op r o v i d ea c o n v e n i e n c eo nt h ei n t e 铲a t i o nb e t w e e nt l l em o d e lf o rp r e s e n t i l l gd a t a 趴do t h e ra p p l i c a t i o n s y s t e m s x m lt e c h n 0 1 0 9 yi ss 曲p l e ,o p e n ,s e l f - d e s 喇p t i v e ,a 1 1 de x p a n s i b l ea n dh a saf e 栅e d i v i d i n gc o m e n t s 趴dp r e s e n t a c c o r d i n gt o t h ep r a c t i c a lr e q u i r e m e n t ,廿l ed o c u m e n t d e s c i i b e sas 0 1 u t i o nt ob l l i l dap l a t f o mf o rp r e s e n t i n gd a t ab a s e do nx m lt e c l m o l o g ya n d t or e a l i z et l l ea p p l i c a t i o n ,w h i c hm a k e sw e bs e n ,i c ea st b ec e n t e r ,f o rd ”肌l i c a y p r c s e n 廿n gd a t ab a s e do nw e bu s i n g n e tp l a t f o m t h j s s o l u t i o nc a i l s a t i s f ym e r e q l l i 咖e n tf o rp r e s e n t i n gd a t aa n dh a sb i g g e rr e p e t i 廿o n 掣删l a r i 够,m u si m p m v i n gm e q u a l i t ya l l dt l l ee f f i c i e n c yo f t l l er e a l i z a t i o nf i o rp r c s e n t i i l gw c b d a t a k e yw o r d s :l ,b u s i n e s si n t e l l i g e n c e ,o n l i n et r a n s a c t i o np r o c e s s i i 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体, 均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名撇 日期:圳钉月侈日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校 有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅 和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本论文属于 不保密田。 ( 请在以上方框内打“”) 学位论文作者签名:搬 日期加6 年i - 月莎日 指导 日期: 华中科技大学硕士学位论文 1 1 课题背景 1绪论 蓿惑攘零已经广泛袋翅予竣痔、毫薅、爨埝、锻孬等各令行熊秘嚣拳掇转移务秘 管理决策过程,但是这些系统往往只分散在各个职熊部门中,相豆问信息的交流非常 困难,导致决策时常常需骤花费很长的时间来收集、展现所需数搬。随着i n t e m e t 上 多数据滚集成豹售患系绕,嚣梵“镲惑嶷藏,共享舄数据震嚣”黢魏当毒誊数据整理领 域研究和开发的热点。 目前x m l 已经成为i n t e m e t 上信息的表示标准,已经迅速成为包括b 2 b 在线交 易、信息与系统集成、w e b 应用秽门户等耨型i n t e e l 应用的关键技术,旺已经 在理论上被 难疆了其备稳装各释信息源酌麓力,所以建立基于x m l 的数弦溪糯蕴含 巨大的商业潜力。 同时,呶子政务的构建,正经历糟出以技术为中心向数据为中心的方向转变,没 有数据震瑗穗藏没有萤惑交互,邀藏没窍致癀嚣辩致电孑致痔。熬合致务蔷崽瓷源, 建设和改造敢务数据展现方式,将成为今后数年电子政务建设的获键。 近年来,电子商务的威力已开始照现,商务智能其有面向客户、实时性、决策分 辑夔特型1 捌,x 池是一个不霉忽援黪瓣技术。暖l 瓣太捉互动戏絮拣提供了搜两者 与电脑之间的互动交流,利用其可延伸性及自我摘述特性翻,各种信息可在企嫩间的 应用程序中自动传输、处理及存储。煳l 所带来的是一个全新的视野,一种对于整 个囊务智能絮梅在戏念上媳颠覆,露审小企、监也可轻易享受其带来的好处1 4 】。 为了实现各个行业信患瓷源静整合,研镬开发疑有自主的数据展现产晶舆有广泛 的应用前景。 。2 国蠹癸凝凝 1 2 1 传统的数据展示方案 蛋黄瀚肉各类金盈锩感纯管瑾幕统中,决策努瓣震覆酶鬟求并不太多,蠢罄理数 据展现类的需求占了很大比重。这是由于过去的管理体系一直是阐绕报表建立的,业 l 华中科技大学硕士学位论文 务人员可以提供一整套完整的基于报表的业务需求,甚至有一套十分完整的生成报表 的指标体系。由于计算机技术的不断发展与成熟,i n t e m e t 技术的不断扩充,企业信 息化建设不断发展,需要用户能够根据自己企业的实际需要,自行编制数据展现的格 式,随心所欲地在数据展现中实现复杂的业务逻辑。 传统的数据展现制作时繁琐,即使是小部分修改也会由于众多的报表而造成大量 的工作量。用户需求一旦发生改变,就必须联系开发人员对系统进行更改,造成大量 人力、物力的浪费。 传统的数据展现还有以下几点不足: 1 看似功能强大,真正用上的并不多。 2 数据展现制作的复杂导致难以找到合适的开发人员。 3 数据展现的权限管理集成困难,增加权限项几乎不可能。 4 前端开发人员往往会陷入无休止的制作与修改之中,大大增加了人力资源成 本。 5 前端展现程序难以产品化。 1 2 2 以x m l 为标准的数据格式 x m l 是关注于数据内容的,同时也可以提供数据的显示与交互。这样就使得x m l 对于数据展现方面,具有比h t m l 提供了更为强大的优势。 1 x m l 提供了一种功能强大、灵活高效地表达数据内容的方法。 2 x m l 具有很强的可扩展性( 通过定义新的d t d ) 。 3 x m l 中的数据内容与具体应用无关,这使得用它表示的数据具有很好的使用 效率和可重用性,这一点在通过网络数据时表现得更为明显。 4 ) ( 1 订l 通过d t d 使得所包含的数据具有自解释性。 5 x m l 通过在h t m l 页面中嵌入数据,大大地扩展了h t m l 在及网上的应用范 围。 通过对x m l 数据的处理,这些内容能被自由的组合,被各种应用程序,无论是 w e b 程序还是桌面程序等呈现和处理。不同类型的数据在x m l 下可以用统一风格显 示 5 】a 华中科技大学硕士学位论文 1 2 3 采用w e b 服务技术实现数据展现 在x m l 基础上发展起来的w e bs e r v i c e 技术是基于标准的技术,它统一封装了 信息、行为、数据及流程,可以将运行在通过i n t 珀n e t 、e x t r a n e t 或i n t e m e t 连接的分 布服务器上的各种应用集成在一起。根据w 曲s e r v i c e 的信息,w e bs e r “c e 通过w s d l 来描述,通过s o a p 作访问,在商业注册中心( u d d i ) 中进行注册,u d d i 就有了关 于这个w e bs e i c e 的服务描述,w e bs e r v i c e s 请求者查找操作在u d d i 中检索到全 程的服务描述进行调用,在进行调用时,u d d i 绑定w e bs e r v i c e 的提供者和请求者, 使其直接进行行为、数据和流程的调用。w e bs e i c e 体系架构模型展示了这些操作, 并提供这些操作的组件以及它们之间的交互【6 】。 我们可以把w e b 服务想象为通过因特网或企业内部网连接调用其方法的组件, 或者把它想象为通过w e b 提供其接口的组件。w e b 服务建立在对开放标准x m l 广泛 接受的基础上,w e b 服务使用x m l 序列化其客户端收发的数据。即使客户端和w e b 主机使用不同的操作系统,或者应用程序以不同的程序语言开发,只要客户端程序可 以解析l ,那么它就可以使用w e b 服务返回的数据。 w e b 服务是利用x m l 消息来传递数据的技术,所以编写w e b 服务的时候尤其要 精心的使用x m l 架构和w s d l 来设计消息的结构。从设计消息结构开始,w e b 服务 需要接收和返回的数据类型就变得清晰了。使用x s d 和w s d l 来设计消息结构,可 以通过w e b 服务定义一个标准的接口,让客户端程序设计的开发者直接调用即可。 1 3 课题主要研究工作 本文主要将x m l 与商务智能下的数据展现结合,实现企业b i e r p 系统中数据 展现的相关问题,通过分析企业应用系统中相关数据的提取,以及数据的展现方式, 借助于n e t 开发环境,建立商务智能下数据展现模型,从理论上研究x m l 数据展现 原理:另一方面,深入研究订l 下动态数据展现技术,实现企业商务智能系统中关 键的一部分动态数据展现功能,为企业应用系统的开发提供理论依据。 本文各章内容安排如下: 第一章绪论,介绍了传统数据展现不足、x m l 为标准的数据展现优点以及本课 题主要研究内容。 华中科技大学硕士学位论文 第二章着重讨论了x m l 数据展现与商务智能间的关系,及商务智能与x m l 结 合后给企业应用系统所带来的优势。 第三章通过分析x m l 数据展现的基本思想,简单地描述了一种数据展现工具, 从实际应用的角度简单地用x m l 描述了相关数据展现方法。 第四章提出了在n e t 环境下使用w e b 解决方案实现企业数据展现的基本方法, 并给出了相关模型图。 第五章提出基于x m l 的商务智能动态数据展现方案,并根据实际应用给出实例。 第六章对全文的研究进行了归纳总结,指出研究中存在的不足之处,并给出下一 步的研究方向。 4 华中科技大学硕士学位论文 2 x m l 数据展现与商务智能 2 1 x 札产生的背景 x m l 同h t m l 一样,都来自s 饥l d a r dg e n e m l i z e dm 啦u pl a l l g u a g e ,即标准通用 标记语言,简称s g m l 【”。早在、c b 未发明之前,s g m l 就已经存在。s g m l 是一种 用标记来描述文档资料的通用语言,它包含了一系列的文档类型定义( 简称d t d ) , d t d 中定义了标记的含义,因而s g m l 的语法是可以扩展的。s g m l 十分庞大,既 不容易学习,又不容易使用,在计算机上实现也十分困难。于是w c b 的发明者一欧 洲核子物理研究中心的研究人员根据当时计算机技术的能力,提出了h t m l 语言。 h t m l 只使用s g m l 中很小的一部分标记,例如h t m l 3 2 定义了7 0 种标记。 为了便于在计算机上实现,h t m l 规定的标记是固定的,即h t m l 语法是不可扩展 的,它不需包含d t d 。h t m l 这种固定的语法使它易学易用,在计算机上开发h l 的浏览器也十分容易。正是由于h t m l 的简单性,使w c b 技术的发展如日中天【酊。 近年来,随着w e b 的应用越来越广泛和深入,人们渐渐觉得h 1 m i ,不够用了, h t m l 过于简单的语法严重地阻碍了用它来表现复杂的形式。尽管h t m l 推出了一 个又一个新版本,已经有了脚本、表格、帧等表达功能,但始终满足不了不断增长的 需求。另一方面,这几年来计算机技术的发展也十分迅速,已经可以实现比当初发明 创造h t m l 时复杂得多的、e b 浏览器,所以开发一种新的w e b 页面语言是必要的, 也是可能的。 在这种形势下,w e b 标准化组织w 3 c 建议使用一种精简的s g m l 版本一一s m l 应运而生了。x m l 是一个精简的s g m l ,它将s g m l 的丰富功能与h l 的易用性 结合到w e b 的应用中。x m l 保留了s g m l 的可扩展功能,这使v i l 从根本上有别 于h l 。x m l 要比h 刚l 强大得多,它不再是固定的标记,而是允许定义数量不 限的标记来描述文档中的资料,允许嵌套的信息结构。h t m l 只是w 曲显示数据的 通用方法,而x m l 提供了一个直接处理、e b 数据的通用方法。h t m l 着重描述w e b 页面的显示格式,而) m m 蓿重描述的是w e b 页面的内容( 如图2 1 所示) 。 华中科技大学硕士学位论文 幽2 1x m l 的发展历程 x m l 中包括可扩展格式语言x s l ( e x t e n s i b l es t y l el a n g l l a g e ) 和可扩展链接语言 x l l ( e x t e 璐i b l el i n k i i 唱l a n g u a g e ) 【9 】。 x s l 用于将x m l 数据翻译为h ,r m l 或其它格式的语言。x s l 提供了一种叠式页 面c s s 功能,使开发者构造出具有表达层结构的w e b 页面来,以有别于x m l 的数 据结构。x s l 也能和h t m l 一起构造叠式页面。x s l 可以解释数量不限的标记,它 使w e b 的版面更丰富多彩,例如动态的文本、跑马式的文字。此外,x s l 还处理多 国文字、双字节的汉字显示、网络的各种各样的处理等。 x l l 是l 的链接语言,它与h t m l 的链接相似,但功能更强大。x l l 支持 可扩展的链接和多方向的链接。它打破了h t m l 只支持超级文本概念下最简单的链接 限制,能支持独立于地址的域名、双向链路环路、多个源的集合链接等。x l l 链接可 不受文档制约,完全按用户要求来指定和管理。 总之,x m l 使用一个简单而有灵活的标准格式,为基于w e b 的应用提供了一个 描述数据和交换数据的有效手段。h t m l 描述了显示全球数据的通用方法,而x m l 提供了直接处理全球数据的通用方法【lo 】。 2 2x 札应用于数据展现的优点 1 可扩展性 6 华中科技大学硕士学位论文 x m l 是设计标记语言的元语言,正如j a v a 让使用者声明他们自己的类,x m l 让 使用者创造和使用他们自己的标记。不同企业有不同的商业数据,而且系统的发展和 变化会导致数据格式的改变,可扩展性使用户可定义自己的数据语汇【1 ”。 2 简单性 x m l 是s g m l 针对w e b 简化的子集,简单易用,易于实现。为了使x m l 易学 易用,) a l 精简了一大片s g m l 难得用一次的功能。正如几十万汉字中常用的只不 过八千,s g m l 常用的部分只占2 0 ,x m l 抛弃了s g m l 中不常用的部分,使它一 下子就精简了8 0 。 3 自描述性 x m l 文档实例包含关于其内容的“元信息”和对它的d t d 或s c h c m a 的引用, 一个应用程序可以根据d t d 或s c h c m a 灵活处理不同的v i l 形式的信息,提高了通 用性。文档里的数据可以由v i l 使能的( x m l a w a r c ) 应用来创建、查询和更新, 跟处理传统的关系型数据库、面向对象数据库里的数据类似。l 甚至还能用来表 示那些以前不被看作文档但是对传统的数据库来说又过于复杂以致难以处理的数据。 所以,x m l 文档被看作是文档的数据库化和数据的文档化。 4 开放标准 l 基于的标准是为w e b 进行过优化的。微软和其他一些公司以及w 3 c 中的 工作组正致力于确保x m l 的互用性,以及为开发人员、处理人员和不同系统和浏览 器的使用者提供支持,并进一步发展x m l 的标准。 x m l 包括一套相关的标准: 可扩展标识语言( x m l ) 标准,这个标准可用于w e b 和工具的开发。 文档对象模式( d o m ) 标准,这为结构化的数据编写脚本提供了标准,这样开发 人员就能够同计算机在基于x m l 的数据上进行交互作用。 可扩展类型语言( x s l ) 标准,这是一个工作草案。x s l 有两个模块:x s l 转换 语言和x s l 格式化对象。转换语言可用来转换订l 以满足显示要求。由于x s l 的 两部分是模块,转换语言能够独立的用来进行多用途的转换,包括把x m l 转换成结 构完整的h t m l 。c s s 可应用于结构简单的x m l 数据,但不能以不同于信息如何传 递来的方式显示信息。 可扩展链按语言( x l l ) 标准和x m l 指针语言( x p o i n t e r ) 标准是当前的工 用草案。x l l 提供类似于h 删l 的链接,但功能更强大【羽。例如,链接可以是多方向 华中科技大学硕士学位论文 的,可以存在于对象上而不仅仅是页面上。i e 5 内在不支持x l l 。 x m l 基于开放的技术和行业标准。摆脱了s g m l 的复杂,却集成了它的保值特 性。x m l 实现了显示和结构化数据的分离,允许不同来源的数据无缝集成以及对同 一数据的多种处理。从数据描述的角度看,x m l 是灵活的、可扩展的、有良好的结 构;从数据处理的角度来看,它足够简单且易于阅读、学习及处理,因此x m l 技术 非常适合于打造随需应变的商务智能。 2 3 数据集成与x 札技术 2 3 1 数据集成发展趋势 现代,由于竞争的激烈导致许多企业不断扩张,同时企业的业务系统越来越多, 导致企业内信息孤岛现象越来直严重,随着市场的变化、客户需求的变化,企业还在 断地增加它的应用。出于降低建设维护成本和提高企业竞争力的考虑,对于这么多应 用系统的数据集成己变得迫在眉睫,因而分布在各个应用系统中的数据对数据的统一 访问和使用构成了很大的挑战【“j 。 数据的规范化和标准化是数据集成的基础。数据集成的发展趋势是采用符合标准 且容易扩展的l 技术作为不同系统之间交换信息的标准,各大企业纷纷投入数以 千万计的i t 预算,努力使自己企业的数据实现x m l 兼容。 数据集成是企业信息系统的核心部分之一,它向其他的功能模块提供数据支撑。 旧的流程架构中每种业务都有自己的数据库,这些数据一般是不完整的、不一致的。 为整合数据,一般需要有数据建模、统一数据系统设计开发、原有系统数据的抽取清 洁转换等工作。其中数据信息模型是基础,应该依据业务流程确定数据的要求,建立 完整的信息模型。 然而,目前传统的数据集成解决方案往往具有以下缺点: ( 1 ) 数据转换和整合的规则都融合在定制代码中,发生变化难以灵活地适应; ( 2 1 许多解决方案提供的都是过时的信息,难以实时地获取准确信息; ( 3 1 各个系统只能通过形成中间库、或者集中库的方式来解决数据集成,然而这 样的做法往往又形成了新的数据孤岛; h ) 所有现有的解决方案都很脆弱一一它们要想适应变化的业务需求或数据源, 都要付出高昂的代价。 8 华中科技大学硕士学位论文 2 。3 2 x 眶作为辩务智能数瓣集成的标潦数据格式 将x 瑚l 作为数据集成的标准数据格式可以带来以下好处: l 。异梅应弱之阉粒数据蘩辜 x m l 的灵活性、扩展性以及自我描述性,使异构廒用闯的数据欺享成为可能。 由于x m l 的自定义性及可扩展性,它足以寝达各种类型的数据。x m l 解决了数据的 统一援舀闻题。缀是,与其继瓣数撂特递椽埏不同静是,x h 纯著没鸯定义数据文体 中数据出现的其体髋范,丽怒强数据中附加t a g 来表遮数据的逻辑络梅和含义。这 使x m l 成为一种程序能自动理解的规范们。 2 数据检索 涟着商务网络信怠纯藐发溪,强大懿数精检索己藏必其内在楚霭袋。x 鹾l 鹃扩 展性和灵活性允许它描述不同种类应用软件中的数据,从描述搜索的w e b 页到数据 记澈,从而通过多种应用得到数据。如果没有) ( i 讧l ,搜索软件必须了解每个数据库 是舞搴萃掏建麴,毽这实嚣爨不霉戆麴,阂淹每令数撂艨攘邃数攥戆掺式凡乎黎愚不 同的。x m l 能够使不同来源的结构化的数据很容易地结含在一起。软件代理商可以 在中间层的服务器上对从后端数据库和其它应用选上来的数据进行集成。然后,数据 就熊被改善到客户或其毽鞭务器敲进上步戆集合、处理粒矮发。 3 数据长久保留 x m l 基于开放的技术和行业标准,摆脱了s g m l 的过分复杂,却继承了它的保 值特性。采用x m l 作为资料数据的长久缣菇格式,其意义重大。 4 集成不同数据源 基于x m l 的数据传送到用户后,客户端可以对这然数据进行解析和操纵,完成 应孀系统要求的功能。这些本地计算不需婺与服务器的额外通信,这样有利于在服务 器移客户之阕合疆分配诗冀瓣l 铡。 5 数据的多种显示 ) 。订l 还可以通过简单开放扩展的方式描述结构化的数据,l 补充了h t m l , 攘广泛这霜寒攒逑应雳界嚣。 疆闻,绉述数攥豹鳋残,聪x 鹾l 攮述数擐本身。南予 数据显示与内容分开,x m l 定义的数据允许指定不同的最示方式,使数据更台瑗缝 表现出来。本地的数据能够以客户配置、使用者选择或麒他标准决定的方式动态地表 现爨来。c s s 和x s l 为数据豹最示提供了公布豹机制。 9 华中科技大学硕士学位论文 2 4x m l 语法 2 4 1 x 札文档组成 x m l 文档是由字符数据和置标组成的。按照i s o i e c l 0 6 4 6 的规定。合法的字符 包括t a b 、回车、换行以及其他字母和字符。在一个x m l 文档中可能出现6 种置标, 它们是: 元素( e l 锄e m ) 。元素是最常见形式的置标,由“( ) ”定出。通常说明其间内 容的属性。 实体参考( e n t i t yr e f e r e n c e ) 。实体参考以“”开始,“:”结束,用于表示被 预留为置标的字符。 注释( c o m m e n t ) 。注释以“ ”结束。注释能包含除“一”之 外的任何。可以放置在文件内任意置标之间。注释不属于x m l 文档的文本内容。 处理指令( p r o c e s s i n gi n s 仃l 瓜i o n ) 。处理指令提供应用程序信息的出口,格式为 ( ? n a m ep id a t a ) ,它不属于x m l 文档的文本内容。 c d a t a 部分定界符( c d a l 、as e 吐i o nd c l i m i t c r ) 。在l 文件中某些不是置标 的源代码可能被分析程序当作置标,c d j a t a 部分定界符指示分析程序忽视这些代码 的置标特征。 文档类型说明d t d 。文档类型说明d t d 是x m l 文档“扩展”的关键所在。d t d 包含或者指向为某类文档提供语法规则的置标说明。并在文档和分析程序之间就文档 内容交换分析信息来进行约束。分析信息包括:文档允许的标签的顺序和嵌套;属性 值和其类型以及缺省值;可能引用的外部文件名;可能包括的一些外部( 非x m l 文 档) 数据格式。 2 4 2x 札语法规则 帆文档的语法规则简单而严格,有以下8 刹1 4 】: x m l 文档必须以一个x m l 声明开头,声明格式为 每个元素必须包括一个开始标记 和一个结束标记 ,将该元 素的值夹起来,形成完整的配对。 各元素必须正确的嵌套,形成包含关系( 父子关系) 或者并列关系( 兄弟关系) , 华中科技大学硕士学位论文 不允许两元素互相交错。 文档有且仅有一个根元素,为所有元素的父元素。 当元素内容为空时,允许将开始标记和结束标记合写为一个空标记 。 标记对大小写敏感。 标记符后面可以有:属性= “属性名”的设置。 特殊字符,如“ ”等必须用规定的所谓实体参考表示。 2 4 3x 札名称空间 为了避免在不同情况下具有系相同标记名的元素或属性之间的冲突,通过名称限 定元素名或属性在w e b 上的唯一性。例如,通过名称空间可以确定一个地址是邮政 地址还是电子邮件地址或是i p 地址,在名称空间定义里面的标记名必须是互不相同 的。由于通用资源识别符u 王u 在i n t e m e t 上是独一无二的,因此经常把一些u r j 确定 为名称空间,名称空间可以用显示声明或缺省说明。 2 4 4x 札文档的格式 ) m m 文档必须遵守x m l l 0 规范中的语法规则,无论是从物理结构上讲,还是 从逻辑结构上讲,x m l 文档都必须符合规范,才能被正确解释处理。 讧l 文档必须遵守文档类型定义( d t d ) 或x m l 模式( 讧ls c h c m ) 中已声 明的种种规定。 限定x m l 语法的方法有:d t d ,x d r 和x s d l 3 7 j 。 1 文档类型定义( d t d ) 文档类型定义用不同于l 的独立语法来规定了x m l 文档中各种元素集合的 内容模式。该语言直接沿袭了定义s g m l 语言的方法。 但d t d 过于复杂,且d t d 采用的是非x m l 语法规则,不能用x m l 工具进行 操作处理;数据类型定义支持不够,所定义的数据类型有限,并且都是针对属性而设 立,无法满足电子商务等w e b 应用所需要的丰富数据类型;扩展机制复杂,也很脆 弱,最大的问题在于不能表达元素之间的相互关系;d t 【) 不支持名称空间的机制【8 一。 2 m i c m s o r 的x m ld a _ c ar e d u c e d 模式 l l 华中科技大学硕士学位论文 x d r 的全称是x m l d a t ar e d u c e dl a n g i l a g e ,最早先由x m l d a t a 草案派生出 来的一个定义x m l 语言的分支。由于微软最先提出了x m l da 【a ,并且经过修订后 在其软件中应用,所以x d r 也被广泛使用。 3 w 3 cx m l 模式定义语言 最为正式的x i 订ls c h e m 语言是由w 3 c 指定的x m ls c h e m a 规范,简称为x s d ( x m ls c h e md e n n i t i o n ) 。x s d 也提供了数据类型的支持和结构定义的方法郾,。 x s d 己得到了广泛的a p i 和工具支持。x s d 包括三个部分: ( 1 ) x m ls c h e m ap a r t0 :p r i m e r 这是对) ( 1 ls c h e m a 的非标准,提供大量示例和说 明。 ( 2 ) x m ls c h e m ap a r t1 :s 订u c t u r e s 这一部分包括简单数据类型。它解释了内置的数 据类型和可用于限制它们的面( f 配e t ) 。 所以,未来是属于x s d 模式的,而不是x d r 。 2 4 5x _ l 模式 x m l 模式由许多不同类型的组件构成,模式包括声明和定义,“声明”用于指 示可能出现在实例中并通过名称来验证的组件,包括元素、属性和符号:“定义”用 来指示模式内部的组件,如数据类型、模型组、属性组和一致性约束,如下表所示 3 8 】。 1 全局和局部元素声明 元素声明用于给元素指定元素类型名称和数据类型。在咀。模式中通过使用 e l e m e n t 元素实现的。元素声明可以是全局的或是局部的。 全局元素声明出现在模式文档的顶级结构中,可以用在多个复杂类型中。局部元 素声明只出现在复杂类型定义内部。局元素声明只在该类型定义中使用,而不被其 他复杂类型引用或在替换组中使用。 全局属性声明出现在模式文档的最顶层,局部属性声明完全出现在复杂类型定义 中,只能在该类型定义中使用,不能被其他类型重用。 2 简单和复杂类型定义 简单类型既可以命名,也可以匿名。命名简单类型总是在全局定义( 即它们的父 元素是s c h e m a 或r e d e f i n c ) ,要求具有唯一名称;匿名简单类型不能有名称,总是完 全在元素或属性声明中进行定义,且只能被该声明使用一次。复杂类型定义跟简单类 型定义一样。 1 2 华中科技大学硕士学位论文 3 一致性约束 一致性约束可以唯一识别文档中的节点,并确保它们之间引用的完整性。一致性 约束分为3 类:唯一性约束,关键字约束,关键字引用。 ( 1 ) 唯一性约束 使用唯一性约束( u n i q u e ) ,可以验证某些元素或属性的值在某个特定范围内是 唯一的。 ( 2 ) 关键字约束 关键字约束( k c y ) 的组合字段必须是唯一的,而且所有字段的值都必须在文档 中存在。 ( 3 ) 关键字引用 关键字引用( k e y r e f ) 用来保证在实例中的两个数据集合之间存在匹配。它们类 似于数据中的外关键字。 2 5x 札目前存在的问题 x m l 具有良好的数据存储格式、可扩展性、高度结构化、便于网络传输等特性, 使得它非常适合于i m e m e t 上的数据交换和信息发布,将广泛应用于电子商务等许多 领域,但它毕竟刚刚兴起,有待于从以下几个方面进行进一步研究: 有关x m l 文档的数据管理,即如何存储、建立索引、查询等相关内容的研究有 待于进一步展开。 随着x m l 在电子商务中的广泛应用,如何保证在合作伙伴、客户和供应商之间 传递数据的安全性和可靠性,解决授权和认证机制,将成为重要问题u 。 x m l 通过对数据表示方法的改进促进了相关技术的进步,加上业界主要厂商的 大力支持,已经成为下一代网络应用的标准数据格式。 2 6 商务智能原理 现今e i 冲、s c m 、c r m 系统与商务智能的融合进一步展现其魅力所在。的有c i t m 专家认为,商务智能是对前台应用程序和后台应用程序的无缝整合;而对数据仓库专 家而言,商务智能只是一种新的数据库术语,是在一个新的技术平台上提供决策支持 的应用程序;对数据挖掘统计专家来说,商务智能代表的是高级数据挖掘的方法。不 华中科技大学硕士学位论文 同角度展现不同的内涵,本篇将通过各方面比较分析,描绘出商务智能与x m l 结合 应用的轮廓。 2 6 1 商务智能原理概述 商务智能的概念最早g a n i l e rg m u p 于1 9 9 6 年提出,但涉及的技术与理念,在命 名之前就已经存在,起初被称为主管信息系统e i s ( e x e c u t i v ei n f o h n a t i o ns v s t e m ) , 在称为商务智能之前也被称为决策支持系统d d s ( d e c i s i o ns u p p o r ts y 啦m ) 。现今 的商务智能包含多方面内容,已经由简单的概念逐渐转化为较成熟的全方位解决方 案。 1 商务智能 商务智能b i ( b u s i n e s s i n t e l l i g e n c e ) 是终端用户查询和报告( q u 蜘,r 印o r t t o o l s ) 、 联机分析处理、数据挖掘、数据仓库等软件工具的集合,并使用某种数学算法对数据 进行分析并发现规律,从而建立一种商业模型,提供给管理决策层进行模拟分析的全 面解决方案。 商务智能可以被看作一种全方位解决方案。b l 的关键是从异构数据源中提取出有 用数据,进行清理以保证数据的正确性,然后使用e t l 将数据重构合并到数据仓库中, 使数据变为信息,得到企业数据的全局性视图,在此基础上利用适当的工具对其进行 分析和处理,最后将转变来的知识呈现给管理者,为管理者的决策过程提供支持。b i 涉及领域很宽,是集诸多功能为一体的综合解决方案。商业智能应用基本上由三个层 次组成,如图2 2 所示。 2 商务智能管理模式 图2 2 商务智能应用的组成 华中科技大学硕士学位论文 包括基于目标的管理( m a n a g e m e n tb yo b j e c t i v c ) ,指一个企业可能有上百个绩 效目标,b i 可通过横跨企业各职能部门的数据仓库即时计算绩效目标,便于企业了解 自身竞争优势。基于例外的管理( m a n a g e m e mb ye x c e p t i o n ) 是在即时而持续地计算 各种绩效目标前提下,b i 系统还可监测指标与计划目标的偏差。当偏差过大,系统以 多种方式通知有关负责人。例外管理与工作流程的结合可使整个例外处理自动化。基 于事实的管理( m a n a g e m e n tb yf a c t ) 是无论目标或例外,背后支持的力量皆来自于 交易事实。企业营运中通过每日的交易累积了大量的事实与知识,商务智能将企业目 标与例外结合事实,使管理者得以进一步分析原因或趋势,查询并探测相关信息【1 6 】。 3 b i 与d s s 、e i s 的比较 在激烈竞争的市场环境中,正确及时的决策是企业生存和发展的决定性因素。d s s 通过生产和计划的完成情况及相关环境数据进行多角度多层次的分析,使企业的决策 者及时掌握企业的运行情况和发展趋势,并对制定生产、销售计划和长远发展规划提 供参考,能提商企业的管理水平和竞争优势。决策支持智能化发展的,导致了商务智 能的出现。b i 作为一种新兴的决策支持体系,与传统的d s s 、e i s 相比,在以下方面 存在明确的优势: ( 1 ) 使用对象范围 商务智能的使用对象不再像d s s 、e i s 仅局限于企业的领导与决策、分析人员, 而是扩展到企业组织内外的各类人员,为他们提供决策支持服务。 ( 2 ) 具有的功能 从以上分析看出,商务智能具有传统d s s 、e i s 所不具有的强大的数据管理、数 据分析与知识发现能力。 ( 3 ) 知识库状态 传统的d s s 、e i s 中的知识库是在已建立的系统中设置好的,库中的知识很少发 生变化,即使发生变化,也采用定期人为更新的方法修改。而b i 系统是一个闭合循 环的动态系统。数据源部分来自各应用系统的反馈,并且数据挖掘可以从现有的数据 仓库或数据集市中发现新知识,即时对知识库中的内容进行自动修正。所以b i 中的 知识库是一种动态结构。 目前国外商务智能应用较为普遍,国内多数企业商务智能处理还处于企业数据分 散阶段,有的企业通过e r p 实旌后积累一定规模的资料信息,但企业更渴望获得整体 经营成功,这就需要使用商务智能工具分析和理解这些不断增长的资料。因此,一个 华中科技大学硕士学位论文 全方位的b i 解决方案就像企业的“原动力”,可以为企业发展提供源源不断的“能 量”。 2 6 2 商务智能支撑技术 商务智能支撑技术的研究主要围绕两部分展开;企业建模方法研究和决策支持工 具研究。企业建模是为解决如何建立特定企业模式的辅助工具。i d e f ( i c a m d e f i n i t i o n m e m o d ,i c a m i m e r 9 1 a d e dc o m p u t e ra i d e dm a n l 】f a c t u r i n g ) 等研究方法是较程式化 的企业建模方法,比较新的建模方法包括基于统一建模语言u m l ( u n i f i e dm 0 d e l i n g l 髓g u a g e ) 的企业建模等方法。数据挖掘算法的研究是目前计算机界研究的热点之一, 它逐渐成为一个跨越人工智能、数据统计等多学科的研究领域。决策分析工具的研究 还包括各种分析方法的研究。为了使决策具有更高正确度,需要跨越的决策分支也变 得越来越大。因此需要有自动数据分析工具,以帮助减少精确分析大量数据所需的时 间。数据分析与查询还可应用多维度分析( m u l t i d 油e n s i o n a la n a l y s i s ) 、假设性问题 分析( w h a t i f a 衄1 y s i s ) 等各种先进技术【1 8 】。 2 6 3 联机分析处理与商务智能 1 联机分析处理概述 联机分析处理( 0 n l i n ea n a l ”i c a lp r o c e s s i n g ,0 l a p ) 的概念最早由关系数据库之 父e f c o d d 于1 9 9 3 年提出。当时c o d d 认为联机事务处理( 0 l t p ) 已经不能满足终 端用户对数据库查询分析的需要,s q l 对大数据库进行的简单查询也不能满足用户分 析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的 结果并不能满足决策者提出的需求。因此提出多维数据库和多维分析的概念,即 o l a p 。 联机分析处理工具能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论