(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf_第1页
(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf_第2页
(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf_第3页
(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf_第4页
(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(计算机应用技术专业论文)企业信用综合管理与服务平台的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 企业信用综合管理与服务平台的应用研究 作者简介:李治强,男,1 9 7 7 年5 月生,籍贯重庆人,2 0 0 4 年从师于苗放教授, 研究方向是计算机网络。 摘要 随着诚信社会的到来,以及社会信息化的进一步发展,全国各地区都相应 建立了各自的企业信用系统,不同程度地整合了来自不同渠道的企业信用信息, 在一定范围内实现了政府内部、社会公众与企业之间有效的共享、交换、集成 和再利用,为管理部门提供决策,为公众提供服务。但因目前的信息化水平不 高,没有完善的信用体系,建立企业信用综合管理与服务平台显得越来越重要。 如何有效在更广泛领域实现多种类型的信用数据资源共享,为用户提供了一个 快速检索和交互的平台,合理保存现有系统及资源,降低系统集成费用,服务 于我国信息化战略,有着重大的意义。 长期以来,企业的信用数据只分散在某个或者某几个数据库中,没有很好 的整合共享,没有形成企业“信用名片”。现在企业信用数据比以往任何时候都 需要将数据进行交换和发布,这必然导致越来越多的企业应用访问各种异构数 据源,为了满足这种要求,需要借助一定的技术手段来支持企业的异构数据集 成。 本文对四川省企业信用征信管理系统进行了深入的调研,分析了多源异构 数据的特点及其在信用系统的应用,在此基础上对多源异构数据的抽取、传输、 入库等进行了论述,确定以政府和各中介信用机构中的信用数据库系统和文件 系统相结合,建立信用资源中心数据库的存储方式作为此论文的研究基础。在 这个模型中,结构化数据和非结构化数据可以统一存储和管理,并且采用监控 机制保证非结构化数据的安全与数据的一致性,接着给出了数据的抽取和传输 方法,以及数据服务功能。 关键词:异构数据;数据抽取;数据整合;j d o m ;信用服务 成都理r 人学硕+ 学何论文 a b s t r a c t a l o n gw i t ht h ef a i t hs o c i e t y sa r r i v a l ,a sw e l la st h ef u r t h e rd e v e l o p m e n to f s o c i a l i n f o r m a t i o n ,d i f f e r e n ta r e a sa c r o s s t h ec o u n t r yh a v e c o r r e s p o n d i n g l y e s t a b l i s h e dt h e i rl o c a le n t e r p r i s ec r e d i ts y s t e m s ,w h i c h ,t ov a r i o u se x t e n t s ,h a v e i n t e g r a t e de n t e r p r i s ec r e d i ti n f o r m a t i o nf r o md i f f e r e n tc h a n n e l s ,r e a l i z e dt h ee f f e c t i v e s h a r i n g , e x c h a n g i n g , i n t e g r a t i o na n dr e u s a b i l i t yo fe n t e r p r i s ec r e d i ti n f o r m a t i o n w i t h i nt h eg o v e r n m e n t so rb e t w e e ns o c i e t ya n de n t e r p r i s e s t h e s es y s t e m sp r o v i d e n o to n l yt h ed e c i s i o n - m a k i n gp r o c e s s e sf o rt h em a n a g e m e n tb u ta l s ob e t t e rs e r v i c e s f o rt h ep u b l i c h o w e v e r , d u et ot h el o wi n f o r m a t i o nl e v e la n dt h ei n e f f i c i e n tc r e d i t s y s t e m ,i t sm o r ea n dm o r ei m p o r t a n tt oe s t a b l i s hs y n t h e s i se n t e r p r i s ec r e d i t m a n a g i n ga n ds e r v i c ep l a t f o r m i th a sg r e a ts i g n i f i c a n c et oe f f e c t i v e l yr e a l i z e m u l t i p l et y p e so fc r e d i ti n f o r m a t i o ns h a r i n gi nm o r ec o m p r e h e n s i v ef i e l d s ,p r o v i d e t h ec u s t o m e r sw i t ha ni n t e r a c t i v e p l a t f o r m w h i c hs u p p o r t s q u i c ks e a r c h i n g , r e a s o n a b l yp r e s e r v et h ee x i s t i n gs y s t e ma n dr e s o u r c e s ,r e d u c et h ec o s to fs y s t e m i n t e g r a t i o n ,a n ds e r v eo u rd o m e s t i ci n f o r m a t i o ns t r a t e g y s i n c el o n ga g o ,e n t e r p r i s e sc r e d i td a t ah a sb e e nd i s p e r s e di ns e v e r a ld a t a b a s e s , d a t ah a sn o tb e e ni n t e g r a t e da n df o r m e da st h ee n t e r p r i s e c r e d i tc a r d ”c u r r e n t l y , t h e e n t e r p r i s ec r e d i td a t an e e d st ob ee x c h a n g e da n di s s u e dt h a ne v e rb e f o r e t h i s i n e v i t a b l yl e a d sm o r ea n dm o r ee n t e r p r i s ea p p l i c a t i o n st o a c c e s sa l lk i n d so f h e t e r o g e n e o u sd a t as o u r c e s ac e r t a i nt e c h n i c a lm e t h o d sa r en e e d e dw i t hr e g a r d st o s u p p o r t i n gt h ee n t e r p r i s eh e t e r o g e n e o u sd a t ai n t e g r a t i o n t h i sa r t i c l eh a da ni n v e s t i g a t i o no nt h ee n t e r p r i s ec r e d i tm a n a g e m e n ts y s t e mo f s i c h u a np r o v i n c e ,a n a l y z e dt h ec h a r a c t e r i s t i co fm u l t i p l es o u r c ed a t aa n di t s a p p l i c a t i o ni nt h ec r e d i ts y s t e m b a s e do nt h ea b o v es t u d i e s ,i ta l s od i s c u s s e dt h e e x t r a c t i o n 、t r a n s m i s s i o n 、s t o r e db a c kt ot h ed a t a b a s e s ,a n dd e c i d e dt ou s et h eu n i f i e d c r e d i td a t a b a s es y s t e m sa n df i l es y s t e m su s e di nt h eg o v e r n m e n ta n da g e n c i e sa st h e f o u n d a t i o no ft h ew h o l er e s e a r c h i nt h i sm o d e l ,b o t ht h es t r u c t u r e da n di u s t r u c t u r e d d a t ac a l lb es t o r e da n dm a n a g e dt o g e t h e r as u p e r v i s i o nm e c h a n i s mw a sa l s ou s e dt o e n s u r et h es e c u r i t yo fi l l s t r u c t u r e dd a t aa n dt h ed a t au n i f i c a t i o n i ta l s op r o v i d e da d a t ae x t r a c t i n ga n dt r a n s m i t t i n gm e t h o d ,a sw e l la sd a t as e r v i c ef u n c t i o n k e y w o r d s :h e t e r o g e n e o u sd a t a :e x t r a c td a t a :j d o m ;c r e d i ts e r v i c e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得盛壑堡工太堂或其 他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者导师签名: 学位论文作者签名: 1 年月2 - 日 学位论文版权使用授权书 本学位论文作者完全了解盛都堡王盔堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被 查阅和借阅。本人授权盛壑理王太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位 论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 7 圳年 月 7 t e l 第1 章引言 1 1 研究的目的和意义 第1 章引言 建立以政府信用为基石的企业综合信用综合管理与服务平台是与时俱进的 需要,更是规范道德,约束行为的需要,通过分析来自各个领域的信用信息, 可便捷全面了解和考量企业的社会信用水平。传统的社会信用信息极端分散异 构,以及不对称等,导致难以统一管理和充分利用,已不能适应新形式下的信 息化管理。怎样从软件的角度提高企业或政府部门的工作效率,应对新形势下 的要求,对软件开发人员来说,也是一种需要深入探讨的问题。 企业信用综合管理与服务平台是在现有的法律框架和相关政府部门的帮助 下,针对一批重点中小型企业,利用政府组织和信用中介机构收集、加工企业 信用信息,建立统一的信息综合管理与服务平台,辅助企业建立信用管理制度, 实现对中小型企业的信用调查,监控和提高企业信用形象,并为发展和完善全 国企业信用管理体系做准备。 随着数据库技术和数据交换技术的发展,各个应用系统间数据交换日间频 繁,消耗了大量的人力物力。要集成不同数据源的数据,首先得对交换双方的 数据库体系。因此,利用x m l 作为数据通道就很容易实现数据交换,由于x m l 的自定义及可扩展性,它足以满足各种类型的数据,作为独立平台和设备的结 构化数据表达方式,它实现了计算机之间的对话。 结合现在社会信用信息量大、实时性高等特点,采用x m l 技术和t u x e d o 消 息中间件技术实现异构数据源系统之间的无缝连接。企业信用数据的整合,是 企业信息化发展中的一个现实问题。 1 2 研究与发展现状 1 2 1 信用体系 国内各省市都初步建立起了社会信用系统,研究并出台了相关政策法规, 逐步建设了信用监督体系,完成了部分部门的信用信息归集工作,稳步发展信 用服务体系,各行业信用工作扎实推进,各地信用体系建设也都取得了良好进 展。 国外主要存在以美国为代表的私营征信模式和以欧洲大多数国家为代表的 公营征信模式。建立了基本的行业标准,保证了征信业高起点、高效率建设与 发展。 成都理r 大学硕士学位论文 1 2 2 数据整合技术 国内针对企业不同信息系统数据库的信息共享研究也如火如荼,研究主要 集中在c s 体系结构下,数据信息之问如何连接实现共享,同时对信息进行动 态访问,以实现异构数据库之间数据处理及共享。主要取得以下成果,中国科 学技术大学提出采用“在网络环境下异构数琚库交互访问中数据格式转换”模 式实现,异构数据库交互访问的问题,提出在源数据库与目标数据库之间构建 转换映射表,以实现两者数据格式互相转换为目标。华中科技大学在电力行业 针对异种数据库信息共享采取“基于d t s 技术的电力系统异种数据库互联”i ”, 在电力企业信息系统中,针对己建立的数据库资源和实际存在的多种异构数据 库,为实现不同数据库之间的连接,数据交换和数据共享,利用于异种数据库 互联的数据转换服务( d t s ) ,实现异构数据库间的连接,数据转换及数据传输, 有效降低开发成本和难度。武汉大学针对电力系统中存在不同结构、不同运行 机制的信息系统,各系统相互独立、应用平台和数据库结构存在差异,并且存 在大量的重复数据问题,利用“异构电力信息系统中异构数据库问的数据导换 方法”i 1 0 1 解决数据共享,对于实际的系统电能量采集与分析系统和负荷控制系 统问的数据导换,提出了基于i n t e r n e t 浏览器和对异构信息系统的异构数据库 进行数据导换方法,通过对档案的动态增加、删除、修改实现档案信息统一, 实现了对异构电力信息系统的数据的统一管理,提高了集成系统的整体性能。 武汉交通科技大学提出基于“c s 模式下异种数据库集成技术”,利用v b 提供的 数据环境生成器技术,实现了v i s u a lb a s i c 6 0 应用系统与o r a c l e 数据服务器 的连接,规范异构数据库之间的数据共享操作。另外,有些科研院校对异构数 据的解决方法还有采用“采用数据降维技术实现网络异构数据库分级数据共享” “基于逻辑数据模型的异构数据交换规则研究”! n l 等。 上述方法在一定程度上解决了企业信息系统异构数据的共享问题,但存在 的问题是:异构数据的共享主要基于某些业务系统,在数据的共享实现方式上 具有局限性;异构数据共享范围有限;异构的数据系统都是在数据开发平台基 础上,系统缺乏通用性等。解决方案是:针对具体的行业应用项目,实现数据 库到数据库的交换;适合局域网;安全性和夸平台性能不好;数据库数据抽取 的速度不够高、数据完整性不好等。 1 ,3 课题来源 四川省企业信用征信系统。 2 第1 章引言 1 4 主要研究内容 项目组研究设计了以数据交换为核心的企业信用征信系统,它包括数据采 集终端系统、中心数据管理系统、信用服务系统和数据传输交换平台。对该系 统进行了总体设计,它包括网络结构图、层次结构图、数据流图、数据采集方 式、传输方式等。提供了企业分类监管综合分析功能,支持政府高效、科学、 依法实施监管功能。实现了面向社会公众的网上信用信息发布、信息披露等功 能。 我主要做了以下工作: 1 、参与了整个项目需求调研、总体设计、详细设计和编码,以及最后的系 统联调。在编码阶段,利用b e a 公司的t u x e d o 消息交易中问件,实现了数据的 可靠性传输,保证了数据的安全性、数据交换的及时性和准确性。对数据的自 动抽取、批量录入和有效性验证进行了论述。 2 、提出在该管理系统上添加多项信用数据服务的功能,从而实现深层次的 关联查询和分析,进而从海量数据中提取或挖掘出有用的知识,达到为公众服 务的目地。 3 、本文对“四川省企业信用征信系统”深入研究,提出建立“企业信用综 合管理与服务平台”的重要性,重点对数据流程和传输方式进行了优化,提高 了数据整合效率和质量,减少了数据传输的开销,提高服务的工作效率,实现 信用信息的实时共享,为全面建设诚信社会创造有利的条件。 1 5 论文章节安排 全文共分五章。 第一章是引言,介绍本文所涉及论文的研究意义、背景、国内外研究与发 展现状、作者的主要工作以及本文的章节安排。 第二章介绍了平台所涉及的基础理论知识,重点介绍了多源异构数据库、 x m l 文档解析、消息传输机制和x m l 与数据库等内容。 第三章介绍了平台的总体设计思想。平台涉及四个予系统,每个子系统联 合运行,实现从分布异构数据库中抽取企业信用数据,传输到资源管理中心, 并在中心进行综合管理和信用服务的功能。 第四章介绍了平台部分功能的设计与实现。 第五章是全文的工作总结及进一步的工作建议,也是作者今后进一步努力 的方向。 信用综合与管理服务平台关系政府信用、企业信用和个人信用,本文仅从 3 成都理i :人学硕+ 学位论文 软件角度对企业信用综合管理与服务平台建设的进行了应用研究,限于本文作 者水平,文中难免存在一些缺点和不足之处,敬请读者批评指证。 4 第2 章数据整合技术 第2 章数据整合技术 随着社会信息化进程的深化,诸多因素促使人们对信息资源的综合管理与 利用提出了更高的要求。数据整合技术就是使用某种方法和机制来消除这个障 碍,使不同系统间的数据交换变得通畅,消除了数据的冗余,也实现了数据共 享。 2 1 异构数据库介绍 2 1 1 异构数据库的特征 分布式异构数据库( d i s t r i b u t e dh e t e r o g e n e o u sd a t a b a s e 下称d h d ) 是指 分布在不同地理位置的异构数据库资源,异构的是操作系统、数据库管理系统 或数据库内部表结构等。针对某一特定类型和组织内部的d h d 系统已经比较成 熟和完善。但不同组织、类型和平台的d h d 系统之间进行同步工作,成为新的 研究论文。目前,异构数据库分布计算主具有以下两种实现方式:( 1 ) 对分布在 各个接点上的各种异构数据库都建立用户交互接口,不进行任何模式的集成。 各个成员数据库对全局数据进行分区域分段管理,对本区域以外的数据操作则 通过远程登录进行。此方案简单易行。但用户无法透明地访问数据,并且增一 种新的异构数据库时,必须增加用户接口,实现方法比较烦琐。( 2 ) 采用分布式 数据库系统结构,将物理上分布而逻辑上相关的数据库通过分布式数据库系统 进行管理。系统具有独立性和透明性的特点。用户对任何数据库的操作的如同 在本地进行,不必关心其数据模型、物理位爱等细节。 2 1 2 异构数据库系统的基本状况 习前存在的信息系统基本上都是异构的,而异构的情况有时是纷繁复杂的, 包括数据库管理系统的异构、数据模型的异构、操作系统的异构,甚至还包括 网络传输协议的异构。系统集成的目的就是构建一个操作平台,屏蔽不同信息 系统的差异性,让用户方便地实现访问数据。 解决多源数据库集成一般有两种方法:一是推翻原有的所有系统,重新进 行总体规划,开发一个全新的符合要求的统一的应用系统。但是,重新开发费 用太高,也浪费现有资源,而且用户重新适应一个新的系统需要较长的时期。 同时,需求是不断变化的,人们不可能时时把原有的系统推倒重做一次。二是 编写专门的接口程序,把孤立的异构的系统彼此联系起来。方法虽然比第一种 方法好,但随着项目的增多,接口数目会按几何级数增长,容易造成开发和维 5 成都理1 = 大学硕十学位论文 护接口程序的沉重负担。 为此,设计中的多源数据库应用集成系统应该建立一个数据交换中心,以 解决在转化过程中数据分散、共享困难和数据不一致的问题。数据交换中心的 中心数据库既保存全局性或公共的信息,也可以保存除基本公共信息之外的其 他数据,而实现数据的冗余分布,提高数据安全性和存取速度。这种方式实现 的是各数据库系统之间的联邦方式,既保证各系统内部的高度自治,又实现了 数据共享。 目前集中式数据库中一般采用的结构仍然是传统的三级模式,但是由于数 据库技术在不断发展,这种结构就不能够很好地描述多源数据库集成系统的逻 辑结构。又因在整个集成体系中计算机系统及其软件环境是异构的,因此,集 成系统必须是开放透明的,最好能够跨平台使用,这样才能够适应和满足复杂 环境的需求。这里设想中的系统可以采用目前比较典型的软硬件资源:首先是 网络环境必须能够支持t c p i p 协议。其次是面向对象的数据库管理系统、网络 数据库管理系统以及关系型数据库管理系统,还有各种文件管理系统等。 2 2x m l 技术 2 2 1x m l 简介【1 l 【2 】 可扩展的标记语言x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是一套定义语义标记 规则,这些标记将文档分成许多部件并对这些部件加以标识。瑚l 结合了s g m l 和h t m l 的优点并消除其缺点,使其在w e b 应用中既能利用s g m l 的长处,又保 留了h t m l 的简单性。x m l 实际上是s g m l 的一个子集,它保持了对现有的面向 s g m l 的系统的向下兼容性,与w e b 的结合也使得它们更便于被访问。 2 2 2x m l 特点 x m l 实际上是w e b 上表示结构化信息的一种标准文本格式,其特点可以归纳 为三点:先进特性;灵活性;自描述性。 先进性:x m l 继承了s g m l 的许多特性,x m l 允许使用者创建和使用自己的 标记而不是h t m l 的有限词汇表。这一点至关重要,企业可以用】【m l 为电子商务 和供应链集成等应用定义自己的标记语言,甚至特定行业一起来定义该领域的 特殊标记语言,作为该领域信息共享与数据交换的基础。 灵活性:h t m l 很难进一步发展,就是因为它是格式、超文本和图形用户界 面语义的混合,要同时发展这些混合在一起的功能是很困难的。而x m l 提供了 一种结构化的数据表示方式,使得用户界面分离于结构化数据。所以,w e b 用户 6 第2 章数据整合技术 所追求的许多先进功能在x m l 环境下更容易实现。 自描性:x m l 文档通常包含一个文档类型声明,因而x m l 文档是自描述的。 不仅人能读懂删l 文档,计算机也能处理。l 表示数据的方式真正做到了独立 于应用系统,并且数据能够重用。l 文档被看作是文档的数据库化和数据的文 档化。 另外,x l j l 支持世界上几乎所有的主要语言。并且不同语言的文本可以在同 一文档中混合使用,应用x m l 的软件能处理这些语言的任何组合。所有这一切 将使x m l 成为数据表示的一个开放标准,这种数据表示独立于机器平台、供应 商以及编程语言。它将为网络计算注入新的活力,并为信息技术带来新的机遇。 目前,许多大公司和开发人员已经开始使用x m l ,包括b 2 b 在内的许多优秀应用 已经证实了x m l 将会改变今后创建应用程序的方式。 应用x m l 进行数据交换( 如图2 1 ) ,将减少系统的开销,提高系统的性能。 图2 - 1 数据交换对比 f j g 2 - 1c o n t r a s to fd a t ae x c h a n g e 2 2 3x m i _ 解析技术 随着x l l l 越来越广泛被采用,高效率解析x 壮文档也变得越来越重要,x m l 解析是将x m l 数据从其序列化字符串格式转换为分层格式的过程。x u l 解析器 可以读取、更新、创建、操作一个x m l 文档。 成都理【:人学硕士学位论文 2 2 3 1 文档对象模型( d o m ) 文档对象模型( d o c u m e n to b j e c tm o d e l ) 是一个文档标准,是基于树的文档 对象模型,x m l 文档一次性读入内存中,它方便修改) 【m l 数据和结构,方便导航 ( n a v i g a t e ) ,但其内存消耗很大。 d o m 类是) ( i l l 文档的内存中表示形式。能够以编程方式读取、操作和修改 x m l 文档。x m l r e a d e r 类也读取x m l ,但它提供非缓存的只进、只读访问。这 意味着使用x m l r e a d e r 无法编辑属性值或元素内容,或无法插入和移除节点。 】( m l 数据在内存中表示是常见的结构化方法,尽管实际的) 【m l 数据在文件中时 或从另一个对象传入时以线性方式存储。 2 2 3 2 简单x m l 应用编程接口( s a x ) 简单) 【m l 应用编程接口s a x ( s i m p l ea p p li c a t i o ni n t e r f a c ef o rx m l ) 是 基于事件的模型,适用于处理数据流,即随着数据的流动而依次处理数据。s a x 是基于事件的a p i 中,解析器将向某种监听器发送事件。s a x 基于事件模型,不 需要将整个x m l 存入内存中,读取数据是即可处理数据。s a x 占用内存不大,但 很难同时访问x m l 文档中多处数据。对于特别大的文档,解析和加载整个文档 会很慢且很耗资源。 j d o m 是j a v a 中的对象模型,是j a v a 语言读、写、操作x m l 的新a p i 函数。 j d o m 中大量使用了c o l l e c t i o n s 类,它使用s a x 2 解析器解析和验证x m l 文档, 通过转换器将j d o m 表示输出成s a x 2 事件流、d o m 模型等。 用j d o m 处理现有x m l 文档的大致过程如下:( 1 ) 、用简单无变元构造函数 构造一个o r g j d o m i n p u t s a x b u i l d e r 对象。s a x b u i l d e r 用s a x 解析器从文件 中构造文档。s a x b u i l d e r 侦听s a x 事件并从内存中建立一个相应的文档。这种 方式非常快( 基本上和s a x 一样快) ,j d o m 的速度有值得期待的提高的潜力通过 一个延期的构造器的完成。这个构造器检查x m l 数据源,但当请求的时候才对 它解析。( 2 ) 、用建立器的b u i l d ( ) 方法从r e a d e r 、i n p u t s t r e a m 、u r l 、f i l e 或包含系统i d 的字符串建立d o c u m e n t 对象。( 3 ) 、如果读取文档遇到问题,则 抛出l o e x c e p t i o n ,如果建立文档遇到问题,则抛出j d o m e x c e p t i o n 。( 4 ) 、否 则用d o c u m e n t 类,e l e m e n t 类和其他j d o m 类的方法在文档中建立导航。 8 第2 章数据整合技术 2 2 4 可以解析的x m l 文件 x m l 文件有两种,一种是有效的( v a l i d a t i n g ) 】( m l 文件,一种是格式良好的 x m l 文件。如果一个x m l 文件是格式良好,并且正确地使用了模式,模式中的语 法又是正确的,那么这个文件就是有效的。而如果一个x m l 文件满足x m l 规范 中的某些相关法则,且没有使用模式时,可称这份文件是格式良好的。x m l 必须 是格式良好的,才能够被解析器正确地解析出来。格式良好的) ( i l l 文件必须符 合如下规则”:元素和属性的名称可以由字母、数字和下划线字符组成,首字符 必须是字母或者下划线;文档必须只有一个唯一的根元素,包含了所有其它元 素;对于每一个起始标记,必须有一个结束标记与之相对应( 使用简洁语法的空 元素除外) ;x m l 标记区分大小写,因此起始标记与结束标记必须严格匹配;根 元素内的每个元素都必须嵌套在自己的父元素内;同一个元素不能包含超过一 个的同名属性,除非使用r l a i i l e s p a c e 来限定属性名。 格式良好的( w e l l f o r m e d ) x m l 文档是指一个遵守x m l 语法规则,并遵守x m l 规范的文档。格式良好的x m l 文档除了要满足根元素唯一的特性之外,还包括: 起始标签和结束标签应当匹配,结束标签是必不可少的;大小写应一致:x m l 对字母的大小写是敏感的,和是完全不同的两个标签,所以结束标签在匹配时 一定要注意大小写一致;元素应当正确嵌套:子元素应当完全包括在父辈元素 中。有效的( v a l i d ) ) 【m l 文档是指一个遵守x 札语法规则,并遵守相应d t d 文件 规范的瑚l 文档。 示例:格式良好的x m l 文件 成都百酾科技有限公司 5 1 0 2 0 3 2 0 7 1 2 3 4 私营公司 李永强( 法人 成都四环东三段1 号信工大厦3 0 a - - i ( 企业住所 国税登记证号 地税登记证号 ( 环保严熏超标 9 成都理1 :大学硕士学位论文 ( 发布虚假广告 ( 欠债水还) ( 电予信箱) 1 i y o n g q i a n g 1 6 3 c o d h t t p :m 1 y q c o m ( 企业 2 3t u x e d o 的可靠消息队歹 j o q 是t u x e d o 系统的一个重要组成部分,它提供了一种可靠队列机制,允许 消息按某种排队规则存储到磁盘上或内存中,然后再转发给其它进程。这种存 储转发机制可以保证在两个通信实体之间传递的消息不丢失、不重传,从而保 证交易的完整性。t u x e d o q 提供管理工具和编程接口用于对q 进行管理和操作。 t m o u e u et m o f o r w a r d服务器 竺t l k a q u c d tp l 0 c a l h v i c c l 6 e d q u e u c 蒋4j 删 t p m m m ; t p | a 胛1 一 i - - - - - - - - - - - - - j l o c a l i 蛔u mm i h c - 弋i :二土一 , 服务嚣 9 弋i s h i i 卜 s m i c e 2 - l t p r c m m ; 一1 n t _ r e p l ,- f s y s t c m t “i 硼州 l, 油c m 可靠潲恳队列系统向 jq m a d m i n 图2 - 1t u x e d o 的消息队列0 f i g 2 - 1o u e u eo ft u x e d o 1 0 第2 章数据整合技术 上图左侧为t u x e d o 客户端,右侧为t u x e d o 事务管理器t ,中间为t u x e d o 可靠消息队列系统q 。右侧事务管理器t 提供了两个服务:s e r v i c e l 和 s e r v i c e 2 。在消息队列系统q 中,一个队列域对应一个g r o u p ,t m s q m 是q 的事务管理进程,在该g r o u p 中要进行定义,该q u e u es p a c e 中定义了有四个 消息队列,s e r v i c e l 和s e r v i c e 2 分别是对应于同名的两个服务( s e r v i c e ) 的队 列( 这是一种习惯的命名规则,客户机若请求服务器中的s e r v i c e l 服务,就把 请求消息放入s e r v i c e l 队列中) 。s e r v i c e l 的处理结果放到c l i e n tr p l y l 中, 如果s e r v i c e l ,s e r v i c e 2 在处理过程中发生错误,把错误信息保存到队列 f a i l u r e q 中。 2 4x m l 与数据库 x m l 数据库( n x d b ) 和关系数据库( r d b ) 归根结底都是数据库,也就是数据管 理的工具,当前人们普遍有x m l 数据库比较慢的感觉,这跟x 札数据本身的结 构当然脱不了干系,但更主要的是,x m l 技术本身发展还未完善,到目前关系数 据库的发展已经有3 0 年以上了。 关系数据库里面存放的是事先结构严格定义好的数据,以表和字段的形式 存放。事先未定义的结构的数据是无法放进关系数据库,无法把数据库里没有 的表的记录放到数据库里。 x m l 数据库存放的是x m l 文本,只要是格式良好( w e l l 一f o r m e d ) 的x m l 文本, 都可以随时添加到数据库里去。而x m l 文本本身不仅仅包含了内容还涵盖结构 信息,正所谓一举两得。这就是x m l 数据库可以存取半构造数据的原因所在。 与x m l 文件不同,数据库将不再扮演简单的数据容器。数据库可以相当灵活, 因为可以存储在数据库中的不仅仅是单调而枯燥的数据,还有适合于应用需要 的规则和模式。针对x m l 数据,一般有两种存储方式:一是将其按结构层次拆 分开来分别存于不同字段,二是将x m l 文档原封不动地存入数据库。实际应用 中,后者的应用环境将受到一定限制,因为关系数据库不能很好地处理大容量 的结构化的信息和文本数据。当然,也可以将结构化文本分解成尽可能小的部 分,然后转换成数据库中的字段来存贮,但是这样在数据库的检索、索引方面 会增加许多额外的工作。至于前一种方式,因为关系型数据库并不能很好地支 持层次、顺序、包含等在结构化置标语言中十分本质的关系,所以在开发中也 仍有很多问题要解决。 2 4 1 关系数据库对x m l 的支持 x m l 已成为i n t e r n e t 数据的表示和交换的标准,这就产生了管理x m l 数据 1 1 成都理【大学硕十学能论文 的新需求,而管理数据是数据库所擅长的。因此将x m l 和数据库系统结合是一 个明智的选择。正是基于此,很多现代关系数据库管理系统对其产品进行扩展 以支持x m l 。 对用户来说好消息是四种最流行的数据库系统o r a c l ed a t a b a s e 、i b m d b 2 、s y b a s e a s e ( a d a p t i v es e r v e re n t e r p r i s e ) 和m i c r o s o f ts q ls e r v e r 不仅 能存储x m l 数据,而且还将处理x m l 数据的复杂性隐藏起来,能轻松地调用这 些功能。 2 4 1 1s o ls e r v e r2 0 0 0 对x m l 存储的支持 s q ls e r v e r2 0 0 0 提供了扩展的s q l 语句( f o rx m l 和o p e n x m l ) 来实现x m l 的存储和出版,为熟悉x m l 的用户提供带批注的x d r 构架建立x m l 视图。o p e n x m l 表行集函数来将) 【m l 数据写入数据库中,其语法如下: o p e n x m l ( , , ) w i t h ( s c h e m a t a b l e ) 它处理x m l 文档有以下三步: ( 1 ) 用存储过程s p _ x m l _ p r e p a r e d o c u m e n t 将x m l 文档转换为数据内部的d o m 表示,此时得到就为x m ld o c u m e n th a n d l e r 。 ( 2 ) 用与x m l 的基本元素相联系的模式来创建一个模式( x m ls c h e m a ) ,也可 以用于已存在的表来替代一个模式,此时表的字段名称和x m l 相同。 ( 3 ) 写好后的用存储过程s p _ x m l _ r e m o v e d o c u m e n t 将一个转换好的x m l 文档 从内存中除去以释放存储空间。 2 4 1 2o r a c l e 9 i 对x m l 存取的支持 o r a c l e 9 i 可以用户自定义列( x m l t y p e ,c l o b 或b l o b ) 的方式存贮x m l 文档, 当x m l 以v a r c i i a r 2 或b l o b 形式存贮数据库时,可以用c o n t a i n s 和w i t h i n 及 s q ls e l e c t 来检索x m l ,当x m l t y p e 存贮时可以通过程序接口( s q l 、p l s q l 、c 或j a v a ) 来直接查询或使用e x t r a c t0 ,e x i t n o d e0 及使用o r a c l et e s t 运算 来检索x m l 表中的x m l t y p e 列也可以映射成x p a t h 表达式来检查。 2 4 2x m l 与数据库之间的转换工具 d a t a i m p o r t e r 数据转换器是一种数据库之间的数据抽取、转换、装载工具, 支持o r a c l e 、s q ls e r v e r 、a c c e s s 、d b a s e 、i n t e r b a s e 、d b 2 等数据库。它具 有表达式计算功能,可以在表达式解释器中,对数据源进行计算处理。能可视 化地生成s q l 语句。通过映射表,能方便灵活地建立目标字段和源字段的映射 第2 章数据整合技术 关系。支持多种平台数据库之间的数据转换。对每个数据导入进行任务化管理。 可对每个任务的源数据、目标数据、未导入数据直接管理;在需要对同类型的 多个表数据进行导入时,只需对导入配置进行简单的修改,即可进行,而对于 那些未导入的数据,则可针对出错信息,对导入条件或数据修改后,再次导入 数据。对于日常性数据,还可让系统定时执行。 天星海沙数据转换器,据转换器为o r a c l e 、s o ls e r v e r 、a c c e s s 、d b 2 、 i n t e r b a s e 、s o la n y w h e r e 、d b a s e 、m y s q l 等多种平台数据库之间的方便的数据 转换工具,它具有方便、浏览、编辑和维护界面,通过一套软件操作多种数据 库实为现实,学习起来更是简单轻松。数据转换器具有对各种数据库的统计、 查询、自定义报表、排序、过滤、转换、数据字典、s o l 向导、命令窗口和事务 缓存处理等功能。 1 3 成都理工大学硕士学位论文 第3 章平台的设计 3 1 平台总体结构 3 1 1 平台的网络结构 企业信用平台网络结构( 图3 一1 ) 由4 个部分组成,分别是分布式数据采集终 端系统,资源管理中心系统,消息交换平台,信用管理与服务系统( 包括互联网 网站系统和政务网网站系统) 。每个子系统联合运行,实现从分布异构数据库中 抽取企业信用数据,传输到资源管理中心,并在网站发布的主要功能。 图3 1 平台网络结构 f i g 3 - 1s t r u c t u r eo fn e t w o r kp i a t f o r m 3 1 2 平台业务数据流 平台业务信用数据流( 图3 - 2 ) ,从数据采集终端业务系统出发,直到信息发 布库的过程。其中信用数据采集终端与其业务系统连接,通过信用数据采集终 端完成数据采集、比对、审核,变成标准的x - i l 数据格式;信用数据采集终端 将x m l 数据,通过数据交换系统交换到信用数据资源管理中心系统;数据交换 系统将采集的数据交换到信用数据资源管理中心系统后,经过整合、汇总生成 企业的信用记录数据:被提炼、挖掘出来的企业信用数据,通过信息发布管理 平台发布到信用门户中( 包括政务网网站和互联网网站) ,供各采集终端和公众 访问。 1 4 笫3 章平台的设计 图3 - 2 业务信用数据流 f i 矗3 - 2c r e d i td a t af l o wo fb u s i n e s s 3 1 3 平台的层次结构 平台主要包括三个层次,应用支撵层,应用层和公众服务层。应用支撑层 为应用层和公众服务层的建设提供底层支持,主要包括基于p k l 的安全认证系 统、基于w f 眦的工作流引擎系统、基于w e bs e r v i c e 和褂 l 的服务集成引擎系 统、个性化服务系统和通用电子政务构件系统。 应用层主要分为两大类,即各部门的应用系统和公共的应用系统,公共应 用系统主要包括政务信息系统、互联审批系统、企业信用系统、个人信用系统 和城市一卡通系统。 众服务层主要是建立电子政务门户网站。通过网站为政府、企业、个人提 供多层次的公众服务。 企业信用系统采集分散在工商、税务、银行、公安、海关、卫生、技监、 杜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论