数据集成接口规范_第1页
数据集成接口规范_第2页
数据集成接口规范_第3页
数据集成接口规范_第4页
数据集成接口规范_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1数据集成接口规范篇一数据集成整体解决方案数据集成整体解决方案继系统集成、应用集成、业务集成之后,最头痛的数据集成(DATAINTEGRATION)已渐被各大企业纷纷触及。目前国内大多数企业还仅停留在服务于单个系统的多对一架构数据集成应用,这种架构常见于数据仓库系统领域,服务于企业的商务智能。早期那些数据集成大家大都是从ETL启蒙开始的,当时ETL自然也就成了数据集成的代名词,只是忽然一夜春风来,各厂商相继推出DI新概念后,我们不得不再次接受新一轮的DI洗脑,首推的有SASDI、BUSINESSOBJECTSDI、INFORMATICADI、ORACLEDI(ODI)等厂商。数据集成,主要是指基于企业分散的信息系统的业务数据进行再集中、再统一管理的过程,是一个渐进的过程,只要有新的、不同的数据产生,就不断有数据集成的步聚执行。企业有了五年、八年的信息化发展,凌乱、重复、歧义的数据接踵而至,数据集成的空间与需求日渐迫切,企业需要一个主数据管理(MASTERDATAMANAGER)系统来统一企业的产品信息、客户信息;企业需2要一个数据仓库(DATAWAREHOUSE)系统来提高领导层的决策意识,加快市场战略调整行动;企业需要一个数据中心(DATACENTER)系统来集中交换、分发、调度、管理企业基础数据。数据集成的必要性、迫切性不言而喻,不断被推至企业信息化战略规划的首要位置。要实现企业数据集成的应用,不光要考虑企业急需集成的数据范围,还要从长远发展考虑数据集成的架构、能力和技术等方面内容。从数据集成应用的系统部署、业务范围、实施成熟性看主要可分三种架构。一种是单个系统数据集成架构、一种是企业统一数据集成架构、一种是机构之间数据集成架构。单个系统数据集成架构,是国内目前大兴土木所采用的架构,主要是以数据仓库系统为代表提供服务而兴建的数据集成平台,面向企业内部如ERP、财务、OA等多各业务操作系统,集成企业所有基础明细数据,转换成统一标准,按星型结构存储,面向市场经营分析、客户行为分析等多个特有主题进行商务智能体现。这种单个系统数据集成应用架构的主要特点是多对一的架构、复杂的转换条件、TB级的数据量处理与加载,数据存储结构特殊,星型结构、多维立方体并存,数据加载层级清晰。企业统一数据集成架构,组织结构较复杂的大型企业、政府机构尤为偏爱这种数据集成的架构,因此类单位具有3业务结构相对独立、数据权力尤为敏感、数据接口复杂繁多等特征,更需要多个部门一起协商来建立一个统一的数据中心平台,来解决部门之间频繁的数据交换的需求。如金融机构、电信企业,公安、税务等政府机构,业务独立、层级管理的组织结构决定了内部数据交互的复杂性。概括来说此类应用属于多对多的架构、数据交换频繁、要有独立的数据交换存储池、数据接口与数据类型繁多等特点。对于企业管理性、决策性较强的信息系统如主数据管理系统、财务会计管理系统、数据仓库系统等数据可直接来源于数据中心,摆脱了没有企业数据中心前的一对多交叉的困扰,避免了业务系统对应多种管理系统时需要数据重复传送,如CRM系统中新增一条客户信息数据后,直接发送到企业数据中心,由企业数据中心面向风险管理系统、数据仓库系统、主数据管理系统进行分发即可。机构之间数据集成架构,这种架构多是应用于跨企业、跨机构、多个单位围绕某项或几项业务进行的业务活动,或由一个第三方机构来进行协调这些企业、机构之间的数据交换、制定统一数据标准,从而形成一个多机构之间的数据集成平台。如中国银联与各商业银行之间的应用案例、各市政府信息中心与市政府各机关单位之间的应用案例、外贸EDI(海关、检验检疫局、外汇局、银行、保险、运4输等)、BTOB电子商务平台等。这类应用属于跨多企业、单位多对多的架构,具有数据网络复杂、数据安全性要求高、数据交换实时性强等特点。尤其这类架构颇具一些特点值得进一步去剖析。因数据集成平台是架于多企业、单位之间,数据的安全性、独立性决定了各企业、单位不得不考虑前置机的部署形式,各企业、单位在业务系统与数据集成平台之间增加一台前置机,则更有利于自有系统数据的独立与安全,也更利于数据平台对数据的获取、分发、交换的统一要求。另外,数据集成平台也要具有更多的技术功能来满足众多单位的众多数据接口、多种数据类型、不一致的数据标准、数据交换的实时性、对数据的抽取与推送(PULLANDPUSH)等业务需求。如数据集成平台需具有数据连通、ETL、数据实时、数据清洗、数据质量、EBS(ENTERPRISESERVICEBUS)、SOA(SERVICEORIENTEDARCHITECTURE)等一些技术与特点。以上三种数据集成架构,一种是对应于某一个应用系统的多对一架构,一种是完成企业内部众多系统之间数据交换的多对多架构,一种是为多个跨企业、单位机构实现某一项或几项业务活动而建立的多对多架构,数据集成的应用差不多都是基于这三种架构,每种架构可能会对应于多种数据集成的应用。国内企业常见的数据集成应用有数据仓库、数据同步、数据交换,随着企业并购、新旧系统升5级、分布系统向数据大集中看齐、电子商务的发展、多个企业单位协同作业等等众多业务需求的诞生,数据集成的应用开始纷繁异景起来。目前大部分数据集成软件厂商都是围绕数据仓库(DATAWAREHOUSING)、数据迁移(DATAMIGRATION)、数据合并(DATACONSOLIDATION)、数据同步(DATASYNCHRONIZATION)、数据交换(DATAHUBS或者叫主数据管理MASTERDATAMANAGEMENT)这5种常见的企业应用形式来发展各自的产品技术。数据仓库(DATAWAREHOUSING)应用数据仓库的发展在国内差不多有近10个年头,数据仓库中的数据集成应用主要是围绕ETL的功能来实现,一般来说其主要功能是将多个业务系统不同种数据类型的数据抽取到数据仓库的ODS(OPERATIONALDATASTORE)层,经过转换,加载存储到星型结构的DW(DATAWAREHOUSE)层,为满足不同主题的展现应用,再向关系型数据库或多维数据库进一步汇总加载,其ETL功能可由手工编程或专业工具软件这两种类型来实现。第一种类型由手工编程到专项ETL工具的应用,这种应用类型是成熟的数据集成软件工具的雏形,是为快速达成项目功能需求为主,满足复杂的业务处理的需要,以ETL为核心应用,开发技术也发挥得淋漓尽致,PB、JAVA、SQL、存储过程、C/C都可能会悉数登场,多一种系统的数据集成就可6能会多于一倍的开发工作量,使数据集成平台更趋于复杂、脆弱。另外,如电信、金融、税务、公安等行业的众多系统集成商针对各自的业务系统也开发有专项的数据集成工具,只是有一定的局限性,拘泥于某一种应用或某一特定的系统环境。第二种类型众多成熟的数据集成软件工具的应用为这一代表,如INFORMATICAPOWERCENTER、IBMDATASTAGE、ORACLEODI、MICROSOFTSISS等,集各种数据接口、ETL、数据质量、实时、数据联邦、分区并行、网格、HA等技术于一身,历练世界众多客户需求多时,具有更宽广的应用、可扩展性强、安全稳定等一些特点。这种应用比较容易理解,对于新旧系统升级、数据大集中时的数据作迁移,使数据更能顺应新系统的结构变化而平稳迁移。在企业并购中很容易产生数据合并的应用,如两个企业的HR系统的合并、财务系统的合并、其它业务系统的合并,当系统需要合并必然产生数据的合并,因此对企业数据进行统一标准化、规范化、数据的补缺、数据的一致性都将导致数据合并。当企业一个系统的业务活动会影响其它多个系统的进程时,对数据的实时性、准确性就第6页共8页尤显重要。如航空公司与航空机场之间的数据同步应用、证券交7易所与证券公司之间的股票信息同步、金融业的汇率信息同步等等,影响数据同步的实时性与可靠性的因素会有网络的连通性、传输效率、数据接口、数据格式等,这些诸多因素都属于数据集成中的数据同步要解决的问题。或者叫主数据管理(MASTERDATAMANAGEMENT)应用,这种数据集成的应用越来越受企业的重视。一般构成企业主要的基础数据分别是客户数据、产品数据、员工信息数据、供应商数据,要从企业多个系统中快速、可靠地建立唯一、完整的企业主数据视图这就是主数据管理。要实现企业主数据管理应用的数据集成平台,必须具备有良好的数据连通性、良好的数据质量探查与分析、良好的数据转换能力等特点。文中上述提到跨多个企业、单位机构的架构就是一个典型的主数据管理应用,如公安局、工商局、税务局、人事局、劳动社保局等这些众多政府机构主要是围绕2个基本主体进行各项事务活动,一个主体是个人,另外一个主体是企业单位,而众多政府机构对这2个主体的信息数据要求重点不同、数据处理顺序有先后,数据变更有各异,数据交换复杂、频繁,而最理想的境界是这2个主体数据能做到最大程度的同步,这就是主数据管理的思想。以上五种数据集成应用解决方案在国内最常见的首当其冲的是数据仓库的应用,最复杂的应用应该是数据交换了,不管是简单还是复杂的应用都以ETL技术为基础,8ETL技术成为了数据集成的核心技术,伴随ETL技术的还有数据连通、数据质量、数据清洗、数据联邦、REALTIME、数据探查等技术,为了提高数据集成的安全性、高效性、可扩展能力,还有SOA、HA、GRID等相关技术作为支撑。ETL(EXTRACT、TRANSFORM、LOAD)数据集成视数据抽取、转换和加载为最基础、最核心的三项技术,这三个执行步骤可根据系统环境特点进行调整顺序,典型的应用有ELT的顺序。如源与目标为同种数据库、或共用一个数据库时,可将数据从源直接抽取到目标然后再进行转换,效率会大有提高,专注此类特点的产品以ORACLE的ODI为代表。数据连通(DATACONNECTIVE)良好的数据连通性是数据集成的能力体现,一般通用的关系型数据库、ODBC、XML等数据连通类型为常见类型,还有一些就是大中型企业常用第7页共8页的ERP、CRM、BPM、OA等应用软件为封闭式的系统,如SAP、SEIBEL、LOTUS等系统的连通,因此良好的数据集成平台需要提供来自更多企业的数据连通接口,抽取源与装载目标的范围也就更广阔。数据质量(DATAQUALITY)数据质量越来越被企业重视,数据质量的技术范围也越发宽广,开始慢慢被剥离出数据集成的范畴。企业不能根据标准不统一、歧义、不正确的数据快速做出决策,只有站在9高质量的数据基础之上做出的决策才不会发生方向偏倚。通常实现企业数据质量管理会包括源数据的探查、数据质量的评估、数据集成、数据的完整和数据的监控这五个步骤。数据的完整一般是指根据现有基础数据作其它数据项的扩展和丰富,如根据客户的联系方式来丰富客户的所属地区数据项、根据客户身份证号码来丰富客户的所属地区、年龄、性别等信息。数据实时(REALTIME)对于实时数据仓库系统、数据同步等应用都会用到数据实时技术,一个系统的数据发生变化后,能即刻将变化的动作同步到另一个系统这就是数据实时技术的主旨。关系型数据库、AS400、MQSERIES、ADABAS等系统都有自身的实时数据策略,如ORACLE数据库的实时可以通过TRIGGER或LOGMINER分析归档日志方式来实现。诸如以上ETL、数据连通、数据质量、数据实时等技术,还有数据联邦、数据清洗、HA、GRID、PARTITION、SOA技术,这些都是保证数据集成平台的可扩展性、安全性、高效性、简便性的通用技术。神州数码公司面向各行业提供有多家数据集成整体解决方案的经验,整体解决方案包括有企业数据集成业务咨询、企业数据集成平台产品、各厂商数据集成底层软件共三大块。篇二物资主数据纵向集成接口规范V20文档编号10物资主数据国家电网公司主数据项目组2011年8月9日版本10纵向集成接口规范文档信息目录1前言11112131423导读1范围1术语1参考资料2原则111主数据管理集成规范13132集成架构1接口集成描述2321322323SGMDM分发主数据到业务应用2SGMDM发送主数据状态到业务应用5业务应用申请主数据错误未定义书签。附录一主数据类型码对照表8附录二接收端编号对照表81前言11导读12目前,SGMDM物资主数据范围包含物资分类(含水电)、物料(含水电),供应商等三类主数据。本文档也仅限于描述这三类主数据与其他外部应用的数据交互接口规范定义。12范围SGMDM管理的物资主数据范围包含物资分类(含水电)、物料(含水电),供应商主数据等三类主数据。本文档也仅限于描述这三类主数据与其他外部应用的数据交互接口规范定义。13术语SGMDMSGMDM指国家电网主数据管理系统。采用总部集中部署,总部/网省两级应用的方式进行主数据管理。WEBSERVICEWEBSERVICE是业务系统对外暴露的能够通过WEB进行调用的API。接收端指各个单位要接入SGMDM的业务系统。为了更好的描述和全局定义要接入的业务系统,我们采取“业务模块_业务系统拼音简称_流水号”方式命名接收端的ID,采用“单位名称系统名称”命名接收端的中文名称。为了便于SGMDM系统对接入系统的统一管理,在采用WEBSERVICE方式进行数据交换时,请求方都需要在接入参数中提供根据本接口规范中预先分配的“接收端ID”来进行13系统接入,详情可见附录二“接收端编号对照表”。具体见附录二接收端编号对照表。14参考资料本规范参考以下文件制定,并参考公司系统部分单位研究成果主数据管理功能模块建设方案_V09应用集成平台典型设计手册V26SGCC_成熟套装软件纵向贯通技术实现V2数据交换接口规范V21(打印版)国家电网公司成熟套装软件信息分类编码方案(使用版)国家电网公司数据中心典型设计物资管控实施_集成技术架构_确认版RAR国家电网公司“SG186”工程一体化平台应用集成典型设计(下发稿)篇三数据交换平台技术规范数据交换平台技术规范目录前言41引言14511适用范围512引用的规范文件和有关规定513术语和定义614缩略语72系统总体设计要求721平台介绍7211概述7212体系架构157213系统结构922功能体系9221数据交换9222交换节点管理10223交换流程管理11224系统管理1123技术要求1612231基本要求123系统性能要求来自WWWXLTKWJCOM小龙文档网数据集成接口规范1331开发环境要求13311要求描述13312性能指标1332平台部署、运行要求14321要求描述1714322性能指标1533数据共享交换服务要求15331要求描述15332性能指标1734平台扩展性需求1735平台管理模式要求18351要求描述18353性能要求181836共享交换应用服务要求18351要求描述1937对性能的规定1938运行环境适应性要求20前言数据交换平台技术规范,是根据国家有关规定和国家标准,并且在多年电子政务系统建设和应用经验的基础上,针对信息资源交换平台的功能技术条件编制而成的。政府各单位可根据本规范为本单位的办公业务系统开发软件接口,实现与数据交换平台无缝对接,从而实现与全市其他单位的系统联网进行电子公文、业务资料、业务信息等各类信息资源的交换。本规范只给出交换平台的技术约定,不涉及信息资源的19管理规定。各单位使用本规约的时候,应注意遵守国家和我省有关法律法规和规章制度。1引言数据交换平台是为解决全市各部门内数据交换与共享需求而提出的一种综合性服务平台,数据交换平台的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论