数据仓库实施方案综述_第1页
数据仓库实施方案综述_第2页
数据仓库实施方案综述_第3页
数据仓库实施方案综述_第4页
数据仓库实施方案综述_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库商业智能解决方案XXX公司BI系统方案建议书二0二0年一月目录第一章概述1第二章商业智能综述22.1 商业智能基本结构22.1.1 XXX数据仓库架构32.1.2 数据仓库:用于抽取、整合、分布、存储有用的信息42.1.3 多维分析:全方位了解现状42.1.4 前台分析工具52.1.5 数据挖掘52.2 商业智能方案实施原则52.2.1 分阶段、循序渐进的原则52.2.2 实用原则62.2.3 知识原则6第三章XXX公司BI系统方案73.1 XXX公司BI系统的需求分析73.2 XXX的解决方案73.3 建议架构9第四章所选XXX产品简介114.1 DB2UDB114.1.1 概述:D

2、B2家族(Family)与DB2通用数据库(UDB)V7.2114.1.2 DB2通用数据库(UDB)V7.2的特色124.1.3 DB2通用数据库(UDB)的其他先进功能224.2 DB2WAREHOUSEMANAGER(数据仓库管理器)264.2.1 DB2WarehouseManager的主要部件264.2.2 数据抽取、车专换和加载(ETL)功能274.2.3 元数据(MetaData)管理314.2.4 DB2WarehouseManager的其它技术特点314.3 XXXOLAPSERVER(多维数据库服务器)334.3.1 DB2OLAPServer引擎334.3.2 DB2OL

3、APServer各个附件344.3.3 DB2OLAPServer与DB2WarehouseManager集成364.3.4 DB2OLAPServer支持的前端工具364.4 DB2OLAPANALYZER374.5 数据挖掘工具(XXXINTELLIGENTMINER)374.5.1 数据挖掘的实现方法384.5.2 数据挖掘基本方法394.5.3 数据挖掘与多维分析相结合40第五章工程服务和售后服务415.1 工程服务415.2 售后服务415.2.1 XXX数据仓库的安装及配置服务415.2.2 XXX数据仓库的维护服务415.2.3 XXX数据仓库的顾问服务425.2.4 XXX培训

4、I服务425.3 技术文档42数据仓库商业智能解决方案第一章概述随着市场竞争的日益激烈,各家公司纷纷把提高决策的科学性、合理性提高到一个新的认识高度。在此背景下,利用信息技术的最新手段,利用业务数据进行面向决策的分析这一方法纷纷被国内外许多公司所采用。通过有目的、有选择地采集业务数据,并将其转换为对决策有用的信息,用于智能化的分析、预测和模拟等目的,这样的应用被称为商业智能应用。从国内外各行各业的发展经验看,实施商业智能是提高企业进行高效的业务分析和科学决策的有效手段。作为一个具有八十多年历史,以开发信息技术和商业应用而闻名的“蓝色巨人”,XXX在这一领域进行了多年的研究,发展出完备的商业智能

5、技术,为商业数据自动转化为商业知识提供了现实的方案。商业智能的本质,是提取收集到的数据,进行智能化的分析,揭示企业运作和市场情况,帮助管理层做出正确明智的经营决定。一般现代化的业务操作,通常都会产生大量的数据,如话单、账单以及客户资料等,其中一部分是决策关键数据,但并不是所有的数据都对决策有决定意义。商业智能包括收集、清理、管理和分析这些数据,将数据转化为有用的信息,然后及时分发到企业各处,用于改善业务决策。企业可以利用它的信息和结论进行更加灵活的阶段性的决策:如采用什么产品、针对哪类客户、如何选择和有效地推出服务等等,也可以实现高效的财务分析、销售分析、风险管理、分销和后勤管理等等。这一切都

6、是为了降低成本、提高利润率和扩大市场分额。第40页业务数据第二章商业智能综述2.1 商业智能基本结构当今,许多企业认识到只有靠充分利用,发掘其现有数据,才能实现更大的商业效益。日常的商务应用生成了大量的数据,这些数据若用于决策支持则会带来显著的附加值。若再加上市场分析报告、独立的市场调查、质量评测结果和顾问评估等外来数据时,上述处理过程产生的效益可进一步增强。而数据仓库正是汇总这些商用信息后,进而支持数据发掘、多维数据分析等当今尖端技术和传统的查询及表报功能,这些对于在当今激烈的商业竞争中保持领先是至关重要的。那么怎样把这样大量的数据转换成可靠的、商用的信息以便于决策支持呢?建立数据仓库正被广

7、泛地公认为最好的转换手段。建立数据仓库的过程转换工具*商业主题成员映射商业视图图i数据仓库建立过程根据IDC的调查,使用数据仓库的投资回报率平均超过400%,尤其是从小型数据仓库开始实施的平均超过500%。2.1.1 XXX数据仓库架构XXX早在90年代初期,就投入大量优秀技术人员和资金开始了数据仓库的研究,并启动了Star-Burst大型科研项目。该项目主要就是为了攻克数据仓库领域的一些技术难题,例如优化星型连接(Star-join),实现多维分析。因此,XXX现在发布的数据仓库产品都是经过反复推敲和久经考验的。基于对数据仓库结构的深刻理解和多年积累的经验,XXX设计了自己的数据仓库结构,见

8、下图:数据仓库的组成。作为一个开发式结构,它方便了用户的产品选择、实施和今后的扩展。数据集市数据仓库趋势 分析DSSDSS销销存务信 售量庠财贸 零批h 4订OLTP业务系统图2XXX数据仓库架构上图为XXX三层次数据仓库结构:从第一层OLTP业务系统到第二层数据仓库为建仓过程,从第二层到第三层数据集市为按主题分类建立应用的过程。第一步包括数据抽取、数据转换、数据分布等步骤,按照统一的数据格式标准进行统一的数据转换,建立可被企业各部门充分共享的数据仓库。其中,数据抽取阶段完成对各种数据源的访问,数据转换阶段完成对数据的清洗、汇总和整合等,数据分布阶段完成对结果数据存储的分配。这三个阶段通常紧密

9、结合在一起,由一个产品或几个产品配合实现。例如,DB2WarehouseManager既可独立完成,又可结合DataJoiner、DataPropagator实现对异构数据和数据复制的处理。DB2WarehouseManager可进行数据映射的定义,以定期地抽取、转换和分布数据;DataJoiner可访问的各种关系型数据库包括DB2数据库家族、ORACLE、SYBASE、INFORMIX和MSSQLServer等;DataPropagator主要用于数据复制,采用数据复制的方式可对业务数据仓库进行增量数据更新,避免对作业系统事物处理性能的影响和大量重复抽取数据。数据的存储由DB2家族产品来完成

10、,以保证数据仓库始终高性能地运转,提供完整、准确的数据,便于将来的升级和扩展。第二步,在按主题分类建立应用时,若既想拥有多维数据库的独特功能,又要把数据存放在关系型数据库中以便管理,则DB2OLAPServer是用户的最佳选择。DB2WarehouseManager中提供的InformationCatalog通过描述性数据帮助用户查找和理解数据仓库中的数据,IntelligentMiner用于数据挖掘以便帮助决策者预测或发现隐藏的关系。最后,我们以报表或图形的方式将结果数据呈现给用户,这通常由第三方产品来实现,它们包括:HyperionAnalyzer,Cognos,Brio,Business

11、Objects等。商业智能的实现方式多种多样,其规模和特点由用户的需求来决定。但万变不离其宗,其基本体系结构往往包括三个部分。2.1.2 数据仓库:用于抽取、整合、分布、存储有用的信息一个企业的信息往往分布在不同的部门和分支机构,管理者要综观全局、运筹帷幄,必须能迅速地找到能反映真实情况的数据,这些数据也许是当前的现实数据,也可能是过去的历史数据。因此,有必要把各个区域的数据集合起来,去其糟粕、取其精华,将真实的、对决策有用的数据保留下来,随时准备管理人员使用。因此,数据仓库不仅仅是个数据的储存仓库,更重要的是它提供了丰富的工具来清洗、转换和从各地提取数据,使得放在仓库里的数据有条有理,易于使

12、用。2.1.3 多维分析:全方位了解现状管理人员往往希望从不同的角度来审视业务数值,比如从时间、地域、产品来看同一类业务的总额。每一个分析的角度可以叫作一个维,因此,我们把多角度分析方式称为多维分析。以前,每一个分析的角度需要制作一张报表。由此产生了在线多维分析工具,它的主要功能,是根据用户常用的多种分析角度,事先计算好一些辅助结构,以便在查询时能尽快抽取到所要的记录,并快速地从一维转变到另一维,将不同角度的信息以数字、直方图、饼图、曲线等等方式展现在您面前。2.1.4 前台分析工具提供简单易用的图形化界面给管理人员,由他们自由选择要分析的数据、定义分析角度、显示分析结果。往往与多维分析工具配

13、合,作为多维分析服务器的前台界面。以上三部分是商业智能的基础。它完成的是对用户数据的整理和观察,可以说,它的工作是总结过去。在此基础结构之上,商业智能可以发挥更进一步的作用,利用数据挖掘技术,发现问题、找出规律,达到真正的智能效果:预测将来2.1.5 数据挖掘正如在矿井中可以挖掘出珍贵的矿石,在数据仓库的数据里也常常可以挖掘出业务人员意想不到的信息。它比多维分析更进一步。例如,如果管理人员要求比较各个区域某类业务在过去一年的情况,可以从多维分析中找答案。但是,如果管理人员要问为何一种业务在某地区的情况突然变得特别好或是不好,或者问该业务在另一地区将会怎么样,这时数据挖掘工具可以作出回答。简单的

14、说,数据挖掘使用统计、分析等数学方法、以及电脑学习和神经网络等人工智能方式,从大量的数据中,找寻数据与数据之间的关系。这种关系,一般显示数据组之间相似或相反的行为或变化。一个细心的分析者,往往能从这些发掘出来的关系得到启示。而这种启示又很可能使得到它的业者,获得其他竞争者所没有的先机。数据挖掘要求有数据仓库作基础,并要求数据仓库里已经存有丰富的数据。因此,在实施商业智能方案时,一般分两步走:第一步实现数据仓库和多维分析,构造商业智能的基础,实现分析应用;第二步实现数据挖掘,发挥商业智能的特色。2.2 商业智能方案实施原则实施商业智能方案项目工程,与实施传统的应用系统有很大的不同。其中最重要的是

15、,商业智能的实施是不断的交流过程,只有双方紧密的合作才能取得实施的成功。我们建议,工程实施上采取以下原则:2.2.1 分阶段、循序渐进的原则任何一个项目的实施都是一个发现问题,解决问题,积累经验,又遇到新问题,再解决,再积累的循序渐进的过程。我们建议XXX公司应根据现有的资源以及今后发展的方向,分阶段、循序渐进的实施商业智能方案。2.2.2 实用原则在第一步实现数据仓库时,尽量针对当前电信最关心的主题,并将该主题进行细致分析,尽可能用简单、统一、易于使用的方式来实现,避免追求片面的复杂和完美。2.2.3 知识原则普遍说来,由于商业智能技术相对而言比较新,企业的信息技术人员对数据仓库、多维分析、

16、数据挖掘等系统涉及的知识往往存在着不足或偏差,实际应用经验也很欠缺。因此,我们建议在实施过程中结合专家培训和服务,在商业智能系统的设计、开发、实施当中,逐步培养出企业自己的系统管理、维护和开发人员。当系统投入使用时,这些人员可以对系统进行维护和管理,并负责对最终用户进行培训。第三章XXX公司I系统方案3.1 XXX公司BI系统的需求分析在XXX公司的BI系统中,可以实现如下一系列经营过程中的分析和决策支持:除了以上列出的一系列分析和预测外,利用BI系统,还应该能够根据XXX公司的需求很方便地扩展其功能。3.2 XXX的解决方案基于XXX公司BI系统的需求,以及XXX公司在数据仓库领域的经验,我

17、们提出以下解决方案:采用一个企业级的数据仓库,实现各分行业务数据的自动采集、清洗、汇总,并且通过多维分析工具,让用户能够有效的将数据转化为灵活的报表和决策支持信息,最终满足用户的信息需求。该方案的实现方式如下:首先,在数据主要来源于两个方面:综合业务系统和新录入的数据。综合业务系统中的数据通过数据仓库工具进行自动采集、清洗、整理,而需要新录入的数据则通过浏览器方式录入。在构造数据仓库的过程中,我们采取以点带面的做法,采用小步长、逐步地建立数据仓库的策略。以XXX公司报表系统为开端,分阶段地实现商业智能应用。小的项目可以立即显示数据仓库的价值,同时也提供了更快的投资回报。而且,先在只有少量的数据

18、和用户的小系统上进行学习和实践,对技术人员来说会学得更快。我们希望首先在需求较为迫切的领域,选择一些比较有意义的主题;基于这些主题,我们将建立一个数据集市,待用户能够对数据仓库的概念和一些技术有了比较深刻的认识之后,冉综观全局,构建起企业级的数据仓库。数据录入可以采用数据文件快速装入的方式,也可以采用专门应用的方式。如果采用后者,我们可以考虑使用XXX的WebSphere和VisualAgeforJava进行开发,它们产品是XXX电子商务应用的重要部件。利用这两个工具,我们可以方便地建立Web页面,生成Java程序,包括Applet、Servlet和Application等等。并且系统的维护工

19、作也比较方便,当需要修改应用时,只需要修改服务器上的程序就可以了,不需要在客户端做工作。另外,这种结构对客户机的配置要求也不太高。在建造数据仓库的过程中,我们推荐使用XXX的WarehouseManager,该产品是XXX用来建立数据仓库的工具,利用该工具,我们可以方便、快捷地构造起数据仓库来,因为我们应该认识到数据仓库必须建立在一个开放的、可更改的结构上,以便能够处理数据和需求的不断膨胀。WarehouseManagers是这样的一个工具。提供一个开放的,从数据源到数据仓库的一致的解决方案。在XXX公司的BI系统中,通过WarehouseManager管理器可以方便地建立数据加工的流程(pr

20、ocess和步骤(step),这些步当!反映了XXX公司具体业务数据的流程、规则。在各步骤中可以定义代理(agent)来自动运行数据传递、清洗和汇总功能,这些步骤可以按时间、事件运行,或由其它步骤触发。代理可以运行在WarehouseManager服务器上,也可以运行在远程的业务主机上,并且可以有多个代理运行以提高效率。可以以非常直观的图形化方式管理数据仓库,当报表系统的业务需求发生变化时,可以非常方便地修改步骤,满足变化多端的商业竞争环境。WarehouseManage是专门为商业应用设计的,它可以自动在网络上进行数据的传送,不需要人为干预,并且利用它的日志功能可以对系统运行很好地监控。在D

21、B2WarehouseManager(DWM)中含有WarehouseAgen詹B件,它可以用来在位于数据仓库的目标数据库DB2UDB中执行直接执行数据仓库的数据加工。另外,在数据仓库服务器于业务系统之间的文件数据FTP传输以及从表中抽取少量数据也可以通过Agent直接执行。建立数据仓库之后,选择一些有意义的主题,抽取相关的数据到DB2OLAPServer中,利用DB2OLAPServer的强大分析功能,给最终用户提供在线多维分析的功能,能够让最终用户充分挖掘出数据中包含的信息。DWM在执行完数据的提取任务后,自动触发预先定义好的OLAP操作,将数据经过汇总计算后加载至DB2OLAPServe

22、r中。最终用户工具我们选用DB2OLAPAnalyzer,这个产品是一个数据仓库的前端分析工具,利用这个工具用户可以很容易地访问OLAPServer中经过处理的数据,制作各种形式、风格的报表,报表内容可以包括数字、图像、曲线等,使得管理层可以直接、直观地查看企业的经营情况。3.3建议架构DB2 UDB EEDB2 OLAP ServerDB2 Warehouse ManagerDB2 Intelligent Miner for DataDB2 Intelligent Miner ScoringMeta Data管理/数据仓库控制DB2/Warehouse Control CenterDB2 W

23、arehouse ServerDB2 OLAP Server Application ManagerDB2 Intelligent Miner ClientWindows 2000查询/分析WEB用服务器DB2 OLAP Analysis Server HTTP Server图3XXX公司BI系统软硬件配置示意图在此方案中,采用RS/6000服务器作为运行数据仓库目标数据库的服务器,其上安装DB2UDBEE、DB2WarehouseManager用来从生产系统抽取对决策有用的业务数据,经过加工后存放在数据仓库中。在海量数据仓库基础上针对每一类具体业务问题建立数据集市。由于XXX公司BI系统中的

24、业务问题大多是多维分析问题,故利用另外一台RS/6000服务器运行XXX公司专门的多维分析服务器产品DB2OLAPServer,以极大地加快多维分析的速度。在数据仓库服务器上同时安装DB2IntelligentMinerforData,从数据仓库服务器中抽取数据进行智能挖掘;止匕外,在数据仓库上安装DB2IntelligentMinerScoring,用来将数据挖掘的结果作用到数据仓库中,实现打分功能。所有客户端以浏览器方式,通过查询和多维分析的WEB应用服务器访问数据仓库和多维分析服务器中的数据。整个系统需要在一台运行Windows2000的PC服务器上安装DB2OLAPAnalyzerAn

25、alysisServer以及HTTPServer,作为为前端浏览器客户提供统一入口的应用服务器。为提高系统响应时间及提供负载均衡能力,可以配合WebSphereApplicationServer同使用。另外,需要配置一台PC服务器运行Windows2000作为整个系统的控制服务器,安装DB2WarehouseControlServerDB2ControlCenter、OLAPServer控制台OLAPServerApplicationManager以及挖掘服务器前端DB2IntelligentMinerforDataCliento此方案的优点:基于公司的业务需求。各业务部门可以根据自己的需要定

26、义数据集市的内容,并进行各种指标的多维分析,在实际应用中不断扩展系统,为决策者提供必要的信息。高性能、高效率。数据都在本地运行,数据量相对较小,因此对服务器计算能力的要求相对较低。同时由于在局域网上运行,对网络带宽基本不会有压力,并且用户响应时间可以得到保障。最大限度地减少网络负荷。各客户端通过浏览器方式从中心数据仓库中获取数据,只有需要的数据被传输。满足XXX公司未来发展的需要。此方案具有很好的可扩展性,随着XXX公司业务量的增加,业务数据的增多,各种业务系统的建立,此方案可以容易的适应这些变化,满足业务的需求。一次性投资,长期受益。此方案不仅可以满足XXX公司目前BI系统的需要,更为重要的

27、是为XXX公司商业智能应用打下了一个坚实的基础。XXX公司可以在此基础上开发各种商业智能应用,辅助决策者制定业务计划和措施,在激烈的竞争中保持良好的势头。第四章所选XXX产品简介在这次的商业智能解决方案中,采用的产品包括数据库DB2UDB、数据仓库(DB2WarehouseManager)多维数据库(OLAPServer)、前台分析工具(DB2OLAPAnalyzer)及智能数据挖掘服务器(DB2IntelligentMinerforData)。以下是各个产品的描述说明。4.1 DB2UDB4.1.1 概述:DB2家族(Family)与DB2通用数据库(UDB)V7.2XXXDB2家族的各种关

28、系数据库管理系统适用于各种硬件平台,其中包括基于Intel的微机、XXX的或非XXX的各种RISC服务器和工作站、大型并行处理机、AS/400中型计算机系统以及运行VM、VSE和MVS、OS/390操作系统的主机系统。各种平台上的DB2有共同的应用程序接口,因此运行在一种平台上的程序可以很容易地移植到其他的平台。DB2家族产品能够满足不同用户的需求,它包含了从单用户的微机系统到支持80万用户的主机系统。DB2家族除了包含在各种平台上运行的数据库管理系统内核之外,产品包中还包括了数据复制、数据库系统管理、环球网(Internet)网关支持、在线分析处理、多媒体支持和各种并行处理能力,免费提供DB

29、2UDBV7.2在PC和UNIX平台上的客户机端产品(DB2CAE),并为所有平台上的异构数据库访问提供中介件”(Middleware骅决方案。可运行在基于Intel的微机及各种RISC服务器(UNIX平台)上的DB2UDBV7.2包括:DB2forAIX,DB2forHP-UX,DB2forSUNSolaris,DB2forOS/2,DB2forWindowsNT,DB2forWin95,DB2forWin98,DB2forLinux,DB2forSCO,DB2forSinix,DB2forNUMA-Q等等。这些产品是全功能、具有工业强度的关系数据库管理系统,分别用于服务器和工作站平台。可以

30、把它们配置到单个的系统上,或者配置到支持客户机工作站的LAN服务器上,还可以把它们配置为环球网(Internet)上的数据库服务器。如果使用服务器配置,那就允许DOS、Windows、OS/2、Win95、Win98、Macintosh或UNIX客户机去访问DB2服务器,可以使用TCP/IP、IPX/SPX、NetBIOS或APPC等网络协议;如果作为环球网上的数据库服务器,则可由一台浏览器(WebBrowser)作为客户机访问。DB2通用数据库(UDB)V7.2产品建立在一个共同代码的基础之上,依据多进程/多线索结构进行设计,具数据库引擎的核心技术来自Starburst研究项目以及DB2fo

31、rOS/390等主机产品,而且它们在数据和应用的可移植性两个方面与DB2家族中的其他成员完全兼容。因而任何受过一种平台上的DB2培训的人员能够很容易地使用其他平台的DB2产品。在保持这种外在的兼容性以及具备DB2家族成员所必需具备的可靠性和可管理性的同时,实际上它们每个产品还针对各自的平台环境作了调整和优化以达到业界领先的性能/价格比。Global SolutionsSaiirce-Orficie* 34曾, inTDrmlx« 目QL Barwr-IMS*DB2ftrOM9O DB2 lorVMindVSE 上 DBZ-TdfOSjIQQraiConnwl DWhu0ner F4I

32、DalaWANClients «DOS widows求f第 0S.2 aAJX -*HP-LK *5C0TCPflPfWSPXNETS 10$RHPfnr AIK DBSforKS' Dm dm Hn3 LTX DH7 fM SIJNScHwix DQ2fw NUMA.Q UHNlDf SIMM SUN Solent SNi Sim?:, SGI Inn h4AC Wnh ArrnM$ei jo 口日NTurgf:-DBZibrvmNT. DB2 (nrnSSSatallite> Win NTPersonalDBSfOffSC-O口必Off LiiwkManagemen

33、t OB? Erteipri? GqmHNTDB2 everyplaceTCP/IP 吕NA IRyiSPXHostsParallel Complexes*DB2UDBEEE 日2 for 口5询*02 for 05/400CompleteSolutionsDB2产品家族提供了完整的中文支持,对中文的支持贯穿于从微机到主机的所有平台,这是任何其他数据库厂家做不到的。图4DB2家族产品4.1.2 DB2通用数据库(UDB)V7.2的特色DB2通用数据库(UDB)V7.2无论在网络计算方面还是在线分析、多媒体处理,都能给你全面、满意的支持,而且集成了丰富的数据库管理工具,把原来复杂的管理工作变得非

34、常简单。DB2V7.2致力于商业智能和数据仓库方面的改进,包括自动触发器,多分区和多表的自动总计表格,优化星式结构的连接方法,使查询和整个系统的反应速度大大提高。同时也增加了在装载和在线重组时对索引的维护。在DB2中还新增了统计、线性回归等功能,直接支持进一步深入分析,以便利用DB2的查询处理实用程序,而以往只能在应用程序级上做到这一点。另外,在支持16和32KBPages多个缓冲池(multiplebufferpool)的优化、更快的完整性约束处理、处理更多查询的星式连接等方面,做了一系列的改进。应一些XXX合作伙伴软件提供商的要求,DB2UDBV7.2包含以下扩充性能:表/视图/别名的命名

35、长度限制由原来的18个字符扩充为128个字符。列命名长度限制由原来的18个字符扩充为30个字符。SQL语句的最大长度由原来的32KB增大到64KB。页大小从16KB增大至I32KB。最大变量字符为32KB,取决于页大小。最大表/表空间的大小从128GB扩大到512GB,取决于页大小。索引关键字长度从255字符扩大到1,024个字符。嵌入式SQL编程支持宏。DB2V7.2对统一代码(Unicode)的支持:16-Bit固定长度的Unicode包含所有通用文本字符,容许定长字符序列(以便分析)和设定含义的字符。对UCS-2和UTF-8格式的支持,允许用户用各种主要语言创建数据库和存取数据。DB2支

36、持wchar_t数据类型,使得用户在单字节环境(如英语环境)下开发的应用在其他环境(日语)下也可照常运行。DB2UDBV7.2增强面向对象的SQL和SQL扩展,集成Windows平台,打包新增免费软件。产品集成改变主要包括通用数据支持,免费新增数据仓库中心和DB2OLAPstarterkit。用户可以使用DB2的数据连接器(DataJoiner),象访问DB2数据资源一样,访问Oracle,Sybase,Informix,SQLServer等数据库。用户只需熟悉DB2语法即可在跨平台的复杂环境中轻松获取非DB2数据。DB2UDBV7.2选件中针对Oracle的关系连接部件可以使用户通过标准SQ

37、L查询同时访问DB2和Oracle的数据资源。DB2UDBV7.2的用户现在可以跨越DB2数据库、Oracle数据库或者一个OLEDB资源进行分布式的查询,也就是可以通过使用DB2通用数据库的SQL句法和API在一个工作单元的查询内实现访问和操作保存在异构数据资源中的数据。DB2RelationalConnect加强了分散查询功能,使DB2用户可以通过一个简单的查询来访问DB2数据和存储在Oracle数据库中的数据。DB2UDBV7.2免费包含的数据仓库中心把可视化仓库的强大功能和DB2控制中心的便捷特点结合起来,为需要商业智能的用户提供友好的用户界面。用户可以使用数据仓库中心对数据进行定义、

38、自动取样、转换、发布、以及为数据仓库加载数据。这种新功能可以为一个部门或单位配置一个独立的简单数据中心。除数据仓库中心之外,DB2还在Wizards,模式名模型(SchemaModeler卜元数据交换(MetadataInterchange容方面做了改进。DB2UDBV7.2数据仓库中心使用了更便捷的新界面,用于创建、设计、储存以及维护数据仓库以及OLAP表。DB2数据仓库管理器产品在大量数据传递、元数据管理以及查询管理方面做了改进。DB2UDBV7中包含了一些先进的高级面向对象SQL功能,对开发人员和分析员都非常有用。这些聚合功能用于OLAP应用计算,这是在SQL-99中很难或根本无法实现的

39、,具符合SQL-99OLAP附录中建议的标准。DB2现在可以提供临时表格支持,应用存储点(savingpoint),标识栏(IDColumn),嵌套存储过程。SQL过程语言(SQLProcedureLanguage)持创建DB2存储过程,符合ANSISQL99中的存储过程模型标准。DB2UDB存储过程创建工具(SPB)是一个图形应用工具,支持DB2存储过程的快速开发。通过使用SPB,用户可以在本地和远程DB2服务器上创建、修改、运行、测试和调试存储过程。SPB提供Windows、AIX和Solaris下的开发环境,支持DB2系列产品,用户可以从DB2UDB程序组启动SPB,也可以从MSVC+,

40、MSVB,XXXVisualAgeforJava,DB2控制中心启动SPB。DB2UDBV7.2创建用户定义功能,表功能和行功能时允许包含一条SQL语句,这就减少了使用外部高级语言书写这些功能的需要。DB2UDBV7.2推出了结构数据类型(或者叫做抽象数据类型),这可以让用户和开发商们创建带有结构的表格。DB2UDBV7.2版本中包括了许多可以提高系统性能和改善系统管理的功能:能够把ODBC/CLI应用程序包含的动态SQL语句转换为静态SQL并执行;活动日志最大可为32GB;支持多个TCP/IP收听者(listener)。DB2UDB7提供三个新的扩展器:(1)空间扩展器(SpatialExt

41、ender):DB2提出了空间SQL查询概念(SpatiallyEnabledSQLQueries)使用户可以在关系型数据库中集成空间数据(通过坐标确定位置)和普通的SQL数据。这两种技术的结合使用户可以进行新型查询。新的空间扩展器将能够存储和索引空间数据(坐标信息),并使用户通过特定的空间数据查询对其进行访问。(2)DB2XML扩展器:XXXDB2XMLExtender体现了XXX全面的XML技术策略,在电子商务领域居业界领导地位。XML扩展器是XXXB2B服务器的组成部分,使DB2服务器可以支持XMLoXXX曾为早期XML技术被采用和发展起到了关键作用,此次该扩展器又提供了XML存储和数据

42、交换的新技术。通过存储,XML扩展器提供了XML文档在DB2中的存储和恢复机制,并可高效地查询XML内容。通过数据交换,XML扩展器提供新的和已存在的DB2相关表格和XML格式文档之间的映射。DB2用户可以在任何地方通过XML扩展器进行电子商务,实现企业之问(B2B)和企业与消费者之间(B2C)的应用。本产品是免费的。A支持先进的面向对象和多媒体应用自从70年代XXX发明关系数据库以来,在数据库市场上,关系型数据库管理系统(RDBMS)得到极其广泛的运用。关键任务的应用在很大程度上依赖于RDBMS的使用。然而,目前很多RDBMS用户正转向非传统的、面向对象的应用,需要对更广泛的形形色色的现实世

43、界数据予以支持。比如,需要更有效地处理在RDBMS中的文本、声音、视频、映象等数据。DB2通用数据库(UDB)能够支持这些先进的应用。DB2把对传统应用与非传统应用的支持与数据库体系结构集成在一起,对关系型数据库进行面向对象扩展,形成新一代对象关系型数据库系统(ObjectRelationalDBMS)°DB2UDBV7.2提供了许多对面向对象及多媒体应用的支持。用户定义类型(UDT)DB2允许用户定义新的数据类型,称为用户自定义类型(UserDennedType)。例如,一个用户可以定义两种币值类型:用CDOLLAR表示加拿大元,用USDOLLAR表示美元。这两种类型在内部可以用d

44、ecimal(十进制)类型来表示,但在意义上是有显著差别的。它们彼此间不应也不能直接进行比较,也不可直接与decimal类型进行比较。这是通过DB2的面向对象强类型(strongtyping)机制来保证的。象内设(built-in)类型一样,UDT可以用来定义表列的数据类型和用户定义函数(UDF)的参数。例如,用户可以定义一个类型:多边形Polygons,这个用户自定义类型可有构造函数,还可有一组用户定义的函数作用于它,如求面积,求角度,以及旋转多边形等等。用户定义函数(UDF)DB2允许用户用C,C+等编译语言定义新的函数,称为用户自定义函数(UserDefinedFunction)0UDF

45、允许在查询中包含强有力的计算过程和检索判定,以便滤除在数据源附近无关的数据。UDF使用户有能力提供一组函数,它们作用于用户定义的类型,形成面向对象的封装,从而定义该UDT的行为语义。SQL优化器考虑到UDF的语义和执行成本,这使得对待用户定义的函数就完全象对待内设函数(如SUBSTR和LENGTH)一样。开发应用程序所用的语言环境可以不同,如C、C+、COBOL、FORTRAN和PL/I等,借助于SQL,应用程序共享一组UDT和UDF。把用户定义的类型和函数组合在一起使用,就能把数据的表示和解释该数据的一组函数定义都隐藏起来。利用它们能创建函数库,这些函数库可以是XXX开发的,也可以是第三方经

46、销商或客户自行开发的,然后直接把它们集成在数据库中。大对象(LOB)LOB允许用户在一个数据库中存储特大(若干个GB)对象。在DB2中有二进制LOB(BLOB),字符LOB(CLOB),双字节字符LOB(DBCLOB)等几种类型。用LOB可以存储多媒体对象,如文档资料、视频信号、映象和声音等。它也可存储由UDT和UDF定义其语义的小型结构。DB2支持一组用于LOB的功能强大的内设函数,如查找、子用和连接等。利用UDF方式用户可随时定义附加函数。另外,在一个表中可以定义多个LOB歹I。对LOB实现支持时要考虑到客户对性能的需求,为此允许数据库用户或管理员执行如下操作:仅访问应用程序需要的那部分L

47、OB,不必访问整个LOB。延迟或取消LOB的求值过程。在定义一个LOB歹时,能做出选择-对该LOB列是否作日志。把LOB数据存储在不连续的数据库分区中,这些分区是专为LOB管理而构造的。关系数据库扩展器(RelationalExtenders)关系数据库扩展器是一个预先包装的用户定义类型、用户定义函数、触发器、约束以及存贮过程的集合。利用DB2提供的对象关系型特征,把DB2的基于内容的搜索能力扩展到诸如文本、图像、视频、音频之类的新的数据类型。使用关系扩展程序,只需简单地添加由关系扩展程序提供的相应数据类型的列(如文本或图像列),用户就可以把文本文档、图像、视频、音频等连同常规企业数据一起存贮

48、在DB2的表中,对这些表的结构或主关键列并没有任何特殊要求。关系扩展程序还提供了一组用户定义函数,用于对新数据类型的管理、索引和搜索。集成内容搜索集成内容搜索由RelationalExtenders通过用户定义函数来支持。例如:DB2ImageExtender提供了一组函数来支持关于图像的、基于内容的搜索。一个用户可以在一个SQL查询中使用一个ImageExtender函数来请求那些与一个现有图像相似的图像。并且,其实现对用户是透明的,用户只需简单地把他的搜索请求表示为SQL查询即可,该SQL查询将自动地调用由扩展程序提供的函数。DB2的基于SQL的、支持集成内容搜索的方法的另一个重要的优点是

49、既可以在多种非常规的数据类型上搜索给定的查询,又可以在常规的数据上搜索给定的查询。B强劲的在线分析处理(OLAP)支持DB2优化器能够使用动态位图索引(DynamicBit-MapIndexAnding)即根据需要在相应字段上自动地动态生成位图索引,从维数表格(Dimensiontable)中调选出符合条件的记录,再和事实表格(Facttable)连接,提高了访问多维数据的性能;而不是执行Cartesian的维数表格连接,避免了大量中间数据的生成,中间数据已实现了理论上的最小值。当连接所涉及的表达到三个或三个以上,DB2可自动判断是否使用星型连接技术(StarJoin河口动态位图索引进行优化。

50、DB2在SQL中新增加了ROLLUP和CUBE功能,ROLLUP功能通过在常规组的行中增加小计”和总计”行来提供扩展的组(GROUP),CUBE功能增加了“crossabulation行:它们通过星型连接(Starjoin)方式在关系型数据库中支持在线分析处理(OLAP),使用立体的结构查看和归纳数据而不是传统的平面结构。DB2的优化器一向是值得XXX骄傲的,它提供了领先于其它数据库厂商的基于成本优化技术,它在优化时考虑了CPU速度、磁盘I/O率、表格尺寸、有效访问路径,并且如果可能的话可以重写查询,以得到更高的性能。这更使得DB2的在线分析处理(OLAP)功能如虎添翼。C卓越的弁行处理能力弁

51、行优化技术DB2UDBV7.2无论在SMP还是在MPP环境下,甚至在SMP节点组成的MPP环境下,都可充分发挥其并行处理能力。查询执行时被透明地分开后并行执行(称作内部查询并行性:Intra-queryparallelism),过去需要数小时的查询现在只需几分钟就可以完成。过去不能执行的查询现在不仅可行,而且还能从中获益。在SMP环境下处理并行,DB2UDB采用的是吸管模型(Strawmodel)。此时被执行的SQL相当于杯子中的水,而每个CPU相当于一根吸水的吸管,这样被执行的SQL很快就被CPU“吸干”了。在MPP环境下处理并行,则相当于把杯子中的水先智能地分配给多个小水杯(参与SQL执行

52、的节点机),这样小水杯中的水就分别被每个节点机吸干”了。有了好的模型仅仅是开了个好头,DB2UDBV7.2中融入的最先进的技术才是成功的关键。(1)并行优化:从很多系统中抽取非常多的数据,这会耗费大量的时间,如果效率不高,还会浪费大量宝贵的处理能力。从串行数据库中抽取数据有很多方法,它们没有必要象并行数据库那样运作。DB2UDBV7.2有一个查询优化器,是由XXX研究机构开发的,它是专为提高并行抽取数据的效率而设计的。这样就可获得高品质的查询性能,特别是对特大型数据库。(2)全面并行(ParallelEverything):DB2首先把数据分配到数据库中的多个分区或子集中,这些数据库位于多个S

53、P站点或SMP服务器内。接着,DB2自动创建一个并行处理访问计划。数据扫描、合并、分类、负载平衡、表格重组、数据调用、创建索引、索引访问、备份与恢复等一系列工作都是在所有不同的节点里同时完成的。DB2UDBV7.2以并行方式执行全部数据库功能,这包括全部SQL语句(Select、Insert、Update和Delete)、实用程序(backup,restore,reorg,load)和数据存取方法(连接、表扫描和索引扫描)等,而且无需任何额外的编程。这不仅提供了更好的性能和可伸缩性,而且也提供了更佳的管理性一一有能力利用全部处理机去执行数据库管理任务。进一步说,DB2UDBV7.2既可用于联机

54、事务处理(OLTP),又可用于决策支持查询工作。(3)管理工具在并行环境同样适用:Governor帮助您控制每个用户及应用程序的资源利用率,可自动调整查询的优先级。从而,在线平衡负载,简化系统管理,减少关机时间。通过并行在线备份功能可显著减少备份及恢复所需的时间。(4)并行环境下功能不受任何限制:DB2UDBV7.2对多媒体数据的支持、支持的客户端平台、支持的应用开发接口和开发工具以及动态位图索引等多维分析功能、对WEB和Java的支持均不受限制。对MPP结构计算机的独特支持当企业的业务系统或数据仓库系统的数据量不断增大、并发用户量不断增大时,依靠单一的数据库服务器往往难以获得比较好的性能和处

55、理能力。此时,由多台服务器协同工作成为解决这一问题的有效手段。多台服务器协同工作的手段主要有共享硬盘的集群式计算机,以及不共享任何资源而自以高速网络相连的海量并行处理计算机两种方式。随着计算机科学的不断发展,无论是科学计算领域还是在数据库领域都已经备计算机科学家证明,海量并行处理是目前解决大数据量、最大限度里并行处理能力的最佳手段。运行在MPP体系结构计算机上的DB2UDBV7.2企业扩展版(EnterpriseExtendedEdition),作为并行关系数据库它允许把单个数据库映象散布到多个系统上,从而能利用所有系统的处理能力以满足用户对数据的需求。DB2可以在并行处理的多个节点上同时运行

56、某一查询,从而提高查询性能,必要时它可以重新编写查询以优化性能。然后,它自动生成用于并行处理的访问方案。它包括以下针对MPP体系结构的特性:(1)无共享(Shared-Nothing饰才DB2UDBV7.2企业扩展版的体系结构设计为每个系统(节点)只处理它那一部分数据库,彼此间尽可能独立。这就减少了节点间共享资源时的竞争,并允许数据库有效地伸缩以支持更大的数据库,或者通过附加更多节点以支持更多用户。在客户进行benchmark测试时多达512个节点,都表明DB2UDBV7.2企业扩展版的性能可随系统规模线性增长。它的体系结构的规模可多达上千个节点。(2)智能数据分发:可在数据库的多个分区或子集

57、中分布数据,其分区图允许DB2管理分发过程并在必要时重新分发。DB2基于成本的SQL优化器利用分区信息估计SQL查询不同执行方案的成本,在需要分布数据和重新分布数据时进行有效的管理,从中选择成本最低的方案。(3)应用透明性:对在DB2客户机工作站上工作的程序员或业务用户来说,DB2UDBV7.2企业扩展版看起来与其它的DB2数据库一样。使用DB2UDBV7.2企业扩展版时不需要修改应用程序,这就保护了当前用在DB2家族产品上在数据、应用和技能方面的投资,同时也提供了新的强有力的数据处理手段和发挥成本效果的手段。(4)对RS/6000SP的支持:DB2UDBV7.2企业扩展版的体系结构完全可与XXX的大型并行处理器(MPP)RS/6000SP相媲美。RS/6000SP由上千个RS/6000节点组成,相互由高速开关连接。DB2UDBV7.2企业扩展版和RS/6000SP的结合构成当今产业界中最有伸缩性和功能最强的并行数据库方案。(5)可伸缩的性能和容量:DB2UDBV7.2企业扩展版提供了非并行增量增长的途径,从容量为1-2GB的单处理器数据库到具有兆兆(TB)字节甚至更多数据的有512个节点的MPP计算机,这一切都不需重写应用程序(串行和并行环境使用相同的SQL语句)即可移到新的操作环境中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论