商业智能(bi)解决方案_第1页
商业智能(bi)解决方案_第2页
商业智能(bi)解决方案_第3页
商业智能(bi)解决方案_第4页
商业智能(bi)解决方案_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库/商业智能解决方案 目目 录录 第一章第一章 概述概述 .1 第二章第二章 商业智能综述商业智能综述 .2 2.1 商业智能基本结构.2 2.1.1 IBM数据仓库架构3 2.1.2 数据仓库:用于抽取、整合、分布、存储有用的信息.4 2.1.3 多维分析:全方位了解现状.4 2.1.4 前台分析工具.5 2.1.5 数据挖掘.5 2.2 商业智能方案实施原则.5 2.2.1 分阶段、循序渐进的原则.5 2.2.2 实用原则.6 2.2.3 知识原则.6 第三章第三章 XXX 公司公司 BI 系统方案系统方案 .7 3.1 XXX 公司 BI 系统的需求分析7 3.2 IBM 的解决方案.7 3.3 建议架构.9 第四章第四章 所选所选 IBM 产品简介产品简介 .11 4.1 DB2 UDB 11 4.1.1 概述:DB2家族(Family)与DB2通用数据库(UDB) V7.211 4.1.2 DB2通用数据库(UDB) V7.2的特色.12 4.1.3 DB2通用数据库(UDB)的其他先进功能.22 4.2 DB2 WAREHOUSE MANAGER (数据仓库管理器).26 4.2.1 DB2 Warehouse Manager的主要部件.26 4.2.2 数据抽取、转换和加载(ETL)功能.27 4.2.3 元数据(Meta Data)管理.31 4.2.4 DB2 Warehouse Manager的其它技术特点.31 4.3 IBM OLAP SERVER(多维数据库服务器) 33 4.3.1 DB2 OLAP Server引擎.33 4.3.2 DB2 OLAP Server各个附件.34 4.3.3 DB2 OLAP Server与DB2 Warehouse Manager集成.36 4.3.4 DB2 OLAP Server支持的前端工具.36 4.4 DB2 OLAP ANALYZER37 4.5 数据挖掘工具(IBM INTELLIGENT MINER).37 4.5.1 数据挖掘的实现方法.38 数据仓库/商业智能解决方案 4.5.2 数据挖掘基本方法.39 4.5.3 数据挖掘与多维分析相结合.40 第五章第五章 工程服务和售后服务工程服务和售后服务 .41 5.1 工程服务.41 5.2 售后服务.41 5.2.1 IBM数据仓库的安装及配置服务41 5.2.2 IBM数据仓库的维护服务41 5.2.3 IBM数据仓库的顾问服务42 5.2.4 IBM培训服务42 5.3 技术文档.42 数据仓库/商业智能解决方案 第 1 页 第一章第一章 概述概述 随着市场竞争的日益激烈,各家公司纷纷把提高决策的科学性、合理性提高 到一个新的认识高度。在此背景下,利用信息技术的最新手段,利用业务数据进 行面向决策的分析这一方法纷纷被国内外许多公司所采用。 通过有目的、有选择地采集业务数据,并将其转换为对决策有用的信息,用 于智能化的分析、预测和模拟等目的,这样的应用被称为商业智能应用。从国内 外各行各业的发展经验看,实施商业智能是提高企业进行高效的业务分析和科学 决策的有效手段。 作为一个具有八十多年历史,以开发信息技术和商业应用而闻名的“蓝色巨 人” ,IBM 在这一领域进行了多年的研究,发展出完备的商业智能技术,为商业 数据自动转化为商业知识提供了现实的方案。 商业智能的本质,是提取收集到的数据,进行智能化的分析,揭示企业运作 和市场情况,帮助管理层做出正确明智的经营决定。一般现代化的业务操作,通 常都会产生大量的数据,如话单、账单以及客户资料等,其中一部分是决策关键 数据,但并不是所有的数据都对决策有决定意义。商业智能包括收集、清理、管 理和分析这些数据,将数据转化为有用的信息,然后及时分发到企业各处,用于 改善业务决策。企业可以利用它的信息和结论进行更加灵活的阶段性的决策:如 采用什么产品、针对哪类客户、如何选择和有效地推出服务等等,也可以实现高 效的财务分析、销售分析、风险管理、分销和后勤管理等等。这一切都是为了降 低成本、提高利润率和扩大市场分额。 数据仓库/商业智能解决方案 第 2 页 第二章第二章 商业智能综述商业智能综述 2.1 商业智能基本结构商业智能基本结构 当今,许多企业认识到只有靠充分利用,发掘其现有数据,才能实现更大的 商业效益。日常的商务应用生成了大量的数据,这些数据若用于决策支持则会带 来显著的附加值。若再加上市场分析报告、独立的市场调查、质量评测结果和顾 问评估等外来数据时,上述处理过程产生的效益可进一步增强。而数据仓库正是 汇总这些商用信息后,进而支持数据发掘、多维数据分析等当今尖端技术和传统 的查询及表报功能,这些对于在当今激烈的商业竞争中保持领先是至关重要的。 那么怎样把这样大量的数据转换成可靠的、商用的信息以便于决策支持呢?建立 数据仓库正被广泛地公认为最好的转换手段。 图 1数据仓库建立过程 根据 IDC 的调查,使用数据仓库的投资回报率平均超过 400,尤其是从小 型数据仓库开始实施的平均超过 500。 数据仓库/商业智能解决方案 第 3 页 2.1.1 IBM 数据仓库架构 IBM 早在 90 年代初期,就投入大量优秀技术人员和资金开始了数据仓库的 研究,并启动了 Star-Burst 大型科研项目。该项目主要就是为了攻克数据仓库领 域的一些技术难题,例如优化星型连接(Star-join),实现多维分析。因此,IBM 现在发布的数据仓库产品都是经过反复推敲和久经考验的,真正做到让用户买起 来放心,用起来舒心。基于对数据仓库结构的深刻理解和多年积累的经验,IBM 设计了自己的数据仓库结构,见下图:数据仓库的组成。作为一个开发式结构, 它方便了用户的产品选择、实施和今后的扩展。 图 2IBM 数据仓库架构 上图为 IBM 三层次数据仓库结构:从第一层 OLTP 业务系统到第二层数据 仓库为建仓过程,从第二层到第三层数据集市为按主题分类建立应用的过程。第 一步包括数据抽取、数据转换、数据分布等步骤,按照统一的数据格式标准进行 统一的数据转换,建立可被企业各部门充分共享的数据仓库。其中,数据抽取阶 段完成对各种数据源的访问,数据转换阶段完成对数据的清洗、汇总和整合等, 数据分布阶段完成对结果数据存储的分配。这三个阶段通常紧密结合在一起,由 一个产品或几个产品配合实现。例如,DB2 Warehouse Manager 既可独立完成, 又可结合 DataJoiner、DataPropagator 实现对异构数据和数据复制的处理。DB2 Warehouse Manager 可进行数据映射的定义,以定期地抽取、转换和分布数据; 数据仓库/商业智能解决方案 第 4 页 DataJoiner 可访问的各种关系型数据库包括 DB2 数据库家族、 ORACLE、SYBASE、INFORMIX 和 MS SQL Server 等;DataPropagator 主要用 于数据复制,采用数据复制的方式可对业务数据仓库进行增量数据更新,避免对 作业系统事物处理性能的影响和大量重复抽取数据。数据的存储由 DB2 家族产 品来完成,以保证数据仓库始终高性能地运转,提供完整、准确的数据,便于将 来的升级和扩展。 第二步,在按主题分类建立应用时,若既想拥有多维数据库的独特功能,又 要把数据存放在关系型数据库中以便管理,则 DB2 OLAP Server 是用户的最佳 选择。DB2 Warehouse Manager 中提供的 Information Catalog 通过描述性数据帮 助用户查找和理解数据仓库中的数据,Intelligent Miner 用于数据挖掘以便帮助 决策者预测或发现隐藏的关系。最后,我们以报表或图形的方式将结果数据呈现 给用户,这通常由第三方产品来实现,它们包括:Hyperion Analyzer, Cognos,Brio,Business Objects 等。 商业智能的实现方式多种多样,其规模和特点由用户的需求来决定。但万变 不离其宗,其基本体系结构往往包括三个部分。 2.1.2 数据仓库:用于抽取、整合、分布、存储有用的信息 一个企业的信息往往分布在不同的部门和分支机构,管理者要综观全局、运 筹帷幄,必须能迅速地找到能反映真实情况的数据,这些数据也许是当前的现实 数据,也可能是过去的历史数据。因此,有必要把各个区域的数据集合起来,去 其糟粕、取其精华,将真实的、对决策有用的数据保留下来,随时准备管理人员 使用。因此,数据仓库不仅仅是个数据的储存仓库,更重要的是它提供了丰富的 工具来清洗、转换和从各地提取数据,使得放在仓库里的数据有条有理,易于使 用。 2.1.3 多维分析:全方位了解现状 管理人员往往希望从不同的角度来审视业务数值,比如从时间、地域、产品 来看同一类业务的总额。每一个分析的角度可以叫作一个维,因此,我们把多角 度分析方式称为多维分析。以前,每一个分析的角度需要制作一张报表。由此产 生了在线多维分析工具,它的主要功能,是根据用户常用的多种分析角度,事先 计算好一些辅助结构,以便在查询时能尽快抽取到所要的记录,并快速地从一维 转变到另一维,将不同角度的信息以数字、直方图、饼图、曲线等等方式展现在 您面前。 数据仓库/商业智能解决方案 第 5 页 2.1.4 前台分析工具 提供简单易用的图形化界面给管理人员,由他们自由选择要分析的数据、定 义分析角度、显示分析结果。往往与多维分析工具配合,作为多维分析服务器的 前台界面。 以上三部分是商业智能的基础。它完成的是对用户数据的整理和观察,可以 说,它的工作是总结过去。在此基础结构之上,商业智能可以发挥更进一步的作 用,利用数据挖掘技术,发现问题、找出规律,达到真正的智能效果:预测将来。 2.1.5 数据挖掘 正如在矿井中可以挖掘出珍贵的矿石,在数据仓库的数据里也常常可以挖掘 出业务人员意想不到的信息。它比多维分析更进一步。例如,如果管理人员要求 比较各个区域某类业务在过去一年的情况,可以从多维分析中找答案。但是,如 果管理人员要问为何一种业务在某地区的情况突然变得特别好或是不好,或者问 该业务在另一地区将会怎么样,这时数据挖掘工具可以作出回答。 简单的说,数据挖掘使用统计、分析等数学方法、以及电脑学习和神经网络 等人工智能方式,从大量的数据中,找寻数据与数据之间的关系。这种关系,一 般显示数据组之间相似或相反的行为或变化。一个细心的分析者,往往能从这些 发掘出来的关系得到启示。而这种启示又很可能使得到它的业者,获得其他竞争 者所没有的先机 。 数据挖掘要求有数据仓库作基础,并要求数据仓库里已经存有丰富的数据。 因此,在实施商业智能方案时,一般分两步走:第一步实现数据仓库和多维分析, 构造商业智能的基础,实现分析应用;第二步实现数据挖掘,发挥商业智能的特 色。 2.2 商业智能方案实施原则商业智能方案实施原则 实施商业智能方案项目工程,与实施传统的应用系统有很大的不同。其中最 重要的是,商业智能的实施是不断的交流过程,只有双方紧密的合作才能取得实 施的成功。 我们建议,工程实施上采取以下原则: 数据仓库/商业智能解决方案 第 6 页 2.2.1 分阶段、循序渐进的原则 任何一个项目的实施都是一个发现问题,解决问题,积累经验,又遇到新问 题,再解决,再积累的循序渐进的过程。我们建议 XXX 公司 应根据现有的资 源以及今后发展的方向,分阶段、循序渐进的实施商业智能方案。 2.2.2 实用原则 在第一步实现数据仓库时,尽量针对当前电信最关心的主题,并将该主题进 行细致分析,尽可能用简单、统一、易于使用的方式来实现,避免追求片面的复 杂和完美。 2.2.3 知识原则 普遍说来,由于商业智能技术相对而言比较新,企业的信息技术人员对数据 仓库、多维分析、数据挖掘等系统涉及的知识往往存在着不足或偏差,实际应用 经验也很欠缺。因此,我们建议在实施过程中结合专家培训和服务,在商业智能 系统的设计、开发、实施当中,逐步培养出企业自己的系统管理、维护和开发人 员。当系统投入使用时,这些人员可以对系统进行维护和管理,并负责对最终用 户进行培训。 数据仓库/商业智能解决方案 第 7 页 第三章第三章 XXX 公司公司 BI 系统方案系统方案 3.1 XXX 公司公司 BI 系统的需求分析系统的需求分析 在 XXX 公司 的 BI 系统中,可以实现如下一系列经营过程中的分析和决策支持: 除了以上列出的一系列分析和预测外,利用 BI 系统,还应该能够根据 XXX 公司 的需求很方便地扩展其功能。 3.2 IBM 的解决方案的解决方案 基于 XXX 公司 BI 系统的需求,以及 IBM 公司在数据仓库领域的经验,我 们提出以下解决方案: 采用一个企业级的数据仓库,实现各分行业务数据的自动采集、清洗、汇总, 并且通过多维分析工具,让用户能够有效的将数据转化为灵活的报表和决策支持 信息,最终满足用户的信息需求。 该方案的实现方式如下: 首先,在数据主要来源于两个方面:综合业务系统和新录入的数据。综合业 务系统中的数据通过数据仓库工具进行自动采集、清洗、整理,而需要新录入的 数据则通过浏览器方式录入。 在构造数据仓库的过程中,我们采取以点带面的做法,采用小步长、逐步地 建立数据仓库的策略。以 XXX 公司 报表系统为开端,分阶段地实现商业智能 应用。小的项目可以立即显示数据仓库的价值,同时也提供了更快的投资回报。 而且,先在只有少量的数据和用户的小系统上进行学习和实践,对技术人员来说 会学得更快。我们希望首先在需求较为迫切的领域,选择一些比较有意义的主题; 基于这些主题,我们将建立一个数据集市,待用户能够对数据仓库的概念和一些 技术有了比较深刻的认识之后,再综观全局,构建起企业级的数据仓库。 数据录入可以采用数据文件快速装入的方式,也可以采用专门应用的方式。 如果采用后者,我们可以考虑使用 IBM 的 WebSphere 和 VisualAge for Java 进行 开发,它们产品是 IBM 电子商务应用的重要部件。利用这两个工具,我们可以 方便地建立 Web 页面,生成 Java 程序,包括 Applet、Servlet 和 Application 等等。 并且系统的维护工作也比较方便,当需要修改应用时,只需要修改服务器上的程 数据仓库/商业智能解决方案 第 8 页 序就可以了,不需要在客户端做工作。另外,这种结构对客户机的配置要求也不 太高。 在建造数据仓库的过程中,我们推荐使用 IBM 的 Warehouse Manager,该产 品是 IBM 用来建立数据仓库的工具,利用该工具,我们可以方便、快捷地构造 起数据仓库来,因为我们应该认识到数据仓库必须建立在一个开放的、可更改的 结构上,以便能够处理数据和需求的不断膨胀。Warehouse Manager 正是这样的 一个工具。提供一个开放的,从数据源到数据仓库的一致的解决方案。 在 XXX 公司 的 BI 系统中,通过 Warehouse Manager 管理器可以方便地建 立数据加工的流程(process)和步骤(step),这些步骤反映了 XXX 公司 具体业务 数据的流程、规则。在各步骤中可以定义代理(agent)来自动运行数据传递、清洗 和汇总功能,这些步骤可以按时间、事件运行,或由其它步骤触发。代理可以运 行在 Warehouse Manager 服务器上,也可以运行在远程的业务主机上,并且可以 有多个代理运行以提高效率。可以以非常直观的图形化方式管理数据仓库,当报 表系统的业务需求发生变化时,可以非常方便地修改步骤,满足变化多端的商业 竞争环境。 Warehouse Manager 是专门为商业应用设计的,它可以自动在网络上进行数 据的传送,不需要人为干预,并且利用它的日志功能可以对系统运行很好地监控。 在 DB2 Warehouse Manager(DWM)中含有 Warehouse Agent 部件,它可以用 来在位于数据仓库的目标数据库 DB2 UDB 中执行直接执行数据仓库的数据加工。 另外,在数据仓库服务器于业务系统之间的文件数据 FTP 传输以及从表中抽取 少量数据也可以通过 Agent 直接执行。 建立数据仓库之后,选择一些有意义的主题,抽取相关的数据到 DB2 OLAP Server 中,利用 DB2 OLAP Server 的强大分析功能,给最终用户提供在线 多维分析的功能,能够让最终用户充分挖掘出数据中包含的信息。 DWM 在执行完数据的提取任务后,自动触发预先定义好的 OLAP 操作,将 数据经过汇总计算后加载至 DB2 OLAP Server 中。 最终用户工具我们选用 DB2 OLAP Analyzer,这个产品是一个数据仓库的前 端分析工具,利用这个工具用户可以很容易地访问 OLAP Server 中经过处理的数 据,制作各种形式、风格的报表,报表内容可以包括数字、图像、曲线等,使得 管理层可以直接、直观地查看企业的经营情况。 数据仓库/商业智能解决方案 第 9 页 3.3 建议架构建议架构 生产系统1 生产系统2 生产系统3 Intranet/Internet Browser Windows 2000 Meta Data管理/数据仓库控制 DB2/Warehouse Control Center DB2 Warehouse Server DB2 OLAP Server Application Manager DB2 Intelligent Miner Client Windows 2000 查询分析WEB应用服务器 DB2 OLAP Analysis Server HTTP Server DB2 UDB EE DB2 Warehouse Manager DB2 Intelligent Miner for Data DB2 Intelligent Miner Scoring OLAP Data Warehouse Data RS/6000 DB2 OLAP Server 图 3XXX 公司 BI 系统软硬件配置示意图 在此方案中,采用 RS/6000 服务器作为运行数据仓库目标数据库的服务器, 其上安装 DB2 UDB EE、DB2 Warehouse Manager,用来从生产系统抽取对决策 有用的业务数据,经过加工后存放在数据仓库中。 在海量数据仓库基础上针对每一类具体业务问题建立数据集市。由于 XXX 公司 BI 系统中的业务问题大多是多维分析问题,故利用另外一台 RS/6000 服务 器运行 IBM 公司专门的多维分析服务器产品 DB2 OLAP Server,以极大地加快 多维分析的速度。 数据仓库/商业智能解决方案 第 10 页 在数据仓库服务器上同时安装 DB2 Intelligent Miner for Data,从数据仓库服 务器中抽取数据进行智能挖掘;此外,在数据仓库上安装 DB2 Intelligent Miner Scoring,用来将数据挖掘的结果作用到数据仓库中,实现打分功能。 所有客户端以浏览器方式,通过查询和多维分析的 WEB 应用服务器访问数 据仓库和多维分析服务器中的数据。整个系统需要在一台运行 Windows 2000 的 PC 服务器上安装 DB2 OLAP Analyzer Analysis Server 以及 HTTP Server,作为为 前端浏览器客户提供统一入口的应用服务器。为提高系统响应时间及提供负载均 衡能力,可以配合 WebSphere Application Server 共同使用。 另外,需要配置一台 PC 服务器运行 Windows 2000 作为整个系统的控制服 务器,安装 DB2 Warehouse Control Server、DB2 Control Center、OLAP Server 控 制台 OLAP Server Application Manager 以及挖掘服务器前端 DB2 Intelligent Miner for Data Client。 此方案的优点: 基于公司的业务需求。各业务部门可以根据自己的需要定义数据集市的内容, 并进行各种指标的多维分析,在实际应用中不断扩展系统,为决策者提供必要的 信息。 高性能、高效率。数据都在本地运行,数据量相对较小,因此对服务器计算 能力的要求相对较低。同时由于在局域网上运行,对网络带宽基本不会有压力, 并且用户响应时间可以得到保障。 最大限度地减少网络负荷。各客户端通过浏览器方式从中心数据仓库中获取 数据,只有需要的数据被传输。 满足 XXX 公司 未来发展的需要。此方案具有很好的可扩展性,随着 XXX 公司 业务量的增加,业务数据的增多,各种业务系统的建立,此方案可以容易 的适应这些变化,满足业务的需求。 一次性投资,长期受益。此方案不仅可以满足 XXX 公司 目前 BI 系统的需 要,更为重要的是为 XXX 公司 商业智能应用打下了一个坚实的基础。XXX 公 司 可以在此基础上开发各种商业智能应用,辅助决策者制定业务计划和措施, 在激烈的竞争中保持良好的势头。 数据仓库/商业智能解决方案 第 11 页 第四章第四章 所选所选 IBM 产品简介产品简介 在这次的商业智能解决方案中,采用的产品包括数据库 DB2 UDB、数据仓 库(DB2 Warehouse Manager)、多维数据库(OLAP Server)、前台分析工具(DB2 OLAP Analyzer)及智能数据挖掘服务器(DB2 Intelligent Miner for Data)。以下是 各个产品的描述说明。 4.1 DB2 UDB 4.1.1 概述:DB2 家族(Family)与 DB2 通用数据库(UDB) V7.2 IBM DB2 家族的各种关系数据库管理系统适用于各种硬件平台,其中包括 基于 Intel 的微机、IBM 的或非 IBM 的各种 RISC 服务器和工作站、大型并行处 理机、AS/400 中型计算机系统以及运行 VM、VSE 和 MVS、OS/390 操作系统 的主机系统。各种平台上的 DB2 有共同的应用程序接口,因此运行在一种平台 上的程序可以很容易地移植到其他的平台。DB2 家族产品能够满足不同用户的 需求,它包含了从单用户的微机系统到支持 80 万用户的主机系统。DB2 家族除 了包含在各种平台上运行的数据库管理系统内核之外,产品包中还包括了数据复 制、数据库系统管理、环球网(Internet)网关支持、在线分析处理、多媒体支持和 各种并行处理能力,免费提供免费提供 DB2 UDB V7.2 在在 PC 和和 UNIX 平台上的客户机端平台上的客户机端 产品产品(DB2 CAE),并为所有平台上的异构数据库访问提供“中介件”(Middleware) 解决方案。 可运行在基于 Intel 的微机及各种 RISC 服务器(UNIX 平台)上的 DB2 UDB V7.2 包括:DB2 for AIX,DB2 for HP-UX,DB2 for SUN Solaris,DB2 for OS/2,DB2 for Windows NT,DB2 for Win95,DB2 for Win98,DB2 for Linux,DB2 for SCO,DB2 for Sinix,DB2 for NUMA-Q 等等。 这些产品是全功能、具有工业强度的关系数据库管理系统,分别用于服务器 和工作站平台。可以把它们配置到单个的系统上,或者配置到支持客户机工作站 的 LAN 服务器上,还可以把它们配置为环球网(Internet)上的数据库服务器。如 果使用服务器配置,那就允许 DOS、Windows、OS/2、Win95、Win98、Macintosh 或 UNIX 客户机去访问 DB2 服务器,可以使用 TCP/IP、IPX/SPX、NetBIOS 或 APPC 等网络协议;如果作为 环球网上的数据库服务器,则可由一台浏览器(Web Browser)作为客户机访问。 数据仓库/商业智能解决方案 第 12 页 DB2 通用数据库(UDB) V7.2 产品建立在一个共同代码的基础之上,依据多 进程/多线索结构进行设计,其数据库引擎的核心技术来自 Starburst 研究项目以 及 DB2 for OS/390 等主机产品,而且它们在数据和应用的可移植性两个方面与 DB2 家族中的其他成员完全兼容。因而任何受过一种平台上的 DB2 培训的人员 能够很容易地使用其他平台的 DB2 产品。在保持这种外在的兼容性以及具备 DB2 家族成员所必需具备的可靠性和可管理性的同时,实际上它们每个产品还 针对各自的平台环境作了调整和优化以达到业界领先的性能/价格比。 DB2 产品家族提供了完整的中文支持,对中文的支持贯穿于从微机到主机 的所有平台,这是任何其他数据库厂家做不到的。 图 4DB2 家族产品 4.1.2 DB2 通用数据库(UDB) V7.2 的特色 DB2 通用数据库(UDB) V7.2 无论在网络计算方面还是在线分析、多媒体处 理,都能给你全面、满意的支持,而且集成了丰富的数据库管理工具,把原来复 杂的管理工作变得非常简单。 DB2 V7.2 致力于商业智能和数据仓库方面的改进,包括自动触发器,多分 区和多表的自动总计表格,优化星式结构的连接方法,使查询和整个系统的反应 速度大大提高。同时也增加了在装载和在线重组时对索引的维护。在 DB2 中还 新增了统计、线性回归等功能,直接支持进一步深入分析,以便利用 DB2 的查 询处理实用程序,而以往只能在应用程序级上做到这一点。另外,在支持 16 和 数据仓库/商业智能解决方案 第 13 页 32KB Pages、多个缓冲池(multiple buffer pool)的优化、更快的完整性约束处理、 处理更多查询的星式连接等方面,做了一系列的改进。 应一些 IBM 合作伙伴软件提供商的要求,DB2 UDB V7.2 包含以下扩充性 能: 表/视图/别名的命名长度限制由原来的 18 个字符扩充为 128 个字符。 列命名长度限制由原来的 18 个字符扩充为 30 个字符。 SQL 语句的最大长度由原来的 32KB 增大到 64KB。 页大小从 16KB 增大到 32KB。 最大变量字符为 32KB,取决于页大小。 最大表/表空间的大小从 128GB 扩大到 512GB,取决于页大小。 索引关键字长度从 255 字符扩大到 1,024 个字符。 嵌入式 SQL 编程支持宏。 DB2 V7.2 对统一代码(Unicode)的支持:16-Bit 固定长度的 Unicode 包含所 有通用文本字符,容许定长字符序列(以便分析)和设定含义的字符。对 UCS-2 和 UTF-8 格式的支持,允许用户用各种主要语言创建数据库和存取数据。DB2 支持 wchar_t 数据类型,使得用户在单字节环境(如英语环境)下开发的应用在其 他环境(日语)下也可照常运行。 DB2 UDB V7.2 增强面向对象的 SQL 和 SQL 扩展,集成 Windows 平台,打 包新增免费软件。产品集成改变主要包括通用数据支持,免费新增数据仓库中心 和 DB2 OLAP starter kit。用户可以使用 DB2 的数据连接器(DataJoiner),象访问 DB2 数据资源一样,访问 Oracle, Sybase, Informix, SQL Server 等数据库。用户只 需熟悉 DB2 语法即可在跨平台的复杂环境中轻松获取非 DB2 数据。DB2 UDB V7.2 选件中针对 Oracle 的关系连接部件可以使用户通过标准 SQL 查询同时访问 DB2 和 Oracle 的数据资源。 DB2 UDB V7.2 的用户现在可以跨越 DB2 数据库、Oracle 数据库或者一个 OLE DB 资源进行分布式的查询,也就是可以通过使用 DB2 通用数据库的 SQL 句法和 API 在一个工作单元的查询内实现访问和操作保存在异构数据资源中的 数据。DB2 Relational Connect 加强了分散查询功能,使 DB2 用户可以通过一个 简单的查询来访问 DB2 数据和存储在 Oracle 数据库中的数据。 DB2 UDB V7.2 免费包含的数据仓库中心把可视化仓库的强大功能和 DB2 控制中心的便捷特点结合起来,为需要商业智能的用户提供友好的用户界面。用 户可以使用数据仓库中心对数据进行定义、自动取样、转换、发布、以及为数据 仓库加载数据。这种新功能可以为一个部门或单位配置一个独立的简单数据中心。 数据仓库/商业智能解决方案 第 14 页 除数据仓库中心之外,DB2 还在 Wizards,模式名模型(Schema Modeler)、元数 据交换(Metadata Interchange)等方面做了改进。 DB2 UDB V7.2 数据仓库中心使用了更便捷的新界面,用于创建、设计、储 存以及维护数据仓库以及 OLAP 表。DB2 数据仓库管理器产品在大量数据传递、 元数据管理以及查询管理方面做了改进。 DB2 UDB V7 中包含了一些先进的高级面向对象 SQL 功能,对开发人员和 分析员都非常有用。这些聚合功能用于 OLAP 应用计算,这是在 SQL-99 中很难 或根本无法实现的,其符合 SQL-99 OLAP 附录中建议的标准。 DB2 现在可以提供临时表格支持,应用存储点(saving point),标识栏(ID Column),嵌套存储过程。SQL 过程语言( SQL Procedure Language)支持创建 DB2 存储过程,符合 ANSI SQL99 中的存储过程模型标准。DB2 UDB 存储过程 创建工具(SPB)是一个图形应用工具,支持 DB2 存储过程的快速开发。通过使用 SPB,用户可以在本地和远程 DB2 服务器上创建、修改、运行、测试和调试存 储过程。SPB 提供 Windows、AIX 和 Solaris 下的开发环境,支持 DB2 系列产品, 用户可以从 DB2 UDB 程序组启动 SPB,也可以从 MS VC+,MS VB,IBM VisualAge for Java,DB2 控制中心启动 SPB。DB2 UDB V7.2 创建用户定义功能, 表功能和行功能时允许包含一条 SQL 语句,这就减少了使用外部高级语言书写 这些功能的需要。DB2 UDB V7.2 推出了结构数据类型(或者叫做抽象数据类型), 这可以让用户和开发商们创建带有结构的表格。 DB2 UDB V7.2 版本中包括了许多可以提高系统性能和改善系统管理的功能: 能够把 ODBC/CLI 应用程序包含的动态 SQL 语句转换为静态 SQL 并执行;活动 日志最大可为 32GB;支持多个 TCP/IP 收听者(listener) 。 DB2 UDB 7 提供三个新的扩展器: (1) 空间扩展器(Spatial Extender):DB2 提出了空间 SQL 查询概念(Spatially Enabled SQL Queries),使用户可以在关系型数据库中集成空间数据(通 过坐标确定位置)和普通的 SQL 数据。这两种技术的结合使用户可以进 行新型查询。新的空间扩展器将能够存储和索引空间数据(坐标信息), 并使用户通过特定的空间数据查询对其进行访问。 (2) DB2 XML 扩展器:IBM DB2 XML Extender 体现了 IBM 全面的 XML 技术策略,在电子商务领域居业界领导地位。XML 扩展器是 IBM B2B 服务器的组成部分,使 DB2 服务器可以支持 XML。IBM 曾为早期 XML 技术被采用和发展起到了关键作用,此次该扩展器又提供了 XML 存储和数据交换的新技术。通过存储,XML 扩展器提供了 XML 文档在 DB2 中的存储和恢复机制,并可高效地查询 XML 内容。通过数据交换, XML 扩展器提供新的和已存在的 DB2 相关表格和 XML 格式文档之间 的映射。DB2 用户可以在任何地方通过 XML 扩展器进行电子商务,实 数据仓库/商业智能解决方案 第 15 页 现企业之间(B2B)和企业与消费者之间(B2C)的应用。本产品是免 费的。 A 支持先进的面向对象和多媒体应用 自从 70 年代 IBM 发明关系数据库以来,在数据库市场上,关系型数据库管 理系统(RDBMS)得到极其广泛的运用。关键任务的应用在很大程度上依赖于 RDBMS 的使用。然而,目前很多 RDBMS 用户正转向非传统的、面向对象的应 用,需要对更广泛的形形色色的现实世界数据予以支持。比如,需要更有效地处 理在 RDBMS 中的文本、声音、视频、映象等数据。 DB2 通用数据库(UDB)能够支持这些先进的应用。DB2 把对传统应用与非 传统应用的支持与数据库体系结构集成在一起,对关系型数据库进行面向对象扩 展,形成新一代对象关系型数据库系统(Object Relational DBMS)。DB2 UDB V7.2 提供了许多对面向对象及多媒体应用的支持。 (1) 用户定义类型(UDT) DB2 允许用户定义新的数据类型,称为用户自定义类型(User Defined Type)。 例如,一个用户可以定义两种币值类型:用 CDOLLAR 表示加拿大元,用 USDOLLAR 表示美元。这两种类型在内部可以用 decimal (十进制)类型来表示, 但在意义上是有显著差别的。它们彼此间不应也不能直接进行比较,也不可直接 与 decimal 类型进行比较。这是通过 DB2 的面向对象强类型(strong typing)机制 来保证的。象内设(built-in)类型一样,UDT 可以用来定义表列的数据类型和用户 定义函数(UDF)的参数。例如,用户可以定义一个类型:多边形 Polygons,这个 用户自定义类型可有构造函数,还可有一组用户定义的函数作用于它,如求面积, 求角度,以及旋转多边形等等。 (2) 用户定义函数(UDF) DB2 允许用户用 C,C+等编译语言定义新的函数,称为用户自定义函数 (User Defined Function)。UDF 允许在查询中包含强有力的计算过程和检索判定, 以便滤除在数据源附近无关的数据。UDF 使用户有能力提供一组函数,它们作 用于用户定义的类型,形成面向对象的封装,从而定义该 UDT 的行为语义。 SQL 优化器考虑到 UDF 的语义和执行成本,这使得对待用户定义的函数就完全 象对待内设函数(如 SUBSTR 和 LENGTH)一样。开发应用程序所用的语言环境 可以不同,如 C、C+、COBOL、FORTRAN 和 PL/I 等,借助于 SQL,应用程 序共享一组 UDT 和 UDF。 数据仓库/商业智能解决方案 第 16 页 把用户定义的类型和函数组合在一起使用,就能把数据的表示和解释该数据 的一组函数定义都隐藏起来。利用它们能创建函数库,这些函数库可以是 IBM 开发的,也可以是第三方经销商或客户自行开发的,然后直接把它们集成在数据 库中。 (3) 大对象(LOB) LOB 允许用户在一个数据库中存储特大(若干个 GB)对象。在 DB2 中有二进 制 LOB(BLOB),字符 LOB(CLOB),双字节字符 LOB(DBCLOB)等几种类型。 用 LOB 可以存储多媒体对象,如文档资料、视频信号、映象和声音等。它也可 存储由 UDT 和 UDF 定义其语义的小型结构。DB2 支持一组用于 LOB 的功能强 大的内设函数,如查找、子串和连接等。利用 UDF 方式用户可随时定义附加函 数。另外,在一个表中可以定义多个 LOB 列。 对 LOB 实现支持时要考虑到客户对性能的需求,为此允许数据库用户或管 理员执行如下操作: 仅访问应用程序需要的那部分 LOB,不必访问整个 LOB。 延迟或取消 LOB 的求值过程。 在定义一个 LOB 列时,能做出选择-对该 LOB 列是否作日志。 把 LOB 数据存储在不连续的数据库分区中,这些分区是专为 LOB 管理 而构造的。 (4) 关系数据库扩展器(Relational Extenders) 关系数据库扩展器是一个预先包装的用户定义类型、用户定义函数、触发器、 约束以及存贮过程的集合。利用 DB2 提供的对象关系型特征,把 DB2 的基于内 容的搜索能力扩展到诸如文本、图像、视频、音频之类的新的数据类型。使用关 系扩展程序,只需简单地添加由关系扩展程序提供的相应数据类型的列(如文本 或图像列),用户就可以把文本文档、图像、视频、音频等连同常规企业数据一 起存贮在 DB2 的表中,对这些表的结构或主关键列并没有任何特殊要求。关系 扩展程序还提供了一组用户定义函数,用于对新数据类型的管理、索引和搜索。 (5) 集成内容搜索 集成内容搜索由 Relational Extenders 通过用户定义函数来支持。例如:DB2 Image Extender 提供了一组函数来支持关于图像的、基于内容的搜索。一个用户 可以在一个 SQL 查询中使用一个 Image Extender 函数来请求那些与一个现有图 像相似的图像。并且,其实现对用户是透明的,用户只需简单地把他的搜索请求 表示为 SQL 查询即可,该 SQL 查询将自动地调用由扩展程序提供的函数。DB2 数据仓库/商业智能解决方案 第 17 页 的基于 SQL 的、支持集成内容搜索的方法的另一个重要的优点是既可以在多种 非常规的数据类型上搜索给定的查询,又可以在常规的数据上搜索给定的查询。 B 强劲的在线分析处理(OLAP)支持 DB2 优化器能够使用动态位图索引(Dynamic Bit-Map Index Anding)即根据需 要在相应字段上自动地动态生成位图索引,从维数表格(Dimension table)中调选 出符合条件的记录,再和事实表格(Fact table)连接,提高了访问多维数据的性能; 而不是执行 Cartesian 的维数表格连接,避免了大量中间数据的生成,中间数据 已实现了理论上的最小值。当连接所涉及的表达到三个或三个以上,DB2 可自 动判断是否使用星型连接技术(Star Join)和动态位图索引进行优化。 DB2 在 SQL 中新增加了 ROLLUP 和 CUBE 功能,ROLLUP 功能通过在常 规组的行中增加“小计”和“总计”行来提供扩展的组(GROUP),CUBE 功能增加了 “cross-tabulation”行。它们通过星型连接(Star join)方式在关系型数据库中支持在 线分析处理(OLAP),使用立体的结构查看和归纳数据而不是传统的平面结构。 DB2 的优化器一向是值得 IBM 骄傲的,它提供了领先于其它数据库厂商的基于 成本优化技术,它在优化时考虑了 CPU 速度、磁盘 I/O 率、表格尺寸、有效访 问路径,并且如果可能的话可以重写查询,以得到更高的性能。这更使得 DB2 的在线分析处理(OLAP)功能如虎添翼。 C 卓越的并行处理能力 (1) 并行优化技术 DB2 UDB V7.2 无论在 SMP 还是在 MPP 环境下,甚至在 SMP 节点组成的 MPP 环境下,都可充分发挥其并行处理能力。查询执行时被透明地分开后并行 执行(称作内部查询并行性:Intra-query parallelism),过去需要数小时的查询现在 只需几分钟就可以完成。过去不能执行的查询现在不仅可行,而且还能从中获益。 在 SMP 环境下处理并行,DB2 UDB 采用的是吸管模型(Straw model)。此时 被执行的 SQL 相当于杯子中的水,而每个 CPU 相当于一根吸水的吸管,这样被 执行的 SQL 很快就被 CPU“吸干”了。在 MPP 环境下处理并行,则相当于把杯子 中的水先智能地分配给多个小水杯(参与 SQL 执行的节点机),这样小水杯中的 水就分别被每个节点机“吸干”了。有了好的模型仅仅是开了个好头,DB2 UDB V7.2 中融入的最先进的技术才是成功的关键。 (1) 并行优化:并行优化:从很多系统中抽取非常多的数据,这会耗费大量的时间,如 果效率不高,还会浪费大量宝贵的处理能力。从串行数据库中抽取数据有很多方 数据仓库/商业智能解决方案 第 18 页 法,它们没有必要象并行数据库那样运作。DB2 UDB V7.2 有一个查询优化器, 是由 IBM 研究机构开发的,它是专为提高并行抽取数据的效率而设计的。这样 就可获得高品质的查询性能,特别是对特大型数据库。 (2) 全面并行全面并行(Parallel Everything):DB2 首先把数据分配到数据库中的多 个分区或子集中,这些数据库位于多个 SP 站点或 SMP 服务器内。接着,DB2 自动创建一个并行处理访问计划。数据扫描、合并、分类、负载平衡、表格重组、 数据调用、创建索引、索引访问、备份与恢复等一系列工作都是在所有不同的节 点里同时完成的。DB2 UDB V7.2 以并行方式执行全部数据库功能,这包括全部 SQL 语句(Select、Insert、Update 和 Delete)、实用程序 (backup,restore,reorg,load)和数据存取方法(连接、表扫描和索引扫描)等,而 且无需任何额外的编程。这不仅提供了更好的性能和可伸缩性,而且也提供了更 佳的管理性有能力利用全部处理机去执行数据库管理任务。进一步说,DB2 UDB V7.2 既可用于联机事务处理(OLTP),又可用于决策支持查询工作。 (3) 管理工具在并行环境同样适用:管理工具在并行环境同样适用:Governor 帮助您控制每个用户及应用程 序的资源利用率,可自动调整查询的优先级。从而,在线平衡负载,简化系统管 理,减少关机时间。通过并行在线备份功能可显著减少备份及恢复所需的时间。 (4) 并行环境下功能不受任何限制:并行环境下功能不受任何限制:DB2 UDB V7.2 对多媒体数据的支持、 支持的客户端平台、支持的应用开发接口和开发工具以及动态位图索引等多维分 析功能、对 WEB 和 Java 的支持均不受限制。 (2) 对MPP结构计算机的独特支持 当企业的业务系统或数据仓库系统的数据量不断增大、并发用户量不断增大 时,依靠单一的数据库服务器往往难以获得比较好的性能和处理能力。此时,由 多台服务器协同工作成为解决这一问题的有效手段。 多台服务器协同工作的手段主要有共享硬盘的集群式计算机,以及不共享任 何资源而自以高速网络相连的海量并行处理计算机两种方式。随着计算机科学的 不断发展,无论是科学计算领域还是在数据库领域都已经备计算机科学家证明, 海量并行处理是目前解决大数据量、最大限度里并行处理能力的最佳手段。 运行在 MPP 体系结构计算机上的 DB2 UDB V7.2 企业扩展版(Enterprise Extended Edition),作为并行关系数据库它允许把单个数据库映象散布到多个系 统上,从而能利用所有系统的处理能力以满足用户对数据的需求。DB2 可以在 并行处理的多个节点上同时运行某一查询,从而提高查询性能,必要时它可以重 新编写查询以优化性能。然后,它自动生成用于并行处理的访问方案。它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论