(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf_第1页
(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf_第2页
(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf_第3页
(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf_第4页
(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(计算机科学与技术专业论文)基于oracle+rac平台的海量数据dml处理性能的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着i t 应用的广泛与深入发展,传统的计算架构难于适应企业急速发展带 来的需求。企业需要他们的系统以最低的成本、最高的效率、最出色的可用性 为企业提供服务。而事实上,他们的信息系统却往往响应缓慢,为了解决这个 问题,各企业不得不构建昂贵的基础架构,而这些架构的设计能力和冗余度却 远远超出应付偶然事件的需要。 同时,随着t b 时代的来临,海量数据大大降低了数据库日常操作和批量处 理的性能与效率。使用传统的数据库d m l 处理方法,即使在硬件支撑能力充足 的情况下,数据库处理t b 级数据的效率仍然十分低下。 o r a c l e1 0 9 是第一个为企业网格计算而设计的数据库,它带来了许多新技 术,并大幅度改良了数据库性能。i t 软硬件技术的高速发展,为企业向网格计 算转移带来了成熟的条件,合理利用o r a c l e1 0 9 数据库提供的新技术,并解决 企业成本、性能、效率的三大难题是本文研究的主要方向。 本文提出企业网格技术的概念,以o r a c l e1 0 9 数据库为研究背景,深入分 析o r a c l e1 0 9r a c 的核心机制。通过实例研究测试r a c 的三大特点,并在同 一实验条件下,测试单节点与双节点性能。以实验数据为基础,提出一种合理 利用当今软硬件新技术来架设高性能、低成本的r a c 数据库平台,解决企业难 题的方案。 以o r a c l e1 0 9r a c 平台为基础,并利用r a c 平台的特点,提出一种通过 加大r a c 数据库系统缓冲区,采用分组的批量绑定方式,大幅度提高海量数据 d m l 处理能力的方案,高效解决数据d m l 处理效率低下的问题。 关键字:o r a c l el o g ;o r a c l e 真正应用集群:o r a c l e 批量绑定 a b s t r a c t w i t ht h ee x t e n s i v ea n df u r t h e rd e v e l o p m e n to fi ta p p li c a t i o n ,t h e t r a d i t i o n a ls t r u c t u r eo ft h ec a l c u l a t i o nc a n tm e e tt h en e e d so f e n t e r p r i s e sw i t hr a p i dd e v e l o p m e n t e n t e r p r i s e sn e e dt h e i rs y s t e m sw i t h t h el o w e s tc o s t ,t h em o s te f f i c i e n ta n do u t s t a n d i n ga v a i l a b i1i t yt os e r v e e n t e r p r i s e s i n d e e d ,t h e i ri n f o r m a t i o ns y s t e m su s u a l l yr e s p o n ds l o w l y t os o l v e t h e s ep r o b l e m s ,a l le n t e r p r i s e sh a dt ob u i l de x p e n s i v e i n f r a s t r u c t u r e ,b u tt h e s ef a c i l i t i e s e x c e s sc a p a c i t ya n dr e d u n d a n c y a r ef a rf r o ma c c i d e n t a li n c i d e n t s m e a n w h i l e ,a c c o r d i n gt ot r a d i t i o n a l d m lp r i n c i p l e s ,e v e nw i t ha d e q u a t eh a r d w a r et os u p p o r t ,t h ed a t a p r o c e s s i n ge f f i c i e n c yi ss t i l l l o w o r a c l el o gi st h ef i r s td a t a b a s ed e s i g n e df o re n t e r p r i s eg r i d c o m p u t i n g ,i tw i l lb r i n gm a n y n e wt e c h n o l o g i e s ,a n ds u b s t a n t i a l l y i m p r o v et h ep e r f o r m a n c eo ft h ed a t a b a s e t h er a p i dd e v e l o p m e n to fi t t e c h n o l o g yh a sm a d ei ti m p o s s i b l et h a te n t e r p r i s e su s i n go r a c l el o g d a t a b a s ec a ns o l v et h ep r o b l e m so fc o s t ,p e r f o r m a n c e ,e f f i c i e n c ye a s i l y b a s e do nt h er e s e a r c ho fo r a c l el o g ,t h i sa r t i c l em a i n l ya n a l y z e d t h ec o r em e c h a n i s mo fo r a c l er a c ,s e tu pe x p e r i m e n t st ot e s tt h et h r e e m a j o rc h a r a c t e r i s t i c so fo r a c l er a c ,a n dc o m p a r e dt h ep e r f o r m a n c eo f t w o - n o d ew i t hs i n g l e n o d e o nt h eb a s i so ft h ee x p e r i m e n t a ld a t a ,t h i s a r t i c l ea l s op r o p o s e dar e s o l u t i o nt ob u i l dah i g hp e r f o r m a n c ea n dl o w c o s tc l u s t e rd a t a b a s ep l a t f o r mu s i n go r a c l er a cl o g o nt h ep l a t f o r mo f o r a c l el o gr a c ,u s i n go r a c l e1 0 9b u l kb i n d st e c h n o l o g y ,t h i sa r t i c l e f i n a l l yp r e s e n t san e wd m ls o l u t i o n s ,w h i c hc a nd e a lw i t hb u l kd a t aa n d s o l v et h ep r o b l e mo fl o we f f i c i e n c yg r e a t l y k e yw o r d s :o r a c l el o g ;o r a c l er a c ;o r a c l eb u l kb i n d s 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。本人 在论文写作中参考的其他个人或集体的研究成果,均在文中以明确方式标 明。本人依法享有和承担由此论文产生的权利和责任。 声明人( 签名) : 年月日 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大学有权保 留并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论 文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位 论文的内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出版。 保密的学位论文在解密后适用本规定。 本学位论文属于 1 保密( ) ,在年解密后适用本授权书。 2 不保密( ) ( 请在以上相应括号内打“”) 作者签名: 导师签名: 日期: 日期: 年 年 月 月 日 日 第一章绪论 1 1 论文的研究背景 第一章绪论 “网格就是下一代i n t e r n e t ,这句话强调了网格可能对未来社会的巨大影 响。在历史上,数据库系统曾经接受了i n t e r n e t 带来的挑战,毫无疑问,现在 数据库系统也将应对网格带来的挑战。o r a c l e1 0 9 网格数据库产品的推出,则 将网格技术的应用领域扩展到企业计算。网格计算将是数据库技术发展的大趋 势之一,数据库不仅仅是存储数据,而是要实现对信息整个生命周期的管理。 在o r a c l e 刚刚发布的o r a c l e1 0 9r e l e a s e2 中进一步改良了许多网格运算的 功能,提升了性能及简化管理功能。同时,可让客户更容易地在网格环境中分 享储存资源,大幅提升数据安全性。n 2 1 。 企业使用信息技术来增加竞争优势、提高工作效率并帮助用户更快做出明 智决策。然而,所有这些优势与信息技术的基础架构的优劣息息相关。如果一 个关键应用程序、服务器或数据不可用,那么整个企业可能面临严重的危机, 包括收入降低、客户流失和债务增加,同时各种负面报道将会对客户和公司的 声誉产生长期的影响。 构建一个具有高可用性的i t 基础架构对于希望在当今瞬息万变的经济环 境立于不败之地并取得成功的企业而言至关重要。 计算机软硬件发展的众多趋势,使得企业向网格计算转移变得更为容易: 硬件趋势 当今,使网格计算成为可能的主要原因是硬件的革新。例如: 处理器:新的低成本、高容量的i n t e li t a n i u m2 、s u ns p a r c 和i b m p o w e r p c6 4 位处理器现在提供的性能等于或者优于在高端s 肝服务器中使用 的处理器。 服务器:刀片服务器技术降低了硬件成本,并提高了服务器的密度,这进 一步降低了昂贵数据中心的需求。这些刀片服务器还自带了远程管理功能,这 使得数据中心管理员可以轻松地管理这些系统。 网络互联:千兆位以太网和无限带宽互联技术正不断降低连接服务器集群 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 的成本。 软件趋势 l i n u x 在小型计算机上已运行得非常良好,提供最好的性价比,是网格环 境的最佳选择。而且,l i n u x 继续保持比其它操作系统更快的增长速度。 刀片服务器较之s m p ,经济上的优势会使刀片服务器在网格环境中成为主 导。由于l i n u x 已经可以很好地用于刀片服务器,这将加速l i n u x 的成长。 因为l i n u x 具有价格优势,当刀片服务器数量不断增加时这种优势会更加明 显。所以,标准的低成本刀片服务器集群自然与l i n u x 非常相配。 只有当运行在硬件上的软件能够有效利用硬件革新时,这些革新才是有用 的。软件已经开始利用这些硬件革新。目前软件存在的一个问题是,它能够使 用提供给它的资源,但很难释放或者放弃不再需要的资源。o r a c l e1 0 9 数据 库能够利用这些硬件革新,并且可以轻松地释放不再需要的资源。 海量数据 在过去的二十年里,磁盘容量从在1 9 8 0 年初的2 0 0 m b ,到今天主流磁盘容 量已达到5 0 0 g b ,而且磁盘容量还在不断增长。有许多大数据的企业,磁盘容 量已经达到并超过了1 t b 。 要处理如此庞大的数据,对于服务器的性能以及数据库的执行能力是一个 最大的考验。对于目前流行的四大数据库软件中,o r a c l e 数据库和i b m 的d b 2 在支撑t b 级海量数据的计算上最为突出。 1 1 1 目前的研究和发展现状 从最早用文件系统存储数据算起,数据库的发展已经有5 0 多年了,其间经 历了2 0 世纪6 0 年代的层次数据库和网状数据库的并存,7 0 8 0 年代关系数据 库的异军突起,9 0 年代对象技术的影响。 目前比较流行的数据库软件主要有四种产品有啪3 :o r a c l e 数据库、 m i c r o s o f ts q ls e r v e r 、i b md b 2 、s y b a s ea s e 等。作为成熟的产品,关系数 据库已经走过了几十年的历史,如今各主流数据库厂商大动干戈、紧锣密鼓地 筹备各自新产品发布,为平淡的数据库市场掀起了新一轮热潮。甲骨文推出了 o r a c l e1 0 9 的第二版本;i b m 代号为v i p e r 的新一代d b 2 数据库产品于已推出 第一章绪论 了测试版本;微软公司的s q ls e r v e r2 0 0 5 已经在2 0 0 6 年推出,现在已升级到 s p 2 版本;s y b a s e 也推出新版本的数据库产品s y b a s ea s e1 5 。 在这四种数据库软件中,o r a c l e1 0 9 数据库与i b m 的d b 2v 8 1 数据库在运 行海量数据的性能方面是领先的: i b md b 2v 8 1 i b md b 2u d b 可以作为海量数据库引擎,在单u n i x 主机c p u 扩展方面,显 示了d b 2 在扩展性方面的能力。 在集群技术方面,i b md b 2 也有非常深入的研究,它采用s h a r en o t h i n g 的 m p p ( 大规模并行处理) 体系结构,每个节点独享各自的硬盘空间,各个节点间 通过网络交换数据。可伸缩性强,最多可以扩充到1 0 0 0 个节点。国外有5 1 2 节点的实例。每个数据库中单个表的大小可以达到5 1 2 g b 车1 0 0 0 = 5 0 0 t b 。在全球 范围有许多t b 级的数据库。 在数据处理方面,d b 2 积累了大量独有专利技术。针对任意的查询,d b 2 独 特的查询重写功能将所有s q l 语句改写成为语义上完全相同,但是可以使用优 化器所有优化功能的语句,优化器再自动选择最优的查询路径完成查询。 o r a c l el o g 相对于i b md b 2 ,o r a c l el o g 同样有着卓越的海量数据处理能力,而且在 集群方面做得更加成熟。o r a c l e 推出了o r a c l e 真正应用集群,它支持o r a c l e 数据库在集群上运行真正的应用程序。“真正应用 是指r a c 能够支持所有类 型的主流商业应用程序。r a c 集群可以实现多机共享数据库,从而保证了应用 的高可用性。同时可以自动实现并行处理和负载均衡,还能实现数据库在故障 时的容错和无断点恢复。当r a c 集群内的一个节点发生故障,o r a c l e 将应用 转移到其余的节点上运行。如果需要更高的处理能力,新的节点可以轻松添加 至集群。 o r a c l er a c 有三个主要特点使它在集群上优于i b md b 2 : 1 、共享磁盘技术:该技术比i b md b 2 的集群使用的独立硬盘空间技术更加 合理。r a c 允许多个实例同时访问同一数据库,所以一个实例的故障不会导致 无法访问数据库。 2 、高速缓存合并技术:高速缓存合并使得集群中的节点可以通过节点间的 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 互联高效地地同步其内存高速缓存,从而最大限度地降低磁盘i o 。 3 、透明的应用切换:当一个节点发生故障的时候,连接在该节点上的终端 用户会被自动重新连接到其它能够提供服务的数据库节点上。 o r a c l el o g 数据库增强了数据库内置各种主要的技术。其中,o r a c l e 数据 库为p l s q l 程序提供了批量绑定的功能。该功能可以一次性从指针中获取大量 数据行来减少c p u 的占用,并且让代码运行得更快。批量绑定的性能在o r a c l e l o g 得到进一步的优化,其性能比之前版本提高了2 到4 倍阳1 。目前,批量绑定 技术的在实际应用方面的文献与资料还很少。 为了体现网格技术的以及分组批量绑定技术的优势,需要有足够的业务数 据对数据库和服务器带来压力。因此,本文的研究是针对于数据量及数据吞吐 量庞大的企业。如果是一个规模不算很大的企业,一到两台服务器就已经可以 满足现在及未来几年企业发展的需要的话,将不在本文的方案的研究范围之内。 1 1 2 大型企业面i 临的难题 应用的不稳定性 在设计高度可用的i t 网格基础架构时,所面临的一大挑战是检查和解决 所有可能的停机原因。停机原因主要可以归为两类:意外停机和计划停机。在 设计容错和灵活i t 基础架构时,很重要的一点就要考虑意外停机和计划停机 时间。 意外停机主要是由于计算机故障或数据故障引起的。造成意外停机的一个 最常见的原因是系统故障或崩溃。系统故障是由于硬件故障、电源故障和操作 系统或服务器崩溃造成的。这些故障导致的中断次数取决于受影响的用户数量, 以及服务恢复的速度。用户希望数据库具有高可用性,当故障发生后,数据库 能自动快速进行故障恢复。 计划停机主要是由于生产系统的数据改变或系统改变而引起的。在大多数 情况下,这是由于硬件故障导致。企业希望,可以在不停机的情况下,来解决 由于计划停机带来的问题。 硬件升级成本太高 由于业务数据与用户的不断增加,一段时间后,势必会带来系统运算能力 第一章绪论 不足的问题。所以,用户一般采用高端s m p 设备来支撑数据库应用。当然,这 些设备的主机一般都会预留一定的扩展模块,以便将来升级。 购买高端的s m p 设备,硬件的一次投入会相当高,而且购置的设备在应用 初期甚至一段较长的时间内只使用了5 0 到7 0 的性能,造成资源的闲置。等到 设备性能不能满足需要的时候,企业只能通过预留的模块在一定程度上进行升 级,比如:加c p u 、内存等来提升主机的性能,但扩展能力十分有限,而且费 用不低。在升级后的很快时间内,主机的性能再次达到极限,而此时,主机已 无法再进行扩展,最终必然将会被淘汰。用户必须重新购置新的高端设备。而 旧服务器被闲置了,新服务器投入使用初期,性能又出现冗余,造成了无法避 免的浪费。 海量数据降低了数据d m l 操作性能 随着业务数据的迅速膨胀,数据库容量已进入了t b 级时代。如此庞大的数 据量势必会影响数据库的日常事务处理性能,业务处理反应缓慢。面对庞大的 数据量与日吞吐量,数据库每一次的大批量数据操作都是件很棘手的问题。当 硬件的性能达到或超过极限时,数据库的稳定性必然降低,特别是业务处理到 高峰期时,宕机出现频率增大。对于许多行业来说,哪怕是一分钟的停机,对 企业的损失也是巨大的。 1 2 本课题的研究价值 本课题的研究,是在一次无意间,有感于网上看到一位在电信业工作多年 的d b a 帖子,以下就是摘取了他说的两段话: “】( ) ( 省的移动电话用户有两千万,一个人一天只打一个电话,数据库便增 加了两千万行。如果打的是网内电话,则记录则要双倍,因为要记录拨打者与 接听者的通话信息。数据暴涨,服务器的处理能力也跟不上了,一年半之前花 两百万买的一台i b mp 5 7 0 小型机,现在已经跑不动了,现在又得开始着手升 级工作了 “有谁相信,删除2 0 亿行数据要花4 天的时间才能完成? 由于需要对没用 的历史数据进行转移,需要删除2 0 0 1 年某月份2 0 亿行的通话记录信息。一次 性删除超过1 4 0 万行数据时,系统便报回滚段空间不足,删除失败。经实验计 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 算,一次删除1 2 0 万行数据,删除所需要耗费的时间是3 分半钟,如果按这种 速度删除2 0 亿行数据的话,需要9 5 个小时才能删除完成。而在数据删除过程 中,占用了大量的c p u 和1 0 资源,为不影响白天高峰期的系统性能,每次删除 都必须放在半夜进行 其实,电信行业就是海量数据库处理的典型例子。比如,浙江移动,预付 费移动呼叫授权系统有1 5 t b 的容量,批次计费系统仅数据就有2 1 t b 的容量, 每天加载数据量达到3 0 0 g b 。 如何解决这些棘手的问题,真正实现硬件投入的高可用性与高性能,降低 企业用户的成本,并且提高海量数据的操纵能力? 这是本文研究的主要目标。 本课题的研究价值主要在以下两点: 1 深入研究o r a c l er a c 机制,充分分析o r a c l e1 0 9r a c 引以自豪的网 格应用核心技术。架设o r a c l er a c 实例,测试o r a c l er a c 三大性能 特点,以及双节点r a c 带来的性能提升,实验证明r a c 应用的可行性与 优越性。利用当前发展的软硬件趋势,为大型企业用户设计一个高稳定、 高性能、低成本的企业信息平台。 2 在o r a c l el o gr a c 平台下,利用o r a c l e1 0 9b u l kb i n d s 技术,研究 出一种通过提高r a c 数据库系统缓冲区,采用分组的批量绑定方案,大 幅度提高海量数据d m l 处理能力的方案,有效解决海量数据库d m l 处理 效率低下的问题。 1 3 本文的主要内容和组织 本文主要通过对o r a c l e1 0 9 数据库的研究,深入分析o r a c l er a c 核心机 制,架设实例测试r a c 三大特点,在同一条件下,测试对比单节点与双节点性 能;以实验数据为基础,提出一种利用o r a c l e1 0 9r a c 架设高性能、低成本 的集群数据库平台的解决方案;并在o r a c l e1 0 9r a c 平台下,使用o r a c l e1 0 9 b u l kb i n d s 技术,研究出一种通过提高r a c 数据库系统缓冲区,采用分组的批 量绑定解决方案,大幅度提高海量数据d m l 处理能力的方案,有效解决数据库 海量数据d m l 处理效率低下的问题。 本文的组织如下: 第一章绪论 第一章,介绍了论文的研究背景,发展现状,研究价值以及内容安排。 第二章,简述了o r a c l e1 0 g 数据库基础功能以及新技术,并着重论述实现 高可用性、高稳定性的r a c 技术;大幅度提高数据操纵能力的o r a c l eb u l kb i n d s 技术,以及本文将涉及到的p l s q l 语言的相关知识。 第三章,提出企业网格计算概念,介绍了o r a c l el o gr a c 的体系结构与技 术特点,并通过实验架设r a c 数据库平台,以实验数据分析o r a c l er a c 带来 的性能飞跃,并为第四章的进一步实现创造基础。 第四章,基于r a c 平台对o r a c l eb u l kb i n d s 功能原理进行分析,提出利 用批量绑定技术来提高海量数据操纵性能的观点;运用s q l 脚本实例对比分析, 验证批量绑定的强大优势。得到一种通过合理增加系统缓冲区值,并通过分组 批量绑定的方式来大幅度提高t b 级海量数据操纵性能的方法。 第五章,总结全文,提出软硬件构想平台,并在该平台上运用分组批量绑 定技术,大幅度提高t b 级海量数据d m l 操作性能的方案。 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 第二章o r a c l e1 0 g 数据库 2 1o r a c i e1 0 6 数据库概述 由于各种各样的原因,今天大多数企业的每个主要的应用系统都拥有专门 的存储器和服务器。通过系统将他们隔离在自己的硬件和软件上,这样部署个 别系统要容易些。然而,这将导致大量的系统需要维护,增加管理与硬件成本。 此外,单个系统必须有足够的规模以适应高峰容量,然而资源却难于从一个系 统转移到另一个系统,结果像现在的企业常常有未充分利用的存储器和c p u 资 源。分析家们已经指出,一般的存储器的利用率为5 0 ,而c p u 利用率为 r 1 1 5 2 0 “。 需求的不断增长使利用率不足的问题更加严重,结果是不仅成本更高,而 且基础架构的复杂度也日益提高,而复杂度的提高将最终削弱z t 响应快速变 化的业务需求的能力。 企业级网格计算n 1 就是针对这些的解决方案。企业级网格计算的焦点是要创 建大型的符合行业标准的、模块化的存储器和服务器池。利用这种体系结构, 每一个新系统都可以从这个组件池中快速得到供应,也不需要根据高峰负载来 确定系统规模,因为可以容易地从这些资源池中按需要增加或重新分配容量。 企业级网格计算通过多种途径显著地降低了成本。凭借使用低成本的组件 来大大提高资源利用水平,降低了硬件成本。同时,因为每一个系统都可以按 照相同的设计图来构建,加上集中化管理和管理工具减轻了维护和监控的负担, 还能极大地降低人工成本。 存储网格 对数据库而言,存储器是主要的资源之一。在今天的标准环境中,为获得 最大吞吐量而在磁盘存储器之间存放数据的过程可能是一个费时的过程,并且 数据库每次向存储区增加或从存储区删除磁盘时,都要重复这个过程。 0 r a c l e 数据库1 0 9 中新的自动存储管理( a s m ) 功能解决了这些挑战。 a s m 为0 r a c l e 数据库提供全面的存储管理,不需要文件系统和大容量磁盘管 理。a s m 自动向所有磁盘散布数据,以最小的管理成本提供了最高的i o 吞吐 第二章o r a c l e1 0 g 数据库 率。增减磁盘时,a s m 自动重新对数据进行动态分布。利用可选的镜像功能, 提高了数据利用率,并且可以在线添加和删除磁盘。a s m 可确保使用低成本的 存储器实现高端控制器所具有的稳定性和高质量。a s m 节省了软件许可费用、 d b a 和系统管理员时间、以及性能分析时间。 数据库网格 如上所述,企业级网格计算的一般方法是建立大型的服务器池,从而在需 要时动态地向系统供应服务器。从业务角度看,供应方法为用户提供了较好的 性能,因为资源可以根据业务优先权或需要提供给合适的应用程序。 o r a c l er a c 在服务器集群上运行和调整全部应用负载的独特能力是企业网 格的重要基础。利用两个主要的新功能,o r a c l e 数据库l o g 使得管理集群数 据库更加容易:集成的集群件和自动工作负载管理。o r a c l e 数据库l o g 支持 的所有平台均可使用集成的集群件,它们的功能包括集群连接、消息和锁定、 集群控制和恢复及工作负载管理框架。集成的集群件消除了购买、安装、配置 和支持第三方集群件的需求,从而使得o r a c l er a c 变得容易。自动负载管理 简化了对负载( 服务) 的动态服务器供应。可以定义规则使之在正常工作时和 应对故障时自动为每个服务分配处理资源,这些规则可以动态修改以满足不断 变化的业务需求。这种在一个数据库网格内动态适应资源分配的能力是o r a c l e r a c 的特有能力,且在实施企业网格计算中非常重要。 除了集群管理的改进以外,o r a c l e 数据库l o g 中的o r a c l er a c 还提供 了在集群配置发生改变时向中间层自动通知事件的功能。于是中间层能够立即 进行例程故障切换或使用新例程。这使终端用户能够在发生例程失败时继续工 作,而不会发生典型的由于网络超时而引起的延迟。如果有新例程可用,中间 层能够立即启动到该例程的负载平衡连接。o r a c l e 数据库l o gj o b c 驱动程序 具有“快速连接故障切换功能,并自动处理这些事件。 结论 o r a c l e 数据库l o g 是一个为企业级网格计算而设计的数据库。o r a c l e 数 据库l o g 赋予执行企业级网格计算所需的灵活性。它极大地降低了管理负担, 同时也有助于在提供最高品质服务的同时降低成本。o r a c l el o gr a c 是一个完 整的集群软件解决方案,它的应用适用于每种用户。它提供了单一的供应商支 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 持,无需第三方组件,也不需购买附加软件,易于安装和管理,因此不会显著 增加系统的复杂性已有成本。o r a c l e 数据库使企业i t 能够更好地响应不断 变化的业务环境,以及用更低的成本、更高的可伸缩性、可预测性和最高可用 性降低风险。 2 2o r a c l el o gr a c 技术概述 o r a c l er a c1 0 9 主要用于管理领域。o r a c l er a c1 0 9 在管理方面的改进显 著降低了管理成本,并提供了更出色的灵活性,从而赋予了企业更高的适应性、 前瞻性和敏捷性。o r a c l er a cl o g 是企业网格的一项主要基础技术。现在,企 业的i t 部门面临巨大的压力,他们需要以最低的成本,最高的效率和灵活性, 提供优质的服务,同时具有最出色的可用性和可伸缩性。简而言之,i t 部门需 要以最低的成本,完成最多的事情。企业网格能够把这些看似无法解决的挑战 变成现实。它由大规模的低成本商用集群组成,显著降低了计算机硬件的成本。 o r a c l er a c 技术可为这一低成本硬件平台提供支持,使其提供优质的服务,并 达到或超出昂贵的大型s m p 计算机所能提供的可用性和可伸缩性等级。通过显 著降低管理成本和提供出色的管理灵活性,o r a c l e 为企业网格环境提供了强有 力的支持。口1 企业网格有着深远的影响,可赋予企业更出色的适应性、前瞻性和敏捷性。 在企业网格中,数据中心将可以动态改变自身特性,以实时支持企业瞬息万变 的需求。应用程序工作负载将以服务的形式进行管理,同时必需满足规定的质 量等级。处理资源和存储器将以数据流的形式分配给服务,以确保满足规定的 质量要求。网格中的每一处理节点或存储组件可近乎实时地改变自身的特性, 而不会对应用程序产生任何影响。 o r a c l er a c 支持o r a c l e 数据库在集群上运行真正的应用程序。此处的真 正应用是指r a c 能够支持所有类型的主流商业应用程序。这包括流行的封装产 品,如s a p 、p e o p l e s o f t 和o r a c l ee , b u s i n e s ss u i t e 等,以及自主研发的 应用程序,其中包括0 l t p 和d s s ,以及o r a c l e 有效支持混合o l t p d s s 环 境的独有能力h 1 。 o r a c l er a c 运行于集群之上,为o r a c l e 数据库提供了最高级别的可用性、 第二章o r a c l el o g 数据库 可伸缩性和低成本计算能力。如果集群内的一个节点发生故障,o r a c l e 将可以 继续在其余的节点上运行。如果需要更高的处理能力,新的节点可轻松添加至 集群。为了保持低成本,即使最高端的系统也可以从采用标准化商用组件的小 型低成本集群开始逐步构建而成。 0 r a c l e 真正应用集群l o g 的新功能: 将集群作为一个单一集成的系统映像进行管理。 实现主要功能的自动化,诸如工作负载管理等以前需要人工完成的功 能。 改进与所有其它o r a c l e 特性和功能的集成,使其能够以透明的方式, 全面支持r a c 环境。 全新和改进的工具,用于验证集群配置的正确性并帮助快速找出故障 点。 改进性能,使众多应用程序受益。 零停机时间补丁,面向o r a c l er a c 集群环境。哺1 o r a c l er a cl o g 的集成集群件管理具有以下优势: 成本低。 单一厂商支持。 安装、配置和持续维护更简单。o r a c l er a cl o g 集群件使用标准o r a c l e 数据库管理工具进行安装、配置和维护。这一过程无须其它的集成步骤。 兼容所有平台。例如,一些第三方集群件产品限制了集群内可以支持的 节点的数量。借助o r a c l er a cl o g ,所有平台可以支持多达6 4 个节 点。用户还可以在所有平台上获得一致的响应体验,从而有效解决了高 可用性挑战,包括服务器节点故障、互连故障以及i o 隔离现象等。 支持高级功能。这包括集成监视和通知功能,从而在发生故障时,在数 据库和应用层之间实现快速协调的恢复 o r a c l er a cl o g 提供的特定新管理性增强功能实现了企业网格和“r a c 无处不在 。企业网格采用大型标准化商用组件配置:处理器、网络和 存储器。利用o r a c l er a c 的高速缓存合并技术,o r a c l e 数据库实现 了最高可用性和可伸缩性。现在,利用o r a c l er a cl o g 大幅降低了运 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 行成本,进一步增强了灵活性,其动态提供节点、存储器、c p u 和内存 的特性可以更轻松、高效地保持服务级别,而通过提高的利用率又进一 步降低了成本。企业网格是未来的数据中心,使企业具备更高的适应能 力、前瞻性和敏捷性。啪 2 3o r a c l eb u i kb i n d s 技术概述 p l s q l 是o r a c l e 的过程语言,由s q l 扩充而来。它将s q l 的简单和灵 活与结构化程序语言的过程功能相结合。p l s q l 代码可以集中存储在数据库 中。使用p l s q l 存储过程可以改善性能并优化内存用量陋1 ,这是因为: 应用程序和数据库之间的网络流量减少了。 过程的编译形式在数据库中已经存在,所以在执行过程中不再需要编译 过程。 多位用户可以共享内存中的一个过程。 通过使用p l s q l ,o r a c l e 数据库1 0 9 在性能方面有了重大改进。p l s q l 编译器经过重新编写,它为高效而持续地优化计算密集型p l s q l 程序提供了 框架。新的编译器包括一个更加成熟的代码生成器和一个可以充分改善大部分 程序的性能的全局代码优化器。其结果是提升了性能,尤其是计算密集型 p l s q l 程序,对于一个单纯的p l s q l 程序来说,其性能比0 r a c l e 9 i d a t a b a s er e l e a s e2 超出大约2 倍呻1 。 p l s q l 的优点 p l s q l 是被可靠地整合到o r a c l e 中的,一旦掌握p l s q l 的优点以及其独 有的数据管理的便利性,就很难想象o r a c l e 缺了p l s q l 的情形会如何。p l s q l 不是一个独立的,它是一个整合到o r a c l e 服务器和o r a c l e 工具中的技术,可 以把p l s q l 看作o r a c l e 服务器内的一个引擎,s q l 语句执行者处理单个的s q l 语句,p l s q l 引擎处理p l s q l 程序块。当p l s q l 程序块在p l s q l 引擎处理 时,o r a c l e 服务器中的s q l 语句执行器处理p l s q l 程序块中的s o l 语句。 p l s q l 的优点如下n 仉n 1 : 第二章o r a c l ei o g 数据库 p l s q l 是一种高性能的基于事务处理的语言,能运行在任何o r a c l e 环 境中,支持所有数据处理命令。通过使用p l s q l 程序单元处理s q l 的 数据定义和数据控制元素。 p l s o l 支持所有s o l 数据类型和所有s o l 函数,同时支持所有o r a c l e 对象类型 p l s q l 块可以被命名和存储在o r a c l e 服务器中,同时也能被其他的 p l s q l 程序或s o l 命令调用,任何客户服务器工具都能访问p l s q l 程序,具有很好的可重用性。 可以使用o r a c l e 数据工具管理存储在服务器中的p l s q l 程序的安全 性。可以授权或撤销数据库其他用户访问p l s q l 程序的能力。 p l s q l 代码可以使用任何a s c i i 文本编辑器编写,所以对任何o r a c l e 能够运行的操作系统都是非常便利的 对于s q l ,o r a c l e 必须在同一时间处理每一条s q l 语句,在网络环境下这 就意味作每一个独立的调用都必须被o r a c l e 服务器处理,这就占用大量的服务 器时间,同时导致网络拥挤。而p l s q l 是以整个语句块发给服务器,这就降低 了网络拥挤。 p l s q l 块结构 p l s q l 是一种块结构的语言,组成p l s q l 程序的单元是逻辑块,一个 p l s q l 程序包含了一个或多个逻辑块,每个块都可以划分为三个部分。与其他 语言相同,变量在使用之前必须声明,p l s q l 提供了独立的专门用于处理异常 的部分,下面描述了p l s q l 块的不同部分n 1 1 2 1 3 1 : 声明部分( d e c l a r a t i o ns e c t i o n ) 声明部分包含了变量和常量的数据类型和初始值。这个部分是由关键字 d e c l a r e 开始,如果不需要声明变量或常量,那么可以忽略这一部分;需要说 明的是游标的声明也在这一部分。 执行部分( e x e c u t a b l es e c ti o n ) 执行部分是p l s q l 块中的指令部分,由关键字b e g i n 开始,所有的可执行 语句都放在这一部分,其他的p l s q l 块也可以放在这一部分。 异常处理部分( e x c e p ti o ns e c ti o n ) 这一部分是可选的,在这一部分中处理异常或错误。 基于o r a c l er a c 平台的海量数据d m l 处理性能的研究 d e c l a r e d e c l a r a ti o ns t a t e m e n t s b e g i n e x e c u t a b l es t a t e m e n t s e x c e p t i o n _ _ _ 。e x c e p ti o ns t a t e m e n t s e n d p l s q l 块中的每一条语句都必须以分号结束,s o l 语句可以使多行的,但 分号表示该语句的结束。一行中可以有多条s o l 语句,他们之间以分号分隔。 每一个p l s q l 块由b e g i n 或d e c l a r e 开始,以e n d 结束。注释由一标示。 p l s q l 块的命名和匿名 p l s o l 程序块可以是一个命名的程序块也可以是一个匿名程序块。匿名程 序块可以用在服务器端也可以用在客户端。 命名程序块可以出现在其他p l s q l 程序块的声明部分,这方面比较明显的 是子程序,子程序可以在执行部分引用,也可以在异常处理部分引用。 变量和常量 变量存放在内存中以获得值,能被p l s q l 块引用。你可以把变量想象成一 个可储藏东西的容器,容器内的东西是可以改变的。 声明变量 变量一般都在p l s q l 块的声明部分声明,p l s q l 是一种强壮的类型语言, 这就是说在引用变量前必须首先声明,要在执行或异常处理部分使用变量,那 么变量必须首先在声明部分进行声明。 声明变量的语法如下: v a r i a b l e n a m e c o n s t a n t d a t a t y t e n o tn u l l := id e f a u l te x p r e s si o n 注意:可以在声明变量的同时给变量强制性的加上n o tn u l l 约束条件,此 时变量在初始化时必须赋值。 给变量赋值 给变量赋值有两种方式: 直接给变量赋值 第二章o r a c l ei o g 数据库 x := 2 0 0 : y := y + ( x * 2 0 ) : 通过s o ls e l e c ti n t o 或f e t c hi n t o 给变量赋值 s e l e c ts u m ( s a l a r y ) ,s u m ( s a l a r y 木o 1 ) i n t ot o t a l _ s a l a r y ,t a t a l _ c o m m i s s i o n f r o me m p l o y e e w h e r ed e f t = t o : 常量 常量与变量相似,但常量的值在程序内部不能改变,常量的值在定义时赋 予,它的声明方式与变量相似,但必须包括关键字c o n s t a n t 。常量和变量都可 被定义为s o l 和用户定义的数据类型。 z e r o _ v a l u ec o n s t a n tn u m b e r := 0 : 这个语句定了一个名叫z e r o _ v a l u e 、数据类型是n u m b e r ,值为o 的常量。 执行部分 执行部分包含了所有的语句和表达式,执行部分以关键字b e g i n 开始,以关 键字e x c e p t i o n 结束,如果e x c e p t i o n 不存在,那么将以关键字e n d 结束。分 号分隔每一条语句,使用赋值操作符:= 或s e l e c ti n t o 或f e t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论