




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、Oracle分区简介 ORACLE的分区是一种处理超大型表、索引等的技术。分区是一种“分而治之”的技术,通过将大表和索引分成可以管理的小块,从而避免了对每个表作为一个大的、单独的对象进行管理,为大量数据提供了可伸缩的性能。分区通过将操作分配给更小的存储单元,减少了需要进行管理操作的时间,并通过增强的并行处理提高了性能,通过屏蔽故障数据的分区,还增加了可用性。 二、Oracle分区优缺点 l 优点: 增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用; 维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可; 均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能; 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。 l 缺点: 分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。 三、Oracle分区方法 l 范围分区: 范围分区就是对数据表中的某个值的范围进行分区,根据某个值的范围,决定将该数据存储在哪个分区上。如根据序号分区,根据业务记录的创建日期进行分区等。 l Hash分区(散列分区): 散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。 l List分区(列表分区): 当你需要明确地控制如何将行映射到分区时,就使用列表分区方法。与范围分区和散列分区所不同,列表分区不支持多列分区。如果要将表按列分区,那么分区键就只能由表的一个单独的列组成,然而可以用范围分区或散列分区方法进行分区的所有的列,都可以用列表分区方法进行分区。 l 范围-散列分区(复合分区): 有时候我们需要根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区内再使用散列分区的一种分区方法(注意:先一定要进行范围分区) l 范围-列表分区(复合分区): 范围和列表技术的组合,首先对表进行范围分区,然后用列表技术对每个范围分区再次分区。与组合范围-散列分区不同的是,每个子分区的所有内容表示数据的逻辑子集,由适当的范围和列表分区设置来描述。(注意:先一定要进行范围分区) 四、Oracle表分区表操作 -Partitioning 是否为true select * from v$option s order by s.PARAMETER desc -创建表空间 CREATE TABLESPACE PARTION_03 LOGGING DATAFILE D:ORACLEORADATAJZHUAPARTION_03.dbf SIZE 50M EXTENT MANAGEMENT LOCAL SEGMENT SPACE MANAGEMENT AUTO -删除表空间 drop tablespace partion_01 -范围 分区技术 create table Partition_Test ( PID number not null, PITEM varchar2(200), PDATA date not null ) partition by range(PID) ( partition part_01 values less than(50000) tablespace dinya_space01, partition part_02 values less than(100000) tablespace dinya_space02, partition part_03 values less than(maxvalue) tablespace dinya_space03 ) create table Partition_TTest ( PID number not null, PITEM varchar2(200), PDATA date not null ) partition by range(PDATA) ( partition part_t01 values less than(to_date(2004-01-01,yyyy-mm-dd) tablespace dinya_space01, partition part_t02 values less than(to_date(2008-01-01,yyyy-mm-dd) tablespace dinya_space02, partition part_t03 values less than(maxvalue) tablespace dinya_space03 ) insert into Partition_Test(PID,PITEM,PDATA) select h.id,h.userid,h.rectime from st_handle h select * from Partition_Test partition(part_01) t where t.pid = 1961 -hash 分区技术 create table Partition_HashTest ( PID number not null, PITEM varchar2(200), PDATA date not null ) partition by hash(PID) ( partition part_h01 tablespace dinya_space01, partition part_h02 tablespace dinya_space02, partition part_h03 tablespace dinya_space03 ) insert into Partition_HashTest(PID,PITEM,PDATA) select h.id,h.userid,h.rectime from st_handle h select * from Partition_HashTest partition(part_h03) t where t.pid = 1961 -复合分区技术 create table Partition_FHTest ( PID number not null, PITEM varchar2(200), PDATA date not null ) partition by range(PDATA) subpartition by hash(PID) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) ( partition part_fh01 values less than(to_date(2004-01-01,yyyy-mm-dd) tablespace dinya_space01, partition part_fh02 values less than(to_date(2008-01-01,yyyy-mm-dd) tablespace dinya_space02, partition part_fh03 values less than(maxvalue) tablespace dinya_space03 ) insert into Partition_FHTest(PID,PITEM,PDATA) select h.id,h.userid,h.rectime from st_handle h select * from Partition_FHTest partition(part_fh02) t where t.pid = 1961 select * from Partition_FHTest partition(part_fh03) t -速度比较 select * from st_handle h where h.rectime to_date(2008-01-01,yyyy-mm-dd); select * from Partition_FHTest partition(part_fh03) t where t.pdata to_date(2008-01-01,yyyy-mm-dd); -分区表操作 -增加一个分区 alter table Partition_Test add partition part_05 values less than (10020) tablespace dinya_space03 -查询分区数据 select * from Partition_FHTest partition(part_fh02) t -修改分区里的数据 update Partition_FHTest partition(part_fh02) t set t.PITEM = JZHUA where t.pid = 1961 -删除分区里的数据 delete from Partition_FHTest partition(part_fh02) t where t.pid = 1961 -合并分区 create table Partition_HB ( PID number not null, PITEM varchar2(200), PDATA date not null ) partition by range(PID) ( partition part_01 values less than(50000) tablespace dinya_space01, partition part_02 values less than(100000) tablespace dinya_space02, partition part_03 values less than(maxvalue) tablespace dinya_space03 ) insert into Partition_HB(PID,PITEM,PDATA) select h.id,h.userid,h.rectime from st_handle h select * from Partition_HB partition(part_03) t where t.pid = 100001 alter table Partition_HB merge partitions part_01,part_02 into partition part_02; -拆分分区 - spilt partition 分区名 at(这里是一个临界区,比如:50000就是说小于50000的放在part_01,而大于50000的放在part_02中) alter table Partition_HB split Partition part_02 at (50000) into (Partition part_01 tablespace dinya_space01, Partition part_02 tablespace dinya_space02); -更改分区名 alter table Partition_HB rename Partition part_01_test to part_02; 五、Oracle索引分区表操作 分区表和一般表一样可以建立索引,分区表可以创建局部索引和全局索引。当分区中出现许多事务并且要保证所有分区中的数据记录的唯一性时采用全局索引。全局索引建立时 global 子句允许指定索引的范围值,这个范围值为索引字段的范围值。其实理论上有3中分区索引。 l Global索引(全局索引): 对于 global 索引,可以选择是否分区,而且索引的分区可以不与表分区相对应。当对分区进行维护操作时,通常会导致全局索引的 Invalid,必须在执行完操作后 Rebuild。Oracle9i 提供了 Update Global Indexes 语句,可以在进行分区维护的同时重建全局索引。 1:索引信息的存放位置与父表的Partition(分区)信息完全不相干。甚至父表是不是分区表都无所谓的。 create index dinya_idx_t on dinya_test(item_id) global partition by range(item_id) ( partition idx_1 values less than (1000) tablespace dinya_space01, partition idx_2 values less than (10000) tablespace dinya_space02, partition idx_3 values less than (maxvalue) tablespace dinya_space03 ); 2:但是在这种情况下,如果父表是分区表,要删除父表的一个分区都必须要更新Global Index ,否则索引信息不正确 ALTER TABLE TableName DROP PARTITION PartitionName Update Global Indexes l Local索引(局部索引): 对于 local 索引,每一个表分区对应一个索引分区(就是说一个分区表一个字段只可以建一个局部索引),当表的分区发生变化时,索引的维护由 Oracle 自动进行; 1:索引信息的存放位置依赖于父表的Partition(分区)信息,换句话说创建这样的索引必须保证父表是Partition(分区),索引信息存放在父表的分区所在的表空间。 2:但是仅可以创建在父表为HashTable或者composite分区表的。 3:仅可以创建在父表为HashTable或者composite分区表的。并且指定的分区数目要与父表的分区数目要一致。 create index dinya_idx_t on dinya_test(item_id) local ( partition idx_1 tablespace dinya_space01, partition idx_2 tablespace dinya_space02, partition idx_3 tablespace dinya_space03 ); 不指定索引分区名直接对整个表建立索引 create index dinya_idx_t on dinya_test(item_id);-ORACLE 为构建数据仓库提供了4种类型的分区方法:Range Partition ,Hash Partition ,List Partition,Composite Partition.下面我分别对这四种分区方法的概念,他们的使用场景,以及各种分区方法做一个性能比较。一:概念1:Range Partitioning这是最常用的一种分区方法,基于COLUMN的值范围做分区,最常见的是基于时间字段的数据的范围的分区,比如:对于SALE表,可以对销售时间按照月份做一个Range Partitioning。这种分区在数据仓库里用的比较多,以下是CREATE STATMENTCREATE TABLE sales_range (salesman_id NUMBER(5), salesman_name VARCHAR2(30), sales_amount NUMBER(10), sales_date DATE)COMPRESSPARTITION BY RANGE(sales_date)(PARTITION sales_jan2000 VALUES LESS THAN(TO_DATE(02/01/2000,DD/MM/YYYY),PARTITION sales_feb2000 VALUES LESS THAN(TO_DATE(03/01/2000,DD/MM/YYYY),PARTITION sales_mar2000 VALUES LESS THAN(TO_DATE(04/01/2000,DD/MM/YYYY),PARTITION sales_apr2000 VALUES LESS THAN(TO_DATE(05/01/2000,DD/MM/YYYY);对于COMPRESS关键字的理解,将在后续的压缩分区讲到2;Hash PartitioningHash Partitioning映射数据到基于HASH算法的分区上,HASH算法将应用你指定的分区关键字,平均的分那些在Partitions中的行。给每一个分区近似相同的大小,要保证数据能平均分配,分区数一般是2N。比如说,需要insert sales_hash 一条数据,ORACLE会通过HASH算法处理salesman_id,然后找到对于的分区表进行insert。Hash Partitioning 是为跨越设备的分布式数据提供了一种理想的方法,HASH算法也很容易转化成RANGE分区方法,特别是当被分区的数据不是历史数据时。CREATE TABLE sales_hash(salesman_id NUMBER(5), salesman_name VARCHAR2(30), sales_amount NUMBER(10), week_no NUMBER(2) PARTITION BY HASH(salesman_id) PARTITIONS 4;3:List PartitioningList Partitioning能够让你明确的控制有多少行被分区,你能对要分区的COLUMN上明确的指定按照那些具体的值来分区,这种方式在Range和Hash方式是做不到的。这种方式的优点是,你能组织和分组那些没有顺序和没有关系的数据集。下面是通过销售地区做一个List分区表。CREATE TABLE sales_list(salesman_id NUMBER(5), salesman_name VARCHAR2(30),sales_state VARCHAR2(20),sales_amount NUMBER(10), sales_date DATE)PARTITION BY LIST(sales_state)(PARTITION sales_west VALUES(California, Hawaii) COMPRESS,PARTITION sales_east VALUES(New York, Virginia, Florida),PARTITION sales_central VALUES(Texas, Illinois);4:Composite PartitioningComposite Partitioning 是把Range ,Hash ,List 分区方式组合起来的分区方式。比如Composite Range-Hash Partitioning和Composite Range-List Partitioning:CREATE TABLE sales_range_hash(s_productid NUMBER,s_saledate DATE,s_custid NUMBER,s_totalprice NUMBER)PARTITION BY RANGE (s_saledate)SUBPARTITION BY HASH (s_productid) SUBPARTITIONS 8(PARTITION sal99q1 VALUES LESS THAN (TO_DATE(01-APR-1999, DD-MON-YYYY),PARTITION sal99q2 VALUES LESS THAN (TO_DATE(01-JUL-1999, DD-MON-YYYY),PARTITION sal99q3 VALUES LESS THAN (TO_DATE(01-OCT-1999, DD-MON-YYYY),PARTITION sal99q4 VALUES LESS THAN (TO_DATE(01-JAN-2000, DD-MON-YYYY);另外你还可以用subpartition template的方式指定:CREATE TABLE sales_range_hash(s_productid NUMBER,s_saledate DATE,s_custid NUMBER,s_totalprice NUMBER)PARTITION BY RANGE (s_saledate)SUBPARTITION BY HASH (s_productid)SUBPARTITION TEMPLATE(SUBPARTITION sp1 TABLESPACE tbs1,SUBPARTITION sp2 TABLESPACE tbs2,SUBPARTITION sp3 TABLESPACE tbs3,SUBPARTITION sp4 TABLESPACE tbs4,SUBPARTITION sp5 TABLESPACE tbs5,SUBPARTITION sp6 TABLESPACE tbs6,SUBPARTITION sp7 TABLESPACE tbs7,SUBPARTITION sp8 TABLESPACE tbs8)(PARTITION sal99q1 VALUES LESS THAN (TO_DATE(01-APR-1999, DD-MON-YYYY), PARTITION sal99q2 VALUES LESS THAN (TO_DATE(01-JUL-1999, DD-MON-YYYY), PARTITION sal99q3 VALUES LESS THAN (TO_DATE(01-OCT-1999, DD-MON-YYYY), PARTITION sal99q4 VALUES LESS THAN (TO_DATE(01-JAN-2000, DD-MON-YYYY);这样,没有子分区通过的HASH分区将会统一到不同的表空间。二:使用各种分区方法的场景1:什么时候用Range PartitionRange Partition是一种方便的方法分区历史的数据,经常在DATE COLMUN通过时间间隔组织数据。比如说:你要查询2009年8月的数据,查询将直接找到2009年8月的分区,避免了大量不必要的数据扫描。在处理周期性的load新数据和purge老数据的时候,Range Partition也是一个理想的选择。应用场景: a)有一个大表需要通过时间字段频繁的访问,通过这个时间字段做RANG PARTITION 有利于做分区裁剪。 b)如果你不能对一个大表在指定的时间内做备份或RESTORE,你可以通过RANGE把他们分成小的logic片来做。2:什么时候用HASH PartitionHASH Partition不是一个很好的管理历史的方法。应用场景 a)增加大表的可用性。 b)避免各个分区之间查找数据,并且各个分区可以放在不同的设备上,达到最大的I0吞吐量。也可以用STORE IN 子句分配每个分区到不同的表空间。3:什么时候用LI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025内蒙古电力集团内蒙古康远监理公司成熟型电力工程监理人才招聘61人笔试参考题库附带答案详解
- 2025中国铁建昆仑投资集团有限公司经营机构有关岗位招聘26人笔试参考题库附带答案详解
- 2024-2025学年度海船船员考试考前冲刺练习试题及参考答案详解【预热题】
- 游戏娱乐行业游戏推广方案
- 深圳富士康线上考试试题及答案
- 2025年诊所医保考试题及答案
- 成都小区物业管理协议
- 2025年新能源行业企业数字化转型与能源安全评估报告
- 旅游线路开发与合作协议合同书及运营规范承诺函
- 2025年禽类养殖考试题及答案
- DB65-T 4803-2024 冰川厚度测量技术规范
- 护理专业新进展介绍
- 大疆无人机培训课件
- 中级消防员维保培训课件
- 小儿推拿进修总结汇报
- 2025公司应急预案演练计划(5篇)
- 医疗机构医院全员培训制度
- 2025仓库保管员试题及答案
- 生猪养殖场实施方案
- 矛盾纠纷化解培训课件
- 2025年成人高考语文试题及答案
评论
0/150
提交评论