海量数据库解决方案_第1页
海量数据库解决方案_第2页
海量数据库解决方案_第3页
海量数据库解决方案_第4页
海量数据库解决方案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 / 5 海量数据库解决方案 【范文:海量数据库解决方案】 1、数据和索引分别独立存储的数据存储结构具有非常重要的意义。 2、设置充足的空余空间是提高数据处理效率的重要技术手段之一。 3、如果表中行的存储顺序与我们经常读取较大范围行的顺序一致,则就能够在很大程度上提高读取效率。 4、写入数据时轻而易举的对其进行了存储,在查询数据时就会花费更多的时间和精力。反之亦然。 5、在利用索引读取堆表数据时,代价较大的地方并不在于对索引的扫描上,而是在利用索引 rowid对分散数据的随机读取。而索 引组织表也正式由于降低了这部分的代价,才是的它在处理大范围数据中能够获得卓越的效率。 6、在堆表中索引和表示分开存储的,所以即使索引块被2 / 5 分割, rowid 也不会发生变化。但在索引组织表中,犹豫索引和表是一个整体,所以当索引快被分割, rowid 会随着行的移动而变化。 7、在 B-tree中只允许每个块的 2/3空间用来存储键值,所以当块中数据超过这个限制时,键值就会被分割到两个块中,所以索引组织表的数据无法拥有永久的物理地址。 8、索引组织表的 rowid 是一个可能的物理地址,利用这个寻找到对应行的 可能行非常大,称之为 PhysicalGuess。如果使用逻辑 rowid 找到正确数据行的命中率非常低,则说明根本不应选择索引组织表。适用情况: 电子分类或关键字查询表 代码信息表 索引表 空间信息管理表 大部分使用主键查询的表 3 / 5 OLAP 维度表 记录的长度相对较短,切插入操作不频繁发生的表。 9、对海量数据处理而言最具有价值的就是聚簇。 10、聚簇表之所以能提高读取效率,是因为只要读取一个索引行就能够连续读取多个数据行。除此之外与一般索引相比没有其他差异。 11、复合表聚簇是在一个单位聚簇中存储两个或两个以上的表聚簇结构。提高表的连接效率。 12、哈希聚簇的特征: SIZE, HASHKEYS, HASHIS 等参数不允许修改。 只能通过 =比较运算符读取数据 创建聚簇的同时存储空间也分配。 4 / 5 当插入的行所需要的空间比其所属的单位聚簇空间大时,多出的行被存储在溢出区中。 如果列值没有被平均分布,则哈希键值容易发生冲突。 直接使用由哈希函数计算出来的值来读取数据的方法比使用索引的方法更加有效。 其他特征几乎和索引聚簇相 同。 哈希聚簇的适用范围: 尽量不要在数据以大量的形式连续不断增加的表中使用。 如果查询条件中只是用了 =运算,则有很好的效果。 在聚簇列值分布不均等的情况下,容易导致出现溢出或键值之间冲突的现象。 仅限于小型代码表,邮政编码表,系统用户信息表等。 把大量数据存储在一定量的哈希聚簇中的升级概念就是5 / 5 hash

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论