《数据库新进展》PPT课件.ppt_第1页
《数据库新进展》PPT课件.ppt_第2页
《数据库新进展》PPT课件.ppt_第3页
《数据库新进展》PPT课件.ppt_第4页
《数据库新进展》PPT课件.ppt_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第十章 数据库新进展,2,10.1 并行数据库,并行数据库系统:对数据库的操作通过多个处理器和磁盘的并行处理实现。 并行数据库主要研究: 数据如何划分、如何分布 并行数据操作算法 并行数据库的查询优化,3,10.1.1 并行数据库系统的体系结构 共享主存储器、共享磁盘、无共享,共享主存储器,4,共享磁盘,5,无共享结构,6,10.1.2 加速比和扩展性,并行系统常用吞吐量、响应时间衡量系统性能,用加速比和扩展性衡量系统并行效果。 加速比 指数据库系统并行化后处理速度的提高程度。 加速比:TS / TL TS:较小规模并行系统中执行任务T所需要的时间; TL :在较大规模的并行系统中执行同一任务T所需要的时间; 如果二个并行系统的资源比是N,而获得的加速比也是N,则称并行系统实现了线性的加速比。,7,扩展性 指增加并行度后的处理能力的提高。 扩展性: TS/TL TS :任务T在较小规模系统上的执行时间; TL:在大N倍规模的系统中任务TQ的执行时间; 若TS /TL =1,称对任务T得到的扩展性是线性的。如果TS /TL ,8,影响加速比和扩展性的主要因素 启动代价:多进程多线程,启动进程的代价 干扰:共享资源竞争 偏斜(skew):子任务划分的偏斜,9,10.1.3 数据划分,并行系统中,一个关系分为多个分片存储在不同磁盘上,划分策略是均衡负载,主要方法有: Round-robin法 关系中元组随机、均匀分布在多个磁盘上. 要找出特定属性值需要并行扫描所有磁盘. Hash法 按照划分属性的散列值确定存储元组到不同磁盘上. 在划分属性上的查询可定位在一个磁盘上. range法 按划分属性值的范围分片后分布在不同磁盘上.,10,10.1.4 并行处理技术,系统的并行执行可在不同的粒度上进行,形成了不同的并行处理技术。 事务间的并行 不同查询或不同事务间的并行执行。 利用锁机制协调不同处理器读出的数据是一致的。 事务内操作间的并行 一个查询内不同操作间的并行。 流水线并行 r1 r2 r3 r4 独立并行 r1 r2 r3 r4,11,操作内的并行 并行排序 (例:对关系R排序) 多路归并排序 并行连接 (例:对关系S和SC连接,学号) 参加连接关系按照连接属性值划分或散列到相同磁盘上,然后并行执行连接。 并行选择 相等选择、范围选择 并行投影,12,10.1.5 并行数据库的查询优化,并行数据库的查询优化特点:可利用的资源多,可选择的执行方案多。 代价=CPU + I/O + 通信代价 查询优化目标 尽量能使操作并行,减少响应时间 优化策略 启发式优化方法,减少收索空间 连接执行方法的选择 资源合理分配,13,10.1.6 并行数据库与分布式数据库,应用目标不同 PDB 尽量并行执行数据库操作,提高系统整体性能 DDB 场地自制、数据操作的透明性,实现方式不同 PDB 充分利用结点处理能力,均衡负载 DDB 尽量减少结点间数据传输,减少通信代

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论