




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据复制中心数据复制中心DRC tb杰睿 阿里集团DBA数据方案 2013年8月8日 1 摘要 简介和应用场景 架构和性能 技术难点和挑战 总结 简介 tb杰睿 数据方案组 数据复制中心Data Replication Center 数据 OLTP数据源 例如MySQL OceanBase 复制 高性能 实时 事务一致 中心 服务 集群 平台 应用场景 多地域间数据库同步 数据库增量消息分发 什么样的数据 数据库的增量数据 数据变更 DML INSERT UPDATE DELETE DDL CREATE DROP ALERT DCL GRANT REVOKE 数据来源 MySQL Binlog OceanBase Oblog 为什么需要数据复制 分布式集群 MegaStore Galera 写入模型 异步写 多数写 同步写 在线存储要求 事务ACID 并发度高 响应时间低 测试结论 在使用多数写模型的情况下性 能将降低30 必须要 异步写 数据复制数据复制 为什么是中心 工具 函数库 规模大 成千的数据库实例 数百的下游应用 配置复杂 双向复制 过滤规则 系统容灾 集群容灾 主备切换 数据安全 权限控制 安全审计 OLTP DRC Middleware Application 业务场景 跨地域的实时在线数据库同步服务 南北机房 机房内主备延迟 数据库的增量数据一对多分发服务 商品 交易 评价 广告 结算 大数据计算 缓存 谁在用 搜索 广告 大数据计算 缓存失效 阿 里 集 团 数 据 库 技 术 团 队 DRC的定位 阿里数据库的非常重要的底层基础组件 DRC OLTP 服务 组件 关键词 提供在线的数据复制服务 数据库的底层基础组件 为什么是DRC 开源 or 其他产品 Tungsten GoldenGate MySQL5 6 Replicator Listener MySQL Applier for Hadoop 用或者不用开源产品 定制化的业务需求 都在那里 并没有本质的不同 DRC 长什么样 数据复制中心 在线存储增量数据同步平台同步平台 在线存储增量消息分分发中心 中心 database database database database database database DRC Client Client 分发中心 同步平台 DRC的架构 架构 Zookeeper Store Replicator ClusterMgr database Database Database ClusterMgr Client ZooKeeper Store database Database Store Store Replicator Replicator Client Get Store Pull Msg Pull Log Write Sql DRC的架构 概念 主题topic 数据流 集群管理模块clustermgr 资源定位 任务守护 队列和分发引擎模块store 日志解析 数据持久化 数据分发过滤 同步模块replicator 客户端client database Database Database ClusterMgr Client ZooKeeper Store database Database Store Store Replicator Replicator Client Get Store Pull Msg Pull Log Write Sql DRC的Performance 测试场景 性能指标 Kelude 压力平 台 tc 应 用 DRC store CM6机房 Congo CM4机房 源DB CM6机房 目标DB CM4机房 513 508 512 535 722 1030 1026 1108 1208 1506 0 500 1000 1500 2000 1000 2162 5442 8029 9000 延延 迟 毫 秒 毫 秒 数据数据库写入写入TPS 平均延迟ms 16线程 最 大延迟ms 16线程 平均延迟ms 32线程 最 大延迟ms 32线程 Binlog时间只能精确到秒 包含0 5秒固有统计误差 DRC的Performance TPS和延时的压测数据 TPS 同步停1小时后启动MySQL Async和Drc 观察TPS和追平时间 延时 主库保持5000TPS写入 观察平均延时和最大延时 MySQL 原始复制 原始复制 DRC 备注 注 TPS 1236 事务数 秒 6867 事务数 秒 a 平均单个事务1 33 个更新操作 b 延时趋势如下 追平时间 711秒 128秒 平均延时 100秒 0 56秒 最大延时 195秒 1 01秒 Binlog时间只能精确到秒 包含0 5秒固有统计误差 DRC的Performance 大事务 问题 延迟增大 解决 切割大事务 1 2 4 8 16 20 25 30 16线程 1140 1305 1626 1037 1534 1276 1648 2350 32线程 1968 2494 1519 2327 2219 2437 1208 6459 0 1000 2000 3000 4000 5000 6000 7000 延延 迟 毫 秒 毫 秒 切割粒度 切割粒度 大事大事务切割切割测试 DRC的Highlights 数据同步 并行写入 DDL支持 双向同步 解耦在线存储系统 对内支持不同数据源 对外访问接口一致 运维容灾 外部数据源容灾 内部系统容灾 安全控制 系统管理 DRC设计和实现 并发复制 并发策略 适用场景 每秒内更新同一个pk 的操作数次数分布 pk更新n次 总次 数 1 13256796 99 2 5 5590 0 5 10 662 0 10 20 211 0 20 30 33 0 30 40 4 0 50 100 17578 0 单个tx里更新操作次数 分布 更新次数 总次 数 1 9004792 87 2 5 1191460 11 6 10 96898 1 10 73536 1 单个更新操作中有效更 新字段占总字段的百分 比分布 有效字段更新百分比 总次数 1 10 7358632 55 10 20 3676699 28 20 30 73262 1 30 40 8092 1 40 50 1408991 10 50 100 794067 5 DRC设计和实现 Meta和DDL Meta的用途 问题 DDL后Meta和Binlog不对应 解决 Meta中心 Create table A1 Create table A2 Replication Checkpoint C1 Insert into A2 Drop table A2 Replication Crash Restart from Checkpoint C1 Binlog 从状态点C1恢复 Table A2的定义在哪里 字段 长度 主键信息 DRC设计和实现 双向同步 循环复制 serverid Txn flag DDL begin begin insert into insert into db tabledb table values values endend DRC设计和实现 统一的数据处理框架 兼容不同数据源 兼容不同的消费端 性能优化 多级流水 队列缓存 对象复用 parallelism 1024 pipeline reset read filterBeforeParse parse filter consume DRC设计和实现 消息订阅 REST API 权限管理 指定位点 指定过滤条件 结构化消息格式 DRC设计和实现 安全控制 用户权限 配置管理 主题管理 机器管理 关键词 高性能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人珠宝买卖合同(标准版)
- 烟草江苏公司招聘考试真题2025
- 2025年浏阳市市级机关公开遴选考试真题
- 重难点解析人教版八年级物理上册第5章透镜及其应用定向训练试题(解析卷)
- 难点详解人教版八年级物理上册第4章光现象难点解析练习题(详解)
- 2025年人教版高中英语从句单选题30题及答案
- 2025年勘察设计注册环保工程师考试(物理污染控制专业案例)全真冲刺试题及答案
- 综合解析人教版八年级上册物理物态变化《温度》专项训练试卷(解析版含答案)
- 2025年数控专业面试试题及答案
- 服务方案进度计划质量保障措施(4篇)
- 合伙开店合同终止协议书
- (正式版)DB15∕T 1987-2020 《蒙古族传统奶制品 阿尔沁浩乳德(酸酪蛋)生产工艺规范》
- 2025年中考数学真题完全解读(上海卷)
- 商户门牌设计方案(3篇)
- 学堂在线 大数据系统基础 章节测试答案
- 技术人员与客户沟通技巧
- 店面库房管理办法
- 人教七年级英语上册Reading Plus《Unit 3》课件
- 《生成式人工智能》 课件 第4章 Transformer模型
- 双镜联合治疗肾结石讲课件
- 肿瘤病人疼痛管理
评论
0/150
提交评论