新浪微博redis技术架构优化_第1页
新浪微博redis技术架构优化_第2页
新浪微博redis技术架构优化_第3页
新浪微博redis技术架构优化_第4页
新浪微博redis技术架构优化_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新浪微博redis技术架构优化大纲业务场景Redis存储架构演进一些经验Q&A业务场景-业务Redis在新浪微博的应用计数 (counter)关系 (graph)通知提醒业务场景-数据一些数据6 IDC500+servers3700+ instances千亿条记录24T+内存7千亿cmds/day1.2万亿read/day2千亿write/dayRedis存储前时代Redis前时代热数据mc全量落地mysql数据量不大:Graph mc 10G,计数器 mc 2G开发速度问题出现2010年,Graph mc 30G+,峰值 10wTPSMysql成为瓶颈线程阻塞,访问卡顿List类型业务不适合

2、mysql新的关系计算需求实现困难大量关系计算:从MC取全量+本地计算-超时解决方案初期方案增大mc容量到40G,Graph db 增至一主六从监控并及时清理僵死线程关系计算性能问题暂时无解最终方案引入Redis做storage (graph/counter)关系计算 在redis实现 O(1)促进更多复杂需求Graph db恢复一主三从小结项目初期30G- 日PV5kw-技术选型 熟悉度拼的是开发速度产品需求与新技术相 互促进Redis存储初期Redis初期Redis 2.0Graph存hash,40G 10w TPS,4 ServerCounter:20G 2w TPS,2 Server问

3、题出现2011年,初期使用经验不足数据分片过少,扩容困难部分数据类型使用不当,内存超预期多业务混放,拆分不便可用性不够小业务初期没有slave,server故障服务异常大业务挂载3-4个slave,高峰期write超时,请求失败重启耗时,10-20分钟服务异常解决方案容量规划提前预估容量,上线前预拆足够的数据分片选择合适的数据类型,慎用zset业务独立存储,拒绝混放解决方案提高可用性所有Redis全部增加SlaveMaster挂载slave不超过2个,采用M-S-S方式挂 载多IDC 单Master,复制同步凌晨低峰升级,访问 IP域名不完美,但基本可work问题升级2011年底,Graph

4、100G+ 灵异事件凌晨3点低峰期,redis无征兆崩溃批量升级、扩容拆分,引发其他业务异常报警多个slave严重负载不均,请求数最大差1-2个数量级,峰值 响应从 不足1ms-3ms在线版本增多最多6个版本BUG重复修复,运维困难问题分析崩溃:读写会用pageCache,导致redis进swap而崩溃其他服务报警:复制 全量推送导致网络阻 塞负载不均:client通过域名访问,域名解析 返回随机ip,结果连接不均衡,最终导致负 载不均衡问题解决紧急方案超过物理内存3/5迁移端口错峰升级/扩容 对网络仍然有一定冲击开发ClientBalancer组件,保持域名下IP连接均衡,负载均衡进一步优化

5、方案:及时清理pagecache,减少对正常业务影响Aof去掉rewrite,改用rotate类似mysql,独立IO线程对rdb、aof转发复制(社区版psync, repl-backlog-size, repl-backlog-ttl)支持热升级,避免重启,提高可运维性Others小结小规模 50G 1-2个集群人肉运维中规模 100G+,3+集群可运维性-重要开源组件-熟悉架构实现Redis存储爆发期Redis存储爆发期完全增量复制在线热升级SLAVE均衡访问大量子业务切入单业务数百G稳定问题出现2013年,Graph海量规模数据T级,MS 十T级数百台server,而且还在快速增加Gr

6、aph用Hash结构,存储效率不高问题出现Counter 业务增加,增长迅猛日增:计数亿条 内存5G+总数据百G级, MS T级Feed请求 计数近百倍读放大,高峰超时报 警存储效率低 质变,极端业务定制大规模集群 T级 3+idc 成本单个请求成本总拥有成本Redis存储高速稳定期Redis存储高速稳定期Graph 定位cache 定制longset内存降为 1/10性能接近Counter 定制cdb内存降为 1/5 -性能增3-5倍Redis存储高速稳定期继续定制Counter 落地SSD,容量提升20倍,8个月10年VectorOthers问题出现2014,SLA 目标6个9数千关联Se

7、rver 6+IDC 跨地域分布海量数据 24T+峰值 5000w+ TPS,响应毫秒级硬件/网络故障时有发生,如何实现?问题解决资源服务化 Configserver用于服务的发布与订阅CacheService 用于集群管理数据路由负载均衡数据在线迁移服务治理(生命周期 故障转移etc.)运维标准化、自动化 (扩/缩容etc.)服务化服务化服务化 业务服务化 motan 资源服务化 c a c h e Se rvic em cssd c a c h edbdbmysqldbdbhbasedbhdbbasein vo ke rm ce d ise d isc o n fig se rve rm cm ce d ise d ism crrre d ism crrre d isc o n fig se rve rssd c a c h essd c a c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论