版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、系统高可用技术架构设计技术创新,变革未来16/11/2提纲1云平台的高可用需求基础组件的高可用实践2平台监控系统升级系统未来工作展望5云平台的高可用需求1如何保证基础平台的稳定性如何监控业务和快速恢复在升级过程中如何保证业务的连续性云平台的高可用需求116/11/2云计算可用性的新需求2基础组件的高可用设计整体架构2基础组件的高可用设计控制服务层之集群高可用 去中心化设计 集群基础配置使用集群文件系 统存放; 使用corosync维护成员关系; 集群leader故障,自动推选; 配置集群IP,跟随leader;2基础组件的高可用设计Failover(故障切换): 业务恢复时间(RTO):系统+
2、 APP + 探测时间(可配置); 需要共享存储(外置存储或者分布式存储); 网络可达,网络的配置和防火墙策略跟随;虚拟机高可用(1)2基础组件的高可用设计虚拟机高可用(2)FT(Fault Tolerance)技术: 基于coarse-grained lock-steping 需要万兆网络进行状态同步 需禁用虚拟化高级特性(如热迁移)基础组件的高可用设计2应用层协议栈/转发面 网络故障不会导致主 机宕机 利用DPDK实现高性 能报文处理 应用层支持主备切换 确保业务连续性虚拟网络高可用(1)2基础组件的高可用设计边界集中路由(南北向) 虚拟路由器之间使用keeplive的方式 虚拟路由器SE
3、SSION同步 备选节点重选择虚拟网络高可用(2)2基础组件的高可用设计分布式路由(东西向) 避免网络节点宕机导致网络中断 节省网络流量,避免网络节点成为瓶颈虚拟网络高可用(3)2基础组件的高可用设计支持数据的多副本防止物理故障导致数据丢失支持快速修复只修复副本间差异数据磁盘检测SSD寿命预测坏道告警无元数据中心避免存在单点故障虚拟存储高可用(1)2基础组件的高可用设计防止脑裂:仲裁机制 增加元数据副本,作为仲裁者 只有在超过1/2副本数在线,才允许 读写端到端数据校验 解决静默错误的数据损坏 解决软件异常导致的数据损坏数据自愈 第一时间修复可能的数据异常虚拟存储高可用(2)2基础组件的高可用
4、设计2基础组件的高可用设计承载业务的高可用基于负载均衡的双活技术 技术成熟度高 4-7层的负载均衡 可以支持两中心双活虚拟机备份(1)基于虚拟机的备份 每次备份仅仅只是增量数据; 支持缓存文件过滤; 支持定时备份;2基础组件的高可用设计虚拟机备份的两种方式 通过快照方式,记录两次快照的差异,实现文件增量备份 通过位图方式,记录数据变化,实现增量备份 快照方式会造成性能的持续降低;位图方式只在备份过程中短暂性能损失虚拟机备份(2)2基础组件的高可用设计16/11/23 监控系统16/11/2监控系统3物理主机监控虚拟机监控虚拟网络监控虚拟存储监控主机级别的监控 主机的keepalive,保证主机
5、宕机及时发现; 对主机的CPU,内存,网络,磁盘监控; 对外置存储和分布式存储状态监控。node nameCPUmemorymanager networksotrage networkbusiness networkFC stoargeserver sannode198%13%node280%84%node350%64%物理主机监控监控系统3虚拟机监控虚拟机级别的监控 虚拟机内部CPU,内存和磁盘占用; 实时IO,网络流量; hypervisor层异常。监控系统3虚拟网络监控(1)网络监控的问题: 虚拟网络拓扑和物理拓扑相差大; 网络流量在虚拟平台内部流转,流量不可见; 网络排障无法使用传统手
6、段;监控系统3网络监控功能: 可以在任意网络节点或者虚拟机发送数据包模拟业务; 数据包经过的所有网络设备和物理设备都返回显示; 数据包由于ACL或者路由不可达等错误而丢弃,明确上报; 可以在任意网络节点上进行抓取分析; 数据包途径路径展现; 异常点精确定位; 配置错误反馈;虚拟网络监控(2)监控系统3虚拟存储监控 存储吞吐能力,展现集群整体的吞吐; 磁盘健康状态,检测是否磁盘离线; SSD寿命预测,计划替换SSD; 缓存命中率,方便排查性能问题; 存储网络的链路检测与切换; 慢盘检测,及时发现加入硬件性能问题;监控系统316/11/24 升级系统的改进升级系统的设计模块化设计,使得每个模块可以独立升级升级过程允许新旧两个模块同时工作、平滑替换 虚拟机可以在不同版本的hypervisor之间热升级4升级系统的改进当前热升级最常用的方式为跨主机的热迁移;优点:业务基本无感知;缺点:跟虚拟机更新内存速度有关,可能会导 致迁移时间过长,甚至迁移失败;迁移过程依赖网络的稳定性和性能,如 果网络不稳定可能会导致迁移失败;升级改进 - 热升级4升级系统的改进升级改进 - 热升级热升级改进:本地迁移,内存共享无需拷贝;迁移时间短,跟虚拟机业务没有关系;提高并发迁移速度,缩减升级时间;4升级系统的改进16/11/2云计算可用性的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026年初三化学(溶液)上学期试题及答案
- 2025年大学工商管理(创业管理基础)试题及答案
- 高中二年级化学(化学反应原理)2026年上学期期末测评卷
- 2025年中职汽车美容(汽车清洁养护)试题及答案
- 2023年中考数学复习微专题靶向提升练习+二次函数+选择题、填空题专练+
- 2025年it部个人年终总结报告
- 2025个人质量总结报告检验员个人年终总结
- 深度解析(2026)《GBT 18132-2016丝绸服装》
- 深度解析(2026)《GBT 17980.121-2004农药 田间药效试验准则(二) 第121部分杀菌剂防治葡萄白腐病》
- 深度解析(2026)《GBT 17980.5-2000农药 田间药效试验准则(一) 杀虫剂防治棉铃虫》
- 2025内蒙古鄂尔多斯东胜区消防救援大队招聘乡镇(街道)消防安全服务中心专职工作人员招聘3人考试笔试模拟试题及答案解析
- 2025年安全总监年终总结报告
- 安顺市人民医院招聘聘用专业技术人员笔试真题2024
- 2025年10月自考00688设计概论试题及答案
- 六西格玛设计实例
- 工业交换机产品培训
- 2025浙江温州市龙港市国有企业招聘产业基金人员3人笔试历年备考题库附带答案详解试卷3套
- 《十五五规划》客观测试题及答案解析(二十届四中全会)
- 代码开发安全培训课件
- 学堂在线 积极心理学(上)厚德载物篇 章节测试答案
- 高中物理 人教版 必修二 圆周运动-1圆周运动教学
评论
0/150
提交评论