已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 姜国强 腾讯 - 云架构平台部 腾讯万亿级Elasticsearch 技术解密 2 议程 ES在腾讯的应用场景1 ES优化实践3 未来规划及开源贡献4 遇到的挑战2 2 3 4 3 ES在腾讯的应用场景 4 典型场景 业务日志:用户行为 运营日志:慢查询、异常日志 审计日志 主要特点 完整的解决方案,易运维 实时性:从日志产生到可访问,十秒级 全文搜索:基于倒排索引,搜索分析灵活 交互式分析:千亿级日志,搜索秒级响应 日志实时分析 5 典型场景 商品搜索 APP搜索 站内搜索 主要特点 高性能:高并发、低延迟 强相关:搜索结果高度匹配用户意图 高可用:可用性达9999,跨机房容灾 搜索服务 6 典型场景 Metrics APM 物联网数据 主要特点 高并发写入:千万级写入 多维分析:多维度统计分析 高性能:十毫秒级 时序数据分析 传统监控 应用监控 智能硬件 工业传感器 7 丰富的业务需求 丰富的场景 大量中小客户 不同的应用场景 不同的熟悉程度 超大规模 600节点 千万级写入 十万级查询 标准化/自动化 完全隔离的环境 标准化交付 自动化运维 公有云内部云私有云 丰富的业务需求 8 遇到的挑战 9 代表场景 电商、站内搜索等在线服务 用户需求 性能更好 可用性更高 挑战 高性能 高可用 搜索类业务 QPS 20w+ 性能 P95延时 100ms 平响延时 20ms SLA 4个9 可用性 容忍 单机故障 容忍 网络故障 10 代表场景 日志、Metric、APM等时序数据 用户需求 支持超高写入吞吐 存储海量数据 挑战 计算成本 存储成本 时序类业务 需要现实 成本高 收益低 存储数据量 写入吞吐 11 ES优化实践 12 高可用优化 健壮性 不足 容灾方案 欠缺 系统缺陷 集群崩溃:异常查询、过载 扩展瓶颈:节点、元数据 集群不均:节点、硬盘 集群不可用:网络故障 数据丢失:自然灾害 误操作 滚动升级缓慢 Master堵塞 分布式死锁 13 系统健壮性:分布式系统共性问题 服务限流:容忍常见异常,保障服务质量 可扩展性:支持千级集群、50w分片 集群均衡:节点、多盘间分片均衡 容灾方案 备份回档:保障数据可恢复 跨可用区容灾:容忍单机房故障 垃圾桶机制:实例销毁保护 缺陷修复 高可用优化 解决方案 容灾方案 系统健壮性 缺陷修复 服务限流可扩展性集群均衡 备份回档 跨可用区 容灾 垃圾桶机制 滚动重启 优化 Master 堵塞 分布式 死锁 14 方案 权限:防止攻击、误操作 队列:优先级、拥塞优化 内存:全链路 + 多级内存限制 + 精准评估 多租户:CVM / Cgroups 优势 限流准确、适应性强 大查询、异常查询、压力过载等 单点故障、网络分区等 混沌测试 高可用优化 服务限流 依赖 包 错误、损坏 应用层 进程 Kill、OOM、Full GC 线程 并发、优先级 系统层 系统 Hang 硬件层 硬盘 满、慢、坏、不可读写 网络 丢包、超时、断网 CPU 抢占 内存 脏、Swap 配置 错误、误删 环境变量 未修改、配置 15 硬盘 : 8 内存 : 4 计算 : 1 0 2 4 6 8 10 0 20 40 60 80 100 1h4h1d7d15d31d93d 成本优化 成本分析 代表场景:日志等时序数据 成本比例关系 主要瓶颈 硬盘 内存 特性分析 冷热特性明显:访问近多远少 历史数据查询聚合结果 长时间范围查询性能差 内存优化 存储优化 冷热分离Rollup备份归档 存储裁剪 LRU Cache Off Heap内存池化 生命周期 管理 硬盘成本 冷热分离:使用混合存储平衡成本、性能 Rollup:预计算 换取 存储、性能 备份归档:更廉价的存储系统 更多优化方式:存储裁剪、生命周期管理等 内存成本 LRU Cache:提升内存利用效率 Off Heap:降低堆内存,提高节点规格 成本优化 解决方案 方案 类似 Cube / 物化视图 预计算:换取 成本和性能(数量级) 数据分析系统 数据无要求 周期性外部计算:读取全量数据 计算开销、维护成本高 Google Mesa 统计数据模型,数据排序 底层Compact:多路归并 多路写入后归并,计算开销高 最终方案 数据排序 流式查询,多路归并 计算开销 10%写入,内存可控 成本优化 Rollup HBase 2.0+ 重点推介Off Heap 堆外内存性能接近堆内 Tencent ES 内存利用效率提升80%,充分利用硬盘 查询性能损耗不超过2% 降低GC开销30% 方案 LFU Cache提升内存利用效率,大小动态可调 Off Heap降低堆内存使用 堆外访问链路优化,降低损耗 成本优化 内存优化 Memory ES社区 按需加载,依赖系统缓存 查询性能倍数级衰退 写入 代表场景:日志、监控等时序数据 高并发写入:1000w/s级 自带主键写入性能衰减1+倍 CPU无法充分利用 查询 代表场景:搜索服务 高并发、低延时查询:20ms,10w QPS 平响需要深度调优,并发不高 容易产生毛刺:GC、执行计划不优等 日志等时序数据 搜索服务 写入 查询 性能优化 写入:时序场景1000w+ 优化主键去重,性能提升45% 优化Translog Sync机制,性能提升20% 向量化执行,减少分支跳转、指令Miss 查询:搜索服务平稳低延迟 优化Merge策略、冷数据自动Merge 基于索引范围的查询剪枝 基于CBO模型的执行计划优化 新硬件 性能优化方案 查询优化 写入优化 主键去重资源竞争向量化 Merge策略查询剪枝执行计划 新硬件 AEPOptaneQAT 方案 原生策略:大小相似性 + 最大上限 时间序Merge:增加时间邻近特性,方便查询裁剪 冷数据Merge:提高查询性能,降低资源开销 效果:搜索场景性能提升1倍 性能优化 Merge策略 1月整月 + 3月1号 未来规划及开源贡献 产 品 场 景 生 态 融 合 内 核 管 控 平 台 Elasticsearch 日志实时分析 时序数据处理 搜索服务 ELK生态 Hadoop生态 可用性 服务限流 均衡策略 多租户隔离 性能 查询优化 写入优化 Merge策略 成本 冷热分离 Rollup 内存优化 功能特性 权限系统 时序接口 中文分词 管控操作 资源管理 实例管理 作业管理 运维支撑 监控告警 审计日志 健康巡检 任务执行引擎 备份回档 数据导出 生命周期管理 运维工具 数据迁移 压测工具 ES 产品持续建设 Data Engineering Data Discovery Data Apps Batch Stream Analytic Search Online 大数据图谱 长期探索 目标数据量递减,响应延时递减 2525 We have recently made a major and ingenious improvement to Elasticsearch, which was proposed by a developer of Tencent. This improvement makes Elasticsearch Some types of write speeds have increased by about 20%, and we are very much looking forward to continuing this good relationship with Tencent Cloud. 开源社区 近期提交了 10+ PR 至开源社区,其中 7 个已合并 被合并的 PR 涉及写入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全生产课件公司名称
- 安全员技能培训课件模板
- 火车安全教育课件下载
- 家具安全课件
- 2025年系统架构设计师 真题
- 北海市银海区直属国有企业招聘考试真题及答案2022
- 安全生产风险分级管控清单编制安全技能提升试卷
- 2月份大药房店员网上试卷(3)试题及答案
- 市场营销策略与市场风险控制专项训练试卷
- 《计算机应用基础》第六章在线测试试题及答案
- 第4章 学前儿童膳食卫生与保健【教学课件】
- (高清版)DZT 0399-2022 矿山资源储量管理规范
- 智慧售电方案
- 数字化人力资源管理系统建设
- 国有企业投资公司绩效考核管理办法
- GB/T 43564-2023中小学合成材料面层田径场地
- 模板支撑系统大样图
- T-CAPDA 006-2020 丙酰芸苔素内酯原药
- 家族财富传承法商
- 激素类药物与血液制剂使用规范
- 2023年《铁道概论》知识考试题库与答案
评论
0/150
提交评论