通用广告引擎的索引设计和性能优化ppt课件_第1页
通用广告引擎的索引设计和性能优化ppt课件_第2页
通用广告引擎的索引设计和性能优化ppt课件_第3页
通用广告引擎的索引设计和性能优化ppt课件_第4页
通用广告引擎的索引设计和性能优化ppt课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通用广告引擎的索引设计和性能优化 阿里妈妈事业部师陀 Agenda 背景索引设计和实现遇到的问题下一步工作性能优化过程性能优化小结Q A 背景 广告引擎的基本状况层级结构 广告主 广告计划 广告商品 竞价词 背景 广告引擎的基本状况层级结构 广告主 广告计划 广告商品 竞价词广告查询流程Query解析 倒排查询 过滤 算分 排序 拼装结果返回 背景 广告引擎的基本状况层级结构 广告主 广告计划 广告商品 竞价词在线查询流程Query解析 倒排查询 过滤 算分 排序 拼装结果返回索引数据 每天重建全量 实时更新增量 背景 一年前 使用搜索引擎isearch的索引内核 自己开发的辅表结构相对实现复杂 正排读接口不清晰性能问题重构 新的通用广告引擎 一期 索引支持主辅表结构只做广告引擎需要的功能目标 性能和可维护性 索引设计 倒排 全量 增量Payload字段可配置增量的多级可回收内存池 索引设计 正排 主 辅表结构多种值类型 bit int8 int16 float string多种字段类型 单值 固定多值 变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺 索引设计 正排 主 辅表结构多种值类型 bit int8 int16 float string多种字段类型 单值 固定多值 变长多值Package表的关联字段平铺 索引设计 正排多种值类型 bit int8 int16 float string多种字段类型 单值 固定多值 变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺主 辅表 keyId docId的hash表 DeleteMap 索引实现 索引实现 索引实现 索引实现 索引实现 其他TableWriter的其他成员DeleteMapKeyIdHashTable相关小工具 indexLibPrinter 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案 2 6 18内核 flush mmap pages 0 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案 2 6 18内核 flush mmap pages 0Pagecache换入换出不可控 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案 2 6 18内核 flush mmap pages 0Pagecache换入换出不可控mlock 不符合极端情况的异常处理需求 遇到的问题 1 Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案 2 6 18内核 flush mmap pages 0Pagecache换入换出不可控mlock 不符合极端情况的异常处理需求另外的解决方案 使用shm替换mmap 主动控制持久化和故障恢复 遇到的问题 2 稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案 索引重整 索引压缩 遇到的问题 2 稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案 索引重整能力 索引压缩数据灵活性跟分布式build的结合批量更新能力 下一步工作 广告引擎设计时的各项指标优先级稳定性正确性灵活性问题定位能力性能 下一步工作 一期的新引擎还是很像搜索引擎 dispatcher searchNode searchNode searchNode merger 下一步工作 dispatcher searchNode searchNode searchNode merger 分布式引擎索引数据中心 服务化的searchNode集群 期望的广告引擎 性能优化 目标 searchNode的单机qps优化 主要是cpu优化方法 Perf热点分析代码优化业务层优化索引数据层优化Cpu资源利用最大化 性能优化过程 性能优化小结 工具帮助理解分析性能瓶颈 但不要仅对热点进行代码优化推荐Intelvtune的top down视图 性能优化小结 工具帮助理解分析性能瓶颈 但不要仅对热点进行优化推荐Intelvtune的top down视图针对内核 硬件特性的优化需谨慎 性能优化小结 工具帮助理解分析性能瓶颈 但不要仅对热点进行优化推荐Intelvtune的top down视图针对内核 硬件特性的优化需谨慎关注数据局部性和整体代码质量 CPI 性能优化小结 工具帮助理解分析性能瓶颈 但不要仅对热点进行优化推荐Intelvtune的top down视图针对内核 硬件特性的优化需谨慎关注数据局部性和整体代码质量 CPI Cpu压不上去的几种原因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论