淘宝大数据量产品技术架构33.ppt_第1页
淘宝大数据量产品技术架构33.ppt_第2页
淘宝大数据量产品技术架构33.ppt_第3页
淘宝大数据量产品技术架构33.ppt_第4页
淘宝大数据量产品技术架构33.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

淘宝大数据量产品技术架构 张轩丞 朋春 淘宝网 数据平台与产品部 关于 张轩丞 朋春 淘宝数据平台与产品部 杭州 vi党 脚本语言爱好者关注NodeJS cnode社区组织者之一pengchun 我是aleafs 数据平台与产品 淘宝网淘宝卖家供应商消费者 搜索 浏览 收藏 交易 评价 一些数字 淘宝主站 30亿店铺 宝贝浏览10亿计的在线宝贝数千万量级交易笔数 数据产品 50G统计汇总结果千万量级数据查询请求平均20 8ms的响应时间 6月1日 海量数据带来的挑战 计算计算的速度处理吞吐量存储存储是为了更方便地查询硬盘 内存的成本查询 大海捞针 全 表 扫描 架构总览 今天的话题 关系型数据库仍然是王道NoSQL是SQL的有益补充用中间层隔离前后端缓存是系统化的工程 关系型数据库仍然是王道 关系型数据库 有成熟稳定的开源产品SQL有较强的表达能力只存储中间状态的数据查询时过滤 计算 排序数据产品的本质拉关系做计算 SELECTIF INSTR f keyword 0 UPPER TRIM f keyword CONCAT b brand name UPPER TRIM f keyword ASf0 SUM f search num ASf1 ROUND SUM f search num SUM f uv 2 ASf3 ROUND AVG f uv 2 ASf4FROMdm fact keyword brand dfINNERJOINdim brandbONf keyword brand id b brand idWHEREf keyword type id 1ANDf keyword ANDkeyword cat idIN 50002535 ANDthedate 2011 07 07 GROUPBYf0ORDERBYSUM f search num DESCLIMIT0 100 存储在DB中的数据 分布式MySQL集群 字段 条目数分片MyISAM引擎离线批量装载跨机房互备 MyFOX 透明的集群中间层 MyFOX 透明查询基于NodeJS 1200QPS数据装载路由计算数据装入一致性校验集群管理配置信息维护监控报警 MyFOX 数据查询 缓存 MyFOX 节点结构 MyFOX 热节点 MySQL 15kSAS盘 300G 12 raid10内存 24G成本 4 5W T 新增热数据 小结 根据业务特点分库分表冷热数据分离降低成本 好钢用在刀刃上更有效地使用内存 SQL虽牛 但是 NoSQL是SQL的有益补充 全属性交叉运算 不同类目的商品有不同的属性同一商品的属性对有很多用户查询所选择的属性对不确定 Prometheus定制化的存储实时计算 Prom 数据装载 Prom Prom 数据查询 Prom 数据冗余 明细数据大量冗余牺牲磁盘容量 以得到 避免明细数据网络传输变大量随机读为顺序读 小结 NoSQL是SQL的有益补充 预算 与 现算 的权衡 本地 与 集中 的协同 其他的数据来源 Prom的其他应用 淘词 指数等 从isearch获取实时的店铺 商品描述从主站搜索获取实时的商品数 异构数据源如何整合统一 用中间层隔离前后端 pengchun tail logs glider rt2 log127 0 0 1 14 Jun 2011 14 54 29 0800 GET glider db brand brandinfo d get hot brand top where HTTP 1 1 200170 065 数据中间层 Glider 多数据源整合UNIONJOIN输出格式化PERCENT RANKOVER JSON输出 Glider架构 Dispatcher Controller 配置解析 请求解析 一级缓存action 缓存是系统化的工程 缓存系统 前端产品 一级缓存 小结 用中间层隔离前后端底层架构对前端透明水平可扩展性缓存是把双刃剑降低后端存储压力数据一致性问题缓存穿透与失效 回顾 关系型数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论