淘宝海量数据处理产品技术架构(精品).ppt_第1页
淘宝海量数据处理产品技术架构(精品).ppt_第2页
淘宝海量数据处理产品技术架构(精品).ppt_第3页
淘宝海量数据处理产品技术架构(精品).ppt_第4页
淘宝海量数据处理产品技术架构(精品).ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

淘宝大数据量产品技术架构,张轩丞(朋春)淘宝网-数据平台与产品部,关于,张轩丞(朋春)淘宝数据平台与产品部(杭州)vi党,脚本语言爱好者关注NodeJS,cnode社区组织者之一pengchun:我是aleafs,数据平台与产品,淘宝网淘宝卖家供应商消费者,搜索、浏览、收藏、交易、评价.,一些数字,淘宝主站:30亿店铺、宝贝浏览10亿计的在线宝贝数千万量级交易笔数,数据产品:50G统计汇总结果千万量级数据查询请求平均20.8ms的响应时间(6月1日),海量数据带来的挑战,计算计算的速度处理吞吐量存储存储是为了更方便地查询硬盘、内存的成本查询“大海捞针”全“表”扫描,架构总览,今天的话题,关系型数据库仍然是王道NoSQL是SQL的有益补充用中间层隔离前后端缓存是系统化的工程,关系型数据库仍然是王道,关系型数据库,有成熟稳定的开源产品SQL有较强的表达能力只存储中间状态的数据查询时过滤、计算、排序数据产品的本质拉关系做计算,SELECTIF(INSTR(f.keyword,)0,UPPER(TRIM(f.keyword),CONCAT(b.brand_name,UPPER(TRIM(f.keyword)ASf0,SUM(f.search_num)ASf1,ROUND(SUM(f.search_num)/SUM(f.uv),2)ASf3,ROUND(AVG(f.uv),2)ASf4FROMdm_fact_keyword_brand_dfINNERJOINdim_brandbONf.keyword_brand_id=b.brand_idWHEREf.keyword_type_id=1ANDf.keyword!=ANDkeyword_cat_idIN(50002535)ANDthedate=2011-07-07GROUPBYf0ORDERBYSUM(f.search_num)DESCLIMIT0,100,存储在DB中的数据,分布式MySQL集群,字段+条目数分片MyISAM引擎离线批量装载跨机房互备,MyFOX,透明的集群中间层MyFOX,透明查询基于NodeJS,1200QPS数据装载路由计算数据装入一致性校验集群管理配置信息维护监控报警,MyFOX-数据查询,缓存,MyFOX-节点结构,MyFOX,热节点(MySQL),15kSAS盘,300G*12,raid10内存:24G成本:4.5W/T,新增热数据,小结,根据业务特点分库分表冷热数据分离降低成本,好钢用在刀刃上更有效地使用内存,SQL虽牛,但是,NoSQL是SQL的有益补充,全属性交叉运算,不同类目的商品有不同的属性同一商品的属性对有很多用户查询所选择的属性对不确定,Prometheus定制化的存储实时计算,Prom数据装载,Prom,Prom数据查询,Prom数据冗余,明细数据大量冗余牺牲磁盘容量,以得到:避免明细数据网络传输变大量随机读为顺序读,小结,NoSQL是SQL的有益补充“预算”与“现算”的权衡“本地”与“集中”的协同,其他的数据来源,Prom的其他应用(淘词、指数等)从isearch获取实时的店铺、商品描述从主站搜索获取实时的商品数,异构数据源如何整合统一?,用中间层隔离前后端,pengchun$tail/logs/glider-rt2.log14/Jun/2011:14:54:29+0800GET/glider/db/brand/brandinfo_d/get_hot_brand_top/whereHTTP/1.1200170.065,数据中间层Glider,多数据源整合UNIONJOIN输出格式化PERCENT/RANKOVERJSON输出,Glider架构,Dispatcher,Controller,配置解析,请求解析,一级缓存action,缓存是系统化的工程,缓存系统,前端产品,一级缓存,小结,用中间层隔离前后端底层架构对前端透明水平可扩展性缓存是把双刃剑降低后端存储压力数据一致性问题缓存穿透与失效,回顾,关系型数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论