




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
移动应用分析平台大数据系统实践 以友盟移动应用分析平台为例 吴磊 友盟数据平台架构师 2015.04.18 数据是移动互联网的主旋律 关于友盟移动分析平台 成立于2010年4月 目前涵盖52万app 目前处理的数据接近2pb 每天处理: 6.7 billion sessions 实时处理:100k qps 离线处理:800+常规任务 基本架构思路 平台基本架构 phone pad box nginx nginx nginx finagle server finagle server kaaa storm mongodb kaaa hdfs mapreduce hbase kv proxy zookeeper hive pig spark 数据处理流程 采集 传输 处理 存储 分析 展示 数据采集 nginx nginx nginx ruby server ruby server resque to . phone pad box nginx nginx nginx fi nagle server fi nagle server kaaa phone pad box 之前 现在 数据总线(kaaa) 分布式 吞吐量 持久化 mirror storm mapreduce 数据传输 实时 storm 离线 map-reduce 计算模型 二进制数据格式 elepantbrid protobuf compress 数据处理 在线数据存储 mongodb 数据规模(tb) 数据特性 离线数据存储 hdfs 存储 数据规模(pb) 二进制数据模型 (elephantbird) 数据压缩 (lzo, lzma) hbase 存储 数据规模(10tb) 数据skew的影响 数据聚合 随机读的需求 数据缓存 redis 数据存储 hbase使用的经验 data skew 随机读的优化 变随机读为顺序读 异步访问 数据聚合 rowkey设计 参数调优 表预先切分 客户端使用参数调优 大批写使用bulk load 中间数据和小表使用文件更优 hbase使用的教训 重视运维 关注官方动态 谨慎使用新特性 数据存储 数据统计分析 storm实时计算 + mr离线计算 深度挖掘 pig + hive 分类聚类 mr + spark 预测建模 mr + spark 数据分析 hadoop 使用经验 map reduce 槽位混用 磁盘空间优先的调度策略 任务运行内存限制及调整,内存动态计算 高比例的压缩算法 hadoop 使用的教训 对于迭代式计算的支持 mr算法的僵化(二次排序,各种join) 数据分析 pig 篇 pig 应用场景 qa 测试 数据深度挖掘 聚类分类 pig 优势 pig 局限 数据分析 hive 篇 hive 应用场景 报表生产 hive 优势 sql hive 局限 udf 数据分析 spark篇 spark 应用场景 深度学习 spark 优势 更多的抽象模型 mllib库 spark sql 强大的语言支持 spark 局限 吞吐量 数据分析 任务调度 开源任务调度器 azkaban oozie 友盟任务调度器 数据分析 友盟任务调度器 数据分析 数据服务 rest api protobuf 异步请求 缓存 redis 预先聚合计算 数据展示 zabbix ganglia bacontower 报警内容 任务失败 任务延迟 jt, nn, dn下线 hm, rs 下线 监控报警 realtime + batch kaaa mongodb + hbase storm, mr,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 17730:2025 EN Dentistry - Fluoride varnishes
- 部编八年级语文校本课程开发教学计划
- 在公共场所销售渔产品零食创新创业项目商业计划书
- 智能家居控制软件定制创新创业项目商业计划书
- 智能车辆远程升级服务创新创业项目商业计划书
- 云端茶艺体验馆创新创业项目商业计划书
- 小学四年级下册班主任班级管理计划
- 2025春疫情期间班主任考勤及评估工作计划
- 合租房合同范文
- 六年级语文部编版上册专项训练计划
- 《机械制图(多学时)》中职全套教学课件
- 新教科版小学1-6年级科学需做实验目录
- 辽2014G403 预应力混凝土双T扳
- 砂石系统设计
- 高中数学 人教A版 必修一 《集合与常用逻辑用语》 1.2 集合间的基本关系
- 安阳简介课件
- 部编版三年级语文上册第2课《花的学校》精美课件
- (精选word)洪恩识字-生字卡片1-200
- 斜拉桥主桥索塔施工监理实施细则
- 部编教材九年级历史(上)全册教案
- 劳动关系理论PPT课件.ppt
评论
0/150
提交评论