




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
移动应用分析平台大数据系统实践 以友盟移动应用分析平台为例 吴磊 友盟数据平台架构师 2015.04.18 数据是移动互联网的主旋律 关于友盟移动分析平台 成立于2010年4月 目前涵盖52万app 目前处理的数据接近2pb 每天处理: 6.7 billion sessions 实时处理:100k qps 离线处理:800+常规任务 基本架构思路 平台基本架构 phone pad box nginx nginx nginx finagle server finagle server kaaa storm mongodb kaaa hdfs mapreduce hbase kv proxy zookeeper hive pig spark 数据处理流程 采集 传输 处理 存储 分析 展示 数据采集 nginx nginx nginx ruby server ruby server resque to . phone pad box nginx nginx nginx fi nagle server fi nagle server kaaa phone pad box 之前 现在 数据总线(kaaa) 分布式 吞吐量 持久化 mirror storm mapreduce 数据传输 实时 storm 离线 map-reduce 计算模型 二进制数据格式 elepantbrid protobuf compress 数据处理 在线数据存储 mongodb 数据规模(tb) 数据特性 离线数据存储 hdfs 存储 数据规模(pb) 二进制数据模型 (elephantbird) 数据压缩 (lzo, lzma) hbase 存储 数据规模(10tb) 数据skew的影响 数据聚合 随机读的需求 数据缓存 redis 数据存储 hbase使用的经验 data skew 随机读的优化 变随机读为顺序读 异步访问 数据聚合 rowkey设计 参数调优 表预先切分 客户端使用参数调优 大批写使用bulk load 中间数据和小表使用文件更优 hbase使用的教训 重视运维 关注官方动态 谨慎使用新特性 数据存储 数据统计分析 storm实时计算 + mr离线计算 深度挖掘 pig + hive 分类聚类 mr + spark 预测建模 mr + spark 数据分析 hadoop 使用经验 map reduce 槽位混用 磁盘空间优先的调度策略 任务运行内存限制及调整,内存动态计算 高比例的压缩算法 hadoop 使用的教训 对于迭代式计算的支持 mr算法的僵化(二次排序,各种join) 数据分析 pig 篇 pig 应用场景 qa 测试 数据深度挖掘 聚类分类 pig 优势 pig 局限 数据分析 hive 篇 hive 应用场景 报表生产 hive 优势 sql hive 局限 udf 数据分析 spark篇 spark 应用场景 深度学习 spark 优势 更多的抽象模型 mllib库 spark sql 强大的语言支持 spark 局限 吞吐量 数据分析 任务调度 开源任务调度器 azkaban oozie 友盟任务调度器 数据分析 友盟任务调度器 数据分析 数据服务 rest api protobuf 异步请求 缓存 redis 预先聚合计算 数据展示 zabbix ganglia bacontower 报警内容 任务失败 任务延迟 jt, nn, dn下线 hm, rs 下线 监控报警 realtime + batch kaaa mongodb + hbase storm, mr,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年共享出行平台在提升用户出行体验中的创新服务研究报告
- 父母遗产房子分割协议书
- 管廊钢筋合同分包协议书
- 物流车辆三方转让协议书
- 海洋技术入股协议合同书
- 黄金麻外墙干挂合同范本
- 防水sbs施工合同范本
- 高校就业协议与劳动合同
- 生产线外包协议合同范本
- 苏州市购买二手房协议书
- 网约车考试题库及答案
- 慢阻肺健康宣教
- 湖北省两校2025年物理高一下期末综合测试试题含解析
- 热射病病例查房汇报
- 小学一年级升二年级暑假数学作业-应用题(178题)(附答案)
- 酒店卫生管理自查报告和整改措施
- 养猪学培训课件
- 班主任常规工作培训课件
- 股份代持及员工持股计划协议书范本
- 燃气专项安全评估报告
- 2024过敏性休克抢救指南(2024)课件干货分享
评论
0/150
提交评论