大数据平台的设计与实现- 研究生答辩ppt.ppt_第1页
大数据平台的设计与实现- 研究生答辩ppt.ppt_第2页
大数据平台的设计与实现- 研究生答辩ppt.ppt_第3页
大数据平台的设计与实现- 研究生答辩ppt.ppt_第4页
大数据平台的设计与实现- 研究生答辩ppt.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、答 辩 人: 红军 专 业: * 指导老师: *,论文题目:大数据平台的设计与实现,目录,大数据,国内,国外,开源-收集,开源-存储,开源-计算,开源-工具,ambari 支持数据服务集群的供应、管理和监控。支持应用扩展。 Hive 是面向Hadoop生态系统的数据仓库。支持类SQL语言。 Oozie 管理调度Hadoop任务。 Mahout 基于MapReduce算法库,初步支持spark。,整体业务视图,平台 开发,平台维护,场景-工程师,合理分配资源 数据可管可查 算法被合理执行 简单实现可视化 异常问题可知,场景-用户,用户查看权限可被管理 查找数据关系描述 数据内容可被搜索 可以查看

2、订阅数据图表,场景-系统,获取数据成果 输送数据 数据暂存 数据计算,设计-架构,设计-部署,设计-收集,应用-关系,应用-调度,应用-可视化,服务 业务系统 管理后台 可视引擎 Mysql集群、Redis集群 关键术语 业务系统、桌面、报表,总结,不足 不能实现一键平台整体部署; 操作复杂,学习门槛高; 存在一些bug待修改,存在功能不足待完善; 部分流程之前还存在断层; 成果 所有系统实现分布式并支持多机房部署; 完成收集、存储、计算、展现、管理的打通; 实现机构化、非结构化、实时和离线的数据收集;,展望,技术方向 结合云计算、资源弹性使用; 增加算法库和开放算法平台; 开放平台,引入自由开发者; 提供离线和在线模式。 行业方向

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论