Hadoop大数据在百度的应用_第1页
Hadoop大数据在百度的应用_第2页
Hadoop大数据在百度的应用_第3页
Hadoop大数据在百度的应用_第4页
Hadoop大数据在百度的应用_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Hadoop大数据在百度的应用技术创新,变革未来主要内容百度在hadoop上的应用对hadoop进行的改进和调整目前面临的问题及未来的改进计划hypertable相关研究和应用百度在hadoop上的应用互联网领域的平台需求应用范畴应用方法互联网领域的平台需求应用范畴日志存储和统计网页数据分析和挖掘商业分析在线数据分析反馈用户和网页聚类应用方法对hadoop进行的改进和调整Map-reduce策略调整HDFS效率和功能改进资源使用控制map-reduce策略调整限制某作业处于运行状态的任务数调整预测执行策略,控制预测执行量。根据节点内存状况调度平衡中间结果输出HDFS效率和功能改进权限控制分区与

2、节点的独立性VFS的posix兼容性资源使用控制应用物理内存控制-修改linux内核,对进程独立限制对计算资源分组调度,实现存储共享,计算不相干 扰。大块文件系统目前面临的问题及未来的改进计划Map-reduce效率问题 HDFS效率和可靠性问题 资源利用效率问题Map-reduce效率问题shuffle效率问题:减少IO次数,过程并行sort的效率和可配置性streaming利用管道传输的效率问题HDFS效率和可靠性问题随机访问效率数据写入的实时性资源利用效率问题hypertable相关应用方法完善和改进与open source合作应用方法完善和改进recovery资源使用情况监控与open

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论