版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、济南大学并行计算实验室MapReduce研究现状,主修:电脑软件和理论名称:居民郑光华地图教师:朱继鹏教授,总结,MapReduce研究调试、监控等常用API Hadoop改造数据挖掘项目red poll canopy,k SVM Jstack JobTracker Profile每个slave节点TaskTracker的Profile每个slave节点的Child进程的Profile(单个执行速度可能太慢)、监视、监视:群集或单个节点I/O、内存监视I/O output format partitioner comparator distributed cache streaming(bas
2、h/job Tracker与作业调度结合性太强的作业History必须独立于一个JVM进程,逻辑必须与作业tracker 与文件系统兼容的POSIX不对齐Map的key输出,仅分区NameNode单点故障问题RPC支持的大数据(例如档案)传输群集资源分配权限管理,大型数据挖掘3360Redpoll,文本数据挖掘分布式向量空间模型分布式距离测量数据检索狗新闻20 news group Wikipedia给定未知数据示例X后,分类将预测后检查概率(条件X下)牙齿最高的类。寻找最大化。根据贝叶斯定理,根据朴素贝叶斯分类,P(X)可通过对所有类的常数、最大化、的考虑分析:等概率或类条件的独立朴素假设:(K=1,2,N)训练样本评价为分类属性,根据样本评价为连续值属性。大容量、高维数据集群集使用两阶段群集,通过徐璐其他距离测量节省计算时间。K-means EM GAC、大规模支持向量机、解决的稀缺性和问题的凸性将大规模原文制分解为小的子问题,并反复解决子问题。直到收敛到原始问题为止,选择块算法分解算法序列最小最优化方法(SM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼师热身活动方案策划(3篇)
- 回填坡道施工方案(3篇)
- 墙艺施工方案(3篇)
- 家清活动策划方案(3篇)
- 茶室设计方案汇报
- 成本管理基础企业培训
- 2026年中职第三学年(审计事务)内部审计基础综合测试题及答案
- 中职第三学年(国际商务)进出口业务操作2026年阶段测试题
- 2025年大学大一(化学工程)物理化学阶段测试题及答案
- 一年级语文(句子排序)2026年下学期单元检测卷
- 矿山应急管理培训
- 高中化学会考复习重点资料全
- 技术股入股协议书
- DL-T5796-2019水电工程边坡安全监测技术规范
- 魁北克腰痛障碍评分表(Quebec-Baclain-Disability-Scale-QBPDS)
- 实验室生物安全培训-课件
- 八年级上册历史【全册】知识点梳理背诵版
- 《工会法》及《劳动合同法》教学课件
- 股权转让协议书常电子版(2篇)
- 2023年副主任医师(副高)-推拿学(副高)考试历年高频考点真题演练附带含答案
- 产品质量法课件
评论
0/150
提交评论