下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录TOC\o"1-5"\h\z\o"CurrentDocument"大数据经典算法 2\o"CurrentDocument"一、C4.5 2\o"CurrentDocument"二、 K-Means算法 2三、 支持向量机 2\o"CurrentDocument"四、 TheApriorialgorithm 2五、 最大期望(EM)算法 2\o"CurrentDocument"六、 PageRank 3\o"CurrentDocument"七、 AdaBoost 3\o"CurrentDocument"八、 kNN:k-nearestneighborclassificatio.n 3\o"CurrentDocument"九、 NaiveBayes 3十、CART:分类与回归树 3十一、mahout算法集 4大数据经典算法一、C4.5C4.5,是机器学习算法中的一个分类决策树算法,二、 K-Means算法k-meansalgorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割(k<n)。它与处理混合正态分布的最大期望算法(本十大算法第五条)很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。三、 支持向量机支持向量机,它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。四、 TheApriorialgorithmApriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。五、最大期望(EM)算法在统计计算中,最大期望(EM,Expectation-Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量( LatentDataClustering)领域。VariablDataClustering)领域。六、 PageRankPageRank是Google算法的重要内容。这个就是所谓的“链接流行度”——衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一般判断这篇论文的权威性就越高。七、 AdaBoostAdaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器 (弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,八、 kNN:k-nearestneighborclassificationK最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的 k个最相似(即特征空间中最邻近)的样本中的多数属于某一个类别,则该样本也属于这个类别。九、 NaiveBayes在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型 (DecisionTreeModel)和朴素贝叶斯模型(NaiveBayesianModel,NBC)。十、CART:分类与回归树CART,ClassificationandRegressionTrees在分类树下面有两个关键的思想:第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。
mahout算法集算法类算法名中文名分类算法LogisticRegression逻辑回归Bayesian贝叶斯SupportVectorMachines支持向量机PerceptronandWinnow感知器算法NeuralNetwork神经网络RandomForests随机森林RestrictedBoltzmannMachines有限波尔兹曼机聚类算法CanopyClusteringCanopy聚类K-MeansClusteringK均值算法FuzzyK-Means模糊K均值ExpectationMaximizationEM聚类(期望最大化聚类)MeanShiftClustering均值漂移聚类HierarchicalClustering层次聚类DirichletProcessClustering狄里克雷过程聚类LatentDirichletAllocationLDA聚类SpectralClusteringMinhashClusteringTopDownClustering谱聚类关联规则挖掘ParallelFPGrowthAlgorithm并行FPGrowth算法回归LocallyWeightedLinearRegression局部加权线性回归降维/维约简StochasticSingularValueDecomposition奇异值分解PrincipalComponentsAnalysis主成分分析IndependentComponentAnalysis独立成分分析GaussianDiscriminativeAnalysis高斯判别分析进化算法并行化了Watchmaker框架推荐/协冋过滤Non-distributedrecommendersTaste(UserCF,ItemCF,SlopeOne)
DistributedRecommendersItemCF向量相似度计算RowS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省德阳市中江县2025-2026学年上学期年10月月考七年级初中道德与法治(答案版)
- 土建一级考试题库及答案
- 浦东银行考试题型分布及答案
- 乙肝疫苗考试题及答案
- 政治经济考试试题及答案
- 四川改革建筑考试题及答案
- 国际大米合同范本
- 区域教育教师培训中人工智能辅助的教学评价方法创新与优化教学研究课题报告
- 《农村土地整治对农业生态环境影响机制与生态修复策略研究》教学研究课题报告
- 2026年材料员考试备考题库【历年真题】
- 北京朝阳区六里屯街道办事处招聘18名城市协管员考试笔试备考题库及答案解析
- 2025年国家统计局齐齐哈尔调查队公开招聘公益性岗位5人笔试考试备考题库及答案解析
- 2025年科研伦理与学术规范期末考试及参考答案
- 货款尾款结算协议书
- 村会计笔试试题及答案
- 2026年江西省铁路航空投资集团校园招聘(24人)笔试考试参考题库及答案解析
- 2025年徐州市教育局直属学校招聘真题
- 消防设施共用责任划分协议书范本
- 杜国楹小罐茶的创业讲稿
- 2025-2026学年统编版九年级历史上册(全册)知识点梳理归纳
- 沪教版(新版)一年级下学期数学第4单元100以内的加减法单元试卷(附答案)
评论
0/150
提交评论