常见算法的优缺点比较_第1页
常见算法的优缺点比较_第2页
常见算法的优缺点比较_第3页
常见算法的优缺点比较_第4页
常见算法的优缺点比较_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常见算法的优缺点比较机器学习算法数不胜数,要想找到一个合适的算法并不是一件简单的事情。通常在对精度要求较高的情况下,最好的方法便是通过交叉验证来对各个算法一一尝试,进行比较后再调整参数以确保每个算法都能达到最优解,并从优中择优。但是每次都进行这一操作不免过于繁琐,下面小编来分析下各个算法的优缺点,以助大家有针对性地进行选择,解决问题。1.朴素贝叶斯朴素贝叶斯的思想十分简单,对于给出的待分类项,求出在此项出现的条件下各个类别出现的概率,以概率大小确定分类项属于哪个类别。优点:1)朴素贝叶斯模型发源于古典数学理论,因此有着坚实的数学基础,以及稳定的分类效率;2)算法较简单,常用于文本分类;3)对小规模的数据表现很好,能够处理多分类任务,适合增量式训练。缺点:1)需要计算先验概率;2)对输入数据的表达形式很敏感;3)分类决策存在错误率。2.逻辑回归优点:1)实现简单,广泛地应用于工业问题上;2)可以结合L2正则化解决多重共线性问题;3)分类时计算量非常小,速度很快,存储资源低;缺点:1)不能很好地处理大量多类特征或变量;2)容易欠拟合,一般准确度较低;3)对于非线性特征,需要进行转换;4)当特征空间很大时,逻辑回归的性能不是很好;5)只能处理两分类问题(在该基础上衍生出来的softmax可以用于多分类),且必须线性可分。3.线性回归线性回归与逻辑回归不同,它是用于回归的,而不是用于分类。其基本思想是用梯度下降法对最小二乘法形式的误差函数进行优化。优点:实现简单,计算简单;缺点:不能拟合非线性数据。4.最近邻算法优点:1)对数据没有假设,准确度高;2)可用于非线性分类;3)训练时间复杂度为O(n);4)理论成熟,思想简单,既可以用来做分类也可以用来做回归。缺点:1)计算量大;2)需要大量的内存;3)样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少)。5.决策树优点:1)能够处理不相关的特征;2)在相对短的时间内能够对大型数据源做出可行且效果良好的分析;3)计算简单,易于理解,可解释性强;4)比较适合处理有缺失属性的样本。缺点:1)忽略了数据之间的相关性;2)容易发生过拟合(随机森林可以很大程度上减少过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论