机器学习方法与实践 课件比较检验_第1页
机器学习方法与实践 课件比较检验_第2页
机器学习方法与实践 课件比较检验_第3页
机器学习方法与实践 课件比较检验_第4页
机器学习方法与实践 课件比较检验_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模型评估与选择:比较检验Modelevaluationandselection:Comparisontest主讲:王雯计算机与信息技术学院视觉智能实验室(VisInt)BeijingJiaotong

University性能评估评估比较学习器的性能:直接取得性能度量的值然后"比大小“?测试性能并不等于泛化性能测试性能随着测试集的变化而变化很多机器学习算法本身有一定的随机性性能评估评估比较学习器的性能:测试性能并不等于泛化性能测试性能随着测试集的变化而变化很多机器学习算法本身有一定的随机性统计假设检验(hypothesistest):为学习器性能比较提供了重要依据,基于其结果我们可以推断出若在测试集上观察到学习器A比B好,则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大。根据测试错误率估推出泛化错误率的分布。比较检验二项检验

来自周志华《机器学习》

比较检验t检验当通过多次重复留出法或是交叉验证法等进行多次训练/测试,会得到多个测试错误率,此时可使用"t检验"(t-test)来自周志华《机器学习》

比较检验交叉验证t检验现实任务中,更多时候需要对不同学习器的性能进行比较

比较检验交叉验证t检验欲进行有效的假设检验,一个重要前提是测试错误率均为泛化错误率的独立采样。然而,通常情况下由于样本有限,在使用交叉验证等实验估计方法时,不同轮次的训练集会有一定程度的重叠,这就使得测试错误率实际上并不独立,会导致过高估计假设成立的概率。为缓解这一问题,可采用“5x2交叉验证“法比较检验5x2交叉检验所谓5*2折交叉验证就是做5次二折交叉验证,每次二折交叉验证之前将数据打乱,使得5次交叉验证中的数据划分不重复。为缓解测试数据错误率的非独立性,仅计算第一次2折交叉验证结果的平均值和每次二折实验计算得到的方差则变量

服从自由度为5的t分布。比较检验配对卡方检验(McNemar’stest)对于二分类问题,留出法不仅可以估计出学习器A和B的测试错误率,还能获得两学习器分类结果的差别

比较检验Friedman检验交叉验证t检验和配对卡方检验都是在一个数据集上比较两个算法的性能,可以用Friedman检验在一组数据集上对多个算法进行比较。

比较检验Friedman检验交叉验证t检验和配对卡方检验都是在一个数据集上比较两个算法的性能,可以用Friedman检验在一组数据集上对多个算法进行比较。得到表格如下所示,由平均序值进行Friedman检验来判断这些算法是否性能都相同。

比较检验Nemenyi后续检验若“所有算法的性能相同”这个假设被拒绝,说明算法的性能显著不同,此时可用Nemenyi后续检验进一步区分算法。Nemenyi检验计算平均序值差别的临界阈值如果两个算法的平均序值之差超出了临界阈值CD,则以相应的置信度拒绝“两个算法性能相同”这一假设。比较检验Friedman检验图根据上例的序值结果可绘制如下Friedman检验图,横轴为平均序值,每个算法圆点为其平均序值,线段为临界阈值的大小。若两个算法有交叠(A和B),则说明没有显著差别;否则有显著差别(A和C),算法A明显优于算法C.扩展阅读周志华,《机器学习》第二章2.4节Dietterich,T.G.(1998).“Approximatestatisticaltestsforcomparingsupervisedclassification1earningalgorithms.”NeuralComputαtion,

10(7):18951923.Demsar,J.(2006)."Statisticalcomparisonofclassifiersovermu1tip1edatasets."JournalofMachineLearn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论