Clementine决策树C5.0算法_第1页
Clementine决策树C5.0算法_第2页
Clementine决策树C5.0算法_第3页
Clementine决策树C5.0算法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.C5.0输出类型:指定分析输出的内容。指定希望最终生成的模型是决策树还是规则集。组符号:如果选择该选项,C5.0会尝试将所有与输出字段格式相似的字符值合并(采用ChiMerge分箱法检查当前分组变量个各个类别能否合并,如果可以应先合并后再分支)。如果没有选择该选项,C5.0会为用于拆分母节点的字符字段的每个值创建一个子节点。使用推进:提高其精确率。这种方法按序列建立多重模型。第一个模型以通常的方式建立。随后,建立第二个模型,聚焦于被第一个模型错误分类的记录。以此类推,最后应用整个模型集对样本进行分类,使用加权投票过程把分散的预测合并成综合预测。试验次数选项允许控制用于助推的模型数量。交互验

2、证:如果选择了该选项,C5.0将使用一组基于训练数据自己建立的模型,来估计基于全部数据建立的模型的精确度。如果数据集过小,不能拆分成传统意义上的训练集和测试集,这将非常有用。或用于交叉验证的模型数目。模式:对于简单的训练,绝大多数C5.0参数是自动设置。高级训练模式选项允许对训练参数更多的直接控制。简单模式:偏好(支持):选择“准确性”C5.0会生成尽可能精确的决策树,某些情况下,会导致过度拟合。选择“普遍性”以使用不易受该问题影响的算法设置。预期噪声(%):指定训练集中的噪声或错误数据期望比率专家模式:模式僱勇严重性:每个子分支的最小记录数:0使用全局催剪宇段模型成本分析注解执行取消修剪纯度

3、:决定生成决策树或规则集被修剪的程度。提高纯度值将获得更小,更简洁的决策树。降低纯度值将获得更加精确的决策树。子分支最小记录数:子群大小可以用于限制决策树任一分支的拆分数。全局修剪:第一阶段:局部修剪;第二阶段:全局修剪。辨别属性:如果选择了该选项,C5.0会在建立模型前检测预测字段的有用性。被发现与分析无关的预测字段将不参与建模过程。这一选项对许多预测字段元的模型非常有用,并且有助于避免过度拟合。C5.0成本选项见“CHAID“成本”选项-误判成本值,调整误判C5.0的模型评价可通过Analysis节点实现。另外Analysis还可以实现不同模型之间的评估对比可通过Evaluation节点实现模型评估圏表类型:増益响应提升利弼投资回报率圄回累稅散点囹回包含基线包含最佳线-複型使用以下內容査找目标呼页则娈重字段:檯型输出宁段元数据宁眾名楷式備妝,亦炸T机已tfi巳彷)其他得分宇段绘制得分宇段目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论