




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Clementine自带应用程序实例 中文版 电信客户流失 二项式Logistic回归 译者注 Logisticregression应该翻译成Logistic回归 而非逻辑回归 因为本身跟逻辑没有什么关系 本文档翻译自Clementine的自带应用程序实例 错漏在所难免 有问题请e mail 欢迎粉我微博e mail 973599102 微博 说明 logistic回归是一种基于输入值的记录分类统计技术 它跟线性回归相似但用分类目标字段替换数字字段 使用的流文件 clementine demo Classification Module telco churn str使用的数据文件 clementine demo telco sav 例如 假设电信提供商关心流失给竞争对手的客户数量 如果服务使用数据可以被用来预测哪些客户有流失到竞争对手的倾向 那么就可以实施相应的措施以挽留客户 实例以客户使用数据预测客户的可能流失概率 因为目标是分成两类 所以选用二项式模型 在多目标分类的情况下 可以使用多项式模型代替 详见系列教程Clementine自带实例 多项式Logistic回归 ppt 百度文库有 添加一个SPSS文件源节点 指向telco sav 添加一个指向telco sav的SPSS源文件节点添加一个类型节点以定义字段 确保它们的类型都设置正确 例如 对于大多数只有0值和1值的字段来说应该被设为标志 但某些特定的字段 如性别 应该被更精确的视为双值集合 小技巧 要改变多个字段的类型 点击 值 字段排序 按下shift键对您要改变的字段进行多选 可右击选择的字段改变选择字段的类型或者属性 添加一个特征选择节点到类型节点并执行使用特征选择节点可以去掉跟预测目标无关的协变量从生成菜单中选择过滤器以生成过滤节点 不是所有telco sav中的数据都对预测流失有用 您可以使用过滤器选择那些重要性比较强的因子在生成过滤器的对话框中 选择 所有标记的字段 重要 点击确定把生成的过滤节点连接到类型节点连接数据审核节点到生成的过滤节点并执行在数据审核浏览器的质量标签中 单击 完成标题进行升序排序 这让您能识别出有大量缺失值的字段 在本例中 我们仅需修正字段logtoll 它的缺失值大于50 在缺失插补中 为logtoll选择指定 在插补时间一栏 选择空值与无效值 已固定为一栏选择平均值在数据审计浏览器的质量节点 生成缺失值超节点在缺失值超节点对话框中 增加样本数量至50 确定 生成超节点到面板中 添加超节点到过滤节点 添加Logistic节点到超节点在Logistic节点中 点击模型标签并选择二项式方法选择前进法 在专家标签中 选择专家模式 点击输出选择每一个步骤和参数估计执行Logistic节点生成模型 模型生成在右上角的面板上 右击选择浏览汇总标签展示了模型使用的目标字段和输入字段 预测字段 协变量 我们看到这些都是被前进法选入的字段 而不是所有的被提交的字段 在高级标签展示的项目 依赖于建模节点中高级输出对话框所选有一项总会出现在案例处理过程摘要 那就是落在某分类的记录条数以及比例 另外 还列出了缺失 如果有的话 数量 那些一个或多个输入字段不可用且未被选中 向下滚动到分类表前进法由空模型 无协变量 看作基础模型 用于与最终模型比较 开始 空模型把所有的记录都预测为0 所以空模型有72 6 的准确率 因为726名客户没有流失 但是那些流失的客户一个都没预测正确 往下拖到分类表 a 分类表展示了每次每个协变量加入模型后的结果 我们看到 第一步加入了一个协变量后 流失的预测比例从0提升至29 9 滚动到分类表的底部分类表展示的最后一步即为第8步 在这步算法决定不再往模型加入更多的协变量 尽管预测未流失客户的精度有一点下降 至91 2 但预测流失的客户从最初的0上升至47 1 相对于没有使用任何协变量的基准模型来说 是显著的提高 对于想减少客户流失的电信营运商来讲 若能减少一半的流失 将是保有自身收入流的一大步 本例还展示了如何考虑模型精确度的问题 有些案例中 整体精确度是会误导人的 基准模型有72 6 的精确度 而最终模型的精确度只提高到了79 1 但是 如我们所见 单个类别的预测精度都得到了极大改变 结语 要知道模型对数据拟合的怎么样 在建模节点的专家 输出里面有一些选项可以使用 欲知详情可查看帮助文件里的LogisticModelNuggetAdvancedOutput Clementine中建模用到的数学方法可以在Documentation目录的ClementineAlgorith
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美术特色引流课件设计框架
- 2025年事业单位工勤技能-湖南-湖南土建施工人员四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-湖北-湖北药剂员四级(中级工)历年参考题库典型考点含答案解析
- 2025年教育培训机构品牌建设策略研究报告
- 2025年事业单位工勤技能-海南-海南环境监测工四级(中级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-河南-河南水文勘测工五级(初级工)历年参考题库典型考点含答案解析
- 2024版个人私有汽车出租合同书
- 2024版并购法律服务合同
- 2025年事业单位工勤技能-河北-河北保健按摩师一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-江西-江西中式面点师五级(初级工)历年参考题库含答案解析(5套)
- 2024年重庆永川区招聘社区工作者后备人选笔试真题
- 医学技术专业讲解
- 2025年临床助理医师考试试题及答案
- 唯奋斗最青春+课件-2026届跨入高三第一课主题班会
- 2025民办中学教师劳务合同模板
- 2025年南康面试题目及答案
- 2025年事业单位考试贵州省毕节地区纳雍县《公共基础知识》考前冲刺试题含解析
- 高中喀斯特地貌说课课件
- 黄冈初一上数学试卷
- 2025年中国花盆人参行业市场发展前景及发展趋势与投资战略研究报告
- 广东省安装工程综合定额(2018)Excel版
评论
0/150
提交评论