已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 回归和神经网络回归和神经网络 分析目标分析目标 零售行业拥有大量消费者特征和行为数据 通过对数据进行探索挖掘得到 的信息 可以帮助企业针对特定的客户进行营销 用最少的成本取得最佳的收 益 分类决策树模型是一种对实例进行分类的树形结构 决策树学习算法包含 特征选择 决策树的生成与剪枝过程 开始时 构建根节点 选择最优特征 该特征有几种值就分割为几个子集 每个子集分别递归调用此方法 返回节点 返回的节点就是上一层的子节点 直到数据集为空 或者数据集只有一维特征 为止 logistic回归又称logistic回归分析 是一种广义的线性回归分析模型 常用于数据挖掘 疾病自动诊断 经济预测等领域 神经网络是一种模仿动物 神经网络行为特征 进行分布式并行信息处理的算法数学模型 这种网络依靠 系统的复杂程度 通过调整内部大量节点之间相互连接的关系 从而达到处理 信息的目的 本文旨在通过建立决策树模型 逻辑回归模型 神经网络模型对 企业的Organics数据进行分析 通过划分训练集和验证集判断模型拟合优劣 最 终选择最优模型来得到购买Organics的消费者的特征 从而为企业提供精准营销 的客户 数据情况数据情况 1 添加数据源添加数据源 我们发现 AGEGRP1 与 AGEGRP2 与 Age 内容相似 只是用不同形式表示年 龄 因此选择拒绝这两组变量 同时 Number of Organic Products Purchased 代 表购买的有机产品的数量 而我们分析的目的是对消费者是否购买有机产品进 行预测 因此该变量相关性较弱 可以拒绝 最后 我们将 Organics Purchased 设 为目标变量进行分析 2 2 数据集右键探索数据集右键探索 从图中可以看到 该数据集共有 18 个变量 22223 个观测 从样本统计量中可以看到 大部分变量缺失值都比较严重 后面应该进行 相应的补缺处理 上图显示了数据集的前面 15 条数据 3 从所有变量的频数统计图中可以看到 除了已经拒绝的变量 其余大部分 呈现正态分布 只有变量 BILL 和 LITME 变量呈现偏态分布 因此后期数据预处 理时应该对这两个变量进行转化处理 3 统计探索统计探索 从目标变量的频数分布图可以看到购买人数占比大概是 25 而不购买的 人数占比大概是 75 说明我们的样本还是有意义的 数据预处理数据预处理 1 数据分区数据分区 设置训练集比例 70 验证集比例 30 经过上次决策树实验得出 70 Exponential Identity Logistic Normal Reciprocal Sine Softmax Square Tanh 优点决策树易于理解 能够同时处理数据型 和常规型属性 对缺失值不敏感 预测结果是界于 0 和 1 之间的概率 可以适用于连续性和 类别性自变量 自学习和自适应能力 有一定的容错能力 缺点类别太多难以预测 只能根据一个目标进 行分类 适用范围较窄 对模型中自变量多重 共线性较为敏感 需要较长的训练时间 解释性差 黑匣子 预测能力和训练能力 的矛盾问题 样本依赖性问题 6 模型优化模型优化 模型优化主要是通过模型参数设置来起到优化效果 比如决策树中通过最 大分支数 树的深度 比如回归模型中通过设置变量选择方法或者选择准则 比如神经网络中通过设置不同的激活函数以及隐藏单元数来优化模型 降低误 分类率 还有很多参数设置需要我们去探索 通过不同参数设置能够得到不同 的模型 最终对模型进行比较 能够得到较好结果的模型 7 结果与建议结果与建议 通过上述三种预测模型得出的结果 我们可以看到决策树模型结果直观简 单 能够清晰的看出分类过后哪些类别的人群购买有机产品的概率有多高 但 是简单的以这个标准判断较为粗矿 不能细化到每一个人 无法进行精准营销 而回归模型得到的结果能够对每个人进行判断买或者不买有机产品的概率 企 业可以通过设定一定的概率阈值来寻找愿意购买有机产品的顾客 买的概率大 于阈值的顾客则属于企业需要进行营销的顾客 因此这个阈值的设定也很关键 可以通过实践来得出最优阈值 神经网络模型则是个黑匣子 无法看
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- NBT 10983-2022 20kV及以下配电网工程结算报告编制导则
- 公务员面试门外面试题及答案
- 公务员面试量变面试题及答案
- 恒力集团校招面试题及答案
- 公务员面试经济面试题及答案
- 国家能源集团校招笔试题及答案
- 贵州茅台校招题库及答案
- 公务员考试税收试题及答案
- 公务员考试实情试题及答案
- 2025年樟树市特聘动物防疫专员招募17人参考题库及答案详解1套
- 公证财产协议书范本
- 2024年锦州辅警招聘考试真题附答案详解(综合卷)
- 2025年高校教师资格证之高等教育学测试卷附答案
- 2025-2026学年高二上学期《如何引导高中生“碳索绿色未来”培养环保意识》主题班会课件
- 北师大版数学七年级上册期中综合能力测评卷(含解析)
- 农业经理人考试题库四级及答案
- 门面反恐应急预案
- 体质测试教案
- (完整版)医疗器械分类目录2002年版
- 厦门劳动合同范本(三篇)
- 27中成药陈列注意事项
评论
0/150
提交评论