商务智能实验7报告.doc_第1页
商务智能实验7报告.doc_第2页
商务智能实验7报告.doc_第3页
商务智能实验7报告.doc_第4页
商务智能实验7报告.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘与商务智能实验实 验 报 告实验题目:统计分析:逻辑回归 姓名:王俊 学号:201430850164 指导教师:张大斌 实验时间:2016.11.09 2016年 11月 10日 实验题纲:一、 实验目的1) 了解和熟悉SPSS Modeler及其相关知识。2) 掌握SPSS Modeler工具建立多项Logistic回归的方法。3) 学会运用SPSS Modeler进行多项Logistic回归的内容。二、 实验内容本实验采用的数据源来自文件Brand.sav。该数据集的变量分别是不同性别(x2,1为男,2为女)、三种职业(x1)顾客选购三种品牌(x3)的数据。本实验主要探讨的例子说明多项Logistic回归的操作和意义。三、 实验步骤与结果步骤1 构建多项式Logistic回归数据流1) 通过“Statistic文件”节点读入文件名为Brand.sav的数据。2) 数据流中添加“类型”节点。3) 在“建模”模块下选择“Logistic”节点连接在数据流的恰当位置。步骤2 设置相关参数1) 右击“类型”节点,将x3设置为目标,其他保持不变,如图所示。2) 右击“Logistic”节点,在模型下,将使用分区数据勾选为“无”,采用的过程选择“多项式”,“多项式过程”中“方法”采用“进入法”,其他保持不变,如图所示。步骤3 结果运行本例的计算结果如图所示。结果包含两个回归方程。以第三种职业作为职业的参照水平,以女性作为性别的参照水平,研究对象是选择第一品牌的概率与第三品牌概率之比的自然对数。当性别相同时,第一种职业的比数自然对数比第三种职业(参照水平)平均减少了1.315,第一种职业是第三种职业的0.269倍。第一种职业选择第一品牌的倾向不如第三种职业,且统计显著,第一种职业选择第一品牌的倾向性与第三种职业有显著差异。当职业相同时,男性的比数自然对数比女性(参照水平)平均多0.747个单位,男性是女性的2.112倍。男性较女性更倾向选择第一品牌,且统计表明,男性选择第一品牌的倾向性与女性有显著差异。4、 实验分析与扩展练习1. 实验分析:请总结分析下面几个问题:(1) 结合本次试验数据结果,分析逻辑回归模型的二分类原理;答:原理:(2) 当本次实验选择的是第2个方程时,说说方程代表的意义;意义:以第三种职业作为职业的参照水平,以女性作为性别的参照水平,研究对象是选择第一品牌的概率与第三品牌的概率之比的自然对数如图(3) 采用二项Logistic回归会出现什么样的结果和问题。出现的问题:2. 扩展训练(1) 尝试改变挖掘算法的参数,来提高预测的准确率,在“挖掘模型确定性表”中,对挖掘模型进行验证。更改图中所示数据:参数改变如下;左边为改变前,右边为改变后五、结论与讨论(重点) 对于逻辑回归的理解: 虽然叫做“回归”,但是这个算法是用来解决分类问题的。回归与分类的区别在于:回归所预测的目标量的取值是连续的(例如房屋的价格);而分类所预测的目标变量的取值是离散的(例如判断邮件是否为垃圾邮件)。当然,为了便于理解,从二值分类(binary classification)开始,在这类分类问题中,y只能取0或1。更好的理解问题,先举个小例子:假如我们要制作一个垃圾邮件过滤系统,如果一封邮件是垃圾系统,y=1,否则y=0 。给定训练样本集,当然它们的特征和label都已知,我们就是要训练一个分类器,将它们分开。1、逻辑回归模型回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见问题有如医生治病时的望、闻、问、切,之后判定病人是否生病或生了什么病,其中的望闻问切就是获取自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。最简单的回归是线性回归,有如图1.a所示,X为数据点肿瘤的大小,Y为观测值是否是恶性肿瘤。通过构建线性回归模型,如h(x)所示,构建线性回归模型后,即可以根据肿瘤大小,预测是否为恶性肿瘤h(x).05为恶性,h(x)0或z0处,都不敏感,将预测值限定为(0,1)。图2 逻辑方程与逻辑曲线逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,逻辑回归成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心。对于多元逻辑回归,可用如下公式似合分类,其中公式(4)的变换,将在逻辑回归模型参数估计时,化简公式带来很多益处,y=0,1为分类结果。对于训练数据集,特征数据x=x1, x2, , x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论