数据挖掘实验报告-数据挖掘的基本数据分析_第1页
数据挖掘实验报告-数据挖掘的基本数据分析_第2页
数据挖掘实验报告-数据挖掘的基本数据分析_第3页
数据挖掘实验报告-数据挖掘的基本数据分析_第4页
数据挖掘实验报告-数据挖掘的基本数据分析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘与应用实验报告 6到11章学 院 自动化 专 业 物联网工程 年级班别 2015物联网4班 学 号 3115001492 学生姓名 张思明 指导教师 董延峰 实验6 数据挖掘的基本数据分析一、实验目的(1) 熟悉基本数据分析的处理流程(2) 进一步熟练掌握SPSS Modeler工具的操作二、实验环境(1) 相关智能算法的基本原理(2) IBM SPSS Modeler软件三、实验内容及步骤1、数据的质量探索(1)建立数据流a、创建“Statistics”节点,读入telco.sav数据。b、创建“类型”节点,说明各变量角色,其中“流失”为目标变量。c、创建“数据审核”节点并连接在适当的位置,进入编辑界面,在“质量”选项卡下,选择检测方法为平均值的标准差。(2)结果输出2、基本描述分析(1)建立数据流,创建“统计量”节点。(2)设置相关参数a、设置“统计量”节点,在“检查”中添加开通月数、基本费用、免费部分和无线费用。b、在“相关”中添加年龄、收入和家庭人数。c、在“相关选择”中选择“按重要性定义相关强度”。(3)结果3、绘制散点图(1)构建数据流,创建“图”节点。(2)设置参数a、编辑“图”节点b、在“X字段”和“Y字段”中分别选择“基本费用”和“年龄”。将“交叉字段”中的“颜色”设置为“流失”,不同颜色表示流失变量不同取值的样本点。(3)结果输出4、两分类变量相关性的研究(1)设置相关参数。创建“网络”节点,在“字段”中选择“套餐类型”和“流失”,设置线值为“绝对值”。(2)结果输出5、变量重要性分析(1)窗口设置。创建“特征选择”节点,编辑,将“流失”添加到目标选项中,其他的全部作为输入。(2)结果输出总的图:实验7 统计分析:逻辑回归一、实验目的SPSS Modeler的Logistic回归的方法。(1) 了解和熟悉SPSS Modeler及其相关知识。(2) 掌握SPSS Modeler工具建立多项Logistic回归的方法。(3) 学会运用SPSS Modeler进行多项Logistic回归的内容。二、实验环境一台装有 SPSS Modeler软件系统的计算机。三、实验内容及步骤1、构建多项Logistic回归数据流(1)通过“Statistics文件”节点读入Brand.sav。(2)数据流中添加“类型”节点。(3)在“建模”模块下选择“Logistic”节点连接在数据流中恰当的位置。(4)运行结果:2、设置相关参数(1)右击“类型”节点,将x3设置为目标,其他保持不变。(2)设置“Logistic”节点,在模型下, 将使用分区数据勾选为“无”,采用的过程选择“多项式”,“多项式过程”中“方法”采用“进入法”,其他保持不变。3、结果运行总的图:实验8 关联分析:关联规则一、实验目的(1) 了解和熟悉SPSS Modeler及其相关知识。(2) 掌握SPSS Modeler工具建立Apriori关联规则的方法。(3) 学会运用SPSS Modeler关联规则进行相关的内容分析。二、实验环境一台装有 SPSS Modeler软件系统的计算机。三、实验内容及步骤1、创建Apriori算法数据流(1)创建“可变文件”节点读入BASKETS.txt文件。(2)在数据流的适当位置创建“Apriori”节点。(3)运行结果2、设置相关参数(1)在“字段”下,选择“使用定制设置”选项。在“后项”和“前项”中选择关联规则的后项和前项的变量。此例中后项和前项均为所有商品。(2)在“类型”下,指定当前前项最低条件支持度,默认值10%;最小规则置信度,默认值为80%;最大前项数,默认为5;勾选“仅包含标志变量的真值”。(3)在“专家”下,选择模式“专家”选项,并选择评价关联规则的度量指标,这里选择默认选项“规则置信度”。3、结果运行4、考察关联规律(1)将Apriori节点中的模型计算的结果添加到数据流编辑区域的恰当位置。(2)点击鼠标右键编辑。(3)“最大预测数”中输入数值。(4)勾选“忽略不匹配篮项目”和 “检测不在篮中”。通过“表”观察具体的结果如图:总的图:实验9分类分析:决策树一、实验目的SPSS Modeler的决策树(1) 了解和熟悉SPSS Modeler及其相关知识。(2) 掌握SPSS Modeler工具建立CHAID决策树的方法。(3) 学会运用SPSS Modeler决策树进行相关的内容分析。二、实验环境一台装有 SPSS Modeler软件系统的计算机。三、实验内容及步骤1、构建CHAID数据流(1)通过“Statistic文件”节点读入“telco.sav”文件。(2)数据流中添加“分区”节点,将样本集划分为训练集和测试集。(3)选择建模中的“CHAID”节点,连接到数据流的恰当位置。2、设置相关参数(1)在“构建选项”“基本(B)”,选择树的生长算法为穷举CHAID。自定义最大树状图深度为5.(2)其他相关参数的设置默认。3、结果运行实验10聚类分析:K-Means一、实验目的SPSS Modeler的聚类分析(1) 了解和熟悉SPSS Modeler及其相关知识。(2) 掌握SPSS Modeler工具建立Apriori关联规则的方法。(3) 学会运用SPSS Modeler关联规则进行相关的内容分析。二、实验环境一台装有 SPSS Modeler软件系统的计算机。三、实验内容及步骤1、创建K-Means聚类数据流(1)创建“Statistic文件”节点导入K-Means.sav。(2)在“字段选项”“类型”节点中,设置“地区”角色为“无”。(3)创建“K-Means”节点,连接到恰当的位置。2、设置相关参数(1)进入编辑界面。(2)在“模型”模块下指定聚类数目为4,勾选“生成距离字段”和“数值”选项。(3)在“专家”模块下,勾选“模式”下的“专家”选项,其他默认。3、结果运行总的:实验11预测分析:人工神经网络一、实验目的SPSS Modeler的聚类分析(1) 了解和熟悉SPSS Modeler及其相关知识。(2) 掌握该工具建立B-P反向传播网络的方法。(3) 学会运用B-P反向传播网络进行相关的内容分析。二、实验环境一台装有 SPSS Modeler软件系统的计算机。三、实验内容及步骤1、创建K-Means聚类数据流(1)通过“Statistic文件”节点读入telco.sav。(2)添加“分区”节点,将样本集划分为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论