数据挖掘软件Clementine介绍.ppt_第1页
数据挖掘软件Clementine介绍.ppt_第2页
数据挖掘软件Clementine介绍.ppt_第3页
数据挖掘软件Clementine介绍.ppt_第4页
数据挖掘软件Clementine介绍.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘软件clementine介绍 clementine产品介绍 clementine是isl integralsolutionslimited 公司开发的数据挖掘工具平台 1999年spss公司收购了isl公司 对clementine产品进行重新整合和开发 现在clementine已经成为spss公司的又一亮点 作为一个数据挖掘平台 clementine结合商业技术可以快速建立预测性模型 进而应用到商业活动中 帮助人们改进决策过程 强大的数据挖掘功能和显著的投资回报率使得clementine在业界久负盛誉 同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比 clementine其功能强大的数据挖掘算法 使数据挖掘贯穿业务流程的始终 在缩短投资回报周期的同时极大提高了投资回报率 clementine中的datamining的方法 classificationclusteringestimationpredictionmarketbasketanalysisdescription 预测和分类推估类似 不同在于是预測未來 將新资料带入既有资料建立的模型预见結果銀行新申请信用卡的客戶要給多少额度 估计和分类的不同在於目标变量为连续值 常和分类配合用分类判断为会贷款客户后再推估会贷款的金額 聚类非监督式 未知有几类 将性质类似的资料加以区分 把顾客资料分群对不同群体采用不同推销手法 购物篮分析找出哪些事件会一起发生超級市场发現男性客戶会一起购买啤酒跟尿布 描述增进对于资料的认识 图形视觉化呈现 或规則 决策树等 相关技术神经网络决策树 c5 0c rt logistic回归等等 相关技术k means两步骤kohonen等等 相关技术分类跟估计的所有方法 相关技术apriorigri等等 相关技术决策树规则各类图表等等 分类目标变量 因变量 反应变量数 为类別的狀況信用卡公司將既有资料分为 伪卡 非伪卡 找出伪卡的模式 数据挖掘应用 业务建摸 神经网络neuralnetworks 聚类分析clustering openaccn t addnewproduct decreaseusage time 序列分析sequenceanalysis 决策树decisiontrees 倾向性分析 客户保留客户生命周期管理目标市场价格弹性分析 客户细分市场细分 倾向性分析客户保留目标市场欺诈检测 关联分析association 市场组合分析套装产品分析目录设计交叉销售 clementine面板 clementine的使用 1打开一个流文件 2执行流文件中的某一流程 3得到结果 4浏览结果1 4浏览结果2 5浏览结果3 clementine流文件的建立 1读取数据文件1 在节点区 双击文件读入节点 在流区出现其图标 再在流工作区 双击文件读入节点 读入所需数据文件 读取数据文件2 对数据进行处理 1 2 4 5 6去掉两个变量na k 3增加新变量 na to k na k 定义变量的方向 在节点区双击type节点 使之在流区中出现 把drug的direction从in 输入 改为out 输出 作分类处理 保存流文件 读取文本数据与查看数据 clementine可以读入的数据文件 文本格式数据spss sas数据excel access dbase foxpro oracle sqlserver db2等数据库用户输入数据文件读入节点 读取文本数据与查看数据 查看数据1 点击data和types 出现数据的属性 查看数据2 点击table 使之出现在流工作区 再点击execute 执行 得到右面图表 clementine中的字段类 离散型二分eg sex m f多分eg 等级 好 中 差 离散eg 连续型整数实数日期 时间其它 数据理解之数据质量 缺失值的检查 quality节点 点击quality节点 使之出现在工作区 再执行quality 出现数据质量表 从中可以看出 数据100 有效 一共有200个有效数据 distribution节点 初步理解字符型字段的分布 1 2 3 4 简单数据整理 derive节点介绍 2增加新变量 na to k na k 根据原有字段值生成新字段值 filter节点介绍 对某些字段进行重命名或丢弃某些无意义的字段 去掉两个变量na k 数据理解之数据间简单关系 web节点 研究字符型字段间关系1 web节点 研究字符型字段间关系2 执行后 得到字符间的网状连系 其中粗线条 表示字符之间的强联系 statistics节点 研究连续型字段间线性相关关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论