




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘软件CLEMENTINE介绍,Clementine产品介绍,Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司, 对Clementine产品进行重新整合和开发,现在Clementine 已经成为SPSS公司的又一亮点。 作为一个数据挖掘平台, Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。 强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。 同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比,Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。,Clementine中的Data Mining 的方法,Classification Clustering Estimation Prediction Market Basket Analysis Description,预测 和分类推估类似,不同在于是预測未來,將新资料带入既有资料建立的模型预见結果 銀行新申请信用卡的客戶要給多少额度,估计 和分类的不同在於目标变量为连续值,常和分类配合 用分类判断为会贷款客户后再推估会贷款的金額,聚类 非监督式,未知有几类,将性质类似的资料加以区分,把顾客资料分群对不同群体采用不同推销手法,购物篮分析 找出哪些事件会一起发生 超級市场发現男性客戶会一起购买啤酒跟尿布,描述 增进对于资料的认识,图形视觉化呈现,或规則、决策树等,相关技术 神经网络 决策树 (C5.0 C&RT) Logistic 回归 等等,相关技术 K-Means 两步骤 Kohonen 等等,相关技术 分类跟估计的所有方法,相关技术 Apriori GRI 等等,相关技术 决策树规则 各类图表 等等,分类 目标变量(因变量、反应变量数)为类別的狀況 信用卡公司將既有资料分为伪卡非伪卡找出伪卡的模式,数据挖掘应用-业务建摸,神经网络 Neural Networks,聚类分析 Clustering,Open Accnt,Add New Product,Decrease Usage,?,Time,序列分析 Sequence Analysis,决策树 Decision Trees,倾向性分析,客户保留 客户生命周期管理 目标市场 价格弹性分析,客户细分 市场细分,倾向性分析 客户保留 目标市场 欺诈检测,关联分析 Association,市场组合分析 套装产品分析 目录设计 交叉销售,Clementine面板,Clementine的使用,1打开一个流文件,2执行流文件中的某一流程,3得到结果,4浏览结果1,4浏览结果2,5浏览结果3,Clementine流文件的建立,1读取数据文件1,在节点区,双击文件读入 节点,在流区出现其图标,再在流工作区,双击 文件读入节点,读入 所需数据文件。,读取数据文件2,对数据进行处理,1,2,4,5,6 去掉两个变量Na、K,3 增加新变量:Na_to_K=Na/K,定义变量的方向,在节点区双击Type节点, 使之在流区中出现,把Drug的 Direction 从in(输入) 改为out (输出),作分类处理,保存流文件,读取文本数据与查看数据,Clementine可以读入的数据文件,文本格式数据 SPSS/SAS数据 Excel,Access,dBase,Foxpro,Oracle, SQL Server,DB2等数据库 用户输入数据 文件读入节点:,读取文本数据与查看数据,查看数据1,点击Data 和Types,出现数据的属性,查看数据2,点击Table,使之出现在流 工作区,再点击Execute (执行),得到右面图表:,Clementine中的字段类,离散型 二分 eg:sex:m/f 多分 eg: 等级:好/中/差 离散 eg: 连续型 整数 实数 日期、时间 其它,数据理解之数据质量,缺失值的检查:quality节点,点击Quality节点,使之 出现在工作区,再执行 Quality,出现数据质量 表,从中可以看出, 数据100%有效,一共 有200个有效数据。,Distribution节点-初步 理解字符型字段的分布,1,2,3,4,简单数据整理,Derive节点介绍,2 增加新变量: Na_to_K=Na/K,根据原有字段值生成新字段值,Filter节点介绍,对某些字段进行重命名或丢弃某些无意义的字段,去掉两个变 量Na、K,数据理解之数据间简单关系,Web节点-研究字符型字段间关系1,Web节点-研究字符型字段间关系2,执行后,得到字符间的网状连系,其中粗线条,表示 字符之间的强联系。,Statistics节点-研究连 续型字段间线性相关关系,得到N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025南昌东湖城市建设投资发展有限公司招聘2人备考考试试题及答案解析
- 2025内蒙古赤峰市医院(宣武医院内蒙古医院)面向社会招聘硕士研究生控制数人员64人备考模拟试题及答案解析
- 2025年8月浙江嘉兴市海宁市丁桥镇中心幼儿园招聘劳动合同制教职工6人考试参考题库及答案解析
- 2025-2030肉牛养殖行业区域协作及产业集群研究报告
- 2026荣耀全球校园招聘备考考试题库附答案解析
- 2025-2030羊肉行业设备自动化升级与智能制造投资回报周期评估报告
- 2025-2030羊肉行业产学研合作模式与技术转化路径报告
- 2025-2030矿泉水跨界联名营销案例与品牌价值提升研究
- 2025贵州遵义市贵蔬供应链服务有限公司补岗招聘1人考试模拟试题及答案解析
- 2025昆明市官渡区金马中学聘用制教师招聘备考考试题库附答案解析
- 防止人身伤亡事故培训课件(共139张)
- 农业可持续发展指标体系
- 2024年危险化学品经营单位主要负责人试题题库
- 2024届贵州省贵阳市高三下学期适应性考试(二)物理试题
- 癌因性疲乏治疗指南
- 大象版(2024)小学科学一年级上册教学设计(附教材目录)
- 接收预备党员表决票(样式)
- 品牌合作协议书合同范本
- 中小学教育管理干部考核试题及答案
- 养老院预防老人食品药品误食
- 装配式建筑装饰装修技术 课件 模块二 装配式楼地面
评论
0/150
提交评论