数据挖掘数据集PPT课件_第1页
数据挖掘数据集PPT课件_第2页
数据挖掘数据集PPT课件_第3页
数据挖掘数据集PPT课件_第4页
数据挖掘数据集PPT课件_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、引例统计学奥卡姆剃刀 以尽量少的因子去解释现象,减少中间过程。误差会以乘积的方式扩大引入因子会使主题偏移第1页/共20页辛普森悖论 分组中具有优势,总评中却是劣势。 爱荷华州的一位居民移居到阿拉巴马州,结果提高了这两个州的平均智商。 分组兼顾权重定量因子细化分析第2页/共20页数据挖掘的三种基本数据集 数据集事物数据集时序/序列数据集多维属性数据集第3页/共20页4事物数据集ID WORKID TIME WORK第4页/共20页描述性结果模式以描述性语言及规则等展现形式关联规则序列规则If-then 规则集第5页/共20页时序数据集值时间序列数据集值值第6页/共20页预测性结果模式以各种回归式

2、、方程式、检验结果等无偏预测值展现l线性、多项式、泊松、岭脊等回归类lARIMA、X-11、WOLD分解等时间序列模式l嵌入式网状结构、过拟合网状神经等学习模式第7页/共20页ARIMA平稳时间序列预测-举例某地年最低气温时序数据绘制时序图平稳性和纯随机性检验定阶参数估计模式化及预测第8页/共20页ARIMA时间序列预测-举例预测效果图第9页/共20页多维属性数据集属性/值目标有目标值则是有监督性第10页/共20页分类性结果模式各种机器学习lK中心、两阶段、邻近、系统等无监督聚类l分类树、逻辑回归、神经网等监督性分类模式第11页/共20页监督性分类性-举例信贷风险预测 数据来源于银行信贷部门对

3、用户贷款信息的记录,包括客户基本信息、信用信息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。 待分析数据数据仓库处理后数据变换后数据数据抽取数据预处理数据挖掘数据变换解释评价建模数据集第12页/共20页2021-11-25监督性分类性-举例界面化流程图第13页/共20页2021-11-25监督性分类性-举例结果输出模型比较预测的0/实际所有的0第14页/共20页2021-11-25监督性分类性-举例结果输出最优模型树第15页/共20页2021-11-25监督性分类性-举例结果输出分类 将打分文件输入待预测数据集,对新数据产生分类。第16页/共20页文本数据集文本只有单列文本第17页/共20页企业决策支持信息系统企业决策支持信息系统ODS数据仓库统计分析数据挖掘决策支持1st Qtr2nd Qtr3rd Qtr4th QtrPowerPlayFileEditDataValuesDisplayTextLegendLocation 1992 All Products Age groups Revenue($000)OLAP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论