利用RapidMiner可视化工具实现线性回归数据挖掘问题_第1页
利用RapidMiner可视化工具实现线性回归数据挖掘问题_第2页
利用RapidMiner可视化工具实现线性回归数据挖掘问题_第3页
利用RapidMiner可视化工具实现线性回归数据挖掘问题_第4页
利用RapidMiner可视化工具实现线性回归数据挖掘问题_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、线性回归背景和概要说明利用前面用到的数据集预测新客户的燃油用量,使用数据挖掘来查看家庭属性和一直的过往消费量,以便预测并满足新客户的需求。线性回归解释利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。分析按照自变量和因变量之间的关系类型,可以分为线性回归分析和非线性回归分析线性回归分析:回归分析中,只包括一个自变量和一个因变量,且二者的关系可以用一条直线近似表示,这种回归分析称为一元线性回归分析如果回归分析中包括两个或者以上的自变量,且因变量和自变量之间的关系是线性关系,则称为多元线性回归分析。业务理解已经拥有数据,将使用线性回归进行预测。新客户的的家庭

2、在性质上与现有客户群非常相似,一次现有客户的使用行为可用作预测新客户未来用量的可靠基准。数据准备一定要注意数据集中各种属性(字段)的属性值取值范围,训练集和数据集必须相同,这样才最准确apptf3WWadsling二AssflciaiionandHemStMining(1ApplyAssoaationRule&ZjklndelApllcslinn(2)7Thresholds(1耳.ptfThreshold-fProcessQu营*督曰Praoessk4?剳Q国拙ApplyModel9RBpg$rlDri$稈.4-5甘卫ibuc-或*LdIRHpoefcfTidm-lwH7Bata-.-.1卫哟

3、卩-:nmzMlIt*3-,.=fx.d,ini;.-.-:荒沖5.:T.飞吃.匸:i第Tt.K4.leans;:f::L荒::叶Trainini3-t_SwrrjlIIHIHI1IIIH11M_i対评镇dMi_rrainr就JHJJ.,m-;_u申匚汨土甬“mini;$二疚折旱.与IE屯前r”M-5ns吴尺4611:山汕細IQaupk-iFimm:!ru-iji-iJTaiariij!.;k13仔S|R旳曲抚占h.l4l_Sfl|Vf-:ii3n数据过滤屯|DalmTran&forrnation團B-Flttenng91二门Sampling驴SampleSamplef&lraunetl)Sa

4、mpleiSocjl&lrappirig沪SamplejFiilodEl-EasEdiSample;iKennard-SIflneSplilD?1a弘RemovsDuplicates沪FilterEwiEplmRange1)RopoEiborisEss殊|4-=neQJ越吾富-innKis-色Qa益ncaUcinmndRgneswonEb-酣ELimE.-nElBD-E-eRcgea1flicm叱誥皆匚2里尢品5兰弓I.tr.Su吕ortJr-rtftms呂豐inga心SupG口龙ieawMWnG4Lirl亶-lL口mcrirmnuntAIl.a一ys-s-sQ匚忌出口一3=皇=31.弐里巫山

5、0一划匚口CP趣Luca-Rglgn圧;fP黒雷a會轉*FmcKS匚neaEP3I3MO3结果展现荃FiesuitOveniewLlExamplsSe;(FillerEkbmpl&3);LinearRegression(LinearRegression)(r-nAttributeCoefficientStd.ErrorStd.CoeffiDi.Toleranct-Statp-ValueCodeInsulalion3.3230.413D.1640.4316.D460*r+*Temperatun-0.8690D68-0.2E20.405-12.7340AvgAg$1.9660.064D.0590.

6、491JO.5650*r+*Hom_Siz2.172031008430.91410.230DXTjrX(Intercept)134.51172577710.5350*t+*Descriptionftnnotallon公式应用模型Process3丁脅囘PROBES卜*迂MoilingSA&sodslionandlien80IMining(1J5.Qppr/A5sociaDonRulesBMdelpplicallon(2J-mresriddE11)ipph-TFireshQld皿lep皿EB讪HelrjcvekhS.=,r家庭人口数不具有预测作用,所以被忽略计算操作巴iOpsrahnsaggregaleRj&tijitFiWm占rrrI”Reposllfities;0i-DataTransrormalicn(10AggregaUon(1!:LH席LqkiiReidosi忖rr洋卄-:.T.H:-bie-biieve-潮亠Il*ppjipIWilI*_J戌yg凹alt易-11o壬ResullOverviewJLinearRegression(LinearRegression)ExampleSet(Aggregate)ExampleSet(1example,0specialattributes,2regulara

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论