数据挖掘实验报告二_第1页
数据挖掘实验报告二_第2页
数据挖掘实验报告二_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验二基本原理分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研 究领域。分类算法通过对已知类别训练集的分析,从中发现分类规则,以此预测新数 据的类别。分类算法的应用非常广泛,银行中风险评估、客户类别分类、文本检索和 搜索引擎分类、安全领域中的入侵检测以及软件项目中的应用等。二、实验目的:掌握CART决策树构建分类模型。三、实验内容告警及线损数据和该用户在当天是否窃漏电的标291个样本数据,得到专家样本,使用CART对所有窃漏电用户及真诚用户的电量、 识,按窃漏电评价指标进行处理并选取其中 决策树实现分类预测模型。20%作为测试样本。注意:数据的80%作为训练样本,剩下

2、的四、实验步骤1、对数据进行预处理2、把数据随机分为两部分,一部分用于训练,一部分用于测试。分成testData和tra in Data文件 即测试数据和训练数据数据的80%乍为训练样本,剩下的20%乍为测试样本届聞 ” g 晒g bring ErcBi 【士 卄J* - i -i . d- A-材 liCHKII HlBv 5«MU m1灯棹i fl b i fl: ? ri丄fia4为島第=H4ra kitnAatAr-raAd. c-fvi; D3 kx!h1 . c.awii')白* eC"e Em-11, pi9 汕冲E丄09fl R* +ii 比时于肝占

3、yfi十t:占洒13! Ind v-profaY I a 0. 2 :"L; LrCdLi *ik3 .E H Lt14 TAITIUIANTA ;r I i H iK fl H15 « A K V U1( M-lti. CfYfCrjIiFXW J s "02 "dEWCl,?!* 帝1? witf.电 W tfjT&MS, Cr-mi 'i>a-4 GtaMEnniBriHBnl ®DMAG-n-i刊1 曲 B < v«r1i4i>H4>l*alDM.A!bl ata. mF 日 vMZ44

4、 cbs Pf & Mar! abl>«-ViillM1!CKi«rH. ./4fl!-ai.'1iLUiirl4i4!9jjil*.Klx!>!-v-*Im 141 11112111 11m xblbhi airu " tmast &xr di>! nk aft *FBM*J> sal:wdClBC = ii>ina4"i.llDvifcEcn,>-diEU>i)»Mslttd- Hdhkl«riEABH>A叩曲廿駅T 1*E.f 昱世灌翼qzh nieini轉

5、駅和js t it占2姑 ir4 威 MApitCJi rvcnw). rtplMt«TM. pr亦<強.-0.2)> tfPT5*TH «- p*tJlnc>«%a , J-«i|il:H|a 0 iti巾*> m1 11*. EM(狎JdrtUl釘E口叮EFMrtW. £4vr,血MZFALH)U*S-I "* I*""HWY 酊 wl* H*WWr:t?WCHlFKI£Ctaff RW. *MU*H ttt* WMiP l+ra 血dn 5 CiMb » RfniM

6、 宓 Mmd © Hewfii呻+訂¥匕厲卅屮叫iM ddrtMfifil U VMri dll一U ¥uri itrAa AlTS.L testData.jdstrainData.Mls2017/12/25 23:17 Microsoft Excel2017/12/25 23:17Microsoft Excel7.3、使用tree包里的tree函数以及训练数据构建CART决策树模型,使用 predict函数和构建的CART决策树模型分别对训练数据和测试数据进行分类。1#数 % M353 把“藪据廉奩序”文件夹请贝到F盘下,再Ssetwd设養工作空间4 serwd

7、Cti :/dwie>c/e)42/eK2/上机实掘")56和把疲据甘拘两補分;训练数揭、别憤教拡7 #读入數振8 Data -r ead, csv (". /data/nodel * csv*)9 数据侖名10 colnames(i>ata)<-Ert1»ertr "useridT Tel t-1nd"Zli»SL.1 nd", "al ar«_1 nd4* ."class4*)11 數据份割12 s獣川gdK12韶卄请呂幅机种子13卄定义序列讪力 隨观抽取1剌臥1的个数占8

8、0%. 2的會数占2彌14 ind sampl e21 nrowCoaia) >即lace =true t prob c(0h B t 0. Z)15 rrainoata <-oataind:= 1,flIII IK16 te&tcata - Dat a i- =2 (1 lit17 «IE write, csv(TrainData., tiup; trainoata. csv" ,row* names=false)19 write,csvCtestData/'-/tmo/testData,csv"row. naqes>FALSE

9、initial value 108.617282 Iter 10 value 63.275219 iter 20 value SI. 111476 Rer 30 value 1.282313 iter 40 value 48.77J149 iter 50 valLre 48.198352 ltEr 60 value 4S. 049784 iter 70 value 48.016256 iter 80 value 48. 000944 icer 90 value 47.9A9600 iter loo value 47.9S53S5 final value 47.985385 stopped af

10、ter 100 iteratiarsy nub f * '*» l<h 19 Mb Mb tnw UkI Mug fcnU U y*i 心r-«*!t f *ctw 占 Str krriM* f rjreiif or : r4|, rf <bc tar I »»4 Ge" Cju *WI4曰口1fH i m 刊 Tri" ,*: C U i > 黑«udtl tf*«# cIaaiiod- 1ms-.>-a1 jja ifd.Efjilncjiij知*UFy If*#. AMtl州

11、Mr * wjr I Win.*«*nri» -rtffiT拳Em* 盂g*#p1«t trw- b£4«1 ;i«»i:''rF#«buli V= E: *趣异COrtf UStOTfc- r Jfcl « tr A I *«JTAiC_pr iHSICl 1M-. Wh>t1 , TF-3 I H&»£l 15-1ALEUTdi CWTfwSlC -103 MM CtWTfvlIOn11 V 恆託 41 Wl pvl .141.tr Air0

12、j| 孔聲鼻fftUt J rw, 04】 .1-r>4nh *.51*fcsClrWRiffT.*!"*'calnjT. t.r jinptJ- , C- Tf 11*r<#s ? rfllrCLfr H . 亠工円农-上g 尸鼻彳 n4wC5-7. ru(*- -*N Rcmf 上 If $<84. mdi.NO'- hWKil i4 - l * e-l ,Lit i fa Bn iB 4-t- IVM I LIi %-il *! ” *Sffu 8 h4 - i4«*L*|、p|ir4 - L rMui- J* Jj*> iii

13、x*嘏尸科盘押*和0护】冠知匸>A 斤棺 X 丹t"T*” I rjii rtuitSrjpirCLki #aprr<ai<t £t ra«. noCfl , Trji r#9 *n' e. 8 ill') Wf 1«, <,¥« («Ul>irt_<fT*4i<*W4-T4 4UA-枕.H严4 静*>越.34产r- *嘗触丄丁*寸 SAi4l:f M-.«dd*l , Fldd .- EMK'A' J4、使用nnet包里面的nnet函

14、数以及训练数据构建神经网络模型,使用predict函数和构建的神经网络模型分别对训练数据和测试数据进行分类。X 匕 4 bi I4i I W I !teii kJ V /> #«Cla5-5列猜为f2C:"雄扫* tr ai nOiLt a<-1 ronsf grra(tr air cl 4155-91. FjHtQr(G:l jts) J>中權超冋蚪摺習构世> 1 i br jry (nnttji QKnntt tE> 立神錘耶> nnet, model-noet(class-ele_ 1 md+1 ossiind+alarnind,

15、train&ataFsiz-10Rdecay-0.05* weightj:現initialval ue丄且氐L62167it®<-IBval ue冲珈樹1I*rvilue5 5-百的237in er30value51.O563W1t«r4Gvalue4S.990954Iter50v&lue4A. 11Q2»1 rer6Qval ue47.BK34I.31t«irMval ue47® 価 H1teraovalue47.809974iter90val ue47-79313it<r100v>l u«47.7

16、MMBfinal value i7.7B4D6a stopped after 1闖 iterationsa J-10-1 neiwark wlih 51 weighrcsoptions fcrtre - entropy fdecay-OSb->M.11->M12 Fl13->fil0H B2-0.3»0-0.5B-0.17b->h212 -Ml?19-*Jh2-l.Sfl-1.141.133.02b->h311-M1313->tl30.7451心11b->M.11-IVIi 2-HJ13->IU2.13-0.1Z-0.52-Q,位b如1

17、2-3<15仆加九gg-0.11-0.61-0,61b->hsl2-*he13-M16-1.23-<534理0-4$1.99Wl61-Q.61il->Mi2->hS13->M-1-I3U6 71a轴b-h71l->h7n-71i3-?h7-1.2B0. 030.73D. 50b->hBl2->hB13->h&-2.200,lS0$0a赫bF!924h!913->K90. B3 0.33-0. fi9-D.ldlb-MUQ il->ttLO 12->hlC i3->hl0OU9646 对|>->

18、;ohi»>CBh2->o打h->&h7->fl->oh-x-0-11-1. 51-3.79-1. 53-2.59-2. 521.B41.93:2- 71>1.523.15>尊肃直琨漏是陈> confus ion-t abl e(t rai inDatalcl ass9pr edi ct (nwt node! , tr ai nOata, typew'pcl as s")> ACcur*-Cy-5U»!(d 1 鼻g ccsnfuS 1on)JlOO/SurafcanfUS 1 "0&

19、gt; wtput.nnettrainData-cbi nd(tria1 nOata,pedictCmet. mode 1,trainData*type-c 1 as")> col names Ccwrt put_nnet B t r*i n&at a) < -c (colnarifls (t rai ntkgt a) B "output")*> irffttr<»VfrnpuUftfl-"和riwct.P或-inn報.Cr<1npjT>. C5virP广帥-namfs-FAL§E)>

20、>駅佩评荐墟闻塔騷盘> saveCnrret.model,fi 1 e""D2/nnet.«0(1«1 RData")3EHAQ-CHod WEH.oo.False positive ratet h-t>jp5、对比分析CART决策树和神经网络模型对数据处理的结果Mv l4t Co*Plot*|bdM Dwfa&f fcn*ta« tceti Mv<i°5-= - ini i* _ 曲* MMWM 2f34hIItltefjryU F t r *< Fi'MEfM.A&d

21、tl- 'Em El Jd-11-M1 .Jinfr-AldVfl._1d , EVJ I WAT Alit£収 歼b /*屮iiBpMi tfiw0w:4Ml 44. * vjd-iiiiTeilh» Rw 虹«W 仁何J* 血a vv o /1p m* f31MIFli-stilHI.理|*1 v C-T 41 FC4I4 i-C 1-f>i .#redl(V' 1 J ' *ifeECHfACy-S4MdWujSlW Is® 1H* CWTu4l4in* 4 IK £. 4 flDvi|Mq .tr*. U

22、j1-<ri<KlnadiAePffdllc1! n*n.Md*1«r(p*Jl _e*f f - trg q;: calruuMn t/p-inQdl j _ f-.mjTAwEfui.ifm. tfii. Qfapui.riv-*. e*i irai.-um V-hiW,比l电讣 M)V1Mt *呻xM* 2 吋 _?*. (J-xlndf u I朋.心七事,pr 钿彳日代尸曾.BE>d»l Irf!吟 f Vyp”* Ti»"»* |h1_I.F4«-. Tf «!|>fig4l <)&#

23、171; ><) . 'OyfiFUTJ* writerci-YiCwSvirttrw!. tr<1 ntat3>, wCpA-tr*、r-F*in<wrt-i.c!-*- i-rcw. nam0*MH49Mnnikd 2 bBS-*電0野FSp (g (04* Vi<w Mqtipug 0TqrU* Tglf.o Q|_# H H -M4«1k ff-fevK«C-MHlt "JWa nnet.C<1 iiil-elM r* l-M>4-.lnd*lllrn.1 ndu t r jinCwt. i Ijre

24、-lO|0e<.4y.* TE护孔IfriKiAl ktAluft1B4.itwl-Q77.2779?1tfTM51.MJ3B7ItfrM wlZ口卫弭)峠1EM- d& aluii!41.ttfeQS41E»FHi山m4=d-.JilC?»1t«r -W ¥A1WBA7d#WMJfW珅胡g«T.»WUTWM itfAlu*级皈4T事1e«tM! MAlut4T. FM31Jlew 100 中ill逛仪 *W»flnilYfllw 4.7.7|J!P<i|贾翼!Md *f£E100 IX+fMim> Siusury (mtc.KMhrl 3 -10 1 r«iwork trit申i *51 m1 gh<scpt Swi wwr* 0trflpy fitting OKxyT冲A a*412-rf«1卜血血垃亠n.»*0lM-0 17li->ka怙加7.14x.u1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论