




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验报告实验目的:使用RapidMiner对数据进行分析实验工具:RapidMiner 6.5实验数据:DatingDate.csv实验数据说明:实验数据是通过研究对象的三种特征,一个是每年坐飞机飞行的里程数miles,二个是玩视频游戏所耗时间的百分比gamepercent,每周消费的冰淇淋公升数icecream,来判断一个人是否具有吸引力(didn't like、smallDoses,lagerDoses)实验过程:打开RapidMiner 6.5,新建一个Process导入数据DatingData.csv,如图所示点击下一步到出现如图所示界面,将Response设为label最后将
2、数据存储在如下图的位置,命名为TrainingData,点击finish完成将数据TrainingData拖拽到process窗口中,用线连接至result接口,可以看到如下数据其中有些Response的值丢失了,共有31个这时需要使用Filter Examples 过滤掉没有值得Response行,操作如下图数据筛选完成之后,选择Decision Tree Model,拖入到process中,连接起来,参数选择默认设置训练好模型之后,我们可以用模型预测一下TrainingData中没有标记的样例,与上面的数据过滤方法相同,只是设置有所不同,如下图使用Apply Model来运用模型整个连接图
3、如下所示实验的预测结果部分决策树截图为了测试上面说的决策树模型的预测能力,我又做了下面的一些如图,加入一个Validation其参数如下图,默认的10表示将样例分为十份,取一份作为测试数据双击Validation右下角的矩形表框进入,建议决策树模型,应用模型退出Validation 如图连接到result运行输出结果如下上图显示准确率为96%左右,正负误差为1.69%,表明训练所得模型是比较稳定的实验总结1.我在这个过程中运用的测试集与训练集是相同的,这可能会使整个模型的预测能力比实际要偏大2.该实验的难点是数据源的收集与筛选,选择什么样的数据,需要怎样的处理才有意义是不容易的3.模型算子的选择对于我来说比较难,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论