KNIME使用说明_第1页
KNIME使用说明_第2页
KNIME使用说明_第3页
KNIME使用说明_第4页
KNIME使用说明_第5页
免费预览已结束,剩余10页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

KNIME用法说明刘春玲、王斌、王璐、谢冬、周莲子(按学号顺序)引注:使用说明包括三个部分:KNIME构建CBR完整模型、聚类K-D树存储和检索优化、Adaboost决策树推理RBR,在使用knime之前先进行knime升级weka功能模块,具体操作:fileupdate knimeavailable software,在搜索栏里输入weka 安装完成重新启动knime,完成升级。KNIME构建CBR完整模型一、新建KNIME文件单击菜单栏File里的New之后出现如下对话框:选择New KNIME Project,并按下Next键,之后点击Finish即可完成新文档的创建。二、K-D树的生成与准确度判断1.布局1)查找file reader,其结果如下图所示:2)分别拖两个file reader出来。3)将IBK拖出来。并将其中的一个file reader与IBK连接起来。4)拖一个Weka Predictor出来并与IBK和另一个file reader连接起来。5)将Scorer与Weka Predictor连接起来。其具体的布局和连接情况如下图所示:2.导入数据右击第一个File Reader,选择Configure(或直接双击进入),在Valid URL处选择要导入的数据的文件。之后点击OK就完成了数据的导入。 3.生成K-D树右击IBK,点击Configure,可以改变KNN的数值,从而改变精度。改distanceweighting(距离权重)的值为weight by 1-distance,之后点击nearest neighbourSearch Algorithm后面的choose,选择KD Tree,点击OK。4.导入新的数据其方法与参照步骤2中导入数据的过程5. 模型运行与验证1)将来自File Reader2 的数据和来自IBK的K-D树模型输入到Weka Predictor中。注:当发现设置完的结点没有变成绿灯时要及时按下按钮来执行所有的结点。2)设置scorer 的属性右击后点击Configure,first column 选择要预测的属性;second column选择winner. 6查看结果右击后点击accuracy statistics 来查看预测的结果。聚类K-D树存储和检索优化1布局与数据导入1)先打开knime,再新建(new)一个工程(project)。2)先拖一个file reader到工作区,右击选择configure,设置成下图形式:3)再拖入一个k-means(依次miningclustering-k-means),file reader连接 k-means4)拖入一个interactive table(dataviewsinteractive table),k-means连接interactive table。5)再拖入一个file reader,右击选择configure,设置成下图形式:6)再拖入一个聚类器cluster assigner(三个下拉菜单里存在聚类器,这里选择miningclustering-cluster assigner)7)最终使工作区变成如下形式:2、模型测试与运行1)点击,运行,观察各node的运行结果。2)右击k-means,选择“0 labeled input”,可观察到如下结果:3)、右击k-means,选择“view:cluster view”,可观察到如下结果注:在interactive table的“view:cluster view”中也可观察到相应结果,结果如下图4、再右击cluster assigner,选择“0 assigned data”,可得到如下结果:Adaboost决策树推理RBR用Adaboost对数据进行训练并得到规则,并用此规则对新数据进行预测1.布局与数据导入1)数据源的选取先查找到File Reader,然后将其拖出。共拖两个,分别代表用来进行训练的数据和用来预测的数据。2)找出Adaboost,将其拖出3)将Weka predictor 和Scorer,Interactive table 拖出,形成如下图所示。4)开始进行设置。在第一个File Reader上点击右键,选择Configure,出现如下图所示:点击“Browse”,选择数据源。本例中是选取经过粗糙集处理的241例病例的数据。5)同理,将第二个File Reader的数据源设置为经过粗糙集处理的61例病例的数据。如下图:2.参数设置1)对Adaboost进行设置,在Adaboost上点击右键,选择Configure,出现如下图所示其中,numIterations一项指的是将多少个分类器累加,即迭代多少次。不同的迭代次数会使最后的准确度不同,次数过少会训练不足,次数太多会训练过度,都不会得到最好的结果,需要多次试数。使最后的准确度最高的迭代次数,就是最合理的迭代次数。2)对Scorer进行设置,在Scorer上点击右键,选择Configure,出现如下图所示将进行比较的两列设为如图所示。即为,将患者实际的是否患病的情况(class)与用训练出的规则预测的情况(winner)进行比较,在Weka preictor上点击右键,选择0 Classified Test Data,即可观察比较情况:如上图,若判断情况相同,则准确度高;反之,则准确度低。3.运行与测试设置完成,即可开始运行如上图,点击最上面一行的即可运行,当所有控件下部都显示绿灯时,运行即结束。如下图所示4、观察预测结果与分析在Scorer上点击右键,选择0Confusion matrix或1 Accuracy Statistics ,即可观察预测结果(或在Interactive Table中也能观察),如下图所示图中数据意为:实际为Yes的案例一共有20个,但预测结果是11个No,9个Yes;实际为No的案例一共有41个,但实际预测结果是39个No,2个Yes如上图所示,规则预测准确率为78.7%,这是在迭代次数为55时的结果。大家也可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论