大数据仓库与大数据挖掘--决策树实验_第1页
大数据仓库与大数据挖掘--决策树实验_第2页
大数据仓库与大数据挖掘--决策树实验_第3页
大数据仓库与大数据挖掘--决策树实验_第4页
大数据仓库与大数据挖掘--决策树实验_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用文案图1 1新建项目标准文档实验3决策树一、实验目的1.1.了解决策树的基本概念。2.2.掌握决策树挖掘分析的操作步骤。二、实验内容对 三国志4 4武将数据.xls.xls中的数据进行决策树分析。三、实验仪、设备计算机、visualvisual studiostudio 20082008、分析用数据、数据库服务四、实验步骤准备工作:三国志 4 4武将数据.xls.xls数据导入数据库中。(1 1) 打开visualvisual studiostudio 20082008,新建项目,选择 商业智能项目,analysisanalysis servicesservices项目实用文案标准文档(2

2、(2 )在解决方案资源管理器中,右键单击数据源,选择新建数据源欢迎使用数据源向导使用砒向导刨建新数据源数据谓表示到数据的连接数据源不提供绘存元數据、睡力谀粟.忝加计斬添加拙注尊功能.若要对數据 源应用这些功电住洁厦用此向导来创逹数轅源撚后使用数据頑视图向导来创連 包含相应功能的视图.图2 2数据源向导(4(4)在服务器名中填写要连接的数据库服务器名称,或者单击服务器名右方下拉按钮进行选择;勾选使用windowswindows 身份验证;选择或输入一个数据库名中填写将要分析数据所在的数据库或者单击右方下拉按钮进行选择图3 3新建数据源新建,进行数据源具体设置在该界面中选择实用文案标准文档图4 4

3、数据源具体设置(5(5 )确定后配置完的数据源已显示在窗口上,继续下一步图5 5完成数据源具体设置实用文案标准文档(6(6) 勾选使用服务账户,继续下一步图6 6模拟信息设置(7(7) 数据源名称 保持默认,完成图7 7完成数据源设置向导(8(8)在解决方案资源管理器中,右键单击数据源视图,选择新建数据源视图实用文案标准文档一回区欢迎使用数据源视图向导擁用此向导创逹新的数据源视图从关系数蹇库的裏和视團中创建数据理视5L数据源摄供与关茅数据璋的简单疲可以便用数誓懣視卿行更售高鐵功能, 如缓存元数据、浦加关系、创建十算和设養逻辑键.图8 8数据源视图向导图9 9选择数据源图1111选择包含对象实用

4、文案标准文档(11(11 )默认名称,完成实用文案标准文档图1212完成数据源视图向导(12(12 )在解决方案资源管理器中,右键单击挖掘结构,选择新建挖掘结构图1313数据挖掘向导(13(13)勾选从现有关系数据库或数据仓库,继续下一步图1414选择定义方法(14(14)选择microsoftmicrosoft 决策树,继续下一步实用文案标准文档图1515创建数据挖掘模型结构(15(15 )下一步图1616选择数据源视图(16(16)勾选事例,继续下一步% 指定表类型搭定斡析旺要使月的表类型.辖入表:表事例最卷!三国志4$s口图1717指定表类型(17(17)在键列勾选序号码,在输入列勾选出

5、身、国别、魅力、统御、武力、政治、智慧、忠诚,在可预测列勾选身份,继续下一步实用文案标准文档士却甫陡諭亍枫i瞅容抿洪揺K韋逆图1818指定定型数据(18(18 )下一步r民数燔挖娠向寻叵区T指定列的商容和数掘芙型扌匪疙据结枸列旳内君租钗琶类坐.栓測恣報据挖幄向导指定定型数据指走分胖中声用的列.挖掘嘎型洁构电谴 回输入回可,.*出身国别名称编武御力 0 总据複型结椅:实用文案标准文档图1919指定内容和数据类型(19(19 )勾选允许钻取,完成燿報盘椅振向导口区主卓向导为挖掘皓构提供名秫,小而兗成数爵挖扼向寻./图2121完成数据挖掘向导(20(20)单击挖掘模型查看器烏别士wmwm丈号注M M

6、 1 1 出1S1S身浙武手攻暫 謎列归辺门羁罚J J口JV.1JV.1 三:朮许硼(D-实用文案标准文档丈件蝙矩堪)视陽世)顶目1 数据源观图6)挖掘模型工具0)主成调诃Q1) ) 窗口世)社区福式Q)数站库帮助QD二国志4$ (.三国志4.设计Ifelt. dsv 设计-三国志4丄解决方案费训一 一工X_、忡TB牡姑屋性1 X三国吉电 Minirktrutur-門宇母廻序币11志laa e捋定对象名称.Development ?号穴田-亠码身别力悅御力号洽慧 出国魅身塩武序政智3 3挖 %挖抡搭,黑S锻Ir?B- 数誓源*Hxk” ds-数堀诱视因*0 Hath, ilsv &爹竝数富集

7、|&雖度9= n葛错误列表 就诸图2222完成设置(21(21 )询问是否部署项目,是图2323部署项目(22(22 )询问是否继续,是licrGsoft Vi?ual Studio数曙昼实用文案标准文档(24(24 )待处理完成后,关闭-二、F陀枉世二1皿寓厂力訂伸“讥 土二期朮度“三圍3 就将羁#处理Rril站議.id 3对茎锻数JS浪“唇亡“按妊巴越兗感 ” 刑ft时1弓20Mf-fl 9 IT T:TW 炉超期问】伽00-U羽廉凰值幻門CwXWl为P的址理S利応农*图2626处理结果(25(25)关闭处理窗口后,就可在 挖掘模型查看器 的决策树中看到系统经过分析得出的结果图2424处理

8、模型(23(23 )单击运行图2525运行挖掘项目-健理堆虞口叵| X-% C记區沽怙三目注L I?址理三禹吐盒云.毎如I4i4 9T:SG:耀腕间:2血-12-4 勺:対:船:号納司:0:00:13实用文案标准文档W3 士 備计】 毗加rAi+J記*商ME刪M |乓EilC刑二仰舉币*胃石舉|闵民础tEEEPEB何划Fl剧_ G1 3声用轉瓯柠n灯L-JF瞅关斥/1 画商:島冊爭乩扩呻m 1切釧HT5E & *丨*1旦亍耶列1图2727分类关系图依赖关系网络:图2727分类剖面图式力匸 IM.I 加 hl7a_ t$UD-所有粧接司 15T 回年闻 #1够 11刁二諛厲誤7M宗计;泪BSrf

9、flFl* 实用文案标准文档(26(26 )在挖掘模型中,右键单击挖掘模型可以设置算法参数实用文案标准文档三阖兴i 4 般计J总h dsv 设计捏躺閲gie册揃|入初5移勿|止 锤型査着黑|厨iae椎确性si熹卫审丹XItD设BTtt怎枣数區)Ici,X ifl辭 恥矚性()图2828算法参数(2727 )算法参数的意义COMPLEXITY_PENALTY:COMPLEXITY_PENALTY:禁止决策树生长。减少此值会增加拆解的可能性,而增加此值则 会减少拆解的可能性。FORCE_REGRESSOR:FORCE_REGRESSOR:强制算法使用的数据行作为回归公式的回归输入变量,而不考虑其在

10、算法计算中的重要性为何。MAXIMUMAXIMU M MN N PUT_ATTRIBUTES:PUT_ATTRIBUTES:指定在叫用功能选项之前,算法可以处理输入属性的最大数目。MAXIMUM_OUTPUT_ATTRIBUTES:MAXIMUM_OUTPUT_ATTRIBUTES:指定在叫用功能选项之前,算法可以处理输出属性的最大数目。MINIMUM_SUPPORT:MINIMUM_SUPPORT:指定分叶节点必须包含的最小个例数目SCORE_METHOD:SCORE_METHOD:指定用来计算分割准则的方法。SPLITSPLIT METHOD:METHOD:指定用来节点分杈的模式。.tn7

11、dJJtl处理把鵬 构和州有植擀 处理頂駐.记配鎳型 邸巡挹掘桶型.实用文案标准文档图2929设置算法参数(28(28 )设定完算法后,再次点击 挖掘模型查看器 进行数据处理,处理完成后所得出的结果就是设置算法后的结果。算法養數(參数值默认值応園1COMPLEXITY PENALTY- -1- -MIHIMUM SUFPORT10.0 0,.)SCDSZ METHOD41.3,4SFLJ TJETHDD31,3实用文案标准文档五、实验心得体会通过这次关于决策树的实验,让我对决策树的应用有了相对具体的理解,并且为决策树的学习提供了一个好的铺垫,在学习过程中,决策树中的算法由于利用系统本身,所以并

12、没有具体理解ID3ID3这个算法的具体运转环节,但是有了这次实验的铺垫,使自己能 够更加容易之后的ID3ID3算法的学习。六、思考题决策树对数据分类的正确率是否可以达到100%100% ?答:不可以达到100%100%决策树一般都是自上而下来生成的。决策树由一个决策图和可能的结果(包括资源成本和风险)组成,用来创建到达目标的规划。每个决策或事件都可能引出两个或多个事件,导 致不同的结果,把这种决策分支画成图形很像一棵树的枝干,所以称作决策树。对于那些各类别样本数量不一致的数据,在决策树当中信息增益的结果偏向于那些具有更多数值的特征。决策树的这种明确性可能带来误导。决策树分类准确率极限理论:定理1 1:有经验风险和结构风险时,决策树分类准确率的极限不存在。定理2 2 :无经验风险、有结构风险时,决策树分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论