数据挖掘期末考试计算题及答案.pdf_第1页
数据挖掘期末考试计算题及答案.pdf_第2页
数据挖掘期末考试计算题及答案.pdf_第3页
数据挖掘期末考试计算题及答案.pdf_第4页
数据挖掘期末考试计算题及答案.pdf_第5页
已阅读5页,还剩3页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题一: 一阶项目集 支持度 a 5 b 4 c 2 d 5 e 3 f 4 g 6 一阶频繁集 支持度 a 5 b 4 d 5 f 4 g 6 二阶候选集 支持度 ab 3 ad 4 af 2 ag 5 bd 3 bf 1 bg 3 df 3 dg 4 fg 3 二阶频繁集 支持度 ad 4 ag 5 dg 4 三阶候选集 支持度 adg 4 三阶频繁集 支持度 adg 4 题二 Distance(G,A)2=0.1; Distance(G,B)2=0.03; Distance(G,C)2=0.11 Distance(G,D)2=0.12; Distance(G,E)2=0.16; Distance(G,F)2=0.05 G 的三个最近的邻居为 B,F,A,因此 G 的分类为湖泊水 Distance(H,A)2=0.03; Distance(H,B)2=0.18; Distance(H,C)2=0.22 Distance(H,D)2=0.03; Distance(H,E)2=0.21; Distance(H,F)2=0.16 H 的三个最近的邻居为 A,D,F,因此 H 的分类为冰川水 题三 首先计算各属性的信息增益 Gain(Ca+浓度)=0 Gain(Mg+浓度)=0.185 Gain(Na+浓度)=0 Gain(Cl-浓度)=0.32 选择 Cl-浓度作为根节点 计算各属性的信息增益 Gain(Ca+浓度)=0 Gain(Mg+浓度)=0.45 Gain(Na+浓度)=0.24 选择 Mg+浓度作为节点 Cl-浓度 冰川水冰川水 ? 高 低 Cl-浓度 冰川水冰川水 Mg+浓度 高 低 高 低 ? 湖泊水湖泊水 计算各属性的信息增益 Gain(Ca+浓度)=0.24 Gain(Na+浓度)=0.91 题四 P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=冰川水)*P(冰 川水) =P(Ca+浓度=低 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度= 高| 类型=冰川水)* P(Cl-浓度=低 | 类型=冰川水) *P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468 高 低 Cl-浓度 冰川水冰川水 Mg+浓度 高 低 Na+浓度 湖泊水湖泊水 高 低 湖泊水湖泊水 冰川水冰川水 P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=湖泊水)*P(湖 泊水) =P(Ca+浓度=低 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度= 高| 类型=湖泊水)* P(Cl-浓度=低 | 类型=湖泊水) *P(湖泊水) =0.5*0.25*0.5*1*0.5=0.03123 第一个样本为冰川水 P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=冰川水)*P(冰 川水) =P(Ca+浓度=高 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度= 低| 类型=冰川水)* P(Cl-浓度=高 | 类型=冰川水) *P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468 P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=湖泊水)*P(湖 泊水) =P(Ca+浓度=高 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度= 低| 类型=湖泊水)* P(Cl-浓度=高 | 类型=湖泊水) *P(湖泊水) =0.5*0.25*0.5*0*0.5=0 第二个样本为冰川水 题五 A,B,C,D,E,F,G 之间的距离矩阵如下表 A B C D E F G A B 1 C 2 5 D 41 50 45 E 5 .42 5 .50 5 .48 5 . 0 F 25.28 25.36 25.31 25. 1 1.5 G 68 65 90 45 5 .36 25.46 根据距离矩阵建立的树如下 题六 第一次迭代以 A,B 作为平均点,对剩余的点根据到 A、B 的距离进行分配 A,C,D,E,F,G,H, B 计算两个簇的平均点 (6.5, 1.7), (4, 5) 第二次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇 D,E,F,H和A,B,C,G 计算两个簇的平均点 B C D A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论