资料机器学习rcise_第1页
资料机器学习rcise_第2页
资料机器学习rcise_第3页
资料机器学习rcise_第4页
资料机器学习rcise_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、P2509了L1,L3,L5,L9,L11a)b)包含145,158,458P250 10P250 10123和126123126P250 10134,234和245123126134234245P250 10346126346123134234245P250 10456126346123245234456134P250 103个内节点5个叶节点126346123245234456134P250 11P250110.50.70.50.90.60.40.20.60.30.20.40.40.30.50.40.10.40.20.10.20.20.10.10.40.1000.10.10.1P122 7

2、P122 7a) 未分类时,错误率为选A划分选择A选B划分选C划分P122 7对A=Fb) 第一属性按A分类后,对于A=T的均为+ 例,不需要再划分选B划分选择B选C划分c) 最终错误实例为20个P122 7d) 第一属性按C分类后,与前述相同,进行计算对于C=T子树,选择A;对于C=F子树,选择B 最终错误率为0e) 贪心算法总是得到局部最优,并不能保证最终的树最优。P122 8P1228a)b)c)5/10 = 0.5(5+4*0.5)/10 = 0.71/5 = 0.2P122 9P122 916个二元属性:4bit编码3个类:2bit编码a)总开销:2x4+3x2+7logn= 14+

3、7lognb)总开销:4x4+5x2+4logn= 26+4lognn < 16 时,a好n >16 时,b好关联规则𝑐𝑏, 𝑑𝑒𝑐( 𝑒𝑏, 𝑑 )可以看出置信度不是对称的度量𝑐𝑏, 𝑑𝑒𝑐( 𝑒𝑏, 𝑑 )不存在关系𝜎(𝐴)𝜎(𝐴)𝑐 Ү

4、60;= 𝑠 𝐴𝜎()𝑁𝜎(𝐴)𝑐𝐴 = 1𝜎(𝐴)𝜎(𝑝, 𝑞)𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞, 𝑟)c1 =c1 =c2 =𝜎(𝑝)𝜎(𝑝, 𝑟)𝜎(ү

5、01;)𝜎(𝑝, 𝑞) 𝜎(𝑝, 𝑞, 𝑟),则c1 c2𝜎(𝑝) 𝜎(𝑝, 𝑟),则c3 c2规则 𝑝𝑞, 𝑟 的置信度最低支持度𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞

6、)𝑠2 =𝑠3 =s1 =𝑁𝑁𝑁s1 = s2 = s3,则𝜎(𝑝, 𝑞) = 𝜎(𝑝, 𝑞, 𝑟),c1= 𝑐2又𝜎(𝑝) 𝜎(𝑝, 𝑟),则c3 c2故c3 c2 = c1,规则 𝑝, 𝑟𝑞 的置信度最高可能,取决于A,B,C的支持度假如s(A)=0.8,s(

7、B)=0.7,s(C)=0.6,S(𝐴 𝐵)=0.6,S(B 𝐶)=0.5,S(𝐴 𝐶)=0.3Minconf=0.5则𝑐 𝐴 𝐵 =0.75>𝑚𝑖𝑛𝑐𝑜𝑛𝑓𝑐 𝐵 𝐶 =0.71>𝑚𝑖𝑛𝑐𝑜𝑛w

8、891;𝑐 𝐴 𝐶 =0.375< 𝑚𝑖𝑛𝑐𝑜𝑛𝑓证明:假设规则左部为k,则有种选择方法,此时右部有种选择方法()则总的方法数为:𝑑= 𝑑()2𝑑𝑘𝑑 2 -𝑘=0𝑘分类每一个顾客ID的Gini=0,总的Gini=0结点:Gini = 1 0.62 0.42 = 0.48女性结点:Gini = 1 0.42 0.62 =

9、 0.48:Gini = 0.5 × 0.48 + 0.5 × 0.48 = 0.482213家用:Gini = 1 ( ) ( ) = 0.37544运动:Gini = 0豪华:Gini = 1 221878= 0.21875488车型: Gini =× 0.375 +× 0 +× 0.21875 =0.16252020202232小:Gini = 1 ( ) ( ) = 0.48552234中:Gini = 1 ( ) ( ) = 0.4898727= 0.52= 0.521212大:Gini = 1 2112加大:Gini = 1 2574420衬衣尺码: Gini =× 0.48 +× 0.4898 +× 0.5 +× 0.5 =0.4914202020车型属性具有最小的Gini值,最好因为对于新的顾客,其ID也是新的,即顾客ID属性没有能力证明:设有c个类别:属性X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论