




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、P2509了L1,L3,L5,L9,L11a)b)包含145,158,458P250 10P250 10123和126123126P250 10134,234和245123126134234245P250 10346126346123134234245P250 10456126346123245234456134P250 103个内节点5个叶节点126346123245234456134P250 11P250110.50.70.50.90.60.40.20.60.30.20.40.40.30.50.40.10.40.20.10.20.20.10.10.40.1000.10.10.1P122 7
2、P122 7a) 未分类时,错误率为选A划分选择A选B划分选C划分P122 7对A=Fb) 第一属性按A分类后,对于A=T的均为+ 例,不需要再划分选B划分选择B选C划分c) 最终错误实例为20个P122 7d) 第一属性按C分类后,与前述相同,进行计算对于C=T子树,选择A;对于C=F子树,选择B 最终错误率为0e) 贪心算法总是得到局部最优,并不能保证最终的树最优。P122 8P1228a)b)c)5/10 = 0.5(5+4*0.5)/10 = 0.71/5 = 0.2P122 9P122 916个二元属性:4bit编码3个类:2bit编码a)总开销:2x4+3x2+7logn= 14+
3、7lognb)总开销:4x4+5x2+4logn= 26+4lognn < 16 时,a好n >16 时,b好关联规则𝑐𝑏, 𝑑𝑒𝑐( 𝑒𝑏, 𝑑 )可以看出置信度不是对称的度量𝑐𝑏, 𝑑𝑒𝑐( 𝑒𝑏, 𝑑 )不存在关系𝜎(𝐴)𝜎(𝐴)𝑐 Ү
4、60;= 𝑠 𝐴𝜎()𝑁𝜎(𝐴)𝑐𝐴 = 1𝜎(𝐴)𝜎(𝑝, 𝑞)𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞, 𝑟)c1 =c1 =c2 =𝜎(𝑝)𝜎(𝑝, 𝑟)𝜎(ү
5、01;)𝜎(𝑝, 𝑞) 𝜎(𝑝, 𝑞, 𝑟),则c1 c2𝜎(𝑝) 𝜎(𝑝, 𝑟),则c3 c2规则 𝑝𝑞, 𝑟 的置信度最低支持度𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞, 𝑟)𝜎(𝑝, 𝑞
6、)𝑠2 =𝑠3 =s1 =𝑁𝑁𝑁s1 = s2 = s3,则𝜎(𝑝, 𝑞) = 𝜎(𝑝, 𝑞, 𝑟),c1= 𝑐2又𝜎(𝑝) 𝜎(𝑝, 𝑟),则c3 c2故c3 c2 = c1,规则 𝑝, 𝑟𝑞 的置信度最高可能,取决于A,B,C的支持度假如s(A)=0.8,s(
7、B)=0.7,s(C)=0.6,S(𝐴 𝐵)=0.6,S(B 𝐶)=0.5,S(𝐴 𝐶)=0.3Minconf=0.5则𝑐 𝐴 𝐵 =0.75>𝑚𝑖𝑛𝑐𝑜𝑛𝑓𝑐 𝐵 𝐶 =0.71>𝑚𝑖𝑛𝑐𝑜𝑛w
8、891;𝑐 𝐴 𝐶 =0.375< 𝑚𝑖𝑛𝑐𝑜𝑛𝑓证明:假设规则左部为k,则有种选择方法,此时右部有种选择方法()则总的方法数为:𝑑= 𝑑()2𝑑𝑘𝑑 2 -𝑘=0𝑘分类每一个顾客ID的Gini=0,总的Gini=0结点:Gini = 1 0.62 0.42 = 0.48女性结点:Gini = 1 0.42 0.62 =
9、 0.48:Gini = 0.5 × 0.48 + 0.5 × 0.48 = 0.482213家用:Gini = 1 ( ) ( ) = 0.37544运动:Gini = 0豪华:Gini = 1 221878= 0.21875488车型: Gini =× 0.375 +× 0 +× 0.21875 =0.16252020202232小:Gini = 1 ( ) ( ) = 0.48552234中:Gini = 1 ( ) ( ) = 0.4898727= 0.52= 0.521212大:Gini = 1 2112加大:Gini = 1 2574420衬衣尺码: Gini =× 0.48 +× 0.4898 +× 0.5 +× 0.5 =0.4914202020车型属性具有最小的Gini值,最好因为对于新的顾客,其ID也是新的,即顾客ID属性没有能力证明:设有c个类别:属性X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 眼镜儿童视力保护考核试卷
- 竞争力提升与造价咨询合同
- 第三方数据共享平台的安全认证与准入考核试卷
- 电话销售中的压力管理策略考核试卷
- 电子设备展会销售考核试卷
- 高级词汇作文课件
- 肉制品加工业的食品安全管理与控制技术研究考核试卷
- 游艺器材的防水防潮技术考核试卷
- 经纪人如何整合艺人宣传资源与推广渠道考核试卷
- 蒙台梭利教育学思想解析
- 电台项目可行性研究报告
- 2025年度事业单位招聘考试公共基础知识仿真模拟试卷及答案(共五套)
- 2025年广西壮族自治区南宁市中考一模生物试题(含答案)
- 长江流域大水面生态渔业的发展现状与发展潜力分析
- SQLSERVER如何配置内存提高性能配置方案
- 电视台影视拍摄合同协议
- 装配式建筑技术创新与可持续发展-全面剖析
- 装饰公司结算管理制度
- 实习生顶岗实习安全教育
- 网络灾难恢复计划试题及答案
- 物业五一节前安全教育
评论
0/150
提交评论