属性数据分析第五章课后答案_第1页
属性数据分析第五章课后答案_第2页
属性数据分析第五章课后答案_第3页
属性数据分析第五章课后答案_第4页
属性数据分析第五章课后答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

属性数据分析第五章课后作业属性数据分析第五章课后作业 6 为了解男性和女性对两种类型的饮料的偏好有没有差异 分别在年青人和老 年人中作调查 调查数据如下 偏好饮料 A偏好饮料 B 男性 3726 年青人 女性 1123 男性 3043 老年人 女性 3111 试分析这批数据 关于男性和女性对这两种类型的饮料的偏好有没有差异的问 题 你有什么看法 为什么 解 解 1 1 数据压缩分析 数据压缩分析 首先将上表中不同年龄段的数据合并在一起压缩成二维 2 2 列联表 1 1 合起来看 分析男性和女性对这两种类型的饮料的偏好有没有差异 表 1 1 性别 偏好饮料 列联表 偏好饮料 A偏好饮料 B合计偏好 A 比 例 偏好 B 比 例 男性 676913649 26 50 74 女性 42347655 26 44 74 二维 2 2 列联表独立检验的似然比检验统计量的值为 0 7032 ln2 值为 不应拒绝原假设 即认为 偏好p05 0 4017 0 7032 0 1 2 Pp 类型 与 性别 无关 2 2 数据分层分析 数据分层分析 其次 按年龄段分层 得到如下三维 2 2 2 列联表 1 2 分开来看 男 性和女性对这两种类型的饮料的偏好有没有差异 表 1 2 三维 2 2 2 列联表 偏好饮料 A 偏好饮料 B 合计偏好 A 比 例 偏好 B 比 例 男性 372663 58 73 41 27 年青人 女性 112334 32 35 67 65 老年人男性 304373 41 10 58 90 女性 311142 73 81 26 19 在上述数据中 分别对两个年龄段 即年青人和老年人 进行饮料偏好的 调查 在 年青人 年龄段 男性中偏好饮料 A 占 58 73 偏好饮料 B 占 41 27 女性中偏好饮料 A 占 58 73 偏好饮料 B 占 41 27 我们可以得出 在这个年龄段 男性和女性对这两种类型的饮料的偏好有一定的差异 同理 在 老年人 年龄段 也有一定的差异 3 3 条件独立性检验 条件独立性检验 为验证上述得出的结果是否可靠 我们可以做以下的条件独立性检验 即由题意 可令表示年龄段 表示年青人 表示老年人 表示性别 C 1 C 2 CD 表示男性 表示女性 表示偏好饮料的类型 表示偏好饮料 1 D 2 DE 1 EA 表示偏好饮料 欲检验的原假设为 给定后和条件独立 2 EBCDE 按年龄段分层后得到的两个四格表 以及它们的似然比检验统计量的值 ln2 如下 层 1 C层 2 C 822 11ln2 248 6 ln2 条件独立性检验问题的似然比检验统计量是这两个似然 比检验统计量的和 其值为 07 18822 11248 6 ln2 由于 所以条件独立性检验的似然比检验统计量的渐近分布的2 tcr 2 自由度为 也就是上面这 2 个四格表的渐近分布的自由度的2 1 1 tcr 2 和 由于值很小 所以认为条件独立性不成立 p50 00011916 07 18 2 2 P 即在年龄段给定的条件下 男性和女性对两种类型的饮料的偏好是有差异的 4 4 产生偏差的原因 产生偏差的原因 1 E 2 E 合计 1 D 372663 2 D 112334 合计 484997 1 E 2 E 合计 1 D 304373 2 D 311142 合计 6154115 a 在 1 中 将不同年龄段的数据压缩在一起合起来后分析发现男性和女性 在对两种类型的饮料的偏好上是没有差异的 但将数据以不同的年龄段分层后 并分别分析发现男性和女性在对两种类型的饮料的偏好上是有一定差异的 合 起来看和分开来看的结果不同 b 由此看来 年龄段在此次调查中属于混杂因素 由于不同年龄段的人对饮料 的选择也会有差异 例如现在的年青人偏好喝一些像可口可乐 美年达等这样 的碳酸饮料 而老年人则偏好喝一些红茶 绿茶等这样的非碳酸饮料 在调查 中 老年人 年龄段共有 115 人 所占比例大 从而使整个结果就倾向于老年 人的观点 即使得混杂因素 年龄段 起到一定的干扰作用 从而导致整个调 查结果产生了偏差 8 某工厂有三个车间 车间主任分别为王 张和李 过去的一年里 该工厂产 品的质量情况总结如下 产品质量情况 车间主任产品类别 合格产品数不合格产品数 产品总数 内销 23681312499 王 外销 12381204 内销 2933296 张 外销 12472551502 内销 30712319 李 外销 35975434 王主任将内销和外销产品合并在一起 然后计算各个车间的不合格率 计算结 果如下 产品质量情况 主任 合格产品数不合格产品数 不合格率 王 24912127 84 张 154025814 35 李 6668711 55 王主任说 我负责的车间生产情况最好 其次是李主任负责的车间 最差的是 张主任负责的车间 这样的比较是不是有偏比较 为什么 解 解 不是 有偏比较是指将数据压缩后合起来看与分层后分开来看得出的结果 不一致时所产生的偏差 而此题只是将数据压缩起来后相互间比较 因此这样 的比较不是有偏比较 具体分析如下 由题知 分析车间主任与产品的质量情况之间的关系 则本题是以产品类别为 层 以车间主任为行 产品的质量情况为列进行相关分析 1 1 数据压缩分析 数据压缩分析 首先将上表中不同产品类别的数据合并在一起压缩成二维 3 2 列联表 2 1 合起来看 分析车间主任与产品的质量情况两者之间的关系 表 2 1 车间主任 产品质量 列联表 产品质量情况 主任 合格产品数不合格产品数 不合格率 王 24912127 84 张 154025814 35 李 6668711 55 可计算出该表独立性检验的似然比检验统计量的值为 48 612 值为 ln2p 应该拒绝原假设 即认为车间主任与产品的质量0 612 48 2 2 Pp 情况两者是有一定相关性的 2 2 数据分层分析 数据分层分析 其次 按产品类别分层 得到如下三维 2 3 2 列联表 2 2 分开来看 分析 车间主任与产品的质量情况两者之间的关系 表 1 2 三维 2 2 2 列联表 产品的质量情况 产品类别车间主任 合格产品数不合格产品数 不合格率 王 2368131 5 24 张 2933 1 01 内销 李 30712 3 76 王 12381 39 71 张 1247255 16 98 外销 李 35975 17 28 在上述数据中 分别对两个产品类别 即内销和外销 进行分析 在 内 销 类别中 王姓主任车间的产品不合格率最高 即车间生产情况最差 张姓 主任车间的不合格率最低 即车间生产情况最好 在 外销 类别中 王姓主 任车间的产品不合格率最高 即车间生产情况最差 张姓和李姓主任车间生产 情况差不多 3 3 条件独立性检验 条件独立性检验 为验证上述得出的结果是否可靠 我们可以做以下的条件独立性检验 即由题意 可令表示产品类别 表示内销 表示外销 表示车间主A 1 A 2 AB 任 表示王姓主任 表示张姓主任 表示李姓主任 表示产品的质 1 B 2 B 3 BC 量情况 表示合格产品数 表示不合格产品数 欲检验的原假设为 给 1 C 2 CA 定后和条件独立 BC 按产品类别分层后得到的两张表格 以及它们的似然比检验统计量的值 ln2 如下 层 1 A 1 C 2 C 合计 1 B 23681312499 2 B 2933296 3 B 30712319 合计 29681463114 289 15ln2 层 2 A 1 C 2 C 合计 1 B 12381204 2 B 12472551502 3 B 35975434 合计684 51ln2 条件独立性检验问题的似然比检验统计量是这两个似然比检验统计量的和 其 值为 973 66684 51289 15ln2 由于 所以条件独立性检验的似然比检验统计量的渐近分布3 2 rtc 2 的自由度为 也就是上面这 2 个表格的渐近分布的自由度3 1 1 tcr 2 的和 由于值很小 所以认为条件独立性不成立 即p0 973 66 3 2 P 在产品类别给定的条件下 车间主任与产品的质量情况两者是有一定相关性的 4 4 结论 结论 在 1 中 将不同产品类别的数据压缩在一起合起来后分析发现车间主任 与产品的质量情况两者是有一定相关性的 在 2 中 将数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论