独立性检验的基本思想及其初步应用幻灯片_第1页
独立性检验的基本思想及其初步应用幻灯片_第2页
独立性检验的基本思想及其初步应用幻灯片_第3页
独立性检验的基本思想及其初步应用幻灯片_第4页
独立性检验的基本思想及其初步应用幻灯片_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 2 独立性检验的基本思想及其初步应用 学习目标 1 了解分类变量 2 列联表的定义 3 等高条形图表示什么 自学指导 阅读课本p10页第1段 回答问题 1 什么是分类变量 问题情境 先从直观上来判断患肺癌与吸烟是否有关 思考 100 0 54 100 2 28 从以上数据可以得到结论 吸烟群体和不吸烟群体患肺癌的可能性存在差异 但是这个结论到底是否一定正确的呢 事实果真如此吗 我们能有多大把握认为 吸烟与患肺癌有关呢 1 列联表 2 三维柱形图 3 二维条形图 从三维柱形图能清晰看出各个频数的相对大小 从二维条形图能看出 吸烟者中患肺癌的比例高于不患肺癌的比例 列联表 定义 列出的两个分类变量的称为列联表 2 2列联表一般地 假设两个分类变量X和Y 它们的取值分别为和 其样本频数列联表 也称为2 2列联表 为下表 频数表 x1 x2 y1 y2 4 等高条形图 等高条形图更清晰地表达了两种情况下患肺癌的比例 等高条形图与表格相比 更能直观地反映出两个分类变量间是否互相影响 常用等高条形图展示列联表数据的频率特征 1 2 2列联表是传统的调查研究中最常用的方法之一 用于研究两个变量之间相互独立还是存在某种关联性 它适用于分析两个变量之间的关系 2 在实际问题中 判断两个分类变量的关系的可靠性时 一般利用随机变量K2来确定 而不利用三维柱形图和二维条形图 某企业为了考察同一种产品在甲 乙两条生产线的产品合格率 同时各抽取100件产品 其中甲线中合格产品的个数为97 乙线中合格产品的个数为95 请做出列联表 三维柱形图与二维条形图 练习 假设吸烟与患肺癌没有关系 那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即 独立性检验 用字母表示的列联表 独立性检验首先 假设结论不成立 即H 两个分类变量没有关系 在这种假设下k应该很小 其次 由观测数据计算K的观测值k 如果k很大 则在一定可信程度上说明H不成立 即两个分类变量之间有关系 最后 根据k的值判断假设是否成立 2 临界值表 这种判断可能有错误 但是犯错误的不会超过0 001 这是个小概率时间 我们有99 9 的把握认为 吸烟与患癌症有关系 k大小的标准是什么呢 独立性检验基本的思想类似反证法 1 假设结论不成立 即 两个分类变量没有关系 2 在此假设下随机变量K2应该很能小 如果由观测数据计算得到K2的观测值k很大 则在一定程度上说明假设不合理 3 根据随机变量K2的含义 可以通过评价该假设不合理的程度 由实际计算出的 说明假设合理的程度为99 9 即 两个分类变量有关系 这一结论成立的可信度为约为99 9 在吸烟与患肺病这两个分类变量的计算中 下列说法正确的是 A 若K的观测值为k 6 635 我们有99 的把握认为吸烟与患肺病有关系 那么在100个吸烟的人中必有99个患肺病B 从独立性检验可知有99 的把握认为吸烟与患肺病有关系时 我们说某人吸烟 那么他有99 的可能患肺病C 若从统计量中求出有95 的把握认为吸烟与患肺病有关系 是指有5 的可能性使得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论