已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 2独立性检验的基本思想及其初步应用 1 分类变量和列联表 1 分类变量变量的不同 值 表示个体所属的 像这样的变量称为分类变量 不同类别 2 列联表 定义 列出的两个分类变量的 称为列联表 2 2列联表 一般地 假设有两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 频数表 2 等高条形图 1 等高条形图和表格相比 更能直观地反映出两个分类变量间是否 常用等高条形图展示列联表数据的 2 观察等高条形图发现 和 相差很大 就判断两个分类变量之间有关系 相互影响 频率特征 3 独立性检验 临界值k0 观测值k k k0 犯错误的概率 没有发现足够证据 1 判一判 正确的打 错误的打 1 事件a与b的检验无关 即两个事件互不影响 2 事件a与b关系越密切 k2就越大 3 k2的大小是判断事件a与b是否相关的唯一数据 解析 1 错误 事件a与b的检验无关 只是说事件的相关性较小 并不一定两事件互不影响 2 正确 由k2的意义易知此说法正确 3 错误 判断a与b是否相关的方式很多 可以用列联表 也可以借助图形或概率运算 答案 1 2 3 2 做一做 请把正确的答案写在横线上 1 统计中有一个非常有用的统计量k2 在2 2列联表中它的表达式是 2 在独立性检验中 选用k2作统计量 当k2满足条件时 在犯错误的概率不超过0 010的前提下认为事件a与b有关 3 式子 ad bc 越大 k2的值就越 填大或小 解析 1 在2 2列联表中k2 答案 k2 2 当k2 6 635时在犯错误的概率不超过0 010的前提下认为a与b有关系 答案 k2 6 635 3 由k2的表达式知 ad bc 越大 ad bc 2就越大 k2就越大 答案 大 要点探究 知识点1分类变量对 分类变量 的三点说明 1 这里的 变量 和 值 都应作为 广义 的变量和值进行理解 例如 对于性别变量 其取值为男和女两种 那么这里的变量指的是性别 同样这里的 值 指的是 男 和 女 因此 这里所说的 变量 和 值 不一定取的是具体的数值 2 分类变量是大量存在的 例如 吸烟变量有吸烟与不吸烟两种类别 而国籍变量则有多种类别 3 注意区分分类变量与定量变量的不同 如身高 体重 考试成绩等就是定量变量 它们的取值一定是实数 并且取值大小有特定的含义 微思考 分类变量只有两个 取值 吗 提示 不是 有些分类变量取值有很多 但本节只研究只有两个 取值 的分类变量 即时练 下列不是分类变量的是 a 近视b 身高c 血压d 药物反应 解析 选b 判断一个量是否是分类变量 只需看变量的不同值是否表示个体的不同类别 a c d选项的不同值都可以表示个体的不同类别 只有b选项的不同值不表示个体的不同类别 知识点2等高条形图与独立性检验1 等高条形图和独立性检验的特点 1 通过等高条形图 可以粗略地判断两个分类变量是否有关系 但是这种判断无法精确地给出所得结论的可靠程度 2 利用独立性检验来判断两个分类变量是否有关系 能够精确地给出这种判断的可靠程度 也常与图形分析法结合 2 独立性检验与反证法的异同点 1 思想类似 独立性检验的思想来自于统计学的假设检验思想 它与反证法类似 假设检验和反证法都是先假设结论不成立 然后根据是否能够推出 矛盾 来断定结论是否成立 2 矛盾 的含义不同 反证法中的 矛盾 是指不符合逻辑的事件的发生 而假设检验中的 矛盾 是指不符合逻辑的小概率事件的发生 即在结论不成立的假设下 推出利用结论成立的小概率事件的发生 知识拓展 临界值表当k 10 828 即在犯错误的概率不超过0 001的前提下认为 x与y有关系 当k 7 879 即在犯错误的概率不超过0 005的前提下认为 x与y有关系 当k 6 635 即在犯错误的概率不超过0 010的前提下认为 x与y有关系 当k 5 024 即在犯错误的概率不超过0 025的前提下认为 x与y有关系 当k 3 841 即在犯错误的概率不超过0 05的前提下认为 x与y有关系 当k 2 706 即在犯错误的概率不超过0 1的前提下认为 x与y有关系 当k 2 706 即认为没有充分的证据显示 x与y有关系 像这样利用随机变量k2的观测值k来确定在多大程度上可以认为 两个分类变量有关系 的方法称为两个分类变量的独立性检验 微思考 1 k2 6 635是指两个分类变量有关系的概率为99 这种理解正确吗 提示 不正确 k2 6 635是指两个分类变量有关系这一结论成立的可信度为99 而不是有关系的概率为99 2 等高条形图与列联表相比有何优点 提示 更直观 更明了 即时练 1 对于分类变量x与y的随机变量k2的观测值k 下列说法正确的是 a k越大 x与y有关系 的可信程度越小b k越小 x与y有关系 的可信程度越小c k越接近于0 x与y没有关系 的可信程度越小d k越大 x与y没有关系 的可信程度越大 解析 选b k越大 x与y没有关系 的可信程度越小 则 x与y有关系 的可信程度越大 k越小 x与y有关系 的可信程度越小 2 为研究服用某种维生素对婴儿头发稀疏或稠密的影响 调查了120名婴儿 其中服用维生素的婴儿有60人 头发稀疏的有5人 不服用维生素的婴儿有60人 头发稀疏的有46人 由以上数据作出列联表 解析 根据题中所给数据得到的列联表如下 题型示范 类型一等高条形图的应用 典例1 1 观察下列各图 其中两个分类变量x y之间关系最强的是 2 2014 青岛高二检测 某学校对高三学生作了一项调查发现 在平时的模拟考试中 性格内向的学生426人中332人在考前心情紧张 性格外向的学生594人中有213人在考前心情紧张 作出等高条形图 利用图形判断考前心情紧张与性格类别是否有关系 解题探究 1 题 1 中的等高条形图中的什么特征能确立分类变量间的关系的强弱 2 题 2 中等高条形图是用什么来说明问题的 利用该图形得到的结论可靠吗 探究提示 1 依靠数形结合 观察图中两个条形的阴影差距 差距越大 两个分类变量之间的关系越强 2 等高条形图是用数据所占的百分比来说明问题的 所得结论可靠但无法精确给出所得结论的可靠程度 自主解答 1 选d 在四幅图中 选项d的图中两个深色条的高相差最明显 说明两个分类变量之间的关系最强 2 作列联表如下 相应的等高条形图如图所示 图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例 从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大 可以认为考前紧张与性格类型有关 方法技巧 利用等高条形图判断两个分类变量是否相关的步骤 变式训练 为了研究成绩与班级的关系 现对某中学同一个数学老师所教的高二年级的两个班级的期中数学考试成绩按照成绩优秀 不优秀进行了统计 得到如下列联表 画出列联表的等高条形图 并判断成绩与班级是否有关 解析 如图所示 从等高条形图可以看出甲班的优秀生比例稍高于乙班 但相差不大 从图中可以看出甲班的优秀生的频率与乙班的优秀生的频率相差不大 因此可以认为班级与成绩关系不大 补偿训练 打鼾不仅影响别人休息 而且还可能与患某种疾病有关 在某一次调查中 其中每一晚都打鼾的254人中 患心脏病的有30人 未患心脏病的有224人 在不打鼾的1379人中 患心脏病的有24人 未患心脏病的有1355人 利用图形判断打鼾与患心脏病是否有关 解析 根据题意得到如下列联表 相应的等高条形图如图 图中两个深色条的高分别表示每一晚都打鼾和不打鼾的人中患心脏病的频率 从图中可以看出 每一晚都打鼾样本中患心脏病的频率明显高于不打鼾样本中患心脏病的频率 因此可以认为打鼾与患心脏病有关系 类型二独立性检验 典例2 1 2014 台州高二检测 在独立性检验中 统计量k2有三个临界值 2 706 3 841和6 635 当k2 3 841时 在犯错误的概率不超过0 05的前提下说明两个事件有关 当k2 6 635时 在犯错误的概率不超过0 01的前提下说明两个事件有关 当k2 2 706时 认为两个事件无关 在一项打鼾与患心脏病的调查中 共调查了2000人 经计算k2 20 87 根据这一数据分析 认为打鼾与患心脏病之间 a 在犯错误的概率不超过0 05的前提下认为两者有关b 约有95 的打鼾者患心脏病c 在犯错误的概率不超过0 01的前提下认为两者有关d 约有99 的打鼾者患心脏病 2 2014 执信高二检测 某食品厂为了检查甲乙两条自动包装流水线的生产情况 随机在这两条流水线上各抽取40件产品作为样本称出它们的质量 单位 克 质量值落在 495 510 的产品为合格品 否则为不合格品 表1是甲流水线样本频数分布表 图1是乙流水线样本频率分布直方图 表1甲流水线样本频数分布表 图1乙流水线样本频率分布直方图 根据上表数据作出甲流水线样本频率分布直方图 若以频率作为概率 试估计从两条流水线分别任取1件产品 该产品恰好是合格品的概率分别是多少 由以上统计数据作出2 2列联表 并回答在犯错误的概率不超过多少的前提下认为 产品的包装质量与两条自动包装流水线的选择有关 解题探究 1 题 1 中判断给出的两个分类变量有关的主要依据是什么 2 题 2 中 作频率分布直方图的主要步骤是什么 中求合格品的概率关键是什么 计算k2的观测值的关键是什么 探究提示 1 主要依据是把k2的值与临界值比较 明确k2的具体含义 2 确立好组距及频率然后作图 正确理解概率与频率的关系 求出合格品的频率 关键是作出2 2列联表 找出各量对应的值 然后代入公式计算 自主解答 1 选c 因为k2 20 87 6 635 根据p k2 6 635 0 01可知 在犯错误的概率不超过0 01的前提下认为打鼾与患心脏病有关 2 甲流水线样本频率分布直方图如下 由表1知甲样本合格品数为8 14 8 30 由图1知乙样本中合格品数为 0 06 0 09 0 03 5 40 36 故甲样本合格品的频率为 0 75 乙样本合格品的频率为 0 9 据此可估计从甲流水线任取1件产品 该产品恰好是合格品的概率为0 75 从乙流水线任取1件产品 该产品恰好是合格品的概率为0 9 2 2列联表如下 因为k2的观测值k 所以在犯错误的概率不超过0 1的前提下认为产品的包装质量与两条自动包装流水线的选择有关 延伸探究 在题 2 条件不变的情况下 画出等高条形图 解析 方法技巧 解决一般的独立性检验问题的步骤 变式训练 2013 福建高考 某工厂有25周岁以上 含25周岁 工人300名 25周岁以下工人200名 为研究工人的日平均生产量是否与年龄有关 现采用分层抽样的方法 从中抽取了100名工人 先统计了他们某月的日平均生产件数 然后按工人年龄在 25周岁以上 含25周岁 和 25周岁以下 分为两组 再将两组工人的日平均生产件数分为5组 50 60 60 70 70 80 80 90 90 100 分别加以统计 得到如图所示的频率分布直方图 1 从样本中日平均生产件数不足60件的工人中随机抽取2人 求至少抽到一名 25周岁以下组 工人的概率 2 规定日平均生产件数不少于80件者为 生产能手 请你根据已知条件完成2 2列联表 并判断能否在犯错误的概率不超过0 1的前提下认为 生产能手与工人所在的年龄组有关 解析 1 由已知得 样本中有25周岁以上组工人60名 25周岁以下组工人40名 所以 样本中日平均生产件数不足60件的工人中 25周岁以上组工人有60 0 05 3 人 记为a1 a2 a3 25周岁以下组工人有40 0 05 2 人 记为b1 b2 从中随机抽取2名工人 所有可能的结果共有10种 即 a1 a2 a1 a3 a2 a3 a1 b1 a1 b2 a2 b1 a2 b2 a3 b1 a3 b2 b1 b2 其中 至少抽到一名 25周岁以下组 工人的可能结果共有7种 是 a1 b1 a1 b2 a2 b1 a2 b2 a3 b1 a3 b2 b1 b2 故所求概率p 2 由频率分布直方图可知 在抽取的100名工人中 25周岁以上组 中的生产能手有60 0 25 15 人 25周岁以下组 中的生产能手有40 0 375 15 人 据此可得2 2列联表如下 所以得 k2 因为1 79 2 706 所以不能在犯错误的概率不超过0 1的前提下认为 生产能手与工人所在的年龄组有关 补偿训练 现对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究 调查他们是否又发作过心脏病 调查结果如表所示 试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别 解题指南 解答本题时应先利用公式k2 求出k2的观测值 再利用临界值的大小关系来判断假设是否成立 解析 根据列联表中的数据 可以求得k2的观测值所以不能得出这两种手术对病人又发作心脏病的影响有差别的结论 规范解答 独立性检验的综合应用 典例 12分 2014 沈阳高二检测 为调查某生产线上某质量监督员甲对产品质量的好坏有无影响 现统计数据如下 质量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑施工安全合同
- 2025商业办公楼租赁合同撤销协议书
- 2025建筑工程项目预拌混凝土采购合同
- 2025公司间借款合同模板
- 2025劳动合同范本全面版广州市
- 2025委托开发合同范式
- 2025青少年活动中心场地租赁合同
- 2025租房合同范本+续签
- 塔里木职业技术学院《儿童发展与学习》2024-2025学年第一学期期末试卷
- DB11T 1107-2014 生活垃圾焚烧厂运行管理规范
- 2025年食品安全管理员考试题库(附答案)
- 2025中国大唐集团新能源股份有限公司本部应届毕业生招聘笔试历年常考点试题专练附带答案详解2套试卷
- 2025四川广安投资集团有限公司第一次招聘工作人员18人笔试考试参考试题及答案解析
- 2025四川南充市嘉陵城市发展集团有限公司招聘10人笔试历年参考题库附带答案详解
- 2025年广西信息职业技术学院辅导员招聘考试笔试模拟试题及答案解析推
- 2023-2024学年山东省济南市历城区六年级(上)期中数学试卷
- 云南文山州州属事业单位选调考试真题2022
- 晋升中学高级教师职称考试试卷
- GB/T 5625.1-1985扩口式端直通管接头
- GB/T 28775-2021同步带传动T型梯形齿同步带轮
- 学校心理健康排查表
评论
0/150
提交评论