高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23(2).ppt_第1页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23(2).ppt_第2页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23(2).ppt_第3页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23(2).ppt_第4页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23(2).ppt_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3 2独立性检验的基本思想及其初步应用 主题1列联表与等高条形图1 某班主任对全班50名学生作了一次调查 所得数据如表 喜欢玩电脑游戏的学生中认为作业多的所占的比例是多少 不喜欢玩电脑游戏的学生中认为作业多的呢 提示 喜欢玩电脑游戏的学生中认为作业多的所占的比例是 不喜欢玩电脑游戏的学生中认为作业多的所占的比例是 2 某校对学生课外活动 文娱和体育 进行调查 结果整理成下图 两个深色条的高分别表示男生与女生样本中喜欢文娱的学生的频率 则喜欢文娱的学生中是男生还是女生所占的比例多 提示 从图中可以看出 喜欢文娱的学生中女生所占的比例较多 结论 2 2列联表及等高条形图1 与列联表相关的概念 1 分类变量 变量的不同 值 表示个体所属的 这样的变量称为分类变量 不同类别 2 列联表 列出的 分类变量的 称为列联表 一般地 假设有两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 两个 频数表 a b c d a c b d a b c d 2 等高条形图直观性 与表格相比 等高条形图更能直观地反映出两个分类变量间是否 用途 1 常用等高条形图展示列联表数据的 2 判断两个分类变量之间有关系可以通过观察等高条形图相差很大的两个量是 和 相互影响 频率特征 微思考 1 分类变量的值就是指的一些具体实数吗 提示 这里的 变量 和 值 都应作为广义的变量和值来理解 只要不属于同种类别都是变量和值 并不一定是取具体的数值 如男 女 上 下 左 右等 2 在2 2列联表中 ad bc 越大 说明两个分类变量的关系如何 提示 在2 2列联表中 ad bc 越小 说明两个分类变量没有关系或关系不大 若 ad bc 越大 说明两个分类变量关系越大 3 利用等高条形图能否精确地判断两个分类变量是否有关系 为什么 提示 不能 因为通过等高条形图 可以粗略地判断两个分类变量是否有关系 但这种判断无法精确地给出所得结论的可靠程度 主题2独立性检验思想1 在2 2列联表中 若 ad bc 无限趋近于0时 k2 其中n a b c d 的值是否也无限趋近于0 若 ad bc 逐渐增大时 k2 其中n a b c d 的值是否也逐渐增大 提示 当 ad bc 无限趋近于0时 也会无限地接近于0 同样 当 ad bc 逐渐增大时 也会逐渐增大 2 类比反证法思想 若要证明 两个分类变量有关系 应如何操作 提示 应该先假设 两个分类变量有关系 不成立 即这两个分类变量无关 然后再推出矛盾 3 估计上面问题2的假设中 能得出k2 会向着什么方向 接近于0还是越来越大 发展 其可能性大了好还是小了好 提示 接近于0 其可能性越大越好 结论 独立性检验1 定义 利用随机变量k2来判断 两个分类变量 的方法称为独立性检验 2 k2 其中n 有关系 a b c d 3 独立性检验的具体做法 1 根据实际问题的需要确定容许推断 两个分类变量有关系 犯错误概率的上界 然后查表确定 k0 2 利用公式计算随机变量k2的 k 临界值 观测值 3 如果 就推断 x与y有关系 这种推断犯错误的概率不超过 否则就认为在 不超过 的前提下不能推断 x与y有关系 或者在样本数据中 支持结论 x与y有关系 k k0 犯错误的概率 没有发现足够证据 微思考 1 在计算k2 判断变量是否相关时 若k2的观测值k 56 632 则p k2 6 635 0 01和p k2 10 828 0 001 哪种说法是正确的 提示 两种说法均正确 p k2 6 635 0 01的含义是在犯错误的概率不超过0 01的前提下 认为两变量相关 而p k2 10 828 0 001的含义是在犯错误的概率不超过0 001的前提下 认为两变量相关 2 独立性检验的步骤与反证法的步骤中在推导假设不成立时主要区别是什么 提示 其主要区别为 反证法原理 在一个已知假设下 如果推出一个矛盾 就证明了这个假设不成立 独立性检验 假设检验 原理 在一个已知假设下 如果一个与该假设矛盾的小概率事件发生 就推断这个假设不成立 预习自测 1 以下关于独立性检验的说法中 错误的是 a 独立性检验的依据是小概率原理b 独立性检验得到的结论一定正确c 样本不同 独立性检验的结论可能有差异d 独立性检验不是判定两分类变量是否相关的唯一方法 解析 选b 利用独立性原理检验时与样本的选取有关 所以得到的结论可能有误 因此选项b不是一定正确的 2 对于研究两个分类变量a与b关系的统计量k2 下列说法正确的是 a k2越大 说明 a与b有关系 的可信度越小b k2越小 说明 a与b有关系 的可信度越小c k2越大 说明 a与b无关 的程度越大d k2接近于0 说明 a与b无关 的程度越小 解析 选b 由独立性检验思想可知 k2越小 说明 a与b有关系 的可信度越小 3 在2 2列联表中 两个比值 相差越大 两个分类变量之间的关系越强 解析 选a 相差越大 说明ad与bc相差越大 两个分类变量之间的关系越强 4 在一项打鼾与患心脏病是否有关的调查中 共调查了1978人 经过计算k2 28 63 根据这一数据分析 我们有理由认为打鼾与患心脏病是 填 有关 或 无关 的 解析 因为k2 28 63 10 828 所以打鼾与患心脏病无关这一假设不成立 这就意味着打鼾与患心脏病有关 答案 有关 5 为防治某种疾病 今研制一种新的预防药 任选取100只小白鼠作试验 得到如下的列联表 参考数据 k2的观测值为3 2079 则在犯错误的概率不超过 的前提下认为 药物对防治某种疾病有效 解析 k2的观测值为3 2079 根据参考数据 因为k 3 2079 2 706 所以在犯错误的概率不超过0 10的前提下认为 药物对防治某种疾病有效 答案 0 10 6 高中流行这样一句话 文科就怕数学不好 理科就怕英语不好 下表是一次针对高三文科学生的调查所得数据 试问 在出错概率不超过0 025的前提下 能否判断 文科学生总成绩不好与数学成绩不好有关系 解析 依题意 计算随机变量k2的观测值 所以在犯错误的概率不超过0 025的前提下 可以判断 文科学生总成绩不好与数学成绩不好有关系 类型一列联表和等高条形图的应用 典例1 某生产线上 质量监督员甲在生产现场时 990件产品中有合格品982件 次品8件 不在生产现场时 510件产品中有合格品493件 次品17件 试利用图形判断监督员甲在不在生产现场对产品质量好坏有无影响 能否在犯错误的概率不超过0 001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系 解题指南 由题目所给数据列出列联表并画出相应的等高条形图 进而可直观判断两个分类变量之间是否有关系 再用独立性检验判断上述推断是否正确 解析 根据题目所给数据得如下2 2列联表 相应的等高条形图如图所示 图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品的频率 从图中可以看出 甲不在生产现场样本中次品的频率明显高于甲在生产现场样本中次品的频率 因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系 由列联表中的数据 得k2的观测值为因此 在犯错误的概率不超过0 001的前提下 认为质量监督员甲在不在生产现场与产品质量好坏有关系 方法总结 判定结论成立的可能性的步骤 1 通过等高条形图 可以粗略地判断两个分类变量是否有关系 但是这种判断无法精确地给出所得结论的可靠程度 2 可以利用独立性检验来考察两个分类变量是否有关系 并且能较精确地给出这种判断的可靠程度 巩固训练 从发生交通事故的司机中抽取2000名司机作随机样本 根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下 试分析血液中含有酒精与对事故负有责任是否有关系 解析 作等高条形图如图 图中阴影部分表示有酒精负责任与无酒精负责任的频率 从图中可以看出 两者差距较大 由此我们可以在某种程度上认为 血液中含有酒精与对事故负有责任 有关系 补偿训练 为了解铅中毒病人与尿棕色素为阳性是否有关系 分别对病人组和对照组的尿液作尿棕色素定性检查 结果如下 试画出列联表的等高条形图 分析铅中毒病人和对照组的尿棕色素阳性数有无差别 铅中毒病人与尿棕色素为阳性是否有关系 解析 等高条形图如图所示 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率 由图可以直观地看出铅中毒病人与对照组相比 尿棕色素为阳性的频率差异明显 因此铅中毒病人与尿棕色素为阳性有关系 类型二两个变量的独立性检验 典例2 1 某高校 统计初步 课程的教师随机调查了选该课的一些学生情况 具体数据如表 为了判断主修统计专业是否与性别有关系 根据表中的数据 得到因为k2 3 841 所以判定主修统计专业与性别有关系 那么这种判断出错的可能性为 2 为了探究学生选报文 理科是否与对外语的兴趣有关 某同学调查了361名高二在校学生 调查结果如下 理科对外语有兴趣的有138人 无兴趣的有98人 文科对外语有兴趣的有73人 无兴趣的有52人 能否在犯错误的概率不超过0 1的前提下 认为 学生选报文 理科与对外语的兴趣有关 解题指南 1 可利用k2的值查找临界值表即可 2 利用 犯错误的概率不超过0 1 对应的k2值应满足k2 2 706判断 解析 1 因为k2 3 841 所以在犯错误的概率不超过0 05的前提下 认为主修统计专业与性别有关 出错的可能性为5 答案 5 2 根据题目所给的数据得到如下列联表 根据列联表中数据由公式计算得因为1 871 10 4 2 706 所以 在犯错误的概率不超过0 1的前提下 不能认为 学生选报文 理科与对外语的兴趣有关 延伸探究 1 把本例 2 条件 理科对外语有兴趣的有138人 无兴趣的有98人 文科对外语有兴趣的有73人 无兴趣的有52人 换成 理科对外语有兴趣的有100人 无兴趣的有136人 文科对外语有兴趣的有93人 无兴趣的有32人 其他条件不变 再求解该问题 解析 根据题目所给的数据得到如下列联表 根据列联表中数据由公式计算得因为33 690 2 706 所以 在犯错误的概率不超过0 1的前提下 可以认为 学生选报文 理科与对外语的兴趣有关 2 在上述探究中能否在犯错误的概率不超过0 001的前提下 认为 学生选报文 理科与对外语的兴趣有关 解析 由上述探究可知k 33 690 10 828 故在犯错误的概率不超过0 001的前提下 认为 学生选报文 理科与对外语的兴趣有关 方法总结 1 k2 w 的两点理解 k2 w 都是随着样本的改变而改变的随机变量 k2 w 的观测值可借助公式 2 利用p w w0 判断两分类变量的相关性此类假设检验法主要是先由p k2 k0 确定对应k0的值 再依此解出w0 进一步判断出w与w0的关系 最后判断相关关系的可信程度 3 独立性检验的实际应用的注意点 1 利用k2检验值为依据也可能失误 它强调的是最大可能性 样本量越大 这个估计越准确 用k2统计量作列联表的独立性检验时 要求表中的4个数据都要大于5 因此 在选取样本容量时一定要注意这一点 2 注意判断时把计算结果与两个临界值3 841与6 635比较 其值越大 有关的可信度越高 补偿训练 在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论