高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第1页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第2页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第3页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第4页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3 2独立性检验的基本思想及其初步应用 自主学习新知突破 1 通过对实际问题的分析探究 了解独立性检验 只要求2 2列联表 的基本思想 方法及初步应用 了解独立性检验的常用方法 等高条形图及k2统计量法 2 通过典型案例的探究 了解实际推断原理和假设检验的基本思想 方法及初步应用 3 理解独立性检验的基本思想及实施步骤 能运用自己所学知识对具体案例进行检验 饮用水的质量是人类普遍关心的问题 据统计 饮用优质水的518人中 身体状况优秀的有466人 饮用一般水的312人中 身体状况优秀的有218人 人的身体健康状况与饮用水的质量之间有关系吗 提示 人的身体健康状况与饮用水的质量之间有关系 1 分类变量变量的不同 值 表示个体所属的 像这样的变量称为分类变量 2 列联表 1 定义 列出的两个分类变量的 称为列联表 分类变量和列联表 不同类别 频数表 2 2 2列联表一般地 假设两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称2 2列联表 为 分类变量及其关系的分析的理解 1 这里的 变量 和 值 都应作为广义的变量和值来理解 只要不属于同种类别都是变量和值 并不一定是取具体的数值 如 男 女 上 下 左 右等 2 频数分析是指用不同类别的事件发生的频率的大小比较来分析分类变量是否有关联关系 3 等高条形图更加形象直观地反映两个分类变量之间的差异 进而推断它们之间是否具有关联关系 1 等高条形图与表格相比 更能直观地反映出两个分类变量间是否 常用等高条形图展示列联表数据的 2 观察等高条形图发现 和 相差很大 就判断两个分类变量之间有关系 等高条形图 相互影响 频率特征 绘制等高条形图时 列联表的行对应的是高度 两行的数据不相等 但对应的条形图的高度是相同的 两列的数据对应不同的颜色 独立性检验 独立性检验思想的理解及常用的几个数值 1 独立性检验的基本思想类似于数学中的反证法 要确认两个分类变量有关系这一结论成立的可信程度 首先假设该结论不成立 即假设结论 两个分类变量没有关系 成立 在该假设下我们构造的随机变量k2应该很小 如果由观测数据计算得到的k2的观测值很大 则在一定程度上说明假设不合理 根据随机变量k2的含义 可以通过p k2 6 635 0 01来评价假设不合理的程度 由实际计算得k2的观测值k 6 635 说明假设不合理的程度约为99 即两个分类变量有关系这一结论成立的可信程度为99 2 在实际问题中要记住以下几个常用值 若k 6 635 则在犯错误的概率不超过0 01的前提下认为 x与y有关系 若k 3 841 则在犯错误的概率不超过0 05的前提下认为 x与y有关系 若k 2 706 则在犯错误的概率不超过0 1的前提下认为 x与y有关系 若k 2 706 则认为没有充分证据显示 x与y有关系 1 观察下列各图 其中两个分类变量x y之间关系最强的是 解析 在四幅图中 d图中两个深色条的高相差最明显 说明两个分类变量之间关系最强 答案 d 2 下面是一个2 2列联表 则表中a b处的值分别为 a 94 96b 52 50c 52 54d 54 52 3 在吸烟与患肺病是否相关的判断中 有下面的说法 若k2的观测值k 6 635 则在犯错误的概率不超过0 01的前提下 认为吸烟与患肺病有关系 那么在100个吸烟的人中必有99人患有肺病 从独立性检验可知在犯错误的概率不超过0 01的前提下 认为吸烟与患肺病有关系时 若某人吸烟 则他有99 的可能患有肺病 从独立性检验可知在犯错误的概率不超过0 05的前提下 认为吸烟与患肺病有关系时 是指有5 的可能性使得推断错误 其中说法正确的是 解析 k2是检验吸烟与患肺病相关程度的量 是相关关系 而不是确定关系 是反映有关和无关的概率 故说法 不正确 说法 中对 确定容许推断犯错误概率的上界 理解错误 说法 正确 答案 4 为了解决高二年级统计案例入门难的问题 某校在高一年级的数学教学中设有试验班 着重加强统计思想的渗透 下面是高二年级统计案例的测验成绩统计表 单位 分 的一部分 试分析实验效果 附 合作探究课堂互动 利用等高条形图判断分类变量间的关系 2012年5月1日起我国对醉驾列入法律 交通事故明显降低 现从发生交通事故的司机中抽取2000名司机的随机样本 根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下 1 试作出相应的等高条形图 2 结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系 思路点拨 1 相应的等高条形图如图 2 图中两个深色条的高分别表示司机血液中有酒精和无酒精样本中对事故负有责任的频率 从图中可以看出 司机血液中有酒精样本中对事故负有责任的频率明显高于司机血液中无酒精样本中对事故负有责任的频率 由此可以认为司机血液中含有酒精与对事故负有责任有关系 2 分析分类变量关系的步骤 1 作大量的调查 研究 统计出结果 2 列出列联表利用频率粗略估计 3 作出等高条形图 从直观上进一步判断分类变量之间的关联关系 特别提醒 通过等高条形图可以粗略地判断两个分类变量是否有关系 但无法精确地给出所得结论的可靠程度 1 某校对学生课外活动进行调查 结果整理成下表 请根据数据 利用图形判断 喜欢体育或喜欢文娱是否与性别有关系 解析 其等高条形图如图所示 由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系 利用随机变量k2判断分类变量间的关系 下表是某地区的一种传染病与饮用水的调查表 1 这种传染病是否与饮用水的卫生程度有关 请说明理由 2 若饮用干净水得病5人 不得病50人 饮用不干净水得病9人 不得病22人 按此样本数据分析这种疾病是否与饮用水有关 并比较两种样本在反映总体时的差异 思路点拨 1 根据表中的信息计算k2的观测值 并根据临界值表来分析相关性的大小 对于 2 要列出2 2列联表 方法同 1 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论 但 1 中我们在犯错误的概率不超过0 001的前提下肯定结论的正确性 2 中我们在犯错误的概率不超过0 025的前提下肯定结论的正确性 12分 规律方法 利用k2公式判断两分类变量是否有关系的方法 2 某电视台联合相关报社对 男女同龄退休 这一公众关注的问题进行了民意调查 数据如下表所示 根据表中数据 能否在犯错误的概率不超过0 001的前提下认为这一问题的看法与性别有关系 p k2 10 828 0 001 独立性检验的综合应用 为了调查某生产线上质量监督员甲对产品质量的好坏有无影响 现统计数据如下 甲在生产现场时 990件产品中有合格品982件 次品8件 甲不在生产现场时 510件产品中有合格品493件 次品17件 试分别用列联表 等高条形图 独立性检验的方法分析监督员甲对产品质量的好坏有无影响 能否在犯错误的概率不超过0 001的前提下 认为质量监督员甲在不在生产现场与产品质量的好坏有关系 思路点拨 解析 1 2 2列联表如下 由列联表可得 ac bd 982 17 493 8 12750 相差较大 可在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关 2 由等高条形图可知 在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关系 规律方法 判断两个分类变量之间有无关系 可以用2 2列联表 等高条形图 独立性检验等方法作出判断 其中从列联表和等高条形图中只能粗略地进行估计 要进行精确的判断 必须利用独立性检验进行计算并与临界值对比 3 在调查的480名男人中有38名患有色盲 520名女人中有6名患有色盲 做出列联表 试用独立性检验的方法来判断色盲与性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论