1112高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第1页
1112高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第2页
1112高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第3页
1112高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第4页
1112高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修23.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3 2独立性检验的基本思想及其初步应用 1 通过对典型案例的探究 了解独立性检验 只要求2 2列联表 的基本思想 方法及初步应用2 通过对数据的收集 整理和分析 增强学生的社会实践能力 培养学生分析问题 解决问题的能力 本节重点 难点 独立性检验的思想方法与初步应用 1 两分类变量之间关联关系的定性分析 1 分类变量 取不同的 值 表示个体所属不同类别的变量称为分类变量 说明 对分类变量的正确理解 这里的 变量 和 值 都应作为广义的变量和值进行理解 如 对于性别变量 其取值为男 女两种 所以这里的 变量 指的是 性别 这里的 值 指的是 男 和 女 故这里所说的 变量 和 值 不一定是具体的数值 分类变量是大量存在的 如吸烟变量有吸烟与不吸烟两种类别 而国籍变量则有多种类别 2 频率分析 通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联 3 图形分析 利用三维柱形图及二维条形图来分析分类变量之间是否具有关联分析 图形的形象直观更能说明相关数据的总体状况 一般地 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频率列联表 即2 2列联表 如下表 在三维柱形图中 主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大 说明x与y有关的可能性越大 当ad与bc的差趋近于零时 x与y几乎没有关系 可以说x与y是相互独立的 2 独立性检验 1 定义 利用随机变量k2 其中n a b c d 来确定是否能以一定把握认为 两个分类变量有关系 的方法称为两个分类变量的独立性检验 独立性检验的基本思想类似于反证法 要确认 两个分类变量有关系 这一结论成立的可信程度 首先假设该结论不成立 即假设结论 两个分类变量没有关系 成立 在该假设下随机变量k2应该很小 如果由观测数据计算得到的k2的观测值k很大 则在一定可信程度上说明假设不合理 根据随机变量k2的含义 可以通过概率p k2 k0 的大小来评价该假设不合理的程度有多大 从而得出 两个分类变量有关系 这一结论成立的可信程度有多大 2 如何用k2的值判断x与y之间是否有关 首先列2 2列联表 当得到的观测数据a b c d都不小于5时 由2 2列联表求出k2的观测值k 若k 10 828 则我们有99 9 的把握认为x与y有关 这种判断结果出错的可能性约为0 1 若k 6 635 则我们有99 的把握认为x与y有关 这种判断结果出错的可能性约为1 若k 2 706 则我们有90 的把握认为x与y有关 这种判断结果出错的可能性约为10 若k 2 706 则没有充分的证据显示x与y有关 但也不能认为x与y无关 3 独立性检验的基本方法一般地 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 若要推断的结论为 h1 x与y有关系 可以按如下步骤判断结论h1成立的可能性 1 通过三维柱形图和二维条形图 可以粗略地判断两个分类变量是否有关系 但是这种判断无法精确地给出所得结论的可靠程度 在三维柱形图中 主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大 h1成立的可能性就越大 如果k 10 828 就有99 9 的把握认为 x与y有关系 如果k 7 879 就有99 5 的把握认为 x与y有关系 如果k 6 635 就有99 的把握认为 x与y有关系 如果k 5 024 就有97 5 的把握认为 x与y有关系 如果k 3 841 就有95 的把握认为 x与y有关系 如果k 2 706 就有90 的把握认为 x与y有关系 如果k 2 706 就认为没有充分的证据认为 x与y有关系 1 分类变量 变量的不同 值 表示个体所属的不同类别 这类变量称为 2 在独立性检验中 常用和直观地反映相关数据的总体情况 分类变量 二维条形图 三维柱形图 3 样本频数列联表 一般地 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 即2 2列联表 为 k2 其中n 为样本容量 a b c d 4 利用随机变量k2来确定是否能以一定把握认为 两个分类变量有关系 的方法称为两个分类变量的 独立性检验 例1 某电视台联合相关报社对 男女同龄退休 这一公众关注的问题进行了民意调查 数据如下表所示 根据表中数据 能否在犯错误的概率不超过0 001的前提下认为对这一问题的看法与性别有关系 p k2 10 828 0 001 解析 假设h0 对这一问题的看法与性别无关 由列联表中的数据 可以得到 125 161 10 828又p k2 10 828 0 001 故在犯错误概率不超过0 001的前提下认为对 男女同龄退休 这一问题的看法与性别有关 点评 可以利用独立性检验来判断两个分类变量是否有关系 具体做法是 5月31日是 世界无烟日 2009年的主题是 让肺自由呼吸 为探究患肺癌是否与吸烟有关 某校研究性学习小组调查了1339名50岁以上的人 调查结果如下表所示 试问 能否在犯错误的概率不超过0 01的前提下认为50岁以上的人患肺癌与吸烟有关系 解析 依题意可知 6 635 又p k2 6 635 0 01 因此 在犯错误的概率不超过0 01的前提下认为吸烟与患肺癌有关 例2 为了解铅中毒病人是否有尿棕色素增加现象 分别对病人组和对照组的尿液作尿棕色素定性检查 结果如下 问铅中毒病人和对照组的尿棕色素阳性数有无差别 解析 由上述列联表可知 在铅中毒病人中尿棕色素为阳性的占80 56 而对照组仅占24 32 说明他们之间有较大差别 根据列联表作出三维柱形图 如图1 二维条形图 如图2 频率分布条形图 如图3所示 由上述三图可知 铅中毒病人中与对照组相比较 尿棕色素为阳性差异明显 因此铅中毒病人与尿棕色素为阳性存在关联关系 点评 由两个分类变量之间频率大小差异可说明这两个变量之间是有关联关系的 而利用三维柱形图 二维条形图 频率分布条形图都能形象直观地反映它们之间差异的关系 进而推断它们之间是否具有关联关系 其中作三维柱形图时应注意恰当的视角 使每个柱体都能看到 而频率分布条形图由于是等高的 因此它与二维条形图相比较更能直观地反映它们之间的差异的大小 特别是当样本容量差异明显时更是如此 某学校对学生课外活动内容进行调查 结果整理成下表 利用图形判断学生课外活动的类别与性别是否有关系 解析 某等高条形图如图所示 由图可以直观地看出喜欢体育还是喜欢文娱在性别上有较大差异 说明课外活动的类别与性别在某种程度上有关系 一 选择题1 调查男女学生购买食品时是否看出厂日期与性别有无关系时 最有说服力的是 a 期望b 方差c 正态分布d 独立性检验 答案 d 2 10名学生在一次数学考试中的成绩如下表 要研究这10名学生成绩的平均情况 则最能说明问题的是 a 概率b 期望c 方差d 独立性检验 答案 b 3 下面是一个2 2列联表则表中a b处的值分别为 a 94 96b 52 50c 52 59d 54 52 答案 c 二 填空题4 用k2统计量进行独立性检验时 使用的表称为 要求表中的四个数据 答案 2 2列联表均大于5 5 若两个分类变量x和y的列联表为 则x与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论