




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 2独立性检验的基本思想及其初步应用 我们经常听到这些说法 吸烟对患肺癌有影响 数学好的人物理一般也很好 性别与是否喜欢数学课程之间有关系 人的血型会决定人的性格 星座与人的命运之间有某种联系 这些说法都有道理吗 1 理解独立性检验的基本思想 重点 2 会从列联表 等高条形图直观判断吸烟与患肺癌有关 难点 3 了解随机变量k2的含义 理解独立性检验的基本思想及实施步骤 难点 探究点1独立性检验的基本思想 对于性别变量 其取值为男和女两种 这种变量的不同 值 表示个体所属的不同类别 这样的变量称为 分类变量在现实生活中是大量存在的 如是否吸烟 是否患肺癌 宗教信仰 国别 年龄 出生月份等 分类变量 问题 为了研究吸烟是否对患肺癌有影响 某肿瘤研究所随机地调查了9965人 得到如下结果 单位 人 在吸烟者中患肺癌的比重是 说明 吸烟者和不吸烟者患肺癌的可能性存在差异 吸烟者患肺癌的可能性大 0 54 2 28 在不吸烟者中患肺癌的比重是 通过图形直观判断两个分类变量是否相关 患肺癌比例 不患肺癌比例 等高条形图 通过数据和图形分析 得到结论是 吸烟与患肺癌有关 那么这种判断是否可靠呢 我们可以通过统计分析回答这个问题 假设h0 吸烟与患肺癌之间没有关系 如果 吸烟与患肺癌没有关系 那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多 即 引入一个随机变量 它是检验在多大程度上可以认为 两个变量有关系 的标准 ad bc 越小 说明吸烟与患肺癌之间的关系越弱 ad bc 越大 说明吸烟与患肺癌之间的关系越强 其中n a b c d为样本容量 通过公式计算 已知在成立的情况下 即在成立的情况下 k2的观测值大于6 635的概率非常小 近似为0 010 是一个小概率事件 思考 这个值到底告诉我们什么呢 现在k2的观测值k 56 632 远远大于6 635 所以有理由断定h0不成立 即认为 吸烟与患肺癌有关系 独立性检验的定义 利用随机变量k2来判断 两个分类变量有关系 的方法称为独立性检验 独立性检验的一般步骤 1 假设两个分类变量x与y没有关系 2 计算出k2的观测值k 3 把k的值与临界值比较确定x与y有关的程度或无关系 设有两个分类变量x和y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 如p k0 10 828 0 001表示在犯错误的概率不超过0 001的前提下 认为 x与y有关系 如p k0 6 635 0 01表示在犯错误的概率不超过0 01的前提下 认为 x与y有关系 临界值表 独立性检验的基本思想类似反证法 1 假设结论不成立 即 两个分类变量没有关系 2 在此假设下随机变量k2应该很小 如果由观测数据计算得到k2的观测值k很大 则在一定程度上说明假设不合理 3 根据随机变量k2的含义 可以通过评价该假设不合理的程度 如由实际计算出的k 10 828 说明假设不合理的程度为99 9 即 两个分类变量有关系 这一结论成立的可信度为约为99 9 在一次独立性相关检验中 若能在犯错误的概率不超过0 005的前提下认为两个分类变量x与y有关系 则k的取值范围是 a 5 024 6 635 b 6 635 7 879 c 7 879 10 828 d 7 879 d 即时训练 探究点2独立性检验的初步应用 例1 在某医院 因为患心脏病而住院的665名男性病人中 有214人秃顶 而另外772名不是因为患心脏病而住院的男性病人中 有175人秃顶 利用图形判断秃顶与患心脏病是否有关系 能否在犯错误的概率不超过0 010的前提下认为秃顶与患心脏病有关系 解 根据题目所给数据得到如下列联表 相应的等高条形图如下所示 秃顶 不秃顶 不患心脏病患心脏病 因此 在犯错误的概率不超过0 010的前提下 认为秃顶与患心脏病有关系 根据列联表中的数据 得到 思考 考察下表 定义 根据独立性检验原理 如何用w构造一个判断x和y是否有关系的规则 使得在该规则下把 x和y没有关系 错判成 x和y有关系 的概率不超过0 010 由w的定义可以发现 它越大 越有利于结论 x和y有关系 它越小 越有利于结论 x和y没有关系 因此可以建立如下的判断规则 当w的观测值 0时 就判断 x和y有关系 否则 判断 x和y没有关系 这里 0为正实数 满足如下条件 在 x和y没有关系 的前提下 思考 若在 x和y没有关系 的情况下有 例1在某医院 因为患心脏病而住院的665名男性病人中 有214人秃顶 而另外772名不是因为患心脏病而住院的男性病人中 有175人秃顶 利用图形判断秃顶与患心脏病是否有关系 能否在犯错误的概率不超过0 01的前提下认为秃顶与患心脏病有关系 解题关键 由题意列出2 2列联表 利用公式求得k2后与临界值比较 得出结论后要注意这组数据是来自于住院的病人 而不是随机对全体人群采样 解析 由题意列出2 2列联表如下 由公式得k2 16 373 k2 6 635 所以有99 9 的把握认为 秃顶与患心脏病有关 有甲乙两个班级进行一门课程的考试 按照学生考试成绩优秀和不优秀统计成绩后 得到如下列联表 能否在犯错误的概率不超过0 01的前提下认为成绩与班级有关 变式练习 解析 假设h0 成绩与班级无关 根据列联表中的数据得 因此不能在犯错误的概率不超过0 01的前提下认为成绩与班级有关 1 下列说法中正确的是 独立性检验的基本思想是带有概率性质的反证法 独立性检验就是选取一个假设h0条件下的小概率事件 若在一次试验中该事件发生了 这是与实际推断相抵触的 不合理 现象 则作出拒绝h0的推断 独立性检验一定能给出明确的结论 a b c d 2 在2 2列联表中 两个比值 相差越大 两个分类变量之间的关系越强 a 3 如果在犯错误的概率不超过0 05的前提下认为事件a和b有关 那么具体算出的数据满足 a k2 3 841b k26 635d k2 6 635 a 4 下列变量中不属于分类变量的是 a 性别b 吸烟c 宗教信仰d 国籍 b 5 有两个分类变量x与y的一组数据 由其列联表计算得k2 4 523 则认为x与y有关系是错误的可信度为 a 95 b 90 c 5 d 10 6 在对人们的休闲方式的一次调查中 共调查了124人 其中女性70人 男性54人 女性中有43人主要的休闲方式是看电视 另外27人主要的休闲方式是运动 男性中有21人主要的休闲方式是看
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆证券从业考试异地及答案解析
- 安全卫生类常识题库及答案解析
- 炒股从业资格考试及答案解析
- 比亚迪安全生产培训试题及答案解析
- 装载机司机安全培训试题及答案解析
- 证券或基金从业资格考试及答案解析
- 2025年挖机工程合同范本
- 基金从业资格考试规则及答案解析
- 天猫店支付服务合同6篇
- 道路建设安全考试题库及答案解析
- 国开2025年《行政领导学》形考作业1-4答案
- 养老护理员中级考试题库2025年(附答案)
- 2025贵州威宁自治县招聘城市社区工作者17人考试参考试题及答案解析
- GB/T 45952-2025科技馆运行评估规范
- 儿童入园(所)健康检查表
- (正式版)JBT 14581-2024 阀门用弹簧蓄能密封圈
- 幼儿园-消毒工作流程图
- 电缆修理工安全生产责任制
- 拼音拼读音节带声调完全版
- 某桥梁箱涵、箱通工程监理细则
- 【教案】圆锥曲线光学性质的数学原理及应用教学设计人教A版(2019)选择性必修第一册
评论
0/150
提交评论