独立性检验的基本思想及其初步应用.ppt_第1页
独立性检验的基本思想及其初步应用.ppt_第2页
独立性检验的基本思想及其初步应用.ppt_第3页
独立性检验的基本思想及其初步应用.ppt_第4页
独立性检验的基本思想及其初步应用.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.2 独立性检验的基本思想 及其初步应用 我们经常听到这些说法: l 吸烟对患肺癌有影响; l 数学好的人物理一般也很好; l 是否喜欢数学课程与性别之间有关系; l 人的血型会决定人的性格; l 星座与人的命运之间有某种联系. 这些说法都有道理吗? 探究点1 独立性检验的基本思想 对于性别变量,其取值为男和女两种.这种变量 的不同“值”表示个体所属的不同类别,像这样的变 量称为 . 分类变量在现实生活中是大量存在的,如是否 吸烟,是否患肺癌,宗教信仰,国别,年龄,出生 月份等. 分类变量 不患肺癌患肺癌总计 不吸烟7 775427 817 吸烟2 099492 148 总计9 874919 965 问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究 所随机地调查了9 965人,得到如下结果: 吸烟与患肺癌列联表(单位:人) 在吸烟者中患肺癌的比重是_. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大. 2.28% 在不吸烟者中患肺癌的比重是_, 0.54% 通过图形直观判断两个分类变量是否相关: 等高条形图 通过数据和图形分析,得到结论是:吸烟与患 肺癌有关.那么这种判断是否可靠呢?我们可以通过 统计分析回答这个问题. 假设H0:吸烟与患肺癌之间没有关系, 吸烟与患肺癌列联表(单位:人) 不患肺癌患肺癌总计 不吸烟aba+b 吸烟cdc+d 总计a+cb+da+b+c+d 如果“吸烟与患肺癌没有关系”,那么吸烟样 本中不患肺癌的比例应该与不吸烟样本中相应的比 例差不多. 即 引入一个随机变量 它是检验在多大程度上可以认为“两个变量 有关系”的标准. ad-bc越小,说明吸烟与患肺癌之间的关系越弱; ad-bc越大,说明吸烟与患肺癌之间的关系越强. 其中n=a+b+c+d为样本容量. 不患肺癌患肺癌总计 不吸烟7 775427 817 吸烟2 099492 148 总计9 874919 965 通过公式计算 吸烟与患肺癌列联表(单位:人) 已知在 成立的情况下, 即在 成立的情况下,K2的观测值大于6.635 的概率非常小,近似为0.01,是一个小概率事件. 思考:这个值到底告诉我们什么呢? 现在K2的观测值k56.632,远远大于6.635,所以有理 由断定H0不成立,即认为“吸烟与患肺癌有关系”. 独立性检验的定义 利用随机变量K2来判断“两个分类变量有关系 ”的方法称为独立性检验. 独立性检验的一般步骤 (1)假设两个分类变量没有关系. (3)把k的值与临界值比较确定X与Y有关的程度或 无关系. (2)计算出K2的观测值k 如P(k10.828)= 0.001表示在犯错误的概率不 超过0.001的前提下,认为“X与Y有关系”. 如P(k6.635)= 0.010表示在犯错误的概率不超 过0.010的前提下,认为“X与Y有关系”. 临界值表: 0.500.400.250.150.100.050.0250.0100.0050.001 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 独立性检验的基本思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量K2应该很小,如果由观测数据 计算得到K2的观测值k很大,则在一定程度上说明假 设不合理. (3)根据随机变量K2的含义,可以通过评价该假设不合 理的程度,如由实际计算出的k10.828.说明假设不 合理的程度为99.9%,即“两个分类变量有关系”这 一结论成立的可信度约为99.9%. 探究点2 独立性检验的初步应用 例.在某医院,因为患心脏病而住院的665名男性 病人中,有214人秃顶,而另外772名不是因为患心脏病 而住院的男性病人中有175人秃顶.(1)利用图形判断 秃顶与患心脏病是否有关系;(2)能否在犯错误的概率 不超过0.01的前提下认为秃顶与患心脏病有关系? 患心脏脏病患其他病总计总计 秃顶秃顶214175389 不秃顶秃顶4515971 048 总计总计6657721 437 (1)相应的等高条形图如下所示, 秃顶不秃顶 不患心脏病 患心脏病 解:根据题目所给数据得到如下列联表: 由图可认为秃顶与患心脏病有关系 因此,在犯错误的概率不超过0.01的前提下, 认为秃顶与患心脏病有关系. (2)根据列联表中的数据,得到 C 3下列说法中正确的是( ) 独立性检验的基本思想是带有概率性质的反证法; 独立性检验就是在假设H0下,如果出现一个与H0相 矛盾的小概率事件,就推断H0不成立,且该推断犯错 误的概率不超过这个小概率,则作出拒绝H0的推断; 独立性检验一定能给出明确的结论 A B C D 4有两个分类变量X与Y的一组数据,由其列联表 计算得K24.523,则认为X与Y有关系是错误的 可信度为( ) A95% B90% C5% D10% 5在对人们的休闲方式的一次调查中,共调查了 124人,其中女性70人,男性54人,女性中有43人 主要的休闲方式是看电视,另外27人主要的休闲方式 是运动;男性中有21人主要的休闲方式是看电视, 另外33人主要的休闲方式是运动 (1)根据以上数据建立一个22的列联表. (2)判断休闲方式与性别是否有关系 性别 看电视运动总计 女432770 男213354 总计6460124 休闲方式 ( ) 独立性检验的一般步骤: (1)假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论