




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.2 独立性检验的基本思想及其初步应用,新课,新课,另习题课、习题见金榜,3.2独立性检验的基本思想及其初步应用,我们经常听到这些说法:吸烟对患肺癌有影响;数学好的人物理一般也很好;是否喜欢数学课程与性别之间有关系;人的血型会决定人的性格;星座与人的命运之间有某种联系.这些说法都有道理吗?,1.理解独立性检验的基本思想.(重点)2.会从列联表、等高条形图直观判断吸烟与患肺癌 有关.(难点)3.了解随机变量K2的含义,理解独立性检验的基本思想及实施步骤.(难点),探究点1 独立性检验的基本思想,对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为 .,分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等.,分类变量,问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果:吸烟与患肺癌列联表(单位:人),在吸烟者中患肺癌的比重是_.,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.,2.28%,在不吸烟者中患肺癌的比重是_,0.54%,通过图形直观判断两个分类变量是否相关:等高条形图,通过数据和图形分析,得到结论是:吸烟与患肺癌有关.那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题.,假设H0:吸烟与患肺癌之间没有关系,吸烟与患肺癌列联表(单位:人),如果“吸烟与患肺癌没有关系”,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多.,即,引入一个随机变量,它是检验在多大程度上可以认为“两个变量有关系”的标准.,ad-bc越小,说明吸烟与患肺癌之间的关系越弱;,ad-bc越大,说明吸烟与患肺癌之间的关系越强.,其中n=a+b+c+d为样本容量.,通过公式计算,吸烟与患肺癌列联表(单位:人),已知在 成立的情况下,,即在 成立的情况下,K2的观测值大于6.635的概率非常小,近似为0.01,是一个小概率事件.,思考:这个值到底告诉我们什么呢?,现在K2的观测值k56.632,远远大于6.635,所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”.,独立性检验的定义:,利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.,独立性检验的一般步骤:,(1)假设两个分类变量X与Y没有关系.,(2)计算出K2的观测值k.,(3)把k的值与临界值比较确定X与Y有关的程度或无关系.,设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,临界值表:,如P(k10.828)= 0.001表示在犯错误的概率不超过0.001的前提下,认为“X与Y有关系”.,如P(k6.635)= 0.010表示在犯错误的概率不超过0.010的前提下,认为“X与Y有关系”.,独立性检验的基本思想类似反证法,(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,如由实际计算出的k10.828.说明假设不合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度约为99.9%.,探究点2 独立性检验的初步应用,例.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?,(1)相应的等高条形图如下所示,,秃顶,不秃顶,不患心脏病患心脏病,解:根据题目所给数据得到如下列联表:,由图可认为秃顶与患心脏病有关系,因此,在犯错误的概率不超过0.01的前提下,认为秃顶与患心脏病有关系.,(2)根据列联表中的数据,得到,思考:考察下表,,定义,根据独立性检验原理,如何用W构造一个判断X和Y是否有关系的规则,使得在该规则下把“X和Y没有关系”错判成“X和Y有关系”的概率不超过0.01?,通分(分子).,由W的定义可以发现:它越大,越有利于结论“X和Y有关系”;它越小,越有利于结论“X和Y没有关系”.因此可以建立如下的判断规则:,当W的观测值0时,就判断“X和Y有关系”;否则,判断“X和Y没有关系”.这里0为正实数,满足如下条件:在“X和Y没有关系”的前提下,,思考:若在“X和Y没有关系”的情况下有:,1.独立性检验中的统计假设就是假设两个分类量A,B ()A.互斥 B.不互斥C.相互独立 D.不独立,C,2.下列说法中正确的是()独立性检验的基本思想是带有概率性质的反证法;独立性检验就是在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率,则作出拒绝H0的推断;独立性检验一定能给出明确的结论 A. B. C. D.,练,3有两个分类变量X与Y的一组数据,由其列联表计算得K24.523,则认为X与Y有关系是错误的可信度为()A95% B90% C5% D10%,4在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动(1)根据以上数据建立一个22的列联表.(2)判断休闲方式与性别是否有关系,休闲方式,( ),独立性检验的一般步骤:,(1)假设两个分类变量X与Y没有关系;,(2)计算出K2的观测值k;,(3)把k的值与临界值比较确定X与Y有关的程度或无关系.,独立性检验基本的思想类似反证法,(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下随机变量 K2 应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烘烤培训考试题及答案
- 黄山传媒公司策划方案
- 股民考试题目及答案
- 巩固几何考试题及答案
- 高职餐饮考试题及答案
- 产品研发流程规划与执行监控工具
- 房产客服考试题及答案
- 发票知识考试题及答案
- 俄国战争考试题及答案
- 小说人物冲突与戏剧性解析教案
- 辽宁省沈阳市2025-2026学年七年级上学期第一次月考数学试卷(含答案)
- 小学生日常行为规范知识竞赛试题(附答案)
- 2025年食品安全员考试题库及答案
- 民宿入住免责协议书范本
- 岭南版小学美术四年级上学期教学进度计划
- 管廊运维招聘题库及答案
- 江西省2025年高考物理真题及答案解析
- 2025年广东卷物理高考试卷(原卷+答案)
- 2025年河南省人民法院聘用书记员考试试题及答案
- 2025年中学教师资格考试《综合素质》核心考点与解析
- 污水处理站运行记录台账范本
评论
0/150
提交评论