独立性检验ppt课件_第1页
独立性检验ppt课件_第2页
独立性检验ppt课件_第3页
独立性检验ppt课件_第4页
独立性检验ppt课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2独立性检验的基本思想及其初步应用,1.掌握22列联表的独立性检验,能利用给出的数据列出列联表并会求K2的观测值.2.了解独立性检验的基本思想和方法.,1.本节课的重点是理解独立性检验的基本思想及实施步骤.2.本节课的难点是了解随机变量K2的含义和根据K2的值得出结论的意义.,1.分类变量变量的不同“值”表示个体所属的,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的,称为列联表.,不同类别,频数表,(2)22列联表:一般地,假设两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为,3.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(2)公式:K2其中n=.,a+b+c+d,1.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K26.635)0.01的含义是什么?提示:P(K26.635)0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关.,2.列联表中ad-bc的值与两个分类变量之间相关的强弱有什么关系?提示:在列联表中,若两个分类变量没有关系,则|ad-bc|0,所以ad-bc的值越小,两个分类变量之间的关系越弱;ad-bc的值越大,两个分类变量之间的关系越强.,3.作散点图的主要目的是.【解析】散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系.答案:直观了解两个变量之间的关系,4.若由一个22列联表中的数据计算得K2的观测值k=4.013,则认为“两个变量有关系”犯错误的概率不超过.【解析】P(K23.841)0.05,认为“两个变量有关系”犯错误的概率不超过0.05.答案:0.05,1.对于“分类变量”的理解(1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取的是具体的数值.,2.独立性检验与反证法的异同点独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件的发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出利用结论成立的小概率事件的发生.,3.判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验.(1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合.,等高条形图的应用【技法点拨】1.判断两个分类变量是否有关系的两个常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.,2.利用等高条形图判断两个分类变量是否相关的步骤,【典例训练】1.从发生交通事故的司机中抽取2000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:,相应的等高条形图如图所示.试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系.,2.某学校对高三学生进行了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【解析】1.比较来说,两者差距较大,在“有酒精”和“无酒精”两个矩形中,阴影部分的面积不同,由此可以看出在某种程度上认为血液中含有酒精与对事故负有责任有关系.,2.作列联表如下:,相应的等高条形图如图所示,,图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.,【归纳】等高条形图的作法及作用小结.提示:1.首先作22列联表,注意对涉及的变量分清类别;其次要注意计算的准确性;第三画等高条形图,注意各变量的顺序与所画位置.2.通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度.,【变式训练】为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?,【解析】根据列联表作出等高条形图(如图).由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.,独立性检验【技法点拨】解决一般的独立性检验问题的步骤,【典例训练】1.(2012武汉高二检测)在独立性检验中,若随机变量K2的观测值k6.635,则()(A)X与Y有关系,犯错的概率不超过1%(B)X与Y有关系,犯错的概率超过1%(C)X与Y没有关系,犯错的概率不超过1%(D)X与Y没有关系,犯错的概率超过1%,2.(2012厦门高二检测)在对人们休闲方式的一次调查中,共调查120人,其中女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个22的列联表;(2)休闲方式与性别是否有关?,【解析】1.选A.k6.635.说明两个变量X与Y有关系,这种说法犯错误的概率不超过0.01,即1%,故选A.2.(1)2的列联表为,休闲方式,(2)计算K2的观测值为而2.7063.4293.841,因为P(K22.706)0.10,P(K23.841)0.05,所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.,【互动探究】本题条件不变的情况下,画出等高条形图.【解析】,【思考】1.求k的值的关键是什么?2.k的大小对“两个变量有关”有什么影响?提示:1.求K2的观测值k的关键是要准确列出22列联表,即找准表达式中的各个量的数值.2.利用K2的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而且k的值越大,说明“X与Y有关系”成立的可能性越大.,【变式训练】(2012琼海高二检测)为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,性别,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?附:,【解析】(1)需要帮助的老年人的比例估计值为(2)P(K26.635)0.010在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.,独立性检验的综合应用【技法点拨】判断两个变量是否有关的三种方法,【典例训练】1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到因为P(k3.841)=0.05,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_.,2.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?,【解析】1.根据独立性检验的思想,假设没关系正确的可能性为5%,所以,判断有关系错误的可能性也为5%.答案:5%,2.(1)22列联表如下:由列联表可得ad-bc|=|98217-4938|=12750.相差较大,可在某种程度上认为“质量监督员甲是否在现场与产品质量有关系”.,(2)画等高条形图.如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.,(3)由22列联表中数据,计算得到K2的观测值为因此,在犯错误的概率不超过0.001的前提下,认为质量监督员甲在不在生产现场与产品质量好坏有关系.,【想一想】在独立性检验中,容易出现的错误有哪些?提示:容易因不能准确列出列联表而犯错误;用等高条形图粗略估计代替准确结论而犯错误;由于记错K2公式、计算出错而犯错误;由于不能利用K2的值与临界值k0比较而出错.,【变式训练】对某校学生进行心理障碍测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?【解题指南】分别计算三种心理障碍的K2观测值k1,k2,k3,比较它们的值与3.841的关系,回答问题.,【解析】对于上述三种心理障碍分别构造三个随机变量K2的观测值:k1,k2,k3,则所以,在犯错误的概率不超过0.05的前提下,认为焦虑与性别无关,说谎与性别有关,懒惰与性别无关.,【规范解答】独立性检验【典例】(12分)(2012荆州高二检测)调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.,(1)将下面的22列联表补充完整;,出生时间,(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?,【解题指导】,【规范解答】(1)6分,出生时间,(2)由所给数据计算K2的观测值8分根据临界值表知P(K22.706)0.10.9分因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.12分,【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的见规范解答过程).,【规范训练】(12分)(2012大庆高二检测)调查在23级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人.女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船.判断晕船是否与性别有关系.【解题设问】(1)本题两个分类变量是什么?_.(2)题中数据取值明确吗?_.,性别和是否晕船,明确,【规范答题】列出22的列联表:8分,晕船情况,计算11分因为k2.706,所以在样本数据中没有发现足够的证据支持结论“晕船与性别有关系”.12分,1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()(A)散点图(B)等高条形图(C)22列联表(D)以上均不对【解析】选B.等高条形图可以粗略地判断两个分类变量之间是否有关.,2.分类变量X和Y的列联表如下,则下列说法中正确的是()(A)ad-bc越小,说明X与Y关系越弱(B)ad-bc越大,说明X与Y关系越强(C)(ad-bc)2越大,说明X与Y关系越强(D)(ad-bc)2越接近于0,说明X与Y关系越强,【解析】选C.(ad-bc)2越大,则K2越大,X与Y关系越强,故选C.,3.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是()(A)若随机变量K2的观测值k6.635,我们说吸烟与患肺病有关的概率为0.99,则某人吸烟,那么他可能患有肺病的概率为0.99(B)若从统计量中求出吸烟与患肺病有关的概率为0.99,则在100个吸烟者中必有99人患有肺病,(C)若从统计量中求出吸烟与患肺病有关的概率为0.95,是指推断错误的概率为0.05(D)以上说法均错误【解析】选C.根据随机变量K2的意义可知,A与B均错误,C正确.,4.某班主任对全班50名学生进行了一次调查,所得数据如表:由表中数据计算得到K2的观测值k5.059,于是_(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为性别与按时完成作业有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论