独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第1页
独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第2页
独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第3页
独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第4页
独立性检验课件2025-2026学年高二下学期数学人教A版选择性必修第三册_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

成对数据的统计分析8.3列联表与独立性检验8.3.2独立性检验XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+dα0.10.050.010.0050.001xα2.7063.8416.6357.87910.858学习目标1.理解独立性检验的基本思想及其实施步骤.2.能利用等高堆积条形图、2×2列联表探讨两个分类变量的关系.3.了解χ2的含义及其应用.4.通过对数据的处理,提高解决实际问题的能力知识回顾1.2×2列联表给出了成对分类变量数据的交叉分类频数,以下表为例,它包含了X和Y的如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX

2.两个分类变量之间关联关系的定性分析的方法:(1)频率分析法(2)图形分析法“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.

{X=0}与{Y=0}独立;{X=0}与{Y=1}独立;{X=1}与{Y=0}独立;{X=1}与{Y=1}独立.以上性质成立,我们就称分类变量X和Y独立,这相当于下面四个等式成立;P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).我们可以用概率语言,将零假设改述为H0:分类变量X和Y独立.假定我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示.②表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数;右下角格中的数n是样本容量.对于随机样本,表中的频数a,b,c,d都是随机变量,而表中的相应数据是这些随机变量的一次观测结果.n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX

思考:如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断?P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX

综合②中的四个式子,如果零假设H0成立,下面四个量的取值都不应该太大:

反之,当这些量的取值较大时,就可以推断H0不成立.

分别考虑③中的四个差的绝对值很困难,我们需要找到一个既合理又能够计算分布的统计量,来推断H0是否成立.一般来说,若频数的期望值较大,则③中相应的差的绝对值也会较大;而若频数的期望值较小,则③中相应的差的绝对值也会较小.为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:

该表达式可化简为

知识概念

知识概念独立性检验公式及定义:提出零假设(原假设)H0:分类变量X和Y独立

为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX

2=χχ2独立性检验中几个常用的小概率值和相应的临界值.10.8287.8796.6353.8412.706xα0.0010.0050.010.050.1α

临界值的定义:对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准,概率值α越小,临界值xα越大.χ2独立性检验中几个常用的小概率值和相应的临界值.10.8287.8796.6353.8412.706xα0.0010.0050.010.050.1α

基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.

用χ2取值的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立。这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.知识概念先假设两个分类变量X与Y无关系,利用上述公式根据观测数据求出K2的观测值k,再得出X与Y有关系的程度.(1)如果k≥10.828,就有______的把握认为“X与Y有关系”

(2)如果k≥7.879,就有______的把握认为“X与Y有关系”;(3)如果k≥_____,就有99%的把握认为“X与Y有关系”

(4)如果k≥5.024,就有97.5%的把握认为“X与Y有关系”

(5)如果k≥3.841,就有_____的把握认为“X与Y有关系”

(6)如果k≥2.706,就有_____的把握认为“X与Y有关系”.99.9%99.5%6.63595%90%

不渴望能够一跃千里,只希望每天能够前进一步.课堂巩固

典例分析解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.因为学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788

思考例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?问题探究

当我们接受零假设H0时,也可能犯错误。我们不知道犯这类错误的概率p的大小,但是知道,若α越大,则p越小典例分析

解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,疗法疗效合计未治愈治愈甲155267乙66369合计21115136

疗法疗效合计未治愈治愈甲155267乙66369合计21115136疗法疗效合计未治愈治愈乙66369甲155267合计21115136疗法疗效合计治愈未治愈甲521567乙63669合计11521136

不影响典例分析例4.为了调查吸烟是否对肺癌有影响,某肿瘤研究所采取有放回简单随机抽样,调查了9965人,得到如下结果(单位:人)依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.典例分析吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965解:零假设为H0:吸烟和患肺癌之间没有关系根据列联表中的数据,经计算的

根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001,即我们有99.9%的把握认为“吸烟与患肺癌有关系”.根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为吸烟者中不患肺癌和患肺癌的评率分别为由

可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以上。于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌.典例分析用χ2进行“相关的检验”步骤(1)零假设:即先假设两变量间没关系.(2)计算χ2:套用χ2的公式求得χ2值.(3)查临界值:结合所给小概率值α查得相应的临界值xα.(4)下结论:比较χ2与xα的大小,并作出结论.注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.应用独立性检验解决实际问题大致应包括以下几个主要环节:

P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828归纳小结归纳小结P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828例如0.1%把握认为A与B无关1%把握认为A与B无关10%把握认为A与B无关99.9%把握认为A与B有关99%把握认为A与B有关90%把握认为A与B有关没有充分的依据显示A与B有关,但也不能显示A与B无关课堂小结——你学到了那些新知识呢?1.分类变量X和Y的抽样数据的2×2列联表:n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX

2=χ2.独立性检验的一般步骤:(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论