版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.3.2独立性检验
教学目标
基于2×2列联表,通过实例了解独立性检验的基本思想,掌握独立性检验的基本步骤,会用独立性检验解决简单的实际问题,提升数据分析能力.
重点:独立性检验的基本思想和独立性检验的基本方法
难点:
统计量的导出和意义,独立性检验的思想和方法
上节课例1:
为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:试分析两校学生中数学成绩优秀率之间是否存在差异.学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788
依据频率稳定于概率的原理,我们可以推断甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,进而可以推断两校学生中数学成绩优秀率之间存在差异.
【思考】你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?
这一结论有可能是错误的.
对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.
因此,需要找到一种更为合理的推断方法判断两变量之间有无关系,同时也希望能对出现错误推断的概率有一定的控制或估算.探究一:提出零假设H0:X和Y相互独立
思考2:P(X=1)P(Y=1)=P(X=1,Y=1)这个条件说明零假设P(Y=1|X=0)=P(Y=1|X=1)等价于什么?
思考1:请同学们根据学过的有关知识对H0进行推导,看看能化简成怎样的形式?P(X=1)P(Y=1)=P(X=1,Y=1)零假设H0等价于{X=1}与{Y=1}独立
因此,我们可以用概率语言,将零假设改述为:
H0:分类变量X和Y独立
思考3:根据已经学过的概率知识,还能得到什么性质?
探究二:分析零假设,构造检验的统计量
为了使得研究更具有代表性,我们首先将上述的列联表的数据进行一般化处理进行一般化处理XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d
填表:根据上面的列联表,完成下面概率表1,概率表2中的统计的真实值。在零假设H0前提下,完成表2中的假设期望值,利用表2中的概率假设期望值,将表3补充完整。表1概率值P(X=0)P(X=1)P(Y=0)P(Y=1)表2概率真实值假设期望值P(X=0,Y=0)P(X=0,Y=1)P(X=1,Y=0)P(X=1,Y=1)XY合计Y=0Y=1X=0a+bX=1c+d合计a+cb+dn=a+b+c+d表3表1:概率值P(X=0)P(X=1)P(Y=0)P(Y=1)表2:概率真实值假设期望值P(X=0,Y=0)P(X=0,Y=1)P(X=1,Y=0)P(X=1,Y=1)XY合计Y=0Y=1X=0a+bX=1c+d合计a+cb+dn=a+b+c+dXY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d表3列联表想一想
若H0成立,依据频率稳定与概率的原理,列联表中观测值和期望值是否相等?
.构造检验的统计量
原假设成立,下面四个量的值不应该太大
一般来说,若频数的期望值较大,则③中相应的差的绝对值也会越大;若频数的期望值较小,则③中相应的差的绝对值也会较小。为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:
该表达式可化简为
上述表达式是
的计算公式,
读作“卡方”构造检验的统计量α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
例如:对于小概率值α=0.05,我们有如下的具体检验规则
(1)当
时,我们推断H0不成立,可以认为X和Y不独立,该推断犯错误的概率不超过0.05(2)当
时,我们没有充分证据推断H0不成立,可以认为X和Y独立基于小概率值α的检验规则:
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.三:应用独立性检验解决实际问题
例3.某儿童医院用甲、乙两种疗法治疗小儿消化不良.用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据(1)小概率值α=0.005(2)小概率值α=0.05(3)小概率值α=0.1的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
解:
零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
由已知数据列出2×2列联表,如下:疗法疗效合计未治愈治愈甲155267乙66369合计21115136α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
由GeoGebra软件计算得
同一组数据得到了相反的结论,可见推断的结论与检验规则有关.另外,由于依据不同的检验规则,(2)和(3)两个推断犯错误的概率上界是不同的,而这种犯错误的概率只能通过多次试验才能表示出来,因此在具体地问题中,所试验的小概率值往往是由有经验的专家先确定的.
观察:若对调两种疗法的位置或对调两种疗效的位置,这样做会影响
取值的计算结果吗?
对调两种疗法的位置,相当与对调a与c,b与d的位置,对调两种疗效的位置,相当与对调a与b,c与d的位置,不影响
的计算结果四:样本量对于
独立性检验结果的影响
学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计7117888.3-2
通常情况下,样本越大,提供的信息越充分,观测的结果会更准确。样本量变为原来的10倍,这种差异无法通过频率的计算表现出来,而
独立性检验可能会得出不同的结论,可见
统计量能够有效地提取样本所包含的有用信息
五:归纳总结:
(1)回顾本节课的学习,请你总结应用独立性检验解实际问题时大致包括几个主要环节?
(2)独立性检验的思想类似于我们常用的反证法,你能指出两者之间的相同和不同之处吗?
(3)你能说一说独立性检验的本质吗?
(1)应用独立性检验解决实际问题大致应包括4个主要环节:
注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.反证法独立性检验
在某种假设H0下,如果推出一个矛盾,则证明H0不成立;若未能推出矛盾,不能对下H0任何结论,即反证法不成功
在零假设H0下,如果出现一个与H0相矛盾的小概率事件,则推断H0不成立,且该推断犯错误的概率不大于这个小概率.否则,不能推断H0不成立,通常会接受H0,即认为两个分类变量相互独立.反证法不会犯错误独立性检验会犯随机性错误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职业发展规划及要求范文
- 入院健康模板-1
- 消防安全主题班会视频
- 食堂安全生产亮点展示讲解
- 全日制本科就业前景展望
- 2026年人力资源师初级考试模拟题
- 快消品业务职业规划
- 人工智能行为主义研究
- 职工绩效考核制度
- 公关服务公司核心公关技术人员薪酬激励管理制度
- 2026年全国高考语文(全国Ⅰ卷)真题及答案
- IATF16949 五大核心工具综合培训(APQP-FMEA-SPC-MSA-PPAP)
- 人教版五年级下册道德与法治专项训练测试题(附答案)
- 股票技术指标公式参考文档
- 2026年餐厅装修设计需求说明书
- 安装与土建交叉作业施工方案1
- 初中七年级道德与法治下册《让和声更美-集体生活中的个人与规则》教学设计
- (2026版)《电力重大事故隐患判定标准及治理监督管理规定》培训
- 城市轨道交通乘客服务标准手册
- DB11T 2409-2025建筑屋顶光伏应用条件评估技术规范
- 主减速器齿轮课件
评论
0/150
提交评论