【数学】列联表和独立性检验课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第1页
【数学】列联表和独立性检验课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第2页
【数学】列联表和独立性检验课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第3页
【数学】列联表和独立性检验课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第4页
【数学】列联表和独立性检验课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.3列联表与独立性检验8.3.1分类变量与列联表8.3.2独立性检验复习导入

在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等.本节将要学习的独立性检验方法为我们提供了解决这类问题的方案.新知探索

如何利用统计数据判断一对分类变量之间是否具有关联性呢?对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确回答,但在大多数情况下,需要借助概率的观点和方法.我们先看下面的具体问题.新知探索问题:为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查.全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?

新知探索

新知探索

在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成2×2列联表加以保存.问题背景:全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)331523男生(X=1)473601合计2×2列联表1921281124320804列联表给出了成对分类变量数据的交叉分类频数.性别对体育锻炼的经常性有影响:性别对体育锻炼的经常性无影响:频率稳定于概率新知探索新知探索

在上面问题的两种解答中,使用了学校全部学生的调查数据,利用这些数据能够完全确定解答问题所需的比率和条件概率.然而,对于大多数实际问题,我们无法获得所关心的全部对象的数据,因此无法准确计算出有关的比率或条件概率.在这种情况下,上述古典概型和条件概率的观点为我们提供了一个解决问题的思路.比较简单的做法是利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理对问题答案做出推断.对于大多数实际问题,我们无法获得所关心的全部对象的数据,但可利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理作出推断.例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测试得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.性别锻炼合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:依据频率稳定于概率的原理,可推断P(Y=1|X=0)>P(Y=1|X=1).故可认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.等高堆积条形图

XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+da+b+c+d(样本容量n)若不相等,则推断两个分类变量有关联或存在明显差异.若相等,则推断两个分类变量无关联或没有明显差异.概念形成1、2×2列联表例析例析练习1.假设有两个分类变量X与Y,它们的可能取值分别为{0,1}和{0,1},其2×2列联表为:XY合计Y=0Y=1X=0101828X=1m26m+26合计10+m44m+54则当m取()时,X与Y的关系最弱.A.8 B.9C.14 D.19X与Y的关系几乎无关联C练习例析

例析

新知探索

我们可以用等高堆积条形图直观地展示上述计算结果,如图所示.

在上图中,左边的蓝色和红色条的高度分别是甲校学生中数学成绩不优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成绩优秀的频率.

新知探索等高条形图展示可列联表数据的频率特征,依据频率稳定与概率的原理,我们可以推断结果.①和表格相比,等高条形图更能直观地反映出两个分类变量间是否相互影响.②比较同色的条形图高度差,若高度差明显,则判断两个分类变量有关系或存在明显差异.两个分类变量x,y之间关系最强的是()吸烟与患肺病有关联D2、等高条形图[例2]为考察甲、乙两种药物预防某疾病的效果,进行动物实验,分别得到如下等高堆积条形图.根据图中信息,在下列各项中,说法最佳的一项是(

)A.药物乙的预防效果优于药物甲的预防效果B.药物甲的预防效果优于药物乙的预防效果C.药物甲、乙对该疾病均有显著的预防效果D.药物甲、乙对该疾病均没有预防效果√例析新知探索思考2:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:依据频率稳定于概率的原理,可推断P(Y=1|X=0)>P(Y=1|X=1).即甲校学生的数学成绩优秀率比乙校学生的高,故可认为两校学生的数学成绩优秀率存在差异.“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.但有可能在随机抽取的样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.导致推断放错误的原因:①样本容量较小,导致频率与概率的误差较大;②样本具有随机性,因而频率有随机性,频率和概率之间存在误差;思考3:有多大的把握推断“学校与优秀率有关”?这个推断犯错误的可能性多大?在这种情况下,我们推断出的结论就是错误的.接下来我们将讨论犯这种错误的概率的大小问题.新知探索

新知探索

新知探索

新知探索

新知探索

新知探索

新知探索

新知探索

新知探索

新知探索(1)认清分类变量,提出零假设H0:X和Y独立,即…与…无关联(无差异);(2)列表:列出2×2列联表.(3)求值:由表中数据计算χ2的值.(4)推断:将χ2值与临界值xα比较,根据小概率值α的独立性检验规则,得出结论若χ2≥xα,则推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;若χ2<xα,则我们没有充分证据推断H0不成立,可认为X和Y独立.P(χ2≥xα)=α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验3、(卡方)独立性检验的步骤新知探索①作用:由χ2≥xα是否发生推断分类变量X和Y是否独立.②独立性检验中常用的小概率值和相应的临界值P(χ2≥xα)=α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验如:若假设H0成立,对于小概率值α=0.05的χ2独立性检验规则如下:(1)当χ2≥3.841=x0.05时,∵P(χ2≥3.841)=0.05,可推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过0.05;(2)当χ2<3.841=x0.05时,我们没有充分证据推断H0不成立,可认为X和Y独立.例析例3.根据以下列联表的数据,试分析两校学生中数学成绩优秀率之间是否存在差异.性别锻炼合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788P(χ2≥xα)=α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828提出原(零)假设计算χ2找临界值比较下结论没有考虑由样本随机性可能导致的错误,所以这个推断依据不太充分独立性检验更理性、更全面,理论依据更充分例析例4.儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种治疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.疗法疗效合计未治愈治愈甲155267乙66369合计21115136P(χ2≥xα)=α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[变式]儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种治疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.05的独立性检验,分析甲、乙两种疗法的效果是否有差异.疗法疗效合计未治愈治愈甲155267乙66369合计21115136P(χ2≥xα)=α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例析练习

例析

新知探索

新知探索思考4:独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之处吗?

例析[例5]某大学生社团组织社会调查活动,随机调查了某市区某个路口100个工作日中每天的天气情况和当天早高峰(7点至9点)时段经过该路口的机动车车次,整理数据得到下表:天气机动车车次[0,800)[800,1600)[1600,2400)晴天105213阴天298雨天024(1)分别估计该市一天的天气为晴天和雨天的概率;例析(2)若晴天记为“天气好”,阴天或雨天记为“天气不好”,且若当天早高峰时段经过该路口的机动车车次小于1600,则视为交通顺畅,否则视为交通拥堵.根据所给数据,完成下面的2×2列联表,根据小概率值α=0.005的独立性检验,可否认为两种交通路况和“天气情况”有关?天气交通合计顺畅拥堵好不好合计例析根据小概率值α=0.005的独立性检验,推断H0不成立,可认为两种交通路况和“天气情况”有关,此推断犯错误的概率不超过0.005.例析应用独立性检验解决实际问题的步骤(1)提出零假设H0:X与Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论:当χ2≥xα时,推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α.当χ2<xα时,没有充分证据推断H0不成立,可以认为X和Y独立.(4)在X与Y不独立的情况下,根据需要,通过比较相应的频率,分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论