版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4节列联表与独立性检验高中总复习·数学课标要求(1)掌握分类变量的含义;(2)通过实例,理解2×2列联表的统计意义;(3)通过实例,了解独立性检验的基本思想、方法及其简单应用.目录CONTENTS知识点一分类变量与列联表01.知识点二独立性检验02.课时跟踪检测03.PART01知识点一分类变量与列联表1.
分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类
变量.2.2×2列联表列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,
X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件
{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=
0,1)的频数,n是样本容量,其样本频数列联表(称为2×2列联表)如
下表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d3.
等高堆积条形图(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是
否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(1)〔多选〕根据如图所示的等高堆积条形图,下列叙述正确的是
(
ABC
)ABCA.
吸烟患肺病的频率约为0.2B.
吸烟不患肺病的频率约为0.8C.
不吸烟患肺病的频率小于0.05D.
吸烟与患肺病无关系解析:
从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远
远大于不吸烟患肺病的频率.A、B、C都正确.(2)假设有两个变量x与y的2×2列联表如表:y1y2x1abx2cd对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(
D
)DA.
a=9,b=3,c=2,d=1B.
a=9,b=2,c=3,d=1C.
a=2,b=3,c=1,d=9D.
a=3,b=1,c=2,d=9解析:
根据观测值求解公式及a+b+c+d=15可得,当n相等
时,|ad-bc|越小,说明x与y之间的关系越弱;|ad-bc|越大,说
明x与y之间的关系越强,经过逐一验证,可知选D.
规律方法分类变量的两种统计表示形式(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是
否有关联及关联性的强弱;(2)2×2列联表:直接利用2×2列联表中的数据进行计算分析,用定量
的方式判断两分类变量是否有关联及关联性的强弱.练1(1)(2024·江西模拟)在某次独立性检验中,得到如下列联表:A
合计B2008001
000
180a180+a合计380800+a1
180+a最后发现,两个分类变量没有关联,则a的值可能是(
B
)A.200B.720BC.100D.180
(2)如表是一个2×2列联表,则m+n=
.XY合计y1y2x1a3545x27bn合计m73s62解析:根据2×2列联表可知a+35=45,解得a=10,则m=a+7=17,又由35+b=73,解得b=38,则n=7+b=45,故m+n=17+45=62.PART02知识点二独立性检验1.
概念:利用随机变量χ2的取值推断分类变量X和Y是否独立的方法称为
χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.2.
χ2的计算公式:χ2=
.3.
基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认
为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有
充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值).4.
独立性检验中几个常用的小概率值和相应的临界值:
α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828角度1
分类变量关联性的判断
(1)(2024·盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到
χ2=2.954,则(
B
)α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828A.
变量Ⅰ与Ⅱ相关B.
变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C.
变量Ⅰ与Ⅱ不相关D.
变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1B解析:零假设为H0:变量Ⅰ与Ⅱ不相关,因为χ2=2.954>2.706,依据
α=0.1的独立性检验可知,推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个
结论犯错误的概率不超过0.1,故选B.
(2)根据分类变量
X
和Y
的样本观察数据的计算结果,有不少于95%的把
握认为
X
和Y
有关,则χ2的值不可能为(
A
)α0.1500.1000.0500.0100.005xα2.0722.7063.8416.6357.879A.2.819B.5.512C.6.635D.8.243A解析:因为有不少于95%的把握认为
X
和Y
有关,所以χ2≥3.841,只
有A不满足要求.故选A.
规律方法分类变量关联性的判断
如果χ2≥xα,则“X与Y有关系”这种推断犯错误的概率不超过α;
否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关
系”,或者在样本数据中没有充分证据支持结论“X与Y有关系”.角度2
独立性检验的应用
在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.
现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列
联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100(1)补全2×2列联表(单位:只);解:
补全2×2列联表如下:被某病毒感染未被某病毒感染合计注射疫苗104050未注射疫苗203050合计3070100(2)依据小概率值α=0.05的独立性检验,分析“给基因编辑小鼠注射
该种疫苗能起到预防该病毒感染的效果”
.
变式本例(2)“依据小概率值α=0.05的独立性检验”变为“依据小概
率值α=0.01的独立性检验”,得到的结论如何?
规律方法独立性检验的具体步骤(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;(2)根据样本数据整理出2×2列联表,利用公式计算χ2的值;(3)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误
概率的上界α,然后查表确定临界值xα;(4)当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯
错误的概率不超过α;当χ2≤xα时,我们没有充分证据推断H0不成立,可
以认为X和Y独立.练2(2024·保定二模)某青少年跳水队共有100人,在强化训练前、后,
教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率
分布直方图,如图2所示的强化训练后的频率分布直方图.(1)根据表中数据,估计强化训练后的平均成绩(同一组中的数据用该
组区间的中点值作代表)与成绩的中位数(中位数精确到0.01);解:
强化训练后的平均成绩约为55×0.04+65×0.16+75×0.2+
85×0.32+95×0.28=81.4(分).由于前三组频率之和为0.04+0.16+0.2=0.4,设中位数为80+x,则
0.032x=0.1,解得x=3.125,所以中位数约为83.13.(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优
秀”.强化训练是否优秀合计优秀非优秀强化训练前强化训练后合计将上面的表格补充完整,依据小概率值α=0.005的独立性检验,能否据
此推断跳水运动员是否优秀与强化训练有关?解:零假设为H0:跳水运动员是否优秀与强化训练无关.补充完整的表格为强化训练是否优秀合计优秀非优秀强化训练前4060100强化训练后6040100合计100100200
PART03课时跟踪检测
一、单项选择题1.
在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打
鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认
为这个结论是成立的,下列说法中正确的是(
)A.100个吸烟者中至少有99人打鼾B.1个人患有心脏病,那么这个人有99%的概率打鼾C.
在100个心脏病患者中一定有打鼾的人D.
在100个心脏病患者中可能一个打鼾的人也没有123456789101112√解析:
在犯错误的概率不超过0.01的前提下认为这个结论是成立的,
其意义就是我们有99%的把握认为打鼾与患心脏病有关,在100个心脏病患
者中可能一个打鼾的人也没有,故D正确;对于A,题设中没有给出吸烟与
打鼾相关性判断,故A错误;对于B,独立性检验是对分类变量相关性的判
断,不能具体到个体,故B错误;对于C,在100个心脏病患者中可能一个
打鼾的人也没有,故C错误.故选D.
1234567891011122.
为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内
调查了120位学生,得到如下2×2列联表:是否喜欢体育锻炼性别合计男女喜欢ab73不喜欢c25合计74则a-b-c=(
)A.7B.8解析:根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21.∴a-b-c=52-21-22=9.C.9D.10√1234567891011123.
(2025·黑龙江一模)根据分类变量x与y的成对样本数据,计算得χ2=
2.826,依据α=0.05的独立性检验,结论为(
)A.
x与y不独立B.
x与y不独立,这个结论犯错误的概率不超过0.05C.
x与y独立D.
x与y独立,这个结论犯错误的概率不超过0.05解析:
零假设为H0:x与y独立,由χ2=2.826<3.841,依据α=0.05
的独立性检验,可得H0成立,故可以认为x与y独立.故选C.
√123456789101112
A.
=
B.
=2
C.
=2
D.
=4
√123456789101112
A.10B.11C.12D.13√123456789101112解析:
设被调查的男性人数为x,则女性人数为2x,依据题意可得列
联表如下:是否喜爱足球性别合计男性女性喜爱足球
不喜爱足球
合计x2x3x123456789101112
123456789101112二、多项选择题6.
每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两
家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具
体数据如下:公司文史男文史女理工男理工女甲10102010乙1520105123456789101112分析毕业生的选择意愿与性别的关联关系时,已知对应的χ2的值
x1≈1.010;分析毕业生的选择意愿与专业的关联关系时,对应的χ2的值
x2≈9.091,则下列说法正确的是(
)A.
有99.9%的把握认为毕业生的选择意愿与专业相关联B.
毕业生在选择甲、乙公司时,选择意愿与专业的关联性比与性别的关联
性更大一些C.
理工科专业的毕业生更倾向于选择甲公司D.
女性毕业生更倾向于选择乙公司√√√123456789101112解析:
由题知x2≈9.091,所以有1-0.005=99.5%的把握认为毕业
生的选择意愿与专业相关联,所以A不正确;由x2>x1,易知B正确;根据
题中的数据表可知,理工科专业的毕业生更倾向于选择甲公司,女性毕业
生更倾向于选择乙公司,所以C,D均正确.故选B、C、D.
1234567891011127.
晚上睡眠充足是提高学习效率的必要条件,某高中M的高三年级学生晚
上10点10分必须休息,另一所同类高中N的高三年级学生晚上11点休息,
并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所
高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高
中M有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学
习效率高的学生的概率是0.4,则(
)A.
高中M的前50名学生中有60%的学生学习效率高B.
高中N的前50名学生中有40%的学生学习效率高C.
有99.9%的把握认为学生学习效率高低与晚上睡眠是否充足有关D.
认为学生学习效率高低与晚上睡眠是否充足有关的犯错概率超过0.05√√123456789101112
学校学习效率高低合计学习效率高学习效率不高高中M302050高中N104050合计4060100123456789101112
123456789101112三、填空题8.
如图是调查某学校高一、高二年级学生参加社团活动的等高堆积条形
图,阴影部分的高表示参加社团的频率.已知该校高一、高二年级学生人
数均为600(所有学生都参加了调查),现从参加社团的同学中按分层随
机抽样的方式抽取45人,则抽取的高二学生人数为
.
27
1234567891011129.
随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼
时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体
育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学
生进行问卷调查,得到如下数据(10≤m≤20,m∈N*)支持不支持男生70-m10+m女生50+m30-m123456789101112若通过计算得,根据小概率值α=0.05的独立性检验,认为支持增加中学
生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加
中学生体育锻炼时间的人数的最小值为
.
66123456789101112四、解答题10.
(2024·全国甲卷理17题)某工厂进行生产线智能化升级改造.升级改
造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据
如下:优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150123456789101112(1)填写如下列联表:优级品非优级品甲车间乙车间能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?解:
填写如下列联表:优级品非优级品甲车间2624乙车间7030123456789101112则完整的2×2列联表如下:优级品非优级品总计甲车间262450乙车间7030100总计9654150
123456789101112
123456789101112
123456789101112
11.
为了了解空气质量指数(AQI)与参加户外健身运动的人数之间的关
系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到
体育公园参加户外健身运动的人数,并与当天AQI值(从气象部门获取)构成60组成对数据(xi,yi)(i=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年图书防伪技术与版权保护服务行业跨境出海战略分析研究报告
- 菏泽小升初试题及答案
- 护理助手静疗题库及答案
- 2026年俄语水平考试笔试模拟题
- 2026年版兼职人员合同协议
- 2026年二级建造师考试仿真题集
- 高中2025年郑和历史说课稿
- 2026年供销社仓储员考试模拟题
- 一 实现中华民族伟大复兴中国梦说课稿2025年高中思想政治高中习近平新时代中国特色社会主义思想学生读本
- 2026年注册会计师考试会计仿真题
- 星瀚金蝶系统介绍
- 2026吉林延边州州直事业单位招聘(含专项招聘高校毕业生)228人考试备考试题及答案解析
- 形式语义学中的预设与蕴含
- 2025届浙江省轨道交通运营管理集团有限公司校园招聘40人笔试参考题库附带答案详解
- 肺段切除专题培训培训课件
- 数据服务管理规范
- 数控镗床培训
- 海尔培训体系
- 干熄焦工艺培训课件
- 手术后贫血护理查房
- 新能源汽车压缩机课件
评论
0/150
提交评论