版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§9.4列联表与独立性检验
【考试要求】1.通过实例,理解2X2列联表的统计意义2通过实例,了解独立性检验及其应用.
■落实主干知识
【知识梳理】
1.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机
变量称为分类变量.分类变量的取值可以用实数表示.
2.列联表与独立性检验
⑴关于分类变量X和y的抽样数据的2X2列联表:
Y
X合计
Y=0r=i
x=oaba+b
X=1cdc+d
合计a+cb+d〃=a+6+c+d
(2)计算随机变量/=伍+〃)(;,瑟?:)3+廿,利用Z2的取值推断分类变量X和y是否独立
的方法称为/独立性检验.
如表为5个常用的小概率值和相应的临界值.
ft0.10.050.010.0050.001
Xa2.7063.84】6.6357.87910.828
【思考辨析】
判断下列结论是否正确(请在括号中打“J”或“X”)
(1)2X2列联表中的数据是两个分类变量的频数.(J)
(2)事件4和B的独立性检脸无关,即两个事件互不影响.(X)
(3)/的大小是判断事件A和B是否相关的统计量.(V)
(4)在2X2列联表中,若|"一切越小,则说明两个分类变量之间关系越强.(X)
【教材改编题】
1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200
名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下
列最适合的统计方法是()
A.均值B.方差
C.独立性检验D.回归分析
答案C
解析由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.
2.如表是2X2列联表,则表中小〃的值分别为()
V)'2合计
XIa835
X2113445
合计b4280
A.27,38B.28,38
C.27,37D.28,37
答案A
解析4=35—8=27,b=a+11=274-11=38.
3.已知paeeesAo.oi,尸(PNIOMS^O.OOI.在检验喜欢某项体育运动与性别是否有关
的过程中,某研究员搜集数据并计算得到Z2=7.235,则根据小概率值。=的Z2独立
性检验,分析喜欢该项体育运动与性别有关.
答案0.01
解析因为6.635V7.235V10.828,所以根据小概率值。=0.01的3独立性检验,分析喜欢该
项体育运动与性别有关.
■探究核心题型
题型一列联表与m的计算
例I(1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调杳了120
位学生,得到如下2X2列联表:
男女合计
喜欢ab73
不喜欢C25
合计74
则a—b—c等于()
A.7B.8C.9D.10
答案C
解析根据题意,可得c=120—73—25=22,a=74—22=52,。=73—52=21,
补充完整2X2列联表为:
男女合计
喜欢522173
不喜欢222547
合计7446120
:.a-b-c=52-2\-22=9.
(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调
查统计,结果如表:
体育课不及格体育课及格合计
文化课及格57221278
文化课不及格164359
合计73264337
在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到/的值为()
A.1.255B.38.214
C.0.0037D.2.058
答案A
---------------......
I(a+0)(c+d)(。一c)(b+J)
337X(57X43-16X221)2
278X59X73X264'
思维升华2义2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.
跟踪训练1某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工
作,在如表“性别与会外语”的2X2列联表中,〃+〃+d=.
会外语不会外语合计
男ab20
女6d
合计1850
答案44
解析由题意得a+〃+d+6=50,
所以a+b+d=50—6=44
题型二列联表与独立性检验
否准点与客车所属公司有关.
思维升华独立性检脸的一般步骤
(1)根据样本数据制成2X2列联表.
(2)根据公式/=(〃+3(cl晟Jc)3+m计算•
(3)比较尤与临界值的大小关系,作统计推断.
跟踪训练2为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得
不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A
组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,
整理数据后获得如下列联表:
单位:人
认知情况
年龄段合计
知晓不知晓
4组(90后与00后)7525100
B组(70后与80后)4555100
合计12080200
______〃(ad-be)2______
附:/2=“=〃+〃+c+d.
(a+力)(c+d)(q+c)(b+d)
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
(1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取
16人,问应在A组、B组中各抽取多少人?
(2)能否依据小概率值。=().001的独立性检验,分析对“绿色消费”意义的认知情况与年龄
有关?
解(1)由题意知,在A组中抽取的人数为16X卤=10.在8组中抽取的人数为16X询=6.
(2)零假设为”o:对“绿色消费”意义的认知情况与年龄无关.
200X(75X55-25X45)2
由题意,得/=
120X80XI00X100—18.75>10.828-A'O.OOI,
故依据小概率值a=0.001的独立性检验,推断〃。不成立,即认为对“绿色消费”意义的认
知情况与年龄有关.
题型三独立性检验的综合应用
例3体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案⑵)20一
2030)》(卜面简称“体白健康促进行动方案”)中明确提巴青少年学生每天在校内参与不少于
60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运均受到
各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育
运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1000名学
生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到如表数据:
数学成绩(分)[30,50)150,70)[70,90)[90,110)[110,130)1130,150]
人数(人)2512535030015059
运动达标
104514520010743
的人数(人)
约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前
50%以内(含50%)的为“数学成绩达标”.
(1)求该中学高三年级本次月考数学成绩的65%分位数;
(2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值
作代表);
(3)请根据已知数据完成下列列联表,并根据小概率值。=0.001的独立性检验,分析“数学成
绩达标”是否与“运动达标”相关.
数学成绩达标人数数学成绩不达标人数合计
运动达标人数
运动不达标人数
合计
附:彳=m+〃)(c+V)(4+c)S+")(〃=a+b+c+①.
a0.0100.0050.001
Xa6.6357.87910.828
解(1)每组的频率依次为0.025,0.125,0.350,0.300,0.150,0.050,
V0.025I0.125I0.350=0.500<0.65,0.025I0.125I0.350I0.300=0.800>0.65,
_0.500+0.800
且-----5------=0.65,
高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100,
该中学高三年级本次月考数学成绩的65%分位数为100.
(2)该中学高三年级本次月考数学成绩的平均分
A=0.025X40+0.125X60+0.350X80+0.300X100+0.I50X120+0.050X140=91.50.
估计该中学高三年级本次月考数学成绩的平均分为91.50分.
(3)列联表如表所示:
数学成绩达标人数数学成绩不达标人数合计
运动达标人数350200550
运动不达标人数150300450
合计5005001000
零假设为儿:“数学成绩达标”与“运动达标”无关,
,1000X(350X30()一2(X)X150)21000
元=550X450X500X500=-^909>1°-828=^ooi,
・•・根据小概率值a=0.001的独立性检验,推断M)不成立,即认为“数学成绩达标”与“运
动达标”有关.
思维升华独立性检脸的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往
按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往
用小题的形式,而且炉的公式一般会在原题中给出.
跟踪训练3某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店
的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表
示在5个区域开设分店的个数,),表示这x个分店的年收入之和.
1(个)23456
N十万元)2.5344.56
(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求),关于x的经验回归方程;
(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下
统计数据,,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的
顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值a=0』的独立性检验,分析
两个店的顾客下单率有无差异.
5>必一〃xy
AA_____A________n(ad-be)?_____
参考公式:b=---------,a=y-bx(4+0)(c+")m+c)S+G'如=2.706
n一
"一〃x-
—2+3+4+5+6
解(1)由题意可得,x=-----c------=4,
2.5+3+4+4.5+6
=--------£--------=4
5
2>M=2X2.5+3X3+4X4+5X4.5+6X6=88.5,
2L-r?=22+32+424-52+62=90,
设),关于x的经验回归方程为),=取+。,
5_____
2>7Vr-5Xy
i=l88.5-5X4X4
则方=90-5X42=0-85,
5x
a=y-bx=4-0.85X4=0.6,
・・・y关于x的经睑回归方程为y=0.85x+0.6.
(2)零假设为为:两个店的顾客下单率无差异,则
由题意可知2X2列联表如表所示:
不下单下单合计
分店一25530
分店二602080
合计8525110
.、110X(25X20-5X6()产44.
"=30X80X85X25=5T^°-863<2-706=x°H
・•・根据小概率值。=0』的独立性检验,没有充分证据推断〃。不成立,即两个店的顾客下单
率没有差异.
课时精练
网基础保分练
1.观察卜.列各图,其中两个分类变量乂,,之间关系最强的是()
D
答案D
解析观察等高堆积条形图易知D选项两个分类变量之间关系最强.
2.下列关于独立性检验的说法正确的是()
A.独立性检验是对两个变量是否具有线性相关关系的一种检验
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.利用/独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关
系时,则我们可以说在10。个吸烟的人中,有99人患肺病
D.对于独立性检验,随机变量/的值越小,判定“两变量有关系”犯错误的概率越大
答案D
解析对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,
并非检验二者是否是线性相关,故错误;
对于B,独立性检脸并不能100%确定两个变量相关,故错误;
对于C,99%是指“抽烟”而“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,
故错误;
对于D,根据卡方计算的定义可知该选项正确.
3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:
流感
药物
患流感未患流感
服用218
未服用812
下表是片独立性检验中几个常用的小概率值和相应的临界值:
a0.10.050.010.005
Xa2.7063.8416.6357.879
根据表中数据,计算/=/上夕匕/川若由此认为“该药物预防流感有效果”,
9十O3)(c”十a)(a十c)(b十a)
则该结论出错的概率不超过()
A.0.05B.0.1C.0.01D.0.005
答案A
5KL,40X(2X12—8X18)2
解析由题意知,x~=17xadx-=4.8>3.841=炖,05,
11JADUAZUAZU
由临界值表可知,认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.
4.(多选)(2022・郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,
收集整理数据后将所得结果填入相应的2X2列联表中,由列联表中的数据计算得/弋9.616.
参照附表,下列结论正确的是()
附表:
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
A.根据小概率值a=0.001的独立性检验,分析认为“药物有效”
B.根据小概率值a=O.OOI的独立性检验,分析认为“药物无效”
C.根据小概率值。=0.005的独立性检验,分析认为“药物有效”
D.根据小概率值1=0.005的独立性检验,分析认为“药物无效”
答案BC
解析因为三-乡方压,所以7.879</2<10.828,所以根据小概率值a=0.001的独立性检脸,
分析认为“药物无效”.
根据小概率值。=0.0()5的独立性检验,分析认为“药物有效”.
5.(多选)(2023・南通模拟)根据分类变量x与),的观察数据,计算得到依据表中给
出的Z2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是()
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
A.根据小概率值a=0.05的独立性检验,分析变量x与),相互独立
B.根据小概率值a=0.05的独立性检验,分析变量x与),不相互独立
C.变量x与),相互独立,这个结论犯错误的概率不超过0.1
D.变量工与),不相互独立,这个结论犯错误的概率不超过0.1
答案AD
2
解析因为/=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.
6.为考查某种营养品对儿童身高增长的影响,选取部分」童进行试验,根据100个有放回简
单随机样本的数据,得到如下列联表,由表可知下列说法正确的是()
身高
营养品合计
有明显增长无明显增长
食用a1050
未食用b3050
合计6040100
参考公式"=5+/+〃)3+。3+/其中〃=。+"+°+”
参考数据:
a0.10.050.01G.0050.001
2.7063.8416.6357.87910.828
Xa
A.a=/?=3()
B.12.667
3
C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是,
D.根据小概率值。=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响
答案D
解析由题可知。=50—1。=40,6=50—30=20,所以A错误;
,100X(40X30—l()X20>
元=50X50X60X40F6.667>10.828=xo.ooi,
所以根据小概率值a=0.001的独立性检验,
可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;
从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是4湍0=(2
所以C错误.
7.如表是对于“喜欢运动”与性别是否有关的2X2列联表,依据表中的数据,得到
A(结果保留到小数点后3位).
喜欢运动不喜欢运动合计
男402868
女51217
合计454085
答案4.722
小,L、85X(40XI2-28X5)2
解析?=-------------------7”
Mdz45X40X68X17
8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:
注意力稳定注意力不稳定
男生297
女生335
则尤=(精确到小数点后三位),依据概率值a=0.05的独立性检验,该实验
该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).
答案0.538支持
解析由表中数据可知。=29,b=7,c=33,d=5,〃=a+Z?+c+d=74,
----n(ad-bcf----
识然/3+c)(c+(l)(b+d)(a+by
?_________74X(145-23iy_________
计算可知LQ9+33)x(33+5)x(7+5)X(29+7/0538《841=xo.os,
所以没有充分证据认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
9.(2021•全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为
了比较两台机床产品的质量,分别用两台机床各生产了2。。件产品,产品的质量情况统计如
下表:
一级品二级品合计
甲机床15050200
乙机床12080200
合计270130400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值«=0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差
异?
______n(ad-be?______
附:〃=4+〃+c+d.
r=(a+b)(c+d)(a+c)(b+d)
a0.050.010.001
3.8416.63510.828
Xa
解(1)根据题表中数据知,甲机床生产的产品中一级品的频率是瑞=0.75,乙机床生产的产
1UU
品中一级品的频率是1端20=06
(2)零假设为Ho:甲机床的产品质量与乙机床的产品质量无差异,
根据题表中的数据可得
、400X(15()X80—120X50。
犬一_2UOX2UUX27UX130
400
=39公10.256>6.635=xo.oi,
所以依据小概率值a=0.01的独立性检验,推断从不成立,即认为甲机床的产品质量与乙机
床的产品质量有差异.
10.某花圃为提高某品种花苗质量,开展技术创新活动,A,8在实验地分别用甲、乙方法培
育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,
将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为
优质花苗.
(1)求图中。的值,并求综合评分的中位数;
(2)填写下面的2X2列联表,并根据小概率值a=O.OI的独立性检验,分析优质花苗与培育方
法是否有关,请说明理由.
优质花苗非优质花苗合计
甲培育法20
乙培育法10
合计
______Mad-bcf______
附:Z2=其中〃=a+/;+c+d.
(a+Z?)(c+d)(a+c)(b+d)
a0.10.050.010.0050.0()1
Xa2.7063.8416.6357.87910.828
解(1)由直方图的性质可知,0.005X10+0.010X10+0.025X10+10a+0.020X10=1,
解得a=0.040,
因为(0.02+0.04)X10=0.6>0.5,所以中位数位于[80,90)内,
设中位数为x,则有0.020X10+0.040X(90-4)=0.5,解得彳=825
故综合评分的中位数为825
(2)由(1)得优质花苗的频率为0.6,
所以样本中优质花苗的数量为60,
得如下列联表:
优质花苗非优质花苗合计
甲培育法203050
乙培育法401050
合计6040100
零假设为以):优质花苗与培育方法无关,
100X(20X10—30X40)2
K=60X40X50X50~16.667>6.635=xo.oi,
所以根据小概率值a=0.01的独立性检验,推断从不成立,即认为优质花苗与培育方法有关.
区综合提升练
11.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只
基因编辑小鼠对该病毒疫苗进行实验,得到如下2X2列联表(部分数据缺失):
被某病毒感染未被某病毒感染合计
注射疫苗1050
未注射疫苗3050
合计30100
计算可知,根据小概率值〃=的独立性检验,分析”给基因编辑小鼠注射该种疫苗
能起到预防该病毒感染的效果”()
______n(ad-be)2______
附:/=〃=a+〃+c+d.
m+〃)(e+4)(a+c)(Z?+d),
a0.10.050.010.005().001
Xa2.7063.8416.6357.87910.828
A.0.001B.0.05
C.0.01D.0.005
答案B
解析完善2X2列联表如下:
被某病毒感染未被某病毒感染合计
注射疫苗104050
未注射疫苗203050
合计3070100
零假设为”o:”给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.
E、L,100X(10X30—40X20)2
1
因为/=—丁1一/14.762,3.841<4.762<6.635,
JUA/uA入DU
所以根据小概率值。=().05的独立性检验,推断不成立,
即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”.
12.(多选)有两个分类变量X,Y,其列联表如表所示.
Y
X合计
Y2
X1a20-a20
X215—a30+a45
合计155065
其中a,\5-a均为大于5的整数,若依据a=0.05的独立性检验可以认为X与丫有关,则a
的可能取值为()
A.6B.7C.8D.9
答案CD
解析根据〃>5且15-a>5,a£Z,知〃可取6,7,8,9.由表中数据及题意,得
265义[。(30+。)一(15—4)(20-4)]213X(134—60)2、姓笳知防w的
彳—20X45X15X50120X45X3X2-刈出,2口选人,知"的可能
取值为89
q拓展冲刺练
13.(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得至J如下
列联表:(单位:人),则()
晕机
性别合计
晕机者未晕机考
男a15C
女6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 进产房要签什么协议书
- 超声检查常规操作流程
- 物业接管验收协议书
- 天丝五十年协议书
- 文明礼貌行为规范
- 精神疾病患者居家护理与康复指南
- 2026四川泸州龙马潭区人民医院招聘3人备考题库附参考答案详解(模拟题)
- 肺源性心房纤颤预防措施
- 2026山西晋中市寿阳县国有资本运营有限公司及下属公司中高层管理人员招聘12人备考题库附参考答案详解(完整版)
- 2026江苏苏州高新区实验初级中学招聘1人备考题库及参考答案详解(满分必刷)
- 白塞病口腔溃疡的护理对策
- 2026年山西单招旅游大类文化素质模拟卷含答案语数英合卷
- DB31∕T 634-2020 电动乘用车运行安全和维护保障技术规范
- 《光伏材料检测技术》课件-太阳电池生产过程中光学性能检测
- 焦油事故应急预案(3篇)
- 2025年智联招聘国企笔试题库及答案
- 专升本生物专业2025年分子生物学测试试卷(含答案)
- 不锈钢管常用标准及规格参考表
- 铝锭交易居间合同范本
- 铁路轨枕防腐施工方案
- 2026年淮南师范学院单招职业适应性考试题库1
评论
0/150
提交评论