版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章成对数据的统计分析
模块一:本章知识思维导图
模块二:典型例题
经典题型一:线性回归方程
经典题型二:非线性回归方程
经典题型三:独立性检验
经典题型四:统计的综合应用
模块三:数学思想方法
①分类讨论思想②转化与化归思想③特殊到一般思想
模块一:本章知识思维导图
最小二
经验回
归方程
相关性t转化
非线性回
成归模型
对
数
据
分类2x2歹IJ
变量联表X?公式
模块二:典型例题
经典题型一:线性回归方程
例1.(2024•高三•天津•期末)学习于才干信仰,犹如运动于健康体魄,持之己久、行之愈远愈受益.为
实现中华民族伟大复兴,全国各行各业掀起了“学习强国〃的高潮.某老师很喜欢“学习强国〃中〃挑战答题〃模
块,他记录了自己连续七天每天一次最多答对的题数如下表:
天数X1234567
一次最多答对题数),12151618212427
参考数据:x=4,y=19,EY=]40,W>:=2695,£x.y.=600,76«2.45.
r=1i=li=l
相关系数一二
由表中数据可知该老师每天一次最多答对题数y与天数x之间是相关(填"正"或"负"),其相关系数
(结果保留两位小数)
【答案】正0.99
【解析】由表中数据得)'随x的推大而增大,
所以该老师每天一次最多答对题数y与人数x之间是正相关,
7
\>/一7回]
600-7x4x19I681_17
«0.99
7140-7X42*A/2695-7X!922X/72屈~7x2.45
故答案为:正:0.99.
例2.(2024•云南楚雄•一模)对具有线性相关关系的变量有一组观测数据(4.》)(/=1,2,-.,10),其
经验回归方程为£=-3.2X+。,且3=10,7=8,则相应于点(1057)的残差为.
3
【答案】-/0.6
【解析】,•经验回归直线亍=-3.2刀+4过样本点的中心(10,8),,8=—3.2x10+3.•.4=40,
二经验回归方程为》=-3.2工+4。.当工=10.5时,§,=-3.2X10.5+40=6.4,.•.残差为7—6.4=0.6.
故答案为:0.6.
例3.(2024嘀三•广东汕头•期中)以下4幅散点图所对应的样本相关系数不小的大小关系为.
3535:
3030-・・・・
2525■・・・.
20
15普…・・・・・・・・
1010-・・・・
55卜.................••・,・・.
0
05101520253035°05101520253035
(1)相关系数为.(2)相关系数为/*2
3535
3030
2525
2020
1515
1010
55
0,
°0510152025303505101520253035
(3)相关系数为/*3(4)相关系数为小
【答案】弓
【解析】根据散点图可知,图①③成正相关,图②④成负相关,所以,
又图①②的散点图近似在一条直线上,所以图①②两变量的线性相关程度比较高,图③④的散点图比
较分散,
故图③④两变量的线性相关程度比较低,即卬与"I比较大,历I与111比较小,
所以弓V〃〈与〈不
故答案为:4<4<4<耳
例4.(2024•高三・浙江•开学考试)已知成对样本数据(内方),(孙必),…,(乙,片)(〃?3)中入,与「'£互
不相等,且所有样本点(4y)(i=i,2,…⑼都在直线),=-枭+1上,则这组成对样本数据的样本相关系数
【答案】-1
【解析】因为所有样本点(4y,)(i=i,2,…,〃)都在直线),=-gx+1上,显然直线),=一]+1的斜率一;<0,
所以样本数据成负相关,相关系数为T.
故答案为:-I
例5.(2024•高三•上海嘉定•阶段练习)某产品的广告支出费用x(单位:万元)与销售额),(单位:万
元)的数据如下表:
X24568
y3040a5070
己知),关于x的线性回归方程为,v=6.5x4-15.1,则表格中实数a的值为
【答案】48
_..--.口一Z+4+D+O4-6u
【解Ar析r】由条件得不=------------=5,
则^=6.5x5+15.1=47.6,
uui1-30+40+4+50+70
所以,=-----------------=47.6,
解得。=48.
故答案为:48.
例6.(2024•陕西•二模)为了提岛市民参观的体验感,某博物馆需要招募若十志愿者对馆臧文物进彳丁整
理.已知整理所需时长y(单位:小时)与招募的志愿者人数x(单位:人)的数据统计如下表:
志愿者人数X12345
整理时长.y70m504035
⑴若£X=250,求),关于x的线性回归方程_v=bx+a:
r=1
⑵根据(1)中的线性回归方程,若博物饰诃划在20小时内完成对文物的整理工作,求博物馆至少需要招
募的志愿者人数.
fl__
八2内一〃”
附:线性回归方程f=/zr+2中,3=吟------------,a=y-bx.
“J沅2
1=1
5
【解析】(1)由于£乂=250,故7。+〃2+5。+40+35=250,「.加=55,
r=l
-1+2+3+4+5250s
则rllx=-----------------=3,y=------=50,
55
5
^xiZ.=1x70+2x55+3x50+4x40+5x35=665,
r=1
火萄2=『+22+32+42+52=55,
r=1
故/;=665e史50-8.5,4=50+8.5x3=75.5,
55-5x9
故?关于%的线性回归方程为y=-8.5X+77.5;
(2)令一8.5x+77.5W20,解得x26.76,而xeNL故工27,
故博物馆计划在20小时内完成对文物的整理工作,博物馆至少需要招募的志愿者人数为7.
例7.(2024•四川巴中・一模)下图是某市2016年至2022年生活垃圾无害化处理量y(单位:万吨)与
年份/的散点图.
-
-
-
-
-
S
i234567?
注:横轴为年份代码覃・7分别对
应2016-2022,纵轴为年生活垃
圾无害化处理取
⑴根据散点图推断变曷),与,是否线性相关,并用相关系数加以说明:
(2)建立y关于,的回归方程(系数精确到0.01),预测2024年该市生活垃圾无害化处理量.
参考数据:
£»=9.06,£//=39.33,£旧-»=0.36,万。2.646.
r-1r-li=l
参考公式:b=R---------,a=y-bt^相关系数〃=下%-------:---------
»〃尸\忙(1)2包-寸
f=|Vi=i/=i
【解析】(1)
根据散点图推断变量y与,线性相关,说明如下:
1+2+3+4+5+6+728/
由题意得/=--------------z--------------=—=4,
77
^(/.-F)2=(-3)2+(-2)2+(-1)2+02+12+22+32=28,
r=1
Z匕一7)(另一了)=》y一7方=39.33-4x9.06=3.09,
r=li=l
3.093.09
之
%,,=I-----------0.97
728x0.362x2.646x0.6
由了与,的相关系数约为0.97表明,y与,线性相关,相关程度相当高;
fl
9()6.Z("T)(凹一)')3()9
(2)由》=——。1.29以及(1)可得b=J------------------=^—«0.11,
7Z(-)228
1=1
则〃-历a1.29—0.11x4=0.85・
故y关于/的回归方程为=0.85+0.111,
将2024年对应的年份代码f=9代入回归方程得y=0.85+0.11x9=1.84
故预测2024年该市生活垃圾无害化处理量约为1.84万吨.
例8.(2024•全国•模拟预测)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促
进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入
结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为重庆市2014
2022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具
有线性相关关系.(数据来源于重庆市统计局2023-05-06发布).
年份201420152016201720182019202020212022
全体居民人均可支配收入
183522011022034241532638628920308243380335666
(元)
全年居民可人均可支配收入
40000
35000
30000
25000•
20000参考数据:£y=24.03,内内=133.39.
15000
100001=11=1
5000
0
20132014201520162017201820192020202120222023
图1
参考公式:对于一组数据(%,%),鱼,%),•・,(〃”,叱),其回归直线方程£=加+々的斜率和截距的最小二乘
估计分别为P=口-----------6=v-pu.
1=1
⑴设年份编号为X(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为
(单位:万元),求经验回归方程§,=九+&(结果精确到0.01),并根据所求回归方程,预测2023年重庆
市全体居民人均可支配收入:
(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,
将选出的人均可支配收入超过3万的年数记为X,求随机变量X的分布列与数学期望.
I191
【解析】(1)由题意得元=^x(l+2+•+9)=5,》=AZ>,=AX24O3=2.67,
yy,=iv
9
Ei%—5)~=16+9+4+1+0+1+4+9+16=60,
r=1
99
Z5,•-f)(y;-田=Zy=133.39-24.03x5=13.24,
/=1/=!
故,=2L_)""=x().22,a=y-hx=2.67-x5=1.57,
、工…6060
f=1
故回归方程为»=0.22X+1.57,
又2023年的年份编号为10,将x=10代入$,=0.22x+1.57,
得共3.77,即预测2023年重庆行全体居民人均可支配收入为3.77万元;
(2)由图表知,人均可支配收入超过3万的年份有3年,
故X的可能取值为0,1,2,3,
则P—。)塔鲁*=1)=警嗤
9=2)=普哈,唳=3)丹啥,
故随机变显X的分布列为:
X0123
2045181
p
84848484
故E(X)=0x含含2啜+3X古=1
经典题型二:非线性回归方程
例9.<2024・高三•重庆・开学考试)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响我们
的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这
个领域逐年加大投入,以下是近年来该公司对产品研发年投入额X(单位:百万元)与其年销售量),(单位:
千件)的数据统计表.
X123456
y0.511.53612
z=lny-0.700.41.11.82.5
⑴公司拟分别用①和②y=eim两种方案作为年销包量》关于年投入额入,的回归分析模型,请根
据已知数据•,确定方案①和②的经验回归方程;(“〃,〃?,〃计算过程保留到小数点后两位,最后结果保留到
小数点后一位)
⑵根据下表数据,用决定系数2(只需比较出大小)比较两种模型的拟合效果哪种更好,并选择拟合精度
更高的模型,预测年投入额为7百万元时,产品的销售量是多少?
经验回归方程y=bx4-aJ-C™
残差平方和18.290.65
J=1
2(苍一可5一份E(x-z)2
参考公式及数据:b=-----------------,a=y-bx,R2=IT-,---------=⑵,£%;=91,
2
t(y^-y)r=l
1-1
283
£xfz.=28.9,z=l(-0.7+0+0.4+1.1+1.8+2.5)=0.85,e«16.5,e«20.1.
r=16
1+2+3+4+5+6__0.5+1+1.5+3+6+12
【解析】(1)x==3o5y=-------------------=4,
—o
所以'J-4=j乂_工35
91-6x3.5217.517.5
所以y=2.Lr_3.4.
由y=e3'",两边取以e为底的对数得ln),=〃t+〃7,g|Jz=fix+/nr
28.9-6x3.5xQ.8511.05
=0.63,m=0.85-x3.5=-1.36
91-6x3.52--17.517.5
所以z=0.63.r-1.36,所以y=eoar-L4.
(2)支=(0.5-41+(1-4)2+(1.5-4『+(3-41+(6-4)2+(12-4)2=96.5,
r-1
对于y=2.1x—3.4,对于),=e06x-g,^=1--,
96.596.5
所以②的拟合效果好,当x=7时,预测值),=e06my=e28Bi6.5千件.
例10.(2024•四川内江•一模)某企、也为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资
金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额/(单位:亿元)的影响,通过对“十二五〃
和“十三五〃规划发展10年期间年研发资金投入额可和年盈利额y,(i=L2,,10)数据进行分析,建立了两个
函数模型:),=/",,其中夕、夕、4、,均为常数,c为自然对数的底数,令%=x;,
匕=In),,&=1,2,,10),经计算得如下数据:
工=265=215斤=6807=5.36
10101010
Z(〃产万y=22500Z(4一))()。一刃=260
ND』。。丑(X-灯=4
/=l/=!/=!1=1
^in(.-v)-,=410
vZG—可(匕与)=18
1=1
⑴请从相关系数的角度,分析哪一个模型拟合度更好?
(2)根据(1)的选择及表中数据,建立)'关于x的回归方程.(系数精确到0.01)
.EG-可5-切
回归直线.夕=去+4中:B=------------,a=y-bx.
J2
L/=1U-)
【解析】(1)设模型,=。+方丁的相关系数为6,模型),=/x”的相关系数为弓,
对于模型产a+/产,令〃=/,即y=a+例,
所以「,鼬一中一方二^^。.87,
混(—『国仃)2
对于模型3=e石”,有干y=lne'**=1x+f,令u=lny,即y=Ar+,,
营(七一元)(4-万)18
所以&=下-------7F-----:=旃石="9,
出门)-加―)-Soo”
因为4〈乃,所以模型1=/“拟合度更好.
八£(x.-x)(vr.-v)[8
(2)因为』-----------=—=0.18,r=V_=5.36-0.18X26=0.68,
鼠—)-100
所以y关于X的回归方程为y=c°,8x+068.
例11.(2024•全国•模拟预测)近三年的新冠肺炎疫情对我们的生活产生了很大的影响,当然也影响着我
们的旅游习惯,乡村游、近郊游、周边游热闹了许多,甚至出现“微度假〃的概念.在国家有条不紊的防疫政
策下,旅游又重新回到了老百姓的日常生活中.某乡村抓住机遇,依托良好的生态环境、厚重的民族文化,
开展乡村旅游.通过文旅度假项目考察,该村推出了多款套票文旅产品,得到消费者的积极回应.该村推
出了六条乡村旅游经典线路,对应六款不同价位的旅游套票,相应的价格x与购买人数y的数据如下表.
旅游线路奇山秀水游古村落游慢生活游亲子游采摘游舌尖之旅
套票型号ABCDEF
价格X/元394958677786
经数据分析、描点绘图,发现价格x与购买人数y近似满足关系式),=以'(〃>0力>0),即
Inv=/?lnx+ln«(«>0,Z?>0),对上述数据进行初步处理,其中匕=111菁,%=lny,/=1,2,...»6.
附:①可能用到的数据:尤匕"=75.3,£>=24.6,£>=18.3,复;=101.4.
1=1f=l1=1f=l
②对于一组数据(匕,卬2),(匕,叫),…,(匕,叱),其回归直线丘=加+&的斜率和截距的最小二乘估计值分
.Z(匕一少)(叱一讨)z4吗一〃丽
别为3=~~n=,a=W-bv.
力(—I力;-而
1=11=1
⑴根据所给数据,求了关于X的回归方程.
⑵按照相关部门的指标测定,当套票价格xe[49,81]时,该套票受消费者的欢迎程度更高,可以被认定为"热
门套票现有三位游客,每人从以上六款套票中购买一款旅游,购买任意一款的可能性相等.若三人买的
套票各不相同,记三人中购买“热门套票”的人数为X,求随机变量X的分布列和期望.
【解析】(1)散点(%叱)=(i=12…,6)集中在一条直线附近,
|616
设回归直线方程为六挣=4』,%£%=3.。5,
Z匕叱-6viv
75.3-6x4.1x3.05
则/;=i=l________a=iv-Z>v=3,O5--x4.1=l.
IO1.4-6x4.122
EV,2-6V2
I=I
所以回归直线方程为w=gu+l.
因为匕=1]】凡,H;=Iny\,所以Inyutinx+1,则Z?=g,Ina=\,所以丫二酬:.
22)—3
综上,y关于x的回归方程为'
(2)由题意知8,C,D,E为“热门套票〃,则三人中购买"热门套票"的人数X服从超几何分布,
X的可能取值为1,2,3,且P(X=1)=等=:,P(X=2)=萼=],P(X=3)=1^=1.
例12.(2024・高三・全国・专题练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9x9盘面
上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3x3)内的数字均含1〜
9,且不重更.数独爱好者小明打算报名参加“丝路杯〃全国数独大赛初级组的比赛.
参考数据/=,:
王
t
r=1f=l
17500370.55
参考公式:对于一组数据(〃/),(〃2,%),,(〃”,匕),其经验回归方程U=〃+如的斜率和截距的最小二乘估计
ZM匕一〃
分别为/二上i二-,a=v-。".
口,=|”加
⑴赛前小明进行了一段时间的训练,每天解题的平均速度M秒/题)与训练天数M天)有关,经统计得到如卜.
数据:
M天)1234567
N秒/题)910800600440300240210
现用),=〃+2作为回归方程模型,请利用表中数据,求出该回归方程;(〃,〃用分数表示)
X
⑵小明和小红玩“对战赛〃,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定
先胜3局者赢得比赛.若小明每周获胜的概率为:,且各局之间相互独立,设比赛X局后结束,求随机变
量X的分布列及均值.
【解析】(1)
解:因为y=。+2川=',所以$=》+%.
XXj
-910+800+600+440+300+240+210
因Iliq为尸---------------------------------=500,
_1750-7x0.37x500_455_9100
所以〃:T---------
().55~(155~II
i-i
所以。=亍_)=500_岑2*0.37=号手
21339100
所以y=----+-----1
1111
71wQIr)n
所以所求回归方程为),=答+竽.
111lx
(2)随机变量X的所有可能取值为3,4,5,
2II
P(X=3)=(Q)3+()3
JJJ
P(X=4)=C#"2+C#丫2L9
'7313)33D3327
2
)=呜12]_
P(X=5xx
沁133)3
所以随机变量X的分布列为
例13.(2024•高三•重庆渝中•期中)当前,新一轮科技革命和产业变革蓬勃兴起,以区块桂为代表的新
一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:
年份201720182019202020212022
编号X123456
企业总数量)'(单位:百个)5078124121137352
⑴若用模型y=〃e侬拟合y与X的关系,根据提供的数据,求出F与工的经验回归方程;
(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区
块钱公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参
加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公
司获得此次信息化比赛的“优胜公司已知在每场比赛中,甲胜乙的概率为:,甲胜丙的概率为:,乙胜丙
的概率为I3,若首场由甲乙比赛,求甲公司获得“优胜公司〃的概率.
66
参考数据:»>,=285»>必=10605,其中,%=Iny
参考公式:对于一组数据(七,£)[=1,2,3,…,〃),其经验回归直线$=公+6的斜率和截距的最小二乘估计分
2七》一,沅吓
别为6---------,a=y-bx
1=1
【解析】(1)令〃=lny=lnae'"=/?x+lri4,
-1+2+3+4+5+6一一
A==3.5,w=
66
Vx.u.-nxu
106.05—6x3.5x4.75
贝匹号----------=0.36,
I2+22+32+42+52+62-6X(3.5)2
1=1
Ina=4.75-0.36x3.5=3.49,所以a
0.36alJ.36x-3.49
所以),=e349.e,i=e
(2)设甲公司获得“优胜公司〃为事件A,
则();1123112113
PA=X—+—X—X—X—+—X—X—X—
32352253210
所以甲公司获得“优胜公司〃的概率为最3.
例14.(2024•高三•广东广州•阶段练习)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶
类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:°C)关于时间x(单位:min)的I可归
方程模型,通过实验收集在25P室温,用同•温度的水冲泡的条件下,茶水温度随时间变化的7组数据,
井对数据做初步处理得到如图所示散点图以及如表所示数据.
茶水温度/℃
9o-
8o•
一
7o-
6o
一
5o1
4O一
5>
0!■]II»
23456时间/min
77__
-y)工(七一工)(吗_卬)
yW
1=1r=l
73.53.8595-2.24
表中:叫=ln(»-25),w=-^vz
⑴根据散点图判断,①尸。+防与②),=小。'+25哪一个更适宜作为该茶水温度),关于时间x的回归方程
类型?(给出判断即可,不必说明理由)请根据你的判断结果及表中数据建立该茶水温度),关于时间x的回
归方程;
⑵已知该茶水温度降至6(FC口感最佳,根据(1)中的回归方程,求在相同条件下冲泡的茶水,大约需要
放置多长时间才能达到最佳饮用口感?
附:(1)对于一组数据(百,))(0%),…,(3,几),其回归直线y=G+"r的斜率和截距的最小二乘估计
分别为/=『------------,d=y-flx-
£(X-f)2
r=l
08409
(2)参考数据:e-0«0.92.e«60,In7al.9,ln3»l.l,In2«0.7
【解析】(1)
由散点图知,更适宜的回归方程为②,即y=/c'+25.
由产=//+25,得>一25=小犬,两边取自然对数,得ln(y-25)=hW+xlnc,
令“=In(y-25),则停=\nd+.vine,
—1L0+1+2+3+4+5+6/—\2/0\2/z1\212与2co
X=一工玉=------------------=3o,二(若一x)=(—3厂+(—2厂+(—1/+「+2-+3~=28,
7r=l7;=|
7__
叱-卬)_224
结合表中数据,得lnc=『-----------=f_=—o.()8,
Z(f228
r=1
结合参考数据可得cne/08«0.92,由lm/=iP-Rnc=3.85-3x(T).08)=4.09,得,/=€409*60:
所以茶水温度y关于时间x的回归方程为v=60x0.92'+25.
(2)依题意,25。(2室温下,茶水温度降至60。(2口感最佳,
60-9S
即60=60x0.92”+25,整理得Mn0.92=In——,
60
于是jdn0.92=ln7-21n2—ln3*-0.6,解得人。^^=7.5,
—0.08
所以在相同条件下,刚泡好的茶水大约需要放置7.5min才能达到最佳引用口感.
例15.(2024•高三•全国•竞赛)预制菜指以农、畜、禽、水产品为原辅料,配以调味料等经预选、调制
等工艺加工而成的半成品.近几色预制菜市场快速增长,某城市调查近4个月的预制菜市场规模),(万元)
得到如表所示的数据,根据数据得到),关于工的非线性回归方程
X1234
yese4e5e6
按照这样的速度,预估第8个月的预制菜市场规模是万元.(结果用e表示)
【答案】尚
—
,.Ax...1+2+3+45-3+4+5+69
【解析】由题设,令z=lny=—a,则工=---------=-,z-----------=—
5242
91X
所以一二——a=>a=-4,则z=In£=二+4,
22'5
2X,8
所以x=8代入回归方程,则2=m$,=不,可得》=e不万元•
故答案为:J
例16.(2024•高二•四川遂宁•阶段练习)某池塘中水生植物的覆盖水塘面积x(单位:山、)与水生植
物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型y=ce,c>0)去拟合x与y的关系,设
z=lny,x与z的数据如表格所示:
X3467
z22.54.57
得到人与z的线性回归方程》=12i+》,则。=1
【答案】e2/\
【解析】由已知可得,x=-一^=5,z=-—一^一二4,
44
所以,有4=1.2x5+。,解得4二一2,
所以,z=l.2x-2,
由z=lny,得lny=1.2x-2,
所以,3'=c12"2=c2-e,2r,贝iJc=e-t
故答案为:e-2
例17.(2024•高二・内蒙古巴彦淖尔-阶段练习)在研究两个变最的相关关系时,观察散点图发现样本点
集中于某一条指数曲线y=d…的周围.令学=加),,求得线性回归方程为展=0.25元_2.58,则该模型的
非线性回归方程为.
【答案】y=e°-8
【解析】由I可归直线方程:=025(—258,*=lny得:ln)'=0.25x-2.58,
整理得:y=e'"S8,
所以该模型的回归方程为.V=/25一58.
故答案为:工/必①
经典题型三:独立性检验
例18.(2024•高一•江苏苏州•期末)为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽
取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的?,女性喜爱足球的人数占女性人数的《,若
63
本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关〃的结论,则被调查的男性至
少有()人
2
2_n(ad-be)
(a+b)(c+d)(a+c)(b+d)
a0.100.050.010.0050.001
Xa2.7063.8415.6357.87910.828
A.11B.12C.13D.14
【答案】B
【解析】设男性人数为〃,依题意,得2x2列联表如下:
喜爱足球不喜爱足球合计
5kk_
男性k
~66
2k4k
女性TT2k
3k3k
合计
~2~23k
QkXkk2k、,
3k(---------------------)-
则/的观测值为二=-633A63/2k
k-2k----------T
22
因为本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,
2k
于是/之7.879,g|J—>7.879,解得kNll.8185,而丘N”,因此心,=已
故选:B
例19.(2024・高三・全国-专题练习)已知P(/^6.635)=0.01,P(/^10.828)=0.001.在检验喜欢某
项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到/=7.235,则根据小概率值。=
的/独立性检验,分析喜欢该项体育运动与性别有关.
【答案】0.01
【解析】因为6.635<7.235<10.828,所以根据小概率值。=0.01的/独立性检验,分析喜欢该项体育运动与
性别有关.
故答案为:0.01.
例20.(2024•高二•仝国-课后作业)下面是2x2列联表:
y
X
X%总计
为a2173
巧22527
总计b46100
则4+b=.
【答案】106
【解析】«=73-21=52,/?=100-46=54,
所以。+〃=106.
故答案为:106
例21.(2024•山东淄博-模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调杳.
统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄
[20,30)[30,40)[40,50)[50,60]
次数
每周0~2次70553659
每周3~4次25404431
每周5次及以上5b2U1U
⑴若把年龄在[20,40)的锻炼者称为青年,年龄在140.60]的锻炼者称为中年,每周体育锻炼不超过2次的称
为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值。=0.01的独立性检验判断体育锻炼
频率的高低与年龄是否有关联;
⑵从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8
人,再从这8人中随机抽取3人,记这3人中年龄在口0,40)与[50,60]的人数分别为*)4=以-丫|,求。
的分布列与期望:
⑶已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中
选择一种,己知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期
122
天选择跑步的概率分别为求小明星期天选择跑步的概率.
n(ad-bc'Y
参考公式:z2=»n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
附:
a0.100.050.010.0050.001
Xa2.7063.8416.6357.87910.828
【解析】(1)零假设:儿体育锻炼频率的高低与年龄无关,
由题得2x2列联表如下:
青年中年合计
体育锻炼频率低12595220
体育锻炼频率高75105180
合计200200400
2「400x(125x105-75x95)2
Z—一200x2(X)x220x180y9091>6.635,
根据小概率值a=0.01的独立性检验推断从不成立,
即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.
(2)由数表知,利用分层抽样的方法抽取的8人中,年龄在[30,40),[50,60]内的人数分别为1,2,
依题意,€的所有可能取值分别为为0,1,2,
C3c'C120
所以「(4=0)=。(*=0,丫=0)+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 京东物流经理招聘面试全攻略
- 餐饮业餐厅经理顾客满意度与成本控制绩效考评表
- 互联网公司运营与维护绩效评定表
- 食品研发工程师的工作绩效考核表
- 艺术培训机构教具采购质量问题情况说明
- 2026年车辆伤害专项应急预案+现场处置方案
- 2025-2026学年经济法教学设计
- 2025-2026学年知到地理教学设计答案
- 2025-2026学年教学设计缺点评价
- 公司财务部内部自查制度
- 保安分包投标详细评审标准
- 用乐句和乐段来说话的音乐
- 法理学(初阶)付子堂
- 会展策划实务-第三章
- GB/T 8923.1-2011涂覆涂料前钢材表面处理表面清洁度的目视评定第1部分:未涂覆过的钢材表面和全面清除原有涂层后的钢材表面的锈蚀等级和处理等级
- 2023年江苏农林职业技术学院高职单招(语文)试题库含答案解析
- 桥梁混凝土裂缝处理专项方案设计
- 酒水概述课件
- 5女性睡眠障碍徐文安课件
- 汉字听写大会竞赛题库及答案
- 2023小学教师资格证教育教学知识与能力简答题小抄
评论
0/150
提交评论