版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
10.8概率统计的综合问题
会综合利用概率统计知识,解决频率分布直方图、回归模型、独立性检验与分布列的综
合问题.
考点1频率分布直方图与分布列的综合
【例1】为提高学生的环保意识,某大学举办了一次环保知识竞赛,并从所有参赛大
学生中随机抽取了100人,统计发现他们的竞赛分数均分布在[450,950]内,根据调查的结
果绘制了竞赛分数的频率分布直方图,如图所示.分数不低于850分的学生被称为“特优选
手”.
(1)求a的值,并估计该校学生竞赛分数的第70百分位数和平均数(同一组中的数据用
该组区间的中点值作代表);
(2)现采用比例分配的分层随机抽样的方式从分数在[750,850),[850,950]内的两组学
生中共抽取10人,再从这10人中随机抽取4人,记被抽取的4名学生中“特优选手”的人
数为随机变量X,求X的分布列及数学期望.
【解】(1)由频率分布直方图知(0.0015×2+a+0.0025+0.0010)×100=1a=0.0035.
设第百分位数为,前两组所占频率为+×=,
70m(0.00150.0035)1000.5⇒
前三组所占频率为(0.0015+0.0035+0.0025)×100=0.75,则m位于第三组数据中,
m-650750-m
所以=m=730,即第70百分位数的估计值为730.
70%-50%75%-70%
⇒
平均数x=(500×0.0015+600×0.0035+700×0.0025+800×0.0015+900×0.0010)
×100=670,
即该校学生竞赛成绩的平均数的估计值为670.
(2)由(1)知分数在[750,850),[850,950]内的两组学生分别有100×0.0015×100=15(人),
100×0.0010×100=10(人),
1510
所以各自抽取的人数分别为10×=6,10×=4,
15+1015+10
显然“特优选手”有4人,
43122
C61C6C48C6C4
故X可取0,1,2,3,4,则P(X=0)==,P(X=1)==,P(X=2)==
444
C1014C1021C10
134
3C6C44C41
,P(X=3)==,P(X=4)==,
44
7C1035C10210
所以X的分布列为
X01234
18341
P
1421735210
183418
E(X)=0×+1×+2×+3×+4×=.
高考中常将频率分布直方图与分布列等交汇在一起进行考查,解题时要正确理解频率分
布直方图,能利用频率分布直方图正确计算出各组数据.概率问题以计算为主,往往和实际
问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来.
【对点训练1】某甜品店为了解某款甜品的销售情况,进而改变制作工艺,根据以往
的销售记录,绘制了日销售量的频率分布直方图,如图所示.假设每天的销售量相互独立,
用频率估计概率.
(1)估计某一天此款甜品销售量不超过60个的概率.
(2)用X表示在未来3天里,此款甜品日销售量超过60个的天数,求随机变量X的分布
列和数学期望.
(3)该店改变了制作工艺以后,抽取了连续30天的销售记录,发现这其中有20天的销售
量都超过70个,根据抽查结果,能否认为改变工艺后,此款甜品的销售情况发生了变化?请
说明理由.
解:(1)设事件A为“某一天此款甜品销售量不超过60个”,
所以P(A)=(0.01+0.03)×10=0.4.
(2)根据题意得X~B(3,0.6),则
P(X=0)=0.43=0.064,
12
P(X=1)=C3×0.6×0.4=0.288,
22
P(X=2)=C3×0.6×0.4=0.432,
P(X=3)=0.63=0.216,
所以X的分布列为
X0123
P0.0640.2880.4320.216
所以E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.
(3)可以认为改变制作工艺后,此款甜品的销售情况发生了变化.理由如下:
改变制作工艺前,设事件C表示“日销售量超过70个”,用Y表示30天内日销售量超
过70个的天数,
由频率分布直方图可得P(C)=0.2,则Y~B(30,0.2),
所以E(Y)=30×0.2=6<20,
所以可以认为改变制作工艺后,此款甜品的销售情况发生了变化.
考点2回归模型与分布列的综合
【例2】(2025·山东淄博二模)汽车尾气排放超标是导致全球变暖、海平面上升的重
要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽
车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统
计表:
年份t20202021202220232024
年份代码x12345
销量y/万辆1012172026
(1)计算销量y关于年份代码x的样本相关系数r,并判断是否可以认为y与x有较强的
线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的经验回
归方程;若不是,请说明理由.
(2)为了解购车车主的购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业调查
了该地区4位购买新能源汽车车主和4位购买传统燃油汽车车主,现从这8位购车车主中随
机抽取3位,用X表示抽取的3位购车车主中购买新能源汽车的人数,求随机变量X的分布
列与均值.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),变量x,y的样本相关系数r=
^^^^
错误!=;经验回归方程y=bx+a中,b=错误!=
^^
,a=y-bx.
1
【解】(1)由题意得x=×(1+2+3+4+5)=3,
5
122
y=×(10+12+17+20+26)=17,错误!iyi=295,错误!i=55,错误!i=1609,
5
295-5×3×174040
r=错误!==>≈0.976>0.75,
55-5×32×1609-5×1724141
因此,销量y与年份代码x有较强的线性相关关系.
^295-5×3×17
b=错误!==4,
55-45
^^
a=y-bx=17-4×3=5,
^
故y关于x的经验回归方程为y=4x+5.
(2)由题意可得,X的可能取值为0,1,2,3,
03
C4C41
则P(X=0)==,
3
C814
12
C4C43
P(X=1)==,
3
C87
21
==C4C4=3,
P(X2)3
C87
30
C4C41
P(X=3)==,
3
C814
所以X的分布列为
X0123
1331
P
147714
13313
所以E(X)=0×+1×+2×+3×=.
1477142
高考中常将回归模型与分布列等交汇在一起进行考查,求经验回归方程时要充分利用已
知数据,合理利用公式减少运算.求解概率问题时要注意概率模型的应用,明确所求问题所
属的事件类型是关键.
【对点训练2】(2024·山东日照二模)某公司为考核员工,采用某方案对员工进行业
务技能测试,并统计分析测试成绩以确定员工绩效等级.
(1)已知该公司甲部门有3名负责人,乙部门有4名负责人,该公司从甲、乙两部门中随
机选取3名负责人做测试分析,记负责人来自甲部门的人数为随机变量X,求X的最有可能
的取值.
(2)该公司统计了七个部门测试的平均成绩x(满分100分,成绩为整数)与绩效等级优
秀率y,如下表所示:
x32415468748092
y0.280.340.440.580.660.740.94
根据数据绘制散点图,初步判断,选用y=λecx作为回归方程.令z=lny,经计算得z≈
-0.642,错误!≈0.02.
(ⅰ)已知某部门测试的平均成绩为60分,估计其绩效等级优秀率;
(ⅱ)根据统计分析,大致认为各部门测试平均成绩x~N(μ,σ2),其中μ近似为样本平均
数x,σ2近似为样本方差s2,经计算s≈20,求某个部门绩效等级优秀率不低于0.78的概率.
参考公式与数据:①ln0.15≈-1.9,e1.2≈3.32,ln5.2≈1.65.
^^^^^^
②经验回归方程y=bx+a中,b=,a=y-bx.
③若随机变量X~N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6826,P(μ-2σ<X<μ+2σ)≈0.9544,
P(μ-3σ<X<μ+3σ)≈0.9974.
解:(1)依题意,随机变量X服从超几何分布,且X的可能取值为0,1,2,3,则P(X
0312
C3·C44C3·C418
=0)==,P(X=1)==,
33
C735C735
21
C3·C412
P(X=2)==,
3
C735
30
==C3·C4=1
P(X3)3.
C735
18
由此可得P(X=1)=最大,即X=1的可能性最大,故X最有可能的取值为1.
35
(2)(ⅰ)依题意,y=λecx两边取对数,得lny=cx+lnλ,即z=cx+lnλ,其中x=
32+41+54+68+74+80+92
=63,
7
由提供的参考数据,可知c≈0.02,
又-0.642=0.02×63+lnλ,故lnλ≈-1.9,所以λ≈e-1.9,
由提供的参考数据,可得λ≈0.15,故y^=0.15×e0.02x.
当x=60时,y^=0.15×e0.02×60≈0.498,即估计其绩效等级优秀率为0.498.
(ⅱ)由(ⅰ)及提供的参考数据可知,μ≈x=63,σ≈s≈20,
ln5.2
又y^≥0.78,即0.15×e0.02x≥0.78,可得0.02x≥ln5.2,即x≥≈83.
0.02
又μ+σ=83,且P(μ-σ<X<μ+σ)≈0.6826,
11
由正态分布的性质,得P(x≥83)=[1-P(μ-σ<x<μ+σ)]≈×(1-0.6826)=0.1587,
22
记“绩效等级优秀率不低于0.78”为事件A,则P(A)=P(x≥83)=0.1587,
所以绩效等级优秀率不低于0.78的概率等于0.1587.
考点3独立性检验与分布列的综合
【例3】(2024·山东青岛三模)为了研究高三年级学生的性别和身高是否低于170cm
的关联性,随机调查了某中学部分高三年级的学生,整理得到如下列联表:
身高
性别合计
低于170cm不低于170cm
女生14519
男生81018
合计221537
(1)依据小概率值α=0.1的独立性检验,能否认为该中学高三年级学生的性别与身高有关
联?
(2)从身高不低于170cm的15名学生中随机抽取三名学生,设抽取的三名学生中女生人
数为X,求X的分布列及期望E(X).
2
(3)若低于170cm的8名男生身高数据的平均数为x=166.5cm,方差为s1=9,不低于
2
170cm的10名男生身高数据的平均数为y=180cm,方差为s2=18.请估计该中学男生身高
数据的平均数和方差.
n(ad-bc)2
附:χ2=,n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
α0.10.050.010.0050.001
xα2.7063.8416.6357.87910.828
【解】(1)零假设:该中学高三年级学生的性别与身高无关联.
根据列联表中的数据,经计算得
××-×2
237(141058)
χ=≈3.278>2.706=x0.1,
19×18×22×15
由此可知根据小概率值α=0.1的独立性检验,零假设不成立,可以认为性别与身高有关
联.
3
由题意,可得随机变量的可能取值为,,,,则==C10=24,=
(2)X0123P(X0)3P(X1)
C1591
12213
C5C1045C5C1020C52
==,P(X=2)==,P(X=3)==,
333
C1591C1591C1591
所以随机变量X的分布列为
X0123
2445202
P
91919191
2445202
所以期望为E(X)=0×+1×+2×+3×=1.
91919191
(3)由题意知,18名男生身高数据的平均数
45
z=×166.5+×180=174(cm),
99
18名男生身高数据的方差
2112
s==[(xi-x+x-z)+错误!(yi
1818
21222
-y+y-z)]=[错误!(xi-x)+8(x-z)+错误!(yi-y)+10(y-z)
18
2422522
]=×[s1+(x-z)]+×[s2+(y-z)]=59,
99
所以估计该中学男生身高数据的平均数为174cm,方差为59.
高考中常将独立性检验与分布列等交汇在一起进行考查,解决独立性检验问题,要注意
过好“三关”:假设关、公式关、对比关.解决概率问题要准确地把握题中所涉及的事件,
明确所求问题所属的事件类型.
【对点训练3】(2024·山东临沂二模)“赶大集”出圈彰显了传统民俗的独特魅力.为
了解年轻人对“赶大集”的态度(态度分为非常喜欢和感觉一般),随机调查了200位年轻人,
得到的统计数据如下面的不完整的2×2列联表所示.
对“赶大集”的态度
性别合计
非常喜欢感觉一般
男性3t100
女性t
合计60
(1)求t的值,试根据小概率值α=0.01的独立性检验,判断能否认为年轻人对“赶大集”
的态度与性别有关.
(2)从样本中筛选出5名男性和3名女性共8人作为代表,这8名代表中有2名男性和2
名女性非常喜欢“赶大集”.现从这8名代表中任选3名男性和2名女性进一步交流,记X
为这5人中非常喜欢“赶大集”的人数,求X的分布列及数学期望E(X).
n(ad-bc)2
参考公式:χ2=,其中n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
α0.10.050.01
xα2.7063.8416.635
解:(1)由题意可知3t+(60-t)=100,解得t=20,
零假设:年轻人对“赶大集”的态度与性别无关,2×2列联表如下:
对“赶大集”的态度
性别合计
非常喜欢感觉一般
男性6040100
女性8020100
合计14060200
200×(60×20-40×80)2200×20002
χ2==≈9.524>6.635.
100×100×140×60140×60×100×100
根据小概率值α=0.01的独立性检验,零假设不成立,可以认为年轻人对“赶大集”的
态度与性别有关,此推断犯错误的概率不大于0.01.
(2)设进一步交流的男性中非常喜欢“赶大集”的人数为m,女性中非常喜欢“赶大集”
的人数为n,则X=m+n,且X的所有可能取值为1,2,3,4.
311
C3C2C121
P(X=1)=P(m=0,n=1)===,P(X=2)=P(m=1,n=1)+P(m=0,n=2)
32
C5C33015
1211322111122
C2C3C2C1C3C213C2C3C2C1C2C3C212
=+=,P(X=3)=P(m=2,n=1)+P(m=1,n=2)=+=
32323232
C5C3C5C330C5C3C5C330
212
2C2C3C231
=,P(X=4)=P(m=2,n=2)===.
32
5C5C33010
所以X的分布列为
X1234
11321
P
1530510
21312338
所以E(X)=1×+2×+3×+4×=.
3030303015
课时作业75
1.(13分)(2025·北京东城区一模)某中学为了解高二年级学生阅读水平现状,从该年
级学生中随机抽取100人进行一般现代文阅读速度的测试,以每位学生平均每分钟阅读的字
数作为该学生的阅读速度,将测试结果整理得到频率分布直方图:
(1)若该校高二年级有1500人,试估计阅读速度达到620字/分及以上的人数;
(2)用频率估计概率,从该校高二学生中随机抽取3人,设这3人中阅读速度达到540字
/分及以上的人数为X,求X的分布列与数学期望E(X);
(3)若某班有10名学生参加测试,他们的阅读速度的数据如下:506,516,553,592,
617,632,667,693,723,776,从这10名学生中随机抽取3人,设这3人中阅读速度达到
540字/分及以上的人数为Y,试判断数学期望E(Y)与(2)中的E(X)的大小,并说明理由.
解:(1)1500×(0.00375+0.00100+0.00025)×80=600,
故可估计阅读速度达到620字/分及以上的人数为600.
(2)从中随机抽取一人,其阅读速度达到540字/分及以上的概率为(0.00500+0.00375+
0.00100+0.00025)×80=0.8,
X的可能取值为0,1,2,3,
03
P(X=0)=C3×0.2=0.008,
12
P(X=1)=C3×0.8×0.2=0.096,
22
P(X=2)=C3×0.8×0.2=0.384,
33
P(X=3)=C3×0.8=0.512,
则X的分布列为
X0123
P0.0080.0960.3840.512
期望为E(X)=3×0.8=2.4.
(3)E(X)=E(Y),理由如下:这10名学生中,阅读速度达到540字/分及以上的人数为8,
则Y的可能取值为1,2,3,
12
C8C281
P(Y=1)===,
3
C1012015
21
C8C2567
P(Y=2)===,
3
C1012015
30
C8C2567
P(Y=3)===,
3
C1012015
177
则E(Y)=1×+2×+3×=2.4,故E(X)=E(Y).
151515
2.(13分)(2024·江西鹰潭三模)某校体育锻炼时间准备提供三项体育活动供学生选择.为
了解该校学生对“三项体育活动中要有篮球”这种观点的态度,随机调查了200名学生,数
据如下:
性别
态度合计
男生女生
同意7050120
不同意305080
合计100100200
(1)能否有99%的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别
有关?
(2)现有足球、篮球、跳绳供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种,且他们的选择互不影响.记事件A为
“甲学生选择足球”,事件B为“甲、乙两名学生的选择不同”,判断事件A,B是否独立,
并说明理由.
②若该校所有学生每分钟跳绳个数X~N(185,169).根据往年经验,该校学生经过训练后,
跳绳个数都有明显增加.假设经过训练后每人每分钟跳绳个数比开始时个数增加10,该校有
1000名学生,预估经过训练后该校学生每分钟跳182个以上的人数(结果四舍五入到整数).
n(ad-bc)2
附:χ2=,其中n=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
α0.0250.0100.005
xα5.0246.6357.879
若X~N(μ,σ2),则P(|X-μ|<σ)≈0.6827,P(|X-μ|<2σ)≈0.9545,P(|X-μ|<3σ)≈0.9973.
解:(1)由题设列联表,有
200×(70×50-50×30)225
χ2==≈8.33>6.635,
120×80×100×1003
故有99%的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关.
(2)①事件A,B独立,理由如下:
111
1C3·C22C22
P(A)=,P(B)==,P(AB)==,则P(AB)=P(A)·P(B),故事件A,B独立.
1111
3C3·C33C3·C39
1P(μ-σ<X<μ+σ)
②训练后X~N(195,132),P(X>182)=P(X>μ-σ)=+
22
1+0.6827
≈=0.84135,
2
故预估经过训练后该校学生每分钟跳182个以上的人数为0.84135×1000≈841.
3.(17分)(2024·江苏南通模拟)某高校统计的连续5天入校参观的人数(单位:千人)
如下:
第x天12345
参观人数y/千人2.42.74.16.47.9
2
并计算得错误!iyi=85.2,错误!i=55,x=3,y=4.7.
(1)求y关于x的经验回归方程,并预测第10天入校参观的人数.
(2)已知该校开放1号、2号门供参观者进出,参观者从两门进校的概率相同,且从进校
12
处的门离校的概率为,从另一处门离校的概率为.假设甲、乙两名参观者进出该校互不影响,
33
已知甲、乙两名参观者从1号门离校,求他们从不同门进校的概率.
^^^^^
附:经验回归方程为y=bx+a,其中b^=错误!,a=y-bx.
^85.2-5×3×4.7
解:(1)依题意,b=错误!=错误!==1.47,
55-5×32
^^^^
a=y-bx=0.29,所以y=1.47x+0.29.当x=10时,y=14.99,
故第10天入校参观的人数约为14.99千人.
(2)记“两名参观者从不同门进校”为事件A,“两名参观者都从1号门离校”为事件B,即
求P(A∣B).
1112
11111212×××1
P(B)=×××+×××+2323×2=,
232323234
11121
P(AB)=××××2=,
23239
P(AB)4
所以P(A∣B)==.
P(B)9
4
故他们从不同门进校的概率为.
9
4.(17分)(2024·河北沧州模拟)“南澳牡蛎”是我国地理标志产品,产量高、肉质肥、
营养好,素有“海洋牛奶精品”的美誉.2024年某基地考虑增加人工投入,现有以往的人工投
入增量x(单位:人)与年收益增量y(单位:万元)的数据如下:
人工投入增量x/人234681013
年收益增量y/万元13223142505658
该基地为了预测人工投入增量为16人时的年收益增量,建立了y关于x的两个回归模型.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理安全信息化管理
- 护理安全妇产科患者护理
- 11.1《过秦论》课件 2025-2026学年统编版高二语文选择性必修中册
- 古诗词诵读《游园》 课件(内嵌视频)2025-2026学年统编版高一语文必修下册
- 口腔分期合同范本
- 游戏文网文资质咨询服务协议
- 卫校分班考试题库及答案
- 2026年小区监控摄像头升级合同
- 广东省揭阳市惠来县第一中学2024-2025学年八年级3月月考道德与法治试题(含答案)
- 疝、甲乳类医保收费总结2026
- 2025年电工(中级)实操技能考核试题(附答案)
- 2026年交管12123驾照学法减分完整版试卷附答案详解(轻巧夺冠)
- 水利水电工程单元工程施工质量检验表与验收表(SLT631.5-2025)
- 市第二中学学生餐厅公寓楼建设项目项目建议书
- 2024北京师范大学出版集团职业教育分社招聘2人笔试备考试题及答案解析
- 上春山二部合唱钢琴伴奏正谱
- 病原菌分离培养与鉴定
- 电气施工方案罗湖二线插花地项目
- 2022-2023年高考物理二轮复习 高考电学压轴题答题策略课件(重点难点易错点核心热点经典考点)
- GB/T 78-2007内六角锥端紧定螺钉
- GB/T 4223-2017废钢铁
评论
0/150
提交评论