版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七节概率与统计的综合问题
题型一频率分布直方图与分布列的综合问题
典例0
全体学生发出“读书好、读好书、好读书”的号召,并开展阅读活动.开学后,
学校统计了高一年级共1000名学生的假期日均阅读时间(单位:分钟),得到了
如下所示的频率分布直方图,若前两个小矩形的高度分别为0.0075,0.0125,
后三个小矩形的高度比为3;2:1.
频率
组距
0.0125
0.0075
0U^_J--------------------------------►
20406080100120时间/分钟
⑴根据频率分布直方图,估计高一年级1000名学生假期日均阅读时间的平均
值(同一组中的数据用该组区间的中点值为代表);
⑵开学后,学校从高一日均阅读时间不低于60分钟的学生中,按照分层抽样的
方式,抽取6名学生作为代表分两周进行国旗下演讲,假设第一周演讲的3名学
生日均阅读时间处于[80,100)的人数记为X,求随机变量X的分布列与数学期望.
解:(1)设后三个小矩形的高度分别为3%2%a,
由题知:(3〃+2"a+0.0125+0.0075)x20=1,解得°=0.005,所以各组频率分别为
0.15,0.25,0.3,0.2,0.1.
日均阅读时间的平均数为30x0.15+50x0.25+70x0.3+90x0.2+110x0.1=67(分
钟).
(2)由题意,在[60,80),[80,100),[100,120]三组分别抽取3,2,1人,
X的可能取值为0,1,2,
则P(AM))笔蒋P(AH)笔
C65C65
P(六2)=*.
所以X的分布列为:
Z012
131
P---
555
E(㈤=0x1#]x3以令1L
OOO
・规律方法・
统计图表与概率综合问题的求解策略
1.正确识读统计图表,从图表中提取有效信息及样本数据.
2.根据统计原理即用样本数字特征估计总体的思想,结合样本中各统计量之间的
关系构造数学模型(函数模型、不等式模型、二项分布模型、超几何分布模型或
正态分布模型等).
3.正确进行运算,求出样本数据中能够说明问题的特征值,从而用此数据估计总
体或作为科学的决策与判断
对点练1.(2025•广东潮州模拟)从某企业的某种产品中随机抽取100测量这
些产品的一项质量指标值,由测量结果制成如图所示的频率分布直方图.
⑴求这100件产品质量指标值的样本平均数共同一组数据用该组区间的中点值
作代表);
⑵已知某用户从该企业购买了3件该产品,用X表示这3件产品中质量指标值
位于[35,45]内的产品件数,用频率估计概率,求X的分布列.
解:(1)由已知得,石10x0.015x10+20x0.040x10+30x0.025x10+40x0.020x10=25.
(2)因为购买一件产品,其质量指标值位于[35,45]内的概率为0.2,所以腔8(3,
0.2),
因为X的所有可能取值为0,1,2,3,
所以P(X=0)=(1-0.2>=0.512,
P(X=l)=C1xO.2X(1-0.2)2=0.384,
P(X=2)=C|xO.22x(l-0.2)=0.096,
Pg)=0.23=0.008.
所以X的分布列为
y0123
P0.5120.3840.0960.008
学生用书■第304页
题型二回归模型与分布列的综合问题
典例日(2025•江苏南京六校联考)某制药公司研发一种新药,需要研究某种药物
成分的含量N单位:mg)与药效指标值M单位:m)之间的关系,该公司研发部门
进行了20次试验,统计得到一组数据即2,…,20),其中孙乂分别
表示第/次试验中这种药物成分的含量和相应的药效指标值,已知该组数据中y
20202020
与X之间具有线性相关关系,且2%产60,200,£xf=260,£yf=81000,
i=li=l£=1i=l
20
2砂,=4400.
i=l
A八A
⑴求歹关于X的经验回归方程y=bx+Q;
⑵该公司要用4与8两套设备同时生产该种新药,已知设备A的生产效率是设
备8的2倍,设备4生产药品的不合格率为0.009,设备B生产药品的不合格率
为0.006,且设备A与8生产的药品是否合格相互独立.
①从该公司生产的新药中随机抽取一件,求所抽药品为不合格品的概率;
②在该新药产品检验中发现有三件不合格品,求其中至少有两件是设备A生产
的概率.
Ag(x,-x)(yry)g々y厂呵
参考公式:b*---------上------
2〃刃9国干HO疝2
a=y-bx.
1201120[
解:⑴百吟X.X60=3,y-xl200=60z
Gep,上热问(力-刃_苫听际_4400-20X3X601.
所以-g(々㈤2―1布一260-20X32「,
i=l1=1
AA____A
a=y~bx=60-10x3=30,所以y关于x的经验回归方程为y=10x+30.
⑵设事件/表示“随机取一件药品来自设备4生产”,事件3表示“随机取一
件药品来自设备8生产”,事件。表示“所抽药品为不合格品”,
①因为设备A的生产效率是设备B的2倍,
所以0(4)=|,P⑻*
P(C\A)=0.009,P(C\B)=0,006,
oi
所以P(C)=P(4)・P(C\A)+P(B)・P(C|8)=jx0.009g0.006=0.008.
2
PG4)P(q4)_§x°.0°9_3
②P(4Q=
P(C)0.0084
所以三件不合格品中至少有两件是设备/生产的概率为尸=或停¥《(()3卷.
・规律方法・
回归分析与概率综合问题的解题思路
1.此类问题的特点为同一生活实践情境下设计两类问题,即(1)求经验回归方程
(预测);(2)求某随机变量的概率(范围)、均值、方差等.
2.充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是
非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确
运算的目的
3.明确所求问题所属事件的类型,准确构建概率模型.
对点练2.为了丰富农村儿童的课余文化生活,某基金会在农村儿童聚居地区捐
建“悦读小屋”.自2019年以来,某村一直在组织开展“悦读小屋读书活动”.
下表是对2019年以来近5年该村少年儿童的年借阅量的数据统计:
年份20192020202120222023
年份代码X12345
年借阅量y(册)3692142
5
(参考数据:£%=290)
i=i
⑴在所统计的5个年借阅量中任选2个,记其中低于平均值的个数为X,求X
的分布列和数学期望£(出;
(2)通过分析散点图的特征后,计划分别用①於3517和②£=5/+机两种模型作
为年借阅量),关于年份代码x的回归分析模型,请根据统计表的数据,求出模型
②的经验回归方程,并用残差平方和比较哪个模型拟合效果更好.
解:(1)由题知,5年的借阅量的平均数为等58.
又"+>2=290-36-92-142=20,
则巾<58,”<58,
所以低于平均值的有3个,
所以X服从超几何分布,
k2-k
。(六%)坤ccTQ0,1,2),
Ls
2
263
-
所以P(X=O)=造2-
55
C510
所以X的分布列为
X012
133
P
10510
所以印0=0x捽ix|+2*=1.
⑵因为X产%”,月T=58,
所以58=5x11+tn,即m=3.
所以模型②的经验回归方程为85r+3,
根据模型①的经验回归方程可得
AAAAA
71=-12,¥7=23,乃=58,%=93,y5=128r
根据模型②的经验回归方程可得
AAAA八A
91=8,夕2=23,9398,夕4=83,95=128,
因为[(yi+12)2+3-23)4(36~58产+(92-93)2+(142-128)2H(yi-8)2+O-23)2+(36-48)2
+(92-83)2+(l42-128网=8+12)2-(y\-8)2+222-122+l2-92=4Qy^34Q,且yi20,
所以模型①的残差平方和大于模型②的残差平方和,所以模型②的拟合效果更
好.
学生用书I第305页
题型三独立性检验与分布列的综合问题
典例§(2025•湖北七市州调研)某高中学校为了解学生参加体育锻炼的情况,统
计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学
在某一周参加体育锻炼的数据,结果如下表:
一周参加体育锻炼次数0丁234567合计
男生人数1245654330
女生人数4556432130
合计579111086460
⑴若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余
的称为“不经常锻炼”.请完成以下2x2列联表,并依据小概率值奸0.I的独立
性检验,能否认为性别因素与学生体育锻炼的经常性有关系;
⑵若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻
炼”会导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取20名同学,
其中“极度缺乏锻炼”的人数为X,求E(X)和。(X);
⑶若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了
解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,
设抽取的3人中男生人数为匕求丫的分布列和数学期望.
n/_L7n(ad-bc)2,,,,,
附.■—————〃=。+人+c+d
八(Q+6)(c+d)(Q+c)(b+d)'
a0.10.050.01
Xa2.7063.8416.635
解:⑴根据统计表格数据可得列联表如下:
锻炼
性别aIT
不经常经常
男生72330
女生141630
合计213960
零假设为儿:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关,
根据列联表的数据计算可得
_60(7X16~23X14)2_60X(7X30)2_140
2
Z21x39x30x30~21x39x30x3039~23.590>2.706=3」.
根据小概率值kO.I的独立性检验,推断〃。不成立,即性别因素与学生体育锻
炼的经常性有关系,此推断犯错误的概率不超过0.1.
(2)因学校总学生数远大于所抽取的学生数,故X近似服从二项分布,
易知随机抽取一人为“极度缺乏锻炼”者的概率P备
即可得长420,套),故E(X)=20x*=|,P(X)=20x^xll=||.
(3)易知10名“运动爰好者”有7名男生,3名女生,
所以丫的所有可能取值为0,1,2,3;且丫服从超几何分布,
D/VnA1zC)Ci217—C?Cj21x321
夕(丫=°)=落=砺,尸D”v=i)=篇=砺=而,尸D"=2)=豆=村=而,
-2)_/」_35_7
P(1Y;
Cf012024-
故所求分布列为:
Y0123
P17217
r
120404024
所以后⑺小会嗡取土」.
・规律方法・
独立性检验与概率综合问题的解题思路
本类题目以生活题材为背景,涉及独立性检验与概率问题的综合,解决该类问题
首先收集数据列出2x2列联表,并按照公式求得*的值后进行比较,其次按照随
机变量满足的概率模型求解.
学生用书1第306页
对点练3.(2025•江苏徐州适应性测试)某中学对该校学生的学习兴趣和预习情况
进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太
主动预习两类,设事件力:学习兴趣高,事件B:主动预习.据统计显示,P(Z|面V,
PG4陪,P(呜
(1)计算P(4)和尸(川8)的值,并判断A与B是否为独立事件;
(2)为验证学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容
量为〃?(〃z£N+)的样本,利用独立性检验,计算得*1.350.为提高检验结论的可
靠性,现将样本容量调整为原来的倍,使得学习兴趣与主动预习犯错误
的概率不超过0.005,试确定t的最小值.
2
附:/=n(ad-bc)其中〃=a+6+c+D.
(a+b)(c+d)(Q+c)(b+d)
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
解:⑴由已知尸(4|5)=1-P(彳⑻=1专,
pm=\-p(A\B)=\-^.
又因为P(8)W,所以尸(万尸1-0(8尸1-吴,
所以尸(4尸P⑻4(川田+P(万)・P(4找x胃,
又P(力5)=P(4出)・尸(8)=3舁,
什D。
所以P(AB),P(A)P(B),所以4与3不为独立事件.
(2)假设原列联表为
兴趣高兴趣不局i总计
主动预习aba+b
不太主动预习Cdc+d
总计a+cb+do+b+c+d
根据原数据有黑:篙黑2)」35.
若将样本容量调整为原来的/(WN.)倍,
则新的列联表为
兴趣高兴趣不高总计
主动预习tatbt(a+b)
不太主动预习tctdt(c+d)
总计t(a+c)t(b+d)t(a+b+c+d)
则%:ZX案黑谭黑鬻435皿879,解得后5.84,
又/£N+,所以/的最小值为6.
课时测评85概率与统计的综合问题箫芸
(时间:60分钟满分:100分)
(本栏目内容,在学生用书中以独立形式分册装订!)
研综合运用练
1.(17分)(2025•安徽黄山模拟)某校高三年级1000名学生的高考适应性演练数
学成绩频率分布直方图如图所示,其中成绩分组区间是[30,50),[50,70),
110,130),[130,150],
⑴求图中。的值,并根据频率分布直方图,估计这I000名学生的这次考试数
学成绩的第85百分位数;(7分)
(2)从这次数学成绩位于[50,70),[70,90)的学生中采用比例分配的分层随
机抽样的方法抽取9人,再从这9人中随机抽取3人,该3人中成绩在区间
[70,90)的人数记为X,求X的分布列及数学期望.(10分)
解:(1)由频率分布直方图可得(0.0025+0.0075+0.015x2+24)x20=1,解得
a=0.005.
前四个矩形的面积之和为(0.0025+0.0075+2x0.015)x20=0.8,
前五个矩形的面积之和为0.8+0.005x20=0.9,
设这1000名学生的这次考试数学成绩的第85百分位数为加,
则0.8+(mT10)x0.005=0.85,解得〃尸120,
因此,这1000名学生的这次考试数学成绩的第85百分位数为120.
(2)数学成绩位于[50,70),(70z90)的学生人数之比为0.0075;0.015=1:2,
所以,所抽取的9人中,数学成绩位于回,70)的学生人数为9x1=3,
数学成绩位于[70,90)的学生人数为9x(=6,
由题意可知,随机变量X的可能取值为0,1,2,3,
则P(X=0)斗出,P(X=1)-'号-3
八」'7Cl841'7141
P(X=2)-日岁—P(X=3)=^-.
所以随机变量X的分布列为:
所以现XAOxHx.x导3导2.
2.(17分)(2025•湖南长沙调研)随着生活水平的提高,人们对水果的需求量越来
越大,为了满足消费者的需求,精品水果店也在大街小巷遍地开花.4月份的“湖
南沃柑”因果肉滑嫩,皮薄汁多,口感甜软,低酸爽口深受市民的喜爱.某水果
店对某品种的“湖南沃柑”进行试销,得到一组销售数据,如下表所示:
试销单价M元)34567
产品销量M件)201615126
⑴经计算相关系数—-0.97,变量x,y线性相关程度很高,求y关于x的经验
回归方程;(7分)
(2)用⑴中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对
值大于1.2时,称该对数据为一个“次数据”,现从这5个成对数据中任取3
个做残差分析,求取到的数据中“次数据”个数Y的分布列和数学期望.(10分)
AAAZ(xrxXyry)AA
参考公式:线性回归方程中b,a的最小二乘估计分别为b——a=y-bx.
2
Z(xrx)
1=1
解:(1)由已知,得3+4+:+6+7―5,解2。+16+;5+12+6_13.8,
55
£砂尸313,£xf=I35,
i=li=l
5__5
AZ(xrx)(yry)Ixiyr5xy
贝加士看—.1=1
zs-郎
i=l1=1
-'313-5x5x13.8,-r32——<2_
135-5X5210•'
A八
所以5=13.8-(-3.2)x5=29.8,
所以夕=32x+29.8.
⑵当x=3时,£=20.2;当x=4时,y=17;
当x=5时,£=13.8;当x=6时,£=10.6;
当-7时,y=7.4.
因此该样本的残差绝对值依次为02,1,1.2,1.4,1.4,
所以“次数据”有2个.
“次数据”个数X可能取值为0,1,2.
c2c1
「3132
3
尸尸阳尸55
L51U
P(六2)=^=^-.
'7egio
所以X的分布列为:
X0i2
133
p
To5To
所以七(㈤=0*号2击1,
■创新拓展练
3.(20分)(2025・湖南“一起考”大联考)某市教育局为了调查学生热爱数学是否
与学生的年级有关,从全市随机抽取了50位高二学生和〃?(加>50)位高三学生进
行调查,每位学生对“是否热爱数学”提出“热爱”或“不热爱”的观点,得到
如下数据:
(1)以该50名高二学生热爱数学的频率作为全市高二学生热爱数学的概率,从全
市的高二学生中随机抽取3名学生,记X为这3名学生中热爱数学的学生人数,
求X的分布列和期望;(8分)
⑵若根据小概率值。=0.01的独立性检验,认为热爱数学与学生的年级有关,求
实数m的最小值.(12分)
附+y2=_____皿-____
HIJ,z(Q+b)(c+d)(Q+c)(b+d),
a0.0500.0100.001
3.8416.63510.828
Xa
解:(1)由题意可知,高二学生热爱数学的概率为DU热O爰数学的学生人数
X~B(3,|),
则。(X=0)=®3喂,P(X=1)=CX|)|(|)2噎,尸(X=2川32(154
125
3\3_27
尸(X=3
57125,
所以丫的分布列为:
X0123
8365427
rP
125125125125
所以X的期望为次X)=3x戋.
⑵因为根据小概率值圻0.01的独立性检验,认为热爱数学与学生的年级有关,
(B0+m)[30(m-20)-400]
所->6.635,
50x50xmxm
2
令/(zn)=(50+m)[30(m-20)-400]-6.635x50x50xwxW/贝!]/O)>0,
所以/'(m)=25(108m2-2527m-80000),
5
因为尸25(108m2—2527nl—80000)的又寸称轴为/H~J^<50且当〃尸50时,y>0,
2x108Z
所以/'(血)=25(108血2—2527m-80000)在[50,+8)上恒大于0,
所以./(m)在60,+勾上单调递增,而/(56)<0,/(57)>0,
所以实数m的最小值为57.
4.(20分)(2024•河北邯郸模拟)某企业为在推进中国式现代化新征程中展现更大
作为,在提升员工敬业精神和员工管理水平上实施新举措制定新方案.现对员工
敬业精神和员工管理水平进行评价,从企业中选出200人进行统计,其中对员工
敬业精神和员工管理水平都满意的有50人,对员工敬业精神满意的人数是总人
数的40%,对员工管理水平满意的人数是总人数的45%.
(1)完成对员工敬业精神和员工管理水平评价的2x2列联表,依据小概率值a=0.01
的独立性检验,能否认为对员工敬业精神满意与对员工管理水平满意有关联?(4
分)
项目对员工管理水平满意对员工管理水平不满意合计
对员工敬业精神满意
对员工敬业精神不满意
合计
(2)若将频率视为概率,随机从企业员工中抽取3人参与此次评价,设对员工敬
业精神和对员工管理水平都满意的人数为随机变量X,求X的分布列和数学期
望.(6分)
(3)在统计学中常用T(B|4)*解表示在事件4发生的条件下事件4发生的优势,
现从该企业员工中任选一人,A表示“选到对员工管理水平不满意”、8表示“选
到对员工敬业精神不满意”,请利用样本数据,估计7(用力)的值.(10分)
2=
附:Z7~八'〃=a+Z?+»
A(a+b)(c+d)(Q+c)(b+d)'
a0.050.010.001
Xa3.8416.63510.828
解:(1)由题意可得关于对员工敬业精神和员工管理水平雨介的2x2列联表:
项目对员,管埋水平满意对员J■管埋水平不满意合计
对员工敬业精神满意503080
对员工敬业精神不满意4080120
合计90110200
零假设为〃。:对员工敬业精神满意与对员工管理水平满意无关.
据表中数据计算得:广20禽鼠喘制)6498>6.635=x°o,
根据小概率值a=0.01的独立性检验,我们推断功不成立,即认为对员工敬业精
神满意与对员工管理水平满意有关联.
(2)对员工敬业精神和对员工管理水平都满意的概率为随机变量X的所有可能
取值为0,1,2,3,
其中P(X=0)=。W,
尸(x=AG,;G)V
尸(X=2)=《G)2•泠,
尸(X=3)=G)=,
所以随机变量X的分布列为:
X0123
272791
rP
64646464
则E⑶=Oxg+lx系2x?3专
p(相)
〃、丁S“、_P(BM)_-^r_P(48)」iG48)_80_8
(JIIP(B\A}P(/l>)P(AB}nfAB}303#
P(A)
所以估计7(用力)的值为*
5.(26分)(2024•湖南永州模拟)为了精准地找到目标人群,更好地销售新能源汽
车,某4s店对近期购车的男性与女性各100位进行问卷调查,并作为样本进行
统计分析,得到如下列联表(〃?W40,加WN):
购买新能源汽车(人数)购买传统燃油车(人数)
男性80~m20+/?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理记录的病人安全与质量保证
- 护理沟通中的沟通障碍与克服
- 患者健康教育与生活指导
- 2025-2026学年天津市北辰区八年级(下)期中英语试卷(含答案)
- 2026学年海南省儋州市四年级数学期末评估高频考点卷(详细参考解析)详细答案和解析
- 急诊护理中的病人转运与交接班管理
- DB1408T 012-2020 设施樱桃生产技术规程
- 护理沟通与团队建设
- 电缆桥架销售合同
- 零星采购销售合同
- 2025年贵州省高考化学试卷真题(含答案)
- 八年级地理第三次月考试卷
- 贵州义华实业有限责任公司煤矸石提硫建设项目环评报告
- 个人嘉奖登记(报告)表(无水印)
- 泌乳奶牛营养需要
- 水利工程施工监理规范SL288-2014标准参考
- DL-T 1083-2019 火力发电厂分散控制系统技术条件
- 六三制新青岛版四年级下册科学第16课《动物的“家”》课件
- LY/T 2810-2017结构化森林经营技术规程
- GB/T 14996-2010高温合金冷轧板
- 人工起道捣固作业考评表(工务专业)
评论
0/150
提交评论