高考数学一轮复习(新高考版)概率与统计的综合问题_第1页
高考数学一轮复习(新高考版)概率与统计的综合问题_第2页
高考数学一轮复习(新高考版)概率与统计的综合问题_第3页
高考数学一轮复习(新高考版)概率与统计的综合问题_第4页
高考数学一轮复习(新高考版)概率与统计的综合问题_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§10.8概率与统计的综合问题

题型•频率分布直方图与分布列的综合问题

例12022年是中国共产主义青年团成立100周年,为引导和带动青少年重温共青团百年光

辉历程,某校组织全体学生参加共青团百年历史知识竞赛,现从中随机抽取了100名学生的

成绩组成样本,并将得分分成以下6组:[40,50),[50,60),[60,70),…,[90,100],统计结果

如图所示.

0.020-

0.015-

0.010-

04050607()8()9()1(M)得分

(I)试估计这100名学生得分的平均数;

⑵从样本中得分不低于70分的学生中,用比例分配的分层随机抽样的方法选取11人进行座

谈,若从座谈名单中随机抽取3人,记其得分在[90,100]的人数为3试求4的分布列和均值;

(3)以样本估计总体,根据频率分布直方图,可以认为参加知识竞赛的学生的得分X近似地服

从正态分布标),其中"近似为样本平均数,/近似为样本方差F经计算$2=42.25.

现从所有参加知识竞赛的学生中随机抽取500人,若这500名学生的得分相互独立,试问得

分高于77分的人数最有可能是多少?

参考数据:若随机变量X〜N"i,o2),则Pa-cWXMd。)40.6827,P(/L2OWX&+

2㈤比0.9545,P(〃-3oWXW〃+3G%0.9973.

解(1)估计这100名学生得分的平均数为10X(45X0.010+55X0.015+65X0.020+

75X0.030+85X0.015+95X0.010)=70.5.

(2)从样本中得分不低于70分的学生中,用比例分配的分层随机抽样的方法选取11人进行座

谈,其中得分在19(),1()0]的人数为00]$+0.03()+0.01()X"=2.

若从座谈名单中随机抽取3人,记其得分在[90,100]的人数为3则^的所有可能取值为0,1,2.

Cd28

P(片0)=仄=药

则1f的分布列为

012

28243

p

555555

289436

所以E(^=OXTT+1X—4-2X-TT=—

**I1

(3)由题意知,〃=70.5,*=$2=42.25,。=6.5.

1—尸〃/—o《XW"+o),益,

P(X>77)=P{X>p.+o)=----------------------——-^0.15865,

所以这500名学生得分高于77分的人数最有可能为0.15865X500^79.

思维升华高考常将频率分布直方图与分布列等交汇在一起进行考查,解题时要正确理解频

率分布直方图,能利用频率分布直方图正确计算出各组数据.概率问题以计算为主,往往和

实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来.

跟踪训练1(2023・济南模拟)从某企业的某种产品中随机抽取10。件,测量这些产品的一项

质量指标值,由测量结果制成如图所示的频率分布直方图.

(1)求这loo件产品质量指标值的样本平均数;(同一组数据用该区间的中点值作代表);

(2)已知某用户从该企业购买了3件该产品,用X表示这3件产品中质量指标值位于[35,45]

内的产品件数,用频率估计概率,求X的分布列.

解(1)由已知得,x=10X0.015X10+20X0.040X10+30X0.025X10+40X0.020X10=

25.

(2)因为购买一件产品,其质量指标值位于[35,45]内的概率为0.2,

所以X〜8(3,0.2),因为X的所有可能取值为0,123,

所以尸(X=0)=(l—0.2)3=0.512,

P(X=1)=CJX0.2X(l一0.2)2=0.384,

P(X=2)=C3X0.22X(I—0.2)=0.096,

P(X=3)=0.23=0.008,

所以X的分布列为

X0123

P0.5120.3840.0960.008

题型二回归模型与分布列的综合问题

例2(2022•德州模拟)工信部发布的《“十四五”促进中小企业发展规划》中明确提出建立

“百十万千”的中小企业梯度培育体系,引导中小企业定向“专精特新”“小巨人”“隐形

冠军”的发展方向,“专精特新”是指具备专业化、精细化、特色化、新颖化优势的中小企

业.下表是某地2017—2021年新增企业数量的有关数据:

年份(年)20172018201920202021

年份代码(X)12345

新增企业数量。)817292442

(I)请根据表中所给的数据.求出),关于x的经验回归方程,并预测2023年此地新增企业的

数量;

(2)若在此地进行考察,考察企业中有4个为“专精特新”企业,3个企业中为普通企业,现

从这7个企业中随机抽取3个,用X表示抽取的3个企业中为“专精特新”企业的个数,求

随机变量X的分布列与均值.

参考公式:经脸回归方程y=〃+中,斜率和截距最小二乘估计公式分别为〃=

E(即一v)傍一),)

-------------,a=y—bx.

Z(k-X)2

5—1+2+3+4+5

解(1)x==3,

-8+17+29+24+42

=5=24,

5__

X(x—x)(yi-),)=(一2)X(—16)+(—1)X(—7)+0X5+1X0+2X18=75,

E(^-.r/=4+1+0+14-4=10,

ri

5__

E(XLX)8-y)

A|AA_

所以}=---;-------------=7.5,贝必=7一力;=1.5,

Z(Xi-x)2

所以y=l.5+7.5%,

2>叨一〃xy

A/"|A_A_

的最小二乘估计分别为人=------------,a=y~bx.

£r?一〃x2

56-上任—1+2+3+…+9+10__

解(1)由题意传,x==5.5,

_1010

Xy=1.5,1>通=89.1,=385,

io_____

—10xy

Ai=l89.l-10X5.5Xl.5_

所以。二-------------385-10X552=008,

10―

2>?-i0x2

〃=1.5—0.08X5.5=1.06,

A

则了关于X的经验回归方程为y=1.06+0.08A-,

A

当x=12时,>'=2.02,

故A省12月份新能源汽车的销量约为2.02万辆.

(2)这两家汽车销售商所获得的奖金总额X的所有可能取值为4,3,2.521.5,1,

。-4)=坛=点

P(X=3)=2X^x|=^,

P(X=2.5)=2x|x|=|,

P(X=2)=|x|=|,

P(X=1.5)=2x|x|=|,

P(X=I)=T>44

则X的分布列为

X432.521.51

1111

rp

3696934

E(X)=4xi+3x1+2.5x|+2xl+1,5x|+lx|=^

题型三独立性检验与分布列的综合问题

例3(2023•滨州模拟)新能源汽车是指除汽油、柴油发动机之外的所有其他能源汽车,有利

于减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源汽车越来越

受到消费者的青睐,新能源汽车产业也必将成为未来汽空产业发展的导向与H标.某车企随

机调查了今年3月份购买本车企生产的汽车的100位车主,经统计其购车种类与性别情况如

表所示(单位:人).

购车种类

性另IJ合计

购置新能源汽车购置传统燃油汽车

男性501060

女性251540

合计7525100

(1)根据小概率值a=0.05的独立性检验,分析购车种类是否与性别有关;

(2)用样本估计总体,用本隼企售出汽车样本的频率代替售出汽车的概率,从该车企今年3月

份售出的汽车中,随机抽取3辆汽车,设被抽取的3辆汽车中属于传统燃油汽车的辆数为X,

求X的分布列及均值.

〃c)2______,,..,

附:=(〃+b)(c+d)(a+c)(〃+d)'〃="+'+c+d.

a0.10.050.010.0050.001

2.7063.8417.87910.828

Xa6.635

解(1)零假设为儿:购车种类与性别无关,

8山士上皿如,100X(15X50—25X10)250

根据表中数据可得”、乂=石25.556>3.841=处05,

/DAZDAOU4UV

根据小概率值a=0.05的独立性检验,我们推断小不成立,即认为购车种类与性别有关.

(2)随机抽取1辆汽车属于传统燃油汽车的概率为俞=;,设被抽取的3辆汽车中属于传统燃

油汽车的辆数为X,则X的所有可能取值为0,123,

依题意得,X〜43,

P(X=O)=GXQ〉XG)34,

r(x=i)=cjxg)*xg)=g,

尸—2)=故*勘=卷

P(x=3)=C3xg)3xg))=i

所以X的分布列为

X0123

272791

P

64646464

13

则£(X)=3X-=-

思维升华高考常将独立性检验与分布列等交汇在一起进行考查,解决独立性检脸问题,要

注意过好“三•关”:假设关、公式关、对比关.解决极受问题要准确地把握题中所涉及的事

件,明确所求问题所属的事件类型.

跟踪训练3(2023・昆明模拟)2022年,举世瞩目的冬奥会在北京举行,冬奥会吉祥物“冰墩

墩”和“雪容融”有着可爱的外表和丰富的寓意,自亮相以来就好评不断,深受各国人民的

喜爱.某市一媒体就本市小学生是否喜爱这两种吉祥物对他们进行了一次抽样调查,列联表

如下(单位:人):

是否喜爱

性别合计

喜爱不喜爱

男生302050

女生401050

合计7030100

⑴根据小概率值。=0.01的独立性检验,能否推断是否喜爱吉祥物与性别有关?

⑵现从样本的男生中采用比例分配的分层随机抽样的方法抽取5人,再从这5人中随机抽取

3人,记抽取的3人中有X人喜爱吉祥物,求X的分布列和均值.

附"=(〃+募5乳%)(。+0其中〃=a+A+c+d・

a0.10.050.01

Xa2.7063.8416.635

解(1)零假设为Ho:喜爱吉祥物与性别无关.

100X(30X10-20X40产100

根据表中数据得12=44.762<6.635=xo.oi

70X30X50X50~2\

所以根据小概率值a=0.01的独立性检验,没有充分证据推断”。不成立,因此可以认为喜爱

吉祥物与性别无关.

(2)由题意得,采用比例分配的分层随机抽样方法抽取出的5人中,有3人喜爱吉祥物,有2

人不喜爱吉祥物,

则丫的可能取值为123,

所以"=1)=詈=东

(3Q3

P(X=2)=

Cg-5'

P(X=3)=9=点,

所以X的分布列为

X\23

331

r

10510

3319

则E(X)=1XTT+2X;T+3X—=-

1UJIJ

课时精练

q基础保分练

1.(2023・大理模拟)第24届冬季奥林匹克运动会于2022年2月4日在中国北京开幕,简称“北

京冬奥会”.某媒体通过网络随机采访了某市100名关注“北京冬奥会”的市民,并将其年

龄数据绘制成如图所示的频率分布直方图.

(1)已知[30,40),[40,50),[50,60)三个年龄段的人数依次成等差数列,求出b的值;

(2)该媒体将年龄在[30,50)内的人群定义为高关注人群,其他年龄段的人群定义为次高关注人

群,为了进一步了解其关注项目.现按“关注度的高低”采用比例分配的分层随机抽样的方

式从参与采访的100位关注者中抽取10人,并在这10人中随机抽取3人进行电视访谈,求

此3人中来自高关注人群的人数X的分布列与均值.

2c.015,

解(1)由题意可知,

(0.010+0.015X2+力+。)*10=1,

解得a=O035,Z?=0.025.

(2)利用比例分配的分层随机抽样的方式从样本中抽取10人,

易知其中属于高关注人群的有10X(0.035+0.025)X10=6(人),则属于次高关注人群的有4

人,

则X的所有可能取值为3,2,1,0,

所以P(X=3)=1=/2底=2)=署=;

P(x-i)-c}o-lo,p(x-o)-cjo-3o,

所以X的分布列为

X3210

1131

P

62To30

所以E(X)=3X、+2X:+lX京+ox==].8.

UJ1UJU

2.(2022・衡阳模拟)某市某部门为了了解全市中学生的视力情况,采用比例分配的分层随机抽

样方法抽取了该市120名中学生,己知该市中学生男女人数比例为7:5,他们的视力情况统

计结果如表所示:

视力情况

性别合计

近视不近视

男生30

女生40

合计120

(1)请把表格补充完整,并根据小概率值。=0.01的独立性检验,判断近视是否与性别有关;

(2)如果用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的

概率,且每名同学是否近视相互独立.现从该市中学生中任选4人,设随机变量X表示4人

中近视的人数,求X的分布列及均值.

附:/=(〃+3(C1G(〃JC)3+")'其中〃="+"+'・+"

a0.10.050.01

Xa2.7063.8416.635

解(I):该市中学生男女人数比例为7:5,

・•・抽取的120名学生中男生有70人,女生有50人,

2X2列联表如下:

视力情况

性别合计

近视不近视

男生304070

女生104050

合计4080120

零假设为%:近视与性别无关.

根据列联表中的数据得,

,120X(30X40-10X40)2

L-40X80X70X50—06.857>6.635=处。|‘

・•・根据小概率值。=0.01的独立性检验,我们推断“0不成立,即认为近视与性别有关.

(2),・,用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的

概率,

・•・每名学生近视的概率为喘

由题意可得,X的所有可能取值为0,1234,

且随机变量X〜从4,;),

P(X=&)=a(9(l-&=0,1,234,

.••X的分布列为

X01234

1632881

P878?278781

14

E(X)=4X-=~.

3.随着生活水平的不断提高,人们越来越注重养生.科学健身有利于降低脂肪含量,健身器

材成为人们的新宠.某小区物业决定选购一款健身器材,物业管理员从该品牌的销售网站了

解到此款健身器材近五个月的实际销量如表所示:

月份7月8月9月10月II月

月份编号f12345

销量N万台)0.50.611.41.7

(1)求出销量y关于月份编号/的经验回归方程,并预测12月份该品牌此款健身器材的销量;

(2)该品牌销售商为了促销,采取“摸球定价格”的优惠方式,其规则为:盒子内装有编号为

1,2,3的三个完全相同的小球,有放回地摸三次,三次摸到相同编号的享受七折优惠,三次仅

有两次摸到相同编号的享受八折优惠,其余均九折优惠.已知此款健身器材一台标价为10000

元,设物业公司购买此款健身器材的价格为X,求X的分布列与均值.

X(Xi-X)3-),)

AAAA•-IAf*

参考公式与数据:对于经检回归方程),=bx+a,其中8=------------------------,a=y~b~,

Z(为一工)2

产।

£3一1)(>'/—>)=3.2.

<=1

解(1)依题意知7=^X(l+2+3+4+5)=3,

一1

y=7X(0.5+0.6+1+1.4+1.7)=1.04,

J

5__

Z(ti-t)(J7—y)

A厂13。

h=一;二=京=0.32,

I(ti~t)2

»=i

a=y-bt=1.04—0.32X3=0.08,

故销量y关于月份编号/的经验回归方程为:,=0.32/+0.08.

A

令f=6,则y=0.32X6+008=2.

故可预测12月份该品牌此款健身器材销量为2万台.

(2)有放回地摸球,每次摸到某个编号的概率为今

则三次摸到相同编号的概率为3X(1)3=^

仅有两次摸到相同编号的概率为3X3X;1X1;X2:号2.

JJJJ

公司购买此款健身器材的价格X的所有可能取值为7000,8000,9000,其分布列为

X700080009000

22

P

939

1?273000

故E(X)=1000X-+8000X-+9000X-=—^—.

4.2022年3月,“两会”在北京召开,会议吸引了全球的目光,对我国以后的社会经济发

展有深刻的历史意义,某媒体为调查本市市民对“两会”的了解情况,进行了一次“两会”

知识问卷调查(每位市民只能参加•次),随机抽取年龄在15〜75岁之间的100人进行调查,

并按年龄绘制的频率分布直方图如图所示,其分组区间为[15,25),[25,35),[35,45),[45,55),

[55,65),[65,75],把年龄落在区间[15,35)和[35,75]内的人分别称为“青少年人”和“中老年

人”.

(1)若“青少年人”中有15人在关注“两会”,根据已知条件完成下面的2义2列联表,根据

小概率值。=0.01的独立性检验,判断关注“两会”是否与年龄有关;

⑵由⑴中结果,采用比例分配的分层随机抽样的方法从“青少年人”关注“两会”和不关注

“两会”的人中抽取6人,再从这6人中选3人进行专访,设这3人中关注“两会”的人数

为X,求X的分布列和均值.

是否关注

年龄合计

关注不关注

青少年人15

中老年人

合计5050100

______.(“d—______

附:留=〃=4+/?+c+d.

(a+b)(c+,/)(〃+c)(b+d)

a0.050.010.001

Xa3.8416.63510.828

解(1)依题意可知,“青少年人”共有100X(().015+0.030)X10=45(人),

“中老年人”共有【00—45=55(人),

2X2列联表如下:

是否关注

年龄合计

关注不关注

青少年人153045

中老年人352055

合计5050100

零假设为〃o:关注“两会”与年龄无关.

结合列联表的数据得

11OOX(2OX15-3OX35)2

力=-50X50X55X45-^9091>6-635=^',

所以根据小概率值。=0.01的独立性检验,我们推断为不成立,即认为关注“两会”与年龄

有关.

(2)依题意可知,样本中青少年人关注“两会”的有15人,不关注“两会”的有30人,

采用比例分配的分层随机抽样的方法抽取6人,则关注“两会”的抽取2人,不关注“两会”

的抽取4人,

则X的所有可能取值为0,1,2,

nrkx/(A—U)—eg—5,'(X—I)—c?—5,

故随机变量X的分布列为

3

5

131

所以E(X)=0X-4-1X-+2X-=1.

,综合提升练

5.(2023・南平模拟)某学校共有3()00名学生,其中男生1800人,为了解该校学生在校的月

消费情况,采取比例分配的分层随机抽样的方式抽取100名学生进行调查,先统计他们某月

的消费金额,然后按“男生、女生”分成两组,再分别将两组学生的月消费金额(单位:元)

分成5组:1300,400),1400,500),[500,600),[600,700),[700,800]分别加以统订,得到如图

所示的频率分布直方图.

频率

组距

0.0040

0.002()

(HX)l0

飞消费金额/元

男生

(1)样本中将月消费金额不低于600元的学生称为“高消费群”.请你根据已知条件完成下列

2X2列联表,并根据小概率值。=0.05的独立性检验,分析该校学生属于“高消费群”是否

与性别有关;

是否属于“高消费群”

性别合计

属于不属于

男生

女生

合计

—(〃一—反)2

Z~(a+b)(c+d)(a+c)(b+dy其中〃=。+8+。+”

a0.10.050.010.0050.001

2.7063.8416.6357.87910.828

Xa

(2)以样本估计总体,将调杳所得到的频率视为概率,现从该学校中每次随机抽取1名学生,

共抽取4次,且每次抽取的结果是相互独立的,记被抽取的4名学生中属丁•“高消费群”的

人数为X,求X的均值E(X)和方差D(X).

解(1)由题意及频率分布直方图可得,

是否属于“高消费群”

性别合计

属于不属于

男生154560

女生202040

合计3565100

零假设为M):该校学生属于“高消费群”与性别无关,

加/目,I0QX(15义20—45义20)2600、

由列联表中数据得/•==67■弋6.593>3.841=XO.O5,

OUA4UA入03>1

所以根据小概率值。=0.05的独立性检验,我们推断H)不成立,即认为该校学生属于“高消

费群”与性别有关.

(2)被抽取的4名学生中每一名学生是“高消费群”的概率为需=1,所以X〜从4,1),

15〉LX)\NU/

77

所以E(X)=420=5,

W0=4X&X(f)=高

力拓展冲刺练

6.(2022・重庆模拟)某公司为了提升一款产品的市场竞争力和市场占有率,对该款产品进行了

科技创新和市场开发,经过一段时间的运营后,统计得到心),之间的五组数据如表所示:

Xi2345

y911142620

其中,M单位:百万元)是科技创新和市场开发的总投入,),(单位:百万元)是科技创新和市场

开发后的收益.

⑴求样本相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创

新和市场开发的总投入X的线性相关程度;

(2)该公司对该产品的满意程度进行了调研,在调研100名男、女性消费者后,得到数据如表

所示:

满意程度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论