2026高考数学解答题专练 第四章 概率与统计(学生版)_第1页
2026高考数学解答题专练 第四章 概率与统计(学生版)_第2页
2026高考数学解答题专练 第四章 概率与统计(学生版)_第3页
2026高考数学解答题专练 第四章 概率与统计(学生版)_第4页
2026高考数学解答题专练 第四章 概率与统计(学生版)_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章概率与统计

目录

题型1超几何分布.....................................................2

题型2二项分布.......................................................5

题型3概率的独立性...................................................7

题型4条件概率与全概率..............................................10

题型5概率的决策分析................................................13

题型6正态分布.....................................................16

题型7统计中的回归分析..............................................20

题型8统计中的独立性检验............................................26

题型9概率中的证明题................................................29

题型10概率与数列结合...............................................33

题型12概率中的最值问题.............................................39

必刷大题.............................................................43

题型1超几何分布

1.(2025.江苏南通•一模)近年来,盲盒经济在消费市场中掀起了一阵热潮,成为一种普遍的经济现

象.商家通过不断变换花样吸引消费者.某商店推出一款售价为1元/个且外观相同的盲盒,每开一

个盲盒,会开出3款不同颜色(分别记为红色、黄色、蓝色)的某一商品,开出红色、黄色、蓝色商

品的概率分别为:H.

3o2

⑴若某顾客一次性购买了3个盲盒,求该顾客恰好开出两个红色商品的概率;

(2)若某顾客只想要红色商品,与老板协商一致,每次开一个盲盒,如果开出红色商品则停止,否则

再开一个盲盒,若连续4次均未开出红色商品,老板就赠送一个红色商品给他为了得到红色商品,求

该顾客的平均花费.

「丁慈元而诊拓药将证;

:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个体,考察某类个体数X的

\概率分布;

;重点特征:④超几何分布的抽取是不放回抽取,各次抽取不独立。

I------工二-----------------------------------------------------------------------------1

j2,定乂:

j一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取〃件(不放回),用j

\X表示抽取的〃件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+\,w+2,…,:

LN

"其中〃,N,MEN,,MWN,nMN,w=max{0,n-N+M),r=m:n{〃,A/}.如果随机变量X的分布列;

;具有上式的形式,那么称随机变量X服从超儿何分布.1

I可以将上面的超几何分布记为X~H(n,M,N)。;

;N:总体的个体总数;M:总体中特定类别个体数(如这里的次品,正品);n:抽取的:

।样本容量।

[3、数学期望与方差:[

(数学期望:E(X)=X1P1+x2P2+…+XnPn或者为E(X)=詈!

22

1方差:D(X)=[x.-E(X)]p,+[x2-E(X)]p2+.+卜一&X)『p〃I

।或者:D(X)Y(1Y)(1-居)I

:4、数学期望与方差性质:j

E(ag+b)=aE(G+b

\。(瑶=

i,i

h>数学期望与方差的关系:।

:”=EJ2-(塔)2i

变式训练

1、(2023.河南新乡.统考三模)现有4个红球和4个黄球,将其分配到甲、乙两个盒子中,每个盒子

中4个球.

(1)求甲盒子中有2个红球和2个黄球的概率.

(2)已知甲盒子中有3个红球和I个黄球,若同时从甲、乙两个盒子中取出甲=123)个球进行交换,

记交换后甲盒子中的红球个数为X,X的数学期望为£,(X).证明:g(X)+&(X)=4.

2.(25-26高三上•内蒙古呼和浩特•开学考试)工厂要对2024年12月份生产的N件产品中随机抽取3

件做质量分析,已知其中A等品占彳,8等品占不.

JJ

⑴当N=10时,

①求出3件产品中恰有2件A等品的概率;

②求出3件产品中A等品个数X的分布列与数学期望;

(2)当总量N足够大,抽出的个体数量足够小时,超几何分布近似为二项分布.现在在2024年全年生

产的产品范围内考虑从N(N>4)件产品(A,8等品比例不变)中随机抽取3件,在超几何分布中4

等品恰有2件的概率记作小在二项分布中A等品恰有2件的概率记作巴.那么当N至少为多少时,

我们可以在误差不超过0.001(4-4〈0.001)的前提下,认为超几何分布近似为二项分布.

(参考数据:质i=24.04,Jl9297*139)

3.(2025・云南曲靖•模拟预测)某学校对高中生体质健康调研,随机抽取1()0名学生的体重(单位:

kg)得到如下频数分布表:

分组[40,50)[50,60)[60,70)[70,80)[80,90]

10

频数5254020

⑴估计样本的中位数;

⑵从样本[60,70)和[70,80)中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在[60,70),

[70,80)的人数分别为x,y,记X=x-y.

(i)求X的分布列及期望;

(ii)求。(2X+1).

・・■•■,・・■•・・・•■・■・•■•■・■■・■•■・■•■・■•・■・■・■・・・・・•■・■・■・■•・•・•・・■・・・■・■・■■・■题•・•・•■型・■・■2・■・・■・二■・■项・・•■分・■・■布・■・・•・・■・■・■・・■・・・■・・・・•・•・・■・■■•■・■・■・・•■・・・■・・•・・・■・・・・•■・・•・・・・•■・■・■・

1.(2025•江西•模拟预测)某平台为了研究用户日均观看短视频的时长,随机抽取了200名用户进行

调查,得到数据如下表:

日均时长(分钟)(0J0)110.20)[20,30)[30,40)[40,50]

频数3050803010

(1)估计这200名用户日均观看时长的第70百分位数;

⑵若平台规定“日均观看时长不少于30分钟的用户为潜在高粘性用户”,现从样本中有放回地抽取左次,

每次抽取1人,记抽到潜在高粘性用户的人数为y.

(1)当%=3时,求y的分布列和数学期望;

(ii)若平台希望至少抽到1名潜在高粘性用户的概率不低于90%,至少需抽取多少次?(参考数据:

ln5。1.609,In2=0.693)

「「三不芬希而转短;

:①每一次试验中,事件发生的概率相同;②各次试验中的事件是相互独立的;③每一次试验

:中,试验结果只有两个,即发生与不发生;

:重点特征:④二项分布的抽取是有放回抽取,各次抽取相互独立。

:2、定义:

\一般地,在〃重伯努利试验中,设每次试验中事件A发生的概率为p(0<pvl),用X表示

;事件A发生的

!次数,则X的分布列为尸(XY尸Cfp£(l—p)"T,:0,1,2,…,〃.如果随机变量X的分布

;列具有上式的形式,则称随机变量X服从二项分布,记作X〜。(〃,p).

:3、数学期望和方差:

如果X〜3(〃,〃),那么E(X)=〃p,D(X)=np(\-p).

变式训练

1.(2023•江苏扬州・扬州中学校考模拟预测)学校组织A,B,C,D,E五位同学参加某大学的测试

活动,现有甲、乙两种不同的测试方案,每位同学随机选择其中的一种方案进行测试,选择甲方案测

试合格的概率为I,选择乙方案测试合格的概率为且每位同学测试的结果互不影响.

⑴若5位同学全选择甲方案,将测试合格的同学的人数记为X,求X的分布列及其方差;

(2)若测试合格的人数的期望值不小于3,求选择甲方案进行测试的同学的可能人数.

2.(25-26高三上•陕西汉中•开学考试)已知排球比赛的规见是:每局25分,达到24分时,比赛双方

必须相差2分.才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);

比赛排名采用积分制,积分规则如下:比赛中,以3:0或3:1取胜的球队积3分,负队积0分;以3:2

取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两

队以往6局比赛成绩:

123456

甲252127272325

乙182525252517

假设用频率估计概率,且甲,乙每同的比赛相互独立.

(1)估计甲队每局获胜的概率;

(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;

(3)如果甲、乙两队约定比赛2场,求两队积分相等的概率.

3.(25-26高三上•河北衡水・开学考试)已知每门大炮击中巨标的概率都是:,现在〃门大炮同

时对某一目标各射击一次.

⑴当〃=4时,记目标被击中的次数为X,求X的分布列、数学期望和方差;

(2)如果使目标至少被击中一次的概率超过99%,至少需要多少门大炮?(lg2=0.3()10,lg3«0.4771)

窗兔丁棉瞿南施豆荏

1.(2024.河南郑州.模拟预测)手工刺绣是中国非物质文化遗产之一,指以手工方式,用针和线把人

的设计和制作添加在任何存在的织物上的一种艺术,大致分为绘制白描图和手工着色、电脑着色,选

线、配线和裁布三个环节,简记为工序A,工序8,工序C.经过试验测得小李在这三道工序成功的概

率依次为千,?.现某单位推出一项手工刺绣体验活动,报名费30元,成功通过三道工序最终的

奖励金额是200元,为了更好地激励参与者的兴趣,举办方推出了一项工序补救服务,可以在着手前

付费聘请技术员,若某一道工序没有成功,可以由技术员完成本道工序.每位技术员只完成其中一道

工序,每聘请一位技术员需另付费10()元,制作完成后没有接受技术员补救服务的退还一半的聘请费

用.

(1)若小李聘请一位技术员,求他成功完成三道工序的概率;

(2)若小李聘请两位技术员,求他最终获得收益的期望值.

ri「函函日釐而宕程;

\(1)、直接法;直接判断一个事件发生能否影响另一个事件发生的概率。

\(2)、定义法:若P(AB尸P(A)P(B)成立,则A事件与B事件相互独立,反之亦成立。

\(3)、转化法:由事件A与事件B相互独立知,A与月,4与B,4与月也相互独立。

\2.n个独立事件同时发生的概率P(A1-A2-...-An)=P(Al)-P(A2)-...-P(An).

变式训练

1.(24-25高三上•湖南长沙•阶段练习)现有一种不断分裂的细胞X,每个时间周期内分裂一次,一个

X细胞每次分裂能生成一个或两个新的X细胞,每次分裂后原X细胞消失.设每次分裂成一个新X细

胞的概率为P,分裂成两个新X细胞的概率为1-〃;新细胞在下一个周期内可以继续分裂,每个细胞

分裂相互独立.设有一个初始的X细胞,从第一个周期开始分裂.

⑴当P=:时,求3个周期结束后X细胞数量为2个的概率;

⑵设2个周期结束后,X细胞的数量为3求J的分布列和数学期望.

2.(2023♦福建龙岩•统考二模)为了丰富孩子们的校园生活,某校团委牵头,发起体育运动和文化项

目比赛,经过角逐,甲、乙两人进入最后的决赛.决赛先进行两天,每天实行三局两胜制,即先赢两

局的人获得该天胜利,此时该天比赛结束.若甲、乙两人中的一方能连续两天胜利,则其为最终冠军;

若前两天甲、乙两人各赢一天,则第三天只进行一局附加赛,该附加赛的获胜方为最终冠军设每局比

赛甲获胜的概率为:,每局比赛的结果没有平局且结果互相独立.

⑴记第一天需要进行的比赛局数为X,求X的分布列及4X);

⑵记一共进行的比赛局数为匕求尸(VW5).

3.(25-26高三上.湖北荆州•开学考试)在电竞比赛中一般采用“双败淘汰制”,这是一种兼顾效率与公

平的比赛赛制,基本原则是“失败2次才被淘汰”“越先淘汰所获名次越低”,且每场比赛只有胜负之

分.现组织A,B,C,。共4个电竞队参加比赛,采用“双败淘汰制”,其流程如下:

第一轮:抽签随机分成2组比赛,每组比赛的胜者进入胜者组,败者进入败者组.第二轮:胜者组、

败者组分别比赛,胜者组的胜者(记为W)进入决赛,败者组的败者因失败2次被淘汰并获得第4

名.笫三轮:第二轮胜者组的败者与败者组的胜者比赛,胜者(记为L)进入决赛,败者被淘汰并获

得第3名.第四轮:决赛,若W获胜则比赛结束,W获得冠军,L获得第2名;若L获胜,则需加赛

一场,加赛胜者获得冠军,败者获得第2名.已知4队战胜其他3支队伍的概率均为二且各场比赛

互不影响.

⑴求川队全胜夺冠的概率;

(2)设X队在整个赛事中参寒场次为随机变量X,求X的分布列及数学期望E(X).

题型4条件概率与全概率

1.(2025•湖北武汉•二模)有A,B,C,D,E,F,G,”八名运动员参加乒乓球赛事,该赛事采

用预赛,半决赛和决赛三轮淘汰制决定最后的冠军、八名运动员在比赛开始前抽签随机决定各自的位

置编号,已知3〜〃这七名运动员互相对决时彼此间的获胜概率均为A运动员与其它运动员对决

时,A获胜的概率为;,每场对决没有平局,且结果相互独立.

冠军

决赛I------'

或工rh"rH

①②③④⑤⑥⑦⑧

(1)求这八名运动员各自获得冠军的概率;

⑵求△与A对决过旦最后获得冠军的概率;

(3)求6与C对决过且最后获得冠军的概率.

1.条件概率

⑴条件概率的定义

一般地,设人3为两个随机事件,且P(A)>0,我们称P(3|A)=华票为事件4发生的条:

1)

「・…祥禾丁事正

i区发生的条件概率,简称条件概率.

\⑵性质

\设尸(A)>0,C为样本空间,则

\①P(3|A)aO,l],P(Q|A)=1;

\②如果8和C是两个互斥事件,则P(3UC|A户P(8⑷+P(C|A);

\③设》和B互为对立事件,则户(同力)=1-尸(B|A).

|2.概率的乘法公式

\由条件概率的定义,对任意两个事件A与3,若P(A)>0,则P(/3)=P(A>P(3|A).

:3,求条件概率的常用方法

\(D利用定义,分别求P(A)和R4B),得P(8M)=4架.

|(2)借助古典概型概率公式,先求事件A包含的基本事件数〃(A),再在事件A发生的条件

;下求事件B包含的基本事件数,即〃(AB),得尸(8]力)=驾吟.

14.全概率公式

\⑴全概率公式

\一般地,设4,4,…,4是一组两两互斥的事件,4U4U…U4=Q,且P(4)>0,i=l,

2,…,

\〃,则对任意的事件87Q,有/5)=比。(4)•尸(814).我们称此公式为全概率公式.

!/=!

\5.贝叶斯公式

\设4,4,…,4是一组两两互斥的事件,4U4U…U4=Q,且P(4)>0,i=l,2,

I则对

"士“*/i、P(4)尸(阴4)P(A^P(B\A)

"壬意的事件8RC,P(B)>0,有尸(4归)=一'一好身上="J,ii.

f;P(4)P(4|4)

i1・1

变式训练

1.(2025,四川泸州♦模拟预测)某工厂有两条生产线加工同一型号的零件,生产线A8加工的次品率

分别为5%,8%,生产出来的零件混放在一起,已知生产线加工的零件数分别占总数的60%,40%.

(1)现从该厂随机抽取一个零件,计算它是次品的概率;

⑵如果取到的一个零件是次品,计算它是生产线A加工的概率;(精确到小数点后第三位,采用四舍

五入法)

⑶从混放在一起的零件中随机抽取3个,若取到1个次品,对责任人罚款5元:若取到1个正品则

对同一责任人奖励10元,用X表示该责任人由3个冬件获得的金额,求X的期望及方差.

2.(2024福建三明.统考三模)在二十大报告中,体育、健康等关键词被多次提及,促进群众体育和竞

技体育全面发展,加快建设体育强国是全面建设社会主义现代化国家的一个重要目标.某校为丰富学

生的课外活动,加强学生体质健康,拟举行羽毛球团体赛,赛制采取3局2胜制,每局都是单打模式,

每队有5名队员,比赛中每个队员至多上场一次且是否上场是随机的,每局比赛结果互不影响.经过小

组赛后,最终甲、乙两队进入最后的决赛,根据前期比赛的数据统计,甲队种子选手“对乙队每名

队员的胜率均为?,甲队其余4名队员对乙队每名队员的胜率均为(注:比赛结果没有平局)

42

(1)求甲队最煞2:1获胜且种子选手”上场的概率;

(2)己知甲队2:1获得最终胜利,求种子选手M上场的概率.

3、(2025浙江)北京时间4月30日晚,2023年国际象棋世界冠军赛在哈萨克斯坦首都阿斯塔纳闭幕,

来自温州的国际象棋男子特级大师丁立人最终击败涅波姆尼齐亚,加冕世界棋王.这是中国棋手首次

夺得国际象棋男子世界冠军.某小学为了提高同学学习国际象棋的兴趣,举行了二年级国际象棋男子

团体赛,各班级均可以报送一支5人队伍.比赛分多轮进行,每轮比赛每队都需选定4名选手,每轮

比赛选手可不同.比赛没有平局,每轮比赛结束,得胜班级得1分,反之0分.晋级赛规则如下:第一

轮随机为各队伍匹配对手;从第二轮比赛开始,积分相同的队伍之间再由抽签决定对手.具体比赛程

序如卜.图.这样进行二轮对抗之后,得2分及以上的班级晋级,反之淘汰.晋级的队伍再进行相应的比

赛.

第-轮■■■■■■■■

获胜一JL・失败

第二轮1分队伍o分队伍

获胜■►失败获胜失败

第三轮2分队伍1分队伍0分队伍

(1)二(1)班选派了A,B,C,D,E五名选手,在第一轮比赛中,己知选手4参加了比赛,请列举

出该班级所有可能的首发队员的样本空间;

(2)现共有8支参赛队伍,且实力相当,二(3)班在第一轮比赛输给了二(4)班,则两队在第三轮

重新遇上的概率为多少?

⑶某班级在筹备队员时,班内已推选水平较为稳定的选手4名,很多同学纷纷自荐最后一个名额.现

共有5名自荐选手,分别为五级棋士2名、六级棋士2名和七级棋士1名,五、六、七级棋士被选上

的概率分别为0.8,0.6,0.5,最后一名选手会在这5名同学中产生.现任选一名自荐同学,计算该同

学被选上的概率,并用X表示选出的该同学的级别,求X的分布列.

题型5概率的决策分析

L(2025.广东.一模)甲参加围棋比赛,采用三局两胜制,若每局比赛甲获胜的概率为输

的概率为1-〃,每局比赛的结果是独立的.

⑴当片;2时,求甲最终获胜的概率;

⑵为了增加比赛的趣味性,设置两种积分奖励方案.方案一:最终获胜者得3分,失败者得-2分;

方案二:最终获胜者得1分,失败者得。分,请讨论选择哪种方案,使得甲获得积分的数学期望更大.

,①窠沛福涕示筱健殖放淳二二薮氧瓶逛存在豉芬羽;

:②某种情况比较稳定——方差进行比较,方差越大情况波动越大,越不稳定。

j③某种情况优于其他情况的概率——直接概率比较。

变式训练

1、(2025.吉林长春.模拟预测)在一个摸球游戏中,有一个装有许多彩色球的不透明盒子,盒子中的

球分为三种颜色:红色、蓝色和绿色,各球除颜色可能不同外,其余均相同.每次游戏,参与者需要从

盒子中随机取球.已知盒子中红色球、蓝色球和绿色球的数量分别为。个、b个和c个,且总球数为N个

(a,〃,c,NeN)

(1)若规定每次取一个球,取球后不将球放回盒子中,且连续取两次.求取出一个红色球和一个蓝色球

的概率;

(2)若规定每次取一个球,取球后将球放回盒子中,且连续取三次.设三次中恰好有两次取出的球颜色

相同的概率为P,当。=3,〃=2,c=5时,求p;

(3)在(2)的条件下,若游戏组织者规定,当三次取球中出现红色球的次数大于等于两次时.参与者获

胜;否则,游戏组织者获胜.请判断此游戏是否公平,并通过计算说明理由.

2.(22-23高二下.福建南平.期末)某公司举办公司员工联欢晚会,为活跃气氛,计划举行摸奖活动,

有两种方案:

方案一:不放回从装有2个红球和4个白球的箱子中随机摸出3个球,每摸出一红球奖励100元:

方案二:有放回从装有2个红球和4个白球的箱子中随机摸出3个球,每摸出一红球奖励100元,分别

用随机变量X、丫表示某员工按方案一和方案二抽奖的获奖金额.

(1)求随机变量X的分布列和数学期望:

(2)用统计知识分析,为使公司员工获奖金额相对均衡,应选择哪种方案?请说明理由.

3.(2025•河北保定♦二模)某零件厂销售部以箱为单位销售某种零件,每箱零件的定价为500元,低

于200箱按原价销售,不低于200箱有两种优惠方案.方案一:以200箱为基准,每多100箱免12

箱的金额.方案二:通过双方议价,买方能以每箱优惠8%的价格成交的概率为0.3,以每箱优惠6%的

价格成交的概率为0.4,以每箱优惠5%的价格成交的概率为0.3.

⑴买方甲要在该厂购买200箱这种零件,并选择方案二,求甲以低于9.5万元的金额购买这200箱零

件的概率.

⑵买方乙要在该厂购买400箱这种零件,以购买总价的数学期望为决策依据,试问乙选择哪种优惠

方案史划算?请说明你的理由.

(3)买方丙要在该厂购买960箱这种零件,由于购买的箱数超过500,该厂的销售部让丙综合使用这两

种方案作为第三种方案,即一部分用方案一(箱数必须是100的正整数倍),另一部分使用方案二(箱

数不限),试问丙应该如何使用方案三,才能获得最多的优惠?说明你的理由.

题型6正态分布

1.(2025•浙江♦三模)固态电池是纯电动汽车搭载的新一代电池,与使用电解液的传统液态锂离子电

池相比,固态电池具有安全性能高、能量密度大等特点.某公司试生产了一批新型固态电池,为了了

解该批次固态电池的“循环寿命、(循环寿命是指:电池的容量下降到初始容量的某一阈值时,完成

充放电循环的次数)的情况,从这批固态电池中随机抽取了100组进行了测试,并统计绘制了下表:

循环寿命x(千次)[2,3)[川[4,5)[5,6)[6,7)

组数),515ab5

已知循环寿命工(千次)的平均值了=4.5(同一组中的数据用该组区间的中点值代表).

(1)求人的值;

(2)根据测试数据可以认为“循环寿命b近似服从正态分布M"。?),经计算样本标准差s的估计值为

0.7.月样本数据的平均值工作为〃的值,用样本标准差s的估计值作为。的值.

(i)若规定:循环寿命xw[5.2,5.9]的电池为一等品;x>5.9的电池为优等品.求试生产的电池的一

等品率和优等品率的估计值(结果用百分数表示);

(ii)在该型电池的生产中,称发生概率低于0.27%的事件为小概率事件,在质量控制时,如果小概

率事件未发生,则认为该批产品合格;否则可以认为该批产品不合格.若这100组电池中,循环寿命

x的最大值和最小值分别为6.5和2.3.请判断该批固态电池是否合格?并说明理由.

参考数据:若随利I变量/~N(小/),贝IJPQ/—。444〃+。)=0.6827,户(〃一2。444〃+2。)=0.9545,

P(〃-3b<J<〃+3cr)=0.9973.

/(x)=-y=-e262?XG(-OO,-K»)

\Is定义:.正态分布密度函数兀6,式中的实数山o(^>0)

:是参数,分别表示个体的平均数与标准差,则成随机变量X服从正态分布,记为X〜N(u,(j2)。

:2、特点:

:①曲旗谑箪函码「五荚手m瓶麻

\②曲线在X=p处达到峰值总

:③当⑶无线增大时,曲线无限接近X值

\⑤对任意的。>0,曲线与x轴围成的面积总为1;

:⑥在参数。取固定值时,正态曲线的位置由"确定,且随着"的变化而沿x轴平移,如图甲

;所示:

:⑦当4取定值时,正态曲线的形状由。确定,当。较小时,峰值高,曲线“瘦高”,表示随机

\变量X的分

i布比较集中;当。较大时,峰值低,曲线“矮胖”,表示随机变量x的分布比较分散,如图乙

3、3o原则:

PQ-应户0.6827;

PQ-2叱X0/+2b户0.9545;

尸Q/-3区X&/+3。户0.9973.

4、均值与方差:

若X〜N(4«2),则E(X)=〃,D(X)=(r.

变式训练

1.(2025.湖南.模拟预测)某企业的甲,乙两条生产线都生产M型零件,一天中,甲,乙两条生产线

分别生产320件和1280件M型零件,为了解该企业M型零件的生产质量,现利用分层随机抽样,

从一天中生产的M型零件中随机抽取40件,测量其尺寸(单位:mm),所得尺寸数据的统计结果如

下表:

平均尺寸标准差

甲生产线〃件M型零件806

乙生产线夕件M型零件704

⑴求这40件M型零件尺寸的平沟数最;

(2)求这40件M型零件尺寸的标准差,;

⑶假设该企业一天中生产的M型零件尺寸服从正态分布乂(〃。2),其中用样本平均数;作为〃的估计

值A,用样本标准差s作为。的估计值6.试估计:这一天生产的M型零件中,尺寸小于60mm的零件

是否低于40件?

参考数据:①〃个数七,々,9,…,Z的方差为/,之心一寸②若随机变量X服从

n〃*=1

正态分布N(贝IJ〃(〃一<7VXK〃十<7)=0.6827,-2bWXV〃十2b)=0.9545,

P(//-3o-<X<//+3cr)«0.9973;@2(62+802)+8(42+702)-10x722=360.

2、(2025.陕西宝鸡.二模)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分

为五个层级,分别对应如下五组质量指标值:阳,55)、[55,65)、[65,75)、[75,85)、[85,95].根据长期

检测结果,发现芯片的质量指标值X服从正态分布现从该品牌芯片的生产线中随机抽取100

件作为样本,统计得到如图所示的频率分布直方图.

频率

(1)根据检测结果,样本中芯片质量指标值的标准差$的近似值为II,用样本平均数;作为〃的近似值,

用样本标准差5作为。的估计值,可得到X服从的正态分布求。和〃的值;

(2)从样本中质量指标值在[45,55)和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的芯片

件数为〃,求?的分布列和数学期望;

(3)将指标值不低于K的芯片称为A等品.通过对芯片长期检测发现,在生产线任意抽取一件芯片,它

为A等品的概率为0.16,用第(1)问结果试估计K的值.

(附:①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量4服从正态分布

贝lj尸(〃-cr<Jv〃+b)k0.6827,-2CT<<//+2(T)»0.9545,<〃+3b)a0.9973.)

3.(25-26高三上.重庆.阶段练习)近期我校被评为全国首批智能研修平台规模化应用领航培育校,中

央电教馆在我校举办项目启动活动,并特设南开专场活动.为了了解AINK人工智能对学生学习的助

力情况,学校组织了高一学生参加“AINK人工智能”知识竞赛(满分100分),并从中随机抽查了100

名学生的成绩(单位:分),将他们的成绩分成以下6组:[40,50)」50,60),[60.70),L,[90,100],统计

结果如下面的频数分布表所示.

组别[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]

频数101520301510

已知高一学生的这次竞赛成绩X近似服从正态分布其中〃近似取为样本平均数了的整数部

分,。近似取为样本标准差$的整数部分,并已求得。=14(同一组中的数据用该组区间的中点值为代

表).

(1)从高一年级随机抽取一个学生的竞赛成绩,试估计他的竞赛成绩在区间(56,98]内的概率(结果保留

一位小数).

(2)现从高一年级随机选取〃名同学的竞赛成绩,根据(1)的结果,若他们的成绩均在(56,98]范围内

的概率不低于1%,求〃的最大值(〃为正整数)

参考数据:怆2=0.301,若则P(〃一b<XK〃+cr)p0.6826,P(//-2<T<X+0.9544.

题型7统计中的回归分析

1.(2025•浙江金华・一模)近些年汽车市场发生了翻天覆地的变化,新能源汽车发展迅速,下表统计

了2021年到2024年某地新能源汽车销量(单位:千辆)

年份2021202220232024

年份代号X1234

销量y336993129

附:相关系数“

.2"心4)

回归方程),=加+。中斜率和截距的最小二乘法估计公式分别为。=———-^,a=y-bxf

r-1

44_2

EX£=966.Z(X-])=4896,7170*13.04•

⑴试根据样本相关系数「的值判断该地汽车销量了与年份代号工的线性相关性强弱(。区斗卬,贝小认

为y与工的线性相关性较强,M<o-75,则认为丁与x的线性相关性较弱);(精确到o.ooi)

(2)建立V关于X的线性回归方程,并预测该地2025年的新能源汽车销量.

1、线性经验回归方程与最小二乘法:

将$,=八+否称为y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经

验回归直线.

这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,

-ZU-x)(3;-y)Zx/-行3

b=~一百~=7=1、—

其中£(七一元)沅2

A

a人=y-bx..

经验回归直线一定过点G5).

2、残差分析

对于响应变量匕通过观测得到的数据称为观测值,通过经验回归方程得到的Q称为预测值,

观测值减

去预测值称为残差。

3、刻画回归效果的方式

(1)残差图法

作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出

的图形称

为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,

说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.

(2)残差平方和法

残差平方和为才(M-£)2,残差平方和越小,模型拟合效果越好.

;=1

⑶利用R2刻画拟合效果

天…厂

Ir=I

R-=i------------------------•

/=!

解越大,模型的拟合效果越好,相越小,模型的拟合效果越差.

4、非线性回归方程:

根据题目提示转化为线性回归方程,即非一次函数转化为一次函数,然后根据线性回归方程

的公式求解参数。

5、见的非线性函数转换方法:

①、幕函数型y=ax"

两边取常用对数,lgy=lg("),即Igy=〃lgx+lga,

令H,原方程变为),f+"然后按线性回归模型求出〃,Iga.

x=lg.r

②、指数函数型户s,(a>0且"1,c>0)

两边取自然对数,Iny=In®'),即Iny=lnc+xlna,

令F;"V,原方程变为y=lnc+Wna,然后按线性回归模型求出Ina,Inc.

③、反比例函数型),=。+2型

,1,原方程变为),,=b£+a,然后按线性回归模型求出L

④、二次函数型产加+〃

令1)':':,原方程变为),、灰+“,然后按线性回归模型求出3a.i

X=X~

⑤、对数函数型y=blnx+a;

令匕=:,原方程变为y=/W+a,然后按线性回归模型求出3a.

x=Inx

变式训练

1.(25-26高三上.湖北.阶段练习)随机抽取某集团公司旗下五家超市,得到广告支出刀(万元)与销

售额),(万元)的数据如下:

广告支出X(万元)24568

销售额y(万元)2030506070

⑴计算羽),的相关系数匕并判断是否可以认为广告支出与销售额具有较高的线性相关程度?(若

0.3<“<0.75,则线性相关程度一般;若|「|之0.75,则线性相关程度较高,7344^18.55)

(2)求出),关于x的线性回归方程,并预测若广告支出15(万元),则销售额约为多少万元?参考公式:

回归直线的斜率和截距的最小二乘法估计公式,相关系数厂的公式分别为。=,a=y-bx,

2.(24・25山东•阶段练习)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企

业当年的俏售收入的关系进行了研究,他们收集了上一年不同企业俏售收入),(单位:10万元)与一

定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,

分别利用),="〃五或建立),关于x的回归方程,令$=五,『」得到如下数据,且(SQ)与

-XX

&f)($123,...13)的相关系数分别为4,弓,且弓=-0.9953.

Xyst

10.15108.403.040.16

H___

/-13〉

^s.y.-\3syZG',T3f・),X一13sZ^-137

I-Ihir-1-1

14.00-2.1011.670.2121.22

(1)用相关系数说明哪种模型建立y与x的回归方程更合适;

⑵根据(1)的结果及表中数据,建立),关于x的回归方程;

oI

(3)已知企业的利润z满足z=试根据回归方程求出企业利润的最大值.

参考数据和公式:0.21x21.22=4.4562,11.67x21.22=247.6374,7247.6374^15.7,对于一组数据

^uv.-nu-v

(qM)(i=123,…,〃),其回归直线方程u=a+加的斜率和截距的最小二乘法估计分别为夕=%

一IIU

/=!

”__

-mt-v

”「血,相关系数一=JjT卜,-:

3.(24-25.山东潍坊.期中)某科技公司研发了一种新型电池,测试该新型电池从满电状态,每使用1

小时其电量衰减情况,得到剩余电量y(库仑)与使用时间/(小时)的散点图,其中/为正整数.

W库伦八

3.•

一9-•

I

O123456789〃小时

⑴利用散点图,判断产"+〃与心哪个更适宜作为回归模型?(给出判断即可,不必说明理由)

⑵在(1)的条件下,

(i)求出剩余电量y与使用时间,的回归方程(精确到0.01);

(ii)当电池剩余电量低于0.3库仑时,电池报警提示需要充电,否则影响电池使用寿命,请利用所

求回归方程,预判该新型电池从满电状态使用12小时后,是否会报警提示,并说明理由.

参考数据:记4=1")

9g999

公Z-vr汇之3eL23

/=!J-l1=1/=1M;=l

4512.021.5520.20285-4.2545.073.42

-nit-v

参考公式:B=-----------,a=v-pii,

f%2-疝2

1=1

题型8统计中的独立性检验

1.(2025・湖南•模拟预测)近日,2025年湖南省城市足球联赛(被球迷称为“湘超”)如火如荼地进行,

引发广泛关注.某地区随机抽取了部分市民,调查他们对赛事的关注情况,得到如下表格:

性别不关注赛事关注赛事

男性25150

女性5075

⑴列出2x2列联表并根据小概率值a=0.001的独立性检验,能否认为关注“湘超”赛事与性别与关?

(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取3名市民参加“湘超”

赛事知识问答.已知男性、,女性市民顺利完成知识问答的概率分别为每个人是否顺利完成相

42

互独立.求在有且仅有2人顺利完成的条件下,这2人的性别不同的概率.

.,n{ad-he)2.,

附IZ/:X'=--------------------------------,n=a+b+c+d.

(a+b)(c+d)(〃+c)(b+d)

a0.10.050.0250.010.0050.001

Xa2.7063.8415.0246.6357.87910.828

1.独立性检验

⑴假定通过简单随机抽样得到了x和丫的抽样数据列联表,如下表所示.

Y

X合计

r=oY=\

x=oaba+b

x=\cdc+d

合计a+cb+d"=a+b+c+d

则v2=__________-C)2___________

AJZ(a+/))(c+”)(a+c)(方+d)•

(2)利用/的取值推断分类变量X和丫是否独立的方法称为/独立性检验,读作“卡方独

立性检验”,简

称独立性检验.

(3)/独立性检验中几个常用的小概率值和相应的临界值.

2.独立性检验的应用问题的解题策略

解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般

步骤:

(1,根据样本数据制成2X2列联表;

⑵根据公式/=(上町/[上八计算,2;

(4+8)(4+c)[(bI+?d/)、([c+d)A

(3)通过比较/与临界值的大小关系来作统计推断.

变式训练

1.(2025•安徽•模拟预测)为了研究“长期长跑”与“半月板损伤”之间的关系,研究人员在长跑爱好者

中随机抽取了1000人进行调查,所得数据统计如下表所示:

半月板的健康状况

组别合计

半月板正常半月板损伤

长期长跑40360400

非长期长跑460140600

合计5005001000

(1)根据小概率值a=0.01的独立性检验,判断“长期长跑''与"半月板损伤”之间是否相关;

(2)若按照半月板的健康状况,使用分层随机抽样的方法从长期长跑的爱好者中随机抽取10人,再从

这1。人中随机挑选2人,记抽到的2人中半月板损伤的人数为X,求X的分布列与均值.

附:上国罂篇E’其"

■a+b+c+d.

a0.10.050.010.0050.001

%2.7063.8416.6357.87910.828

2.(2025♦陕西西安♦一模)鄂尔多斯某地一景区为了吸引游客,进行了马术实景剧的展演.景区为了解

游客本其开展的“马术实景剧”活动的满意度,随机抽取400人进行调查,得到如下2x2列联表:

调查结果组别不满意满意合计

本地游客80120200

外地游客60140200

合计140260400

(1)根据小概率值夕=0。。的独立性检验,分析满意情况是否与游客的来源有关;

(2)在本地游客的样本中用分层抽样的方法选出5人,再从这5人中随机抽取3人做进一步的访谈,

求这3人中满意人数X的概率分布列和数学期望.

n(ad-be)'

附:X2=

(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

3.8416.63510.828

题型9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论