2026年高考数学终极冲刺:培优专题06 概率与统计 6大重难题型(大题专练)(解析版)_第1页
2026年高考数学终极冲刺:培优专题06 概率与统计 6大重难题型(大题专练)(解析版)_第2页
2026年高考数学终极冲刺:培优专题06 概率与统计 6大重难题型(大题专练)(解析版)_第3页
2026年高考数学终极冲刺:培优专题06 概率与统计 6大重难题型(大题专练)(解析版)_第4页
2026年高考数学终极冲刺:培优专题06 概率与统计 6大重难题型(大题专练)(解析版)_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

94/94培优专题06概率与统计6大重难题型题型01统计案例与样本数字特征问题题型01统计案例与样本数字特征问题命题方向一统计图表的数据分析及样本数字特征的计算与应用命题方向二统计案例中的抽样方法与数据解读题型02二项分布、超几何分布、正态分布命题方向一二项分布命题方向二超几何分布命题方向三正态分布题型03概率的独立性、条件概率与全概率公式命题方向一概率的独立性命题方向二条件概率与全概率公式命题方向三贝叶斯公式的应用题型04变量的相关关系与回归分析命题方向一线性回归方程的求解、拟合与预测命题方向二非线性回归的转化与应用命题方向三回归模型的拟合效果评价题型05独立性检验问题题型06概率统计与其他模块的融合交汇与创新问题命题方向一概率统计与数列的融合命题方向二概率统计与函数、导数的融合命题方向三概率统计与立体几何的融合命题方向四概率统计与不等式的融合命题方向五概率统计中的新定义问题题型01统计案例与样本数字特征问题抓关键·破难点结论1:频率分布直方图中的有关数据计算方式◎众数为最高长方形底边中点对应的横坐标.◎平均数为每个小长方形的面积与对应小长方形底边中点的横坐标的乘积之和.◎中位数左边和右边的直方图的面积相等,都为0.5,第百分位数的左边的直方图面积为.结论2:根据频率分布直方图判断中位数与平均数的大小关系一般来说,对单峰的频率分布直方图,如果直方图的形状是对称的,那么平均数和中位数差不多,如果直方图在右边“拖尾”,那么平均数>中位数,如果直方图在左边“拖尾”,那么平均数<中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.刷经典·通方法🎯命题方向一统计图表的数据分析及样本数字特征的计算与应用1.(2026·河南周口3月·联考)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩分成,,,,这五组,得到如图所示的频率分布直方图.(1)估计样本成绩的平均数及方差;(同一组中的数据用该组区间的中点值作为代表)(2)已知落在内的平均成绩是80分,方差是4分,落在内的平均成绩是88分,方差是6分,求两组成绩合并后的平均数和方差.附:设两组数据的样本量、样本平均数和样本方差分别为m,,;n,,,记两组数据总体的样本平均数为,则总体样本方差.【答案】(1)平均数100,方差104(2),【分析】(1)根据频率分布直方图中平均数与方差的求法,代入数据,即可得答案.(2)根据条件,分别求出两组数据的样本容量,平均数和方差,代入公式,整理计算,即可得答案.【详解】(1)由频率分布直方图得,平均数,方差.(2)第一组的样本容量,,第二组的样本容量,,所以合并后的平均数,则.2.(2026·辽宁大连·一模)某快递公司收取快递费用的标准是:重量不超过的包裹收费10元;重量超过的包裹,除收费10元之外,超过的部分,每超出(不足时按计算)需再收5元.公司从承揽过的包裹中,随机抽取100件,其重量统计如下:包裹重量(单位:)包裹件数43301584公司又随机抽取了60天的揽件数,得到频数分布表如下:揽件数天数6630126以记录的60天的揽件数的频率作为各揽件数发生的概率(1)计算该公司3天中恰有2天揽件数在的概率;(2)估计该公司对每件包裹收取的快递费的平均值;(3)公司将快递费的三分之一作为前台工作人员的工资和公司利润,剩余的用做其他费用,目前前台有工作人员3人,每人每天揽件不超过150件,每人每天工资100元,公司正在考虑是否将前台工作人员裁减1人,试计算裁员前后公司每日利润的数学期望,并判断裁员是否对提高公司利润有利?(注:同一组中的揽件数以这组数据所在区间中点值作代表)【答案】(1);(2)公司对每件快递收取的费用的平均值可估计为15元;(3)公司将前台工作人员裁员1人对提高公司利润不利.【分析】(1)根据样本中包裹件数在内的天数,得到频率,再根据未来3天中,包裹件数在间的天数服从二项分布求解.(2)根据重量统计和收费标准,列出样本中快递费用的分布列,再求期望.(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),若不裁员,则每天可揽件的上限为450件,若裁员1人,则每天可揽件的上限为300件,根据公司随机抽取60天的揽件数的频数分布表分别列出分布列,求期望再减去员工的费用比较.【详解】(1)样本中包裹件数在内的天数为48,频率为,可估计概率为,未来3天中,包裹件数在间的天数服从二项分布,即,故所求概率为;(2)样本中快递费用的分布列如下表:10152025300.430.30.150.080.04故样本中每件快递收取的费用的平均值为(元),故该公司对每件快递收取的费用的平均值可估计为15元.(3)根据题意及(2),揽件数每增加1,可使前台工资和公司利润增加(元),若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下:包裹件数(近似处理50150250350450实际揽件数50150250350450频率0.10.10.50.20.1故公司平均每日利润的期望值为(元);若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下:包裹件数(近似处理50150250350450实际揽件数50150250300300频率0.10.10.50.20.1故公司平均每日利润的期望值为(元)因,故公司将前台工作人员裁员1人对提高公司利润不利.3(2026·河北黄骅一模)某学校为提升学生的科学素养,要求所有学生在学年中完成规定的学习任务,并获得相应过程性积分.现从该校随机抽取100名学生,获得其科普测试成绩(百分制,且均为整数)及相应过程性积分数据,整理如下表:科普测试成绩x科普过程性积分人数4103a2b12302(1)当a=25时,(i)从该校随机抽取一名学生,估计这名学生的科普过程性积分不少于3分的概率;(ii)从该校科普测试成绩不低于80分的学生中随机抽取2名,记X为这2名学生的科普过程性积分之和,估计X的数学期望;(2)从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,上述100名学生科普测试成绩的平均值记为.若根据表中信息能推断恒成立,直接写出a的最小值.【答案】(1)(i)0.35;(ii)(2)7.【分析】(1)(i)用频率代替概率即可;(ii)先用频率代替概率得出科普过程性积分为的概率,再根据独立事件的乘法公式计算分布列,最后利用期望公式即可;(2)先求出的最大值,再根据各分数段取最小值求得的平均分作为的最小值,根据即可求出.【详解】(1)(i)由表知,科普过程性积分不少于3分的学生人数为,则从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的频率为,所以从该校随机抽取一名学生,这名学生的科普过程性积分不少于3分的概率估计为0.35.(ii)依题意,从样本中成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的频率为,所以从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为3分的概率估计为,同理,从该校学生科普测试成绩不低于80分的学生中随机抽取一名,这名学生的科普过程性积分为4分的概率估计为,X的所有可能值为6,7,8,,,,所以X的数学期望.(20由表知,,则,从该校科普过程性积分不高于1分的学生中随机抽取一名,其科普测试成绩记为,则的最大值为69,100名学生科普测试成绩的平均值记为,要使恒成立,当且仅当,显然的最小值为各分数段取最小值求得的平均分,因此,则,解得,所以根据表中信息能推断恒成立的a的最小值是7.🎯命题方向二统计案例中的抽样方法与数据解读4.(2026·云南曲靖·模拟)某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:分组频数525402010(1)估计样本的中位数;(2)从样本和中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在,的人数分别为,,记.(i)求的分布列及期望;(ii)求.【答案】(1)65(2)(i)分布列见详解,数学期望为1;(ii).【分析】(1)根据中位数的定义确定体重区间,进而可求得中位数的值.(2)(i)首先确定分层抽样的比例,然后确定的可能取值,并计算相应的概率,列出分布列,计算出期望;(ii)根据方差公式求出的值.【详解】(1)因为,,故样本的中位数落在内,

又,故中位数为(2)(i)和的人数比为,

分层抽样抽取学生6人中,和的人数分别为和,故这6人中随机抽取3人,的可能取值为,对应的的取值为,所以的可能取值为,

,,,

故的分布列为期望为,

(ii)由(i)知,所以.5.(2026·重庆名校联盟第一次·联考)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.(1)该地区某学校建议此次物理测试成绩在本地区前的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)(2)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量,求的分布列及数学期望.【答案】(1)72分(2)分布列见详解,【分析】(1)根据频率分布直方图中所有小矩形的面积和为1,可求得a值,分析可得选报物理方向的最低分在内,根据x值右侧面积和为,即可求得答案.(2)求出成绩在区间和的人数,分析可得X的可能取值,求出各个取值对应的概率,列出分布列,求出期望即可.【详解】(1)由题意,解得,成绩在的频率为0.1,在的频率为0.25,在的频率为0.3,因为,所以选报物理方向的最低分在内,则,解得,所以估计报物理方向的学生本次成绩不低于72分.(2)由题可知,成绩在区间的频数为,成绩在区间的频数为,利用分层抽样,从中抽取7份,成绩在的频数为,成绩在的频数为,再从这7份答卷中随机抽取3份,的所有可能取值为,,故的分布列为:012所以的数学期望为:.6.(2026·安徽合肥第六中学阶段性·绿色评价)烧麦——在呼和浩特有着深厚的历史底蕴,2024年12月21日,呼和浩特举办了“首届烧麦美食大会”,活动持续至2025年1月3日,期间吸引了数以万计的国内外游客慕名而来.“烧麦美食大会”的举办旨在传承和弘扬烧麦文化,深入挖掘呼和浩特市的文旅资源优势,推动烧麦产业创新与发展,促进文商旅融合,提升城市形象.为了了解游客的旅游体验满意度,某研究性学习小组采用问卷调查的方式,随机调查了100名游客,并将收集到的满意度得分数据(满分100分)分成了五段:,,,,得到如图所示的频率分布直方图.(1)求频率分布直方图中的值,为进一步了解游客对本次“烧麦美食大会”满意度情况,从分值在,,三组满意度问卷中,按分层随机抽样的方法抽取6人,再从这6人中随机抽取3人,记满意度得分在人数为,求的分布列和期望;(2)已知满意度分值在的平均数,方差,在的平均数为,方差,试求满意度分值在的平均数和方差.【答案】(1)分布列见详解,(2)84,30【分析】(1)根据分层抽样比确定得分在人数为的所有可能取值为0,1,2,3,分别求得对应概率即可求得分布列和期望值;(2)利用样本方差求总体方差公式代入计算即可求得结果.【详解】(1)由,解得;由题可知,调查问卷考核得分分值在三组内的游客人数比为,则需在内的游客中分别抽取人,人,人.现从这6人中随机抽取3人,则考核得分在人数为的所有可能取值为0,1,2,3.,,,.所以的分布列为0123所以.(20满意度分值在的频率为,人数为20;在的颣率为,人数为30,满意度分值在的平均数,方差,在的平均数,方差,所以满意度分值在的平均数,满意度分值在的方差.题型02二项分布、超几何分布、正态分布抓关键·破难点一、“提、定、求、列、套”五步速求随机变量的分布列、期望与一、“提、定、求、列、套”五步速求随机变量的分布列、期望与方差提:提取关键信息,分析离散型随机变量的含义.定:确定离散型随机变量的所有取值.求:求每一个取值对应的概率(注意).列:根据各个取值与对应的概率列出分布列.套:套用期望、方差计算公式求解,期望,方差.二、二项分布、超几何分布的均值、方差公式分布类型均值公式方差公式服从参数,的二项分布服从参数,,的超几何分布三、正态分布常用结论◎对于随机变量,其正态密度曲线关于直线对称,曲线与轴之间的区域的面积为1.,,.刷经典·通方法🎯命题方向一二项分布1.(2026·安徽合肥·模拟)某平台为了研究用户日均观看短视频的时长,随机抽取了200名用户进行调查,得到数据如下表:日均时长(分钟)[40,50]频数3050803010(1)估计这200名用户日均观看时长的第70百分位数;(2)若平台规定“日均观看时长不少于30分钟的用户为潜在高粘性用户”,现从样本中有放回地抽取次,每次抽取1人,记抽到潜在高粘性用户的人数为.(i)当时,求的分布列和数学期望;(ii)若平台希望至少抽到1名潜在高粘性用户的概率不低于,至少需抽取多少次?(参考数据:)【答案】(1)(2)(i)分布列见详解,;(ii)11次【分析】(1)第70百分位数为累计频数,第70百分位数落在区间,利用比例求解即可;(2)(i),列出Y的所有可能取值和对应概率,得到分布列,并利用二项分布求期望公式计算出数学期望;(ii)利用对立事件计算出抽到潜在高粘性用户的概率,解不等式得到答案【详解】(1)将数据按时长升序排列,第70百分位数位置为,前两组累计频数,前3组累计频数,故第70百分位数落在区间,则第70百分位数约为;(2)(i)潜在高粘性用户的频率为,.易得的可能取值有0,1,2,3,则,,.故的分布列为0123;(ii)设至少需抽取次,则,即,.即,故至少需抽取11次.2.(2026陕西汉中·模拟)已知排球比赛的规则是:每局25分,达到24分时,比赛双方必须相差2分.才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3:0或3:1取胜的球队积3分,负队积0分;以3:2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:123456甲252127272325乙182525252517假设用频率估计概率,且甲,乙每局的比赛相互独立.(1)估计甲队每局获胜的概率;(2)如果甲、乙两队比赛1场,求甲队的积分的概率分布列和数学期望;(3)如果甲、乙两队约定比赛2场,求两队积分相等的概率.【答案】(1)(2)分布列见详解,(3)【分析】(1)用频率估计概率,结合题意求概率即可;(2)由题意可知,随机变量的所有可能取值为0,1,2,3,结合独立重复性实验概率公式求分布列和期望;(3)记“甲、乙比赛两场后,两队积分相等”为事件A,分析可得,结合题意运算求解.【详解】(1)用频率估计概率,6局中甲共赢4局,则甲队每局获胜的概率为.(2)由题意可知,随机变量的所有可能取值为0,1,2,3,则,,,,可得的分布列为:0123所以.(3)记“甲、乙比赛两场后,两队积分相等”为事件A,设第场甲、乙两队积分分别为,,则,其中,因为两队积分相等,则,即,可得,又因为,,,,所以.3.(2026·山东临沂·一模)某人工智能公司召开年会,期间提供两个游戏供员工选择,两个游戏均有3局,每局获胜可获对应奖金,奖金可累计.具体规则如下:游戏Ⅰ:抛掷质地均匀的相同硬币第1局,抛两枚,向上的图案相同则获胜,得100元奖金;第2局,抛三枚,向上的图案相同则获胜,得500元奖金;第3局,抛四枚,向上的图案相同则获胜,得900元奖金;游戏Ⅱ:抛掷质地均匀的特殊骰子(三组对面分别标记0,2,6的骰子).第1局,抛两颗,向上数字相同则获胜,得300元奖金;第2局,抛三颗,向上的数字相同则获胜,得600元奖金;第3局,抛四颗,向上的数字是2,0,2,6(不计顺序)则获胜,得900元奖金.(1)求游戏Ⅰ第2局获胜的概率;(2)若销售部门3位员工均选择游戏Ⅰ,设X为前两局均未获胜的人数,求X的分布列和数学期望;(3)从奖金期望角度,员工应选择哪个游戏?请说明理由.【答案】(1)(2)答案见详解;(3)游戏Ⅱ【分析】(1)根据古典概型概率公式直接计算可得结果;(2)利用二项分布直接计算即可得出分布列和期望;(3)分别计算出参加一次游戏Ⅰ和游戏Ⅱ对应的奖金期望值,可知应选择游戏Ⅱ.【详解】(1)由题意知,游戏Ⅰ第局获胜的概率.(2)易知,游戏Ⅰ第局获胜的概率为,第局获胜的概率为,则第局和第局均未获胜的概率为,因此可知,随机变量的分布列为0123随机变量的期望或.(3)应该参加游戏Ⅱ,理由如下:记分别为一次参加游戏Ⅰ,Ⅱ所获奖金总额,游戏Ⅰ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,,游戏Ⅱ第局获胜的概率为,第局获胜的概率为,第局获胜的概率为,,从奖金期望角度来看,应选择参加游戏Ⅱ.4.(2026·山东枣庄·二调)某人工智能实验室要对一款新型学习智能体进行轮测试(每轮测试的结果相互独立),每轮测试中智能体会随机接受类与类任务中的一个.已知该智能体每轮成功完成类任务的概率均为,每轮成功完成类任务的概率均为.成功完成一次类任务得1分,成功完成一次类任务得2分,不成功均得0分.记智能体在第1轮测试后的得分为.(1)求的分布列;(2)记智能体经过2轮测试后的总得分为,求;(3)每轮测试中智能体成功完成类或类任务就称为“过关”.记轮测试中智能体过关的次数为,求和.【答案】(1)分布列为:012(2)(3),【分析】(1)根据题意求出对应随机变量的概率,得到分布列;(2)根据条件概率公式求解即可;(3)利用二项分布的期望、方差公式求解即可.【详解】(1)的可能取值为,,,,所以分布列为:012(2)由(1),,,所以.(3)由题意,,所以,所以,,🎯命题方向二超几何分布5.(2026·广东东莞·模拟)一个袋子中有个大小相同的球,其中有4个红球、8个绿球,分别采用有放回和不放回的方式从中随机抽取3个球,设采用有放回方式抽取时抽到红球的个数为,采用不放回方式抽取时抽到红球的个数为.(1)求的概率;(2)求Y的分布列与数学期望.【答案】(1)(2)分布列0123【分析】(1)若有放回的抽取时,随机变量X服从二项分布,由二项分布的概率公式可得;(2)若不放回抽取时,随机变量Y服从超几何分布,由超几何分布的概率公式可得分布列及期望.【详解】(1)若有放回抽取时,每次抽球相互独立,每次抽到红球的概率为

​,共抽3次,因此,根据二项分布概率公式:

.(2)若不放回抽取时,服从超几何分布,的所有可能取值为,概率公式为:.,,,.的分布列为:0123数学期望:.6.(2026·江苏南通·检测)近年来,盲盒经济在消费市场中掀起了一阵热潮,成为一种普遍的经济现象.商家通过不断变换花样吸引消费者.某商店推出一款售价为1元/个且外观相同的盲盒,每开一个盲盒,会开出3款不同颜色(分别记为红色、黄色、蓝色)的某一商品,开出红色、黄色、蓝色商品的概率分别为.(1)若某顾客一次性购买了3个盲盒,求该顾客恰好开出两个红色商品的概率;(2)若某顾客只想要红色商品,与老板协商一致,每次开一个盲盒,如果开出红色商品则停止,否则再开一个盲盒,若连续4次均未开出红色商品,老板就赠送一个红色商品给他为了得到红色商品,求该顾客的平均花费.【答案】(1)(2)【详解】(1)记“该顾客恰好开出两个红色商品”为事件,.(2)为了得到红色商品,记该顾客打开盲盒的次数为,的所有可能取值为.,,的分布列如下:1234,则该顾客的平均花费为元.🎯命题方向三正态分布7.(2026·河北秦皇岛·阶段检测)固态电池是纯电动汽车搭载的新一代电池,与使用电解液的传统液态锂离子电池相比,固态电池具有安全性能高、能量密度大等特点.某公司试生产了一批新型固态电池,为了了解该批次固态电池的“循环寿命”x(循环寿命是指:电池的容量下降到初始容量的某一阈值时,完成充放电循环的次数)的情况,从这批固态电池中随机抽取了100组进行了测试,并统计绘制了下表:循环寿命x(千次)组数y515ab5已知循环寿命x(千次)的平均值(同一组中的数据用该组区间的中点值代表).(1)求a,b的值;(2)根据测试数据可以认为“循环寿命”x近似服从正态分布,经计算样本标准差s的估计值为0.7.用样本数据的平均值作为的值,用样本标准差s的估计值作为的值.(ⅰ)若规定:循环寿命的电池为一等品;的电池为优等品.求试生产的电池的一等品率和优等品率的估计值(结果用百分数表示);(ⅱ)在该型电池的生产中,称发生概率低于0.27%的事件为小概率事件,在质量控制时,如果小概率事件未发生,则认为该批产品合格;否则可以认为该批产品不合格.若这100组电池中,循环寿命x的最大值和最小值分别为6.5和2.3.请判断该批固态电池是否合格?并说明理由.参考数据:若随机变量,则,,.【答案】(1),.(2)(ⅰ)一等品率的估计值为13.59%;优等品率的估计值为2.275%;(ⅱ)不合格,理由见详解【分析】(1)由题意列出关于的方程组即可求解;(2)由题意,,(i)根据正态分布的对称性求概率即可;(ii)算出,然后由即可判断.【详解】(1)由题,①,②,由①②解得,.(2)由题,,,(ⅰ)因为;,所以一等品率的估计值为13.59%;优等品率的估计值为2.275%.(ⅱ)不合格.理由如下:由题,,所以,又,,故小概率事件发生,所以该批固态电池不合格.8.(2026·山东青岛一模)某款产品的尺寸误差(单位:)服从正态分布,若一件产品的尺寸误差的绝对值不小于,则认为该件产品不合格.(1)任取一件产品,求这件产品不合格的概率;(2)在计算二项分布的概率时,若重复性试验的次数很多且每次试验事件发生的概率很小,则可利用泊松分布代替二项分布进行近似计算.设随机变量服从二项分布,若,且,则,,其中.现对某一批产品抽取40件进行检测,若不合格产品超过3件,则认为这批产品不合格.估算这批产品不合格的概率(精确到0.01).附:若,则;.【答案】(1)0.05;(2)0.14.(注:和均为正确答案)【分析】(1)根据给定条件,求出合格品概率,再利用对立事件的概率公式计算得解.(2)由(1)可得,求出,再利用公式结合互斥事件、对立事件的概率公式求解.【详解】(1)当,时,,则,所以任意一件产品是不合格的概率为0.05.(2)记为不合格产品数量,则,且,又,且,则,,其中,因此,所以这批产品不合格的概率为0.14.(注:最终结果为和均为正确答案)9.(2026·陕西宝鸡·阶段检测)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五个层级,分别对应如下五组质量指标值:、、、、.根据长期检测结果,发现芯片的质量指标值服从正态分布,现从该品牌芯片的生产线中随机抽取件作为样本,统计得到如图所示的频率分布直方图.(1)根据检测结果,样本中芯片质量指标值的标准差的近似值为,用样本平均数作为的近似值,用样本标准差作为的估计值,可得到X服从的正态分布.求和的值;(2)从样本中质量指标值在和的芯片中随机抽取件,记其中质量指标值在的芯片件数为,求的分布列和数学期望;(3)将指标值不低于的芯片称为等品.通过对芯片长期检测发现,在生产线任意抽取一件芯片,它为等品的概率为,用第(1)问结果试估计的值.(附:①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量服从正态分布,则,,.)【答案】(1),(2)分布列见详解,(3)【详解】(1)由于在频率分布直方图可知,所有矩形的面积之和为,由题可知:,解得,所以,估计从该品牌芯片的生产线中随机抽取件的平均数为:.所以,.(2)样本中质量指标值在和的芯片数量为,所取样本的个数为件,质量指标值在的芯片件数为件,故可能取的值为、、、,所以,,,,,随机变量的分布列为:所以的数学期望.(3)由(1)可知:,则,,由题可知:.所以:,即.题型03概率的独立性、条件概率与全概率公式抓关键·破难点一、条件概率模型结论=1\*GB3①:利用定义计算条件概率,分别求P(A)和P(AB),得.结论=2\*GB3②:利用缩小样本空间法求条件概率.先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数,即n(AB),得.二、全概率模型结论=3\*GB3③:一般地,设是一组两两互斥的事件,=Ω,且P(Ai)>0,i=1,2,,n,则对任意的事件,有P(B)=.三、贝叶斯公式结论=4\*GB3④:设是一组两两互斥的事件,=Ω,且,则对任意的事件,P(B)>0,有.刷经典·通方法🎯命题方向一概率的独立性1.(2026·河北部分学校·一模)甲、乙两名同学进行投篮游戏,两人各投一次称为一轮,投中记1分,投不中记0分,甲、乙每次投中的概率分别为,且每次投篮结果都相互独立,共进行3轮游戏,总分多者获胜,相等为平局.(1)求甲获胜的概率;(2)游戏结束后,记甲、乙两名同学的得分之和为随机变量X,求X的分布列与数学期望.【答案】(1);(2)随机变量的分布列为:.【分析】(1)因为甲乙投篮结果相互独立,所以可利用独立事件概率乘法公式和互斥事件概率加法公式,分别计算甲获胜的每种情况的概率再求和.先确定随机变量X的所有可能取值,利用独立事件概率乘法公式计算每个组合的概率,求出分布列.【详解】(1)设甲、乙三轮总得分为、,且、服从二项分布,,,,;,,,;=++=所以甲获胜的概率为.(2)X可能的取值为,,;;;;;;随机变量的分布列为:=.2.(2026·广东东莞3月·质量检测)甲、乙两人参加某高校的入学面试,入学面试有2道难度相当的题目,甲答对每道题目的概率都是,乙答对每道题目的概率都是,每位面试者共有两次机会,若答对第一次抽到的题目,则面试通过,结束答题;否则继续第2次答题,答对则面试通过,未答对则面试不通过,甲、乙两人对抽到的不同题目能否答对是独立的,且两人答题互不影响,(1)求甲、乙两人有且只有一人通过面试的概率;(2)设面试过程中甲、乙两人答题的次数之和为,求的分布列与期望.【答案】(1)(2)分布列见详解,【分析】(1)根据相互独立事件概率公式直接计算可得结果;(2)易知随机变量的可能取值为2,3,4,分别计算出对应概率可得分布列,计算出期望值.【详解】(1)设事件为“甲通过面试”,事件为“乙通过面试”,(或)(或)所以甲、乙两人有且只有一人通过面试的概率.(2)随机变量的可能取值为2,3,4.,,,随机变量的分布列为234所以随机变量的期望为.3.(2026·海南部分学校·联合调研)竹竿舞又称“跳竹竿”,是人在两竹竿滑动相撞的空隙中跳动的一种娱乐活动.2005年,黎族的竹竿舞被确定为海南省非物质文化遗产,2006年,竹竿舞入选“国家级非物质文化遗产保护名录”,甲、乙两名游客组队参加了海南某文化旅游区举办的竹竿舞闯关活动,该活动总共分为三关:第一、二关均为单人独舞(第一关和第二关闯关的人不相同),第三关为两人共舞.已知甲、乙闯过第一关的概率分别为,闯过第二关的概率分别为,这支队伍闯过第三关的概率为0.5.活动规定:只有闯过前一关,才有资格闯关后一关.(1)请以这支队伍闯过前两关的概率为依据,为甲、乙安排第一关和第二关的闯关顺序,并求此时这支队伍闯过前两关的概率;(2)以在(1)中安排的闯关顺序为准,记这支队伍闯过的关数为,求的分布列与期望.【答案】(1)甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为(2)01230.20.320.240.24【详解】(1)若甲闯第一关,乙闯第二关,则这支队伍闯过前两关的概率为,若乙闯第一关,甲闯第二关,则这支队伍闯过前两关的概率为,由于,则应该安排甲闯第一关,乙闯第二关,此时这支队伍闯过前两关的概率为.(2)由(1)知,安排甲闯第一关,乙闯第二关,而的可能取值为,则,,,,所以的分布列为:01230.20.320.240.24则.4.(2026·安徽临泉·模拟)某校为庆祝建校百年,学校组织建校百年校友体育赛,赛事间隙举行了一次有关三大球类运动的知识竞赛,海量题库中篮球、足球、排球三类相关知识题量占比分别为.甲校友回答篮球、足球、排球这三类问题中每个题的正确率分别为.(1)若甲校友在该题库中任选一题作答,求他回答正确的概率;(2)若甲校友从这三类题中各任选一题作答,每回答正确一题得3分,回答错误得分.设该校友回答三题后的总得分为分,求的分布列及数学期望;(3)知识竞赛规则:随机从题库中抽取道题目,答对题目数不少于道,即可获得奖励.现以获得奖励的概率大小为依据,若甲校友在和之中选其一,则他应如何选择?并说明理由.【答案】(1)(2)分布列见详解,(3),理由见详解【分析】(1)根据全概率公式即可求解,(2)根据概率乘法公式求解概率,即可求解分布列和期望,(3)对和求解对应的概率,利用作差法比较大小即可求解.【详解】(1)设“甲校友所选的题目回答正确”,“所选的题目为篮球相关知识的题目”,“所选的题目为足球相关知识的题目”,“所选的题目为排球相关知识的题目”,则,且两两互斥.根据题意得,,,,则,所以甲校友在该题库中任选一题作答,他回答正确的概率为.(2)的可能取值为,,,,,则的分布列为:-3159所以.(3)当时,为甲校友答对题目的数量,由题意可知,其中,故当时,甲校友获得奖励的概率,当时,甲校友获得奖励的情况可以分为如下情况:①前8题答对题目的数量大于等于5,②前8题答对题目的数量等于4,且最后2题至少答对1题,③前8题答对题目的数量等于3,且最后2题全部答对,故当时,甲校友获得奖励的概率,所以,因为,所以,即,所以甲校友应选.🎯命题方向二条件概率与全概率公式5.(2026·河南焦作一模)有甲、乙两个不透明的袋子,甲袋中有8个红球、2个黄球,乙袋中有9个红球、3个黄球.(1)若从甲袋中随机一次性取出2个球,其中红球的个数为,求的分布列与数学期望;(2)先从甲、乙两个袋子中任选一个袋子,再从所选的袋子中随机一次性取出2个球,若已知取出的2个球都是红球,求这2个球来自乙袋的概率.【答案】(1)012(2)【分析】(1)由题意,的所有取值为,分别求出对应的概率即可得到分布列,再根据期望的公式求解即可;(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,根据全概率公式先求得,再根据条件概率公式求解即可.【详解】(1)由题意,的所有取值为,则,,,所以的分布列为:012则.(2)设事件为“选中乙袋”,事件为“从袋子中随机一次性取出的2个球都是红球”,由题意得,,则,所以.6.(2026·陕西咸阳·模拟)2026年央视马年春晚节目《武BOT》将传统武术与现代科技完美融合,“人机共武”完成了棍术攻防、醉拳互动、双节棍对练及极限空翻等高难度表演动作,不仅展示了我国人工智能技术的飞速发展,也体现了科技赋能传统文化的实践创新,其中高空弹射空翻转体完成后,稳准落地让人震撼.研究人员将机器人极限空翻动作划分为空翻转体和稳准落地两个环节,在空翻转体环节中,每个机器人完成空翻转体的概率均为0.9;在落地环节,机器人的表现存在差异:若空翻转体完成,则稳准落地的概率为0.8;若空翻转体未完成,则稳准落地的概率为0.1.在极限空翻这个表演中,假设每个机器人完成动作互不影响.(1)如果随机抽取3个机器人,记为完成空翻转体的机器人人数,求的分布列及数学期望;(2)如果随机抽取一个机器人,已知其稳准落地,求其空翻转体完成的概率.【答案】(1)的分布列为:01230.0010.0270.2430.729数学期望为2.7(2)【分析】(1)分析可知,利用二项分布求分布列和期望即可;(2)设相应事件,利用全概率公式可得,结合条件概率公式运算求解.【详解】(1)由题意可知:,则有:;;;;则的分布列为:01230.0010.0270.2430.729数学期望为.【详解】(2)设事件为“一个机器人空翻转体完成”,事件为“一个机器人稳准落地”.则,,,,由全概率公式可得:,所以.7.(2026·江西吉安3月·模拟)某校社团举行“网络安全”知识竞赛,规则如下:每位选手需要独立完成3道题目,答对一题得2分,答错一题得分,3道题目累加得分多者获胜,甲、乙两位同学报名参加比赛,两人分别独立答题,互不影响,若甲、乙正确回答每道题的概率分别为、.(1)求比赛结束后甲得3分的概率;(2)已知在甲获胜的前提下,乙恰好得3分的概率为,求的值.【答案】(1)(2)【分析】(1)首先确定甲得3分的事件为答对2题,答错1题,根据二项分布概率公式求解;(2)首先分别求甲和乙得分的分布列,再求甲获胜的概率,最后代入条件概率公式,求解概率.【详解】(1)设“比赛结束后甲得3分”为事件,则;(2)记“比赛结束后甲获胜”为事件,记“比赛结束时乙恰好得3分”为事件,设甲的得分为,则,,,设乙的得分为,的可能取值为,,,,则,,,,,又,所以,解得8.(2026·安徽皖北协作区·联考)某市高三学生学习强度指数Q的概率分布情况如下表所示.学习强度指数Q概率0.2050.3应对情况轻松应对勉强应对困难应对(1)从该市随机选取3名高三的学生,记学习强度指数的人数为X,求及X的数学期望.(2)定义为在事件M发生的条件下事件N发生的优势.记事件“该学生学习有压力”(勉强应对和困难应对都被认为是学习有压力,轻松应对被认为是学习无压力),事件“该学生困难应对”,求在事件A发生的条件下事件B发生的优势.【答案】(1),的数学期望为;(2);【详解】(1)由表可知,学习强度指数的概率为:,从该市随机选取名学生,记学习强度指数的人数为,则服从二项分布,所以;的数学期望为:;(2)由题意可知,事件为“该学生学习有压力”,事件为“该学生困难应对”.,,因事件包含于事件中,所以,在事件发生的条件下事件发生的概率为:,在事件发生的条件下事件发生的概率为:,所以在事件发生的条件下事件发生的优势为:.9.(2026·广东河源3月·质量检测)湘绣,是中国优秀的民族传统工艺之一,有着两千多年的历史.湘绣的制作工艺繁杂,一幅湘绣作品要经过设计图案和刺绣两大主要环节,且只有设计图案通过后才能进行刺绣,两个环节相互独立.只有同时通过这两个环节才能成为成品.某绣坊准备制作三幅不同的湘绣作品,已知三幅作品通过设计图案环节的概率依次为,通过刺绣环节的概率依次为.(1)求三幅中恰有一幅作品通过设计图案环节的概率;(2)若已知三幅中恰有一幅作品通过设计图案环节,求通过的作品为的概率;(3)经过设计图案和刺绣两个环节后,三幅作品成为成品作品的件数为.求随机变量的分布列及数学期望.【答案】(1)(2)(3)分布列见详解,【分析】(1)由概率乘法公式进行求解;(2)由条件概率公式求解;(3)记三幅作品成为成品的事件分别为,则,由可取,求出对应的概率,列出分布列即可求解数学期望.【详解】(1)记三幅作品通过设计图案环节分别为事件,记三幅中恰有一幅作品通过设计图案环节为事件,则.(2).(3)记三幅作品成为成品的事件分别为,则,由可取,则,,,,则的分布列为0123则数学期望.10.(2026·安徽合肥3月·质量检测)某公司研发了一种智能语音客服系统,在测试时,当语音输入的问题表达清晰时,智能语音客服的回答被采纳的概率为,当语音输入的问题表达不清晰时,智能语音客服的回答被采纳的概率为.已知语音输入的问题表达清晰的概率为,且智能语音客服每次回答是否被采纳相互没有影响.(1)求智能语音客服的回答被采纳的概率;(2)在某次测试中输入了4个问题,设表示智能语音客服的回答被采纳的次数,求的分布列、数学期望和方差.【答案】(1)(2)分布列见详解,3,【分析】(1)设出基本事件并求出概率,再利用全概率公式求解即可.(2)结合题意得到,再求出对应取值概率,进而得到分布列和数学期望即可.【详解】(1)设表示事件“智能语音客服的回答被采纳”;表示事件“语音输入的问题表达清晰”,由题意可知,,所以,即智能语音客服的回答被采纳的概率为.(2)依题意得,的所有可能取值为,且.所以所以的分布列为0123411.(2026·江苏南京市六合区名校联盟第一次·调研)有N个人需要通过血液检测某种酶是否存在.假设每个人血液中含有该酶的事件是相互独立的,且含有该酶的概率均为,若血液检测始终能准确判断样本中该酶是否存在.现采用以下分组检测方法:将待检测人群分成r个小组,每组人.在每一组中,取每人的血液混合成一个样本进行检测.若某组的混合样本检测结果呈阴性(不含酶),则该组内所有人员无需再进行后续检测.若某组的混合样本检测结果呈阳性(含有酶),则需要对该组内的每一位成员再分别单独检测一次(不用采集血样,利用现有采集过的血样).(1)若,,已知某小组的混合样本检测结果呈阳性,求该组内“恰有2人”血液中含有该酶的概率;(2)用N,k,p表示该方法所需检测次数的期望值;(3)设检测成本由两部分组成:采集处理血样成本为a元/人份,化验检测成本为b元/次.若,每组人数,且该方法的总成本期望值比“逐一检测”的总成本节省了50%以上,求的取值范围.(参考数据:)【答案】(1)(2)(3)【分析】(1)设小组中有酶的人数为X,依题意,可知,分别求出与,利用条件概率公式即可求出恰有2人有酶的概率;(2)设每组检测次数,则易得,求出其分布列和数学期望,进而可求得总检测次数的期望;(3)利用(2)中若分组检测,由检测次数的期望求得总成本期望,若逐一检测,则总成本为,依题意,代值计算即得的取值范围.【详解】(1)设小组中有酶的人数为X,则.已知混合样本阳性,即,则恰有2人有酶的概率为.(2)设每组检测次数,则的分布列为1p期望为则总检测次数的期望;(3)若分组检测,检测次数的期望为.总成本期望,若逐一检测,则总成本.由节省50%以上得.代入,,,得,整理得,因此,,故的取值范围是.12.(2026·山东德州·一模)在某工厂的产品质量检测中,设随机变量表示从一批产品中随机抽取的不合格产品数量.已知抽取到个不合格产品的分布列为:0123每个不合格产品需要进行返工处理,返工成功(即将不合格产品修复为合格产品)的概率均为,且各个产品返工是否成功相互独立.事件表示抽取的产品中有个不合格产品(),事件表示抽取的产品中返工成功的数量比返工失败的数量多.(1)若,求,并根据全概率公式求;(2)是否存在值且,使得,请说明理由.【答案】(1),(2)不存在,理由见详解【分析】(1)利用所给分布列,根据概率之和为1求出,再由条件概率公式及全概率公式求解即可;(2)根据分布列由期望公式求出得出方程,令,再由导数判断函数的最大值小于0,即可判断方程无解.【详解】(1)当时,,则,解得,由题意,得,,.由全概率公式,得.(2)假设存在,使,又.得,化简得,即令则因为,所以在上存在,使得所以即且在为正,在为负从而在为增函数,在为减函数所以当时,,即不存在值,使得.🎯命题方向三贝叶斯公式的应用13.(2026·辽宁大连·二调)欲从A,B两个频道中选出一个优选频道作为校园之声广播,现对这两个频道轮流播放进行测试,每次播放一个频道.已知A频道每次播放成功的概率为,B频道每次播放成功的概率为,且每次播放互不影响.约定1:任选一个频道进行播放,若播放成功,便成为优选频道;约定2:从A频道开始播放,先成功播放的频道为优选频道,当决定出优选频道或两频道都播放3次均失败,结束测试.(1)按照约定1,求在播放一次就成功的条件下,A频道成为优选频道的概率;(2)按照约定2,(i)两个频道共播放不超过4次时,求A频道成为优选频道的概率;(ii)测试结束时,求B频道播放次数的分布列与数学期望.【答案】(1)(2)(i);(ii)分布列见详解,数学期望为【分析】(1)按照贝叶斯公式直接计算即可;(2)(i)按照播放次数分情况求解;(ii)写出的所有可能取值并计算所对应的概率,然后列出分布列,计算即可.【详解】(1)设“任选一个频道播放,该频道是A频道”为事件,“任选一个频道播放,该频道是B频道”为事件,“任选一个频道播放一次,该频道播放成功”为事件,所以,,在播放一次就成功的条件下,A频道成为优选频道的概率为.(2)(i)播放1次A频道成为优选频道的概率为,播放3次A频道成为优选频道的概率为,所以按照约定2,两个频道共播放不超过4次时,A频道成为优选频道的概率为.(ii)的所有可能取值为0,1,2,3,,,所以的分布列为:0123所以数学期望为.14.(2026·甘肃陇南·二诊)托马斯.贝叶斯(ThomasBayes)在研究“逆向概率”的问题中得到了一个公式:设,是一组两两互斥的事件,,且,,则对任意的事件,有.这个公式被称为贝叶斯公式(贝叶斯定理).其中称为事件的全概率.(1)假设这3台车床型号相同,它们各自独立工作,且发生故障的概率都是0.3,设同时发生故障的车床数为随机变量,求的分布列和数学期望;(2)假设该车间生产了两箱零件,第一箱内装有10件,其中有2件次品;第二箱内装有20件,其中有3件次品.现从两箱中等可能地随机挑选一箱,然后从该箱中随机取一个零件.已知取出的是次品,求它是从第二箱中取出的概率.【答案】(1)01230.3430.4410.1890.027期望(2)分析】(1)由题意确定服从二项分布,即可求解;(2)设“任取一个零件为次品”“零件是从第箱取出的”,由全概率公式求得,再由贝叶斯公式即可求解.【详解】(1)设,由题意知:所以的分布列为01230.3430.4410.1890.027.(2)设“任取一个零件为次品”,“零件是从第箱取出的”,则且,由题意知:,,由全概率公式:,由贝叶斯公式知:.题型04变量的相关关系与回归分析抓关键·破难点当经验回归方程不是形如时的转化技法:非线性经验回归方程变换公式变换后的线性经验回归方程刷经典·通方法🎯命题方向一线性回归方程的求解、拟合与预测1.(2026·安徽池州质量·监测)某同学为养成锻炼习惯,使用智能手环记录自己连续五天行走步数,设日期顺序变量x(为第一天),y(单位:千步)为对应日期的步数,具体数据如下表:日期顺序(天)12345步数y(千步)6.26.87.68.49.0(1)求y关于x的经验回归方程;(2)利用(1)中的回归方程,预测该同学第7天的步数能否达到一万步.附:经验回归方程,其中,【答案】(1)(2)预测该同学第7天的步数能达到一万步【分析】(1)利用最小二乘估计可求得经验回归方程;(2)令,代入回归方程求解即可.【详解】(1),,所以又过,所以所以关于的经验回归方程为(2)令,得(千步)因为10.48千步等于1.048万步所以由(1)中的回归方程,预测该同学第7天的步数能达到一万步2.(2026·江苏南京·一模)为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:日期编号123456温差91311151014百粒发芽数232826312529(1)根据表中的数据,计算样本相关系数(精确到0.01);(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.参考公式:相关系数,,,参考数据:,,,.【答案】(1)(2),【分析】(1)根据条件,直接计算,即可求解;(2)根据条件,直接求出,即可求出线性回归方程,再将代入,即可求解.【详解】(1)相关系数.(2)由题意得,,所以,,所以所求的经验回归方程是,当时,,故当昼夜温差为时,这种植物种子当日百粒发芽数为.3.(2026·浙江强基联盟·联考)2025年11月,全国多地中小学推行“秋假”政策,直接带动旅游市场热度.某景点为科学定价、吸引更多中小学生游客,选取拟定价格开展门票定价试运行,相关数据如下表所示:门票价格x(元/人)4050607080日游客人数y(千人)18171375(1)已知y与x具有线性相关关系,求出y关于x的经验回归方程;(2)为了扩大景区知名度与客流吸引力,景区将门票定价为10(元/人),并计划做广告宣传.由前期调查可知,当日均广告费为千元时的日游客人数为千人,其中y是当门票为10(元/人)时,根据(1)中的经验回归方程所预测的日游客人数.求景区的日均广告费用为多少千元时才能使日门票净收入最大.(日门票净收入=票价×日游客人数-日均广告费)参考公式:经验回归方程,.【答案】(1)(2)当门票定价为10元时,日广告费用为4千元时门票净收入最大【分析】(1)根据公式求得,可求得y关于x的经验回归方程;(2)设门票净收入为,结合(1)可得,进而利用,可求解.【详解】(1)由题意得:,,,,,,关于x的经验回归方程为.(2)设门票净收入为,则,由(1)时,,故,若要使最大,则,代入可得,又因为,故,所以当门票定价为10元时,日广告费用为4千元时门票净收入最大.4.(2026·山东聊城·一模)某景区统计了连续5天该景区接待游客的人数(单位:万人),数据如下表:第x天12345接待游客人数y(万人)222.63.15.26.9(1)根据表中数据,求y关于x的经验回归方程,并预测第7天该景区接待游客的人数;(2)该景区上山、下山各有步行和乘观览车两种方式.调查显示,游客选择步行和乘观览车上山的概率分别为,,步行上山的游客下山时继续选择步行的概率为,乘观览车上山的游客下山时继续选择乘观览车的概率为.假设游客之间选择上山、下山的方式互不影响,现从该景区出口随机选取4位下山的游客了解其下山方式,记X为这4人中步行下山的游客人数,求X的分布列和期望.附:参考数据:,,.参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.【答案】(1);8.8万人.(2)分布列见详解,数学期望为3.【分析】(1)利用最小二乘法公式求出回归直线方程,再估计第7天该景区接待游客的人数;(2)由全概率公式计算,利用二项分布计算概率,列出分布列,由公式计算期望和方差可得.【详解】(1)由题,又,,,,所以

,因此关于的经验回归方程为,将代入回归方程得,即预测第7天接待游客人数为8.8万人.(2)设事件为“游客步行下山”,事件为“游客步行上山”,事件为“游客乘观览车上山”,根据全概率公式可得每位游客步行下山的概率为,所以由题意,的可能取值为,,,,,因此的分布列为:01234所以期望为.5.(2026·江苏扬州适应性·调研测试)某高中数学兴趣小组,准备利用所学知识研究成年男性的臂长与身高之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:1591651701761806771737678(1)根据上表数据,可用线性回归模型拟合与的关系,请用相关系数加以说明;(2)建立关于的回归方程(系数精确到0.01);(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为,求.参考数据:【答案】(1)说明见详解(2)(3)【分析】(1)利用相关系数的计算公式即可得解;(2)利用已知数据和公式得到关于的线性回归方程;(3)根据已知条件求出随机变量X的取值,利用古典概型的概率公式计算随机变量取值相应的概率,再利用离散型随机变量的期望公式即可求解.【详解】(1)由表中的数据和参考数据得,,,,,,,∴.因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.(2)由及(1)得,,所以y关于x的回归方程为.(3)X的取值依次为2,3,4,5,6,7,9,11,,,,,,,,,X的分布列X所以.6.(2026·江苏扬州市第一次·调研)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:年份代码x12345App在线用户数y(单位:万)80150210260300(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.【答案】(1),很强的线性正相关关系(2)X80150210P【详解】(1)由题意,,,则,由,同理,则,则,由接近1且为正,故变量x与y之间有很强的线性正相关关系.(2)由题意,X的可能取值为80、150、210,则,,,故X的分布列为:X80150210P则.🎯命题方向二非线性回归的转化与应用7.(2026·江苏省南京市栖霞区名校联盟·一模)在“M型无人机”物流配送场景中,无人机的载重(单位:kg,)会直接影响其每千米能耗(单位:Wh/km,Wh为电能单位).某技术团队对该无人机进行载重测试,得到如下实验数据:载重(kg)014916每千米能耗(Wh/km)27121722为精准预测不同载重下的每千米能耗,现有以下三种模型供选择:①,②,③.(1)选出你认为最符合实际的函数模型,说明理由,并求出其函数解析式;(2)若该无人机电池容量为300Wh,飞行环境、飞行参数控制不变.根据(1)中所得的函数模型,(i)某单程配送任务要求该无人机飞行20km,且载重9kg,判断该无人机是否能完成本次配送任务,并说明理由;(ii)若该无人机执行往返配送任务,去程与返程均需飞行(单位:km),去程载重25kg,返程空载,且往返总能耗不大于电池容量的,求的最大值.【答案】(1)选择模型为,理由见详解,(2)(i)不能,理由见详解(ii)9km【分析】(1)先根据定义域和单调性要求筛选出函数模型③,把已知点代入模型求出、的值,检验其余点是否在所得函数图象上确定解析式.(2)(i)计算载重9时飞行20km能耗并与300比较判断能否完成任务.(ii)先算出载重25时总能耗表达式,再根据能耗限制列不等式求解的最大值.【详解】(1)选择函数模型③.理由如下:依题意可知,所选的函数模型必须满足两个条件:一是函数定义域为;二是“每千米能耗”随着“载重”的增多而增大.因为模型①的定义域不可能为,所以不符合:因为模型②是单调递减函数,所以不符合;因为模型③在有意义,且当时,单调递增,符合题意,故应选择模型为.将点(0,2),(1,7)代入得,解得,所以.经检验,点(4,12),(9,17),(16,22)都在函数的图象上,所以所求的函数解析式为,且当时,表示空载能耗.(2)由(1)得.(i)依题意,得,所以该无人机不能完成本次配送任务.(ii)依题意,得,所以,解得,所以的最大值为9km.8.(2026·广东深圳中学·阶段测试)某市近6年的新能源汽车保有量数据如下表年份代号x123456保有量y(万辆)11.82.745.99.2(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;(2)用函数模型对变量x,y关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).参考数据:,,,;设,,参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,【答案】(1)(2)【分析】(1)先确定保有量大于3万辆的年份数量,用对立事件求至少1年大于3万辆的概率,再结合2年都大于3万辆的概率,通过条件概率公式计算结果;(2)将非线性回归模型取对数转化为线性回归模型,利用给定数据计算斜率和截距,再还原得到原模型的参数.【详解】(1)保有量大于3万辆的年份有第4,5,6年,共3年,保有量不大于3万辆的年份有第1,2,3年,共3年,设至少有1年保有量大于3万辆为事件,2年保有量全都大于3万辆为事件,事件的对立事件为2年都不大于3万辆,总选法有,两年都不大于3万辆的选法为,所以,两年都大于3万辆的选法为,所以,则.(2)已知模型,两边取对数得,令,则,即转化为线性回归方程,其中,由题意得,则,,因为,所以,则.9.(2026·云南民族大学附属高级中学·适应性训练)近年来,我国新能源汽车发展势头迅猛.为支持绿色出行,某市近年来加速公共充电桩建设,研究人员记录了某品牌新型充电桩投入运营后前6周的周均单桩服务车辆数(单位:辆),数据如下所示.第周123456周均单桩服务车辆数2030456799148为分析其增长趋势,令.经初步计算,已知,,.(1)写出关于的指数回归方程;(其中,为常数,为自然对数的底数,的计算结果保留两位小数)(2)调查显示,使用该充电桩的车主中,随机抽取1人会参与“低碳积分”活动的概率为0.3.现随机独立抽取5名车主,求恰好有2人参与该活动的概率.附:记一组点,…,通过最小二乘估计所得的经验回归方程为,其中,.【答案】(1)(2)【分析】(1)将原指数方程可转化为线性回归方程:,结合经验回归方程的公式求解即可;(2)设事件为“恰好有2人参与该活动”,利用即可求解.【详解】(1)令,则原指数方程可转化为线性回归方程:,即,其中,由,,,可得,,,所以,,所以,由得,则关于的指数回归方程;(2)设事件为“恰好有2人参与该活动”,所以.🎯命题方向三回归模型的拟合效果评价10.(2026·广东广州市天河区适应性训练·二模)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.256891620212810.9619.242227.5230.28(1)求的值;(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.【答案】(1)(2)分布列见详解,(3)经验回归方程的拟合效果不良好【分析】(1)求出根据回归直线必过样本中心点求解即可;(2)可能取值,求出对应概率,进而得到分布列和期望;(3)求出代入公式,即可得到答案.【详解】(1),,因为,即,解得.(2)5组数据中,两组数据残差为正值,三组数据残差为负值,所以可能取值为,,,,所以X的分布列为012期望.(3),,所以经验回归方程的拟合效果是不良好.题型05独立性检验问题抓关键·破难点“补、提、套、比、说”五步速解独立性检验问题补:根据题干数据信息,补全列联表;提:提出零假设:两个分类变量不相关;套:套用公式计算;比:查表找到,比较和的大小;说:说明结论:如果,则不成立,即两个分类变量相关;如果,则成立,即两个分类变量不相关;刷经典·通方法1.(2026·云南曲靖·模拟)血脂高(高脂血症)可能导致动脉硬化、心脑血管疾病、胰腺炎等健康问题,长期血脂高会引发全身多器官损伤.某市医疗机构为了研究运动与血脂的关系,从本市成年人中采用随机抽样的方法抽取了150名市民,调查他们是否得高脂血症和平时运动的情况(每日进行30分钟以上中等强度的运动,且每周运动5天以上的为“运动者”,否则为“非运动者”).统计的部分数据如表.运动情况是否得高脂血症合计得高脂血症未得高脂血症“非运动者”45

“运动者”5575合计

150(1)计算,的值,并依据的独立性检验,判断能否认为得高脂血症与不运动有关?(2)该医疗机构采用分层随机抽样的方法从得高脂血症的成年人中随机抽取13人,并进行饮食方面的调查,然后从这13人中随机抽取2人作饮食指导,记这2人中“运动者”的人数为,求的分布列及数学期望.附:,.0.100.010.0012.7066.63510.828【答案】(1),,能认为得高脂血症与不运动有关(2)的分布列为:,数学期望为【分析】(1)利用合计数据求出,,再代入公式计算,与临界值比较判断是否有关.(2)先确定得高脂血症总人数,根据分层抽样求出抽样比,进而求解的分布列与期望.【详解】(1)由题意可知:总样本数为,所以非运动者合计为,因此,运动者合计为,则,所以

,因为(对应的临界值),依据的独立性检验,能认为得高脂血症与不运动有关.(2)由(1)可知:得高脂血症总人数为人,分层抽样抽取13人,抽样比为,因此抽取的非运动者高脂血症患者为人,运动者高脂血症患者为人,表示抽取2人中运动者的人数,的可能取值为,则,,,所以的分布列为:数学期望为:.2.(2026·四川成都二模)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了人进行问卷调查,得到如下列联表:体质情况组别合格良好及以上合计爱好运动不爱好运动

合计

(1)求的值,并依据小概率值的独立性检验,分析体质情况是否与爱好运动有关;(2)在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为X,求X的分布列及数学期望.附:,其中.【答案】(1),体质情况与爱好运动有关.(2)的分布列为:012.【分析】(1)求出参数值并完善表格,根据公式计算的值后可得正确判断;(2)先确定的所有可能取值,根据超几何分布计算概率后结合期望公式可求.【详解】(1)由表中数据可得,表格完善如下:体质情况组别合格良好及以上合计爱好运动不爱好运动合计设:体质情况与爱好运动无关,则,根据依据小概率值的独立性检验,否定,故体质情况与爱好运动有关.(2)易知名体质情况“合格”对象中有人爱好运动,人不爱好运动,故的所有可能取值为0,1,2,,,,即所求分布列为012所以的期望.3.(2026·宁夏银川·一模)某工厂有甲、乙两条生产线加工同一型号的产品,甲生产线加工的优品率为5%,乙生产线加工的优品率为6%,加工出来的产品混放在一起.已知甲、乙生产线加工的产品数分别占总数的51%,49%.(1)任取一件产品,如果取到的产品是优品,计算它是甲生产线加工的概率;(2)现对甲生产线升级改造,从改造前与改造后甲生产线加工的产品中分别随机抽取100件进行检验,数据如下:优品非优品合计改造前595100改造后1585100合计20180200根据小概率值的独立性检验,能否认为生产线改造与优品有关联?附:0.050.010.00138416.63510.828【答案】(1)(2)有关联,证明见详解.【分析】(1)结合题意根据全概率公式和贝叶斯公式计算求解(2)根据表格数据计算卡方,与临界值比较即可判断.【详解】(1)设事件:任取一件产品为甲生产线加工,事件:任取一件产品为优品.由题意得:,,,.根据全概率公式,可得总优品概率:根据贝叶斯公式,可得所求条件概率:(2)由列联表得,总样本量,代入卡方公式:因为,所以有把握认为生产线改造与优品有关联.4.(2026·陕西渭南中学·一模)人工智能技术(简称技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,并迅速在各行各业中得到应用和推广,教育行业也不例外.某市教体局为调查本市中学教师使用技术辅助教学的情况,随机抽取了该市120名中学教师,统计了他们一周内使用技术帮助制作课件的情况,并将一周内使用技术帮助制作课件的节次不少于4次的认定为喜欢使用技术,否则认定为不喜欢使用技术,经统计得到如下列联表.年龄是否喜欢使用技术合计是否不超过45岁461460超过45岁322860合计7842120(1)依据小概率值的独立性检验,能否认为该市中学教师是否喜欢使用技术与年龄有关;(2)将频率视为概率,现从所抽取的120名中学教师中随机抽取一人,在抽中喜欢使用技术的教师的条件下,求此人年龄超过45岁的概率.附:,其中.0.10.010.0012.7066.63510.828【答案】(1)有关(2)【详解】(1)零假设该市中学教师是否喜欢使用技术与年龄无关,而,依据小概率值的独立性检验,推断不成立,即认为该市中学教师是否喜欢使用技术与年龄有关.(2)设事件为从所抽取的120名中学教师中随机抽取一人,抽中喜欢使用技术的教师,事件为从所抽取的120名中学教师中随机抽取一人,此人年龄超过45岁,由题意,,则.5.(2026·黑龙江哈尔滨第三中学·一模)为了探究学生完成数学作业情况与成绩之间的联系,某学校采用按比例分层抽样的方式得到200名学生的测验成绩,样本中认真完成作业的学生成绩频率分布直方图如图1所示.若认为成绩不低于120分为优秀,且数学成绩为优秀的学生年级分布扇形图如图2所示,已知样本中高三年级有15位同学成绩为优秀,且在所有数学成绩为优秀的学生中,认真完成作业的学生占.(1)求a的值,并且计算出样本中认真完成作业的学生成绩的下四分位数;(2)根据样本数据完成下方列联表,依据小概率值的独立性检验,分析认真完成作业与成绩是否有关.认真完成作业不认真完成作业成绩优秀成绩不优秀附:.0.10.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1),下四分位数(2)有关【分析】(1)利用频率分布直方图各组频率之和为的性质,列出方程求解参数值;再根据百分位数的定义,通过累计频率确定下四分位数所在的区间,并用插值法计算该分位数;(2)根据分层抽样和条件概率完成列联表,再代入卡方公式计算检验统计量,与临界值比较以判断独立性;最后通过计算两组学生的优秀率并对比,进一步验证独立性检验的结论.【详解】(1)根据频率分布直方图的性质,所有组频率和为,组距为,因此:,解得:,下四分位数即第百分位数,计算累计频率频率,累计;频率,累计;频率,累计;频率,累计。,因此第百分位数在区间内,计算得:下四分位数(2)零假设:认真完成作业与成绩无关

认真完成作业不认真完成作业成绩优秀成绩不优秀,因为,依据小概率值的独立性检验,零假设不成立,即认真完成作业与成绩有关,该判断出错概率不超过0.001,认真完成作业的学生中成绩优秀的频率为0.4,不认真完成作业的学生中成绩优秀的频率为0.1,可以发现认真完成作业的学生成绩优秀的频率是不认真完成作业的学生的4倍,差异显著.6.(2026·东北师大附中哈尔滨师大附中辽宁省实验中学第一次联合模拟考试)截至2025年底,我国新能源汽车保有量达到4397万辆,占汽车总产量的12%.某城市研究小组调查了300名汽车驾驶员对新能源汽车和燃油汽车的偏好程度,将调查结果整理成如下列联表.现统计得出样本中偏好燃油汽车的人数占样本总数的50%,女性驾驶员的样本占样本总数的,偏好燃油汽车的男性驾驶员的样本有120人.偏好燃油汽车偏好新能源汽车合计男性驾驶员120女性驾驶员合计300(1)请根据已知条件将上述列联表补充完整,并依据小概率值的独立性检验,分析对燃油汽车和新能源汽车的偏好是否与驾驶员性别有关联.如果有关联,解释它们之间如何影响.(2)现从女性驾驶员中按对燃油汽车和新能源汽车的偏好用分层抽样法抽取8人做进一步访谈,然后从这8人中随机抽取3人填写调查问卷,记抽取的3人中偏好新能源汽车的人数为X,求X的分布列及数学期望.参考公式及数据:,.0.10.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1)列联表为

偏好燃油汽车偏好新能源汽车合计男性驾驶员120100220女性驾驶员305080合计150150300有关联,解释见详解,(2)随机变量的分布列为

0123

期望为【分析】(1)根据已知数据可计算得到补全列联表所需的数据,进而补全列联表,并计算得到,由此可得结论;(2)根据分层抽样原则可确定样本中偏好新能源汽车的人数和偏好燃油车的人数,由此可得所有可能的取值,根据超几何分布概率公式可求得每个取值对应的概率,由此可得分布列;由数学期望计算公式可求得期望值.【详解】(1)因为样本中偏好燃油汽车的人数占样本总数的50%,故样本中偏好燃油汽车的人数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论