2026年(新高考)数学(二模)专项练习:统计概率 含答案_第1页
2026年(新高考)数学(二模)专项练习:统计概率 含答案_第2页
2026年(新高考)数学(二模)专项练习:统计概率 含答案_第3页
2026年(新高考)数学(二模)专项练习:统计概率 含答案_第4页
2026年(新高考)数学(二模)专项练习:统计概率 含答案_第5页
已阅读5页,还剩78页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/专题11统计、概率及离散型随机变量期望、方差及其分布题型01随机抽样及频率分布直方图1.(2025·天津南开·二模)某中学三个不同选课组合的学生在一次高三质量监测的数学平均分分别为,若按不同选课组合采用分层抽样的方法抽取了一个120人的样本,抽到三个不同选课组合的学生人数分别为20,40,60,则估计这三个不同选课组合学生的数学平均分为(

).A. B. C. D.2.(2025·黑龙江·二模)某学校为了拓展学生的国际视野,培养学生的创新精神,让学生学有动力,学有信心,举办了英语手抄报比赛.为了解考生的成绩情况,抽取了样本容量为的部分考生成绩,得到如图所示的频率分布直方图,则估计考生成绩的第70百分位数为(

)A.74 B.75 C.76 D.773.(多选)(2025·山东滨州·二模)据网络平台最新数据,截止到2025年4月20日14时10分,电影《哪吒之魔童闹海》总票房(含点映、预售及海外票房)已超149.81亿元,成为首部进入全球票房榜前六.登顶动画票房榜榜首的亚洲电影.一团队从观看该电影的所有观众中随机抽取10000人为样本,统计他们的年龄,并绘制如图所示的频率分布直方图,则(

)A.B.观众年龄的众数估计为35C.观众年龄的平均数估计为30.2D.观众年龄的第70百分位数估计为384.(多选)(2025·安徽淮北·二模)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则(

)A.图中的值为0.005B.这组数据的平均数为73C.这组数据的众数为75D.这组数据的中位数约为71.75.(多选)(2025·安徽合肥·二模)从某校高一和高二年级分别随机抽取100名学生进行知识竞赛,按得分(满分100分)绘制如图所示的频率分布直方图,根据频率分布直方图,并用频率估计概率记高一年级学生得分平均数的估计值为,高二年级学生得分中位数与平均数的估计值分别为,.从高一和高二年级各随机抽取一名学生,记事件“高一年级学生得分不低于60分,高二年级学生得分不低于80分”,事件“高一年级学生得分不低于80分,高二年级学生得分不低于60分”则(

)A. B. C.事件,互斥 D.6.(多选)(2025·广东揭阳·二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是(

)A.基地牡丹植株高度的极差的估计值大于50B.基地牡丹植株高度不高于70的频率估计值为30%C.基地牡丹植株高度的众数与中位数的估计值相等D.基地牡丹植株高度的第75百分位数的估计值小于807.(2025·河北·二模)为了落实健康第一教育理念,实施学生体质强健计划,现对某高中学生每天的运动时间进行调查,随机抽取了100名学生进行调查.下面是根据调查结果绘制的学生每天平均运动时间(单位:分钟)的频率分布直方图,将每天平均运动时间不低于80分钟的学生称为“运动爱好者”.(1)试求频率分布直方图中的值;(2)用样本估计总体,已知某学生每天平均运动时间不低于60分钟,求该学生是“运动爱好者”的概率;(3)从样本里的“运动爱好者”学生中随机选取两位同学,用随机变量表示每天平均运动时间在分钟之间的学生数,求的分布列及期望.8.(2025·内蒙古呼和浩特·二模)烧麦——在呼和浩特有着深厚的历史底蕴,2024年12月21日,呼和浩特举办了“首届烧麦美食大会”,活动持续至2025年1月3日,期间吸引了数以万计的国内外游客慕名而来.“烧麦美食大会”的举办旨在传承和弘扬烧麦文化,深入挖掘呼和浩特市的文旅资源优势,推动烧麦产业创新与发展,促进文商旅融合,提升城市形象.为了了解游客的旅游体验满意度,某研究性学习小组采用问卷调查的方式,随机调查了100名游客,并将收集到的满意度得分数据(满分100分)分成了五段:,,,,得到如图所示的频率分布直方图.(1)求频率分布直方图中的值,为进一步了解游客对本次“烧麦美食大会”满意度情况,从分值在,,三组满意度问卷中,按分层随机抽样的方法抽取6人,再从这6人中随机抽取3人,记满意度得分在人数为,求的分布列和期望;(2)已知满意度分值在的平均数,方差,在的平均数为,方差,试求满意度分值在的平均数和方差.题型02样本的数字特征1.(2025·河北张家口·二模)在某次高三模拟考试后,数学老师随机抽取了6名同学第一个解答题的得分情况如下:7,9,5,8,4,1,则这组数据的平均数和极差分别为(

)A. B. C. D.2.(2025·江苏·二模)诗歌朗诵比赛共有八位评委分别给出某选手的原始评分,评定该选手的成绩时,从8个原始评分中去掉1个最高分和1个最低分,得到6个有效评分,6个有效评分与8个原始评分相比,一定不变的数字特征是(

)A.极差 B.平均数 C.中位数 D.标准差3.(多选)(2025·山东·二模)一组递增数据,,,,的平均数为3,方差为4,极差为6,若,则(

)A.,,,,的极差为12B.,,,,的方差为16C.,,,,的第80百分位数为D.,,,,,,,,,的平均数为54.(多选)(2025·江西·二模)下列说法中,正确的是(

)A.数据,,,,,,,,,的第75百分位数是9B.样本点的经验回归方程为,若样本点与的残差相等,则C.若随机变量,且,则D.,,,和,,,的方差分别为和,若且,则5.(多选)(2025·山西·二模)2025年春节期间,中国电影市场表现亮眼,《哪吒之魔童闹海》等多部优秀影片上映,吸引了大量观众走进影院,某影院对1月29日至2月27日的售票情况进行统计,得到这30天的观影人数如下表:观影人数(单位:千人)不小于3天数261084据表中数据,下列结论一定正确的是(

)A.30天观影人数的中位数不小于2千人B.30天观影人数的平均数大于2千人C.30天观影人数的众数大于1.5千人D.30天观影人数的极差大于1.5千人6.(多选)(2025·山东青岛·二模)给定一组不全相同的样本数据,关于样本数据的说法正确的是(

)A.与原数据相比,极差一定变大B.与原数据相比,众数一定变大C.与原数据相比,平均数一定变大D.与原数据相比,方差一定变大7.(2025·安徽池州·二模)春季是流感的高发季节,某医院对8名甲型流感患者展开临床观察,记录了从开始服药到痊愈所需的天数,具体数据如下(单位:天):7,4,6,5,8,5,6,4.则下列说法正确的是(

)A.这组数据的众数为5B.这组数据的平均数为5C.这组数据的第60百分位数为6D.这组数据的极差为58.(2025·辽宁鞍山·二模)已知互不相等的数据,,,,,,的平均数为,方差为,数据,,,,,的方差为,则(

)A. B.C. D.与的大小关系无法判断9.(多选)(2025·吉林长春·二模)为筹备亚洲冬季运动会短道速滑男子500米预选赛,运动员甲和乙的5次训练成绩(单位:秒)记录如下:甲:乙:对训练成绩的统计,下列结论中正确的有(

)A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差大于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差10.(多选)(2025·河南焦作·二模)有一组样本数据,其中,由这组数据得到的新样本数据为,,,,则(

)A.两组数据的极差一定相等 B.两组数据的平均数一定相等C.两组数据的中位数可能相等 D.两组数据的方差不可能相等11.(2025·湖北黄冈·二模)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数5的是(

)A.平均数为4,中位数为3 B.中位数为4,众数为3C.中位数为4,方差为2 D.平均数为3,方差为312.(2025·山东临沂·二模)若样本数据的均值为10,则样本数据的均值为.题型03一元线性回归模型1.(2025·山东聊城·二模)为了研究某市高中生的脚长(单位:cm)和身高(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的,根据最小二乘法算得脚长和身高的经验回归方程为.已知被调查的某学生的脚长为25cm,身高180cm,则该样本点的残差为(

)A.1cm B.cm C.4cm D.cm2.(2025·河北张家口·二模)商品价格与销量之间往往存在某种关系,以下是某商品价格x(单位:元)与销量y(单位:万件)的调研数据:商品价格x/(元)1015202530销量y/(万件)5446403632则下面四个回归方程中最适宜作为销量y与价格x的回归方程的是(

)(参考数据,,)A. B. C. D.3.(多选)(2025·江苏南京·二模)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表:耕种深度810121416每公顷产量6.07.57.89.29.5经计算可知每公顷产量与耕种深度的线性回归方程为,则下列说法中正确的是(

)A.每公顷产量与耕种深度呈负相关 B.耕种深度的平均数为12C.每公顷产量的平均数为7.8 D.4.(多选)(2025·云南昆明·二模)某同学研究两个变量与的关系,收集了以下5组数据:12345141910根据上表数据,求得相关系数为,经验回归方程为,决定系数为.后经检查发现当时记录的有误,实际值应为,修正数据后,求得新相关系数为,新回归方程为,新决定系数为,则以下结论正确的是(

)参考公式:相关系数,经验回归方程为,其中,,.A. B. C. D.5.(多选)(2025·广东广州·二模)一组成对样本数据的散点位于一条直线附近,它的样本相关系数(其中),由最小二乘法求得经验回归方程(其中),则(

)A.若,则B.若,则成对数据的样本相关系数等于C.若,则成对数据的样本相关系数大于D.若,则成对数据的经验回归方程6.(2025·江西九江·二模)植物的根是吸收水分和矿物养分的主要器官.已知在一定范围内,小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:)与氮元素吸收量(单位:天)的相关数据,如下表所示:9.912.114.818.219.921.825.127.730.432.10.300.340.420.500.550.600.710.740.780.86根据表中数据可得及线性回归方程为,则(

)A.B.变量与的相关系数C.在一定范围内,小麦的根长度每增加,它一天的氮元素吸收量平均增加D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应回归方程不变7.(2025·河北·二模)市某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了市淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人数(万人)与第个月的数据:1234523.137.062.1111.6150.8(1)根据表中数据可用一元线性回归模型刻画变量与变量之间的线性相关关系,且回归方程中的,请计算相关系数(精确到0.01),并判断是否可以认为与的线性相关性很强;(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.喜欢不喜欢总计男100女60总计110参考公式:(1)相关系数.若,则认为与有较强的线性相关性.回归方程中斜率的最小二乘法估计公式为;(2),其中.临界值表:0.0100.0050.0016.6357.87910.828参考数据:,,,,.8.(2025·云南曲靖·二模)自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,宇树科技这家专注于四足机器人研发的中国科技公司在全球范围内倍受瞩目,旗下一款机器人UnitreeAliengo在巡检与监控、安防与救援、科研与影视等方面应用广泛.现统计出机器人UnitreeAliengo在某地区2024年1月至5月的销售量如下表所示:月份x12345销售量y/台2637506493(1)经计算样本的相关系数,故变量x,y线性相关性很强,求y关于x的经验回归方程;(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”对数的分布列和数学期望.附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.题型04列联表与独立性检验1.(2025·河南·二模)某校开设校本课程“剪纸”,为了解学生参加该课程与性别是否有关,用简单随机抽样的方法分别从男生和女生中各抽取了50名学生进行调查,得到如下列联表:性别课程合计参加“剪纸”课程不参加“剪纸”课程男生10女生3050合计(1)补全列联表,并依据小概率值的独立性检验,分析参加“剪纸”课程是否与性别有关联;(2)以样本估计总体,且以频率估计概率,若从该校女生中随机抽取3人,记其中参加“剪纸”课程的人数为,求的期望.附:,其中.0.0500.0250.0103.8415.0246.6352.(2025·山东临沂·二模)体育是培养学生高尚人格的重要途径之一.足球作为一项团队运动项目,深受学生喜爱,为了解学生喜爱足球运动是否与性别有关,随机抽取了100名学生作为样本,统计得到如下的列联表:喜爱足球运动不喜爱足球运动合计男生40女生25合计100已知从这100名学生样本中随机抽取1个,抽到喜爱足球运动的学生的概率为.(1)求;(2)根据小概率值的独立性检验,判断学生喜爱足球运动是否与性别有关?(3)用样本分布的频率估计总体分布的概率,现在从喜爱足球运动的学生中随机抽取30名,记其中男生的人数为,求使事件“”概率最大的的值.附:,3.(2025·江西·二模)为试验某种元素在土地中的含量对某一品种的水果品质的影响,富农果业种植合作社进行种植试验,选择了元素含有量有明显差异的甲乙两块试验地,其中甲地元素含有量较为丰富,乙地元素含有量较为贫瘠.种植结束后对收获的水果进行评级,只有优等果与合格果两种品级.一共收获该品种水果数量为500,其中甲地总数量为200,甲地优等品数量为80,乙地优等品数量为20.(1)试判断:是否有的把握认为该品种水果的品级与土地中元素的含量有关?(2)已知该品种水果并不是所有的果实都可以作为种果(指可以育种的果实).种果中优等品占比为,在非种果中,优等品与合格品之比为.将种果占总数量的占比频率视为概率,已知种果的利润为200元/个,非种果的利润为30元/个.现从中随机的抽取5个水果,表示这5个水果的总利润,求的分布列和数学期望.附.0.1500.1000.0500.0102.0722.7063.8416.6354.(2025·江苏·二模)某种产品可以采用甲、乙两种工艺来生产,为了研究产品的质量与所采用的生产工艺的关联性,现对该种产品进行随机抽查,得到的结果如下表所示.工艺甲工艺乙合计合格6040100不合格203050合计8070150(1)依据小概率值的独立性检验,分析产品的质量是否与采用的工艺有关;(2)在不合格的50件样本产品中任选3件,求在这3件样本产品中至少有1件是采用工艺甲生产的条件下,这3件样本产品中恰有一件是采用工艺乙生产的概率.附:0.10.050.010.0050.0012.7063.8416.6357.87910.8285.(2025·广西河池·二模)2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭携老扶幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:是否成年人是否喜欢合计不喜欢喜欢未成年人80100成年人2080合计180(1)求的值;(2)依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?(3)用频率估计概率,现随机采访一名成年人和一名未成年人,设表示这两人中非常喜欢电影《哪吒之魔童闹海》的人数,求的分布列和数学期望.参考公式:0.10.050.012.7063.8416.6356.(2025·黑龙江哈尔滨·二模)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解30~40岁人群的体质健康是否与性别有关,在3月感冒易发季节对某社区中该年龄段的60位居民进行了检测,将检测结果制成如下2×2列联表:性别健康状况合计不感冒感冒男121830女62430合计184260(1)在上述不感冒的人群中,按照性别采用分层抽样的方法抽取9人,再从这9人中随机选取4人访谈,记参与访谈的男性人数为,求的分布列和期望;(2)依据小概率值的独立性检验,能否据此推断30~40岁人群的体质健康与性别有关?若把表中所有数据扩大到原来的10倍,在相同的检验标准下,再用独立性检验判断体质健康与性别的关联性,结论还一样吗?请解释原因.附录:,其中.0.10.050.0250.010.0012.7063.8415.0246.63510.8287.(2025·山东·二模)近年来,全球数字化进程持续加速,人工智能(Artificial

Intelligence,简称AI)已然成为科技变革的核心驱动力.有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,用比例分配的分层随机抽样方法在全体学生中抽取100人,设事件“学生报名参加答题活动”,“学生为男生”,据统计,,.(1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关联?性别男生女生合计未报名参加答题活动报名参加答题活动合计100(2)网络答题规则:答题活动不限时间,不限轮次,答多少轮由选手自行确定;每轮均设置道题,选手参与该轮答题,则至少答一道题,一旦答对一题,则其本轮答题结束,答错则继续答题,直到第道题答完,本轮答题结束.已知甲同学报名参加答题活动,假设甲每道题回答是否正确相互独立,且每次答对的概率均为.①求甲在一轮答题过程中答题数量的数学期望;②假设甲同学每轮答题答对前两题中的一道,本轮答题得2分,否则得1分.记甲答题累计得分为的概率为,求的最大值.参考公式与数据:,其中.0.100.050.010.0050.0012.7063.8416.6357.87910.828题型05古典概型1.(2025·河南·二模)若把满足的正整数组称为“勾股平方数组”,则在不大于13的正整数中随机选取3个不同的数,能组成“勾股平方数组”的概率为(

)A. B. C. D.2.(2025·陕西咸阳·二模)2025年有双春年之寓意,双春年是指在一个农历年中出现两个立春节气的现象.这是由于农历和阳历之间的差异造成的,为了使农历与季节变化相适应,农历中会设置闰月,2025年有闰六月,从而导致一年中出现两个立春.在传统文化中,双春年通常被认为是非常吉利的年份,双字寓意着好事成双,在这一年做任何事都会有好兆头.那么,用2025,66,2,0,2,5组成不同的10位数的个数为(

)A.294 B.297 C.298 D.3002.(2025·河南焦作·二模)为了抒写乡村发展故事、展望乡村振兴图景、演绎民众身边日常、唱出百姓幸福心声,某地组织了年“美丽乡村”节目汇演,共有舞蹈、歌曲、戏曲、小品、器乐、非遗展演六个节目,则歌曲和戏曲节目相邻,且歌曲和戏曲都在器乐节目前面演出的概率为(

)A. B. C. D.4.(2025·湖北黄冈·二模)5件产品中有2件次品,现逐一检查,直至能确定所有次品为止,则第四次检测结束的概率为()A. B. C. D.5.(2025·河南信阳·二模)现安排甲、乙、丙、丁、戊位志愿者到三个社区做志愿服务工作,每个社区至少安排人,每位志愿者只到一个社区,其中甲、乙安排在同一个社区的概率为(

)A. B. C. D.6.(2025·山东临沂·二模)已知正整数,欧拉函数表示、、、中与互质的整数的个数,例如,,,且、互质时,.若从、、、中随机取一个数,则满足的概率为.7.(2025·四川南充·二模)斐波那契数列,又称黄金分割数列,指的是这样一个数列:在数学上,斐波那契数列以如下递推的方式定已知且Ø,则中所有元素之和为奇数的概率为.8.(2025·广东深圳·二模)将五张标有、、、、的卡片摆成右图,若逐一取走这些卡片时,每次取走的一张卡片与剩下的卡片中至多一张有公共边,则把这样的取卡顺序称为“和谐序”(例如按取走卡片的顺序是“和谐序”,按取走卡片的顺序不是“和谐序”),现依次不放回地随机抽取这张卡片,则取卡顺序是“和谐序”的概率为.9.(2025·山东·二模)已知项数为的数列满足,若数列中存在连续三项,使得成立,则称数列为“友好数列”.当时,“友好数列”的个数为;当时,随机选取一个数列,该数列是“友好数列”的概率为题型06条件概率及全概率公式1.(2025·河南·二模)张某经营、两家公司,张某随机到公司指导与管理,已知他第1个月去公司的概率是.如果本月去公司,那么下个月继续去公司的概率为;如果本月去公司,那么下个月去公司的概率为,如此往复.设张某第个月去公司的概率为,则(

)A. B.C. D.2.(2025·湖南邵阳·二模)有甲、乙、丙3台车床加工同一型号的零件,加工的次品率分别为、、,加工出来的零件混放在一起.已知甲、乙、丙台车床加工的零件数分别占总数的、、.任取一个零件,如果取到的零件是次品,则它是甲车床加工的概率为(

)A. B. C. D.3.(2025·广西河池·二模)一家银行有VIP客户和普通客户,VIP客户占客户总数的,普通客户占客户总数的.已知VIP客户的信用卡欺诈概率为,而普通客户的信用卡欺诈概率为.现在随机抽取一个发生信用卡欺诈的客户,请问这个客户是VIP客户的概率是(

)A. B. C. D.4.(多选)(2025·贵州毕节·二模)甲,乙两个盒子中装有除颜色外完全相同的球,其中甲盒子中有3个红球,4个白球,乙盒子中有2个红球,3个白球.先从甲盒子中随机取出一球放入乙盒子,再从乙盒子中随机取出一球.事件“从甲盒子中取出的球是红球”,事件“从甲盒子中取出的球是白球”,事件“从乙盒子中取出的球是红球”.则(

)A. B.C. D.5.(2025·安徽淮北·二模)甲箱中有3个红球和2个白球,乙箱中有2个红球和3个白球,先从甲箱中随机取出一球放入乙箱,再从乙箱中随机取出两球,则取出的两球颜色相同的概率为(

)A. B. C. D.6.(2025·天津河北·二模)甲、乙两位同学进行乒乓球比赛,采用3局2胜制.假设每局比赛中甲获胜的概率为,乙获胜的概率为,且各局比赛的结果相互独立,则甲以的比分获胜的概率为;在甲获胜的条件下,甲第一局获胜的概率是.7.(2025·江西·二模)2025年春晚,刘谦表演了一个现场互动魔术,道具只有三个:勺子、筷子和杯子.刘谦让观众从左到右随便摆放这三个道具,分为三个位置:左位、中位和右位.按照魔术规则进行前两步:第一步,筷子跟它左边的东西互换位置,如果筷子已经在最左边,那么就不需要移动;第二步,杯子跟它右边的东西互换位置,如果杯子已经在最右边,就不需要移动.完成这两步后,在杯子出现在右位的条件下,勺子出现在中位的概率是.8.(2025·天津南开·二模)甲、乙两个袋子中各有10个除颜色外完全相同的小球,其中甲袋中有7个红球,3个黄球,乙袋中有8个红球,2个黄球.若从两个袋子中各任取1个球,则都取到红球的概率为;若从两个袋子中各任取1个球,两球颜色不同的条件下,乙袋中取出黄球的概率为.9.(2025·安徽合肥·二模)如图,在的方格中放入棋子,每个格子内至多放一枚棋子,若每行都放置两枚棋子,则恰好每列都有两枚棋子的概率为.10.(2025·山东·二模)甲乙二人进行比赛,已知在每局比赛中,甲获胜的概率为,乙获胜的概率为,各局比赛的结果相互独立.为决出最终获胜的一方,有以下两种方案可供选择:方案一:规定每局比赛的胜方得1分,败方得0分,则首次比对手高两分的一方获胜.方案二:首次连胜两局比赛的一方获胜.(1)若,且采用方案一,求第四场比赛结束时恰好分出胜负的概率.(2)若,为使甲获胜的概率更大,则应该选择哪种比赛方案?请说明理由.附:当0<q<1时,.11.(2025·河北张家口·二模)乒乓球比赛规则规定:在双方打成10平后,领先两分者获胜.在某校组织的乒乓球比赛中,甲、乙两名同学已经打成了10平.已知下一球乙同学得分的概率为,且对以后的每一球,若乙同学在本球中得分,则他在下一球的得分概率为,若乙同学在本球中未得分,则他在下一球的得分概率为.(1)求在继续打了两个球后比赛结束的条件下,乙同学获胜的概率;(2)求乙同学最终获胜的概率.题型07离散型随机变量期望、方差及其分布列1.(2025·山东临沂·二模)已知随机变量,为使在内的概率不小于(若,则),则的最小值为(

)A.8 B.16 C.32 D.642.(2025·江苏·二模)已知随机变量,相互独立,且,,则;若,则.3.(2025·广西河池·二模)泊松分布是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩•德尼•泊松在1838年时发表.它适合于描述单位时间内随机事件发生的次数的概率分布.已知某校学生每周体育锻炼的次数服从非零参数的泊松分布,其概率满足,且,则(参考数据:)4.(2025·云南曲靖·二模)如图,一个质点在外力的作用下,从原点0出发,每隔1s向左或向右移动一个单位,且向右移动的概率为.若该质点共移动100次,则它位于数字处的可能性最大.5.(2025·山东滨州·二模)某学校组织“一带一路”有奖知识竞赛,有两个问题,已知甲同学答对问题的概率为0.6,回答正确得奖金10元,回答错误得奖金0元;答对问题的概率为0.5,回答正确得奖金元,回答错误得奖金0元.甲同学回答两个问题正确与否相互独立.(1)若甲同学对两个问题都作答,求他仅答对其中一个问题的概率;(2)若规定只有在答对第一个问题的情况下,才能回答下一个问题,若甲先回答问题和先回答问题所获得的奖金总额的期望相同,求的值.6.(2025·山西·二模)甲、乙两人进行掷骰子游戏,每轮两人各掷骰子一次,一次掷三粒.得分规则如下;若向上三个点数相同,得6分;若向上三个点数按某种顺序可构成等差数列(公差不为0),得4分;若恰有两粒点数相同,得2分;其余情况得0分.若第一次两人得分相同,则进行第二轮,直至出现两人得分不同,得分多者获胜,游戏结束.(1)记甲第一轮得分为X,求X的概率分布列及数学期望;(2)求两人共投n轮骰子的概率.7.(2025·黑龙江·二模)有一摸球游戏如下:盒子中有红、黄、绿三种颜色的球各3个,球除颜色外其他均相同,两人摸球,规定每人一次从盒中摸3个球,第二人从第一人摸球后剩余的6个球中再摸3个球.记每个人摸到的3个球中颜色相同的球的最大数量为其得分,规定得分高者获胜.现有甲、乙二人参与此摸球游戏,记甲、乙的得分分别为.(1)若甲先摸球,求的分布列及其数学期望;(2)在甲先摸球的情况下,分别计算甲获胜的概率和乙获胜的概率,并判断参赛者获胜的概率是否受摸球先后顺序的影响.8.(2025·湖北黄冈·二模)一个袋子中有4个红球,个绿球,已知取出的2个球都是红球的概率为.(1)求的值:(2)从中依次随机地摸出4个球作为样本,设采用有放回摸球和不放回摸球得到的样本中绿球的个数分别为.(i)求的数学期望和方差;(ii)分别就有放回摸球和不放回摸球,用样本中绿球的比例估计总体中绿球的比例,求误差的绝对值不超过0.2的概率,并比较所求两概率的大小,说明其实际含义.9.(2025·山东聊城·二模)周末双休,四个同学约好一起参加体验活动,有甲、乙两个体验项目可供选择,每人必须参加且只能参加一个项目.四人约定每人通过掷一次质地均匀的骰子来决定自己参加哪个体验项目,若掷出点数小于3,就体验甲项目,否则体验乙项目.(1)求这4个人中恰有2人参加甲项目的概率;(2)用X,Y分别表示这4个人中参加甲、乙项目的人数,记,求随机变量的分布列及期望.10.(2025·云南昆明·二模)在“2025年全球AI创新峰会”中,参与“环境监测问题解决方案”代码编写比赛组的科技团队A和B通过实时编写代码,争夺“最佳环测算法团队”称号.规定每轮比赛限时编写一个算法模块,评委会通过对算法模块测试,评定优胜方,优胜方记1分,另一方记0分,无平局;当两团队累积得分的分差为3分时,比赛结束,累积得分高的团队获“最佳环测算法团队”称号.若每轮比赛中,A团队获优胜的概率为,且每轮比赛结果相互独立.(1)当比赛结束时恰好进行了5轮,且A团队获“最佳环测算法团队”称号的概率;(2)(i)若比赛最多进行6轮,求比赛结束时轮数的分布列及数学期望;(ii)若比赛轮数不限制,求A团队获“最佳环测算法团队”称号的概率.11.(2025·广东揭阳·二模)一个质点在数轴上从原点开始运动,每次运动的结果可能是原地不动,也可能是向左或向右运动一个单位.记质点原地不动的概率为,向右运动的概率为,向左运动的概率为,其中,.(1)若,,求质点运动3次后停在原点右侧的概率;(2)若.①规定质点只要运动到原点左侧就立即停止运动,求质点运动5次后停在原点右侧的概率;②设计游戏规则如下:第一轮游戏,质点从原点开始运动,设置质点向右运动的概率,若质点运动3次后停在原点右侧,则进入第二轮游戏,否则游戏结束;第二轮游戏,质点重新从原点开始运动,重新设置质点向右运动的概率,运动3次后,若质点停在原点右侧,则以质点停留位置对应数轴上的数值作为两轮游戏的最终得分,若质点停在原点左侧或原点处,则两轮游戏的最终得分为0分(规定游戏一轮结束的得分也是0分).记两轮游戏最终得分的期望,若存在极大值点,求的取值范围.答案解析题型01随机抽样及频率分布直方图1.(2025·天津南开·二模)某中学三个不同选课组合的学生在一次高三质量监测的数学平均分分别为,若按不同选课组合采用分层抽样的方法抽取了一个120人的样本,抽到三个不同选课组合的学生人数分别为20,40,60,则估计这三个不同选课组合学生的数学平均分为(

).A. B. C. D.【正确答案】C【分析】先求出三个不同选课组合的学生的人数的比列,总体平均分需用各组合的平均分乘以对应比列后相加即可.【详解】因为三个不同选课组合的学生人数分别为20,40,60,所以三个不同选课组合的学生的人数的比列分别为:,所以估计这三个不同选课组合学生的数学平均分为.故选:C.2.(2025·黑龙江·二模)某学校为了拓展学生的国际视野,培养学生的创新精神,让学生学有动力,学有信心,举办了英语手抄报比赛.为了解考生的成绩情况,抽取了样本容量为的部分考生成绩,得到如图所示的频率分布直方图,则估计考生成绩的第70百分位数为(

)A.74 B.75 C.76 D.77【正确答案】C【分析】结合百分位数的计算公式,代入计算,即可得到结果.【详解】由频率分布直方图可知,考生成绩的第70百分位数为.故选:C.3.(多选)(2025·山东滨州·二模)据网络平台最新数据,截止到2025年4月20日14时10分,电影《哪吒之魔童闹海》总票房(含点映、预售及海外票房)已超149.81亿元,成为首部进入全球票房榜前六.登顶动画票房榜榜首的亚洲电影.一团队从观看该电影的所有观众中随机抽取10000人为样本,统计他们的年龄,并绘制如图所示的频率分布直方图,则(

)A.B.观众年龄的众数估计为35C.观众年龄的平均数估计为30.2D.观众年龄的第70百分位数估计为38【正确答案】BD【分析】根据频率之和为1求判断A;根据众数定义判断B,根据频率直方图求平均值判断C,根据百分位数的求法判断D.【详解】由题意知,解得,故A错误;观众年龄的众数估计是,故B正确;估计这10000名观众年龄的平均数为,故C错误;前3组的频率之和为,前4组的频率之和为,故第70百分位数位于第4组,设其为,则,解得,即第70百分位数为38,故D正确.故选:BD4.(多选)(2025·安徽淮北·二模)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则(

)A.图中的值为0.005B.这组数据的平均数为73C.这组数据的众数为75D.这组数据的中位数约为71.7【正确答案】ABD【分析】根据频率分布直方图中各小矩形得面积之和为1,可求出的值,再结合平均数、众数、中位数的定义判断BCD.【详解】对于A,由频率分布图可知:,解得,故A正确;对于B,由频率分布图可知:,故B正确;对于C,由频率分布图可知众数为65,故C错误;对于D,设这组数据的中位数约为,因为,,所以中位数在区间内,则,解得,故D正确;故选:ABD.5.(多选)(2025·安徽合肥·二模)从某校高一和高二年级分别随机抽取100名学生进行知识竞赛,按得分(满分100分)绘制如图所示的频率分布直方图,根据频率分布直方图,并用频率估计概率记高一年级学生得分平均数的估计值为,高二年级学生得分中位数与平均数的估计值分别为,.从高一和高二年级各随机抽取一名学生,记事件“高一年级学生得分不低于60分,高二年级学生得分不低于80分”,事件“高一年级学生得分不低于80分,高二年级学生得分不低于60分”则(

)A. B. C.事件,互斥 D.【正确答案】AB【分析】由频率分布直方图求出对应的值,即可判断AB选项;由互斥事件的定义求来判断C选项;求出来判断D选项.【详解】,,∵,∴,∴,A选项正确;,B选项正确;∵“高一年级学生得分不低于80分,高二年级学生得分不低于80分”,C选项错误;由评率估计概率得:,,D选项错误.故选:AB6.(多选)(2025·广东揭阳·二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是(

)A.基地牡丹植株高度的极差的估计值大于50B.基地牡丹植株高度不高于70的频率估计值为30%C.基地牡丹植株高度的众数与中位数的估计值相等D.基地牡丹植株高度的第75百分位数的估计值小于80【正确答案】BC【分析】根据频率分布直方图中的数据可得出极差,判断A项;计算各小组频率可判断B项;分析可知中位数位于,列方程计算即可得出中位数,根据频率分布直方图可直接估算众数;根据各小组的概率可知基地牡丹植株高度的第75百分位数的估计值应在内.【详解】对于A项,由图象可知,基地牡丹植株高度范围在之间,所以极差的估计值应不大于50,故A错误;对于B项,基地牡丹植株高度不高于70的频率为.故B正确;对于C项,由频率分布直方图可知,基地牡丹植株高度不高于70的频率为,不高于的频率为,所以中位数位于,设为,则应有,计算可得.众数估计为的中点,也是,与中位数相同.故C正确;对于D项,基地牡丹植株高度不高于的频率为,不高于的频率为,所以,基地牡丹植株高度的第75百分位数的估计值应在内.故D错误.故选:BC.7.(2025·河北·二模)为了落实健康第一教育理念,实施学生体质强健计划,现对某高中学生每天的运动时间进行调查,随机抽取了100名学生进行调查.下面是根据调查结果绘制的学生每天平均运动时间(单位:分钟)的频率分布直方图,将每天平均运动时间不低于80分钟的学生称为“运动爱好者”.(1)试求频率分布直方图中的值;(2)用样本估计总体,已知某学生每天平均运动时间不低于60分钟,求该学生是“运动爱好者”的概率;(3)从样本里的“运动爱好者”学生中随机选取两位同学,用随机变量表示每天平均运动时间在分钟之间的学生数,求的分布列及期望.【正确答案】(1);(2);(3)分布列见解析,数学期望为.【分析】(1)应用频率分布直方图频率和为1计算求参;(2)应用条件概率公式计算求解;(3)先写出对应概率,再得出随机变量的分布列,进而计算数学期望即可.【详解】(1)由频率分布直方图可知,,解得.(2)设“该学生每天平均运动时间不低于60分钟”为事件A,“该学生是‘运动爱好者’”为事件B,则,,所以在该学生每天平均运动时间不低于60分钟的条件下是“运动爱好者”的概率为.(3)由题意可知,样本中共有“运动爱好者”学生25人,运动时间在分钟之间的学生有5人,所以.,,.则的分布列为012则.8.(2025·内蒙古呼和浩特·二模)烧麦——在呼和浩特有着深厚的历史底蕴,2024年12月21日,呼和浩特举办了“首届烧麦美食大会”,活动持续至2025年1月3日,期间吸引了数以万计的国内外游客慕名而来.“烧麦美食大会”的举办旨在传承和弘扬烧麦文化,深入挖掘呼和浩特市的文旅资源优势,推动烧麦产业创新与发展,促进文商旅融合,提升城市形象.为了了解游客的旅游体验满意度,某研究性学习小组采用问卷调查的方式,随机调查了100名游客,并将收集到的满意度得分数据(满分100分)分成了五段:,,,,得到如图所示的频率分布直方图.(1)求频率分布直方图中的值,为进一步了解游客对本次“烧麦美食大会”满意度情况,从分值在,,三组满意度问卷中,按分层随机抽样的方法抽取6人,再从这6人中随机抽取3人,记满意度得分在人数为,求的分布列和期望;(2)已知满意度分值在的平均数,方差,在的平均数为,方差,试求满意度分值在的平均数和方差.【正确答案】(1)分布列见解析,;(2)84,30【分析】(1)根据分层抽样比确定得分在人数为的所有可能取值为0,1,2,3,分别求得对应概率即可求得分布列和期望值;(2)利用样本方差求总体方差公式代入计算即可求得结果.【详解】(1)由,解得;由题可知,调查问卷考核得分分值在三组内的游客人数比为,则需在内的游客中分别抽取人,人,人.现从这6人中随机抽取3人,则考核得分在人数为的所有可能取值为0,1,2,3.,,,.所以的分布列为0123所以.(2)满意度分值在的频率为,人数为20;在的颣率为,人数为30,满意度分值在的平均数,方差,在的平均数,方差,所以满意度分值在的平均数,满意度分值在的方差.题型02样本的数字特征1.(2025·河北张家口·二模)在某次高三模拟考试后,数学老师随机抽取了6名同学第一个解答题的得分情况如下:7,9,5,8,4,1,则这组数据的平均数和极差分别为(

)A. B. C. D.【正确答案】A【分析】根据平均数,极差的定义求解.【详解】根据题意,这组数据的平均数,极差为.故选:A.2.(2025·江苏·二模)诗歌朗诵比赛共有八位评委分别给出某选手的原始评分,评定该选手的成绩时,从8个原始评分中去掉1个最高分和1个最低分,得到6个有效评分,6个有效评分与8个原始评分相比,一定不变的数字特征是(

)A.极差 B.平均数 C.中位数 D.标准差【正确答案】C【分析】由极差、中位数、平均数和标准差的概念判断即可.【详解】根据题意,将8个数据从小到大排列,从8个原始评分中去掉1个最高分、1个最低分,得到6个有效评分,6个有效评分与8个原始评分相比,最中间的两个分数不变,而最高分、最低分、平均分、标准差都有可能发生变化,因此一定不变的数字特征是中位数.故选:C.3.(多选)(2025·山东·二模)一组递增数据,,,,的平均数为3,方差为4,极差为6,若,则(

)A.,,,,的极差为12B.,,,,的方差为16C.,,,,的第80百分位数为D.,,,,,,,,,的平均数为5【正确答案】ABD【分析】利用极差的定义判断选项A;利用方差的性质判断选项B;利用百分位数的定义判断选项C;利用平均数的定义和计算公式判断选项D.【详解】对于选项A:因为数据的极差为6,所以.根据可知:,.所以,所以A正确.对于选项B:因为数据的方差为4,,所以根据方差的性质可知:数据的方差为.所以B正确.对于选项C:因为,为整数,则第80百分位数是第4项与第5项数据的平均值,即,所以C错误.对于选项D:因为数据的平均数为3,,所以数据的平均数为.所以数据,的平均数为.所以D正确.故选.4.(多选)(2025·江西·二模)下列说法中,正确的是(

)A.数据,,,,,,,,,的第75百分位数是9B.样本点的经验回归方程为,若样本点与的残差相等,则C.若随机变量,且,则D.,,,和,,,的方差分别为和,若且,则【正确答案】AB【分析】利用百分位数计算判断A,根据残差计算判断B,利用正态分布判断C,根据方差计算判断D.【详解】A:1,1,2,2,3,3,3,9,11,12共10个数则,所以第75百分位数是9,A正确.B:样本点的残差为,的残差为,由残差相等得,B正确.C:由知对称轴为1,根据得,所以,故C错误.D:由,且,,,则,故D错误.故选:AB5.(多选)(2025·山西·二模)2025年春节期间,中国电影市场表现亮眼,《哪吒之魔童闹海》等多部优秀影片上映,吸引了大量观众走进影院,某影院对1月29日至2月27日的售票情况进行统计,得到这30天的观影人数如下表:观影人数(单位:千人)不小于3天数261084据表中数据,下列结论一定正确的是(

)A.30天观影人数的中位数不小于2千人B.30天观影人数的平均数大于2千人C.30天观影人数的众数大于1.5千人D.30天观影人数的极差大于1.5千人【正确答案】ABD【分析】由中位数、平均数、众数、极差的定义即可判断.【详解】由可知,中位数位于内,故A正确;因,则平均数一定大于2千人,故B正确;由于每天的观影人数的具体值不清楚,故30天观影人数的众数可能大于1.5千人,也可能小于1.5千人,故C错误;因,所以由表格30天观影人数的极差大于1.5千人,故D正确.故选:ABD6.(多选)(2025·山东青岛·二模)给定一组不全相同的样本数据,关于样本数据的说法正确的是(

)A.与原数据相比,极差一定变大B.与原数据相比,众数一定变大C.与原数据相比,平均数一定变大D.与原数据相比,方差一定变大【正确答案】AD【分析】对于A,根据极差的定义分析判断,对于B,根据众数的定义举例判断,对于C,根据平均数的定义举例判断,对于D,根据方差的定义分析判断.【详解】对于A,若样本数据中的最小的数为,最大的数为,则极差为,则样本数据的极差为,因为,所以,所以A正确,对于B,若的众数为,则的众数为,若,则,所以B错误,对于C,若的平均数为,则的平均数为,若,则,所以C错误,对于D,若的方差为,而,则的方差为,所以D正确.故选:AD7.(2025·安徽池州·二模)春季是流感的高发季节,某医院对8名甲型流感患者展开临床观察,记录了从开始服药到痊愈所需的天数,具体数据如下(单位:天):7,4,6,5,8,5,6,4.则下列说法正确的是(

)A.这组数据的众数为5B.这组数据的平均数为5C.这组数据的第60百分位数为6D.这组数据的极差为5【正确答案】C【分析】根据众数,平均数,百分位数,极差的定义逐一判断即可.【详解】对于A,这组数据的众数为,故A错误;对于B,这组数据的平均数为,故B错误;对于C,将这组数据按从小到大的顺序排列为,因为,所以这组数据的第60百分位数为6,故C正确;对于D,这组数据的极差为,故D错误.故选:C.8.(2025·辽宁鞍山·二模)已知互不相等的数据,,,,,,的平均数为,方差为,数据,,,,,的方差为,则(

)A. B.C. D.与的大小关系无法判断【正确答案】C【分析】根据所给数据分别计算、比较大小即可求解.【详解】根据已知条件第一组数据的个数为个,且,所以,,第二组数据的个数为个,且平均数,,因为,所以.故选:C9.(多选)(2025·吉林长春·二模)为筹备亚洲冬季运动会短道速滑男子500米预选赛,运动员甲和乙的5次训练成绩(单位:秒)记录如下:甲:乙:对训练成绩的统计,下列结论中正确的有(

)A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差大于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差【正确答案】ABD【分析】结合甲乙的成绩,逐一判断每一个选项即可.【详解】对于A,甲成绩的平均数为,乙成绩的平均数为,故甲的成绩的平均数小于乙的成绩的平均数,故A正确;对于B,甲成绩的中位数为,乙成绩的中位数为,故B正确;对于C,甲成绩比乙成绩更加集中,故甲成绩的方差小于乙成绩的方差,故C错误;对于D,甲成绩的极差为,乙成绩的极差为,故D正确.故选:ABD.10.(多选)(2025·河南焦作·二模)有一组样本数据,其中,由这组数据得到的新样本数据为,,,,则(

)A.两组数据的极差一定相等 B.两组数据的平均数一定相等C.两组数据的中位数可能相等 D.两组数据的方差不可能相等【正确答案】BC【分析】举反例,如数据为判断A、C;如数据为判断D,根据平均数的定义判断B.【详解】A.假设原样本数据为,则新样本数据为,两组数据的极差不相等,错误;B.因为,所以两组数据的平均数一定相等,正确;C.由A中的数据可知两组数据的中位数可能相等,正确;D.假设原样本数据为,则新样本数据为,这两组数据一样,故方差可能相等,错误.故选:BC.11.(2025·湖北黄冈·二模)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数5的是(

)A.平均数为4,中位数为3 B.中位数为4,众数为3C.中位数为4,方差为2 D.平均数为3,方差为3【正确答案】D【分析】根据平均数、中位数、众数、方差的定义和性质,逐一分析每个选项,判断是否一定没有出现点数.【详解】对应选项,平均数为,中位数为.设这次掷骰子的点数从小到大排列为.根据平均数的计算公式,可得.当,,,时满足条件,所以有可能出现点数,A选项错误.对应B选项,中位数为,众数为.设这次掷骰子的点数从小到大排列为.因为众数为,所以至少出现次,若,,时满足条件,所以有可能出现点数,B选项错误.对于C选项,中位数为,方差为.设这次掷骰子的点数从小到大排列为.若,,,时,平均数.方差,满足条件,所以有可能出现点数,C选项错误.对于D选项,平均数为,方差为.设这次掷骰子的点数分别为.根据平均数公式可得,即.根据方差公式,则.若假设出现点数,不妨设,则.则.则.展开变形,得到,即,解得,因为,所以中不能有.由,不妨令,则所有可能取值为:,因为;;;;;;综上,不存在,使得且.故假设错误,不会出现点数.D选项正确.故选:D.12.(2025·山东临沂·二模)若样本数据的均值为10,则样本数据的均值为.【正确答案】19【分析】由均值的性质即可求解.【详解】若样本数据的均值为10,则样本数据的均值为.故19.题型03一元线性回归模型1.(2025·山东聊城·二模)为了研究某市高中生的脚长(单位:cm)和身高(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的,根据最小二乘法算得脚长和身高的经验回归方程为.已知被调查的某学生的脚长为25cm,身高180cm,则该样本点的残差为(

)A.1cm B.cm C.4cm D.cm【正确答案】D【分析】根据回归方程必过点求出,即可得到回归方程,再根据残差的定义计算可得.【详解】因为,又经验回归方程必过点,所以,解得,所以,当时,所以该样本点的残差为.故选:D2.(2025·河北张家口·二模)商品价格与销量之间往往存在某种关系,以下是某商品价格x(单位:元)与销量y(单位:万件)的调研数据:商品价格x/(元)1015202530销量y/(万件)5446403632则下面四个回归方程中最适宜作为销量y与价格x的回归方程的是(

)(参考数据,,)A. B. C. D.【正确答案】C【分析】分别取代入相应方程计算的估计值与实际值比较,得出答案.【详解】对于A,分别代入,可得,与实际值相差较大,不合题意,故A错误;对于B,分别代入,可得,第五组数据与实际值相差较大,不合题意,故B错误;对于C,分别代入,求得的估计值与实际值完全相同,应采用,故C正确;对于D,分别代入,可得,,得,数据与实际值相差较大,不合题意,故D错误.故选:C.3.(多选)(2025·江苏南京·二模)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表:耕种深度810121416每公顷产量6.07.57.89.29.5经计算可知每公顷产量与耕种深度的线性回归方程为,则下列说法中正确的是(

)A.每公顷产量与耕种深度呈负相关 B.耕种深度的平均数为12C.每公顷产量的平均数为7.8 D.【正确答案】BD【分析】根据线性回归方程的概念即可判断A;求出即可判断BC;将点代入方程求出即可判断D.【详解】A:对于,,所以每公顷产量与耕种深度呈正相关,故A错误;B:由题意知,,故B正确;C:由题意知,,故C错误;D:将点代入方程,得,解得,故D正确.故选:BD4.(多选)(2025·云南昆明·二模)某同学研究两个变量与的关系,收集了以下5组数据:12345141910根据上表数据,求得相关系数为,经验回归方程为,决定系数为.后经检查发现当时记录的有误,实际值应为,修正数据后,求得新相关系数为,新回归方程为,新决定系数为,则以下结论正确的是(

)参考公式:相关系数,经验回归方程为,其中,,.A. B. C. D.【正确答案】ABD【分析】根据给定条件,求出数据修正前后的相关量,再比较大小即得.【详解】数据修正前:,,,,,,数据修正后:,,,,,,因此,,,而,则,ABD正确,C错误.故选:ABD5.(多选)(2025·广东广州·二模)一组成对样本数据的散点位于一条直线附近,它的样本相关系数(其中),由最小二乘法求得经验回归方程(其中),则(

)A.若,则B.若,则成对数据的样本相关系数等于C.若,则成对数据的样本相关系数大于D.若,则成对数据的经验回归方程【正确答案】ABD【分析】根据相关系数的意义判断ABC,利用线性回归方程的求法判断D.【详解】当时,变量正相关,所以,故A正确;因为,所以成对数据对应点相当于把成对数据对应的点向下平移2个单位,不改变变量的相关性,故B正确;因为,则成对数据对应点相当于把成对数据对应的点横坐标不变,纵坐标变为原来的2倍,故变量间的相关性不变,故C错误;当,由可知,新的回归直线方程中斜率变为,,则成对数据的经验回归方程,故D正确.故选:ABD6.(2025·江西九江·二模)植物的根是吸收水分和矿物养分的主要器官.已知在一定范围内,小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:)与氮元素吸收量(单位:天)的相关数据,如下表所示:9.912.114.818.219.921.825.127.730.432.10.300.340.420.500.550.600.710.740.780.86根据表中数据可得及线性回归方程为,则(

)A.B.变量与的相关系数C.在一定范围内,小麦的根长度每增加,它一天的氮元素吸收量平均增加D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应回归方程不变【正确答案】C【分析】根据样本中心在方程上可求解A,进而可判断B,根据回归方程的含义即可求解CD.【详解】由线性回归方程过样本中心点知,,故A错误;小麦对氮元素的吸收量与它的根长度具有正相关关系,故相关系数,故B错误;由线性回归方程可得,在一定范围内,小麦的根长度每增加,它一天的氮元素吸收量平均增加,故C正确;若研究小麦的根长度与钾元素吸收量的相关关系,回归方程可能发生改变,故D错误.故选:C.7.(2025·河北·二模)市某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了市淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人数(万人)与第个月的数据:1234523.137.062.1111.6150.8(1)根据表中数据可用一元线性回归模型刻画变量与变量之间的线性相关关系,且回归方程中的,请计算相关系数(精确到0.01),并判断是否可以认为与的线性相关性很强;(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.喜欢不喜欢总计男100女60总计110参考公式:(1)相关系数.若,则认为与有较强的线性相关性.回归方程中斜率的最小二乘法估计公式为;(2),其中.临界值表:0.0100.0050.0016.6357.87910.828参考数据:,,,,.【正确答案】(1),可以认为与有较强的线性相关性(2)答案见解析【分析】(1)根据题给数据算出平均数,再根据参考数据及,再对和进行求值,即可得到的值,再根据相关系数公式求解即可.(2)根据题给数据完成列联表,再根据公式代值求解,再与比较大小,即可得解.【详解】(1)由题可知,,,,.,可得.相关系数,,可以认为与有较强的线性相关性.(2)填写下面的列联表喜欢不喜欢总计男7030100女4060100总计11090200由表可知,则所以有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.8.(2025·云南曲靖·二模)自“机器人扭秧歌”这一节目在2025年春晚舞台大放异彩后,宇树科技这家专注于四足机器人研发的中国科技公司在全球范围内倍受瞩目,旗下一款机器人UnitreeAliengo在巡检与监控、安防与救援、科研与影视等方面应用广泛.现统计出机器人UnitreeAliengo在某地区2024年1月至5月的销售量如下表所示:月份x12345销售量y/台2637506493(1)经计算样本的相关系数,故变量x,y线性相关性很强,求y关于x的经验回归方程;(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于5时,称该对数据为一对“次数据”,现从这5对数据中任取3对做残差分析,求取到的数据中“次数据”对数的分布列和数学期望.附:经验回归直线中斜率和截距的最小二乘估计公式分别为:.【正确答案】(1)(2)的分布列见解析,数学期望为1.2【分析】(1)由线性回归方程,分别计算各部分的值,代入公式求解即可;(2)先计算各组数据的残差,再结合超几何分布,得到所有取值的概率,从而得到分布列和数学期望.【详解】(1)由表格可得,,,,,所以,,故y关于x的经验回归方程是.(2)当时,,残差的绝对值为;当时,,残差的绝对值为;当时,,残差的绝对值为;当时,,残差的绝对值为;当时,,残差的绝对值为.所以“次数据”为第四组和第五组共两组数据.故“次数据”对数的所有可能取值为0,1,2.,,.所以的分布列如下:012的数学期望.题型04列联表与独立性检验1.(2025·河南·二模)某校开设校本课程“剪纸”,为了解学生参加该课程与性别是否有关,用简单随机抽样的方法分别从男生和女生中各抽取了50名学生进行调查,得到如下列联表:性别课程合计参加“剪纸”课程不参加“剪纸”课程男生10女生3050合计(1)补全列联表,并依据小概率值的独立性检验,分析参加“剪纸”课程是否与性别有关联;(2)以样本估计总体,且以频率估计概率,若从该校女生中随机抽取3人,记其中参加“剪纸”课程的人数为,求的期望.附:,其中.0.0500.0250.0103.8415.0246.635【正确答案】(1)列联表见解析,认为参加“剪纸”课程与性别有关联,此推断犯错误的概率不大于0.050.(2)【分析】(1)根据列联表计算,再根据表格判断;(2)利用二项分布的期望公式.【详解】(1)列联表如下:性别课程合计参加“剪纸”课程不参加“剪纸”课程男生104050女生203050合计3070100零假设为:参加“剪纸”课程与性别无关联,则,依据小概率值的独立性检验,我们推断不成立,即认为参加“剪纸”课程与性别有关联,此推断犯错误的概率不大于0.050.(2)由表格中的数据知,从女生中抽取1人,其参加“剪纸”课程的概率为,的可能取值为0,1,2,3,且,所以.2.(2025·山东临沂·二模)体育是培养学生高尚人格的重要途径之一.足球作为一项团队运动项目,深受学生喜爱,为了解学生喜爱足球运动是否与性别有关,随机抽取了100名学生作为样本,统计得到如下的列联表:喜爱足球运动不喜爱足球运动合计男生40女生25合计100已知从这100名学生样本中随机抽取1个,抽到喜爱足球运动的学生的概率为.(1)求;(2)根据小概率值的独立性检验,判断学生喜爱足球运动是否与性别有关?(3)用样本分布的频率估计总体分布的概率,现在从喜爱足球运动的学生中随机抽取30名,记其中男生的人数为,求使事件“”概率最大的的值.附:,【正确答案】(1)(2)没有的把握认为喜爱足球运动与性别有关(3)20【分析】(1)根据题干条件直接计算即可;(2)写出零假设,列联表,计算卡方对比即可得出结论;(3)先得出,进一步列出不等式组即可求解.【详解】(1)因为从这100名学生样本中随机抽取1个,抽到喜爱足球运动的学生的概率为,所以;(2)零假设:喜爱足球运动与性别无关.作出列联表如下:喜爱足球运动不喜爱足球运动合计男生401555女生202545合计6040100由题,根据小概率值的独立性检验,我们推断成立,也就是说没有的把握认为喜爱足球运动与性别有关.(3)现在从喜爱足球运动的学生中随机抽取1名学生,该学生是男生的概率是,从而从喜爱足球运动的学生中随机抽取30名时,记其中男生的人数为,则,所以,令,解得,故使事件“”概率最大的的值为20.3.(2025·江西·二模)为试验某种元素在土地中的含量对某一品种的水果品质的影响,富农果业种植合作社进行种植试验,选择了元素含有量有明显差异的甲乙两块试验地,其中甲地元素含有量较为丰富,乙地元素含有量较为贫瘠.种植结束后对收获的水果进行评级,只有优等果与合格果两种品级.一共收获该品种水果数量为500,其中甲地总数量为200,甲地优等品数量为80,乙地优等品数量为20.(1)试判断:是否有的把握认为该品种水果的品级与土地中元素的含量有关?(2)已知该品种水果并不是所有的果实都可以作为种果(指可以育种的果实).种果中优等品占比为,在非种果中,优等品与合格品之比为.将种果占总数量的占比频率视为概率,已知种果的利润为200元/个,非种果的利润为30元/个.现从中随机的抽取5个水果,表示这5个水果的总利润,求的分布列和数学期望.附.0.1500.1000.0500.0102.0722.7063.8416.635【正确答案】(1)有的把握认为该品种水果的品级与土地中元素的含量有关;(2)分布列见解析,期望为490.【分析】(1)求出卡方值,对比临界值即可判断;(2)现从中随机的抽取5个水果,设取到的种果的个数为,判断,确定,即可求解.【详解】(1)列联表数据如下:土体甲乙合计优等品8020100合格品120280400合计200300500所以,所有有的把握认为该品种水果的品级与土地中元素的含量有关;(2)设种果数量为,则非种果数量为,因为种果优等品占比为,所以种果中优等品数量为,又因为在非种果中,优等品与合格品之比为,所以非种果中优等品的数量为,则,所以,所以从中随机取一个得到种果的概率为,现从中随机的抽取5个水果,设取到的种果的个数为,则,则,所以,所以的分布列如下:1503204906608301000012345P又,所以.4.(2025·江苏·二模)某种产品可以采用甲、乙两种工艺来生产,为了研究产品的质量与所采用的生产工艺的关联性,现对该种产品进行随机抽查,得到的结果如下表所示.工艺甲工艺乙合计合格6040100不合格203050合计8070150(1)依据小概率值的独立性检验,分析产品的质量是否与采用的工艺有关;(2)在不合格的50件样本产品中任选3件,求在这3件样本产品中至少有1件是采用工艺甲生产的条件下,这3件样本产品中恰有一件是采用工艺乙生产的概率.附:0.10.050.010.0050.0012.7063.8416.6357.87910.828【正确答案】(1)产品的质量与采用的工艺有关(2)【分析】(1)根据卡方的计算公式求解卡方,即可与临界值比较作答,(2)根据条件概率的计算公式即可求解.【详解】(1)零假设:产品的质量与采用的工艺无关,根据小概率值的独立性检验,产品的质量与采用的工艺有关.(2)记事件为3件样本产品中至少有1件是采用工艺甲,事件为这3件样本产品中恰有一件是采用工艺乙..5.(2025·广西河池·二模)2025年春节期间,电影《哪吒之魔童闹海》掀起全民观影热潮,连续7天票房逆势攀升,单日最高突破8.6亿元,吸引部分家庭携老扶幼共赴影院,缔造中国影史春节档票房与观影人次双冠王的奇迹.某电影院为了解民众观影的喜欢程度,随机采访了180名观影人员,得到下表:是否成年人是否喜欢合计不喜欢喜欢未成年人80100成年人2080合计180(1)求的值;(2)依据小概率值的独立性检验,能否认为喜欢电影《哪吒之魔童闹海》与是否成年有关?(3)用频率估计概率,现随机采访一名成年人和一名未成年人,设表示这两人中非常喜欢电影《哪吒之魔童闹海》的人数,求的分布列和数学期望.参考公式:0.10.050.012.7063.8416.635【正确答案】(1)(2)没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关(3)分布列见解析,【分析】(1)根据列联表计算即可;(2)由(1)根据卡方的计算公式结合临界值表计算即可求解;(3)列出随机变量的可能取值,利用独立事件乘法公式计算对应概率可得分布列,进而可求得数学期望.【详解】(1)由列联表可知,所以;(2)零假设:喜欢电影《哪吒之魔童闹海》与是否成年无关,根据表中数据得:.根据小概率值的独立性检验,没有充分证据证明喜欢电影《哪吒之魔童闹海》与是否成年有关;(3)由题可知,随机采访一位未成年人,则该未成年人喜欢电影《哪吒之魔童闹海》的概率为,随机采访一位成年人,则该成年人喜欢电影《哪吒之魔童闹海》的概率为,的可能取值为,,,,所以X的分布列为012.6.(2025·黑龙江哈尔滨·二模)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病.某医学研究小组为了解30~40岁人群的体质健康是否与性别有关,在3月感冒易发季节对某社区中该年龄段的60位居民进行了检测,将检测结果制成如下2×2列联表:性别健康状况合计不感冒感冒男121830女62430合计184260(1)在上述不感冒的人群中,按照性别采用分层抽样的方法抽取9人,再从这9人中随机选取4人访谈,记参与访谈的男性人数为,求的分布列和期望;(2)依据小概率值的独立性检验,能否据此推断30~40岁人群的体质健康与性别有关?若把表中所有数据扩大到原来的10倍,在相同的检验标准下,再用独立性检验判断体质健康与性别的关联性,结论还一样吗?请解释原因.附录:,其中.0.10.050.0250.010.0012.7063.8415.0246.63510.828【正确答案】(1)分布列见解析,;(2)答案见解析【分析】(1)利用分层抽样的方法抽取人,则抽取男性人,女性人,随机变量的所有取值为,求出对应概率,即可列出分布列,求出期望;(2)根据列联表中的数据,经计算得到,再和参考数据表中对应的数据比较,即可得到结论.【详解】(1)样本中不感冒的男性有人,女性有人,比例为,按照性别采用分层抽样的方法抽取人,则抽取男性人,女性人,所以随机变量的所有取值为.则,,,,所以的分布列为1234所以.(2)提出统计假设:岁人群的体质健康与性别无关.根据列联表中的数据,经计算得到,因为,假设成立,所以依据小概率值的独立性检验,不能据此推断岁人群的体质健康与性别有关.如果把所有数据都扩大10倍后,,,所以依据小概率值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论