高三二轮高效复习讲义数学专题突破统计与概率第3讲统计与成对数据的统计分析_第1页
高三二轮高效复习讲义数学专题突破统计与概率第3讲统计与成对数据的统计分析_第2页
高三二轮高效复习讲义数学专题突破统计与概率第3讲统计与成对数据的统计分析_第3页
高三二轮高效复习讲义数学专题突破统计与概率第3讲统计与成对数据的统计分析_第4页
高三二轮高效复习讲义数学专题突破统计与概率第3讲统计与成对数据的统计分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲统计与成对数据的统计分析▶对应学生用书P84【考情分析】高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.1.(2024·全国Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:亩产量[900,950)[950,1000)[1000,1050)频数61218亩产量[1050,1100)[1100,1150)[1150,1200)频数302410根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间解析:选C.对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1050,1100),故A不正确;对于B,100块稻田中亩产量低于1100kg的稻田所占比例为6+12+18+30100×100%=66%,故B不正确;对于C,因为1200-900=300,1150-950=200,所以100块稻田亩产量的极差介于200kg至300kg之间,故C正确;对于D,100块稻田亩产量的平均值约为1100×(925×6+975×12+1025×18+1075×30+1125×24+1175×10)=1067(kg),故D2.(多选)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差解析:选BD.对于选项A:设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则n-m=x1+x2+x3+x4+x5+x66-x2+x3+x4+x54=2(x1+x6对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42对于选项C:因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如:2,4,6,8,10,12,则平均数n=16×(2+4+6+8+10+12)=7标准差s1=16×[4,6,8,10,则平均数m=14×(4+6+8+10)=7标准差s2=14×[显然1053>5,即s1>s2,故C错误对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.3.(2024·全国甲卷)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150(1)填写如下列联表:优级品非优级品甲车间乙车间能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率p=0.5.设p为升级改造后抽取的n件产品的优级品率.如果p>p+1.65p(1-p)n,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(附:K2=n(ad-bc)2(a+b)(P(K2≥k)0.0500.0100.001k3.8416.63510.828解:(1)填写如下列联表:优级品非优级品甲车间2624乙车间7030则完整的2×2列联表如下:优级品非优级品总计甲车间262450乙车间7030100总计9654150K2=150×26×30-70因为K2=4.6875>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;因为K2=4.6875<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.(2)由题意可知p=96150=0.64又p+1.65p(1-p)n=0.5+1.65×0.5×(1-所以p>p+1.65p(1-p)考点1统计图表、数字特征1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率2.在频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积与小长方形底边中点的横坐标之积的和.(1)(多选)(2025·广东揭阳二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:cm)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是()A.基地牡丹植株高度的极差的估计值大于50B.基地牡丹植株高度不高于70的频率估计值为30%C.基地牡丹植株高度的众数与中位数的估计值相等D.基地牡丹植株高度的第75百分位数的估计值小于80解析:选BC.对于A项,由图象可知,基地牡丹植株高度范围在50,100之间,所以极差的估计值应不大于50,故A对于B项,基地牡丹植株高度不高于70的频率为(0.01+0.02)×10=0.3,故B正确;对于C项,由频率分布直方图可知,基地牡丹植株高度不高于70的频率为0.3,不高于80的频率为0.01+0.02+0.04×10=0.7>0.5,所以中位数位于70,80,设为x,则应有x-7010×0.4+0.3=0.5,得x=75,对于D项,基地牡丹植株高度不高于80的频率为0.7,不高于90的频率为0.95,所以基地牡丹植株高度的第75百分位数的估计值应在80,90内,故D(2)(多选)(2025·河南周口二模)已知正项等比数列an的公比q<1,将an的前9项按照从小到大的顺序排列组成一组数据,则下列说法正确的是(A.该组数据的30%分位数为a3B.该组数据的中位数小于其平均数C.若去掉a5,所得新数据的中位数与原中位数相等D.若bi=3ai(i=1,2,…,9),则b1,b2,…,b9的方差是a1,a2,…,a9的方差的9倍解析:选BD.由题意可知0<q<1,a1>0,故an为单调递减数列对于A,9×30%=2.7,故数据的30%分位数为从小到大的第三个数a7,A错误;对于B,该组数据的中位数为a5,由于a1+a9>2a1·a9=2a5,a2+a8>2a2·a8=2a5,a3+a7>2a3·a7=2a5,a4+a6>2a4·a6=2a5,因此a1+a9+a2+a8+a3+a7+a4+a6+a5对于C,若去掉a5,所得新数据的中位数为a4+a62>a4·a6=a5,对于D,bi=3ai(i=1,2,…,9),则b1,b2,…,b9的方差是a1,a2,…,a9的方差的9倍,D正确.[易错提醒](1)对于给出的统计图表,一定要结合问题背景理解图表意义.(2)频率分布直方图中纵坐标不要误以为是频率.对点练1.(1)(多选)(2025·河北秦皇岛二模)已知一组样本数据x1,x2,…,x2n,…,x4n,x1<x2<…<x2n<…<x4n,则下列说法错误的是()A.x1,x2,…,x4n的下四分位数为xnB.x2n,x2n+1,…,x4n的中位数为xC.x1,x2,…,x2n的平均数小于x2n+1,x2n+2,…,x4n的平均数D.ax1-a,ax2-a,…,ax4n-a的方差为x1,x2,…,x4n的方差的a倍解析:选ABD.对于A,由4n×25%=n,得下四分位数为xn+xn对于B,数据x2n,x2n+1,…,x4n共2n+1个,其中位数为x3n,B错误;对于C,12n∑i=12nxi<12n·2nx2n=x2n<x2n+1=12n·2nx2n+1对于D,ax1-a,ax2-a,…,ax4n-a的方差为x1,x2,…,x4n的方差的a2倍,D错误.(2)(多选)(2025·内蒙古呼和浩特一模)2024年4月30日国家统计局发布了制造业采购经理指数(PMI)(%)(50%=与上月比较无变化),如图所示.下列说法正确的是()A.从2023年4月到2024年4月制造业采购经理指数(PMI)呈下降趋势B.从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI)的极差为1.8%C.从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI)的平均数为49.4%D.从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI)的80%分位数为50.4%解析:选BD.对于A,制造业采购经理指数(PMI)有升有降,A错误;对于B,从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI)的极差为50.8%-49.0%=1.8%,B正确;对于C,从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI)的平均数为(49.5%+49.4%+49.0%+49.2%+49.1%+50.8%+50.4%)÷7≈49.63%,C错误;对于D,从2023年10月到2024年4月,这7个月的制造业采购经理指数(PMI),从小到大的顺序为49.0%,49.1%,49.2%,49.4%,49.5%,50.4%,50.8%,由7×80%=5.6,得第80百分位数为第6个数,为50.4%,D正确.考点2回归分析求经验回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略);(2)计算出x,y,a,b;(3)写出经验回归方程.(1)(多选)下列有关回归分析的结论中,正确的有()A.在成对样本数据(xi,yi)(i=1,2,3,…,10)中,根据最小二乘法求得经验回归方程为y=3x-1,去除一个样本点(x1,y1)后,得到的新经验回归方程一定会发生改变B.具有相关关系的两个变量x,y的样本相关系数为r,那么r越大,x,y之间的线性相关程度越强C.若散点图中的散点均落在一条斜率非零的直线上,则决定系数R2=1D.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高解析:选CD.对于A,若去除的点恰好在原经验回归直线上,则去除该点后,经验回归方程不会发生改变,故A错误;对于B,|r|越接近于1,则x,y之间的线性相关程度越强,故B错误;对于C,若散点图中的散点均落在一条斜率非零的直线上,则变量与变量之间满足线性函数关系,决定系数R2=1,故C正确;对于D,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故D正确.(2)(2025·山东济南二模)每年3月20日是国际幸福日,节日的意义在于追求幸福,建设未来.某中学为纪念国际幸福日举办了幸福种植计划,一名同学记录了种子的发芽情况,天数x12345胚芽长度y/cm0.81.11.52.44.2通过对表中数据进行分析,分别提出了两个回归模型:(ⅰ)y=bx+a;(ⅱ)y=mx2+n,①根据以上数据,计算模型(ⅰ)中的y关于x的相关系数r(结果精确到0.01),若0.95≤r≤1,则选择模型(ⅰ),否则选择模型(ⅱ),试问应该选择哪个模型?②根据①的结果,试建立y关于x的回归方程,并预测第6天种子的胚芽长度(结果精确到0.01).附:回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=∑i=1nxi-x样本相关系数为r=∑i参考数据:∑i=15xi-xyi-y=8.1,∑i=15(y令ui=xi2,∑i=15解:①由题设得x=1+2+3+4+55=3则∑i=15xi-x2=(1-3)2+(2-3)2+…+(所以r=∑i=15xi-xyi-y∑i②令ui=xi2,设线性回归方程为y=mu+则u=1+4+9+16+255=11,y=0.8+1所以∑i=15ui-u2=(1-11)2+(4-11)2+…+(所以m=∑i=15ui-又2=0.139×11+n,则n≈0.47,故y=0.14u+0.47,所以回归方程为y=0.14x2+0.47,故当x=6时,有y=0.14×36+0.47=5.51(厘米),所以预测第6天种子的胚芽长度为5.51厘米.[易错提醒](1)样本点不一定在经验回归直线上,但点(x,y)一定在经验回归直线上.(2)求b时,灵活选择公式,注意公式的推导和记忆.(3)利用样本相关系数判断线性相关程度强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值.对点练2.(2025·四川雅安二模)国产动画电影《哪吒之魔童闹海》现已登顶全球动画电影票房榜榜首,并刷新多项世界票房纪录.下表截取了该电影上映后10日的单日累计票房:日期1月29日1月30日1月31日2月1日2月2日2月3日2月4日日期代码x1234567累计票房y/亿元4.889.6815.8723.1931.3239.7648.43日期2月5日2月6日2月7日日期代码x8910累计票房y/亿元54.9260.7866.20(1)请根据这10日数据:(ⅰ)计算x,y的平均值x,y;(ⅱ)求y关于x的经验回归方程;(2)用上面求出的经验回归方程预测该电影上映半年后的票房,得到的结果合理吗?为什么?(每月按30天计)附:参考公式:经验回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=∑i=1nxi-x参考数据:∑i=110yi=355.03,∑i=110(xi-x)(yi-y解:(1)(ⅰ)由题意,x=110×(1+2+3+4+5+6+7+8+9+10)=5.5,y=110∑i=110yi=110×35(ⅱ)∑i=110xi2=12+22+32+42+52+62+72+82+92则b=∑i=110xi-xyi-y∑i=110xi2-10x所以y关于x的经验回归方程为y=7.206x-4.13.(2)由(1)知,y=7.206x-4.13,当x=180时,y=7.206×180-4.13=1292.95,则预测该电影上映半年后的票房为1292.95亿元,这样的预测结果显然不合理,电影的票房一般在刚上映的一段时间内增长较快,随着时间的推移,增长速度会逐渐放缓,而所求的经验回归方程是假设变量之间具有线性关系,不能准确反映电影票房在较长时间内的变化趋势,所以用这个方程预测半年后的票房是不合理的.考点3独立性检验独立性检验的一般步骤(1)根据样本数据列2×2列联表;(2)根据公式χ2=n(ad-bc)2(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.(2025·浙江杭州二模)某车企为考察选购新能源汽车的款式与性别的关联性,调查100人购买情况,得到如下列联表:新能源汽车A款新能源汽车B款总计男性5010x女性251540总计y25100(1)求x,y;(2)根据小概率值α=0.05的独立性检验,能否认为选购该新能源汽车的款式与性别有关联?(3)假设用样本估计总体,用频率估计概率,所有人选购汽车的款式情况相互独立.若从购买者中随机抽取3人,设被抽取的3人中购买了B款车的人数为X,求X的数学期望.附:χ2=nad-bc2a+bc+daα0.100.050.0100.005xα2.7063.8416.6357.879解:(1)由题意得x=50+10=60,y=100-25=75.(2)零假设为H0:选购新能源汽车的款式与性别无关联.根据列联表中的数据,可得χ2=100×50×15-25×根据小概率值α=0.05的独立性检验,推断H0不成立,可以认为选购车的款式与性别有关,此推断犯错误的概率不大于0.05.(3)随机抽取1人购买B款车的概率为p=25100=1X的可能取值有0,1,2,3,由题意得X~B3,由二项分布的期望公式得EX=np=3×14=3[易错提醒](1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.对点练3.(2025·广东湛江二模)为了研究观众对某档节目的喜爱情况与性别的关联性,分别调查了该档节目男、女观众各100人,发现共有70名观众喜爱该档节目,且不喜爱该档节目的女性观众数是喜爱该档节目的男性观众数的2倍.(1)根据题中信息,完成下面列联表;单位:人性别喜爱情况合计喜爱不喜爱男女合计(2)根据(1)中的列联表,依据α=0.1的独立性检验,能否认为观众对该档节目的喜爱情况与性别有关?附:χ2=n(ad-bc)2(a+b)(α0.10.050.01xα2.7063.8416.635解:(1)设喜爱该档节目的男性观众数为x,则喜爱该档节目的女性观众数为70-x,不喜爱该档节目的女性观众数为2x,则70-x+2x=100,得x=30.故列联表完成如下.性别喜爱情况合计喜爱不喜爱男3070100女4060100合计70130200(2)零假设为H0:观众对该档节目的喜爱情况与性别无关.得χ2=200×(30×60-40×70)2100×根据α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为观众对该档节目的喜爱情况与性别无关.[课下巩固检测练(三十五)]统计与成对数据的统计分析(单选题、填空题每题5分,多选题每题6分,解答题每题10分)一、单选题1.(2024·天津高考)下列图中,线性相关系数最大的是()解析:选A.观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,r值相比于其他3图更接近1.2.(2025·重庆模拟)“缤纷艺术节”的表演比赛中,某节目结束后,100位观众评委的打分情况如图所示(分数均不相同).计算该节目最终得分时,需去掉一个最高分和一个最低分,关于处理后的打分数据,下列说法一定正确的是()A.中位数不变,极差变小B.极差不变,平均数变小C.平均数变大,方差变小D.方差变小,中位数变大解析:选A.去掉一个最大值和一个最小值,所以中位数没有变化,因为极差为最大值与最小值之差,所以极差会变小,所以BD错误;由于去掉最大值与最小值,平均值的变化不确定,故C错误.3.随着消费者对食品安全和健康饮食的关注度的提升,中国有机燕麦作为有机食品中营养价值较高的产品,受到消费者青睐,下图为中国有机燕麦消费者调研样本构成,根据该图,下列说法正确的是()A.中国有机燕麦消费者中女性不超过男性的2倍B.超过85%的中国有机燕麦消费者月收入不高于15000元C.超过半数的中国有机燕麦消费者年龄在31~40岁D.中国有机燕麦消费者月收入构成占比中的5个百分数的中位数是33.0%解析:选C.对于A,由图可得中国有机燕麦消费者中女性与男性占比分别为69.2%,30.8%,而30.8%×2=61.6%<69.2%,故A错误;对于B,中国有机燕麦消费者月收入不高于15000元的占比为1-4%-11.1%=84.9%<85%,故B错误;对于C,中国有机燕麦消费者中年龄在31~40岁的占比为57.7%,故C正确;对于D,中国有机燕麦消费者月收入构成占比中的5个百分数的中位数是11.5%,故D错误.4.(2025·天津一模)下列说法中,不正确的是()A.在1,3,6,7,9,10,12,15这组数据中,第50百分位数为8B.分类变量A与B的统计量χ2越大,说明“A与B有关系”的可信度越大C.根据具有线性相关关系的两个变量的统计数据所得的经验回归方程为y=bx+a,若b=2,x=1,y=3,则a=1D.两个模型中,残差平方和越大的模型拟合的效果越好解析:选D.对A:因为8×50%=4,所以这组数据的第50百分位数为7+92=8,故A选项内容正确对B:根据统计量χ2的意义可知,B选项内容正确;对C:根据线性回归方程必过x,y得3=2×1+a⇒a=1,故C对D:因为残差平方和越小,模型拟合的效果越好,故D选项内容错误.5.(2025·天津河东二模)2024年12月26日,DeepSeek—V3首个版本正式上线,截至2025年2月9日,DeepSeekAPP的累计量已超1.1亿次,AI成为当下的热门话题.某中学高中数学社团以16至40岁人群使用DeepSeek频率为课题,分小组自主选题进行调查研究,下列说法正确的是()A.甲小组开展了DeepSeek每周使用频次与年龄的相关性研究,经计算样本相关系数r≈0.97,可以推断两个变量正线性相关,但相关程度很弱B.乙小组利用最小二乘法得到DeepSeek每周使用频次y关于年龄x的经验回归方程为y=0.3x+8,可以推断年龄为30岁的群体每周使用频次一定为17次C.丙小组用决定系数R2来比较模型的拟合效果,经验回归方程①和②的R2分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多D.丁小组研究性别因素是否影响DeepSeek使用频次,根据小概率值α=0.1的χ2独立性检验,计算得到χ2=3.837>2.706=x0.1,可以认为不同性别的人对DeepSeek使用频次没有差异解析:选C.对于A,r的绝对值越接近1,相关性越强,故A错误;对于B,回归方程为y=0.3x+8给出的是预测值,实际值会有随机误差,所以年龄为30岁的群体每周使用频次不一定为17次,故B错误;对于C,R2表示模型对因变量的解释比例,R2大说明经验回归方程②的刻画效果比经验回归方程①的好很多,故C正确;对于D,χ2=3.837>2.706=x0.1,可以认为不同性别的人对DeepSeek使用频次有差异,故D错误.二、多选题6.(2025·广东珠海一模)一组样本数据(xi,yi),i∈1,2,3,…,100.其中xi>1895,∑i=1100xi=2×105,∑i=1100yi=970,求得其经验回归方程为:y=-0.02x+a1,残差为ei.对样本数据进行处理:x'i=ln(xi-1895),得到新的数据(x'i,yi),求得其经验回归方程为:y=-0.42x+a2,其残差为ui.ei,ui分布如图所示,且e~NA.样本xiB.a1=49.C.σ12D.处理后的决定系数变大解析:选ABD.对于A,经验回归方程y=-0.02x+a1中斜率-0.02<0,则样本(xi,yi)负相关,A正确对于B,原样本均值:x=2×103,y=9.7,由y=-0.02x+a1,得a1=9.7+0.02×2×103=49.7,B对于C,由图1的数据波动较大可得ui比ei更集中,则σ22<σ对于D,由图1的残差平方和较图2的残差平方和大知,处理后拟合效果更好,决定系数变大,D正确.7.(2025·甘肃陇南模拟)某校举行了交通安全知识主题演讲比赛,甲、乙两位同学演讲后,6位评委对他们的演讲分别进行打分(满分100分),得到如图所示的统计图,则()A.甲得分的中位数大于乙得分的中位数B.甲得分的极差大于乙得分的极差C.甲得分的第75百分位数大于乙得分的第75百分位数D.甲得分的方差大于乙得分的方差解析:选AC.由统计图可知,甲得分从小到大排列为:81,81,82,83,84,87,乙得分从小到大排列为:78,79,80,81,82,86,对于A,甲得分的中位数为82+832=82.5,乙得分的中位数80+812=80.5,所以甲得分的中位数大于乙得分的中位数,故A对于B,甲得分的极差为87-81=6,乙得分的极差为86-78=8,所以甲得分的极差小于乙得分的极差,故B错误;对于C,因为6×75%=4.5,所以甲得分的第75百分位数为84,乙得分的第75百分位数为82,所以甲得分的第75百分位数大于乙得分的第75百分位数,故C正确;对于D,由折线图可知,甲的得分比较集中,乙的得分比较分散,所以甲得分的方差小于乙得分的方差,故D错误.三、填空题8.(2025·上海长宁二模)为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设H0:患慢性气管炎与吸烟没有关系,并通过计算得到统计量χ2≈3.468,则可推断原假设H0.(填“拒绝”或“接受”,规定显著性水平α=0.1,Pχ2≥2.解析:已知显著性水平α=0.1,P(χ2≥2.706)≈0.1,即临界值为2.706,因为3.468>2.706,所以可推断拒绝原假设H0.答案:拒绝9.(2025·黑龙江哈尔滨一模)由样本数据(xi,yi)(i=1,2,3,…,10),求得回归直线方程为y=2x-1,且x=3,若去除偏离点(4,10)后,得到新的回归直线方程为y=52x+b,则去除偏离点后,相应于样本点2,2解析:由于回归直线过样本中心点,当x=3时,y=2x-1=2×3-1=5,去除偏离点4,10后,剩余数据的中心点为则x'=10x-49=269,y'将点(269,409)的坐标代入回归直线方程y=52x+b,可得52×269+b=409,解得b=-259,所以新的回归直线方程为y=52x-259,当x=2时所以去除偏离点后,相应于样本点(2,2)的残差值为2-209=-2答案:-2四、解答题10.(2025·辽宁大连二模)在哈尔滨2025年第九届亚洲冬季运动会的志愿者选拔工作中,面试满分为100分,现随机抽取了120名候选人的面试成绩分为五组,第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95),绘制成如图所示的频率分布直方图.已知图中从左到右前三组的频率成等差数列,第一组的频率等于第五组的频率.(1)求a,b的值,并估计这120名候选人成绩的平均数(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1);(2)已知120名候选人中,男、女生各60人,男生想去冰上赛区的有35人,女生想去冰上赛区的有20人,请补全下面2×2列联表.请问是否有99%的把握认为候选人想去冰上赛区与性别有关?(χ2精确到0.001)志愿者性别合计男生女生想去冰上赛区3520不想去冰上赛区合计6060附:χ2=n(P(χ2≥k)0.0500.0100.001k3.9416.63510.828(3)滑冰项目的场地服务需要4名志愿者,有4名男生和2名女生通过选拔入围,现随机从6名同学中抽取4人服务该场地,记男生被抽中的人数为X,求X的分布列及期望.解:(1)由题意:10×2b=10a+10×0.045,又(2a+b+0.02+0.045)×10=1,解得a=0.005,b=0.025.估计这120名候选人成绩的平均数为:50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5,设中位数为x:(x-65)×0.045=0.5-(0.005+0.025)×10,解得中位数x≈69.4.(2)志愿者性别合计男生女生想去冰上赛区352055不想去冰上赛区254065合计6060120χ2=n(ad-bc)2(a+所以有99%的把握认为候选人想去冰上赛区与性别有关.(3)男生被抽中的人数X可能取值为2,3,4.P(X=2)=C42C22C64=25,P(X=3)=C43C21X的分布列为:X234P281E(X)=2×25+3×815+4×11511.(2025·山东模拟预测)下表是2020—2024年中国出生人口数y(单位:十万人)的数据:年份2020202120222023

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论