版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第40页(共40页)2026年高考数学复习新题速递之统计一.选择题(共8小题)1.已知某总体分为两层,第一层总体数量为N1=80,第二层总体数量为N2=120,采用分层抽样抽取样本,第一层样本平均数为x1=5;第二层样本平均数为x2A.5.5 B.6.0 C.6.2 D.7.02.已知一组数据如下:2022,2023,2024,2024,2025,2026,则下列结论错误的是()A.这组数据的极差为4 B.这组数据的方差为2 C.这组数据的众数等于平均数 D.这组数据的第70百分位数为20253.甲、乙两名选手在射击训练中各射击5次,成绩(单位:环)如下:甲78988乙1067107记甲、乙的平均成绩和方差分别为x甲,x乙和D甲A.x甲B.x甲C.x甲D.x4.如图是根据x,y的观测数据(xi,yi)(i=1,2,⋯,10)得到的散点图,则变量x,y能用一元线性回归模型y=bx+a+e来刻画,且b<0的是()A. B. C. D.5.如图,这是某城市在2023年12月﹣2024年2月的二手房销量数据折线图.下列说法正确的是()A.这组数据的极差为470 B.这组数据的众数为365 C.这组数据的中位数为387 D.这组数据的平均数约为3606.为了研究y关于x的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程ŷx12345y0.50.911.11.5A.âB.x与y的样本是负相关 C.当x=8时,y的预估值为2.2 D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变7.已知由小到大排列的4个数据1,3,5,a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是()A.9 B.7 C.5 D.38.某市6月1日至14日的空气质量指数变化趋势如图所示,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,下列说法中不正确的是()A.该市14天空气质量指数的中位数为78.5 B.该市14天空气质量指数的第30百分位数为55 C.该市14天空气质量指数的平均值大于100 D.计算连续3天空气质量指数的方差,其中6日到8日的方差最大二.多选题(共4小题)(多选)9.近几年,人工智能(AI)逐渐走入人们的生活并得到越来越多的使用.为了解某大学大一学生对AI的使用情况,随机抽取了该校100位大一学生,收集了该100位学生在上学期中向AI提问的次数,得到如图1所示的频率分布直方图(60次及以上的称为经常向AI提问),则下列结论正确的是()A.b=0.005 B.这100位学生中经常向AI提问的人数为75 C.估计大一学生向AI提问的次数的平均数为70 D.按照“经常向AI提问”与“不经常向AI提问”进行分层随机抽样,从这100人中抽取24人,则在经常向AI提问的学生中应抽取16人(多选)10.下列命题中正确的是()A.数据4,4,5,6,6,6,7,9,12,12,13的70%分位数是9 B.频率分布直方图中各个小矩形的面积和为1 C.分层随机抽样中每个个体入样的概率不相等 D.将总体划分为两层,其个体数分别为m,n,通过分层随机抽样,得到两层的样本平均数和样本方差分别为x1,x2和s(多选)11.下列说法正确的是()A.样本数据x1,x2,x3,⋯,xn(n≥5),去掉其中的一个最小数和一个最大数后,剩余数据的中位数小于原样本的中位数 B.数据x1,x2,x3,⋯,xn的方差为0,则所有的xi(i=1,2,3,⋯,n)都相等 C.若随机变量X∼N(0,22),Y∼N(0,32),则P(|X|≤3)>P(|Y|≤3) D.在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=2x+1上,则决定系数R(多选)12.某中学三个年级学生共2000人,且各年级人数比例如以下扇形图.现因举办校庆活动,以按比例分配的分层抽样方法,从中随机选出志愿服务小组,已知选出的志愿服务小组中高一学生有32人,则下列说法正确的有()A.该学校高一学生共800人 B.志愿服务小组共有学生96人 C.志愿服务小组中高三学生共有20人 D.某高三学生被选入志愿服务小组的概率为2三.填空题(共4小题)13.已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数与众数之和等于中位数的2倍、则x=.14.某校高三年级10次模考中甲同学的数学成绩从小到大依次排列为94,96,98,98,100,101,101,102,102,103,则甲同学在这10次模考中数学成绩的第40百分位数为.15.某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组[2,4),[4,6),[6,8),[8,10),[10,12]抽样结果绘成的频率分布直方图如图所示,则实数a=.16.已知男、女生共有200人,其中女生有80人,按性别采用分层随机抽样的方法从这200人中抽取25人,则这25人中男生有人.四.解答题(共4小题)17.某校生物科技班开展“核酸自组装”实验,记录200名学生在限制性末端配对实验中的操作表现:组别操作评级合计优良男生35100女生45合计200(1)完成列联表,依据α=0.01的独立性检验,能否认为学生组别与操作评级存在关联?(2)在后续的“环状核酸构建”实验中,需处理n(n∈N*)条线性核酸片段:每条片段有两个末端;每次随机选取2个未配对的末端进行连接;连接后可能形成一个或多个环状结构,所有核酸片段末端连接完毕视为结束.(i)当n=3时,记随机变量X为最终形成的环状结构数,求X的分布列与数学期望;(ii)求证:所有核酸片段连接成一个完整环状结构的概率为2n附:χ2=n(ad-bc)2(aα0.050.010.0050.001xα3.8416.6357.87910.82818.随机抽取某集团公司旗下五家超市,得到广告支出x(万元)与销售额y(万元)的数据如下:广告支出x(万元)24568销售额y(万元)2030506070(1)计算x,y的相关系数r,并判断是否可以认为广告支出与销售额具有较高的线性相关程度?(若0.3<|r|<0.75,则线性相关程度一般;若|r|≥0.75,则线性相关程度较高,344≈18.55(2)求出y关于x的线性回归方程,并预测若广告支出15(万元),则销售额约为多少万元?参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为b̂=i=1n19.某学校为了研究学生的数学成绩与物理成绩是否有关联,随机抽取了500名学生的成绩数据,得到如下2×2列联表:单位:人物理成绩数学成绩合计优秀不优秀优秀9060150不优秀160190350合计250250500(1)记数学成绩优秀者中物理成绩不优秀的概率为P,求P的值;(2)依据小概率值α=0.01的独立性检验,能否认为学生的数学成绩与物理成绩有关系?参考公式:χ2=n(ad-bc)2(a临界值表:α0.050.010.001xα3.8416.63510.82820.2024年奥运会在巴黎举行,中国代表团获得了40枚金牌,27枚银牌,24枚铜牌,共91枚奖牌,取得了境外举办奥运会的最好成绩,运动员的拼搏精神给人们留下了深刻印象.为了增加学生对奥运知识的了解,弘扬奥运精神,某校组织高二年级学生进行了奥运知识能力测试.根据测试成绩,将所得数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,其频率分布直方图如图所示.(1)求该样本的第75百分位数;(2)试估计本次奥运知识能力测试成绩的平均分;(3)该校准备对本次奥运知识能力测试成绩不及格(60分以下)的学生,采用按比例分配的分层随机抽样方法抽出5名同学,再从抽取的这5名同学中随机抽取2名同学进行情况了解,求这2名同学分数在[40,50),[50,60)各一人的概率
2026年高考数学复习新题速递之统计(2025年10月)参考答案与试题解析一.选择题(共8小题)题号12345678答案CBAACABC二.多选题(共4小题)题号9101112答案ABABDBCDAC一.选择题(共8小题)1.已知某总体分为两层,第一层总体数量为N1=80,第二层总体数量为N2=120,采用分层抽样抽取样本,第一层样本平均数为x1=5;第二层样本平均数为x2A.5.5 B.6.0 C.6.2 D.7.0【考点】由分层随机抽样的样本平均数估计总体平均数.【专题】对应思想;定义法;概率与统计;运算求解.【答案】C【分析】根据分层抽样平均数公式计算求解.【解答】解:已知某总体分为两层,第一层总体数量为N1=80,第二层总体数量为N2=120,第一层样本平均数为x1=5,第二层样本平均数为则总体平均数为80200故选:C.【点评】本题考查总体平均数相关知识,属于基础题.2.已知一组数据如下:2022,2023,2024,2024,2025,2026,则下列结论错误的是()A.这组数据的极差为4 B.这组数据的方差为2 C.这组数据的众数等于平均数 D.这组数据的第70百分位数为2025【考点】众数;极差;百分位数.【专题】对应思想;定义法;概率与统计;运算求解.【答案】B【分析】根据极差,众数,平均数,方差以及百分位数相关知识可解.【解答】解:已知一组数据如下:2022,2023,2024,2024,2025,2026,则极差为2026﹣2022=4,故A正确;众数为2024,平均数为2022+2023+2024+2024+2025+20266=2024,故方差为16(4+1+0+0+1+4)=53又6×70%=4.2,则这组数据的第70百分位数为第5个数,即为2025,故D正确.故选:B.【点评】本题考查极差,众数,平均数,方差以及百分位数相关知识,属于中档题.3.甲、乙两名选手在射击训练中各射击5次,成绩(单位:环)如下:甲78988乙1067107记甲、乙的平均成绩和方差分别为x甲,x乙和D甲A.x甲B.x甲C.x甲D.x【考点】平均数;方差.【专题】对应思想;综合法;概率与统计;运算求解.【答案】A【分析】根据条件,直接求出x甲,x乙和D甲D乙,即可求解.【解答】解:因为x甲=7+8+9+8+85=8又D甲D乙则D甲<D乙.故选:A.【点评】本题考查平均数与方差公式,属于基础题.4.如图是根据x,y的观测数据(xi,yi)(i=1,2,⋯,10)得到的散点图,则变量x,y能用一元线性回归模型y=bx+a+e来刻画,且b<0的是()A. B. C. D.【考点】散点图;经验回归方程与经验回归直线.【专题】整体思想;综合法;概率与统计;逻辑思维.【答案】A【分析】由题意可知,x与y负线性相关,进而作出判断即可.【解答】解:根据变量x,y具有线性相关关系,则散点在某条直线附近,又b<0,所以散点从左上至右下,观察选项可知,A选项散点图正确.故选:A.【点评】本题主要考查了散点图的应用,考查了变量间的相关关系,属于基础题.5.如图,这是某城市在2023年12月﹣2024年2月的二手房销量数据折线图.下列说法正确的是()A.这组数据的极差为470 B.这组数据的众数为365 C.这组数据的中位数为387 D.这组数据的平均数约为360【考点】中位数;众数;极差.【专题】计算题;方程思想;转化思想;综合法;概率与统计;运算求解.【答案】C【分析】根据极差,众数,中位数以及平均数的计算即可求解.【解答】解:根据题意,将数据从小到大排列为:36,131,140,270,355,365,387,408,420,420,437,481,516.则其极差为516﹣36=480,众数为420,中位数为387,平均数为113分析选项:A、B、D错误,C正确.故选:C.【点评】本题考查数据的极差,众数,中位数以及平均数的计算,注意极差,众数,中位数以及平均数的计算公式,属于基础题.6.为了研究y关于x的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程ŷx12345y0.50.911.11.5A.âB.x与y的样本是负相关 C.当x=8时,y的预估值为2.2 D.去掉样本点(3,1)后,x与y的样本相关系数r必会改变【考点】经验回归方程与经验回归直线;样本相关系数.【专题】对应思想;定义法;概率与统计;运算求解.【答案】A【分析】由表格数据求出样本中心点求解判断A;由â的正负判断B;由回归方程计算判断C;由相关系数公式判断D【解答】解:若已求得一元线性回归方程ŷ根据图中数据可得x=1+2+3+4+55=3,对于A,由3â+0.34=1,得a对于B,由â>0,得x与y对于C,当x=8时,y的预估值为ŷ=0.22×8+0.34=2.1,对于D,由相关系数公式知,去掉样本中心点(3,1)后,x与y的样本相关系数r不会改变,D错误.故选:A.【点评】本题考查线性回归方程相关知识,属于中档题.7.已知由小到大排列的4个数据1,3,5,a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是()A.9 B.7 C.5 D.3【考点】极差.【专题】方程思想;定义法;概率与统计;运算求解.【答案】B【分析】利用极差是中位数的2倍,解得a=9,由此能求出这4个数据的第75百分位数.【解答】解:由小到大排列的4个数据1,3,5,a,∵这4个数据的极差是它们中位数的2倍,∴a﹣1=3+5,解得a=9,4×75%=3,∴这4个数据的第75百分位数是5+92=故选:B.【点评】本题考查极差、中位数、百分位数等基础知识,考查运算求解能力,是基础题.8.某市6月1日至14日的空气质量指数变化趋势如图所示,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,下列说法中不正确的是()A.该市14天空气质量指数的中位数为78.5 B.该市14天空气质量指数的第30百分位数为55 C.该市14天空气质量指数的平均值大于100 D.计算连续3天空气质量指数的方差,其中6日到8日的方差最大【考点】折线统计图.【专题】整体思想;综合法;概率与统计;运算求解.【答案】C【分析】由平均数、中位数、百分位数和方差的概念即可得出答案.【解答】解:对于选项A,将14天的空气质量指数由小到大排列为:33,38,52,53,55,65,76,81,102,102,116,122,158,163,所以该市14天空气质量指数的中位数为:76+812=78.5,故对于选项B:因为14×30%=4.2,所以该市14天空气质量指数的30百分位数为55,故B正确;对于选项C:x=所以该市14天空气质量指数的平均值小于100,故C错误;对于选项D:因为连续3天空气质量指数,6日到8日的波动最大,也即方差最大,故D正确.故选:C.【点评】本题主要考查了统计图的应用,属于基础题.二.多选题(共4小题)(多选)9.近几年,人工智能(AI)逐渐走入人们的生活并得到越来越多的使用.为了解某大学大一学生对AI的使用情况,随机抽取了该校100位大一学生,收集了该100位学生在上学期中向AI提问的次数,得到如图1所示的频率分布直方图(60次及以上的称为经常向AI提问),则下列结论正确的是()A.b=0.005 B.这100位学生中经常向AI提问的人数为75 C.估计大一学生向AI提问的次数的平均数为70 D.按照“经常向AI提问”与“不经常向AI提问”进行分层随机抽样,从这100人中抽取24人,则在经常向AI提问的学生中应抽取16人【考点】频率分布直方图的应用.【专题】对应思想;定义法;概率与统计;运算求解.【答案】AB【分析】根据频率之和为1即可求解A,由频率的计算即可求解B,根据平均数的计算公式即可求解C,利用抽样比即可求解D.【解答】解:对于A,由频率分布直方图可得2b+0.015+0.020+0.025+0.030=0.1,故b=0.005,故A正确;对于B,经常向AI提问的次数不少于60的频率为1﹣(0.005+0.020)×10=0.75,故这100位学生中经常向AI提问的人数约为100×0.75=75,故B正确;对于C,经常向AI提问的次数的平均数为45×0.005×10+55×0.020×10+65×0.025×10+75×0.030×10+85×0.015×10+95×0.005×10=69.5,故C错误;对于D,已知按照“经常向AI提问”与“不经常向AI提问”进行分层随机抽样,从这100人中抽取24人,“经常向AI提问”与“不经常向AI提问”的人数之比为3:1,故从这100人中抽取24人,在经常向AI提问的人中应抽34×24=18人,故故选:AB.【点评】本题考查频率分布直方图,平均数以及分层抽样相关知识,属于中档题.(多选)10.下列命题中正确的是()A.数据4,4,5,6,6,6,7,9,12,12,13的70%分位数是9 B.频率分布直方图中各个小矩形的面积和为1 C.分层随机抽样中每个个体入样的概率不相等 D.将总体划分为两层,其个体数分别为m,n,通过分层随机抽样,得到两层的样本平均数和样本方差分别为x1,x2和s【考点】百分位数;由分层随机抽样的样本平均数估计总体平均数;方差.【专题】对应思想;综合法;概率与统计;运算求解.【答案】ABD【分析】根据第p百分位数的定义计算判断A;根据频率分布直方图的频率性质判断B;根据分层随机抽样的概率和方差公式判断C,D;【解答】解:对于A,将数据排列可得:4,4,5,6,6,6,7,9,12,12,13,因为11×70%=7.7,第8个数据即为70%分位数为第8个数,即为9,故A正确;对于B,频率分布直方图中,频率之和等于1,故各个小矩形的面积和为1,故B正确;对于C,分层随机抽样中每个个体入样的概率相等,均为样本容量与总体容量的比值,故C错误;对于D,由题意,总体的平均数为x=则s12=总体的方差s=m=mm+故选:ABD.【点评】本题考查百分位数、频率分布直方图的性质、分层随机抽样的平均数与方差公式,属于基础题.(多选)11.下列说法正确的是()A.样本数据x1,x2,x3,⋯,xn(n≥5),去掉其中的一个最小数和一个最大数后,剩余数据的中位数小于原样本的中位数 B.数据x1,x2,x3,⋯,xn的方差为0,则所有的xi(i=1,2,3,⋯,n)都相等 C.若随机变量X∼N(0,22),Y∼N(0,32),则P(|X|≤3)>P(|Y|≤3) D.在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=2x+1上,则决定系数R【考点】决定系数与模型的拟合效果;正态分布曲线的特点及曲线所表示的意义;中位数;方差.【专题】对应思想;定义法;概率与统计;运算求解.【答案】BCD【分析】通过举具体的样本数据例子,根据中位数定义,即可判断选项A;依据方差的计算公式,分析方差为0时数据的特征,即可判断选项B;利用正态分布中σ越小,曲线越“瘦高”,相同区间内概率越大的性质,即可判断选项C;根据线性回归模型中决定系数的公式,结合“样本数据对应的点均在回归直线上”这一条件,分析残差平方和与总偏差平方和的关系,即可判断选项D.【解答】解:对于选项A,假设一组数据样本1,2,3,4,5,6,7,8,9,其中位数为5,去掉其中的一个最小数和一个最大数后,数据样本为2,3,4,5,6,7,8,其中位数仍为5,故A错误;对于选项B,数据x1,x2,x3,⋯,xn的方差为0,即i=1则xi-x=0,即xi=x,因此所有的xi(i=1,2,3对于选项C,对于正态分布N(μ,σ2),σ越小,曲线越“瘦高”,在相同区间内的概率越大,因为X∼N(0,22),Y∼N(0,32),则σX=2<σY=3,所以P(|X|≤3)=P(﹣3≤X≤3)>P(|Y|≤3)=P(﹣3≤Y≤3),故C正确;对于选项D,已知在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=2x+1上,则残差ei=yi-故选:BCD.【点评】本题考查中位数,方差,正态分布,决定系数相关知识,属于中档题.(多选)12.某中学三个年级学生共2000人,且各年级人数比例如以下扇形图.现因举办校庆活动,以按比例分配的分层抽样方法,从中随机选出志愿服务小组,已知选出的志愿服务小组中高一学生有32人,则下列说法正确的有()A.该学校高一学生共800人 B.志愿服务小组共有学生96人 C.志愿服务小组中高三学生共有20人 D.某高三学生被选入志愿服务小组的概率为2【考点】扇形统计图.【专题】转化思想;综合法;概率与统计;运算求解.【答案】AC【分析】利用扇形图的特点和分层抽样的概念,即可判断.【解答】解:A项,根据题意可知,高三年级学生人数占总人数的25%,高二年级学生人数占总人数的35%,故高一年级学生人数占总人数的1﹣25%﹣35%=40%,故高一学生共2000×40%=800人,故A选项正确;B项,因为2000×32800=80,所以志愿服务小组共有学生80C项,因为志愿服务小组中高三学生共有80×25%=20人,故C选项正确;D项,高三学生共2000×25%=500人,志愿服务小组中高三学生共有20人,故某高三学生被选入志愿服务小组的概率为20500=1故选:AC.【点评】本题考查了扇形图的特点和分层抽样的概念,属于基础题.三.填空题(共4小题)13.已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数与众数之和等于中位数的2倍、则x=﹣11或3或17.【考点】用样本估计总体的集中趋势参数.【专题】整体思想;定义法;概率与统计;运算求解.【答案】﹣11或3或17.【分析】根据平均数和众数的概念求出平均数和众数,再分情况讨论得到中位数,根据题设列方程可求解.【解答】解:由题意得,这组数据的平均数为:x+10+2+5+2+4+27=若x≤2,则中位数为2,由题意有x+257+2=4,解得x若2<x<4,则中位数是x,此时2x=x+257若x≥4,则中位数是4,此时2×4=x+257+2,解得综上所述,x的值为﹣11或3或17.故答案为:﹣11或3或17.【点评】本题考查平均数、中位数和众数的概念,属基础题.14.某校高三年级10次模考中甲同学的数学成绩从小到大依次排列为94,96,98,98,100,101,101,102,102,103,则甲同学在这10次模考中数学成绩的第40百分位数为99.【考点】百分位数.【专题】计算题;转化思想;综合法;简易逻辑;运算求解.【答案】99.【分析】根据百分位数的定义直接计算即可.【解答】解:因为10×40%=4,所以第40百分位数为第四、五两数的平均数即为98+1002故答案为:99.【点评】本题考查百分位数的求解,是基础题.15.某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组[2,4),[4,6),[6,8),[8,10),[10,12]抽样结果绘成的频率分布直方图如图所示,则实数a=0.14.【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【答案】0.14.【分析】由频率分布直方图结合频率和为1可得答案.【解答】解:根据题意可得:(0.04+0.12+0.15+a+0.05)×2=1,解得a=0.14.故答案为:0.14.【点评】本题考查频率分布直方图的性质,属基础题.16.已知男、女生共有200人,其中女生有80人,按性别采用分层随机抽样的方法从这200人中抽取25人,则这25人中男生有15人.【考点】分层随机抽样的比例分配与各层个体数及抽取样本量.【专题】对应思想;定义法;概率与统计;运算求解.【答案】15.【分析】根据分层随机抽样的定义求解即可.【解答】解:根据题意男生有120人,按照分层随机抽样的方法,男生应该抽取120×25故答案为:15.【点评】本题考查分层随机抽样的定义,属于基础题.四.解答题(共4小题)17.某校生物科技班开展“核酸自组装”实验,记录200名学生在限制性末端配对实验中的操作表现:组别操作评级合计优良男生35100女生45合计200(1)完成列联表,依据α=0.01的独立性检验,能否认为学生组别与操作评级存在关联?(2)在后续的“环状核酸构建”实验中,需处理n(n∈N*)条线性核酸片段:每条片段有两个末端;每次随机选取2个未配对的末端进行连接;连接后可能形成一个或多个环状结构,所有核酸片段末端连接完毕视为结束.(i)当n=3时,记随机变量X为最终形成的环状结构数,求X的分布列与数学期望;(ii)求证:所有核酸片段连接成一个完整环状结构的概率为2n附:χ2=n(ad-bc)2(aα0.050.010.0050.001xα3.8416.6357.87910.828【考点】独立性检验.【专题】对应思想;定义法;概率与统计;运算求解.【答案】(1)列联表为:组别操作评级合计优良男生6535100女生4555100合计11090200能认为学生组别与操作评级有关联;(2)(i)分布列为:X123P81525115数学期望为E(X)=1×8(ii)记末端编号为1,2,3,⋯,2n,可与末端1连接形成一个环状结构的末端有2n﹣2种可能,假设末端1与末端3连接,那么相当于剩下的n﹣1条线性核酸片段进行连接,记n(n∈N*)条线性核酸片段连接后可形成环状结构的种数为an,那么经过一次连接后,剩下的n﹣1条线性核酸片段连接后可形成环状结构的种数为an﹣1,则a1=1,an=(2n﹣2)an﹣1,则an又a1=1也满足上式,∴an因为对2n个末端进行任意2个末端连接,共有N=则P=即所有核酸片段连接成一个完整环状结构的概率为2n【分析】(1)补充列联表,再计算卡方值比较即可;(2)(i)利用组合公式和古典概型公式计算概率,得到分布列,利用公式计算数学期望即可;(ii)记n(n∈N*)条线性核酸片段连接后可形成环状结构的种数为an,利用累乘法得an=2n-1⋅(n-1)!【解答】解:(1)根据题意,已知记录了200名学生在限制性末端配对实验中的操作表现,则列联表为:组别操作评级合计优良男生6535100女生4555100合计11090200零假设H0:组别与操作评级没有关联,经计算得χ2依据小概率值α=0.01的独立性检验,推断H0不成立,即有99.5%的把握认为组别与操作评级有关联;(2)(i)已知n=3,则最终形成的环状结构数X的所有可能取值为1,2,3,P(则其分布列为:X123P81525115则最终形成的环状结构数X数学期望E((ii)证明:记末端编号为1,2,3,⋯,2n,可与末端1连接形成一个环状结构的末端有2n﹣2种可能,假设末端1与末端3连接,那么相当于剩下的n﹣1条线性核酸片段进行连接,记n(n∈N*)条线性核酸片段连接后可形成环状结构的种数为an,那么经过一次连接后,剩下的n﹣1条线性核酸片段连接后可形成环状结构的种数为an﹣1,则a1=1,an=(2n﹣2)an﹣1,则an又a1=1也满足上式,∴an因为对2n个末端进行任意2个末端连接,共有N=所以P=即所有核酸片段连接成一个完整环状结构的概率为2n【点评】本题考查独立性检验以及离散型随机变量的分布列以及数学期望相关知识,属于中档题.18.随机抽取某集团公司旗下五家超市,得到广告支出x(万元)与销售额y(万元)的数据如下:广告支出x(万元)24568销售额y(万元)2030506070(1)计算x,y的相关系数r,并判断是否可以认为广告支出与销售额具有较高的线性相关程度?(若0.3<|r|<0.75,则线性相关程度一般;若|r|≥0.75,则线性相关程度较高,344≈18.55(2)求出y关于x的线性回归方程,并预测若广告支出15(万元),则销售额约为多少万元?参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为b̂=i=1n【考点】一元线性回归模型;样本相关系数.【专题】对应思想;定义法;概率与统计;运算求解.【答案】(1)r=0.97,可以认为广告支出与销售额具有较高的线性相关程度;(2)y=9x+1,销售额为136万元.【分析】(1)根据相关系数公式求出相关系数即可判断.(2)根据公式求出â【解答】解:(1)根据表格里的数据可得:y=x=i=1i=15(xi-x)(yi-y)=(2-5)(20-46)+(4-5)(30-46)+(5﹣5)(50﹣46)+(6﹣5)(60﹣i=1r=所以可以认为广告支出与销售额具有较高的线性相关程度;(2)根据公式可得:b̂=i所以y关于x的线性回归方程为ŷ当广告支出15万元时,销售额约为ŷ【点评】本题考查线性回归直线方程相关知识,属于中档题.19.某学校为了研究学生的数学成绩与物理成绩是否有关联,随机抽取了500名学生的成绩数据,得到如下2×2列联表:单位:人物理成绩数学成绩合计优秀不优秀优秀9060150不优秀160190350合计250250500(1)记数学成绩优秀者中物理成绩不优秀的概率为P,求P的值;(2)依据小概率值α=0.01的独立性检验,能否认为学生的数学成绩与物理成绩有关系?参考公式:χ2=n(ad-bc)2(a临界值表:α0.050.010.001xα3.8416.63510.828【考点】独立性检验.【专题】转化思想;综合法;概率与统计;运算求解.【答案】(1)1625(2)认为学生的数学成绩与物理成绩有关联.【分析】(1)根据列联表以及古典概型的概率计算公式即可求解;(2)先进行零假设,然后计算出卡方值,根据独立性检验的思想判断即可.【解答】解:(1)数学成绩优秀者有250人,在这250人中物理成绩不优秀的有160人,所以P=(2)零假设为H0:学生的数学成绩与物理成绩无关联,χ2根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为学生的数学成绩与物理成绩有关联,此推断犯错误的概率不大于0.01.【点评】本题考查了独立性检验,属于基础题.20.2024年奥运会在巴黎举行,中国代表团获得了40枚金牌,27枚银牌,24枚铜牌,共91枚奖牌,取得了境外举办奥运会的最好成绩,运动员的拼搏精神给人们留下了深刻印象.为了增加学生对奥运知识的了解,弘扬奥运精神,某校组织高二年级学生进行了奥运知识能力测试.根据测试成绩,将所得数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,其频率分布直方图如图所示.(1)求该样本的第75百分位数;(2)试估计本次奥运知识能力测试成绩的平均分;(3)该校准备对本次奥运知识能力测试成绩不及格(60分以下)的学生,采用按比例分配的分层随机抽样方法抽出5名同学,再从抽取的这5名同学中随机抽取2名同学进行情况了解,求这2名同学分数在[40,50),[50,60)各一人的概率【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【答案】见试题解答内容【分析】(1)根据百分位数定义结合题意计算即可;(2)根据频率直方图中的平均数计算方法求解即可;(3)利用分层抽样、列举法及古典概型即可求解.【解答】(1)根据频率分布直方图可得:(0.01+0.015+0.015+a+0.025+0.005)×10=1,解得:a=0.030;∵0.1+0.15+0.15+0.3<0.75,0.1+0.15+0.15+0.3+0.25>0.75∴该样本的第75百分位数在区间[80,90)内,∴设该样本的第75百分位数为x,则可得方程:0.1+0.15+0.15+0.3+(x﹣80)×0.025=0.75,解得:x=82,∴该样本的第75百分位数为82.(2)∵45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,∴本次奥运知识能力测试成绩的平均分为71.(3)采用分层抽样从[40,50)和[50,60)抽取5名同学,∵0.1:0.15=2:3,则应在成绩为[40,50)的学生中抽取2人,记为a,b;在成绩为[50,60)的学生中抽取3人,记为A,B,C;再从抽取的这5名同学中随机抽取2名同学有如下结果,(a,b),(a,A),(a,B),(a,C),(b,A),(b,B),(b,C),(A,B),(A,C),(B,C)共10种可能结果;其中在[40,50),[50,60)各一人的共6种;∴所求概率P=则这2名同学分数在[40,50),[50,60)各一人的概率为35【点评】本题考查了百分位数定义,频率直方图,分层抽样、列举法及古典概型,属于中档题.
考点卡片1.正态分布曲线的特点及曲线所表示的意义【知识点的认识】1.正态曲线及性质(1)正态曲线的定义函数φμ,σ(x)=12πσe-(x-μ)22σ2,x∈(﹣∞,+∞),其中实数μ和(2)正态曲线的解析式①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).②解析式中含有两个常数:π和e,这是两个无理数.③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.④解析式前面有一个系数为12πσ,后面是一个以e为底数的指数函数的形式,幂2.正态分布(1)正态分布的定义及表示如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=abφμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,(2)正态总体在三个特殊区间内取值的概率值①P(μ﹣σ<X≤μ+σ)=0.6826;②P(μ﹣2σ<X≤μ+2σ)=0.9544;③P(μ﹣3σ<X≤μ+3σ)=0.9974.3.正态曲线的性质正态曲线φμ,σ(x)=12πσe(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值12(4)曲线与x轴围成的图形的面积为1;(5)当σ一定时,曲线随着μ的变化而沿x轴平移;(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.4.三个邻域会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.【解题方法点拨】正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.【命题方向】题型一:概率密度曲线基础考察典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)=18πA.10与8B.10与2C.8与10D.2与10解析:由18πe-(x-10)答案:B.典例2:已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6B.0.4C.0.3D.0.2解析:由P(ξ<4)=0.8知P(ξ>4)=P(ξ<0)=0.2,故P(0<ξ<2)=0.3.故选C.典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.6826,则P(X>4)等于()A.0.1588B.0.1587C.0.1586D.0.1585解析由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣12P(2≤X≤4)=0.5-12×0.6826=题型二:正态曲线的性质典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为14(1)求该正态分布的概率密度函数的解析式;(2)求正态总体在(﹣4,4]的概率.分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数μ,σ的值,其中μ决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关.解(1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于y轴对称,即μ=0.由12πσ=1φμ,σ(x)=142πe-x2(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)=P(μ﹣σ<X≤μ+σ)=0.6826.点评:解决此类问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变化对曲线的影响.典例2:设两个正态分布N(μ1,σ12)(σ1>0)和N(μ2,σ22)(σ2>0A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ2解析:根据正态分布N(μ,σ2)函数的性质:正态分布曲线是一条关于直线x=μ对称,在x=μ处取得最大值的连续钟形曲线;σ越大,曲线的最高点越低且较平缓;反过来,σ越小,曲线的最高点越高且较陡峭,故选A.答案:A.题型三:服从正态分布的概率计算典例1:设X~N(1,22),试求(1)P(﹣1<X≤3);(2)P(3<X≤5);(3)P(X≥5).分析:将所求概率转化到(μ﹣σ,μ+σ].(μ﹣2σ,μ+2σ]或[μ﹣3σ,μ+3σ]上的概率,并利用正态密度曲线的对称性求解.解析:∵X~N(1,22),∴μ=1,σ=2.(1)P(﹣1<X≤3)=P(1﹣2<X≤1+2)=P(μ﹣σ<X≤μ+σ)=0.6826.(2)∵P(3<X≤5)=P(﹣3<X≤﹣1),∴P(3<X≤5)=12[P(﹣3<X≤5)﹣P(﹣1<X≤3=12[P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2=12[P(μ﹣2σ<X≤μ+2σ)﹣P(μ﹣σ<X≤μ+σ=12×(0.9544=0.1359.(3)∵P(X≥5)=P(X≤﹣3),∴P(X≥5)=12[1﹣P(﹣3<X≤5=12[1﹣P(1﹣4<X≤1+4=12[1﹣P(μ﹣2σ<X≤μ+2σ=12×(1﹣0.9544求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知概率的三个区间上.典例2:随机变量ξ服从正态分布N(1,σ2),已知P(ξ<0)=0.3,则P(ξ<2)=.解析:由题意可知,正态分布的图象关于直线x=1对称,所以P(ξ>2)=P(ξ<0)=0.3,P(ξ<2)=1﹣0.3=0.7.答案:0.7.题型4:正态分布的应用典例1:2011年中国汽车销售量达到1700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了1200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量ξ服从正态分布N(8,σ2),已知耗油量ξ∈[7,9]的概率为0.7,那么耗油量大于9升的汽车大约有辆.解析:由题意可知ξ~N(8,σ2),故正态分布曲线以μ=8为对称轴,又因为P(7≤ξ≤9)=0.7,故P(7≤ξ≤9)=2P(8≤ξ≤9)=0.7,所以P(8≤ξ≤9)=0.35,而P(ξ≥8)=0.5,所以P(ξ>9)=0.15,故耗油量大于9升的汽车大约有1200×0.15=180辆.点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x轴之间的曲边梯形的面积,根据正态密度曲线的对称性,当P(ξ>x1)=P(ξ<x2)时必然有x1+典例2:工厂制造的某机械零件尺寸X服从正态分布N(4,19),问在一次正常的试验中,取1000个零件时,不属于区间(3,5]解∵X~N(4,19),∴μ=4,σ=∴不属于区间(3,5]的概率为P(X≤3)+P(X>5)=1﹣P(3<X≤5)=1﹣P(4﹣1<X≤4+1)=1﹣P(μ﹣3σ<X≤μ+3σ)=1﹣0.9974=0.0026≈0.003,∴1000×0.003=3(个),即不属于区间(3,5]这个尺寸范围的零件大约有3个.2.分层随机抽样的比例分配与各层个体数及抽取样本量【知识点的认识】﹣比例分配:根据每层在总体中的比例分配样本量.﹣计算:每层样本量=总样本量×层的比例.【解题方法点拨】﹣确定每层样本的分配比例,并计算各层的样本量.【命题方向】﹣重点考察分层随机抽样中样本量的分配问题.3.由分层随机抽样的样本平均数估计总体平均数【知识点的认识】﹣样本平均数估计总体平均数:将各层的样本平均数按层的比例加权求和得到总体的估计值.【解题方法点拨】﹣使用加权平均的方法计算总体的估计值,权重为各层样本量的比例.【命题方向】﹣主要考察如何从样本数据估计总体特征的问题.4.频率分布直方图的应用【知识点的认识】﹣应用:用于数据的分布可视化,帮助分析数据集中趋势、离散程度等.【解题方法点拨】﹣分析:通过直方图观察数据的分布特征,识别数据的集中区域和离散程度.【命题方向】﹣重点考察如何解读频率分布直方图及其对数据分析的贡献.5.散点图【知识点的认识】1.散点图的概念:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.2.曲线拟合的概念:从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.3.正相关和负相关:(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.6.折线统计图【知识点的认识】﹣折线统计图:用于显示数据随时间或其他变量变化的趋势,x轴表示时间或变量,y轴表示数值.【解题方法点拨】﹣绘制:连接数据点的线段展示数据的变化趋势.﹣调整:根据数据点间的变化设置线条样式.【命题方向】﹣重点考察数据趋势的可视化和折线图的解读.7.扇形统计图【知识点的认识】﹣扇形统计图:用于展示各部分在整体中所占比例,通常为圆形图,分成若干扇形.【解题方法点拨】﹣绘制:根据数据的比例分配扇形区域的角度.﹣调整:标注每个扇形的类别和百分比.【命题方向】﹣主要考察扇形图的制作和数据比例的表示.8.用样本估计总体的集中趋势参数【知识点的认识】1.众数、中位数、平均数众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(3)平均数:一组数据的算术平均数,即x=2.众数、中位数、平均数的优缺点【解题方法点拨】众数、中位数、平均数的选取:(1)平均数能较好地反映一组数据的总体情况;(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);(3)众数能反映一组数据的集中情况(即多数水平).根据频率分布直方图估算众数、中位数、平均数:(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.9.平均数【知识点的认识】﹣平均数:数据集中所有值的算术平均,计算公式为x=【解题方法点拨】﹣计算:求出数据集中所有值的总和,再除以数据的个数.【命题方向】﹣主要考察平均数的计算和解释.10.中位数【知识点的认识】﹣中位数:数据集中将数据分为两部分的中间值,数据需按顺序排列.【解题方法点拨】﹣计算:对于奇数个数据,中位数为中间值;对于偶数个数据,中位数为中间两个值的平均.【命题方向】﹣考察中位数的计算和在数据分析中的应用.11.众数【知识点的认识】﹣众数:数据集中出现频率最高的值.【解题方法点拨】﹣计算:找出数据集中出现次数最多的值.【命题方向】﹣主要考察众数的计算及其在数据分析中的意义.12.方差【知识点的认识】﹣方差:标准差的平方,衡量数据离均值的变异程度.【解题方法点拨】﹣计算:直接使用方差的公式σ2【命题方向】﹣主要考察方差的计算及其在数据变异分析中的作用.13.极差【知识点的认识】﹣极差:数据集中最大值与最小值的差异,计算公式为极差=最大值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广西来宾市合山市低收入居民家庭经济状况核对中心招聘见习人员1人(4.1)考试备考题库及答案解析
- 2026中国空气干燥净化机行业营销动态与需求前景预测报告
- 2026福建南平市消防救援局招聘政府专职消防员19人备考题库及一套完整答案详解
- 2026西藏昌都市左贡县青年就业见习招聘30人备考题库及答案详解一套
- 2026广西柳州鱼峰区里雍镇卫生院招聘2人备考题库含答案详解(能力提升)
- 2026合肥源创新人才发展有限公司社会招聘5人备考题库及答案详解(名校卷)
- 2026洞头海霞青年营度假酒店招聘5人备考题库(浙江)及参考答案详解(能力提升)
- 2026广东广州市政务服务中心编外人员招聘备考题库及完整答案详解一套
- 2026人民日报文化传媒有限公司贵州分公司招聘2人备考题库含答案详解(培优)
- 2026春季山东济宁市鱼台邮政校园招聘备考题库附参考答案详解(综合题)
- JG/T 336-2011混凝土结构修复用聚合物水泥砂浆
- 低压电工培训教材
- 安桥功放TX-SR508使用说明书
- 2024年版《输变电工程标准工艺应用图册》
- 2024年全科主治医师西医考试知识总结
- APQC跨行业流程分类框架(PCF)V7.4版-2024年8月21日版-雷泽佳编译
- 大数据与人工智能营销智慧树知到期末考试答案章节答案2024年南昌大学
- 数学脑筋急转弯-脑筋急转弯题目及答案大全
- 化工行业大数据分析与应用
- 工艺管道安装施工方案及工艺管道焊接方案
- 民事检察监督申请书
评论
0/150
提交评论