版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1页(共1页)2026年高考数学复习热搜题速递之统计(2025年12月)一.选择题(共8小题)1.某学校高一、高二、高三年级的学生人数分别为900、900、1200人,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高三年级抽取的学生人数为()A.15 B.20 C.25 D.302.已知变量x和y满足关系y=﹣0.1x+1,变量y与z正相关,下列结论中正确的是()A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关3.已知变量x与变量y之间具有相关关系,并测得如下一组数据:x681012y6532则变量x与y之间的线性回归直线方程可能为()A.y^=0.7x﹣2.3 B.y^=-C.y^=-10.3x+0.7 D.y^=4.其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表).年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到回归方程ŷ=1.03xA.6.1 B.6.28 C.6.5 D.6.85.已知x与y之间的几组数据如表:x123456y021334假设根据上表数据所得线性回归直线方程为ŷ=b̂x+â,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=A.b̂>b′,â>a′ B.b̂>b′,â<a′ C.b̂<b′,â6.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r37.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且ŷ=2.347x﹣②y与x负相关且ŷ=-3.476x③y与x正相关且ŷ=5.437x④y与x正相关且ŷ=-4.326x﹣其中一定不正确的结论的序号是()A.①② B.②③ C.③④ D.①④8.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D.6二.多选题(共4小题)(多选)9.若某地区规定在一段时间内没有发生大规模群体病毒感染的标准为“连续10天,每天新增疑似病例不超过7人”,根据该地区下列过去10天新增疑似病例的相关数据,可以认为该地区没有发生大规模群体感染的是()A.平均数为2,中位数为3 B.平均数为1,方差大于0.5 C.平均数为2,众数为2 D.平均数为2,方差为3(多选)10.已知一组样本数据x1,x2,…,xn(x1<x2<…<xn),现有一组新的数据x1+x22,xA.平均数不变 B.中位数不变 C.极差变小 D.方差变小(多选)11.下列说法正确的有()A.已知一组数据x1,x2,x3,⋯,x10的方差为3,则x1+2,x2+2,x3+2,⋯,x10+2的方差也为3 B.对具有线性相关关系的变量x,y,其线性回归方程为ŷ=0.3x-m,若样本点的中心为(m,2.8),则实数m的值是C.已知随机变量X服从正态分布N(μ,σ2),若P(X>﹣1)+P(X≥5)=1,则μ=2 D.已知随机变量X服从二项分布B(n,13),若E(3X+1)=(多选)12.我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是()A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.调查样本中倾向选择生育二胎的群体中,男性人数与女性人数相同 D.倾向选择不生育二胎的群体中,农村户籍人数多于城镇户籍人数三.填空题(共4小题)13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程ŷ=0.67x零件数x个1020304050加工时间y(min)62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为.14.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.15.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.16.甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测,若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.四.解答题(共4小题)17.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.P(x2≥k)0.1000.0500.0100.001k2.7063.8416.63510.828(Ⅰ)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(Ⅱ)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=n(n1118.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x:y1:12:13:44:519.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数82042228B配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数412423210(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)20.A,B两组各有7位病人,他们服用某种药物后的康复时间(单位:天)记录如下:A组:10,11,12,13,14,15,16B组;12,13,15,16,17,14,a假设所有病人的康复时间相互独立,从A,B两组随机各选1人,A组选出的人记为甲,B组选出的人记为乙.(Ⅰ)求甲的康复时间不少于14天的概率;(Ⅱ)如果a=25,求甲的康复时间比乙的康复时间长的概率;(Ⅲ)当a为何值时,A,B两组病人康复时间的方差相等?(结论不要求证明)
2026年高考数学复习热搜题速递之统计(2025年12月)参考答案与试题解析一.选择题(共8小题)题号12345678答案BABACADB二.多选题(共4小题)题号9101112答案ADACDACAB一.选择题(共8小题)1.某学校高一、高二、高三年级的学生人数分别为900、900、1200人,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高三年级抽取的学生人数为()A.15 B.20 C.25 D.30【考点】分层随机抽样.【专题】概率与统计;数据分析.【答案】B【分析】根据分层抽样的定义即可得到结论.【解答】解:三个年级的学生人数比例为3:3:4,按分层抽样方法,在高三年级应该抽取人数为50×故选:B.【点评】本题主要考查分层抽样的应用,根据条件确定抽取比例是解决本题的关键,比较基础.2.已知变量x和y满足关系y=﹣0.1x+1,变量y与z正相关,下列结论中正确的是()A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y正相关,x与z负相关 D.x与y负相关,x与z正相关【考点】变量间的相关关系.【专题】概率与统计.【答案】A【分析】由题意,根据一次项系数的符号判断相关性,由y与z正相关,设y=kz,k>0,得到x与z的相关性.【解答】解:因为变量x和y满足关系y=﹣0.1x+1,一次项系数为﹣0.1<0,所以x与y负相关;变量y与z正相关,设,y=kz,(k>0),所以kz=﹣0.1x+1,得到z=-0.1kx+1k,一次项系数小于故选:A.【点评】本题考查由线性回归方程,正确理解一次项系数的符号与正相关还是负相关的对应是解题的关键.3.已知变量x与变量y之间具有相关关系,并测得如下一组数据:x681012y6532则变量x与y之间的线性回归直线方程可能为()A.y^=0.7x﹣2.3 B.y^=-C.y^=-10.3x+0.7 D.y^=【考点】经验回归方程与经验回归直线.【专题】计算题;对应思想;定义法;概率与统计.【答案】B【分析】根据表中数据,计算x、y,再根据变量y随变量x的增大而减小,是负相关,验证回归直线方程是否过过样本中心点(x,y)即可.【解答】解:根据表中数据,得;x=14(6+8+10+12y=14(6+5+3+2且变量y随变量x的增大而减小,是负相关,所以,验证x=9时,y^=-0.7×9+10.3即回归直线y^=-0.7x+10.3过样本中心点(x,故选:B.【点评】本题考查了线性回归方程过样本中心点的应用问题,是基础题目.4.其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表).年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到回归方程ŷ=1.03xA.6.1 B.6.28 C.6.5 D.6.8【考点】经验回归方程与经验回归直线.【专题】转化思想;概率与统计.【答案】A【分析】由题意求出x,代入到回归直线方程y,即可求解污损处的数据.【解答】解:由表中数据:x=1回归方程ŷ=1.03x∴ŷ=1.03×4+1.13=∴y=1解得:?=6.1.故选:A.【点评】本题考查了线性回归方程的求法及应用,属于基础题.5.已知x与y之间的几组数据如表:x123456y021334假设根据上表数据所得线性回归直线方程为ŷ=b̂x+â,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=A.b̂>b′,â>a′ B.b̂>b′,â<a′ C.b̂<b′,â【考点】经验回归方程与经验回归直线.【专题】压轴题;概率与统计.【答案】C【分析】由表格总的数据可得n,x,y,进而可得i=1nxi2-nx2,和i=1n【解答】解:由题意可知n=6,x=1n故i=1nxi2-nx2=91﹣6故可得b̂=i=1而由直线方程的求解可得b′=0-21-2=2,把(1,0)代入可得a比较可得b̂<b′,a故选:C.【点评】本题考查线性回归方程的求解,涉及由两点求直线方程,属中档题.6.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3【考点】样本相关系数.【专题】概率与统计.【答案】A【分析】根据题目给出的散点图,先判断是正相关还是负相关,然后根据点的集中程度分析相关系数的大小.【解答】解:由给出的四组数据的散点图可以看出,图1和图3是正相关,相关系数大于0,图2和图4是负相关,相关系数小于0,图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于﹣1,由此可得r2<r4<r3<r1.故选:A.【点评】本题考查了两个变量的线性相关,考查了相关系数,散点分布在左下角至右上角,说明两个变量正相关;分布在左上角至右下角,说明两个变量负相关,散点越集中在一条直线附近,相关系数越接近于1(或﹣1),此题是基础题.7.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且ŷ=2.347x﹣②y与x负相关且ŷ=-3.476x③y与x正相关且ŷ=5.437x④y与x正相关且ŷ=-4.326x﹣其中一定不正确的结论的序号是()A.①② B.②③ C.③④ D.①④【考点】经验回归方程与经验回归直线.【专题】规律型;数据分析.【答案】D【分析】由题意,可根据回归方程的一次项系数的正负与正相关或负相关的对应对四个结论作出判断,得出一定不正确的结论来,从而选出正确选项.【解答】解:①y与x负相关且ŷ=2.347x﹣②y与x负相关且ŷ③y与x正相关且ŷ=5.437x+8.493;④y与x正相关且ŷ综上判断知,①④是一定不正确的故选:D.【点评】本题考查线性回归方程,正确理解一次项系数的符号与正相关还是负相关的对应是解题的关键,本题是记忆性的基础知识考查题,较易8.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D.6【考点】系统抽样方法;茎叶图.【专题】概率与统计.【答案】B【分析】对各数据分层为三个区间,然后根据系统抽样方法从中抽取7人,得到抽取比例为15【解答】解:由已知,将个数据分为三个层次是[130,138],[139,151],[152,153],根据系统抽样方法从中抽取7人,得到抽取比例为15所以成绩在区间[139,151]中共有20名运动员,抽取人数为20×15故选:B.【点评】本题考查了茎叶图的认识以及利用分层抽样抽取个体的方法;关键是正确分层,明确抽取比例.二.多选题(共4小题)(多选)9.若某地区规定在一段时间内没有发生大规模群体病毒感染的标准为“连续10天,每天新增疑似病例不超过7人”,根据该地区下列过去10天新增疑似病例的相关数据,可以认为该地区没有发生大规模群体感染的是()A.平均数为2,中位数为3 B.平均数为1,方差大于0.5 C.平均数为2,众数为2 D.平均数为2,方差为3【考点】用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数.【专题】计算题;对应思想;定义法;概率与统计;运算求解.【答案】AD【分析】根据给定条件,利用平均数、中位数、方差的意义计算推理判断A,D;举例说明判断B,C作答.【解答】解:对于A,因10个数的平均数为2,中位数为3,将10个数从小到大排列,设后面4个数从小到大依次为a,b,c,d,显然有d≥c≥b≥a≥3,而a+b+c+d≤14,则d的最大值为5,A符合条件;对于B,平均数为1,方差大于0.5,可能存在大于7的数,如连续10天的数据为:0,0,0,0,0,0,0,0,0,10,其平均数为1,方差大于0.5,B不符合;对于C,平均数为2,众数为2,可能存在大于7的数,如连续10天的数据为:0,0,0,2,2,2,2,2,2,8,其平均数为2,众数为2,C不符合;对于D,设连续10天的数据为xi,i∈N*,i≤10,因平均数为2,方差为3,则有110i=110(xi-2)2=3,于是得(xi﹣2)2≤30,而xi∈N,i∈N*,i≤10,因此xi≤7,故选:AD.【点评】本题考查了求平均数、众数、中位数与方差的问题,是中档题.(多选)10.已知一组样本数据x1,x2,…,xn(x1<x2<…<xn),现有一组新的数据x1+x22,xA.平均数不变 B.中位数不变 C.极差变小 D.方差变小【考点】用样本估计总体的离散程度参数;用样本估计总体的集中趋势参数.【专题】整体思想;综合法;概率与统计;运算求解.【答案】ACD【分析】由平均数、中位数、极差及方差的概念计算即可.【解答】解:对于A项,新数据的总数为:x1+x对于B项,不妨设原数据为:1,2.5,3,则新数据为:1.75,2.75,2,显然中位数变了,故B错误;对于C项,原数据极差为:xn﹣x1,新数据极差为:xn-1+xn2对于D项,由于两组数据的平均数不变,而极差变小,说明新数据相对原数据更集中于平均数,故方差变小,即D项正确.故选:ACD.【点评】本题主要考查了平均数、中位数、极差及方差的计算公式,属于基础题.(多选)11.下列说法正确的有()A.已知一组数据x1,x2,x3,⋯,x10的方差为3,则x1+2,x2+2,x3+2,⋯,x10+2的方差也为3 B.对具有线性相关关系的变量x,y,其线性回归方程为ŷ=0.3x-m,若样本点的中心为(m,2.8),则实数m的值是C.已知随机变量X服从正态分布N(μ,σ2),若P(X>﹣1)+P(X≥5)=1,则μ=2 D.已知随机变量X服从二项分布B(n,13),若E(3X+1)=【考点】经验回归方程与经验回归直线;命题的真假判断与应用;正态分布曲线的特点及曲线所表示的意义.【专题】转化思想;综合法;概率与统计;逻辑思维.【答案】AC【分析】利用方差的性质即可判断选项A,利用线性回归方程必过样本中心,即可判断选项B,利用正态分布曲线的对称性以及μ的意义,即可判断选项C,利用二项分布的数学期望计算公式以及期望的运算性质,即可判断选项D.【解答】解:对于A,因为一组数据x1,x2,x3,⋯,x10的方差为3,由方差的运算性质可知,所以x1+2,x2+2,x3+2,⋯,x10+2的方差也为3,故选项A正确;对于B,线性回归方程为ŷ因为样本点的中心为(m,2.8)在回归方程上,所以2.8=0.3m﹣m,解得m=﹣4,故选项B错误;对于C,因为随机变量X服从正态分布N(μ,σ2),则其密度曲线关于X=μ对称,所以1﹣P(X>﹣1)=P(X≤﹣1),又P(X>﹣1)+P(X≥5)=1,所以P(X≥5)=P(X≤﹣1),则μ=-1+5故选项C正确;对于D,因为随机变量X服从二项分布B(n所以E(X)=1则E(3X+1)=3E(X)+1=n+1,因为E(3X+1)=6,则n+1=6,所以n=5,故选:AC.【点评】本题考查了方差运算性质的应用,线性回归方程必过样本中心的应用,正态分布曲线的对称性以及μ的意义的运用,二项分布的数学期望计算公式以及期望的运算性质的应用,属于中档题.(多选)12.我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是()A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.调查样本中倾向选择生育二胎的群体中,男性人数与女性人数相同 D.倾向选择不生育二胎的群体中,农村户籍人数多于城镇户籍人数【考点】收集数据的方法.【专题】整体思想;数形结合法;概率与统计;运算求解.【答案】AB【分析】由比例图,可得是否倾向选择生育二胎与户籍、性别有关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中的男性人数与女性人数,即可得出结论.【解答】解:由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:在A中,城镇户籍倾向选择生育二胎的比例为40%,农村户籍倾向选择生育二胎的比例为80%,∴是否倾向选择生育二胎与户籍有关,故A正确;在B中,男性倾向选择生育二胎的比例为60%,女性倾向选择生育二胎的比例为60%,∴是否倾向选择生育二胎与性别无关,故B正确;在C中,男性倾向选择生育二胎的比例为60%,人数为120×60%=72人,女性倾向选择生育二胎的比例为60%,人数为80×60%=48人,∴倾向选择生育二胎的人员中,男性人数与女性人数不相同,故C错误;在D中,倾向选择不生育二胎的人员中,农村户籍人数为100×(1﹣80%)=20人,城镇户籍人数为100×(1﹣40%)=60人,∴倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选:AB.【点评】本题考查柱形图的应用,考查运算求解能力、数据处理能力,考查数形结合思想,是基础题.三.填空题(共4小题)13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程ŷ=0.67x零件数x个1020304050加工时间y(min)62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为68.【考点】经验回归方程与经验回归直线.【专题】计算题.【答案】见试题解答内容【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,根据由最小二乘法求得回归方程ŷ【解答】解:设表中有一个模糊看不清数据为m.由表中数据得:x=30,y由于由最小二乘法求得回归方程ŷ将x=30,y=m+3075代入回归直线方程,得m=故答案为:68.【点评】本题考查线性回归方程的应用,解题的关键是正确应用线性回归方程进行预测.14.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是数学.【考点】变量间的相关关系.【专题】概率与统计.【答案】见试题解答内容【分析】(1)根据散点图1分析甲乙两人所在的位置的纵坐标确定总成绩名次;(2)根据散点图2,同一个人的总成绩是不会变的,观察右图中丙的对应的坐标,丙的总成绩在班里倒数第5,再从左图中找出相应的倒数第5名,判断成绩排名即可.【解答】解:①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;②观察散点图,发现丙的总成绩在年级中的名次倒数第5,数学成绩的名次倒数第11,语文成绩的名次倒数第4,丙同学的成绩名次更靠前的科目是数学.故答案为:乙;数学.【点评】本题考查了对散点图的认识;属于基础题.15.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为185cm.【考点】经验回归方程与经验回归直线.【专题】概率与统计.【答案】见试题解答内容【分析】设出解释变量和预报变量;代入线性回归方程公式,求出线性回归方程,将方程中的X用182代替,求出他孙子的身高.【解答】解:设X表示父亲的身高,Y表示儿子的身高则Y随X的变化情况如下;建立这种线性模型:X173170176182Y170176182?用线性回归公式,求解得线性回归方程y=x+3当x=182时,y=185故答案为:185.【点评】本题考查由样本数据,利用线性回归直线的公式,求回归直线方程.16.甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测,若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为1800件.【考点】分层随机抽样.【专题】概率与统计.【答案】见试题解答内容【分析】根据样本容量为80,可得抽取的比例,再求得样本中由乙设备生产的产品数,乙设备生产的产品总数=样本中产品数【解答】解:∵样本容量为80,∴抽取的比例为804800又样本中有50件产品由甲设备生产,∴样本中30件产品由乙设备生产,∴乙设备生产的产品总数为30×60=1800.故答案为:1800.【点评】本题考查了分层抽样方法,熟练掌握分层抽样方法的特征是解题的关键.四.解答题(共4小题)17.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.P(x2≥k)0.1000.0500.0100.001k2.7063.8416.63510.828(Ⅰ)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(Ⅱ)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=n(n11【考点】频率分布直方图的应用.【专题】概率与统计.【答案】见试题解答内容【分析】(I)由分层抽样的特点可得样本中有25周岁以上、下组工人人数,再由所对应的频率可得样本中日平均生产件数不足60件的工人中,25周岁以上、下组工人的人数分别为3,2,由古典概型的概率公式可得答案;(II)由频率分布直方图可得“25周岁以上组”中的生产能手的人数,以及“25周岁以下组”中的生产能手的人数,据此可得2×2列联表,可得k2≈1.79,由1.79<2.706,可得结论.【解答】解:(I)由已知可得,样本中有25周岁以上组工人100×300300+20025周岁以下组工人100×200300+200所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人),故从中随机抽取2名工人所有可能的结果共C52其中至少1名“25周岁以下组”工人的结果共C31故所求的概率为:710(II)由频率分布直方图可知:在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以可得K2=因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.【点评】本题考查独立性检验,涉及频率分布直方图,以及古典概型的概率公式,属中档题.18.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x:y1:12:13:44:5【考点】补全频率分布直方图.【专题】概率与统计.【答案】见试题解答内容【分析】(1)由频率分布直方图的性质可10(2a+0.02+0.03+0.04)=1,解方程即可得到a的值;(2)由平均数加权公式可得平均数为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05,计算出结果即得;(3)按表中所给的数据分别计算出数学成绩在分数段的人数,从总人数中减去这些段内的人数即可得出数学成绩在[50,90)之外的人数.【解答】解:(1)依题意得,10(2a+0.02+0.03+0.04)=1,解得a=0.005;(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分);(3)数学成绩在[50,60)的人数为:100×0.05=5,数学成绩在[60,70)的人数为:100×数学成绩在[70,80)的人数为:100×数学成绩在[80,90)的人数为:100×所以数学成绩在[50,90)之外的人数为:100﹣5﹣20﹣40﹣25=10.【点评】本题考查频率分布估计总体分布,解题的关键是理解频率分布直方图,熟练掌握频率分布直方图的性质,且能根据所给的数据建立恰当的方程求解.19.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数82042228B配方的频数分布表指标值分组[90,94)[94,98)[98,102)[102,106)[106,110]频数412423210(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为y=从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以试验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)【考点】简单随机抽样;用样本估计总体的集中趋势参数;离散型随机变量的均值(数学期望).【专题】计算题;综合题.【答案】见试题解答内容【分析】(I)根据所给的样本容量和两种配方的优质的频数,两个求比值,得到用两种配方的产品的优质品率的估计值.(II)根据题意得到变量对应的数字,结合变量对应的事件和第一问的结果写出变量对应的概率,写出分布列和这组数据的期望值.【解答】解:(Ⅰ)由试验结果知,用A配方生产的产品中优质的频率为22+8∴用A配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B配方生产的产品中优质品的频率为32+10∴用B配方生产的产品的优质品率的估计值为0.42;(Ⅱ)用B配方生产的100件产品中,其质量指标值落入区间[90,94),[94,102),[102,110]的频率分别为0.04,0.54,0.42,∴P(X=﹣2)=0.04,P(X=2)=0.54,P(X=4)=0.42,即X的分布列为X﹣224P0.040.540.42∴X的数学期望值EX=﹣2×0.04+2×0.54+4×0.42=2.68【点评】本题考查随机抽样和样本估计总体的实际应用,考查频数,频率和样本容量之间的关系,考查离散型随机变量的分布列和期望,本题是一个综合问题20.A,B两组各有7位病人,他们服用某种药物后的康复时间(单位:天)记录如下:A组:10,11,12,13,14,15,16B组;12,13,15,16,17,14,a假设所有病人的康复时间相互独立,从A,B两组随机各选1人,A组选出的人记为甲,B组选出的人记为乙.(Ⅰ)求甲的康复时间不少于14天的概率;(Ⅱ)如果a=25,求甲的康复时间比乙的康复时间长的概率;(Ⅲ)当a为何值时,A,B两组病人康复时间的方差相等?(结论不要求证明)【考点】用样本估计总体的离散程度参数;古典概型及其概率计算公式.【专题】概率与统计.【答案】见试题解答内容【分析】设事件Ai为“甲是A组的第i个人”,事件Bi为“乙是B组的第i个人”,由题意可知P(Ai)=P(Bi)=17,i=1,2(Ⅰ)事件等价于“甲是A组的第5或第6或第7个人”,由概率公式可得;(Ⅱ)设事件“甲的康复时间比乙的康复时间长”C=A4B1∪A5B1∪A6B1∪A7B1∪A5B2∪A6B2∪A7B2∪A7B3∪A6B6∪A7B6,易得P(C)=10P(A4B1),易得答案;(Ⅲ)由方差的公式可得.【解答】解:设事件Ai为“甲是A组的第i个人”,事件Bi为“乙是B组的第i个人”,由题意可知P(Ai)=P(Bi)=17,i=1,2(Ⅰ)事件“甲的康复时间不少于14天”等价于“甲是A组的第5或第6或第7个人”∴甲的康复时间不少于14天的概率P(A5∪A6∪A7)=P(A5)+P(A6)+P(A7)=3(Ⅱ)设事件C为“甲的康复时间比乙的康复时间长”,则C=A4B1∪A5B1∪A6B1∪A7B1∪A5B2∪A6B2∪A7B2∪A7B3∪A6B6∪A7B6,∴P(C)=P(A4B1)+P(A5B1)+P(A6B1)+P(A7B1)+P(A5B2)+P(A6B2)+P(A7B2)+P(A7B3)+P(A6B6)+P(A7B6)=10P(A4B1)=10P(A4)P(B1)=(Ⅲ)当a为11或18时,A,B两组病人康复时间的方差相等.【点评】本题考查古典概型及其概率公式,涉及概率的加法公式和方差,属基础题.
考点卡片1.命题的真假判断与应用【知识点的认识】判断含有“或”、“且”、“非”的复合命题的真假,首先要明确p、q及非p的真假,然后由真值表判断复合命题的真假.注意:“非p”的正确写法,本题不应将“非p”写成“方程x2﹣2x+1=0的两根都不是实根”,因为“都是”的反面是“不都是”,而不是“都不是”,要认真区分.【解题方法点拨】1.判断复合命题的真假,常分三步:先确定复合命题的构成形式,再指出其中简单命题的真假,最后由真值表得出复合命题的真假.2.判断一个“若p则q”形式的复合命题的真假,不能用真值表时,可用下列方法:若“pq”,则“若p则q”为真;而要确定“若p则q”为假,只需举出一个反例说明即可.3.判断逆命题、否命题、逆否命题的真假,有时可利用原命题与逆否命题同真同假,逆命题与否命题同真同假这一关系进行转化判断.【命题方向】该部分内容是《课程标准》新增加的内容,几乎年年都考,涉及知识点多而且全,多以小题形式出现.2.古典概型及其概率计算公式【知识点的认识】1.定义:如果一个试验具有下列特征:(1)有限性:每次试验可能出现的结果(即基本事件)只有有限个;(2)等可能性:每次试验中,各基本事件的发生都是等可能的.则称这种随机试验的概率模型为古典概型.*古典概型由于满足基本事件的有限性和基本事件发生的等可能性这两个重要特征,所以求事件的概率就可以不通过大量的重复试验,而只要通过对一次试验中可能出现的结果进行分析和计算即可.2.古典概率的计算公式如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是1n如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m【解题方法点拨】1.注意要点:解决古典概型的问题的关键是:分清基本事件个数n与事件A中所包含的基本事件数.因此要注意清楚以下三个方面:(1)本试验是否具有等可能性;(2)本试验的基本事件有多少个;(3)事件A是什么.2.解题实现步骤:(1)仔细阅读题目,弄清题目的背景材料,加深理解题意;(2)判断本试验的结果是否为等可能事件,设出所求事件A;(3)分别求出基本事件的个数n与所求事件A中所包含的基本事件个数m;(4)利用公式P(A)=mn求出事件3.解题方法技巧:(1)利用对立事件、加法公式求古典概型的概率(2)利用分析法求解古典概型.3.离散型随机变量的均值(数学期望)【知识点的认识】1、离散型随机变量的期望数学期望:一般地,若离散型随机变量ξ的概率分布则称Eξ=x1p1+x2p2+…+xnpn+…为ξ的数学期望,简称期望.数学期望的意义:数学期望离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平.平均数与均值:一般地,在有限取值离散型随机变量ξ的概率分布中,令p1=p2=…=pn,则有p1=p2=…=pn=1n,Eξ=(x1+x2+…+xn)×1期望的一个性质:若η=aξ+b,则E(aξ+b)=aEξ+b.4.正态分布曲线的特点及曲线所表示的意义【知识点的认识】1.正态曲线及性质(1)正态曲线的定义函数φμ,σ(x)=12πσe-(x-μ)22σ2,x∈(﹣∞,+∞),其中实数μ和σ(σ>(2)正态曲线的解析式①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).②解析式中含有两个常数:π和e,这是两个无理数.③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.④解析式前面有一个系数为12πσ,后面是一个以e为底数的指数函数的形式,幂指数为2.正态分布(1)正态分布的定义及表示如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=abφμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,(2)正态总体在三个特殊区间内取值的概率值①P(μ﹣σ<X≤μ+σ)=0.6826;②P(μ﹣2σ<X≤μ+2σ)=0.9544;③P(μ﹣3σ<X≤μ+3σ)=0.9974.3.正态曲线的性质正态曲线φμ,σ(x)=12πσe-(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值12π(4)曲线与x轴围成的图形的面积为1;(5)当σ一定时,曲线随着μ的变化而沿x轴平移;(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.4.三个邻域会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.【解题方法点拨】正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.【命题方向】题型一:概率密度曲线基础考察典例1:设有一正态总体,它的概率密度曲线是函数f(x)的图象,且f(x)=18πeA.10与8B.10与2C.8与10D.2与10解析:由18πe-(x-10)28=1答案:B.典例2:已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6B.0.4C.0.3D.0.2解析:由P(ξ<4)=0.8知P(ξ>4)=P(ξ<0)=0.2,故P(0<ξ<2)=0.3.故选C.典例3:已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.6826,则P(X>4)等于()A.0.1588B.0.1587C.0.1586D.0.1585解析由正态曲线性质知,其图象关于直线x=3对称,∴P(X>4)=0.5﹣12P(2≤X≤4)=0.5-12×0.6826=题型二:正态曲线的性质典例1:若一个正态分布的概率密度函数是一个偶函数,且该函数的最大值为14(1)求该正态分布的概率密度函数的解析式;(2)求正态总体在(﹣4,4]的概率.分析:要确定一个正态分布的概率密度函数的解析式,关键是求解析式中的两个参数μ,σ的值,其中μ决定曲线的对称轴的位置,σ则与曲线的形状和最大值有关.解(1)由于该正态分布的概率密度函数是一个偶函数,所以其图象关于y轴对称,即μ=0.由12πσ=14φμ,σ(x)=142πe-x(2)P(﹣4<X≤4)=P(0﹣4<X≤0+4)=P(μ﹣σ<X≤μ+σ)=0.6826.点评:解决此类问题的关键是正确理解函数解析式与正态曲线的关系,掌握函数解析式中参数的取值变化对曲线的影响.典例2:设两个正态分布N(μ1,σ12)(σ1>0)和N(μ2,σ22)(σ2>0A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ2解析:根据正态分布N(μ,σ2)函数的性质:正态分布曲线是一条关于直线x=μ对称,在x=μ处取得最大值的连续钟形曲线;σ越大,曲线的最高点越低且较平缓;反过来,σ越小,曲线的最高点越高且较陡峭,故选A.答案:A.题型三:服从正态分布的概率计算典例1:设X~N(1,22),试求(1)P(﹣1<X≤3);(2)P(3<X≤5);(3)P(X≥5).分析:将所求概率转化到(μ﹣σ,μ+σ].(μ﹣2σ,μ+2σ]或[μ﹣3σ,μ+3σ]上的概率,并利用正态密度曲线的对称性求解.解析:∵X~N(1,22),∴μ=1,σ=2.(1)P(﹣1<X≤3)=P(1﹣2<X≤1+2)=P(μ﹣σ<X≤μ+σ)=0.6826.(2)∵P(3<X≤5)=P(﹣3<X≤﹣1),∴P(3<X≤5)=12[P(﹣3<X≤5)﹣P(﹣1<X≤3=12[P(1﹣4<X≤1+4)﹣P(1﹣2<X≤1+2=12[P(μ﹣2σ<X≤μ+2σ)﹣P(μ﹣σ<X≤μ+σ=12×(0.9544=0.1359.(3)∵P(X≥5)=P(X≤﹣3),∴P(X≥5)=12[1﹣P(﹣3<X≤5=12[1﹣P(1﹣4<X≤1+4=12[1﹣P(μ﹣2σ<X≤μ+2σ=12×(1﹣0.9544求服从正态分布的随机变量在某个区间取值的概率,只需借助正态曲线的性质,把所求问题转化为已知概率的三个区间上.典例2:随机变量ξ服从正态分布N(1,σ2),已知P(ξ<0)=0.3,则P(ξ<2)=.解析:由题意可知,正态分布的图象关于直线x=1对称,所以P(ξ>2)=P(ξ<0)=0.3,P(ξ<2)=1﹣0.3=0.7.答案:0.7.题型4:正态分布的应用典例1:2011年中国汽车销售量达到1700万辆,汽车耗油量对汽车的销售有着非常重要的影响,各个汽车制造企业积极采用新技术降低耗油量,某汽车制造公司为调查某种型号的汽车的耗油情况,共抽查了1200名车主,据统计该种型号的汽车的平均耗油为百公里8.0升,并且汽车的耗油量ξ服从正态分布N(8,σ2),已知耗油量ξ∈[7,9]的概率为0.7,那么耗油量大于9升的汽车大约有辆.解析:由题意可知ξ~N(8,σ2),故正态分布曲线以μ=8为对称轴,又因为P(7≤ξ≤9)=0.7,故P(7≤ξ≤9)=2P(8≤ξ≤9)=0.7,所以P(8≤ξ≤9)=0.35,而P(ξ≥8)=0.5,所以P(ξ>9)=0.15,故耗油量大于9升的汽车大约有1200×0.15=180辆.点评:服从正态分布的随机变量在一个区间上的概率就是这个区间上,正态密度曲线和x轴之间的曲边梯形的面积,根据正态密度曲线的对称性,当P(ξ>x1)=P(ξ<x2)时必然有x1+典例2:工厂制造的某机械零件尺寸X服从正态分布N(4,19),问在一次正常的试验中,取1000个零件时,不属于区间(3,5]解∵X~N(4,19),∴μ=4,σ=∴不属于区间(3,5]的概率为P(X≤3)+P(X>5)=1﹣P(3<X≤5)=1﹣P(4﹣1<X≤4+1)=1﹣P(μ﹣3σ<X≤μ+3σ)=1﹣0.9974=0.0026≈0.003,∴1000×0.003=3(个),即不属于区间(3,5]这个尺寸范围的零件大约有3个.5.简单随机抽样【知识点的认识】1.定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.特点:(1)有限性:总体个体数有限;(2)逐个性:每次只抽取一个个体;(3)不放回:抽取样本不放回,样本无重复个体;(4)等概率:每个个体被抽到的机会相等.(如果从个体数为N的总体中抽取一个容量为n的样本,则每个个体被抽取的概率等于nN3.适用范围:总体中个数较少.4.注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素.【解题方法点拨】1.抽签法(抓阄法)一般地,从个体总数为N的总体中抽取一个容量为k的样本,步骤为:(1)编号:将总体中所有个体编号(号码可以为1﹣N);(2)制签:将编号写在形状、大小相同的号签上(可用小球、卡片、纸条等制作);(3)搅匀:将号签放在同一个箱子中进行均匀搅拌;(4)抽签:每次从箱中取出1个号签,连续抽取k次;(5)取样:从总体中取出与抽到号签编号一致的个体.2.随机数表法.〇随机数表:由0﹣9十个数字所组成,其中的每个数都是用随机方法产生的,这样的表称为随机数表.〇随机数表法:按一定的规则到随机数表中选取号码的抽样方法叫做随机数表法.实现步骤:(1)编号:对总体中所有个体编号(每个号码位数一致);(2)选数:在随机数表中任选一个数作为开始;(3)取数:从选定的起始数沿任意方向取数(不在号码范围内的数、重复出现的数不取),直到取满为止;(4)取样:根据所得的号码从总体中抽取相应个体.【命题方向】以基本题(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考查学生学习基础知识、应用基础知识、解决实际问题的能力.(1)考查简单随机抽样的特点例:用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m被抽到的概率为()A.1100B.120C.199分析:依据简单随机抽样方式,总体中的每个个体被抽到的概率都是一样的,再结合容量为5,可以看成是抽5次,从而可求得概率.解答:一个总体含有100个个体,某个个体被抽到的概率为1100∴以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为1100×5故选:B.点评:不论用哪种抽样方法,不论是“逐个地抽取”,还是“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的,体现了抽样方法具有客观公平性.(2)判断抽样方法是否为简单随机抽样常见与分层抽样、系统抽样对比,注意掌握各种抽样方法的区分.例:下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签法从10件产品中选取3件进行质量检验.分析:从所给的四个选项里观察因为抽取的个体间的间隔是固定的;得到A、B不是简单随机抽样,因为总体的个体有明显的层次,C不是简单随机抽样,D是简单随机抽样.解答:A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;C不是简单随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.故选D.点评:本题考查简单随机抽样,考查分层抽样,考查系统抽样,是一个涉及到所学的所有抽样的问题,注意发现各种抽样的特点,分析清楚抽样的区别.(3)考查简单随机抽样的抽样方法操作例:利用随机数表法对一个容量为500编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,若选定从第12行第5列的数开始向右读数,(下面摘取了随机数表中的第11行至第15行),根据下图,读出的第3个数是()A.841B.114C.014D.146分析:从随机数表12行第5列数开始向右读,最先读到的1个的编号是389,再向右三位数一读,将符合条件的选出,不符合的舍去,继续向右读取即可.解答:最先读到的1个的编号是389,向右读下一个数是775,775它大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983.舍去,再下一个数是114.读出的第3个数是114.故选B.点评:本题主要考查了抽样方法,随机数表的使用,在随机数表中每个数出现在每个位置的概率是一样的,所以每个数被抽到的概率是一样的,属于基础题.6.分层随机抽样【知识点的认识】1.定义:当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例进行抽样,这种抽样叫做分层抽样,其中所分的各部分叫“层”.2.三种抽样方法比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相同的从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几个部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【解题方法点拨】分层抽样方法操作步骤:(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.【命题方向】(1)区分分层抽样方法例:某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样法B.抽签法C.随机数表法D.分层抽样法分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:总体由男生和女生组成,比例为500:400=5:4,所抽取的比例也是5:4.故选D点评:本小题主要考查抽样方法,属基本题.(2)求抽取样本数例1:某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A.8,8B.10,6C.9,7D.12,4分析:先计算每个个体被抽到的概率,再用每层的个体数乘以每个个体被抽到的概率,即得到该层应抽取的个体数.解答:每个个体被抽到的概率等于1654+42=16,54×16故从一班抽出9人,从二班抽出7人,故选C.点评:本题考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数.例2:某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()A.35B.25C.15D.7分析:先计算青年职工所占的比例,再根据青年职工抽取的人数计算样本容量即可.解答:青年职工、中年职工、老年职工三层之比为7:5:3,所以样本容量为7715故选C.点评:本题考查分层抽样的定义和方法,求出每个个体被抽到的概率,用个体的总数乘以每个个体被抽到的概率,就得到样本容量n的值.7.系统抽样方法【知识点的认识】1.定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.2.系统抽样的特征:(1)当总体容量N较大时,适宜采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此系统抽样又称等距抽样,这里的间隔一般为k=[(3)在第一部分的抽样采用简单随机抽样;(4)每个个体被抽到的可能性相等3.系统抽样与简单随机抽样的关系:(1)系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样;(2)系统抽样和简单随机抽样都是等概率抽样,它是公平的.4.系统抽样与简单随机抽样的优缺点:(1)当总体的个体数较大时,用系统抽样比用简单随机抽样更易实施,更节约成本;(2)系统抽样比简单随机抽样应用范围更广;(3)系统抽样所得到的样本的代表性和个体的编号有关,而简单随机抽样所得到的样本的代表性与编号无关,如果编号的特征随编号的变化呈一定的周期性,可能造成系统抽样的代表性很差.【解题方法点拨】系统抽样的一般步骤:(1)编号:采用随机的方式将总体中的个体编号;(2)分段:确定分段间隔k,对编号进行分段(N为总体个数,n为样本容量):①当Nn∈Z时,k②当Nn∉Z时,通过从总体中剔除一些个体,使剩下的总体中的个体数N′能被n整除,这时(注意这时要重新编号1﹣N′后,才能再分段)(3)确定起始编号:在第一段用简单随机抽样确定起始的个体编号l(l∈N,l≤k);(4)抽样:按事先确定的规则抽取样本,即l,l+k,l+2k,…,l+(n﹣1)k.【命题方向】1.考查系统抽样的定义例:某小礼堂有25排座位,每排有20个座位.一次心理讲座时礼堂中坐满了学生,讲座后为了了解有关情况,留下了座位号是15的25名学生进行测试,这里运用的抽样方法是()A.抽签法B.随机数表法C.系统抽样法D.分层抽样法分析:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,符合系统抽样的定义.解答:由题意可得,从第一排起,每隔20人抽取一个,所抽取的样本的间隔距相等,故属于系统抽样,故选C.点评:本题考查系统抽样的定义和方法,属于容易题.2.考查系统抽样的应用例:将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是分析:根据系统抽样的定义,即可得到结论.解答:∵样本容量为20,首个号码为003,∴样本组距为100÷20=5∴对应的号码数为3+5(x﹣1)=5x﹣2,由48≤5x﹣2≤81,得10≤x≤16.6,即x=10,11,12,13,14,15,16,共7个,故答案为:7.点评:本题主要考查系统抽样的应用,利用系统抽样的定义建立号码关系是解决本题的关键,比较基础.8.收集数据的方法【知识点的认识】数据收集的基本方法:(1)做试验:通过设计一些合适的试验,能够直接地获得样本数据,如统计一颗骰子各点出现的频率,就可做抛掷骰子试验.(2)查阅资料:有些数据不易直接调查到,可通过查阅图书馆文献或通过搜索因特网上的相关资料等办法获得所需数据或相关数据.(3)设计调查问卷:问卷一般由一组有目的、有系统、有顺序的题目组成.9.补全频率分布直方图【知识点的认识】﹣补全:解决直方图中图形或数据缺失的问题.【解题方法点拨】﹣补全:通过对频率分布表的检查,找出并填补直方图中的缺失部分.【命题方向】﹣常见于直方图的制作和数据补全问题中.10.频率分布直方图的应用【知识点的认识】﹣应用:用于数据的分布可视化,帮助分析数据集中趋势、离散程度等.【解题方法点拨】﹣分析:通过直方图观察数据的分布特征,识别数据的集中区域和离散程度.【命题方向】﹣重点考察如何解读频率分布直方图及其对数据分析的贡献.11.茎叶图【知识点的认识】1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50得分表示成茎叶图如下:2.茎叶图的优缺点:优点:(1)所有信息都可以从茎叶图上得到(2)茎叶图便于记录和表示缺点:分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.【解题方法点拨】茎叶图的制作步骤:(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分(2)将最小的茎和最大的茎之间的数按小大次序排成一列(3)将各个数据的叶按大小次序写在茎右(左
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大都市辐射对区域发展的影响以上海市为例(教学课件)地理鲁教版选择性必修()
- 古诗词诵读《书愤》课件统编版高二语文选择性必修中册()
- 市场租赁转让合同范本
- 建材出售租赁合同范本
- Unit4跟音频学词汇课件-人教版八年级英语上册()
- 学校采购五金合同范本
- Unit6Project课件-鲁教版六年级上册英语
- 小米收购诺基亚协议书
- 如何起草合同股份协议
- 抗疫物资捐赠合同范本
- 国际货运代理公司合伙协议书
- 质量安全环保保证协议书
- 北京市朝阳区2023-2024学年七年级上学期期末质量监测历史试卷及答案
- 教代会提案工作培训指南
- 2025年副高卫生职称-临床医学检验学技术-临床医学检验临床化学技术(副高)代码:058历年参考题库典型考点含答案解析
- 电大专科水利水电工程水法规与行政执法试题及答案
- 2025年四川单招试题及答案普高
- 学堂在线 雨课堂 学堂云 生活、艺术与时尚:中国服饰七千年 期末考试答案
- JJF 2254-2025戥秤校准规范
- 硬笔书法全册教案共20课时
- DB 5201∕T 152.2-2025 交通大数据 第2部分:数据资源目录
评论
0/150
提交评论