




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复习课(一)统计抽样方法的选取及应用此类问题多以选择题、填空题的形式考查,有时与概率问题相结合以解答题的形式出现,难度偏小,属中、低档题1三种抽样方法(1)简单随机抽样:是抽样中一个最基本的方法逐一不放回地抽取一次抽取所有样本和抽取样本检查后放回样本都不是简单随机抽样(2)系统抽样:按照简单随机抽样抽取第一个样本,然后按相同的间隔(即抽样距)抽取其他样本(3)分层抽样:将总体分成若干层,在各层中按照所占比例随机抽取一定的样本2三种抽样方法的适用原则(1)看总体是否由差异明显的几个层组成若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样(2)看总体容量和样本容量的大小当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样典例(1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90B100C180 D300(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3 B4C5 D6解析(1)设样本中的老年教师人数为x,则,解得x180,选C.(2)第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在139,151上恰有4组,故有4人,选B.答案(1)C(2)B类题通法(1)分层抽样中容量的计算分层抽样的特点是“按比例抽样”,即.(2)系统抽样中个体编号的确定系统抽样的特点是“等距抽样”,即第一段抽取的是编号为i的个体,则第k段抽取的是第k段中的第i个(3)当总体容量或其中某层中的个体数使得不能恰好按比例或等距抽取时,应该采取简单随机抽样的方法剔除若干个体后再进行1某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法 B系统抽样法C分层抽样法 D随机数法解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法2有20位同学,编号从1至20,现在从中抽取4人做问卷调查,用系统抽样的方法确定所抽的编号可能为()A3,8,13,18B2,6,10,14C2,4,6,8 D5,8,11,14解析:选A总体个体数是20,样本容量为4,因此分段间隔k5,只有选项A中的数据的分段间隔为5.3某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_解析:设男生抽取x人,则有,解得x25.答案:254某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为_解析:若设高三学生数为x,则高一学生数为,高二学生数为300,所以有x3003 500,解得x1 600.故高一学生数为800,因此应抽取高一学生数为8.答案:8用样本的频率分布估计总体分布此类问题多以选择题、填空题的形式考查频率分布直方图、茎叶图等,属中、低档题有时与概率等知识相结合以解答题的形式出现1频率分布直方图2茎叶图典例(1)对一批产品的长度(单位:毫米)进行抽样检测,如图为检测结果的频率分布直方图根据标准, 产品长度在区间20,25)上为一等品,在区间15,20)和25,30)上为二等品,在区间10,15)和30,35上为三等品用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()A0.09 B0.20C0.25 D0.45(2)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()(3)某电子商务公司对10 000名网络购物者2015年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示直方图中的a_;在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_解析(1)由频率分布直方图的性质可知,样本数据在区间25,30)上的频率为15(0.020.040.060.03)0.25,则二等品的频率为0.250.0450.45,故任取1件为二等品的概率为0.45.(2)由茎叶图知,各组频数统计如下表:分组区间0,5)5,10)10,15)15,20)20,25)25,30)30,35)35,40频数统计11424332上表对应的频率分布直方图为A.(3)由0.11.50.12.50.1a0.12.00.10.80.10.21,解得a3.区间0.3,0.5)内的频率为0.11.50.12.50.4,故0.5,0.9内的频率为10.40.6.因此,消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.答案(1)D(2)A(3)36 000类题通法(1)茎叶图与频率分布表的关系如下:频率分布表中的分组茎叶图的茎;频率分布表中指定区间组的频率茎上叶的数目(2)频率分布直方图中计算用到的知识:图中小矩形的面积组距频率所有小矩形的面积之和为1.1如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A0.2 B0.4C0.5 D0.6解析:选B由茎叶图可知数据落在区间22,30)内的频数为4,所以数据落在区间22,30)内的频率为0.4,故选B.2某地教育部门为了调查学生在数学考试中的有关信息,从上次参加考试的10 000名考生中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图所示),则这10 000人的数学成绩在140,150(单位:分)段的约是_人解析:设500人的数学成绩在140,150段的人数为x,10 000人的数学成绩在140,150段的人数为n.由样本频率分布直方图知数学成绩在140,150段的频率是相应小矩形的面积,即0.008100.08,x40.又样本的个数占总体个数的,即每组的抽样比为,n800,因此10 000人的数学成绩在140,150段的约是800人答案:800用样本的数字特征估计总体的数字特征此类问题主要以选择题、填空题形式考查平均数、方差等数字特征的计算,有时与其他知识结合出现在解答题中1有关数据的数字特征2众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势典例(1)重庆市2015年各月的平均气温()数据的茎叶图如图,则这组数据的中位数是()A.19 B20C21.5 D23(2)某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据计算中样本的均值和方差s2.36名工人中年龄在s与s之间有多少人?所占的百分比是多少(精确到0.01%)?解析(1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20.答案:B(2)解:36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n2(n1,2,9),其年龄数据为:44,40,36,43,36,37,44,43,37.由均值公式知:40,由方差公式知:s2(4440)2(4040)2(3740)2.因为s2,s,所以36名工人中年龄在s和s之间的人数等于年龄在区间37,43上的人数,即40,40,41,39,共23人所以36名工人中年龄在s和s之间的人数所占的百分比为100%63.89%.类题通法通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计(1)一般情况下,需要将平均数和标准差结合,得到更多样本数据的信息,从而对总体作出较好的估计因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况(2)若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()A BC D解析:选B法一:甲29,乙30,甲s乙故可判断结论正确法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论正确,故选B.2若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8 B15C16 D32解析:选C已知样本数据x1,x2,x10的标准差为s8,则s264,数据2x11,2x21,2x101的方差为22s22264,所以其标准差为2816,故选C.3(新课标全国卷)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表图B地区用户满意度评分的频数分布表满意度评分分组50,60)60,70)70,80)80,90)90,100频数2814106(1)在图中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由解:(1)如图所示通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散(2)A地区用户的满意度等级为不满意的概率大记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”由直方图得P(CA)的估计值为(0.010.020.03)100.6,P(CB)的估计值为(0.0050.02)100.25.所以A地区用户的满意度等级为不满意的概率大.变量的相关性此类问题既有选择题、填空题,也有解答题,主要考查线性回归方程的求法及应用1最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法2线性回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数典例(1)(福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ybxa,其中b0.76,ab.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元(2)(重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810求y关于t的回归方程ybta;用所求回归方程预测该地区2015年(t6)的人民币储蓄存款解析(1)由题意知,10,8,a80.76100.4,当x15时,y0.76150.411.8(万元)答案:B(2)解:列表计算如下:itiyittiyi11515226412337921448163255102550153655120这里n5,i3,i7.2.又n25553210,iyin120537.212,从而b1.2,ab7.21.233.6,故所求回归方程为y1.2t3.6.将t6代入回归方程可预测该地区2015年的人民币储蓄存款为y1.263.610.8(千亿元)类题通法线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算1(新课标全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关解析:选D对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.2以下是某地搜集到的新房屋的销售价格y和房屋面积x的数据:房屋面积x(m2)11511080135105销售价格y(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格解:(1)数据对应的散点图如下图所示:(2)i109,(xi)21 570,i23.2,(xi)(yi)308.设所求回归直线方程为ybxa,则b0.196 2,ab23.21090.1 9621.814 2.故回归直线方程为y0.196 2x1.814 2,回归直线在(1)中的散点图中(3)据(2)知当x150 m2时,销售价格估计为:y0.196 21501.814 231.244 231.2(万元)1某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:X12345fa0.20.45bc若所抽取的20件日用品,等级系数为4的恰有3件,等级系数为5的恰有2件,则a,b,c的值分别为()A无法确定 B0.2,0.75,0.05C0.1,0.15,0.1 D0.2,0.15,0.1解析:选C由频率分布表得a0.20.45bc1,即abc0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,所以b0.15,c0.1,从而a0.35bc0.1.所以a0.1,b0.15,c0.1.2已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数相同,则图中的mn()A.3 B5C8 D11解析:选D根据茎叶图,得乙的中位数是33,甲的中位数也是33,即m3;甲的平均数甲(273933)33,乙的平均数是乙(20n323438)33,n8,mn11.故选D.3对于下列表格所示的五个散点,已知求得的线性回归直线方程为y0.8x155.x196197200203204y1367m则实数m的值为()A8 B8.2C8.4 D8.5解析:选A因为回归直线过样本点的中心(,),又 (196197200203204)200,(1367m),所以把(,)代入y0.8x155可得,0.8200155,解得m8.4某中学高中部有300名学生为了研究学生的周平均学习时间,从中抽取了60名学生,先统计了他们某学期的周平均学习时间(单位:小时),再将学生的周平均学习时间分成5组:40,50),50,60),60,70),70,80),80,90,并加以统计,得到如图所示的频率分布直方图则高中部学生的周平均学习时间为(同一组中的数据用该组区间的中点值作代表)()A63.5小时 B62.5小时C63小时 D60小时解析:选A在高中部抽取的60名学生中,周平均学习时间分别落在40,50),50,60),60,70),70,80),80,90的人数依次为6,15,24,12,3.所以高中部学生的周平均学习时间为(645155524651275385)6063.5(小时)故选A.5某学校随机抽查了本校20名同学平均每天在课外从事体育锻炼的时间(单位:分钟),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是0,5),5,10),35,40,作出频率分布直方图如图所示,则原始的茎叶图可能是()解析:选B根据频率分布直方图,样本数据位于区间15,20)内的有200.0252个,位于区间20,25)内的有200.0454个,据此检验只可能是选项B.6气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ”现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数)甲地:5个数据的中位数为24,众数为22;乙地:5个数据的中位数为27,总体平均数为24;丙地:5个数据中有一个数据是32,总体平均数为26,总体方差为10.8.则肯定进入夏季的地区有()A0个 B1个C2个 D3个解析:选C甲地肯定进入,因为众数为22,所以22至少出现两次,若有一天低于22 ,则中位数不可能为24;丙地肯定进入,令x为其中某天的日平均温度,则10.85(3226)218(x26)2,若x21,上式显然不成立;乙地不一定进入,如13,23,27,28,29.故选C.7为了解某市甲、乙、丙三所学校高三数学模拟考试成绩,采取分层抽样方法,从甲校的1 260份试卷、乙校的720份试卷、丙校的900份试卷中进行抽样调研若从丙校的900份试卷中抽取了45份试卷,则这次调研共抽查的试卷份数为_解析:抽取比例为,故抽取的试卷份数为(1 260720900)144.答案:1448一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是_,_.解析:由题意得原来数据的平均数是801.281.2,方差不变,仍是4.4.答案:81.24.49利用随机数表法对一个容量为500,编号为000,001,002,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开始由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),根据下表,读出的第3个数是_18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71解析:最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.答案:11410为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图(如图所示)已知图中从左到右前三个小组的频率分别为0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电竞教练岗位面试问题及答案
- 创业培训师岗位面试问题及答案
- 冲压件销售员岗位面试问题及答案
- 在线教育班主任岗位面试问题及答案
- 河北省巨鹿县第二中学2025年高二化学第二学期期末学业质量监测模拟试题含解析
- 江西省赣州市宁都县第三中学2025届高二下化学期末综合测试试题含解析
- 2025届辽宁省葫芦岛市协作校高二化学第二学期期末质量跟踪监视模拟试题含解析
- 公共投资项目管理办法
- 民间捐赠资金管理办法
- 2026届高三复习之阅读理解-议论文(复习讲义)(带解析)
- 银行安全培训
- 医学教育中的临床试验实践教学探索
- 《烟花爆竹安全》课件
- 2025年四川省成都市新都区特需人才引进34人历年高频重点模拟试卷提升(共500题附带答案详解)
- 低血糖危像症状及救治护理课件
- 2025年四川省成都经开区(龙泉驿区)面向社会公开招聘卫生事业单位工作人员32人历年管理单位笔试遴选500模拟题附带答案详解
- 梅毒课件完整版本
- 中国文化概论知识试题与答案版
- 《改善思维转变观念》课件
- 工地各项人员岗位职责(2篇)
- 《中国胃食管反流病诊疗规范》(2023版)解读课件
评论
0/150
提交评论