第1节 随机抽样、统计图表_第1页
第1节 随机抽样、统计图表_第2页
第1节 随机抽样、统计图表_第3页
第1节 随机抽样、统计图表_第4页
第1节 随机抽样、统计图表_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

考试要求1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的样本均值和样本方差.3.理解统计图表的含义.【知识梳理】1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样(除非特殊声明,本章所指的简单随机抽样是指不放回简单随机抽样).(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本.(3)简单随机抽样的常用方法:抽签法和随机数法.2.分层随机抽样(1)分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配的分层随机抽样所获得样本的均值与方差利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为n1,均值为eq\o(x,\s\up6(-))1,方差为seq\o\al(2,1);第二层的样本量为n2,均值为eq\o(x,\s\up6(-))2,方差为seq\o\al(2,2),则总的样本均值eq\o(x,\s\up6(-))=eq\f(n1,n1+n2)eq\o(x,\s\up6(-))1+eq\f(n2,n1+n2)eq\o(x,\s\up6(-))2,总的样本方差s2=eq\f(n1,n1+n2)[seq\o\al(2,1)+(eq\o(x,\s\up6(-))1-eq\o(x,\s\up6(-)))2]+eq\f(n2,n1+n2)[seq\o\al(2,2)+(eq\o(x,\s\up6(-))2-eq\o(x,\s\up6(-)))2].3.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.(2)频率分布表、频率分布直方图的制作步骤及意义[常用结论与微点提醒]1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.3.频率分布直方图中小长方形高=eq\f(频率,组距).【诊断自测】1.思考辨析(在括号内打“√”或“×”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()(2)抽签法和随机数法都是简单随机抽样的方法.()(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()答案(1)×(2)√(3)×(4)√解析(1)简单随机抽样中,每个个体被抽到的机会一样,与先后无关.(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层无关.2.(必修二P222T1)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行调查分析,在这个问题中,被抽取的200名学生成绩是()A.总体 B.个体C.样本 D.样本量答案C解析由题意可得200名学生成绩是样本.3.(必修二P184T1改编)已知23名男生的平均身高是170.6cm,27名女生的平均身高是160.6cm,则这50名学生的平均身高为________cm.答案165.2解析平均身高为eq\f(23,50)×170.6+eq\f(27,50)×160.6=165.2cm.4.已知某一段公路限速70千米/时,现抽取400辆通过这一段公路的汽车的速度,其频率分布直方图如图所示,则这400辆汽车中在该路段超速的有________辆.答案80解析速度在(70,80]内的频率为1-(0.01+0.03+0.04)×10=0.2,所以在(70,80]内的频数为0.2×400=80.故这400辆汽车中在该路段超速的有80辆.考点一简单随机抽样例1(1)(多选)下列抽样方法不是简单随机抽样的是()A.在机器传送带上抽取30件产品作为样本B.从平面直角坐标系中抽取5个点作为样本C.箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,每次任意地拿出1个零件进行质量检验,检验后不再把它放回箱子里,直到抽取10个零件为止D.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查答案AB解析A不是,因为传送带上的产品数量不确定;B不是,因为个体的数量无限;C是,因为满足简单随机抽样的定义;D是,因为一次性抽取和逐个不放回地随机抽取是等价的.(2)总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()第1行78166232080262426252536997280198第2行32049234493582003623486969387481A.19 B.25 C.26 D.27答案B解析由随机数法可知,样本的前5个个体的编号分别为23,20,26,24,25,因此,选出的第5个个体的编号为25.感悟提升1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.(一次性抽取和逐个不放回抽取是等价的)2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).训练1(1)下列抽取样本的方式属于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中抽取5个零件进行质量检验.在抽样时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定其中个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3答案B解析①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③是简单随机抽样.因为这是“一次性”抽取,等价于“逐个不放回”抽取;④不是简单随机抽样.因为不是等可能抽样.故选B.(2)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.eq\f(1,10),eq\f(1,10) B.eq\f(3,10),eq\f(1,5)C.eq\f(1,5),eq\f(3,10) D.eq\f(3,10),eq\f(3,10)答案A解析第一次被抽到,显然为eq\f(1,10);第二次被抽到,首先第一次不能被抽到,第二次才被抽到,可能性为eq\f(9,10)×eq\f(1,9)=eq\f(1,10).考点二分层随机抽样例2(1)(2023·新高考Ⅱ卷改编)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则在初中部和高中部抽取的人数分别为________.答案40,20解析由题意,初中部和高中部学生人数之比为eq\f(400,200)=eq\f(2,1),所以抽取的60名学生中初中部应有60×eq\f(2,3)=40(人),高中部应有60×eq\f(1,3)=20(人).(2)某学校高一年级共有3个班,1班有30人,优秀率为30%,2班有35人,优秀率为60%,3班有35人,优秀率为40%,则该校高一年级学生的优秀率为________.答案44%解析某学校高一年级共有三个班,按优秀率进行评选:1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则高一年级优秀率为eq\f(30×30%+35×60%+35×40%,30+35+35)=44%.(3)为了解学生的课外阅读情况.某校采用比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级抽样人数样本平均数样本方差高一4053.5高二30eq\o(x,\s\up6(-))22高三303seq\o\al(2,3)已知高中三个年级的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数eq\o(x,\s\up6(-))2=________,高三年级学生的样本方差seq\o\al(2,3)=________.答案41.5解析由高中三个年级学生的总样本平均数为4.1,可得eq\f(40×5+30·\o(x,\s\up6(-))2+30×3,40+30+30)=4.1,解得eq\o(x,\s\up6(-))2=4;因为总样本方差为3.14,所以eq\f(40,100)×[3.5+(5-4.1)2]+eq\f(30,100)×[2+(4-4.1)2]+eq\f(30,100)×[seq\o\al(2,3)+(3-4.1)2]=3.14,解得seq\o\al(2,3)=1.5.感悟提升分层抽样中有关计算的方法(1)抽样比=eq\f(该层样本量n,总样本量N)=eq\f(该层抽取的个体数,该层的个体数).(2)在分层随机抽样中,如果第一层的样本量为m,平均值为x,方差为seq\o\al(2,x);第二层的样本量为n,平均值为y,方差为seq\o\al(2,y),则样本的平均值为μ=eq\f(mx+ny,m+n)=eq\f(m,m+n)x+eq\f(n,m+n)y;方差为s2=eq\f(m,m+n)[seq\o\al(2,x)+(μ-x)2]+eq\f(n,m+n)[seq\o\al(2,y)+(μ-y)2].训练2(1)某社区为迎接中秋节,组织了隆重的庆祝活动,为全面了解社区居民的文娱喜好,已知参加活动的老年人、中年人、青年人的人数比为10∶13∶12,如果采用比例分配的分层随机抽样方法从所有人中抽取一个70人的样本进行调查,则应抽取的青年人的人数为()A.20 B.22 C.24 D.26答案C解析由比例分配的分层随机抽样的等比例关系,可得eq\f(12,10+13+12)×70=24.(2)某工厂新、旧两条生产线的产量比为7∶3,为了解该工厂生产的一批产品的质量情况,采用比例分配的分层随机抽样的方法从两条生产线抽取样本并计算得:新生产线生产的产品的质量指标的均值为10,方差为1;旧生产线生产的产品的质量指标的均值为9,方差为2,据此估计该批产品的质量指标的均值为________,方差为________.答案9.71.51解析根据两条生产线的产量比为7∶3,且新生产线质量指标的均值为10,方差为1,旧生产线质量指标的均值为9,方差为2,计算该批产品的质量指标的均值为eq\o(x,\s\up6(-))=eq\f(1,7+3)×(10×7+9×3)=9.7;则所求的方差s2=eq\f(3,7+3)[2+(9-9.7)2]+eq\f(7,7+3)[1+(10-9.7)2]=1.51.考点三统计图表角度1扇形图、条形图例3(多选)某中学组织三个年级的学生进行禁毒知识竞赛.经统计,得到成绩排在前200名学生分布的扇形图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是()A.成绩排在前200名的200人中,高二人数比高三人数多10B.成绩排在第1~50名的50人中,高一人数比高二的多C.成绩排在第51~150名的100人中,高三人数占比可能超过eq\f(1,3)D.成绩排在第51~100名的50人中,高二人数肯定多于23答案AC解析对于A,成绩排在前200名的200人中,高二人数比高三人数多200×(30%-25%)=10,故A正确;对于B,成绩排在第1~50名的50人中,高一人数为200×45%×20%=18,高二和高三的总人数为50-18=32,高二的具体人数不知道,故B错误;对于C,成绩排在第51~150名的100人中,高一人数为90×(0.3+0.4)=63,高二和高三的总人数为100-63=37,所以高三人数占比有可能超过eq\f(1,3),故C正确;对于D,成绩排在第51~100名的50人中,高一学生人数为90×0.3=27,高二人数最多有50-27=23,故D错误.角度2折线图例4(多选)(2024·南京、盐城模拟)新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.下面两图分别是2018年至2023年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则()A.2018~2023年我国新能源汽车年产量逐年增加B.2018~2023年我国新能源汽车年产量的极差为626.4万辆C.2023年我国汽车年总产量超过2700万辆D.2020年我国汽车年总产量低于2019年我国汽车年总产量答案BCD解析对于A,题图1中2020年新能源汽车年产量低于2019年新能源汽车年产量,A错误;对于B,极差为705.8-79.4=626.4(万辆),B正确;对于C,2023年我国汽车年总产量为705.8÷25.6%≈2757(万辆),C正确;对于D,2020年我国汽车年总产量为124.2÷4.8%≈2588(万辆),2019年我国汽车年总产量为127÷4.5%≈2822(万辆),2588<2822,D正确.角度3频率分布直方图例5从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图.(1)直方图中x的值为________;(2)在这些用户中,月用电量落在区间[100,250)内的户数为________.答案(1)0.0044(2)70解析(1)由频率分布直方图知数据落在[200,250)内的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=eq\f(0.22,50)=0.0044.(2)因为数据落在[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,所以所求户数为0.7×100=70.感悟提升1.通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据变化的趋势.3.频率分布直方图的数据特点:(1)频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.训练3(1)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()A.240,18 B.200,20C.240,20 D.200,18答案A解析样本量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.(2)(2024·潍坊调研)将某市高中数学建模竞赛的成绩分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],并整理得到频率分布直方图(如图所示).现按成绩运用分层随机抽样的方法抽取100位同学进行学习方法的问卷调查,则成绩在区间[70,80)内应抽取的人数为()A.10 B.20 C.30 D.35答案D解析由题图得,成绩在区间[70,80)内的频率为0.035×10=0.35,所以成绩在区间[70,80)内应抽取的人数为0.35×100=35.【A级基础巩固】1.下列情况中,适合用全面调查的是()A.检查某人血液中的血脂含量B.调查某地区的空气质量状况C.乘客上飞机前的安检D.调查某市市民对垃圾分类处理的意识答案C解析乘客上飞机前的安检适合用全面调查,只有确认每一名乘客所携带的物品都安全才能保证航班安全.2.从某班50名同学中选出5人参加户外活动,利用随机数法抽取样本时,先将50名同学按01,02,…,50进行编号,然后从随机数表的第1行第5列和第6列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为()注:表为随机数表的第1行与第2行0347437386369647366146986371629774246792428114572042533237321676A.24 B.36 C.46 D.47答案A解析由题知,从随机数表的第1行第5列和第6列数字开始,依次选取43,36,47,46,24.3.要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查购买力的某项指标;(2)从某中学高二年级的10名体育特长生中抽取3人调查学习负担情况.应采取的抽样方法是()A.(1)(2)都用简单随机抽样法B.(1)用分层随机抽样法,(2)用简单随机抽样法C.(1)用简单随机抽样法,(2)用分层随机抽样法D.(1)(2)都用分层随机抽样法答案B解析(1)中收入差距较大,采用分层随机抽样法较合适;(2)中总体容量较小,采用简单随机抽样法较合适.4.为了增强学生的主人翁意识,学校决定召开座谈会征求学生对学校建设的意见和建议,采用分层随机抽样的方法从高一1200人、高二1450人、高三n人中,抽取80人参加座谈会,已知高一年级被抽取的人数为24,那么高三年级人数n为()A.1250 B.1300C.1350 D.1400答案C解析利用分层随机抽样的方法可知抽取比例为eq\f(80,1200+1450+n),又因为高一被抽取的人数为24,所以eq\f(24,1200)=eq\f(80,1200+1450+n),解得n=1350.5.(2024·广州模拟)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为()A.0.96 B.0.94C.0.79 D.0.75答案B解析由题意,总体的均值为eq\f(800,2000)×9+eq\f(1200,2000)×8=8.4,根据分层随机抽样的性质,可得总体的方差为eq\f(800,2000)×[1+(8.4-9)2]+eq\f(1200,2000)×[0.5+(8.4-8)2]=0.544+0.396=0.94.6.(2024·浙江名校联考)某市中小学生人数和近视情况分别如图甲和图乙所示,为了解该地区中小学生近视形成的原因,现用分层随机抽样的方法抽取5%的学生进行调查,则样本量和抽取的高中生近视人数分别为()A.750,100 B.1500,100C.1500,120 D.750,120答案B解析由题意得,样本量为(18500+7500+4000)×0.05=1500,抽取的高中生近视人数为4000×0.05×0.5=100.7.(多选)某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)元的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则一定有600人的支出在[50,60)元答案BC解析在A中,样本中支出在[50,60)元的频率为1-(0.010+0.024+0.036)×10=0.3,故A错误;在C中,n=eq\f(60,0.03×10)=200,故n的值为200,故C正确;在B中,样本中支出不少于40元的人数为200×(0.030+0.036)×10=132,故B正确;在D中,若该校有2000名学生,则可能有600人的支出在[50,60)元,故D错误.8.(多选)(2024·银川质检)某企业2023年12个月的收入与支出数据的折线图如图.已知:利润=收入-支出,根据该折线图,下列说法正确的是()A.该企业2023年1月至6月的总利润低于2023年7月至12月的总利润B.该企业2023年1月至6月的平均收入低于2023年7月至12月的平均收入C.该企业2023年8月至12月的支出持续增长D.该企业2023年11月份的月利润最大答案ABC解析因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入普遍低于7月至12月的收入,故B正确;由折线统计图可知2023年8月至12月的虚线是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.9.某校高三共有10个班,编号分别为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高三(5)班被抽到的概率为a,高三(6)班被抽到的概率为b,则a-b=________.答案0解析由简单随机抽样的定义,知每个个体被抽到的概率相等,故高三(5)班和高三(6)班被抽到的概率均为eq\f(3,10).故a=eq\f(3,10),b=eq\f(3,10),a-b=0.10.一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如表所示(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类型用分层随机抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.答案400解析设该厂这个月共生产轿车n辆,由题意得eq\f(50,n)=eq\f(10,100+300),所以n=2000,则z=2000-100-300-150-450-600=400.11.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案144解析因为初中部女教师占70%,高中部女教师占40%,所以该校女教师的人数为120×0.7+150×0.4=84+60=144.12.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形面积等于其他8个小长方形的面积和的eq\f(2,5),且样本容量为140,则中间一组的频数为________.答案40解析设中间一个小长方形的面积为x,其他8个小长方形的面积和为eq\f(5,2)x,根据频率分布直方图各小长方形的面积之和为1,得x+eq\f(5,2)x=1,则x=eq\f(2,7),即中间一组的频率为eq\f(2,7),所以中间一组的频数为140×eq\f(2,7)=40.【B级能力提升】13.(多选)某市为了解该地小微企业年收入的变化情况,对该地小微企业减免前和减免后的年收入进行了抽样调查.据整理,得到如图所示的频率分布直方图,则下列结论正确的是()减免前减免后A.推行减免政策后,某市小微企业的年收入都有了明显的提高B.推行减免政策后,某市小微企业的平均年收入有了明显的提高C.推行减免政策后,某市小微企业的年收入更加均衡D.推行减免政策后,某市小微企业的年收入没有变化答案BC解析对于A,年收入在[65,70]万元的,减免前的频率为0.011×5=0.055,减免后的频率为0.008×5=0.040,A错误;对于B,减免前占比最多的年收入为[45,50]万元,其次是[40,45]万元,减免后占比最多的为[50,55]万元,其次是[55,60]万元,所以平均年收入也明显提高,B正确;对于C,减免前年收入在[25,30]万元的占比为0.055,而减免后年收入最少的[25,30]万元没有了,变成[35,40]万元,减免前[65,70]万元的占比为0.055,而减免后年收入最多的[65,70]万元的占比为0.040,即减少了,所以年收入更加均衡,C正确;对于D,从图上知年收入有所变化,如收入在[65,70]万元的减少了,而收入在[25,30]万元的减免后没有了,所以收入提高了,D错误.14.(多选)(2024·武汉调研)某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到扇形图如图:则下列结论中正确的是()A.招商引资后,工资性收入较前一年增加B.招商引资后,转移净收入是前一年的1.25倍C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的eq\f(2,5)D.招商引资后,经营净收入较前一年增加了一倍答案AD解析设招商引资前经济收入为M,则招商引资后经济收入为2M.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论