版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.1.2分层随机抽样9.1.3获取数据的途径学习目标1.通过实例,了解分层随机抽样的特点和适用范围.2.了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.(重点)3.结合具体实例,掌握分层随机抽样的样本平均数.(难点)4.知道并能设计获取数据的基本途径.导语上节课,我们学习了简单随机抽样.知道样本的代表性越好,对于总体情况的反映就越好,所以抽样调查最核心的问题是样本的代表性.简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本.例如,在对某中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法进行改进呢?一、分层随机抽样的定义问题1某市为调查中小学生的近视情况,在全市范围内分别对小学生、初中生、高中生三个群体抽样,进而了解中小学生的总体情况和三个群体近视情况的差异大小.(1)上述问题中样本总体有什么特征?(2)若采用抽签法会出现什么结果?(3)为使抽取的样本更合理,更有代表性,有更好的抽样方法解决该问题吗?提示(1)此总体包含小学生、初中生、高中生三个群体,在年龄、体质等方面存在着明显的差异.(2)抽取的样本可能集中于某一个群体,不具有代表性.(3)有,可分不同群体抽取.知识梳理1.分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2.比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.3.分层随机抽样的特点:(1)从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.(2)分层随机抽样是等可能抽样.用分层随机抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于nN(3)分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也更广泛.注意点:(1)分层随机抽样分层的原则是每层内样本的差异要尽可能小,而层与层之间的差异要尽可能大.(2)根据实际情况,可对每层所抽取的数目进行适当的细微调整.比如,如果计算出的层内抽样数不是整数,可以进行一定的技术处理,比如,将结果取成整数等.例1(1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适()A.抽签法 B.随机数法C.简单随机抽样 D.分层随机抽样答案D解析总体由差异明显的三部分构成,应选用分层随机抽样.(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行()A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同答案C解析为了保证每个个体等可能的被抽取,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.反思感悟使用分层随机抽样的前提分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.跟踪训练1某沙漠地区经过治理,生态系统得到很大改善,野生动物有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,计划从这些地块中抽取20个作为样本,根据现有的统计资料,各地块间植物覆盖面积差异很大,为了让样本具有代表性,以获得该地区这种野生动物数量准确的估计,在下面的抽样方法中,最合理的抽样方法是()A.普查 B.分层随机抽样C.简单随机抽样 D.非以上三种抽样方法答案B解析因为所研究的总体中差异很大,为了让样本具有代表性,最合理的抽样方法是分层随机抽样.二、分层随机抽样的应用比例分配的分层随机抽样的实施步骤:第一步,按某种特征将总体分成若干部分(层);第二步,计算各层所占比例.所占比例=各层总的个体数总体中的个体数第三步,计算各层抽取的个体数,各层抽取的个体数=总样本量×各层所占比例;第四步,按简单随机抽样从各层抽取样本;第五步,综合每层抽样,组成样本.注意点:在分层随机抽样中,各层分别抽取样本时仍需采用简单随机抽样的方法进行.例2一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,用比例分配的分层随机抽样应该怎样抽取?解用比例分配的分层随机抽样法来抽取样本,步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500=15,则在不到35岁的职工中抽取125×15=25(在35岁至49岁的职工中抽取280×15=56(人)在50岁及50岁以上的职工中抽取95×15=19(人)(3)在各层中分别按简单随机抽样的方法抽取样本.(4)汇总每层抽取的样本,组成总体的样本.反思感悟在比例分配的分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本量与总体容量之比.跟踪训练2交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做比例分配的分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808C.1212 D.2012答案B解析因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12,所以抽取驾驶员的抽样比为1296=1所以这四个社区驾驶员的总人数N=(12+21+25+43)÷18三、用分层随机抽样的样本平均数估计总体平均数问题2在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数X和样本平均数x与第2层的总体平均数Y和样本平均数y,该如何计算?提示X=X1+X2+x=x1+x2+Y=Y1+Y2+y=y1+y2+知识梳理在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为x,y,第1层和第2层的总体平均数分别为X,Y,总体平均数为W,样本平均数为w,则W=MM+NX+NM+NY,w=m例3高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.(1)如果张华按比例分配的分层随机抽样的方法抽取样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高;(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?解(1)抽取男生人数为490490+510×100=49,抽取女生人数为510490+510高二年级全体学生的平均身高估计为49100×170.2+51100×160.8=165.406≈165.4(cm(2)仍按(1)方式进行估计,即49100×170.2+51100×160.8≈165.4(cm反思感悟进行比例分配的分层随机抽样的相关计算时,常用到的3个关系如下:(1)样本量总体容量=该层抽取的个体数(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;(3)样本的平均数和各层的样本平均数的关系为w=mm+nx+nm跟踪训练3某校高二有重点班学生400人,普通班学生800人,为调查总体学生数学成绩的平均数,用比例分配的分层随机抽样方法,从重点班抽出20人,从普通班抽出40人,通过计算重点班平均成绩为125分,普通班平均成绩为95分,则高二总体学生数学成绩的平均分为()A.110分 B.125分C.95分 D.105分答案D解析高二总体学生数学成绩的平均分为20×125+40×9560四、获取数据的基本途径问题3我们日常中有哪些获取数据的方法和途径呢?提示通过调查获取数据,通过试验获取数据,通过观察获取数据,通过查询获得数据等.知识梳理获取数据的基本途径获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象借助专业测量设备通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗”数据,去伪存真例4(1)粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常巨大的.某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是()A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据答案C解析该地的气象记录和本次的降雨量数据都是通过观察获取的.(2)为了研究近年来我国高等教育发展的状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是()A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据答案D解析因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.反思感悟选择获取数据的途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.跟踪训练4(1)“中国天眼”为500米口径球面射电望远镜(Five⁃hundred⁃meterApertureSphericalradioTelescope,简称“FAST”),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是()A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据答案C解析“中国天眼”主要是通过观察获取数据.(2)要得到某乡镇的贫困人口数据,应采取的方法是()A.通过调查获取数据 B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据答案A解析某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据.五、获取数据途径的方法的设计例5为了缓解城市的交通拥堵情况,某市准备出台限制私家车出行的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?说明理由.解不能.理由如下:调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.反思感悟在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.跟踪训练5某公司想调查一下本公司员工对某项规章制度的意见,由于本公司车间工人工作任务繁重,负责该项事务的公司办公室人员向本公司的50名中层及以上领导干部派发了问卷,统计后便得到了调查意见,公司办公室人员获得数据的途径是什么?你认为该调查结果具有代表性吗?为什么?解通过调查获取数据,该调查结果不具有代表性,因为只对中层及以上领导干部调查,结果一定是片面的.1.知识清单:(1)分层随机抽样的定义.(2)分层随机抽样的应用.(3)用分层随机抽样的样本平均数估计总体平均数.(4)获取数据的基本途径.(5)获取数据途径的方法的设计.2.方法归纳:(1)数据分析法.(2)获取数据有四种基本途径:①调查;②试验;③观察;④查询.3.常见误区:(1)在分层随机抽样中,要想每个个体被抽到的可能性相等,需进行比例分配.(2)对获取数据的背景缺乏了解,采用不合适的方法获取数据.1.影响获取数据可靠程度的因素不包括()A.获取数据方法的设计B.所用专业测量设备的精度C.调查人员的认真程度D.数据的大小答案D解析数据的大小不影响获取数据的可靠程度.2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用比例分配的分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A.9 B.10C.12 D.13答案D解析∵360=n120+80+60,∴3.(多选)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人,甲就读高一,乙就读高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样B.若用比例分配的分层随机抽样,则高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力答案ABD解析由于各年级的年龄段不一样,因此应采用分层随机抽样,A正确;由于比例为23520×50+30×45=110,因此若用比例分配的分层随机抽样,则应从高一年级1000人中抽取100人,高二年级1350人中抽取135人,B正确;甲、乙被抽到的可能性都是14.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班各抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为分.
答案108解析样本中40名学生的平均分为2040×110+2040×106=108(分),所以该组合学生的平均成绩约为108课时对点练[分值:100分]单选题每小题5分,共25分;多选题每小题6分,共24分1.若要研究某班级家庭的收入情况,获取数据的途径应该是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据答案A解析因为要研究的某班级家庭的收入情况属于有限总体问题,所以获取数据的途径应该是通过调查获取数据.2.①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草本三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测.上述两项调查应采用的抽样方法是()A.①用简单随机抽样,②用分层随机抽样B.①用简单随机抽样,②用简单随机抽样C.①用分层随机抽样,②用简单随机抽样D.①用分层随机抽样,②用分层随机抽样答案C解析①乔木、灌木、草本分类明显,可以采用分层随机抽样;②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样.3.某校有老师200人,男学生1200人,女学生1000人,现用比例分配的分层随机抽样的方法从所有师生中抽取一个容量为n的样本.已知从女生中抽取80人,则n等于()A.80 B.100C.192 D.200答案C解析因为80∶1000=8∶100,所以n∶(200+1200+1000)=8∶100,所以n=192.4.共享单车为人们提供了一种新的出行方式,有关部门对使用共享单车人群的年龄分布进行了统计,得到的数据如表所示:年龄12~20岁20~30岁30~40岁40岁及以上比例14%45.5%34.5%6%为调查共享单车使用满意率情况,现采用比例分配的分层随机抽样的方法从中抽取容量为200的样本进行调查,那么应抽取20~30岁的人数为()A.12 B.28C.69 D.91答案D解析由比例分配的分层随机抽样的定义得应抽取20~30岁的人数为200×45.5%=91.5.(多选)下列关于抽样的说法正确的是()A.总体的个体数不多时宜用简单随机抽样B.在对分层随机抽样的每一部分进行抽样时,采用的是简单随机抽样C.分层随机抽样的整个抽样过程中,每个个体被抽取的可能性相等(有剔除时例外)D.百货商场的抽奖活动是抽签法答案ABD解析总体的个体数不多时宜用简单随机抽样,A正确;对分层随机抽样的每一层进行抽样时,采用的是简单随机抽样,B正确;分层随机抽样的整个抽样过程中,每个个体被抽取的可能性相等(有剔除时可能性也相等),C错误;百货商场的抽奖活动是抽签法,也叫抓阄,D正确.6.(多选)某运动队由足球运动员12人,篮球运动员18人,乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若采用比例分配的分层随机抽样的方法,且不用删除个体,则样本量n的取值不可能是()A.24 B.20C.6 D.5答案BD解析由题意得12∶18∶6=2∶3∶1,则n要为6的倍数,故B,D不满足要求.7.(多选)某旅行社分年龄段统计了前往某景区的老、中、青年旅客的人数比为5∶2∶3,现使用比例分配的分层随机抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到90人,则下列说法正确的是()A.被抽到的老年旅客和中年旅客人数之和超过200B.n=300C.中年旅客抽到40人D.老年旅客抽到150人答案ABD解析由题意从这些旅客中随机抽取n名,青年旅客抽到90人,则35+2+3×n=90,所以n=300,故B正确;则中年旅客抽到25+2+3×300=60(人),故C错误;老年旅客抽到55+2+3×300=150(人),故D正确;被抽到的老年旅客和中年旅客人数之和为150+60=210,超过200,故8.(5分)某分层随机抽样中,有关数据如表:样本量平均数第1层454第2层358此样本的平均数为.
答案5.75解析此样本的平均数为4545+35×4+3545+359.(5分)《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出钱.(结果保留整数)
答案17解析依照钱的多少按比例出钱,则丙应出180560+350+180×100≈17(钱)10.(10分)某高级中学共有学生3000名,各年级男、女生的人数如表:高一年级高二年级高三年级女生487xy男生513560z已知高二年级女生比高一年级女生多53人.(1)问高二年级有多少名女生?(3分)(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取300名学生,问应从高三年级抽取多少名学生?(7分)解(1)由x-487=53得x=540,所以高二年级有540名女生.(2)高三年级人数为y+z=3000-(487+513+540+560)=900,所以9003000×300=90,故应从高三年级抽取90名学生11.某学校高一、高二、高三学生分别有1200名、1000名、800名,现在让学生对餐厅服务进行评价,高一、高二、高三年级的好评率分别为75%,80%,85%,那么学生对餐厅的好评率约是()A.78% B.79%C.80% D.81%答案B解析由分层随机抽样的平均数可知,学生对餐厅的好评率约为75%×12003000+80%×10003000+85%×12.(多选)某高校大一新生中,来自东部地区的学生有2400人、中部地区的学生有1600人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列判断正确的有()A.用比例分配的分层随机抽样的方法分别抽取东部地区学生48人、中部地区学生32人、西部地区学生20人B.用比例分配的分层随机抽样的方法从新生中抽取100人最适合C.若用比例分配的分层随机抽样的方法抽取,西部地区学生小刘被抽中的可能性为1D.若用比例分配的分层随机抽样的方法抽取,中部地区学生小张被抽中的可能性为1答案ABC解析由题设可得用比例分配的分层随机抽样的方法抽取,东部地区、中部地区、西部地区的学生的抽样比为12∶8∶5,故抽取100人时东部地区、中部地区、西部地区的学生分别为100×1225=48(人),100×825=32(人),100×525=20(人)总体容量较大,且各部分差异明显,用比例分配的分层随机抽样的方法从新生中抽取100人最适合,故B正确;由比例分配的分层随机抽样的性质可得无论哪一个地区的学生,被
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电气绝缘测试施工工艺
- 泸州老窖销售外包合同
- 苏州佘山小时工外包合同
- 石油企业岗位外包合同
- 钢筋绑扎机操作规程保证措施
- 水利施工方案
- (完整版)施工临时用电专项方案
- 护士五年制职业发展前景
- 广东项目劳务外包合同
- 手机app软件开发外包合同
- 安徽省皖江名校联盟2026届高三5月联考语文试卷(含答案及解析)
- 2026年安徽省淮南市初二学业水平地理生物会考考试试题及答案
- 2026山东青岛大学招聘辅导员6人(博士学位)笔试备考试题及答案解析
- 2026人教版三年级下册道德与法治期末复习知识点总结梳理+教材问答解答
- 第一课 开启美食之旅-教学设计 川教版(2024)信息科技 七年级下册
- (正式版)T∕CPCPA 0017-2026 托育机构婴幼儿回应性照护服务规范
- 中国骨质疏松症诊治指南(2026版)
- 2026年北京市西城区初三一模英语试卷(含答案)
- 电力重大事故隐患判定标准2026版解读
- 北京2025年国家艺术基金管理中心招聘应届毕业生笔试历年参考题库附带答案详解
- GA 270-2009警用服饰帽徽
评论
0/150
提交评论