




免费预览已结束,剩余23页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十二章统计第1讲随机抽样28考点梳理1简单随机抽样(1)定义:一般地,从个体数为n的总体中逐个不放回地取出n个个体作为样本(nn),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样的步骤假设要从容量为n的总体中抽取容量为n的样本(1)采用随机的方式将总体中的n个个体编号;(2)将编号接间隔k分段,当是整数时,取k;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数n能被n整除,这时取k,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,lk,l2k,l(n1)k的个体抽出3分层抽样(1)当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(2)分层抽样的步骤将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层抽样(可用简单随机抽样或系统抽样)【助学微博】三个特点(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样考点自测1一支篮球队有男运动员56人,女运动员42人,用分层抽样的方法从全体运动员中抽出一个容量为14的样本,则男,女运动员各抽取的人数为_解析男运动员人数:568,女运动员人数:426.答案8,62(2011山东卷)某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为_解析抽样比为,因此从丙专业应抽取40016(人)答案163若大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为_解析因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为恰当答案简单随机抽样4为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况若用系统抽样法,则抽样间隔和随机剔除的个体数分别为_解析因为923302,所以抽样间隔为3,随机剔除的个体数为2.答案3,25(2012合肥一检)某高中在校学生2 000人为了响应“阳光体育运动”号召,学校举行了跑步和登山比赛活动每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:高一年级高二年级高三年级跑步abc登山xyz其中abc235,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二年级参与跑步的学生中应抽取_人解析样本中参与跑步的人数为:200120.高二年级参与跑步的学生中应抽取人数为:12036.答案36考向一简单随机抽样【例1】 第十六届亚洲运动会于2010年11月12日在广州举行,广州某大学为了支持亚运会,从报名的60名大三学生中选10人组成志愿小组,请用抽签法和随机数表法设计抽样方案解抽签法:第一步:将60名志愿者编号,编号为1,2,3,60;第二步:将60个号码分别写在60张外形完全相同的纸条上,并揉成团,制成号签;第三步:将60个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取10个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员随机数表法:第一步:将60名志愿者编号,编号为01,02,03,60;第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在0160中的数,或已读过的数,都跳过去不作记录,依次可得到12,58,07,44,39,52,38,33,21,34;第四步:找出以上号码对应的志愿者,就是志愿小组的成员方法总结 随机数表中共随机出现0,1,2,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去【训练1】 有一批瓶装“山泉”牌矿泉水,编号为1,2,3,112,为调查该批矿泉水的质量问题,打算抽取10瓶入样,问此样本若采用简单随机抽样方法将如何获得?解法一(抽签法):把每瓶矿泉水都编上号码001,002,003,112,并制作112个号签,把112个形状、大小相同的号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取10次,就得到一个容量为10的样本法二(随机数表法):第一步,将原来的编号调整为001,002,003,112.第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向比如:选第9行第7列的数3,向右读第三步,从选定的数3开始向右读,每次读取三位,凡不在001112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092.第四步,对应原来编号74,100,94,52,80,3,105,107,83,92的瓶装矿泉水便是要抽取的对象考向二系统抽样【例2】 一个总体中的1 000个个体编号为0,1,2,999,并依次将其分为10个小组,组号为0,1,2,9,要用系统抽样方法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码的后两位数为x33k的后两位数,(1)当x24时,写出所抽取样本的10个号码;(2)若所抽取样本的10个号码中有一个的后两位数是87,求x的取值范围解(1)当x24时,按规则可知所抽取的样本的10个号码依次为:24,157,290,323,456,589,622,755,888,921.(2)当k0,1,2,9时,33k的值依次为0,33,66,99,132,165,198,231,264,297;又抽取样本的10个号码中有一个的后两位数是87,从而x可以为87,54,21,88,55,22,89,56,23,90,所以x的取值范围是21,22,23,54,55,56,87,88,89,90方法总结 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行【训练2】 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施解(1)将每个人编一个号由0001到1003;(2)利用简单随机抽样法找到3个号将这3名工人剔除;(3)将剩余的1 000名工人重新编号0001到1000;(4)分段,取间隔k100,将总体平均分为10段,每段含100名工人;(5)从第一段即为0001号到0100号中随机抽取一个号l;(6)按编号将l,100l,200l,900l共10个号选出,这10个号所对应的工人组成样本考向三分层抽样【例3】 一个地区共有5个乡镇,人口3万人,其中人口比例为32523,从3万人中抽取一个300人的样本,分析某种疾病的发病率已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程解因为该种疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法将3万人分为五层,其中一个乡镇为一层按照样本容量的比例随机抽取各乡镇应抽取的样本30060(人);30040(人);300100(人);30040(人);30060(人),所以各乡镇抽取人数分别为60,40,100,40,60.将300人组到一起即得到一个样本方法总结 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即nininn.【训练3】 某校有高一学生400人,高二学生302人,高三学生250人,现在按年级分层抽样,从所有学生中抽取一个容量为190人的样本,应该在高_学生中剔除人,高一、高二、高三抽取的人数依次是_解析总体人数为400302250952(人)等于5余2,80,60,50,应从高二年级中剔除2人,从高一、高二、高三年级中分别抽取80人,60人,50人答案二80、60、50热点突破31高考中抽样方法问题从近两年新课标高考试题可以看出高考主要是以填空题的形式考查抽样方法,难度并不大其中重点考查分层抽样,其次是系统抽样计算时应注意:分层抽样是按比例抽样,系统抽样首先是对总体分段的计算,注意分段时可能要排除一些个体,各段的间距是一样的【示例】 (2010湖北卷改编)将参加夏令营的600名学生编号为:001,002,600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为_审题与转化 第一步:按照系统抽样方法,抽出的从003开始间隔为12的号码第二步:抽取的号码按照等差数列的通项公式求解规范解答 第三步:第营区的学生人数需满足012n9300,解得n25,故第营区的学生有25人;第营区的学生人数需满足30012n9495,则在第营区的学生人数为17人;在第营区的学生人数需满足495s可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高方法总结 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小(2)平均数、方差的公式推广若数据x1,x2,xn的平均数为,那么mx1a,mx2a,mx3a,mxna的平均数是ma.数据x1,x2,xn的方差为s2.as2(xxx)n2;b数据x1a,x2a,xna的方差也为s2;c数据ax1,ax2,axn的方差为a2s2.【训练3】 (2013宁波模拟)甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些解(1)甲(86786591047)7(环),乙(6778678795)7(环)(2)由方差公式s2(x1)2(x2)2(xn)2可求得s3.0(环2),s1.2(环2)(3)由甲乙,说明甲、乙两战士的平均水平相当;又ss,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定热点突破32统计与概率的综合问题抽样方法、直方图、茎叶图与概率的交汇问题,准确提取直方图、茎叶图中的信息是解此类题的关键,借助这些数据结合独立事件、互斥事件可设计概率、分布列问题,高考在此结合点处命题有加强的趋势【示例】 (2011北京卷)以下茎叶图记录了甲、乙两组各四名同学的植树棵数乙组记录中有一个数据模糊,无法确认,在图中以x表示(1)如果x8,求乙组同学植树棵数的平均数和方差;(2)如果x9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率(注方差s2(x1)2(x2)2(xn)2,其中为x1,x2,xn的平均数)审题与转化 第一步:本题考查了统计中的茎叶图知识和平均数、方差的计算及概率的计算第二步:(1)从茎叶图中提取数据,利用平均数、方差公式计算(2)利用列举法求古典概型概率规范解答 第三步:(1)当x8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为(棵)方差为s2(棵2)(2)记甲组四名同学为a1,a2,a3,a4,他们植树的棵数依次为9,9,11,11;乙组四名同学为b1,b2,b3,b4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),(a3,b1),(a3,b2),(a3,b3),(a3,b4),(a4,b1),(a4,b2),(a4,b3),(a4,b4),用c表示:“选出的两名同学的植树总棵数为19”这一事件,则c中的结果有4个,它们是:(a1,b4),(a2,b4),(a3,b2),(a4,b2)故所求概率为p(c).反思与回顾 第四步:茎叶图是一个将数据分成主、次两部分,把主要部分当做茎、次要部分当作叶表达数据的一个图,它是一种常用的统计图因此考题常将茎叶图作为载体来考查平均数、方差以及概率问题高考经典题组训练1(2010江苏卷)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间5,40中,其频率分布直方图如图所示,则其抽样的100根中,有_根棉花纤维的长度小于20 mm.解析由图可知频率为(0.010.010.04)50.3,有0.310030(根)答案302(2011浙江卷)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_解析根据样本的频率分布直方图,成绩小于60分的学生的频率为0.020.060.120.20,所以可推测3 000名学生中成绩小于60分的人数为600名答案6003(2009江苏卷)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为s2_.解析甲7,s1202021202,乙7,s1202120222,ss,方差中较小的一个为s,即s2.答案4(2010天津卷)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数则这10天甲、乙两人日加工零件的平均数分别为_和_解析将零件个数和除以天数,得甲平均数为24,乙平均数为23.答案24235(2012安徽卷改编)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列正确的有_甲的成绩的平均数小于乙的成绩的平均数;甲的成绩的中位数等于乙的成绩的中位数;甲的成绩的方差小于乙的成绩的方差;甲的成绩的极差小于乙的成绩的极差解析甲(45678)6(环),乙(5369)6(环),甲的成绩的方差为(222122)2(环2),乙的成绩的方差为(123321)2.4(环2)甲成绩的中位数为6,乙成绩的中位数为5;甲成绩的极差为4,乙成绩的极差为4.答案分层训练a级基础达标演练(时间:30分钟满分:60分)一、填空题(每小题5分,共30分)1.(2013梁丰高级中学模拟)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为_7984464793解析由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为85,方差为3(8485)2(8685)2(8785)21.6.答案85,1.62(2012苏中三市调研)一组数据9.8,9.9,10,a,10.2的平均数为10,则该组数据的方差为_解析由条件,a为10.1,其方差为:(0.040.0100.010.04)0.02.答案0.023(2012广州联考)为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为235631,则该班学生数学成绩在(80,100)之间的学生人数是_解析80100之间两个长方形高占总体的比例为,即为频数之比,x33.答案334(2010北京卷)从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知a_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析小矩形的面积等于频率,除120,130)外的频率和为0.700,a0.030.由题意知,身高在120,130),130,140),140,150的学生分别为30人,20人,10人,由分层抽样可知抽样比为,在140,150中选取的学生应为3人答案0.03035(2012广东卷)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_(从小到大排列)解析由题意,得解得x11,x21,x33,x43.答案1,1,3,36. (2012扬州调研三)某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是_解析产品净重小于100克的频率为(0.0500.100)20.300,设样本容量为n,则0.300,所以n120,净重大于或等于98克并且小于104克的产品的频率为(0.1000.1500.125)20.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是1200.7590.答案90二、解答题(每小题15分,共30分)7. 从甲、乙两种玉米苗中各抽10株,测得它们的株高的茎叶图如右图(单位:cm)问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得整齐?解(1)甲(25414037221419392142)30(cm),乙(27164427441640401640)31(cm)所以甲乙(2)s(2530)2(4130)2(4030)2(3730)2(2230)2(1430)2(1930)2(3930)2(2130)2(4230)2104.2(cm2),s2(2731)23(1631)23(4031)22(4431)2128.8(cm2)所以ss.所以,乙种玉米苗长得高,乙种玉米苗长得整齐8.某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段40,50),50,60),90,100后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分解(1)设分数在70,80)内的频率为x,根据频
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高血压病人的饮食与护理
- 公司电工安全培训课件
- 了不起的0课件
- 《童年的发现》课件
- 颅脑损伤早期康复护理
- 公司水电安全培训课件
- 2025年标准安置房买卖合同范本
- 2025综合设备租赁合同书
- 透平式空压机启动讲解
- 月经期的个人护理
- 2025年中国保健电器具市场调查研究报告
- 电梯成品保护方案(3篇)
- 科技研发公司保密管理制度
- 医院科教相关管理制度
- 2025年江苏省农业融资担保有限责任公司招聘笔试参考题库附带答案详解
- 无锡信捷校招笔试题目及答案
- 2024第41届全国中学生物理竞赛预赛试题(含答案)
- (新版)中国心理卫生协会心理咨询师考试复习题库(浓缩400题)
- 南昌大学 2018-2019学年第二学期期中考试大学英语试卷
- 2025-2030中国妇科中成药市场营销趋势及投融资发展状况研究报告
- 艾滋病防治知识宣传
评论
0/150
提交评论