2012届人教版高中新课标总复习(第1轮)文数第13章13.3随机抽样与用样本估计总体_第1页
2012届人教版高中新课标总复习(第1轮)文数第13章13.3随机抽样与用样本估计总体_第2页
2012届人教版高中新课标总复习(第1轮)文数第13章13.3随机抽样与用样本估计总体_第3页
2012届人教版高中新课标总复习(第1轮)文数第13章13.3随机抽样与用样本估计总体_第4页
2012届人教版高中新课标总复习(第1轮)文数第13章13.3随机抽样与用样本估计总体_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第三课时,随机抽样与用样本估计总体,第十三章 概率与统计,2,1.简单随机抽样(1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(nN).如果每次抽取时总体内的各个个体被抽到的机会 ,我们把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法有: 和 .2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本,其步骤是:,逐个不放回地,都相等,抽签法,随机数法,3,(1)先将总体的N个个体 ;(2)确定 ,对编号进行 .当 是整数时,取k= ;当 不是整数时, ,使剩下的总体中个体的个数N这时取k= ,并将剩下的总体 ;(3)在第一段用 确定第一个个体编号l(lk);,编号,分段间隔k,分段,从总体中剔除一些个体,能被n整除,,,重新编号,简单随机抽样,4,(4)按照一定的规律抽取样本,通常是将l加上间隔k得到第2个个体编号 ,再加k得到第3个个体编号 ,依次进行下去,直到获取整个样本.3.分层抽样定义:当总体由的几个部分组成时,常将总体中的个体按不同的特点分成层次比较分明的部分,然后按照 .实施抽样,这种抽样方法叫做分层抽样.,l+k,l+2k,差异明显,一定的比例,5,4.作频率分布直方图的步骤(1)求极差(即一组数据中 与 的差);(2)决定 与 ;(3)将数据 ;(4)列 ;(5)画 .5.频率分布折线图连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图.,最3大值,最小值,组距,组数,分组,频率分布表,原频率分布直方图,中点,6,6.茎叶图(1)两位数字的茎叶图 将所有两位数的 作为“茎”, 作为“叶”,茎相同者共用一个茎,茎按的顺序从上向下列出,共茎的叶一般按或 的顺序同行列出,即得到这组数据的茎叶图.,十位数字,个位数字,从小到大,从大到小,从小到大,7,(2)三位数字的茎叶图将数据中所有三位数的作为“茎”, 作为“叶”,茎相同者共用一个茎,茎按 的顺序从上向下列出,共茎的叶一般按 或的顺序同行列出,即得这组数据的茎叶图.,十位与百位数字,个位数字,从小到大,从大到小,从小到大,8,7标准差和方差已知一组数据x1,x2,xn的平均数为 .(1)方差:s2= .(2)标准差是样本数据到平均数的一种 ;标准差s= .,平均距离,9,1.下面不为总体特征数的是( )A. 总体平均数 B. 总体方差C. 总体标准差 D. 总体样本,D,10,2.2010年7月,某校进行了期末统考,为了了解高一年级1000名学生的考试成绩,从中抽取了100名学生的成绩.就这个问题而言,下面说法正确的是( )A.1000名学生是总体B.每个学生是个体C.1000学生的成绩是一个个体D.样本的容量是100,D,11,3.为了抽查某城市汽车尾气排放执行标准情况,在该城市的主干道上采取抽取车牌末位数字为5的汽车检查,这种抽样方法称为( )A. 简单随机抽样 B. 随机数表C. 系统抽样 D. 分层抽样,C,12,4.将参加数学竞赛的1000名同学编号如下:0001,0002,1000.现从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分.若第一部分的编号为0001,0002,0020,且从第一部分随机抽取的号码为0015,则第40个号码为 . 因为15+3920=795,故第40个号码为0795.,0795,13,5.某厂生产A、B、C三种不同型号的产品,产品数量之比依次为235.现用分层抽样方法抽出一容量为n的样本,样本中A种型号产品有16件.那么此样本的容量n=_.,80,14,1.随机抽样的概念(1)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为();在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为().则完成(),15,()这两项调查宜采用的抽样方法依次是( )A. 分层抽样,系统抽样B. 分层抽样,简单随机抽样C. 系统抽样,分层抽样D. 简单随机抽样,分层抽样,B,16,(2)一个总体中有100个个体,随机编号0,1,2,99,依编号顺序平均分成10个小组,组号依次为1,2,3,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是 .,63,17,2.频率分布直方图某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.,18,如图,是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )A. 0.9,35 B. 0.9,45C. 0.1,35 D. 0.1,45,A,19,3.用样本估计总体(1)从一堆苹果中任取320只,并得到它们的质量(单位:支)数据分布如下: 则这堆苹果中,质量不小于120克的苹果数约占苹果总数的 .,70%,20,(2)从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g):492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499 根据用样本的频率分布估计总体分布的原理,该自动包装机包装的袋装食盐质量在497.5 g501.5 g之间的概率约为 .,0.25,21,题型1:随机抽样及其应用某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10.登山组的职工占参加活动总人数的 且该组中,青年人占50,中年人占40,老年人占10.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:,22,(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数. (1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,,23,则有解得b=50%,c=10%,故a=100%-50%-10%=40%.即游泳组中,青年人、中年人、老年人各占比例分别为40、50、10.,24,(2)游泳组中,抽取的青年人为200 40%=60(人);抽取的中年人为200 50%=75(人);抽取的老年人为200 10%=15(人).【评注】弄清抽样方法的区别与联系是解决问题的基础.本例主要考查分层抽样,设登山组人数是入手解决问题的关键.,25,为了考察某校的教学水平,将抽查这个高三年级的部分学生的本学年考试成绩进行考察.为了全面地反映实际情况,采用以下两种方式进行抽查(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;,26,每个班都抽取1人,共计20人,考查这20个学生的成绩;把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).,27,根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用了何种抽取样本的方法?,28,(1)这三种抽取方式中,其总体都是指该校高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本学年的考试成绩,样本容量为100.,29,(2)第一种采用简单随机抽样法;第二种采用系统抽样法和简单随机抽样法;第三种采用分层抽样法和简单随机抽样法.,30,某公司在过去几年内使用某种型号的灯管1000支,该公司对这些灯管的使用寿命(单位:小时)进行了统计,统计结果如下表所示:,题型2:频率分布直方图及其应用,31,(1)将各组的频率填入表中;(2)根据上述统计结果,计算灯管使用寿命不足1500小时的频率. (1)频率依次为0.048,0.121,0.208,0.223,0.193,0.165,0.042.(2)由(1)可得0.048+0.121+0.208+0.223=0.6,所以灯管使用寿命不足1500小时的频率为0.6.,32,【评注】利用样本的频率分布去近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用试验的数据正确地作出估计.,33,在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:,34,(1)完成频率分布表,并画出频率分布直方图;(2)估计纤度落在1.38,1.50)中的概率及纤度小于1.40的概率是多少?(3)统计方法中,同一组数据常用该组区间的中点值(例如区间1.30,1.34)的中点值是1.32)作为代表.据此,估计纤度的期望.,35,(1)频率分布表补充完整如下:,36,频率分布直方图如下:,37,(2)纤度落在1.38,1.50)中的概率约为0.30+0.29+0.10=0.69,纤度小于1.40的概率约为0.04+0.25+ 0.30=0.44.(3)总体数据的期望约为1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088.,38,某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,题型3:茎叶图的应用,39,(1)作出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.,40,(1)茎叶图如下: A B 9 7 35 8 7 36 3 5 37 1 4 8 38 3 5 6 9 2 39 1 2 4 4 5 7 7 5 0 40 0 1 1 3 6 7,41,5 4 2 41 0 2 5 6 7 3 3 1 42 2 4 0 0 43 0 5 5 3 44 4 1 45,42,(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:品种A的亩产平均数(或均值)比品种B高;品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.,43,【评注】本题主要考查了茎叶图和统计的基本思想方法,考查了分析样本数据,从样本数据提取基本的数字特征进行统计推断的能力和应用意识.,44,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员的得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员的得分:49,24,12,31,50,31,44,36,15,37,25,36,39.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两名运动员的水平.,45,(1)茎叶图如下图. 甲 乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0,46,(2)乙运动员的得分基本上是对称的,叶的分布是“单峰”的,有 的叶集中在茎2,3,4上,中位数是36.众数是31、36.甲运动员的得分除了一个特殊得分(51)外,也大致对称,也是“单峰”的,有 的叶主要集中在茎1,2,3上,中位数是26,由此看出,乙运动员的成绩更好.另外,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.,47,1.注意三种抽样方法的比较.无论采用何种抽样方法,必须保证在整个抽样过程中每个个体被抽到的机会相等.2.在实践中应根据具体情况正确选择抽样方法.3.总体分布反映的是总体在各个范围内取值的比例情况,而这种分布一般是不知道的,所以用样本的分布估计总体分布,所以样本数据的代表性就很重要.,48,4.对于每个个体所取不同数值较少的总体,常用条形图表示其样本分布,而对于每个个体所取不同数值较多或无限的总体,常用频率分布直方图表示其样本分布.5.描述数据的数字特征平均数、众数、中位数、方差,其中平均数、众数、中位数描述其集中趋势,方差反映各个数据与其平均数的离散程度.,49,1.(2009福建卷)一个容量100的样本,其数据的分组与各组的频数如下:则样本数据落在(10,40上的频率为( )A. 0.13 B. 0.39C. 0.52 D. 0.64,C,50,2.(2009陕西卷)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论