应用统计学--抽样调查与推断_第1页
应用统计学--抽样调查与推断_第2页
应用统计学--抽样调查与推断_第3页
应用统计学--抽样调查与推断_第4页
应用统计学--抽样调查与推断_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计推断的过程,第八章抽样调查与推断,第一节抽样推断概述第二节抽样调查的组织方式和抽样方法第三节抽样误差第四节抽样估计第五节样本容量的确定,【学习目标】了解抽样调查的概念、特点;掌握抽样推断的几个基本概念;掌握抽样平均误差、抽样极限误差的概念及计算方法;掌握全及指标推断:点估计和区间估计方法;掌握抽样单位数的确定方法,第一节抽样推断概述,抽样调查的概念,一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。,不受主观因素及系统因素影响,机会均等,说明:1、抽样调查是

2、一种科学的非全面调查。2、抽样调查必须按照随机原则来抽取被调查单位。,一、抽样调查的特点,1、目的是由部分推断整体。(与全面调查;重点、典型调查不同)2、建立在随机抽样的基础之上。(等可能性原则,通过部分认识总体)3、抽样推断运用概率估计方法;误差可事先计算且能估计。以样本推断总体,必然存在误差,但这种误差是可以计算并加以控制的,可以调整其它一些因素进行控制(与典型调查不同),第一节抽样推断概述,二、抽样推断的作用,(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。,(2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力物力和时间

3、达到满意的调查效果。(3)运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。(4)可运用于企业质量管理。,举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。,(5)利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。,第一节抽样推断概述,三、抽样调查的基本概念,总体和样本总体:所要研究对象的全体。它由某些具有共同性质或特征的个体或单位组成。同时,各单位的数量表现又存在差异。一般用“N”表示。分:属性总体和变量

4、总体。样本:从总体按一定程序抽取的个体或单元组合。一般用“n”表示。N大于30叫大样本;小于30叫做小样本。,第一节抽样推断概述,某市在12万名大学生中抽出1000人进行消费结构调查。,总体:12万名大学生就是调查。样本:被抽到的1000名大学生。,认识:,第一节抽样推断概述,变量总体的总体指标有平均数:属性总体的总体指标有成数:总体方差或标准差:,总体指标和样本指标总体指标:由全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指标。又称(母体)参数。,样本指标:由样本各个单位的标志值或标志特征计算的,反映样本某种属性的综合指标。,第一节抽样推断概述,变量样本的总体指标有平均数:

5、属性样本的总体指标有成数:样本方差或标准差:,样本容量和样本个数:样本容量:指样本中的单位个数。样本个数:指在一定总体中可能抽取的样本组合的个数。,认识:,在100个学生中抽取10个样本,则样本容量和样本个数分别是多少?,第二节抽样调查的组织方式和抽样方法,简单随机抽样(SRS)按照随机原则,从总体中不加任何分组、划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称非常简单随机抽样(VSRS),性质:,用不重复抽样方法,按随机原则从N个单位中抽取n个单位组成样本。则其样本数目,方法:,抽签法或随机数法,抽签法给总体各单位编号后,把号码写在结构均匀的字签上,将字签混合均匀后即可从中抽取。,在

6、随机原则下,根据需要可以有不同的方式。,一、抽样的组织方式,1、简单随机抽样,第二节抽样调查的组织方式和抽样方法,随机数法利用随机数表进行抽样的方法。,仅适用于规模不大、内部各单位标志值差异较小的总体,应用:,优点:(1)简单、直观比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。缺点:(1)对样本编号困难;(2)样本分散,费用较高;(3)总体方差大时,样本代表性差;(4)有些情况不能使用,如连续生产质检。,第二节抽样调查的组织方式和抽样方法,将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从各组中抽取一定数目的总体单位组成样本的抽样

7、组织方式。,2、类型抽样,总体N,样本n,描述:,第二节抽样调查的组织方式和抽样方法,等比例抽样,指分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层的样本数量。每层抽取的样本数计算公式为:,式中:ni为第i层抽出的样本数Ni为第i层的总单位数N为总体单位数n为总体样本数,第二节抽样调查的组织方式和抽样方法,非等比例抽样,指分层后,不按各层中单位数量占总体单位数量的比例抽取各层的样本数量。一般用最佳抽样或最低成本抽样。每层抽取的样本数计算公式为:,最佳抽样:,根据各层标准差的大小来调整各层样本数目的抽样方法。,为第i层的标准差,第二节抽样调查的组织方式和抽样方法,优点:1)在调查

8、中不仅可对总体进行参数估计,还可对层的参数进行估计。2)使样本更具代表性。3)对不同层可以按照不同情况和条件,具体采用不同的抽样方法。4)分层抽样可以提高估计量的精度缺点:1)对抽样框的要求比较高,必须有分层的辅助信息;2)估计值的计算比简单随机抽样复杂,第二节抽样调查的组织方式和抽样方法,又称系统抽样先把总体单位按某种顺序排列成行(或按自然顺序),用随机方法抽取第一个单位,以后每隔若干单位抽取一个单位。,3、等距抽样,1、和调查项目无关,如按照门牌号排列;2、和调查项目有关,如按收入给家庭排序。,排列:,抽选方法:,设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n(取整),在1

9、到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,。当N不能被n整除时,采用圆形系统抽样方法。,第二节抽样调查的组织方式和抽样方法,举例:,某企业对购进的10000台电视机的质量进行调查,计划抽取400台作为样本调查,总体编号为1-10000。1、样本间距为K=10000/400=25。2、然后从1-25中任意抽取一个数为样本,假定为第8台,则第2个样本为8+25=33,即抽取第33台作为第2个样本,以此类推,一直抽够400台为止。,第二节抽样调查的组织方式和抽样方法,(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)要知道有关材料,如排序标志;(3

10、)没有一个无偏的方差估计量;误差计算复杂。,优点:,(1)简便易行,容易确定样本单元(2)分布比较均匀,有利于提高估计精度例如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只要确定了起点的被检查树,每隔30棵检查1棵即可。,缺点:,国家统计局的调查多采用系统抽样,它便于操作。,第二节抽样调查的组织方式和抽样方法,将总体全部单位分为若干“群”,然后随机抽取一部分群”,被抽中群体的所有单位进行全面调查的抽样组织方式。,4、整群抽样,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,样本容量,示意图:,第二节抽样调查的组织方式和抽样方法,特点,(1)总体和样本都

11、是由“群”组成;(2)引起的抽样误差的方差是群间方差,群内方差不影响抽样误差;(3)整群抽样均为不重复抽样,可提高样本的代表性。(4)每群的数量可等可不等,而且抽样方法方便。,第二节抽样调查的组织方式和抽样方法,优点:简单、方便,易于组织,能节省人力、物力、财力和时间,缺点:限制了样本在总体中分配的均匀性,同样数量情况下,误差比其它抽样方法大。,第二节抽样调查的组织方式和抽样方法,5、阶段抽样,先抽大的调查单位,再抽取小的调查单位,直到获得能推断总体资料的基本单位为止的抽样方式。,总体,第一阶样本,最终样本,示意图:,第二节抽样调查的组织方式和抽样方法,二、抽样方法和样本可能数量,不考虑顺序抽

12、样:即从总体的单位中抽取个单位构成样本,只考虑样本构成成份,不问样本的构成顺序。,抽样方法,重复抽样:是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。,不重复抽样:是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。,考虑顺序抽样:即从总体的单位中抽取个单位构成样本,不但考虑样本各单位的不同性质,而且还要考虑不同性质各单位的中选顺序。,第二节抽样调查的组织方式和抽样方法,样本数量考虑顺序的不重复抽样:,考虑顺序的重复抽样:,不考虑顺序的不重复抽样:,不考虑顺序的重复抽样:,第三节抽样误差,一、抽样误差的概念及其影响程度,在统计调查中,调查资料与

13、实际情况不一致,两者的偏离称为统计误差。,1、抽样误差也叫随机误差,指样本指标和总体指标之差。是抽样调查固有的误差,是无法避免的。但可以运用数理统计定理预先控制的。,组织问题,2、抽样误差的影响因素:,第三节抽样误差,1.总体标志变异程度。正比关系2.抽样单位数目的多少。反比关系,二、抽样误差的计算,1、样本平均数标准(平均)误差,重复抽样:,不同的抽样方法,一般讲不重复抽样好些。不同的抽样组织形式,一般讲等距、类型抽样比简单随机和整群抽样好些。,第三节抽样误差,取得的途径有:,1、用过去全面调查或抽样调查的资料,若同时有n个的资料,应选用数值较大的那个;2、用样本标准差S代替全及标准差;3、

14、在大规模调查前,先搞个小规模的试验性的调查来确定S,代替。,第三节抽样误差,某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时/200小时,分别求其标准误差。,例:,第三节抽样误差,根据以往资料,产品质量不太稳定,若=200小时,,不重复抽样:,第三节抽样误差,2、样本成数的标准误差(不重点),第三节抽样误差,三、抽样极限误差,1、定义:指根据研究对象的差异程度和分析任务的要求所确定的可允许的最大误差范围。样本指标和总体指标的最大差异值。,设x表示样本平均数和样本成数的误差范围,则有:,变形有:,第三节抽样误差

15、,其中:,一般表达式为:,其中t称为覆盖因子(标准化分为点),表示抽样极限误差用抽样标准误差来衡量的倍数。,第三节抽样误差,抽样估计精度为1减抽样误差系数:,抽样误差系数表示抽样误差的相对程度,是极限误差和样本均值和成数的比值。,第三节抽样误差,对某城市抽取200户职工进行调查,平均收入为5000元,若极限误差不抽过10,求:1、平均数估计区间;2、如果抽样误差为5元,求覆盖因子;3、抽样误差系数。,例:,第五节样本容量的确定,样本容量是决定抽样误差大小的直接因素,在其它条件相同的情况下,抽样单位数越多,抽样误差越小;但增加抽样单位有时会增加成本,因此在抽样过程中首先要确定最佳的样本容量。,一

16、、样本容量确定方法,样本容量是决定先要给定抽样误差的范围和置信度,然后确定样本的多少。,估计总体平均数所需的样本容量。,重复抽样所需样本容量的确定:,不重复抽样所需样本容量的确定:,估计总体成数所需的样本容量。(不要求掌握),第五节样本容量的确定,补充:置信度F和t之间相矛盾,其关系如下:,第五节样本容量的确定,某金笔厂月产10000支金笔,以前多次抽样调查使用寿命标准差为400小时,现在要求误差范围在100小时之内,可靠程度达95.45%,问必须重复抽取多少单位数?,例1:,例2:,建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。

17、根据过去资料=1.5,如果用不重复抽样,求样本数应是多少?,第五节样本容量的确定,例3:,某公司职工人数是20000人,平均工资的标准差是6元,抽样极限误差是0.9元,要求抽样估计的置信度为95.45%。按照重复和不重复抽样的方法,确定估计总体平均数所需的样本容量。,第五节样本容量的确定,二、影响样本容量的主要因素,第五节样本容量的确定,三、确定样本容量所需注意的几个问题,总体方差可通过历史资料或试验性调查取得。,几个方差要选择较大的数值。,F和t之间查表规律,第四节抽样估计,一、总体指标的点估计,1、定义:利用样本计算出来的一个数值估计未知的一个总体指标。直接以样本指标数值为相应的总体指标估

18、计值。,2、评价标准:无偏性:如果用样本指标的数学期望等于估计的总体指标本身,则该样本指标是被估计的总体指标的无偏估计量。一致性:当样本容量充分大时,若样本指标充分地接近被估计的总体指标本身,则该样本指标为相应的一致估计量。有效性:如果一个样本指标的方差比其它样本指标的方差小,则称该样本指标是被估计的总体指标的有效估计量。,总体平均数的点估计量是样本均值;成数的估计是样本成数;总体方差的点估计量是修正的样本方差:,2、要素:根据抽样资料计算的估计量值;给定的抽样极限误差,并计算出估计区间;计算估计区间的概率保证程度,置信度。说明:区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是

19、说,推断总体指标在这个范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率(置信度)。,二、总体指标的区间估计,1、定义:根据样本指标估计总体指标的上下限以及这种估计的把握程度。,第四节抽样估计,抽样极限误差加样本指标值就是总体估计的上下限;抽样极限误差表示抽样估计的精确程度,范围越小越精确;抽样极限误差的大小取决于覆盖因子t,t越小越精确。置信度F和t之间相矛盾,其关系如下:,区间估计有两种:一种是达到一定精确度;另一种是要求有一定的置信度t。,第四节抽样估计,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:1、计算抽样标准误差;2、若t=2;计算平均亩产的区间;3、若t=3;计算平均亩产的区间;,例:,第四节抽样估计,例:,对某工厂某种产品进行耐用性能抽样检验,采用简单随机不重复抽样的方法进行2%的抽样,其结果如表8-2所示:,第四节抽样估计,假设在1000小时以下的为不合格品。1、若耐用时数允许误差上下不超过1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论