人大金勇进抽样调查第章.ppt_第1页
人大金勇进抽样调查第章.ppt_第2页
人大金勇进抽样调查第章.ppt_第3页
人大金勇进抽样调查第章.ppt_第4页
人大金勇进抽样调查第章.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.1 调查与抽样调查,调查(survey):通过使用明确的概念、方法和程序,依据专门设计的调查方案指导的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 例:调查北京市民对出租车行业的满意度调查,全面调查与非全面调查,根据“调查是否针对总体的所有单元”划分: 全面调查:普查 非全面调查,非全面调查相对于全面调查的优点: (1)时间短速度快; (2)费用少成本低; (3)调查结果比较准确; (4)应用范围广泛。,应用前提,抽样调查的基本概念,抽样调查(sampling survey)是一种非全面的调查,指从研究对象的全体(总体)中抽取一部分单元作

2、为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。 抽样调查的作用 1节约费用 2时效性强 3可以承担全面调查无法胜任的项目 4有助于提高调查数据的质量,根据“单元是否按照一定的概率入样”划分: 概率抽样和 非概率抽样,随机抽样是指按照概率原则,从总体中抽取一定数目的单位作为样本进行观察,随机抽样使总体中每个单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。 非随机抽样是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差,无法用样本的量化数据来推断总体。,概率抽样调查 非概率抽样调查,优点

3、: 能够保证样本的代表性,避免人为因素的干扰; 用概率抽样取得的样本去估计总体特征时,可以对由抽样产生的抽样误差进行估计。,缺点: 难以评价样本的代表性 无法估计抽样误差 偏倚往往较大,概率(随机)抽样(probability sampling )非概率(非随机)抽样(non- probability sampling ),抽样调查应用领域,社会经济现象的调查 社会性的民意调查 市场调查,1.2 基本概念,目标总体与抽样总体 抽样框与抽样单元 总体参数与统计量 估计量方差、偏差、均方误差 抽样误差与非抽样误差 精度与费用,目标总体与抽样总体,总体 目标总体也可简称为总体,是指所要研究对象的全体

4、,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成 组成总体的各个个体称作总体单元或单位。 抽样总体是指从中抽取样本的总体。,抽样框与抽样单元,抽样总体的具体表现是抽样框。通常抽样框是一份包含所有抽样单元的名单。 抽样框的形式:名单、手册、地图、数据包等等。 抽样框的要求: (1)抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列。 (2)抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样框误差。 抽样单元分级: 初级单元次级单元三级单元四级单元基本抽样单元。,总体参数和(样本)统计量,总体参数:总体是调查的客体,而总体参数是总体某个特征或属性的数量

5、表现。 常见的总体参数有4种:(1)总体总值;(2)总体均值;(3)总体比例;(4)总体比率。 总体总值、总体均值、总体比例三者是统一的,它们都可以用总体均值来表示。,why,统计量和估计方法,统计量是根据样本的n个单元的变量值计算出的一个量,也叫估计量,用于对总体参数的估计。 估计量是随机变量,比如样本均值 估计方法:最常见的估计方法是简单线性估计,除此之外,还可以借助于辅助变量。 辅助变量必须满足的两个条件:(1)与要估计的变量高度相关;(2)其总体信息已知。,估计量方差、偏差、均方误差,估计量分布的方差称为估计量方差,它是从平均的意义上说明估计值与待估参数的差异状况,也是我们对抽样方案进

6、行评价的标准之一。 估计量方差表达式:,偏差是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。 偏差的表达式 : 对于无偏估计量 ,偏差为零 。,均方误差(Mean Square Error, MSE )指所有可能的估计值与待估参数之间离差平方的均值,它等于估计量方差加偏差的平方。,抽样误差与非抽样误差,抽样误差:抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免。 抽样误差是一个一般的概念,它可以用不同的量值来表示。例如:估计量方差或估计量标准差。 非抽样误差:是相对于抽样误差而言的,它不是由于抽样的随机性,而是由于其它多

7、种原因引起的估计值与总体参数之间的差异。 包括:抽样框误差、计量误差、无回答误差等,精度与费用,调查的费用是一个与样本量有关的函数,最简单的是线性费用函数。 最优抽样设计:指以最小的费用达到要求的精度或者在给定费用的情况下达到最大的精度,精度由误差来表现。 抽样误差与样本量有关,样本量越大,在其它条件相同情况下,抽样误差就越小,抽样调查的精度就越高。,几种基本的抽样方式,概率抽样调查 非概率抽样调查,简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样,判断抽样(包括典型调查和重点调查) 便利抽样 自愿样本 滚雪球抽样 配额抽样等,简单随机抽样,简单随机抽样(simple random sa

8、mpling)又称纯随机抽样,考虑一个包含N个单位的母体,从中抽取n个单位作为样本。如果抽样是不放回的,即同一个单位不能在样本中重复出现,那么总共有C(N,n) 种不同的取法,也就是说共有C(N,n)个可能的不同样本。如果每个样本被抽中的概率都相等,则称这种抽样方法为简单随机抽样,所得到的样本叫做简单随机样本(SRS)。,例题:某大学欲了解该校研究生中打算报考托福人数的比例,全校研究生共有570人,随机抽取了100人,其中有14人准备参加托福考试,试以95%的把握程度对研究生中欲报考托福人数的比例作出估计。,分层抽样,分层抽样(stratified sampling)又称类别抽样,它是先将总体

9、所有单位按某些重要标志进行分类(层),然后在各类(层)中采用简单随机抽样或系统抽样方式抽取样本单位的一种抽样方式。例如,对员工收入状况进行调查,就可将员工按职业不同,分为生产人员、商业人员、服务性工作人员等各层,再从各层中抽取员工。,等比例抽样 不等比例抽样 优点 更为精确 对每层的推论,系统抽样,系统抽样是将N个总体单位按一定顺序排列,先随机抽取一个单位作为样本的第一个单位,然后按某种确定的规则抽取样本的其它单位。 其中最简单也是最常用的规则是等间隔抽取。所以系统抽样又称等距抽样。,系统抽样,排列顺序与调查项目无关 排列顺序与调查项目有关 例如,从600名大学生中抽选50名大学生 利用学校现

10、有名册按顺序编号排序,从第001号编至600号。 抽选距离=N/n=600/50=12(人) 如从第一个12人中用简单随机抽样方式,抽取第一个样本单位,如抽到的是8号,依次抽出的是20号,32号,44号等。 ,系统抽样,优点 均匀地分布 简单易行 缺点 抽样误差计算较为复杂 周期性重合时会影响调查的精确度 需要较为详细、具体的相关资料,整群抽样,整群抽样是先将总体划分成许多不相重合的子总体或群,然后以群为抽样单位,按某种随机方式从中抽取若干个群,形成一个“群”的随机样本,对抽中的群内所有单位都进行调查。 例如,某大学要调查学生的视力,可以将班做为一个群,随机抽取几个班,对这些班的全部学生进行调

11、查。,整群抽样,一是没有总体最终单位的抽样框 实施便利、节省费用 影响整群抽样误差的主要是群间方差。分群时使群内方差尽可能大,使群间方差尽可能小。 整群抽样的估计精度一般低于简单随机抽样,多阶段抽样(multi stage sampling),多阶段抽样是指抽取样本单位时分几个阶段进行: 首先在总体中按随机原则抽取若干初级(一级)单位, 然后再从被抽中的初级单位中抽取若干次级(二级)单位,这种抽样称为二阶段抽样。 如果每个次级单位又可以进一步分为更小的三级单位,那么在每个被抽中的二级单位中再抽取三级单位,这称为三阶段抽样, 以此类推,可以定义更多阶段的抽样。,多阶段抽样,例如,全国性调查,省;市或县;街道、镇、或乡,等等。 在大规模的抽样调查中,特别是当抽样单位为各级行政单位时,通常都采用多阶段抽样。 优点: 样本单位相对集中,实施调查比较方便,可以节省调查费用。 抽样时并不需要全部低级单位的抽样框,非随机抽样技术,原因: 1受客观条件限制,无法进行严格的随机抽样; 2为了快速获得调查结果;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论