版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第8讲 抽样方法,2,探讨一些问题: 1.样本大小问题; 2.抽样误差问题; 3.无回复情况;,3,4,5,83 抽样方法,6,抽样方式的特点,概率抽样的特点 随机性、成本高、要求高、精确度。 非概率抽样的特点 最大特点是操作简便,时效快,成本低。,7,概率抽样方法,1简单随机抽样(SRS) 为抽出一个简单随机样本,调研人员首先需要编辑一个抽样框,给其中每个个体分配一个号码,然后用计算机程序或随机数表(见附录B-1)生成随机数,根据这些随机数来确定哪些个体被包括进样本中。 简单随机抽样有许多优点: 最简单、最典型的概率抽样技术,易于理解; 抽样框不需要其他(辅助)信息就能进行抽样; 样本结
2、果可以推论到目标总体上,大多数统计推论方法都假定数据是由简单随机抽样方法收集的。,8,概率抽样方法,2系统抽样(SYS) 指将调查总体单位按照一定标志进行顺序排列,然后根据总体单位数和样本单位数计算出抽样间距(k),并从抽样框中每隔k个单位抽选一个个体,组成样本。 抽样间距(k)总体单位数(N)/样本单位数(n) 例1:总体中有50000个单位,想要抽取一个样本量为500的样本,此时抽样间距k为100.在1100之间选出一个随机数如36,则该样本就由个体36、136、236、336、43649736、49836、49936等500个样本组成。,9,概率抽样方法,总体单位的排序决定着系统抽样的代
3、表性,并决定系统抽样调查结果的统计效率。 分三种情况说明: 1.如果排序与要研究的特征无关,则结果与SRS相似; 2.当排序与要研究的特征有关时,SYS能增加样本的代表性。 3.若排序呈现循环形式,抽样间距又与循环周期相同时,系统抽样会降低样本的代表性。,10,概率抽样方法,例2:如果在某行业中按照年销售额的增序排列公司,那么一个系统 抽样的样本将包括一些小公司和一些大公司,通常会比一个简单随机样本具有更好的代表性。 例3:想对商场的零售额进行抽样调查,以7天为抽样间隔。因为每周7天中商场的销售额实际是不同的,而且有一定规律,那就是周末和假日零售额比较多,平时比较少。若抽中周末为系统样本的起点
4、,估计结果就会偏高;反之,若抽中平时为样本起点,估计结果则偏低。,11,概率抽样方法,系统抽样的优点: 1.在没有抽样框时,可代替简单随机抽样; 2.与简单随机抽样一样,系统抽样不需要辅助的抽样框信息; 3.与简单随机抽样相比,系统抽样样本的分布较好(这还取决于抽样间隔及抽样框架是如何排列的); 4.与简单随机抽样一样,有较好的理论支持,估计值容易计算; 5.只需要一个随机起点,系统抽样更简单,成本低,更容易实现。,12,系统抽样的缺点: 1.如果间隔正好碰上总体变化的某种周期,就会得到一个差的系统样本; 2.与简单随机相同,由于不使用抽样框中的辅助信息,抽样策略的效率不高; 3.系统抽样的抽
5、样方差没有一个无偏的估计量,为了进行方差估计,必须把系统看做简单随机样本,而且在名录框中的单元确实是随机排列的。,13,概率抽样方法,3分层抽样(Stratified Sampling) 指将调查总体中的所有单位按照一定的属性或特征分成不相重叠的若干层次(或类),然后在每一个层次(或类)中进行简单随机抽样或等距抽样。 分层标志,一定是总体的某种重要属性或特征,而且与调查主题内容之间联系越密切越好。 分层的目的是使样本单位在各层、各类中分布比较均匀,具有更好的代表性。 分层抽样在操作上分为四种方法:比例分层、纽曼分层、德明分层和多次分层。,14,概率抽样方法,分层抽样: 设n为样本总数,ni为第
6、i层应抽取的样本单位数,N为调查总体单位数,Ni为第i层总体单位数,则分比例为n/N,等比例意味着ni/n=Ni/N。所以第i层应抽取的样本数量: ni=n(Ni/N). 例如:某街道有居民20000户,按经济收入分为三层,分布情况如表所示。假定样本数为200,通过等比例分层进行购买力调查。各层应抽取的样本数量可以按上述公式计算出来,结果如下表:,15,16,概率抽样方法,4整群抽样(Cluster Sampling) 指首先将调查总体区分为若干群,然后采用SRS方法抽出部分群作样本,最后对这些样本群进行全面调查。即,两段整群抽样。在两段整群抽样中,如果不对所抽样本群进行全面调查,而是进一步将
7、这些群划分为若干小群,然后按照随机原则抽出一部分群进行全面调查,就形成所谓的三段整群抽样。,17,概率抽样方法,整群抽样有以下主要优点: 由于样本相对集中,整群抽样能大大降低数据收集的费用。 当总体单位自然聚合成群时,创建地域抽样框较容易; 对于研究变量而言,若群内单元差异大且群间差异小,则整群抽样策略比SRS的统计效率更高。 整群抽样的缺点: 如果群内单元对调查变量有趋同势,则整群抽样的统计效率比简单随机抽样低,而这正是通常遇到的情况; 无法提前知道调查的总样本量,因为不知道群内到底有多少单位; 调查的组织比其他方法复杂; 方差估计可能比简单随机抽样更为复杂。,18,概率抽样方法,5与个体大
8、小成比例的概率抽样(PPS) PPS是一种使用辅助信息从而使入样概率不相等的抽样技术。如果总体单位的大小变化很大且己知,这些信息就可用在抽样中,以提高统计效率。 PPS抽样的主要优点是它使用了辅助信息,提高了抽样策略的统计效率,与SRS方法甚至与分层抽样相比,都能显著地减少抽样误差。,19,概率抽样方法,PPS抽样有以下缺点: 抽样框中所有单位,都要有高质量的、能用作大小度量的辅助信息; 抽样框的创建比简单随机抽样和系统抽样成本高、更复杂,因为需要度量和存储总体中每一个单位的大小; 并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量; 对于那些与大
9、小变量不相关的调查变量,会导致抽样策略的统计效率比简单随机抽样低; 估计量的抽样方差的估计较复杂; 当总体单位大小度量不准确或不稳定时,PPS抽样不再适用。,20,其他概率抽样方法,多阶抽样 多阶抽样是用两个或更多个连续的阶段抽取样本的过程。第一阶段抽取的单位称为初级抽样单位,第二阶段抽取的单位称为次级抽样单位,依次类推。每个阶段抽取的单位在结构上是不同的。 二阶抽样是常见形式:第一阶用地域框抽小的地理小区;第二阶用系统抽样抽小区内的住所。与整群抽样中样本群的所有单位都入样不同,在两阶抽样中,则从每个抽中的群中再抽一部分单位进行调查。,21,其他概率抽样方法,多相抽样(或多重抽样) 多相抽样先
10、抽一个包含很多单位的大样本,收集基本信息,然后在这个大样本中抽一个子样本,收集更详细的信息。第一相收集的数据能够用作分层及筛选信息,同时也可以用来提高估计的效率。 多相抽样能用在抽样框缺乏辅助信息,而又想对总体进行分层或筛选部分总体的情况。 当没有充足的预算收集整个样本的信息,或这样做会导致额外的回答负担,也可以考虑使用多相抽样。,22,非概率抽样方法,1便利抽样 便利抽样就是依据方便原则抽取样本,对抽样单位的选择主要是由调查人员完成,通常被访者由于碰巧在适当的时间出现在适当的地点而被选中。 “街头拦人法”和“空间抽样”,是方便抽样的两种最常用方法。,23,非概率抽样方法,2判断抽样(立意或目
11、的抽样) 它是按照调研设计者的主观判断选取调查单位组成样本的一种抽样方法。应用前提是,调研设计的必须以对调查总体的有关特征相当了解,或者可以依靠专家判断来决定样本。 在判断抽样中,样本单位的选取通常分为两种情况: 第一种情况是,选择最能代表普遍情况的调查对象,即选取“多数型”、或“平均型”的样本作为调查对象。 第二种情况是,选择那些异乎寻常的个案,目的是调查造成异常的原因。,24,非概率抽样方法,3配额抽样 所谓配额抽样,是指首先将总体单位按照一定的属性或者特征分成若干类,然后在每类中按照方便抽样或者判断抽样的方法选取样本单位。 配额抽样的具体步骤: S1:选定控制特征。即据以对总体单位分层的
12、属性和特征。 S2:确定调查总体中各个控制特征的比例。 S3:按照分层比例表确定各层次样本数目,建立样本配额表。 S4:确定抽样单位。采用方便/判断抽样方式抽取样本单位。,25,非概率抽样方法,表8-3 独立控制样本配额表,表8-4 交叉控制样本配额表,26,非概率抽样方法,4滚雪球抽样 指一种抽样程序,最初的应答者通过概率方法进行选择,而另外的应答者则是通过最初应答者所提供的信息而获得。该过程可以通过一轮接一轮的推荐进行下去,因而产生一个“滚雪球”效应。即使在选择最初的被访者时使用了概率抽样,最终的样本还是一个非概率样本。 该技术用于通过推举找到那些罕见的总体单位。,27,抽样方法的选择,1是否要以样本结果对总体进行推断 2非抽样误差相对于抽样误差是大还是小 3总体的差异化程度如何 4有没有或是否有可能建立一个总体所有单位的名录 5调查是否要求对一个相当大的地理区域进行面访 6总体单位是否自然成群,或是否有此类群体的名录 7抽样框是否有能用作分层或度量大小等辅助信息 8是否需要进行域(子总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026浙江宁波市体育科学研究所招聘非事业编制工作人员备考题库及完整答案详解一套
- 2026天津市北方人力资源管理顾问有限公司津南分公司招聘实习生备考题库及答案详解(考点梳理)
- 2026广东汕头市潮阳区西胪镇乡村公益性岗位招聘备考题库及答案详解(名师系列)
- 202天津绿色能源发展有限公司社会招聘2人备考题库及答案详解(典优)
- 高中化学实验安全教育与虚拟仿真软件的结合分析教学研究课题报告
- 2026福建泉州发展集团有限公司人才引进招聘10人备考题库附答案详解(研优卷)
- 2026山东潍坊滨海经济技术开发区招聘中学教师20人备考题库含答案详解(巩固)
- 校方教育协同合作承诺书6篇
- 量子计算安全功能承诺书7篇
- 数据驱动精准营销策略在奢侈品中的应用-洞察与解读
- 《预算执行常态化监督发现问题纠偏整改操作指南(试行)》
- 2026年“建安杯”信息通信建设行业安全竞赛核心考点题库
- T-CCSAS 062-2026《行为安全观察与沟通实施指南》
- 备战2026河南中考英语:补全对话7大场景高频问句及答语梳理+解题技巧
- 应急演练组织规范及流程
- 砖混转框架施工方案样本
- T-CHAS 10-2-19-2023 中国医院质量安全管理 第2-19部分:患者服务 内镜治疗
- 2025年农产品质量与安全管理试卷及答案
- DB11∕T 1072-2025 城市桥梁工程施工质量检验标准
- 中国农业大学强基计划真题笔试
- 2025年公安院校联考考试面试试题及答案
评论
0/150
提交评论