第五节 抽样调查技术_第1页
第五节 抽样调查技术_第2页
第五节 抽样调查技术_第3页
第五节 抽样调查技术_第4页
第五节 抽样调查技术_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章第五节抽样调查技术一、抽样调查的内涵二、抽样调查的原理与步骤三、概率抽样技术四、非概率抽样技术五、抽样质量的检验总体(Population)研究对象的全体,是研究者希望概化的目标群体。例:中国西南地区所有高中校长、某高校全体本科学生样本(Sample)按一定方式从总体中抽取的、具有代表性的部分个体集合。例:从600人中抽取50人组成样本样本容量(SampleSize)样本中包含的个体数量,通常用符号n表示。例:样本量n=50抽样框(SamplingFrame)一次直接抽样时,总体中所有抽样单元的范围名单。它是抽取样本的依据。例:全校学生名单、班级花名册、电话号码簿抽样方法(SamplingMethod)概率抽样:总体中每个个体被抽中概率已知且相等(随机原则)。非概率抽样:不遵循随机原则,基于主观判断或方便性抽取。一、抽样调查的内涵——核心概念节省资源大幅降低人力、物力、时间消耗,避免全面调查的高成本(如无需对6000万初中生逐一测验)。时效性强数据收集与处理周期短,能快速反映总体最新动态(如市场需求快速变化的调查场景)。提升准确性减少大规模调查的操作误差和数据加工误差,样本研究更细致(避免“非抽样误差”)。一、抽样调查的内涵——意义基本原理基于概率论,通过随机抽取样本,利用样本统计值科学推断总体特征。实施步骤1.规定总体对总体的基本特征作出明确的定义2.方案设计定义抽样单元,确定样本容量3.技术实施选择具体技术,抽取样本4.统计推论计算统计量5.质量评估评估抽样误差二、抽样调查的原理与步骤简单随机抽样采用抽签或随机数字表法,确保总体中每个个体都有同等概率被直接抽取。系统抽样先给总体编号,计算间隔(K=N/n),随机确定起点后,按固定间隔抽取样本。分层抽样将总体按特征分层,在各层内独立抽样,能有效保证层内同质性,提高精度。整群抽样以群为基本单位进行随机抽取,一旦抽中某群,则调查该群内的所有个体。多阶段抽样分阶段抽取抽样单元,先抽大单元再抽小单元,适用于大规模、广分布总体。技术特点总结核心优势在于每个个体都有已知、非零的入样概率,样本代表性强,推断准确性高。三、概率抽样技术核心定义按等概率原则直接从总体(N)中随机抽取样本(n)。关键特征是:总体中每个个体被抽中的机会均等且相互独立,是最基本的抽样方法。适用场景最适用于总体规模较小、个体之间差异程度均匀的情况。若总体规模过大,编号和抽样的工作量会显著增加,此时通常结合其他抽样方法使用。操作方式抽签法:编号制签,混合后随机抽取。随机数字表法:编号后,利用随机数表任意起点读取编号。典型示例场景:从700人中抽取50人。步骤:编号001-700,从随机数字表读取3位数,跳过>700的编号,直至选够50人。三、概率抽样技术——简单随机抽样核心定义系统抽样又称等距抽样。操作逻辑为:先给总体个体依次编号,计算固定抽样间隔,随机确定起点后,按间隔规律抽取个体。关键计算公式抽样间隔K=总体量N/样本容量n示例:若总体N=180,样本n=15,则K=12标准操作步骤(N=180,n=15)1.编号:将总体180个个体顺序编号为1-180。2.算间隔:计算K=180/15=12。3.定起点:在1-12号中随机选取,例如选6为起点。4.抽样本:按间隔抽取6,18,30,...,174号个体。注意事项:避免系统性偏差必须确保总体的排列顺序与研究变量无关。若总体本身存在周期性规则分布,可能导致样本缺乏代表性。三、概率抽样技术——系统抽样核心定义将总体按核心特征(如年级、性别、专业)分成同质子总体(层),再在每层内独立抽样,最后合并样本。分层原则关键在于保证层内同质性与层间异质性:层内个体差异小:每个层次内部的个体特征尽可能一致。层间差异大:不同层次之间的特征差异尽可能明显。抽样比例类型等比例分层:按各层占总体比例抽样(如4:6:5),代表性好。非比例分层:根据需求调整比例,需后期加权处理。技术优势显著降低抽样误差,提高样本代表性。便于对总体内部不同层次的情况进行独立分析。三、概率抽样技术——分层抽样核心定义以“群”(如学校、班级)为基本抽样单位,随机抽取若干群,对抽中群内的所有个体进行全面调查。适用场景适用于总体范围广、难以获取个体名单,但易于获取群体名单的情况。例如:调查全国农村小学生,以“村小”为群。主要优点抽样框编制得以简化,节省调查成本,便于组织实施和管理,是大规模调查中常用的便捷方法。潜在缺点若群内个体差异小(同质化)、群间差异大,则抽样误差较大,样本代表性可能不足,影响推断精度。三、概率抽样技术——整群抽样偶遇抽样(方便抽样)指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或仅仅选择那些离得最近的、最容易找到的人作为调查对象。判断抽样(目的抽样)基于研究者的主观判断,选择那些被认为最能代表总体的个体作为样本。它依赖于研究者的经验、知识和判断力。定额抽样(配额抽样)先将总体按某种标准分类,然后在每一类中按一定比例分配样本数额,再由调查者在每一类中主观地抽取样本。雪球抽样先从几个适合的调查对象开始,通过他们得到更多的调查对象,一步步扩大样本范围,特别适合研究难以接触的特殊群体。四、非概率抽样技术核心定义又称方便抽样,是指调查者根据方便原则,选择那些最容易接触到的、最容易找到的个体作为样本的抽样方法。操作方式通常在街头、校园、商场、车站等公共场所,选取当时在场且愿意参与调查的人群作为样本。特点分析优点:简便易行,节省时间、人力和成本。缺点:代表性最差,结果无法推论到总体。适用场景仅适用于对问题的初步探索、预调查、试点研究或一些非正式的、即时性的研究,不适用于正式的结论性研究。四、非概率抽样技术——偶遇抽样核心定义又称目的抽样。研究者根据主观判断和经验,选择那些被认为最能代表总体特征的个体作为样本,而非随机抽取。选择依据基于研究者对研究对象的深入了解、研究的具体目的以及相关的理论假设来进行筛选。特点分析优点:充分利用专业知识,针对性强,适合特定问题的深入研究。缺点:依赖主观判断,可能存在偏差,客观性和普遍性易受质疑。适用场景案例研究:选取典型个案进行剖析深度访谈:寻找符合特定条件的受访者专家咨询:筛选领域内的权威人士四、非概率抽样技术——判断抽样核心定义又称配额抽样。先将总体按特征(如性别、年龄)分类并分配配额,再在每个类别中主观选取样本。操作步骤确定分层标准:选择与研究相关的特征计算各层配额:按总体比例分配样本数量按配额选取样本:偶遇或判断方式选取方法特点优点:样本结构与总体相似,比偶遇/判断抽样更具代表性。缺点:非随机抽样,层内选取存在主观偏差。与分层抽样的核心区别分层抽样是随机抽取,而定额抽样是主观选取。这是两者最本质的区别。四、非概率抽样技术——定额抽样核心定义又称网络抽样。通过已有的研究对象推荐符合条件的新对象,像滚雪球一样逐步扩大样本规模。操作步骤初始样本:寻找少数符合条件的个体抽样推荐:调查并请其推荐同类重复过程:直到达到规模或无新推荐适用场景针对难以接触、隐藏性强或规模较小的特殊群体。

例如:吸毒者、艾滋病患者、特定行业精英等。方法优势能够有效接触到常规抽样方法无法触及的特殊人群,解决了“找不到人”的核心难题,是探索性研究的有力工具。潜在局限样本通常具有较强的同质性(如朋友推荐朋友),导致样本代表性难以评估,统计推断的误差较大。四、非概率抽样技术——雪球抽样一、抽样误差(SamplingError)核心定义由于抽样的随机性引起的样本统计值与总体参数值之间的差异。主要特点不可避免,但可通过增大样本量、改进方法来减小,且可计算控制。误差来源样本与总体之间的随机差异,源于抽样过程本身。二、非抽样误差(Non-samplingError)核心定义除抽样误差外,由其他各种原因引起的误差,存在于调查的各个阶段。主要特点可以避免和消除,对研究结果的影响往往比抽样误差更大。误差来源抽样框不完整、问卷设计缺陷、调查员操作不当、受访者拒答或数据录入错误等。五、抽样质量的检验——误差来源样本与总体分布比较对比样本关键特征(如性别、年龄、学历)与总体结构的相似程度。计算抽样误差针对概率抽样,计算标准误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论