




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 抽样设计l 抽样设计将要解决的是调查谁的问题,即如何挑选调查对象的问题。要解决包括选择哪一部分作为调查对象,这部分应包含的个体有多少,用什么样的方法进行选择,以及所选出来这一部分调查对象与总体间的关系是什么等问题l 抽样设计的假 设: 1部分是含于整体之中l 2部分与整体具有相同的特征、规律、相互关系及变化过程l 3部分能够为研究者提供一个有关整体状态、态度、意见和行为更加清晰的脉络抽样的基本术语 l 总体与样本l 总体是所研究调查对象的全体,样本是从总体中抽取的部分个体,构成了调查的直接对象l 参数与统计量l 参数也叫总体指标或调查的目标量,是用来描述总体特征的一些指标,是研究所要了解的最终目标。它是未知的,需要通过样本数据来进行估计;统计量则是关于样本中某一变量的描述,抽样调查的重要内容就是通过样本统计量来推算总体的参数,从而达到由部分推知总体的目的。常用的参数和统计量有平均数、百分比、标准差、相关系数等抽样的基本术语l 抽样框l 抽样框指的是包含所有抽样单元的详细名单、地图或其他形式的资料。在抽样框中,每个抽样单元都有自己的对应位置或顺序,通常通过编号来实现。l 例如:要在全国抽取一部分城镇家庭进行调查,可先抽取若干个省、然后在抽取到的省抽取若干个城镇、最后在从这些抽取到的城镇中抽取家庭样本。全部省的名单、抽中省的所有城镇的名单、抽中城镇中所有家庭的名单都是抽样框抽样的基本术语l 抽样误差和非抽样误差l 由于总体中个体的差异性,在用样本统计量去推断总体的参数时,总会存在误差,这种误差称为抽样误差。抽样误差是衡量样本代表性强弱的标准。非抽样误差是指在抽样过程中因为各种人为原因违反随机原则而产生的误差样本容量样本容量 抽样误差总体内总体内部差异部差异抽样方式抽样方式抽样的基本术语l 置信度和置信区间l 置信度是指总体参数落在由样本统计量所构造的某一区间的概率l 置信区间是指某一置信度下,样本统计量与总体参数之间的误差范围抽样的基本程序l 明确研究的目的,确定研究所要估计的主要总体参数l 确定研究总体和调查总体l 确定和构造抽样框:在确定调查总体和抽样单位后,应将总体按照抽样单位划分为各部分,构成抽样框l 选择适当的抽样方法以及确定样本量的大小l 制定抽样方案的具体实施细节概率抽样和非概率抽样l 概率抽样是以一定的统计原则和一定的程序进行选择,每个单元被选择的概率是已知的,可以由抽样结果来推断总体;而非概率抽样并不遵循统计规律,而是根据主观意识在研究对象中进行的选择1、概率抽样 - 简单随机抽样( SRS)l 简单随机抽样又称单纯随机抽样,是所有随机抽样方法中最简单的一种方法。它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接从总体中不放回地逐个抽取单位,每次抽取都要保证所有未被抽取进入样本的单位都有相同的被抽中的概率。各单位被抽到的机会完全均等,相互独立,排除了抽样过程中各种主观因素的干扰。简单随机抽样的方法l 1、抽签法l 2、随机数字表法2、等距抽样l 等距抽样是简单随机抽样的变种,又称为系统抽样或机械抽样。它是先将总体各单位按照某一标志排列,然后根据一定的抽样间距从总体中抽取样本;或者将总体划分为若干类型,然后在各类型中根据一定的抽样距离抽取样本的一种抽样方法。l 等距抽样是以总体的随机排列为前提的,如果总体的排列出现规律性的分布时,而抽样间距又与这种规律性重合时,等距抽样会出现极大的误差l 例:为了了解参加某种知识竞赛的 1000名学生的成绩,应采用什么样的抽样方法恰当?(样本量为 50个)l 解:适宜选用系统抽样,抽样过程如下:l ( 1)随机将这 1000名学生编号为 1, 2, 3, ,1000(比如可以利用准考证号)。l ( 2)将总体按编号顺序平均分成 50部分,每部分包含20个个体。l ( 3)在第一部分的个体编号 1, 2, , 20中,利用简单随机抽样抽取一个号码,比如是 18。l ( 4)以 18为起始号,每间隔 20抽取一个号码,这样就得到一个容量为 50的样本: 18, 38, 58, , 978,998。3、分层随机抽样 2分层抽样也称分类抽样,方法是将总体按照某些重要的指标分成若干个互不重叠、穷尽的子总体,使总体中的每一个单位都属于且只属于一个子总体。这样的子总体称为层或类,然后在每个子总体内分别抽样一个子样本,各子样本综合成一个总样本总体N样本n等额比例最优 分层比例抽样l 先将总体按照相似性原则分为若干层,然后根据各层在总体中所占的比重从层中抽取相应的样本组成研究样本。分层抽样可以避免样本差异过大导致的抽样分布不准确。小学或以下 10%初中 20% 大专以上 30%高中或中专 40%大专以上3000人N1高中或中专4000人N2初中2000人N3小学或以下1000人N430n140n220n310n4总体 N=10000样本 n=100人pps抽样 (Sampling with probability proportional to size)大小与规模成比例的不等概率抽样l 指在总体中参照各单位的规模进行抽样,规模大的被抽取的机会大,总体中每个个体被抽中的概率与该个体的规模成正比的抽样。l 1999年北京广播学院调查设计中国人民银行城镇储户调查抽样方案中,第一阶段采用分层抽样的方法在 655个城市中随机抽取 50个城市。首先,把全国 655个城市按照 “城乡居民年末储蓄余额 ”、 “年末市区人口数 ”、 “职工平均工资水平 ”、 “社会消费品零售总额 ”、 “人口密度 ”这 5个和储蓄行为紧密有关的指标把全部城市分为 5层,如表:层 特征 所包含城市数一 特大城市 2二 大城市 13三 人口密度的大中城市 49四 经济 活 跃 的中等城市 156五 经济 欠 发 达的中小城市 435合 计 655按照 pps操作可以根据城市的大小给以每个城市不同的被抽中机会。根据这个思路接着考察每层中各城市的市区人口数并决定每层应抽取的城市数层 所包含城市 市区人口数 每 层 占全部的 % 应 抽取的城市数一 2 1689.42 3.3 2二 13 4599.08 9.0 5三 49 3822.44 7.5 4四 156 12772.74 25.1 12五 435 28066.03 55.1 27合 计 655 50958.71 100.0 50分层指标的选取l 研究者一般是选择与调查中欲测量的变量高度相关的指标,即把对所要研究的变量有重大影响的因素作为分层变量l 分层的标准:同一层内的个体有较好的同质性、不同层间的元素具有明显的异质性4、整群 抽 样 概 述l 整群抽样是先将市场调查的总体划分为若干个群体,然后以简单随机抽样的方法选取部分群体作为调查样本,对群体内各个单位进行调查的一种随机抽样方法。整群抽样适用于调查总体单位分布较分散并且无法确定分层标准的大总体。当调查总体相当大时,可以进行逐级分群,一直进行到单个群体的数目足够小时为止,然后从所有的群中随机抽取一定的群作为调查对象实施调查。整群抽样对总体推断的准确性较差。因而往往与其它方法相结合使用。总体群数 R=16 样本群数 r=4 样本容量ABCDEFG H IJKLM NOP LHPD整群抽样的划分标准l 整群抽样与分层抽样类似,它们的第一步都是根据某种标准将总体划分为一些子群,但两者分群的原则完全不同。分层抽样在总样本中每层都有自己的代表,因而它要求层的划分具有较高的代表性,即各层间的差异性尽可能大,而层内的差异性尽可能小;整群抽样则相反,要求群间的差异尽可能小,而群内的差异尽可5、多阶段抽样l 多阶段抽样是指样本通过一次以上的抽样而得到样本的方法共有 50个村270人 200人 180人 170人 210人 190人 110人 180人 190人200人170人190人210人20人20人20人20人总体 N=10000样本 n=100110人20人案例l 调查背景:为了解普通居民对某种新产品的接受程度,需要在一个城市中抽选 1000户居民开展市场调查,在每户居民中,选择 1名家庭成员作为受访者。l 总体抽样设计: 由于一个城市中居民的户数可能多达数百万,除了一些大型的市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大的居民户名单。这种情况决定了抽样设计只能采取多阶段抽选的方式。根据调查要求,抽样分为两个阶段进行,第一阶段是从全市的居委会名单中抽选出 50个样本居委会,第二阶段是从每个被选中的居委会中,抽选出 20户居民。l 对居委会的抽选 从统计或者民政部门,我们可以获得一个城市的居委会名单。将居委会编上序号后,用计算机产生随机数的方法,可以简单地抽选出所需要的 50个居委会。如果在居委会名单中还包括了居委会户数等资料,则在抽选时可以采用不等概率抽选的方法。l 在居委会中的抽样 在选定了居委会之后,对居民户的抽选将使用居委会地图来进行操作。此时,需要派出一些抽样员,到各居委会绘制居民户的分布图,抽样员需要了解居委会的实际位置、实际覆盖范围,并计算每一幢楼中实际的居住户数。然后,抽样员根据样本量的要求,采用等距或者其他方法,抽选出其中的若干户,作为最终访问的样本。 l 确定受访者 访问员根据抽样员选定的样本户,进行入户访问。以谁为实际的被调查者,是抽样设计中最后一个问题。如果调查内容涉及的是受访户的家庭情况,则对受访者的选择可以根据成员在家庭生活中的地位确定,例如,可以选择使用计算机最多的人、收入最高的人、实际负责购买决策的人等等。 2.3 非随机抽样调查l 任意抽样法,或方便抽样:研究者把一定时间内一定环境里最容易接触到的人作为样本的方法,如街头拦访l 判断抽样法,或判断抽样:根据自己的知识经验或技能等有目的的选择样本l 配额抽样法 : 根据调查目的找出与研究目的关系密切的特性作为配额指标,抽样时保证样本中具有某种特性的比例与总体中具有这种特性的比例一致配额抽样法l 配额抽样法的基本步骤选择控制特性作为分层标准分层确定各层样本额配额指派l 配额抽样法是在分层基础上进行的。配额抽样根据其抽样方法可以分为独立控制配额抽样交叉控制配额抽样独立控制配额抽样l 比如:一项研究要调查 400名北京市区 18-42岁的白领阶层对时尚的看法,配额的重要指标是城区、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比例,则 400人的样板也应该与总体中各项指标的比例相一致。如下表城区 东 城 西城 朝阳 海淀 宣武 崇文 合 计50 50 100 100 50 50 400性 别 男 女 400人200 200年 龄 18-28岁 29-35岁 36-42岁 400人100 200 100职业公 务员 企 业 管理 公司行政 科教 卫 事业单 位大学生400人80 60 140 80 40交叉控制配额抽样l 交叉控制配额抽样是要求样本按比例同时满足几个配额条件,并能够保证任意配额指标与总体的分布相一致。以 年龄、性别与收入水平作为交叉控制因素进行配额抽样的样本配额分布收入水平高 中 低 合 计性 别 男 女 男 女 男 女年龄50以上 6 19 4 13 2 6 502
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海南湖职业技术学院《电子商务案例分析》2023-2024学年第二学期期末试卷
- 长安大学《空间规划与方法》2023-2024学年第二学期期末试卷
- 德阳农业科技职业学院《粉画技法》2023-2024学年第二学期期末试卷
- 安徽林业职业技术学院《材料科学基础A》2023-2024学年第二学期期末试卷
- 北京舞蹈学院《数字移动通信》2023-2024学年第二学期期末试卷
- 北京汇佳职业学院《多元统计分析课程实验》2023-2024学年第二学期期末试卷
- 广西外国语学院《JAVA语言与网络编程》2023-2024学年第二学期期末试卷
- 2025上海家居室装修施工合同
- 2025签订购房合同前先了解这些
- 上海微型货车租车合同范例
- 肾上腺皮质功能减退护理
- 村干部笔试题库及答案
- 学校食堂安全风险管控清单
- 高低压柜常见故障及检修培训
- 供应商分级制度
- 安徽省C20教育联盟2025年九年级中考“功夫”卷(一)数学(原卷版+解析版)
- 家校社协同育人促进学生核心素养发展的实践研究范文
- 第7课《我们有新玩法》第2课时《我们一起来创造》课件 道德与法治二年级下册 统编版
- 医院胸痛中心应知应会
- 厂房拆除及重建施工合同协议
- 《晨会的重要性》课件
评论
0/150
提交评论