




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章抽样设计 抽样设计将要解决的是调查谁的问题 即如何挑选调查对象的问题 要解决包括选择哪一部分作为调查对象 这部分应包含的个体有多少 用什么样的方法进行选择 以及所选出来这一部分调查对象与总体间的关系是什么等问题抽样设计的假设 1部分是含于整体之中2部分与整体具有相同的特征 规律 相互关系及变化过程3部分能够为研究者提供一个有关整体状态 态度 意见和行为更加清晰的脉络 抽样的基本术语 总体与样本总体是所研究调查对象的全体 用N来表示样本是从总体中抽取的部分个体 构成了调查的直接对象 用n来表示 每个被抽取进入样本的单元叫做入样单元 抽样的基本术语 抽样框抽样框指的是包含所有抽样单元的详细名单 地图或其他形式的资料 在抽样框中 每个抽样单元都有自己的对应位置或顺序 通常通过编号来实现 分为名单抽样框 地图抽样框 时间抽样框例如 要在全国抽取一部分城镇家庭进行调查 可先抽取若干个省 然后在抽取到的省抽取若干个城镇 最后在从这些抽取到的城镇中抽取家庭样本 全部省的名单 抽中省的所有城镇的名单 抽中城镇中所有家庭的名单都是抽样框 抽样的基本术语 参数与统计量参数也叫总体指标或调查的目标量 是用来描述总体特征的一些指标 是研究所要了解的最终目标 它是未知的 需要通过样本数据来进行估计参数的类型 1 总体均值 如某市居民平均收看电视的时间 2 总体中具有某种特征的个体所占的比重 如固定收看栏目A的忠诚观众的比例 3 总体总量统计量则是关于样本中某一变量的描述 抽样调查的重要内容就是通过样本统计量来推算总体的参数 从而达到由部分推知总体的目的 常用的参数和统计量有平均数 百分比 标准差 相关系数等 抽样的基本术语 抽样误差和非抽样误差由于总体中个体的差异性 在用样本统计量去推断总体的参数时 总会存在误差 这种误差称为抽样误差 抽样误差是衡量样本代表性强弱的标准 非抽样误差是指在调查设计 抽样实施 数据收集和分析中 因为各种人为原因而产生的误差 样本容量 抽样误差 总体内部差异 抽样方式 抽样的基本术语 置信水平和误差估计置信水平是指总体参数落在由样本统计量所构造的某一区间的概率误差估计 是指某一置信度下 样本统计量与总体参数之间的误差范围 例子 假定要进行一项有关全国性报纸的广告内容方面的研究 试说明拟研究的总体 抽样框 记录单位 解 为了简化问题 假定研究的主要目的是改革开放30年来 人民日报 中国青年报 光明日报 三份全国性报纸的广告规模 内容及形式等方面的变化总体 1987年1月1日至2007年12月31日在上述三份报纸上刊出的全部广告抽样框 北京图书馆内可以查阅到的在此30年期间上述三份报纸上的广告抽样单位 报纸 可以按照等距抽样来进行记录单位 每份报纸上各个版面各种类型的广告总体参数 各类报纸和版面上不同时期刊出的平均广告条数 平均面积数 各种类型广告条数所占的比重 面积所占的比重等 抽样的基本程序 明确研究的目的 确定研究所要估计的主要总体参数确定研究总体和抽样单元确定和构造抽样框 在确定调查总体和抽样单位后 应将总体按照抽样单位划分为各部分 构成抽样框选择适当的抽样方法以及确定样本量的大小制定抽样方案的具体实施细节 抽样方法 概率抽样和非概率抽样 概率抽样是以一定的统计原则和一定的程序进行选择 每个单元被选择的概率是已知的 可以由抽样结果来推断总体 而非概率抽样并不遵循统计规律 而是根据主观意识在研究对象中进行的选择 1 概率抽样 简单随机抽样 SRS 简单随机抽样又称单纯随机抽样 是所有随机抽样方法中最简单的一种方法 它按照随机的原则从调查总体中不加任何分类 排序 分组等先行工作 直接从总体中不放回地逐个抽取单位 每次抽取都要保证所有未被抽取进入样本的单位都有相同的被抽中的概率 各单位被抽到的机会完全均等 相互独立 排除了抽样过程中各种主观因素的干扰 例题 例 从以下由N 5个元素 X1 10 X2 15 X3 20 X4 25 X5 30 组成的总体中抽取一个由n 2个元素构成的简单随机样本 试给出所有可能的抽样结果 简单随机抽样的方法 1 抽签法 将抽样框中的N个元素编码 将每个元素的号码写在签上 将签充分的混合 随机不放回的抽取2 随机数字表法 查表例题 在某居民小区中抽取40 的样本 2 等距抽样 等距抽样是简单随机抽样的变种 又称为系统抽样或机械抽样 它是先将总体各单位按照某一标志排列 然后根据一定的抽样间距从总体中抽取样本 或者将总体划分为若干类型 然后在各类型中根据一定的抽样距离抽取样本的一种抽样方法 等距抽样是以总体的随机排列为前提的 如果总体的排列出现规律性的分布时 而抽样间距又与这种规律性重合时 等距抽样会出现极大的误差 例 为了了解参加某种知识竞赛的1000名学生的成绩 应采用什么样的抽样方法恰当 样本量为50个 解 适宜选用系统抽样 抽样过程如下 1 随机将这1000名学生编号为1 2 3 1000 比如可以利用准考证号 2 将总体按编号顺序平均分成50部分 每部分包含20个个体 3 在第一部分的个体编号1 2 20中 利用简单随机抽样抽取一个号码 比如是18 4 以18为起始号 每间隔20抽取一个号码 这样就得到一个容量为50的样本 18 38 58 978 998 3 分层随机抽样 2 分层抽样也称分类抽样 方法是将总体按照某些重要的指标分成若干个互不重叠 穷尽的子总体 使总体中的每一个单位都属于且只属于一个子总体 这样的子总体称为层或类 然后在每个子总体内分别抽样一个子样本 各子样本综合成一个总样本 总体N 样本n 等额 比例 最优 分层比例抽样 先将总体按照相似性原则分为若干层 然后根据各层在总体中所占的比重从层中抽取相应的样本组成研究样本 分层抽样可以避免样本差异过大导致的抽样分布不准确 小学或以下10 初中20 大专以上30 高中或中专40 大专以上3000人N1 高中或中专4000人N2 初中2000人N3 小学或以下1000人N4 30n1 40n2 20n3 10n4 总体N 10000 样本n 100人 分层指标的选取 研究者一般是选择与调查中欲测量的变量高度相关的指标 即把对所要研究的变量有重大影响的因素作为分层变量分层的标准 同一层内的个体有较好的同质性 不同层间的元素具有明显的异质性 4 pps抽样 Samplingwithprobabilityproportionaltosize 大小与规模成比例的不等概率抽样 1999年北京广播学院调查设计中国人民银行城镇储户调查抽样方案中 第一阶段采用分层抽样的方法在655个城市中随机抽取50个城市 首先 把全国655个城市按照 城乡居民年末储蓄余额 年末市区人口数 职工平均工资水平 社会消费品零售总额 人口密度 这5个和储蓄行为紧密有关的指标把全部城市分为5层 如表 PPS 指在总体中参照各单位的规模 重要性 进行抽样 规模大的被抽取的机会大 总体中每个个体被抽中的概率与该个体的规模成正比的抽样 按照pps操作可以根据城市的大小给以每个城市不同的被抽中机会 根据这个思路接着考察每层中各城市的市区人口数并决定每层应抽取的城市数 PPS的基本步骤 规定总体单位 大小 的度量计算总体中各单元被抽中的概率根据其概率确定分配给总体中各单元的样本数 5 整群抽样概述 整群抽样是先将市场调查的总体划分为若干个群体 然后以简单随机抽样的方法选取部分群体作为调查样本 对群体内各个单位进行调查的一种随机抽样方法 整群抽样适用于调查总体单位分布较分散并且无法确定分层标准的大总体 当调查总体相当大时 可以进行逐级分群 一直进行到单个群体的数目足够小时为止 然后从所有的群中随机抽取一定的群作为调查对象实施调查 整群抽样对总体推断的准确性较差 因而往往与其它方法相结合使用 总体群数R 16样本群数r 4样本容量 A B C D E F G H I J K L M N O P L H P D 整群抽样的划分标准 整群抽样与分层抽样类似 它们的第一步都是根据某种标准将总体划分为一些子群 但两者分群的原则完全不同 分层抽样在总样本中每层都有自己的代表 因而它要求层的划分具有较高的代表性 即各层间的差异性尽可能大 而层内的差异性尽可能小 整群抽样则相反 要求群间的差异尽可能小 而群内的差异尽可能大 6 多阶段抽样 多阶段抽样是指样本通过一次以上的抽样而得到样本的方法 共有50个村 270人 200人 180人 170人 210人 190人 110人 180人 190人 200人 170人 190人 210人 20人 20人 20人 20人 总体N 10000 样本n 100 110人 20人 案例 调查背景 为了解普通居民对某种新节目的接受程度 需要在一个城市中抽选1000户居民开展市场调查 在每户居民中 选择1名家庭成员作为受访者 总体抽样设计 由于一个城市中居民的户数可能多达数百万 除了一些大型的市场研究机构和国家统计部门之外 大多数企业都不具有这样庞大的居民户名单 这种情况决定了抽样设计只能采取多阶段抽选的方式 根据调查要求 抽样分为两个阶段进行 第一阶段是从全市的居委会名单中抽选出50个样本居委会 第二阶段是从每个被选中的居委会中 抽选出20户居民 对居委会的抽选从统计或者民政部门 我们可以获得一个城市的居委会名单 将居委会编上序号后 用计算机产生随机数的方法 可以简单地抽选出所需要的50个居委会 如果在居委会名单中还包括了居委会户数等资料 则在抽选时可以采用pps不等概率抽选的方法 在居委会中的抽样在选定了居委会之后 对居民户的抽选将使用居委会地图来进行操作 此时 需要派出一些抽样员 到各居委会绘制居民户的分布图 抽样员需要了解居委会的实际位置 实际覆盖范围 并计算每一幢楼中实际的居住户数 然后 抽样员根据样本量的要求 采用等距或者其他方法 抽选出其中的若干户 作为最终访问的样本 确定受访者访问员根据抽样员选定的样本户 进行入户访问 以谁为实际的被调查者 是抽样设计中最后一个问题 如果调查内容涉及的是受访户的家庭情况 则对受访者的选择可以根据成员在家庭生活中的地位确定 例如 可以选择使用计算机最多的人 收入最高的人 实际负责购买决策的人等等 2 3非随机抽样调查 任意抽样法 或方便抽样 研究者把一定时间内一定环境里最容易接触到的人作为样本的方法 如街头拦访判断抽样法 或判断抽样 根据自己的知识经验或技能等有目的的选择样本配额抽样法 根据调查目的找出与研究目的关系密切的特性作为配额指标 抽样时保证样本中具有某种特性的比例与总体中具有这种特性的比例一致 配额抽样法 配额抽样法的基本步骤选择控制特性作为分层标准分层确定各层样本额配额指派配额抽样法是在分层基础上进行的 配额抽样根据其抽样方法可以分为独立控制配额抽样交叉控制配额抽样 独立控制配额抽样 比如 一项研究要调查400名北京市区18 42岁的白领阶层对时尚的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部编人教版四年级语文下册《综合性学习 轻叩诗歌大门》示范课教学课件
- 科学技术考试题及答案
- 邮储银行2025菏泽市结构化面试15问及话术
- 建设银行2025随州市秋招笔试EPI能力测试题专练及答案
- 农业银行2025酒泉市秋招面试典型题目及参考答案
- 农业银行2025海口市笔试英文行测高频题含答案
- 工商银行2025孝感市秋招英文面试题库及高分回答
- 2025年3D打印的定制化医疗产品发展
- 建设银行2025凉山彝族自治州秋招笔试性格测试题专练及答案
- 交通银行2025济南市秋招笔试价值观测评题专练及答案
- 地砖铺贴分包合同协议书
- 2025年山东省青岛市中考英语真题
- 煤矿智能掘进员内部技能考核试卷及答案
- 新《斜视弱视学》期末考试复习题库(含答案)
- 幼儿园数学活动《6和7的认识》课件
- 大语言模型与安全 课件 第3章 多模态大语言模型
- 人民医院开展“改善就医感受提升患者体验”主题活动实施方案
- 2025四川成都崇州市国有资产监督管理局市属国有企业面向社会招聘中层管理人员和员工19人笔试模拟试题及答案解析
- 2025年《医疗器械质量管理规范》培训试题(附答案)
- 2025年小学生宪法素养竞赛题库
- 2025年php考试题及答案笔试
评论
0/150
提交评论