




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 中级经济师 经济基础知识 经济学基础 第22章抽样调查 2 第22章抽样调查一 抽样调查基本概念 一 抽样调查基本概念抽样调查是一种非全面调查 它是从全部调查研究对象中 抽选一部分单位进行调查 并据以对全部调查研究对象作出估计和推断的一种调查方法 显然 抽样调查虽然是非全面调查 但它的目的却在于取得反映总体情况的信息资料 因而 也可起到全面调查的作用 根据抽选样本的方法 抽样调查可以分为概率抽样和非概率抽样两类 概率抽样是按照概率论和数理统计的原理从调查研究的总体中 根据随机原则来抽选样本 并从数量上对总体的某些特征作出估计推断 对推断出可能出现的误差可以从概率意义上加以控制 习惯上将概率抽样称为抽样调查 3 第22章抽样调查一 抽样调查基本概念 总体与样本根据研究目的而确定的同质观察单位的全体称为总体 Population 更确切的说 它是同质的所有观察单位某种观察值的集合 研究中实际观测或调查的一部分个体称为样本 sample 研究对象的全部称为总体 为了使样本能够正确反映总体情况 对总体要有明确的规定 总体内所有观察单位必须是同质的 在抽取样本的过程中 必须遵守随机化原则 样本的观察单位还要有足够的数量 又称 子样 按照一定的抽样规则从总体中取出的一部分个体 样本中个体的数目称为 样本容量 4 第22章抽样调查一 抽样调查基本概念 抽样框抽样框又称 抽样框架 抽样结构 是指对可以选择作为样本的总体单位列出名册或排序编号 以确定总体的抽样范围和结构 设计出了抽样框后 便可采用抽签的方式或按照随机数表来抽选必要的单位数 若没有抽样框 则不能计算样本单位的概率 从而也就无法进行概率选样 抽样单元抽样单元 是指构成总体的个体项目 5 关系 抽样框与抽样单元是抽样的一对基本范畴 其单元满足 与实际总体的每个单元之间存在确定的对应关系 凭借这种对应关系可以找到实际总体中特定的一个或一些单元 条件的实际总体的映射总体称为抽样框 构成映射总体的单元则称为抽样单元 换言之 包含所有抽样单元的总体称为抽样框 抽样单元构成抽样框的单元称为抽样单元 6 二 概率抽样与非概率抽样 1概率抽样 1 概率抽样 是最理想 最科学的抽样方法 能保证样本数据对总体参数的代表性 而且它能够将调查误差中的抽样误差限制在一定范围内 概率抽样包括以下形式 简单随机抽样 是最基本的形式 是完全随机的选择样本 分层抽样 整体抽样 等距抽样 又称作系统抽样 7 二 概率抽样与非概率抽样 2 非概率抽样 非概率抽样 调查者根据自己的方便或主观判断抽取样本的方法 它不是严格按随机抽样原则来抽取样本 所以失去了大数定律的存在基础 也就无法确定抽样误差 无法正确地说明样本的统计值在多大程度上适合于总体 虽然根据样本调查的结果也可在一定程度上说明总体的性质 特征 但不能从数量上推断总体 非概率抽样主要有偶遇抽样 主观抽样 定额抽样 滚雪球抽样等类型 8 二 概率抽样与非概率抽样 2 非概率抽样 非概率抽样不是完全按照随机原则选取样本 判断抽样又称 立意抽样 是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法 方便抽样自愿抽样配额抽样 9 三 抽样调查一般步骤 确定调查问题调查方案设计实施调查过程数据处理分析撰写调查报告 10 四 抽样调查的误差 抽样方法本身所引起的误差 当由总体中随机地抽取样本时 哪个样本被抽到是随机的 由所抽到的样本得到的样本指标x与总体指标 之间偏差 称为实际抽样误差 当总体相当大时 可能被抽取的样本非常多 不可能列出所有的实际抽样误差 而用平均抽样误差来表征各样本实际抽样误差的平均水平 11 四 抽样调查的误差 抽样误差 抽样的随机性造成非抽样误差 由其他原因引起 抽样框误差是因不准确或不完整的抽样框而引起的误差 从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况 这就存在抽样框误差 在实践中由于设计或是资料本身等方面的原因 目标总体与抽样总体往往不一致 无法保证样本的代表性 而且由于目标总体单位数不准确 对总体进行估计时就会产生估计量偏倚 增大其方差 这种误差并不是来自抽样的随机性 而是产生于不完善的抽样框 因此称为抽样框误差 抽样框误差是一种非抽样误差 12 四 抽样调查的误差 所谓无回答误差 就是指的数据丢失 数据丢失的原因有两种 一是有意不回答 二是无意不回答 有意识不回答 主要指被调查者拒绝访问或拒绝就某一个问题给予回答 无意识不回答则可能受访者不在家或者是访问者疏忽 导致数据遗漏 回答误差比较普遍 是影响统计数据质量和利用效益的一个重要因素计量误差 调查所获得的数据与真值之间不一致造成的误差 13 二 几种基本概率抽样方法 简单随机抽样也称为单纯随机抽样 纯随机抽样 SRS抽样 是指从总体N个单位中任意抽取n个单位作为样本 使每个可能的样本被抽中的概率相等的一种抽样方式 一般地 设一个总体含有N个个体 如果通过逐个抽取的方法从中抽取一个样本 且每次抽取时各个个体被抽到的概率相等 则这样的抽样方法叫做简单随机抽样 14 二 几种基本概率抽样方法 简单随机抽样简单随机抽样的特点是 每个样本单位被抽中的概率相等 样本的每个单位完全独立 彼此间无一定的关联性和排斥性 1 简单随机抽样要求被抽取的样本的总体个数N是有限的 2 简单随机样本数n小于等于样本总体的个数N 3 简单随机样本是从总体中逐个抽取的 4 简单随机抽样是一种不放回的抽样 5 系统抽样抽样的每个个体入样的可能性均为n N 15 分层抽样 先将总体的单位按某种特征分为若干次级总体 层 然后再从每一层内进行单纯随机抽样 组成一个样本的方法 一般地 在抽样时 将总体分成互不交叉的层 然后按一定的比例 从各层次独立地抽取一定数量的个体 将各层次取出的个体合在一起作为样本 这种抽样方法是一种分层抽样 又称分类抽样或类型抽样 将总体划分为若干个同质层 再在各层内随机抽样或机械抽样 分层抽样的特点是将科学分组法与抽样法结合在一起 分组减小了各抽样层变异性的影响 抽样保证了所抽取的样本具有足够的代表性 16 适用条件 分层抽样尽量利用事先掌握的信息 并充分考虑了保持样本结构和总体结构的一致性 这对提高样本的代表性是很重要的 当总体是由差异明显的几部分组成时 往往选择分层抽样的方法 17 实例应用 例如 一个单位的职工有500人 其中不到35岁有125人 35岁至49岁的有280人 50岁以上的有95人 为了了解这个单位职工与身体状况有关的某项指标 要从中抽取一个容量为100的样本 由于职工年龄与这项指标有关 决定采用分层抽样方法进行抽取 因为样本容量与总体的个数的比为1 5 所以在各年龄段抽取的个数依次为125 5 280 5 95 5 即25 56 19 18 系统抽样 等距抽样也称为系统抽样 机械抽样 SYS抽样 它是首先将总体中各单位按一定顺序排列 根据样本容量要求确定抽选间隔 然后随机确定起点 每隔一定的间隔抽取一个单位的一种抽样方式 是纯随机抽样的变种 在系统抽样中 先将总体从1 N相继编号 并计算抽样距离K N n 式中N为总体单位总数 n为样本容量 然后在1 K中抽一随机数k1 作为样本的第一个单位 接着取k1 K k1 2K 直至抽够n个单位为止 19 特征 等距抽样的特点是 抽出的单位在总体中是均匀分布的 且抽取样本可少于纯随机抽样 要求等距抽样既可以用同调查项目相关的标志排队 也可以用同调查项目无关的标志排队 等距抽样要防止周期性偏差 因为它会降低样本的代表性 例如 军队人员名单通常按班排列 10人一班 班长排第1名 若抽样距离也取10时 则样本或全由士兵组成或全由班长组成 20 整群抽样 又称聚类抽样 Clustersampling 是将总体中各单位归并成若干个互不交叉 互不重复的集合 称之为群 然后以群为抽样单位抽取样本的一种抽样方式 应用整群抽样时 要求各群有较好的代表性 即群内各单位的差异要大 群间差异要小 21 整群抽样 优缺点整群抽样的优点是实施方便 节省经费 整群抽样的缺点是往往由于不同群之间的差异较大 由此而引起的抽样误差往往大于简单随机抽样 样本分布面不广 样本对总体的代表性相对较差等缺点 22 多阶段抽样 是指将抽样过程分阶段进行 每个阶段使用的抽样方法往往不同 即将各种抽样方法结合使用 其在大型流行病学调查中常用 其实施过程为 先从总体中抽取范围较大的单元 称为一级抽样单元 再从每个抽得的一级单元中抽取范围更小的二级单元 依此类推 最后抽取其中范围更小的单元作为调查单位 23 多阶段抽样的过程 第一阶段 将总体分为若干个一级抽样单位 从中抽选若干个一级抽样单位入样 第二阶段 将入样的每个一级单位分成若干个二级抽样单位 从入样的每个一级单位中各抽选若干个二级抽样单位入样 依此类推 直到获得最终样本 24 多阶段抽样的过程 如果我们面对的一阶单元内总体基本单元数相当大 作全面的调查就会比较困难 或者一阶单元内各二阶单元可以给出相近的结果 作全面的调查又无必要 此时从费用和抽样估计效率考虑 便可以从总体中随机抽取一部分一阶单元 然后再从被抽中的一阶单元内 随机抽取部分二阶单元并对他们作全面调查 我们把这种抽样技术称为两阶抽样 25 多阶段抽样的过程 如果在被抽中的二阶单元中 再抽取部分三阶单元组成样本 并对抽中的三阶单元进行全面的调查 这就是三阶抽样 类似地 可以定义四阶抽样或更高阶的抽样 通常将两阶以上的抽样称为多阶段抽样 需要指出的是 多阶段抽样中 各阶可以采用不同的抽样方法 也可采用同一种抽样方法 要视具体情况和要求而定 在两阶抽样中 总体各一阶单元所包含的二阶单元数 有相等和不相等的两种情况 前者无论在样本的抽取还是在指标的估算方面都相对比较简单 然而在抽样实践中却很少有这种情况的存在 但作为基本方法仍然有其实际意义 后种情况在抽样和指标的估算方法上都较为复杂 然而在实际中普遍存在此种情况 26 三 估计量与样本量 参数的点估计就是根据样本构造一个统计量 作为总体未知参数的估计 定义1设总体的X未知参数为 样本为 根据样本构造一个统计量作为未知参数的估计 则称这个统计量为未知参数的估计量 用来估计总体未知参数用的统计量 当经测定的具体数值代入估计量时 它就是一个具体的数值 称为估计值 英文是estimate 27 三 估计量与样本量 无偏性估计值在待估参数的真值附近摆动 对待估参数的真值无偏倚 从分析测试的观点看 无偏性意味着测定的准确度 总体参数的无偏估计量的意义为 样本估计量 平均数 变异数 方差等 的数学期望等于母体真值 有效性由样本值求得的估计值 方差越小 估计值接近待估参数的概率越大 这种特性称为估计的有效性 在诸多无偏估计值中 具有最小方差的无偏估计值为有效估计值 因为多次测定的平均值比单次测定值xi具有更好的精密度 因此 用平均值要比单次测定值xi作为总体均值 的估计值更有效 28 三 估计量与样本量 有效性由样本值求得的估计值 方差越小 估计值接近待估参数的概率越大 这种特性称为估计的有效性 在诸多无偏估计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB65T 3678-2015 籽瓜膜下滴灌栽培技术规程
- 追电网络面试题库及答案
- 光华管理学院试题及答案
- 4.1免疫系统的组成和功能 教学设计 2023-2024学年高二上学期生物人教版选择性必修1
- 2025年终止商业店铺租赁合同协议书
- 2025年智能电网电力系统稳定控制关键技术研究
- 2025担保公司合同范本
- 管理学升本测试题及答案
- 三年级美术上册教案-《第2课 万花筒》教学设计人教版
- 2025年智能仓储机器人任务分配在仓储机器人智能人机协同中的技术创新
- 主体结构劳务分包工程(八标段)施工组织设计
- 营养与慢性伤口愈合的关系
- (正式版)JBT 9229-2024 剪叉式升降工作平台
- 六年级上册语文期末复习句子专项训练及答案
- 2019人教版高中英语选择性必修一UNIT 1 People of Achievement 单词表
- 电力变压器基础知识课件
- JJG 373-1997四球摩擦试验机
- GB/T 37785-2019烟气脱硫石膏
- GB/T 29343-2012木薯淀粉
- 班组长能力提升培训讲义课件
- 少先队大队委申请表
评论
0/150
提交评论