抽样技术.ppt_第1页
抽样技术.ppt_第2页
抽样技术.ppt_第3页
抽样技术.ppt_第4页
抽样技术.ppt_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样技术 授课老师 苏宇楠周二 14 00 15 50 南睿楼主南3 1周四 16 10 18 00 南睿楼主南3 1单周 课前交流 是否修过抽样课程 1 有2 没有是否修过调查课程 1 有2 没有实践经验1 有2 没有课程内容 第一章绪论 概念介绍 目标总体与抽样总体抽样框与抽样单元总体特征与估计量方差 偏差 均方误差抽样误差与非抽样误差精度与费用 第一章绪论 一 数据的来源1 统计数据的重要性量化研究的需要抽样调查是数据来源的重要途径样本的有效性问题 全球性调查报告 中国人均性伴侣数全球排第一 近日 2004年杜蕾斯全球性调查报告向社会发布 引人注目的是报告中显示中国人的平均性伴侣数最多 为19 3人 远远高于全球的平均数10 5人 而中国人平均每年性生活的频率却只有90次 排全球倒数第7位 低于全球平均水平103次 同时 报告还显示中国首次接受性教育的年龄为13 7岁 最接近世界平均水平 然而却只有22 的调查对象认为青少年性教育由家人或监护人完成 资料来源 北京晨报 2004年11月25日矛盾 为什么性伴侣最多 性频率却不高 首次接受性教育的年龄走低 却不是由家长来完成性教育任务 问题在于 样本是怎样产生的 到底多少人赞成取消 黄金周 2007年11月9 15日 新华网 人民网 国家发改委网站 新浪 搜狐等网站就 节假日调整方案 联合进行网上调查 约155万人通过网络参与了调查 调查结果是 68 的网民支持将 五一 节调整出的两天和新增加的一天用于增加清明 端午 中秋三个传统节日为国家法定节假日 81 的网民支持保留 十一 和春节两个黄金周 并将春节放假时间提前一天 即春节假从除夕开始 77 的网民支持调整前后周末形成元旦 清明 国际劳动节 端午 中秋五个连续三天的 小长假 90 网民支持国家全面推行职工带薪休假制度 资料来源 2007年11月16日 北京青年报 网友质疑 网民调查的比例是否就是全体公民意愿的比例 调查问卷中是否有缺欠 整个调查问卷以 五一 黄金周取消为前提 例如问卷中 对于保留十一和春节两个黄金周 您的态度是什么 这个问题 回避了五一黄金周存废问题 有偷换概念的嫌疑 该项调查也引起一片质疑 上述调查结果都是被社会广泛质疑的 从技术层面讲 被质疑的一个重要原因是没有说明样本的产生过程 样本的代表性 成功的案例也有 如美国总统竞选的预测 第一章绪论 美国总统竞选预测 民主党候选人共和党候选人实际汉佛莱 50 尼克松 50 尼 50 3 尼克松 62 尼 61 8 卡特 51 卡 51 1 里根 52 里 55 3 1984里根 59 里 59 2 1988布什 56 布 53 9 对人的评价比对物的评价要更困难 2 数据的间接来源3 数据的直接来源试验数据调查数据本课程是对调查而言 第一章绪论 二 抽样调查的作用1 抽样调查的概念2 抽样调查的作用 有些现象不可能进行全面调查 实际操作有困难 检查 核查作用 第一章绪论 3 抽样调查优点 费用低 速度快 有助于提高数据质量 第一章绪论 三 抽样调查的历史1 国际上抽样调查的进展1802年法国数学家拉普拉斯进行人口抽样估计 这是文字记载最早的抽样案例 目前抽样方法用于各个领域 人口调查 经济领域调查 社会问题研究 电视收视率调查 民意调查 等 第一章绪论 2 我国情况不同的发展阶段目前 政府调查 社会调查 市场调查 收视率调查等 都有长足进展 与国外差距 热情有余 科学性不够 对抽样理论缺乏了解 第一章绪论 四 调查步骤一个完整的调查包括几个阶段性的工作 1 调查目标确定属于调查策划 明确通过调查所要获取的信息 确定调查内容 决定向谁进行调查 确定调查对象 2 调查问卷设计3 抽样方法确定4 调查方式 数据收集 确定5 数据编码与录入 第一章绪论 6 数据审核与插补7 数据估计 包括权数确定 计算置信区间 8 调查结果表述 调查报告 第二章基本概念 一 总体与样本1 总体2 样本二 目标总体与抽样总体1 目标总体2 抽样总体3 抽样框良好抽样框的标志 第二章基本概念 三 概率抽样与非概率抽样1 概率抽样特点与作用2 非概率抽样 1 方便选样 2 目的选样 3 自愿样本 4 配额选样特点 案例 调查北京市老年人的住房条件 抽样方案设计 调查目标的确定 把与主题相关的问题转换为调查问题目标总体的确定 已知变量 研究变量 待估参数抽样框选择和建立可得资源明细进度表 允许估计误差数据收集方法抽样设计 样本选择机制 样本量数据整理方法估计量公式 方差估计量人员培训 现场工作的组织资源的分配质量控制和评估 抽样方案设计 第一 确定抽样调查的目的 任务和要求 第二 确定调查对象的范围和抽样单位 第三 确定抽取样本方法 第四 确定必要的样本数 第五 对主要抽样指针的精度提出要求 第六 确定总体目标量的估算方法 第七 制订实施总体方案的办法和步骤 例子 N 4 n 2Lablefarmacreagecornacreage14126336542015Total3624 第二章基本概念 四 等概抽样与不等概抽样1 等概抽样2 不等概抽样 第二章基本概念 五 抽样误差与非抽样误差1 抽样误差 可以计算 可以控制2 非抽样误差 1 抽样框误差 2 无回答误差 3 计量误差 第二章基本概念 六 方差 偏差与均方误差 方差反映随机因素为的估计值 偏差反映系统因素为总体真值 第二章基本概念 均方误差 第二章基本概念 七 估计量的优良性准则1 一致性当越大时 接近于的概率越大 第二章基本概念 2 无偏性3 有效性令 为的两个无偏估计量若则是较有效的估计量 第二章基本概念 八 精度与费用 精度 100 95 60 20 40 费用 第三章简单随机抽样 第一节基本问题一 什么是简单随机抽样1 放回抽样2 不放回抽样二 实施方法 抽签 随机数表 计算机抽取 第三章简单随机抽样 三 符号说明总体样本单位数总和均值比例方差及 第三章简单随机抽样 第二节简单随机抽样的误差计算例题 A B C D4人 体重分别为100 110 120 130斤可知 现采用抽样方法估计 放回抽样 第三章简单随机抽样 样本样本A A100225A B105100A C11025A D1150B A105100B B11025B C1150B D12025C A11025C B1150C C12025C D125100D A1150D B12025D C125100D D130225合计 第三章简单随机抽样 100105110115120125130频数1234321频率0 06250 1250 18750 250 18750 1250 0625说明样本分布近似正态分布并且 样本分布 第三章简单随机抽样 抽样误差 标准差 抽样误差计算公式误差也可用方差形式表现 第三章简单随机抽样 若采用不放回抽样计算公式 第三章基本概念 为修正系数为修正系数令 称抽样比 故 有限总体调整系数 第三章简单随机抽样 第三节简单随机抽样中的估计一 均值估计不放回抽样是常用方法是的估计 第三章简单随机抽样 置信区间 概率度当时 称为允许抽样误差 第三章简单随机抽样 二 总量估计 第三章简单随机抽样 三 比例估计令总体比例样本比例例 有户家庭拥有彩电 全市居民家庭彩电拥有率 第三章简单随机抽样 置信区间 81 9 88 1 第三章简单随机抽样 第四节样本量的确定影响样本量的因素 调查经费 总体方差 允许误差范围 置信度 第三章简单随机抽样 一 样本量计算基本公式1 调查费用确定样本量先确定费用函数 如C一定时 可得到样本量上限 第三章简单随机抽样 2 放回抽样由得 第三章简单随机抽样 3 不放回抽样由得将分子 分母同除以故 第三章简单随机抽样 4 比例估计中的样本量放回抽样不放回抽样 第三章简单随机抽样 二 控制相对误差的样本量 放回抽样 令则 在不放回抽样条件下 第三章简单随机抽样 三 总体方差的事先确定1 以往数据或经验数据2 预调查解决的估计问题3 全距与标准差之间的关系推测4 先抽取 根据 求出总体方差估计 进而求得 再抽 四 样本量设计中的误区1 估计精度越高越好吗 简单随机抽样估计比例P的样本量与误差 当P 0 5时 样本量误差500 141000 105000 04510000 032对精度要求的判断十分重要 为得到最小误差而选择最大样本量不是好的选择 第三章简单随机抽样 2 样本量与总体规模N有关吗 例 简单随机抽样估计P 置信度95 允许误差5 在P 0 5条件下总体规模 N 所需样本量 n 5044100805002221000286500037010000385100000398100000040010000000400 抽样调查中的样本量 抽样调查中的样本量 由此可知 在精度要求相同条件下 在北京市进行一项调查和在全国进行一项调查 样本量的差别并不大 总体规模越大 进行抽样调查的效率越高 若分类 分区 分层分别进行估计则另当别论 总体规模越大 抽样调查的效率越高 对于很小规模的总体 要取得所期望的精度 通常必须调查较大比例的样本 在经济上不合算 所以 从抽样理论而言 抽样调查与 满足各级政府需要 存在矛盾 抽样调查中的样本量 第四章分层随机抽样 第一节基本问题一 什么是分层随机抽样 第四章分层随机抽样 二 特点1 提高估计精度2 可对各层进行估计3 便于组织三 分层原则 层内方差尽可能小 层间方差尽可能大 第四章分层随机抽样 四 符号总体样本第层单位数单位数总和第层均值第层方差第层权数第层抽样比 第四章分层随机抽样 等比例抽样即 不等比抽样 第四章分层随机抽样 第二节均值与总量估计一 估计量性质 性质1 若无偏 则是的无偏估计量 第四章分层随机抽样 性质2 的方差是证 第四章分层随机抽样 在总量估计中 第四章分层随机抽样 例 类别 户 总村数0 156351534 0520 1916 3057013810 3169 9631 5047511515 2963 1351 753037323 16170 3276 100892128 71184 90合计2072500以95 45 概率估计耕牛总头数的置信区间 第四章分层随机抽样 第四章分层随机抽样 第三节各层中样本单位数的分配一 不同分配方式层常数分配与成正比与成正比内曼分配10 22010049604020 330100110909030 534100141150170n3003003003003 863 113 093 00 第四章分层随机抽样 1 常数分配 实际中采用不多 2 与成正比 3 与成正比 按比例分配 常采用4 内曼分配 第四章分层随机抽样 5 最优分配分配样本量时考虑费用因素费用函数式中 为抽样固定费用 1 当方差一定时使最小 2 当一定时使方差最小 第四章分层随机抽样 分配样本量的准则 实际运用中的考虑比例分配 内曼分配较多使用 第四章分层随机抽样 二 样本量的确定1 一般公式由令 代入上式 1 因为 故 第四章分层随机抽样 2 不同条件下一般公式的运用 在比例分配条件下将代入 1 式 得或 第四章分层随机抽样 在内曼分配条件下在条件下 故内曼分配样本量小于比例分配样本量 第四章分层随机抽样 在最优分配条件下由代入到中解得或 第四章分层随机抽样 在给定费用条件下 第四章分层随机抽样 第四节估计比例的分层抽样一 目标量的估计 第四章分层随机抽样 例 类别小学250001500 02中学200001200 10大学5000300 80合计50000300对硕士学位教师所占比例进行区间估计 第四章分层随机抽样 第四章分层随机抽样 二 比例估计中样本量的确定 一分层抽样的效率200 000800 0001 000 0004 000 0001 000 0001 800 000有几种分配方案第一种第二种第三种第四种简单随机抽样 第五节分层抽样中的其他问题 第四章分层随机抽样 四种抽样方案各自方差 分层抽样 简单抽样 省略 第四章分层随机抽样 方案一方案二 第四章分层随机抽样 方案三方案四设计效果 第四章分层随机抽样 二 层的构造1 分几层 L 6 层数 抽样方差 第四章分层随机抽样 2 层的分点 1 建立联立方程 求方差极小化的解 2 若总体均匀分布 可等距分层 第四章分层随机抽样 3 累积法ID职工人数累积11 1010 000100100211 202 50050150321 301 60040190 层距 第四章分层随机抽样 三 事后分层1 什么是事后分层抽取 调查后得到和又已知 第四章分层随机抽样 2 估计当充分大时故 第四章分层随机抽样 四 的情况例题企业规模小企业10 0000 88000200中企业1 00088000200大企业100808000200合计11 10024000600调整后目录抽样 ListSampli

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论