




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 52 统计抽样主要研究什么内容 解决什么问题 抽样方法主要有哪几种方法 如何确定样本容量 2 56 7 1统计抽样基本概念 总体由研究对象的全体所组成 样本是总体中的部分元素所组成的集合 目标总体是我们要推断的总体抽样总体是实际抽取样本的总体 3 56 在抽样之前 应将总体划分为抽样单位 抽样单位既可以是一个简单的个体 也可以是一组个体 对某一个特殊研究 抽样单位的名册称为抽样框 7 1统计抽样基本概念 4 56 调查方法 邮寄调查 电话调查 个人采访调查 7 2抽样调查种类和抽样方法 5 56 调查误差 非抽样误差 抽样误差 由于没有对总体的所有单位进行调查而产生的误差 进行一次抽样调查可能出现的如测量误差 采访者误差及数据处理误差等 7 3调查误差 6 56 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机样本 使每一个容量为n的可能样本 都有相同的概率被抽中 建立抽样框 根据随机数表进行抽样 抽样总体中所有个体的名册 使用随机数表 可以保证抽样总体中的每个个体都有相同的概率被抽中 7 4简单随机抽样 7 56 总体均值总体比率样本容量的确定 7 4简单随机抽样 8 56 如果选择大样本 n 30 则中心极限定理可以保证的抽样分布近似服从正态概率分布 的区间估计为式中 为均值的标准差 1 称为置信度 为与之对应的临界值 例如 若置信度为95 则 7 4 1总体均值 9 56 当从一个容量为N的有限总体中 抽取一个容量为n的简单随机样本时 均值的标准差的估计值为此时总体均值的区间估计为在抽样调查中 当构造置信区间时 通常取 2 因此 在使用简单随机样本时 总体均值的近似95 的置信区间的表达式为 7 4 1总体均值 10 56 例7 1 摄影 是一本推介摄影作品 报道摄影发展状况 介绍摄影器材的杂志 它目前拥有8000个订户 根据一个484个订户的简单随机样本 得出订户的年平均收入为30500元 标准差为7040元 因此 所有订户的年平均收入的无偏估计为元 因此 这本杂志订户的年平均收入的近似95 的置信区间为即 29880 31120 7 4 1总体均值 11 56 上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计 对点估计的抽样分布近似服从正态概率分布的所有情形 其近似95 的置信区间为例如 在 摄影 的抽样调查中 点估计量的标准误差的估计值为 允许误差为2 310元 620元 7 4 1总体均值 12 56 总体比率p是总体中具有某些感兴趣特征的个体的比重 例7 2 在市场调查研究中 人们想了解喜欢某一品牌的消费者比重 样本比率是总体比率的无偏点估计 总体比率的标准差的估计值为因此 总体比率的近似95 的置信区间的表达式如下 7 4 2总体比率 13 56 例如 在大宇国际咨询公司的抽样调查中 大宇国际咨询公司也想估计在它服务范围内的500所学校中 使用天然气作为取暖燃料的学校比率 如果在抽出的50所学校中 有35所学校使用天然气作为取暖燃料 则总体500所学校中使用天然气比率的点估计值 比率的标准差的估计值为因此 总体比率的近似95 置信区间为即 0 5758 0 8242 7 4 2总体比率 14 56 回忆前面提到的允许误差为 点估计的标准差估计值的2倍 因此 均值的标准差的估计值 7 4 3样本容量的确定 15 56 两步抽样 用试点调查或事先检验的结果估计s2 估计s2的方法 根据以往的资料估计s2 由第一步抽取的部分单位 得到的s2的估计值 将此值代入上式 确定出全部样本容量n 然后对第一步确定的全部样本容量 再抽取第二步所需要的其余单位数 7 4 3样本容量的确定 16 56 例7 3 某大学有5000名毕业生 我们想构造宽度在1000元之内的近似95 的置信区间 对这样规定的置信区间 B 500 在确定n之前 需要估计 假设根据去年所做的同样研究 得知s 3000元 我们可以用这个值来估计 根据B 500 s 3000及N 5000 则样本容量为 7 4 3样本容量的确定 17 56 在估计总体比率时 选择样本容量的公式 与估计总体均值的公式类似 我们只需要将估计总体均值的公式中替换为 即使用上式时 我们必须规定允许误差B和给出的一个估计值 如果没有合适的估计值 我们可以使用代替 这样将保证近似置信区间的允许误差比希望的要小的多 7 4 3样本容量的确定 18 56 将总体划分H组 从第h层中抽取一个容量为nh的简单随机样本 由这H个简单随机样本的联合资料 可得出诸如总体均值 总体总量及总体比率等各种总体参数的估计 分层简单随机抽样的步骤 也称为层 7 5分层简单随机抽样 19 56 如果各层内的差异比层间的差异小 则分层简单随机样本可得到更大的精度 总体参数的区间估计将更窄 各层的划分应依据样本设计者的判断 总体可按部门 地区 年龄 产品类型 销售水平等分层 7 5分层简单随机抽样 20 56 例7 4 某大学管理学院想对今年的毕业生进行一次调查 以便了解他们开始工作时的年薪 7 5分层简单随机抽样 21 56 在分层抽样中 总体均值的无偏估计是各层样本均值的加权平均数 所用权数为总体在各层的比重 用表示总体均值的点估计 其定义如下 式中 H 层数 第h层的样本均值 Nh 第h层的单位数 N 总体单位数 对分层简单随机样本 计算平均值的标准差的估计公式为 7 5 1总体均值 22 56 某大学管理学院的180名毕业生的样本调查结果 7 5 1总体均值 23 56 各专业 层 的样本均值分别为 因此 总体均值的点估计为 7 5 1总体均值 24 56 抽样调查中估计均值的标准差所需要的部分计算结果 7 5 1总体均值 25 56 上表中因此 总体的近似95 的置信区间为即 29074 29626 7 5 1总体均值 26 56 对分层简单随机抽样 总体比率p的无偏估计是各层比率的加权平均数 所用权数为总体在各层的比重 总体比率的点估计定义如下 式中 H 层数 第h层的样本比率 Nh 第h层的单位数 N 总体单位数 7 5 2总体比率 27 56 的标准差的估计值为总体比率的近似95 的置信区间的表达式为 7 5 2总体比率 28 56 例7 5 在某大学的调查中 大学想了解毕业生开始工作时的年薪不低于36000元的比率 180名毕业生的抽样调查结果显示 有20名毕业生开始工作时的年薪不低于36000元 其中会计专业4名 金融专业2名 信息系统专业7名 市场营销专业1名 经营管理专业6名 7 5 2总体比率 29 56 根据总体比率的近似95 的置信区间的公式 开始工作时的年薪不低于36000元的比率的点估计为 故毕业生开始时的年薪不低于36000元的比率近似95 置信区间为 0 0575 0 1387 7 5 2总体比率 30 56 对分层简单随机抽样 我们可用两阶段过程来选择样本容量 既然人们想估计各层的均值 总量及比率 这两种组合方法都经常使用 7 5 3样本容量的确定 31 56 确定总样本容量n及其分配 可对所有要研究的总体参数提供必要的精度 分配工作就是决定总样本被分配到各层的部分 这些部分将确定各层的简单随机样本的容量 7 5 3样本容量的确定 32 56 一般地 单位数较多的层和方差较大的层应分配较多的样本数目 相反地 对于给定的费用 为了获得更多的信息 则抽样单位成本较大的层应分配较少的样本数目 7 5 3样本容量的确定 33 56 整群抽样需要将总体各个个体分为N组 也称作群 使总体中每个个体只属于一群 7 6整群抽样 34 56 例如 我们想调查某省的登记选民 则有两种方法 调查某省的登记选民 有两种方法 第一种方法是建立包含该省所有登记选民的抽样框 然后根据抽样框 选择选民的一个简单随机样本 第二种方法是整群抽样 我们选择用该省各县的清单作抽样框 在这个方法中 每个县 或群 包含一组登记选民 而该省的每个登记选民只属于一群 7 6整群抽样 35 56 分层抽样和整群抽样都将总体划分为组 因此这两种抽样过程感觉上是相似的 选择整群抽样与分层抽样的原因是不同的 当群内的个体存在差异时 整群抽样可提供较好的结果 理想情形是每一群是整个总体的一个缩影 这时 抽取很少的群就可以提供关于整个总体特征的信息 整群抽样与分层抽样的比较 7 6整群抽样 36 56 整群抽样的优缺点整群抽样的优点是实施方便 节省经费 整群抽样的缺点是往往由于不同群之间的差异较大 由此而引起的抽样误差往往大于简单随机抽样 整群抽样与分层抽样的匹别整群抽样与分层抽样在形式上有相似之处 但实际上差别很大 分层抽样要求各层之间的差异很大 层内个体或单元差异小 而整群抽样要求群与群之间的差异比较小 群内个体或单元差异大 37 56 例7 6 某省拥有12000名执业注册会计师的注册会计师协会进行了一项调查 作为调查的一部分 注册会计师协会收集与收入 性别和与注册会计师生活方式有关的因素的信息 因为用个人采访法去搜集所需要的信息 因此注册会计师协会采用整群抽样 以使总的差旅费和采访费用达到最小 抽样框中包含所有在该省登记注册的执业会计师事务所 7 6整群抽样 38 56 假设有1000群 即在该省登记注册的从事会计活动的会计师事务所有1000个 选择10个会计师事务所为一个简单随机样本 例7 6 续 7 6整群抽样 39 56 为了介绍在整群抽样中 构造总体均值 总体总量和总体比率的近似95 置信区间需要的公式 我们使用如下的记号 N 总体的群数 n 样本中选出的群数 Mi i群的单位数 M 总体单位数 M M1 M2 十MN 每一群的平均单位数 Xi 第i群所有观察值的总量 ai 第i群具有某特征的观察值的数量 7 6整群抽样 40 56 对注册会计师协会的抽样调查 我们有如下资料 N 1000n 10M 12000 下表7 4为每个中选群的Mi和xi的值 以及中选事务所中女注册会计师的数量 ai 的资料 例7 6 续 7 6整群抽样 41 56 7 6整群抽样 42 56 由整群抽样得到的总体均值的点估计的公式如下 7 25 7 6 1总体均值 43 56 该点估计量的标准差的估计为 7 26 总体均值的近似95 的置信区间为 7 6 1总体均值 44 56 根据表7 4的资料 我们可以得到执业注册会计师平均年薪的点估计为 例7 6 续 7 6 1总体均值 45 56 由于表7 4中的年薪资料是以千元计量的 因此 执业注册会计师的平均年薪的估计值为42531元 而 因此 例7 6 续 7 6 1总体均值 46 56 因此标准差为1 730 我们得到平均年薪的近似95 置信区间 即 39 071 45 991 例7 6 续 7 6 1总体均值 47 56 整群抽样的总体比率的点估计如下 7 30 式中ai 第i群中具有某种感兴趣特征的个体的数量 7 6 2总体比率 48 56 该点估计量的标准误差的估计为 7 31 总体比率的近似95 的置信区间 7 32 7 6 2总体比率 49 56 对注册会计师抽样调查 可以得到女性执业注册会计师的比率的估计为 例7 6 续 7 6 2总体比率 50 56 并且 因此 例7 6 续 7 6 2总体比率 51 56 因此 女性执业注册会计师比率的近似95 置信区间为 即 0 2052 0 3416 例7 6 续 7 6 2总体比率 52 56 先通过选择 即允许误差 的值 规定可接受的精度水平 建立满足所需要的精度的n值的计算公式 每群平均个体的数量和群间方差是决定样本中包含群数多少的关键因素 如果各群相似 则群间方差小 因此中选群数就比较少 如果每群平均个体数量较大 则中选群数也会比较少 整群抽样的过程同其他抽样方法整体上是类似的 7 6 3样本容量的确定 53 56 7 7系统抽样 系统抽样法 又叫做等距抽样法或机械抽样法 即依据一定的抽样距离 从母体中抽取样本 定义 要从容量为N的总体中抽取容量为n的样本 可将总体分成均衡的若干部分 然后按照预先规定的规则 从每一部分抽取一个个体 得到所需要的样本的抽样方法 由于系统抽样法操作简便 实施起来不易出错 因而在生产现场人们乐于使用它 如在某道工序上定时去抽一件产品进行检验 就可以看做是系统抽样法的一个例子 54 56 系统抽样步骤 编号 先将总体的N个个体编号 有时可直接利用自身个体所带的号码 如学号 门牌号等 分段 确定分段间隔k 对编号进行分段 当N n n是样本容量 是整数时 取k N n 确定第一个个体编号 在第一段用简单随机抽样确定第一个个体编号l l k 成样 按照一定的规则抽取样本 通常是将l加上间隔k得到第二个个体编号 l k 再加上k得到第三个个体编号 l 2k 依次进行下去 直到获取整个样本 55 56 例如 需要从容量为5000的总体中抽取一个容量为50的样本 我们可以从总体中随机选择一个 然后在其后面的抽样框中 每隔100个个体选择一个 可得到样本中其余的个体 7 7系统抽样 因为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学品安全培训课件
- 16 麻雀第一课时 公开课一等奖创新教案
- 3 雨的四季 (共19张)+公开课一等奖创新教案
- 1《念奴娇-赤壁怀古》任务式公开课一等奖创新教案统编版高中语文必修上册
- 《小狗学叫》 说课稿
- 第9课《宇宙生命之谜》公开课一等奖创新教学设计 -统编版(五四学制)语文六年级上册
- 内河航运安全培训课件
- 创业法律知识培训课件
- 共同投资协议书范本格式7篇
- 美罗培南临床应用与研究进展
- 快递业务流程标准化管理
- 中班健康魔法消气屋课件
- JJF 2267-2025场磨式大气电场仪校准规范
- 蓝莓水肥一体化栽培技术规程
- 【基于Creo的NGW型行星齿轮减速器设计9000字】
- DB64∕T 2023-2024 不动产登记操作指南
- 云南省云南师大附中2026届高考适应性月考卷地理及答案(一)
- oa数据安全管理制度
- 旋风除尘器设计选型
- 子宫纵膈微创治疗进展-洞察及研究
- 中医全科课件下载
评论
0/150
提交评论