抽样习题答案.pdf_第1页
抽样习题答案.pdf_第2页
抽样习题答案.pdf_第3页
抽样习题答案.pdf_第4页
抽样习题答案.pdf_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 抽样习题答案抽样习题答案 习题一习题一 1 1 请列举一些你所了解的以及被接受的抽样调查 略 2 2 抽样调查基础理论及其意义 答 大数定律 中心极限定理 误差分布理论 概率理论 大数定律是统计抽样调查的数理基础 也给统计学中的大量观察法提供了理论和数学 方面的依据 中心极限定理说明 用样本平均值产生的概率来代替从总体中直接抽出来的 样本计算的抽取样本的概率 为抽样推断奠定了科学的理论基础 认识抽样误差及其分布 的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附 近 通过计算抽样误差的极限是抽样误差处于被控制的状态 概率论作为数学的一个分支 而引进统计学中 是统计学发展史上的重要事件 3 3 抽样调查的特点 答 1 随机抽样 2 以部分推断总体 3 存在抽样误差 但可计算 控制 4 速度快 周 期短 精度高 费用低 5 抽样技术灵活多样 6 应用广泛 4 样本可能数目及其意义 答 样本可能数目是在容量为 N 的总体中抽取容量为 n 的样本时 所有可能被抽中的不同样本 的个数 用 A 表示 意义 正确理解样本可能数目的概念 对于准确理解和把握抽样调查误差的计算 样本 统计量的抽样分布 抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助 5 影响抽样误差的因素 答 抽样误差是用样本统计量推断总体参数时的误差 它属于一种代表性误差 在抽样调查 中抽样误差是不可避免的 但可以计算 并且可以被控制在任意小的范围内 影响抽 样误差的因素 1 有样本量大小 抽样误差通常会随着样本量的大小而增减 在某些 情形下 抽样误差与样本量大小的平方根成反比关系 2 所研究现象总体变异程度的 大小 一般而言 总体变异程度越大则抽样误差可能越大 3 抽样的方式方法 如 放回抽样的误差大于不放回抽样 各种不同的抽样组织方式也常会有不同的抽样误 差 在实际工作中 样本量和抽样方式方法的影响是可以控制的 总体变异程度虽不可以 控制 但却可通过设计一些复杂的抽样技术而将其影响加以控制 6 6 解 1 1 519 n y y i s2 250 62 62800 2 1 519Y y y是无偏的 2 2 1 s n f yv 3 1256 50 628001 2 s n f yv 1 f 1 44 351256 ys 4 95 的置信区间 56 588 64 44944 3596 1 1 519 2 ysy 习题二习题二 一一 判断题判断题 1 5 6 10 11 15 16 20 二二 填空题填空题 1 样本容量与总体容量之比 N n f 2 E无偏估计量 3 2 1 n f VMSE 4 2 1 n VMSE 5 N 1 6 N n 7 n N C 1 8 随机事件 随机现象n随机 9 n正态分布 总体 正态 10 无偏有效一致性 三三 简答题简答题 1 概率抽样与非概率抽样的区别 答 概率抽样是指在抽取样本单元时 每个总体单元有一个非零的入样概率 并且样本单元 的抽取应遵循一定的随机化程序 2 普查与抽样调查的区别 答 普查是对总体的所有单元进行调查 抽样调查仅对总体中的部分单元进行调查 3 何谓抽样效率 如何评价设计效果 答 两个抽样方案的抽样方差之比为抽样效率 当某个估计量的方差比另一估计量的方差小 3 时 则称方差小的估计量效率比较高 因方差的大小与样本容量有直接的关系 因此比 较时通常以样本量相同时的方差进行比较 4 何谓三种性质的分布 它们之间的关系怎样 答 三种分布是指总体分布 样本分布 抽样分布 总体分布是指总体的标志值的分布 样 本分布是指容量为 n 的样本标志值的分布 抽样分布则是指样本估计量的分布 它是一 个变量 据中心极限定理 当 n 增大时估计量的分布趋向于正态分布 可用大样本理论 对其进行区间估计 5 简述抽样估计的原理 答 如果样本的估计量 E 而且已知道在大样本的情况下 趋向于正态分布 只要知 道 的抽样标准误差 S 就可以根据正态分布原理对 进行区间估计 四四 计算题计算题 1 解 1 重复 168077A 5 1 n N 不重复 21 5 72 CCA n N 2 7 1 P 3 7 5 P 4 21 11 P 5 7 C 5 5 6 7 8 95 6 7 8 105 6 7 8 11 7 8 9 10 11 2 允许绝对误差不超过 0 1 解 已知 d 0 1 1 95 Z 2 1 96 或者取 2 96 1 0 5 05 096 1 2 2 2 2 0 d PQZ n 调整预计的回答率 148 65 0 96 65 0 n0 n 3 解 依题意知 n 351173285 2 fsy 285 yY 086 2 73 35 11 2 s n f yv 44 1 yvys 4 005 0 85 2 44 1 y ys yCv 95 的置信区间 82 287 18 28244 1 96 1 285 2 ysZy 习题三习题三 一 单选题一 单选题 1 5BAACA6 7AB 二 多选题二 多选题 1 BC2 ABC3 ABCD4 ABCDE5 CE6 CD7 ABCD 三 判断题三 判断题 1 5 6 10 11 15 16 20 四四 填空题填空题 1 层层 L21 N NN 2 扩大层间差异 缩小层内差异 3 N N W h h h h h N n f 4 h n i hi h h y n y 1 h n i hhi h h yy n s 2 2 1 1 5 22 1 h h h hst s n f Wyv 22 1 h h h hst s n f NYv 6费用方差层权 7层 样本量差 8估计精度 9选择标志总体 10 2 n 五五 简答题简答题 1 何谓分层抽样 简述分层抽样的意义 答 分层抽样是在概率抽样的前提下 按某种标志将总体划分为若干层 然后按随机原则对每 层都进行抽样 分层抽样的效率高于简单随机抽样 能够推算子总体 2 试举一例说明分层抽样的抽样效率比简单随机的抽样要好 答 简单简单随机抽样可能得到一个差的样本 如一个总体进行简单随机抽样 N 6 其标志 值为 1 2 3 4 5 6 当 眉 2 时其均值的变动范围在 1 5 5 5 若 1 2 3 为一组 4 5 5 6 为一组进行分层抽样进行则均值的范围在 2 5 4 5 则分层抽样的精度提高 3 分层抽样的分层的原则及其意义 答 在总体分层后 总体方差 层内方差 层间方差 据方差分析原理 在分层抽样的条件下 抽样误差仅与层内方差有关 和层间方差无关 因此从其组织形式上看所谓的分层抽样是 先将总体分层 然后在每层中抽取样本 遵循扩大层间方差 缩小层内方差的原则对总体 进行分层 就可以提高估计的精度 4 简述分层抽样的局限性 答 分层抽样一般说来比简单随机抽样的精度要高 但若层的划分或样本量的分配不合理时 可能会使分层随机抽样的精度比简单随机抽样要差 5 简述分层抽样中总样本量的分配方法 答 当样本量一定时考虑样本量的分配问题 主要有 三种分配方法按层要进行分配 1 比例 分配 2 最优分配 3 内曼分配 6 怎样分层能提高精度 答 考虑分层标志的选择及合理的确定层数 一般来说 增加层数能够提高估计的精度 同时考 虑增加层数提高的精度和费用之间的平衡 即增加层数而降低量在精度上是否合算 六六 计算题计算题 1 解 等比例分配 hh h h hh h h h Wnn n n W n n N N N n N n ff 即 100 1000 400 250 11 人 Wnn 150 1000 600 250 22 人 Wnn 即各层样本量分别为 100 人 150 人 2 解 由尼曼分配知 hh hh hh hh h SN SN n SW SW nn 用各层样本方差估计各层总体方差 由题意得 18 927259236132 36132 30 11 1 hhS N SN nn 10 927259236132 2592 30 22 2 hhS N SN nn 2 927259236132 927 30 33 3 hhS N SN nn 3 解 已知 N 300 N1 N2 N3L 3 6 总样本量 2 1 22 hhN hhh SWV wSW n 此分层为一般最优分配 因为 Ch不等 而最优分配 hhh hhh h cSW cSW w 将 式带入 式得 222 1 hh hhhhhh hhN hhhhhh SNVN cSNcSN SWV cSWcSW n 根据题设条件课求得 n 28 则由4 7 17 3 2 1 321 nnnh cSN cSN nn hhh hhh h 求得 注 其中 8 3126 9158 43377 6 4 2353 5 24 3 93 3 25 2 154 hhh cSN 4 2102 4 572837693624 3 53524 3 93325 2 154 hhh cSN 54 981972 17132 301 5 3469000 24 3 5324 3 9325 2 154 1 03002 22 hhS NVN 4 解 由题设得 163 0 86 14 1 1 1 N n f167 0 72 12 2 f 57 65 1 y183 2 y 2 93863 30 2 2 1 s52 905315 95 2 2 2 s 173 0 52 9 3 f167 0 30 5 4 f 6 5340 3 y 4472 4 y 57 1679359 129 2 2 3 s14 7237703 269 2 2 4 s 总植树面积 14 50696 4 4723056 340521837257 6586 公顷 hhst yNY 7 06 1869769751 10852228815 4172656393 32579643483 414847 5 03 269 167 0 1 30 9 59 129 173 0 1 52 12 15 95 167 0 1 72 14 63 30 163 0 1 861 2222 2222 22 h h h hst s n f NYv 083 4324 公顷 st Ys 95 的置信区间为 34 59171 937 42220083 432496 1 14 50696 2 stst YsZY 5 解 由题2 810 2 h s 各层相同 即各层差异为 0 故认为不需要分层 习题四习题四 1 5 6 10 二二 填空题填空题 1 正相关 2 yx xy ss s 样本协方差研究变量的标准差辅助变量的标准差 3 x y R 1 1 2 n xRy xn f Rv ii 4 各层分别比估计联合比估计 5 2 1 变异系数为yxCCCC yxyx 6 常数无偏有偏 7 较大分别回归估计联合回归估计 三三 简答题简答题 1 简述比率估计提高抽样效率的条件 答 1 有相应的准确的辅助可以利用 2 推断的变量与辅助变量之间存在着相关关系 3 要 求的样本量较大 2 简述比率估计的应用条件 答 1 比估计是有偏估计 要求的样本量较大 2 研究变量与辅助变量之间有较好的相关关系 3 回归估计 比估计与简单估计间的区别 答 回归估计一般优于比估计和简单估计 当回归系数等于总体比率 即总体回归直线通过原点 时 回归估计量与比估计量的效果相同 当调查变量与辅助变量间的相关系数 等于 0 时 回归估计与简单估计效果相同 8 4 辅助变量的选择原则 答 选择与调查变量 Y 之间有密切相关程度的变量 X 作为辅助变量 5 回归系数的选择与确定 答 1 的不同取值当然会影响 V lr Y 的值 取得合理 V lr Y 就小 否则就大 事实 上 为一特定常数时 lr Y 是无偏的 可取到最优值 B 2 x xy S S V 达到最小值 2 为样本回归系数 此时回归估计量 lr Y 不是无偏的 四四 计算题计算题 1 分析 以去年资料作为辅助变量 N 1000 n 100 解 5 17 10 1750 今年 y 12 10 1200 去年 x 5 12 1000 12500 X 则485 1 12 5 17 x y R 23 18 5 12485 1 XRYR 94358 2562 2882 100 1000 100 1 1100 35 22059485 1 215620485 1 316500 100 1000 100 1 2 1 11 1 1 2 2 2 2 2 iiii ii RyxRxRy nn f n xRy n f Yv 935 05R YvYSR 95 的置信区间为 2 28 25 8 0935 5 96 1 23 1896 1 R RysY 2 解 列简单计算表如下 h n h N h W h f h X hx h y 2 yh S 2 xh S yxh S h R h 161200 40 0524500193202 56757 5513258351 409 9 平 原 h 2 山 区 91800 60 0521200114 11121 112242 361788 111978 6111 061 合 计 153001 45700 1 分别比估计计算 7 4819321200061 1 24500409 1 百斤 h h RSXRY 3738 5652546888 193778685 371475 611 1978061 1 211 1788061 1 36 2242 9 05 0 1 180 5835049 1 25132049 1 5 6757 6 05 0 1 120 2 1 2 2 222 2 yxhhxhhyh h hh RS sRsRs n fN Yv 834 751 RS Ys 2 按联合比估计计算 8 4609911 121180 5 202120 hhst yNY 8 4369911 114180193120 h hst xNX 0549 1 8 43699 8 46099 st st c X Y R 8513 4820945700 8 43699 8 46099 百斤 XRY cst 6493 5571386709 1974039784 359734 2 1 222 2 yxhcxhcyh h hh st sRsRs n fN Yv 4172 746 Rc Ys 1 2 比较 RcRS YsYs 说明在 nh不大的情况下 联合比估计优于分别比估计 习题五习题五 一 一 单选题单选题 1 6ACADDB 二 多选题二 多选题 10 1 ABCE2 ABCD 3 ACD 4 ABCE 三三 判断题判断题 1 5 6 10 11 15 16 20 21 25 26 29 四 填空题四 填空题 1 N n 样本量总体群 2 2 2 1 yy N M s ib 1 1 11 2 2 Ms nM f s nM f yv b yvMYv 2 0 3 c 群内相关系数0 c 负或高于 OR 等于 4 的取值样本量 5 总体单元数未知总体群数已知 6 群规模 M0提高估计的效率 精度 7 有偏样本量 n 很大时简单随机抽样 8 均值 n yi 10 9 相似 群内方差大负 10 i i M M 11 n 2 12 总体总量 五 简答题五 简答题 1 简述整群抽样的分群原则 答 扩大群内方差 缩小群间方差 以提高整群抽样的抽样效率 2 您如何认识影响整群抽样抽样误差的主要因素是群间方差 答 在整群抽样时 总体方差分为群内方差和群间方差两部分 在总体各群间进行随机抽样 使得抽样由群间方差的大小来决定 对被抽中的群进行全面调查所以不存在抽样误差即 群内方差不影响抽样误差 3 整群抽样时 采用无偏估计的方法与比率估计的方法来估计总体总量有何不同 答 1 采用比率估计的方法时 是以群的规模作为辅助变量 2 采用无偏估计的方法 是采 用简单估计的方法进行的 因为没有用到辅助信息 使得无偏估计的方法估计精度不高 4 简述整群抽样的优点 答 1 样本集中 可以降低收集样本的费用 2 抽取样本的效率比简单随机抽样高 3 抽样 框的编制得以简化 5 整群抽样时 比率估计的方法估计总体总量与比估计量中的辅助变量有什么不同 11 答 1 比率估计的方法估计总体总量时 辅助变量是总体单元的规模大小 i M 2 比估计量中 的辅助变量是 i X 6 简述使用整群抽样的原因 答 1 省时 省力 平均单元的调查费用较少 2 样本集中 可以降低收集样本的费用 3 抽取样本的效率比简单随机抽样高 4 抽样框的编制得以简化 7 整群抽样与分层抽样的区别 分组须满足的条件 1 无重复无遗漏 2 各层单元数 h N已知 1 同左 2 各群单元数 i M确知 组间 组内 层间全面调查 各层都抽取样本 群间抽调查 只抽部分群 层内抽样调查 每层只抽部分单元 群内全面调查 分组目的 将标志值或指标值相近的总体单元划 归为同一层 以 缩小总体 将标志值或指标值差异较 大的单元划归为同一群 以扩大 总体抽样单元 抽样时以扩大后的 单元 为单位 组间 组内 尽可能扩大层间差异 因抽样误差同 层间差异无关 尽可能缩小群间差异 因 抽样误差只与群间差异有 关 尽可能缩小层内差异 因抽样误差只 与层内差异有关 尽可能扩大群内差异 因 抽样误差同群内差异无 关 8 整群抽样群大小的计量方法 答 1 常用尺度 群规模 i M 最常用 2 一般尺度 找辅助变量 3 最优尺度 即各变 量值之和 该尺度理论上可以 但实际上不可实施 9 整群抽样的设计效应 答 设计效应用 deff 表示 整群抽样的 deff 0 1 0 1 0 1 1 1 1 1 1 1 2 2 c c c c c srs M S nM f MS nM f yV YV 10 从等概率抽样与不等概率的区别来分析进行简单抽样的有效性 答 当总体单元的差异不大时进行简单随机抽样 即等概率抽样是有效的 但若总体单元之间 的差异较大时 要用不等概率抽样 11 简述不等概率抽样的主要优点 答 当总体单元的差异不大时进行简单随机抽样 即等概率抽样是有效的 但若总体单元之间 的差异较大时 要用不等概率抽样 12 试举一个利用区域可以直接进行抽样的例子 答 特点 区域本身就是抽样单元 如调查某师团的总收入或总支出 以连队或团为抽样单元 13 分析 PPS 抽样与PS 的抽样效率 答 PPS 抽样重复抽样 PS 产是不重复抽样 因此从抽样效率上分析 前者的效率低于后者 12 六六 计算题计算题 1 解 1 375 218 12 5 26201 元 i y n Y 18 14186273 1733819506 112 8 1 2 2 n i ib yy n M s 8173 14418 14186 812 600 12 1 1 Y 2 b s nM f v 034 12YY元 vs Y的置信区间 034 1296 1Y 即 194 79 241 96 2 1048200375 218600 YNMY 2 57763034 128600 22 YNMvYsYvMNYv所以 Y的置信区间为 2 5776396 1Y 即 934984 128 1161415 872 3 群规模相等 18 14186 10000 2 2 2 b b b s sND Ns n已知 44 69 6004 10000 4 2 2 2 2 N D 153 85 55852 8511708 18 1418644 69600 18 14186600 2 2 个 b b sND Ns n 2 解 第 3 车间 06 2 2100 4320 3 y 第 6 车间 18 2 1910 4160 6 y 第 8 车间 81 1 3200 5790 8 y 02 2 3 81 1 18 2 06 2 1 人天 i y n Y 13 2597502 2 12850 02 2 32002901910284086021004501200 0 天 YMY 0119 0 23 21 0 16 0 04 0 1 1 222 2 yy nn yv i 109 0 ys 95 的置信区间 23364 2 80636 1 96 1 ysy 65 1400109 0 12850 0 2 0 YsMYvMYvYs 274 28702 726 2321165 140096 1 25957 96 1 YsY 3 解 1 32 58 120 70 i i M a p 002971 0 29 667 48 430 200 30 1 1 2 1 1 1 2 2 2 2 2 2 n MapMpa Mn f n pMa Mn f pv iiiiii 其中 667 482805832 0 24805832 0 212 2 2 2 22 iiiiii MapMpapMa 0545 0 ps 2 有以上可得 95 下p 的区间为 即 00 69 64 4710682 0 5832 0 0545 0 96 1 p 习题六习题六 一一 判断题判断题 1 系统抽样中最简单也是最常用的规则是等间隔抽取 所以又称系统抽样为等距抽样 2 第一个样本抽取后 其它所有的样本就都确定了 这种抽样看来似乎很机械 所以系统抽样 又被称为机械抽样 3 在直线等距抽样中 总体容量是样本容量的整数倍 4 循环等距抽样中总体单元数同样也是 n 的整数倍 14 5 总体单元按有关标志排队就是指各单元的排列顺序与所研究的内容无关 但与总体单元的规 模大小有关 6 如果系统抽样时总体单元的排列有周期性的变化 就可能抽出代表性很差的样本 7 如果按总体单元的有关标志排列 则系统抽样时样本单元在总体中分布较均匀 8 系统抽样可以看成是分层抽样的一个特例 但样本单元在各层的位置相同 9 系统抽样可以看成整群抽样的一个特例 从 k 群中随机抽取 1 个群的整群抽样 10 当 N nk 时有 k 个可能样本 其样本均值是总体均值的无偏估计量 11 当 N nk 时采用直线等距抽样得到 k 个可能样本 其样本均值是总体均值的无偏估计量 12 当 N nk 时采用循环等距抽样得到 k 个可能样本 其样本均值是总体均值的有偏估计量 13 有效地应用系统抽样 必须了解总体的特征 14 按无关标志排列的总体单元可以看成是随机排列的 当为有限总体时其系统抽样方差与简单 随机抽样的方差相等 15 当总体单元有趋势顺序排列时 其方差估计有一些近似的公式 不论 n 为何值 都可用合并 层和连续差的方法来估计总体方差 16 中心位置抽样法起始单元的抽选是在第一段的 k 个单元中在 1 k 之间随机抽取 17 Sethi 的方法和 Singn 的方法在抽取样本单元时起始单元有两个 因此这就被称为对称系统抽 样 18 对称系统抽样与一般系统抽样的主要区别在于此时起始单元不是一个而是两个 它们的位置 对称 数值大小相低 因而改进了估计量的精度 19 交叉子样本的方法又称为随机组法 它是解决周期性波动总体的系统抽样的有效方法之一 20 当系统抽样的间隔恰好与循环周期的整数倍相一致时 系统抽样的误差将会很大 二二 填空题填空题 1 随机 按无关标志有关 2 排列顺序 3 均匀 4 位置 5 奇数增加kni 1 2 1 6 不是1 N 7 同样样本量高于 828 228 28 iii 928 228 28 iiiiNi依次为中随机取503 523 543 8 28 10 无偏 有偏 三三 简答题简答题 1 简述系统抽样的主要优点 答 1 简便易行 容易确定样本单元 2 样本单元在总体中分布较简单随机抽样均匀 3 采用有关标志排队可提高估计的精度 2 系统抽样的局限性有哪些 答 1 如果单元的排列存在周期性的变化 而抽样者对此缺乏了解或缺乏的经验 抽取出的 样本的代表性可能很差 2 系统抽样的方差估计较为复杂 15 3 对于周期性波动的总体上在组织系统抽样的时候应注意什么问题 答 应克服周期性波动对总体趋势的影响 如采用交叉子样本的方法 可以改变影响 4 对线性趋势的总体进行系统抽样时应该如何组织 答 由于样本的确定失去了随机性 会对抽样带来不利的影响 对线性趋势总体的抽样方法 可以进行如下改进 1 采用中心位置抽样法 2 对称系统抽样法以提高精度 5 试举一个总体单元按无关标志排列进行直线等距抽样的例子 答 一个简单随机抽样的例子总体 100 人 样本量为 10 时 如调查总体的人均收入在编制抽 样框时 按总体单元的先后顺序登记 6 简要分析影响系统抽样误差的因素 答 1 总体的特征 不同类型的总体在估计总体方差时 有不同的模型 2 同其它方差一样 影响 抽样比 样本容量 系统样本方差 补充补充 以下只给出答题要点 以下只给出答题要点 1 误差主要包括哪

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论