2026年09级抽样技术试题答案_第1页
已阅读1页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年09级抽样技术试题答案

一、单项选择题(每题2分,共20分)1.在有限总体不放回简单随机抽样中,使样本均值方差达到最小的必要条件是A.总体方差为零B.样本量等于总体量C.抽样比趋于零D.总体服从正态分布2.分层抽样中,若各层样本量按“层大小×层标准差”比例分配,该分配方法称为A.奈曼分配B.比例分配C.最优分配D.等距分配3.整群抽样设计效应Deff通常A.小于1B.等于1C.大于1D.与群内相关无关4.系统抽样间隔k的确定公式为A.k=N/nB.k=n/NC.k=√ND.k=1/f5.在两阶段抽样中,若第一阶段用PPS抽取初级单元,第二阶段用简单随机抽样抽取次级单元,则总体总量估计量的无偏性依赖于A.第一阶段包含概率与规模成比例B.第二阶段抽样比恒定C.总体排序随机D.初级单元规模相等6.比率估计量Ŷ_R与回归估计量Ŷ_L的根本区别在于A.是否利用辅助变量B.是否要求辅助变量总体均值已知C.是否要求相关模型线性D.是否要求样本量极大7.当辅助变量x与目标变量y相关系数ρ<0时,比率估计量的精度相对简单估计量A.一定提高B.一定降低C.可能提高也可能降低D.不变8.捕获—再捕获方法中,若第二次捕获的标记个体数m=0,则总体量N的Petersen估计量A.无定义B.为零C.为无穷大D.为负值9.在多重抽样框重叠情形,Hartley组合估计量通过A.剔除重叠单元B.加权调整重叠部分C.仅使用主框D.增加样本量10.非抽样误差中的“无回答”属于A.抽样框误差B.测量误差C.无回答误差D.处理误差二、填空题(每题2分,共20分)11.有限总体校正因子为________。12.奈曼分配下第h层样本量n_h与层大小N_h、层标准差S_h的关系式为n_h∝________。13.若群内相关系数为ρ,群规模为M,则整群抽样设计效应近似为________。14.系统抽样中,当总体存在线性趋势时,为降低偏差,可采用________排列。15.在PPS抽样中,单元i的包含概率π_i与其规模度量X_i的关系为π_i=________。16.回归估计量中,当回归系数取总体回归系数B时,估计量方差达到________。17.捕获—再捕获估计量方差近似公式为Var(Ñ)=________。18.事后分层调整权重等于设计权重乘以________。19.在双重抽样中,若第一阶段样本量n′,第二阶段子样本量n,则成本函数常设为C=________。20.非抽样误差分解为变量误差与________误差。三、判断题(每题2分,共20分,正确打“√”,错误打“×”)21.简单随机抽样下,样本均值的方差随样本量增大而单调不增。22.分层抽样层内方差越大,则层间方差一定越小。23.系统抽样可视为特殊的一阶整群抽样。24.比率估计量总是无偏的。25.在PPS抽样中,若规模度量与目标变量高度相关,则估计量方差可小于简单随机抽样。26.捕获—再捕获方法要求封闭总体且标记不丢失。27.非抽样误差可通过增大样本量完全消除。28.多重抽样框估计量需解决重叠单元权重重复问题。29.回归估计量对辅助变量总体均值是否已知没有要求。30.电话调查的覆盖误差属于抽样框误差的一种。四、简答题(每题5分,共20分)31.简述分层抽样中“层内同质、层间异质”原则对精度提升的作用机理。32.说明整群抽样成本函数与群内相关系数如何共同影响最优群规模的选择。33.给出系统抽样总体均值估计量方差无法直接利用简单随机抽样公式的原因,并指出一种替代估计思路。34.概述双重抽样在辅助信息昂贵情形下的经济效率来源。五、讨论题(每题5分,共20分)35.结合2020年第七次全国人口普查实践,讨论分层、整群、系统三种抽样技术如何被综合使用以兼顾精度与成本,并指出其中非抽样误差控制的关键环节。36.比率估计与回归估计均利用辅助变量,请从模型稳健性、辅助变量要求、计算复杂度三方面比较二者在大型社会调查中的适用场景。37.捕获—再捕获方法近年被用于网络大数据用户规模估计,请评估其基本假设在虚拟总体中的合理性,并提出两项改进策略。38.面对抽样框不完整与无回答并存的双重挑战,讨论多重抽样框与多重插补联合使用的可行性、权重构造流程及潜在风险。参考答案与解析一、单项选择题1.B2.A3.C4.A5.A6.B7.B8.A9.B10.C二、填空题11.(N-n)/(N-1)12.N_hS_h13.1+(M-1)ρ14.随机或分层随机15.nX_i/X_total16.最小17.(n_1+1)(n_2+1)(n_1-m)(n_2-m)/[m^3(m+1)]18.事后分层比率19.C_0+c_1n′+c_2n20.偏差三、判断题21.√22.×23.√24.×25.√26.√27.×28.√29.×30.√四、简答题31.将总体划分为内部同质、层间异质的层,使层内方差大幅减小,层间方差归入抽样方差公式中的“层间平方和”部分,从而在分层抽样方差公式中总体方差被替换为层内方差加权和,达到精度提升。32.成本函数C=C_1√M+C_2M表明群规模M增大可缩减差旅费但增加场内观测费;群内相关系数ρ增大则设计效应增大,需缩小M。最优M在边际成本等于边际精度收益处取得,常用公式M_opt∝√[C_1(1-ρ)/(C_2ρ)]。33.系统抽样估计量方差依赖于总体单元排列顺序的潜在周期或趋势,无法从单一样本直接估计总体方差;可用连续差分法、多重系统抽样或把系统样本视为分层样本构造方差估计量。34.双重抽样先以低成本获得大样本辅助变量x,再在小子样本中观测昂贵目标变量y,利用y对x的回归或比率关系,将辅助信息外推至大样本,从而以较小成本获得与全样本观测相近的精度。五、讨论题35.人口普查采用“分层—系统—整群”混合设计:省级分层保证地域代表性;系统抽样抽取普查小区;整群调查降低差旅成本。非抽样误差控制关键:1.完善行政记录抽样框减少覆盖误差;2.预约+多次回访降低无回答;3.标准化培训与电子采集降低测量误差。36.比率估计无需模型假设但要求辅助变量总体均值已知,计算简单,对线性相关敏感;回归估计需线性模型稳健且允许辅助变量均值未知,可通过样本回归,计算复杂,对异常值敏感。大型社会调查若辅助信息完整且相关高,用比率;若关系非线性或需调整多个辅助变量,用回归。37.虚拟总体中“封闭性”假设常被用户注册注销破坏,“标记不丢失”被多账号规避。改进:1.采用多平台联合标记降低标记丢失;2.引入捕获历史模型(如Lincoln–Petersenlog-linear模型)估计开放总体增减。38.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论