2025年高级统计题库及完整答案_第1页
2025年高级统计题库及完整答案_第2页
2025年高级统计题库及完整答案_第3页
2025年高级统计题库及完整答案_第4页
2025年高级统计题库及完整答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年高级统计题库及完整答案一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项的字母填在括号内)1.在构建CPI篮子时,若某类商品支出占比下降但仍保持较高权重,最可能导致的统计偏差属于()A.替代偏差B.质量调整偏差C.outlet偏差D.新商品偏差答案:A2.对有限总体不放回简单随机抽样,样本均值方差公式中有限总体校正系数为()A.(Nn)/(N1)B.(Nn)/NC.n/ND.1n/N答案:A3.若随机变量X~N(μ,σ²),则E|Xμ|的表达式为()A.σ√(2/π)B.σ/√(2π)C.σ√πD.2σ/π答案:A4.在双重差分法中,处理组与对照组在干预前满足平行趋势假设的等价表述是()A.干预前两组结果变量增长率相同B.干预前两组结果变量水平相同C.干预前两组协变量分布相同D.干预前两组误差项同方差答案:A5.对高维线性模型使用Lasso,若惩罚系数λ→∞,则非零系数个数()A.趋于0B.趋于1C.趋于pD.不变答案:A6.在Bootstrapt置信区间构造中,关键统计量t=(θ̂θ̂)/se(θ̂),其Bootstrap分布用于估计()A.抽样分布B.先验分布C.后验分布D.极限分布答案:A7.对月度时间序列建立SARIMA(0,1,1)(0,1,1)₁₂模型,其季节差分阶数为()A.12B.1C.0D.2答案:A8.若样本偏度g₁=0,样本峰度g₂=3,则JarqueBera统计量近似服从()A.χ²(2)B.χ²(1)C.t(2)D.N(0,1)答案:A9.在贝叶斯层次模型中,若先验π(θ)∝1,则后验分布形状完全由()A.似然函数决定B.边缘似然决定C.预测分布决定D.超先验决定答案:A10.对零膨胀泊松回归,若检验“过度离散”参数α=0,应使用的渐近分布为()A.0.5χ²(0)+0.5χ²(1)B.χ²(1)C.N(0,1)D.F(1,1)答案:A11.在抽样调查中,若设计效应deff=1.8,则有效样本量约为名义样本量的()A.55.6%B.80%C.180%D.123%答案:A12.对两阶段整群抽样,若群规模不等且采用PPS抽样,则总体总量估计量具有()A.自加权性B.无偏性但非自加权C.一致性但非无偏D.有偏但方差最小答案:A13.若X₁,…,Xₙ为i.i.d.Exp(λ),则λ的UMVUE为()A.(n1)/∑XᵢB.n/∑XᵢC.1/X̄D.X̄答案:A14.在随机森林中,变量重要性度量基于()A.节点不纯度下降总和B.分裂次数C.OOB误差变化D.树深度答案:A15.对高维协方差矩阵估计,LedoitWolf收缩估计量的收缩目标为()A.单位矩阵B.对角样本协方差C.恒等矩阵D.样本协方差答案:A16.若使用GMM估计,当矩条件数大于参数个数时,过度识别检验统计量服从()A.χ²(rk)B.χ²(k)C.F(r,k)D.N(0,1)答案:A17.对空间误差模型Y=Xβ+u,u=λWu+ε,若|λ|>1,则模型()A.非平稳B.可识别C.无偏D.有效答案:A18.在生存分析中,若累积风险函数H(t)呈线性,则生存时间服从()A.指数分布B.威布尔分布C.对数正态D.伽马分布答案:A19.对分位数回归,当τ=0.5且误差对称时,系数估计等价于()A.LADB.OLSC.MLED.GLS答案:A20.在多重插补中,若m=5,则合并后标准误包含()A.组内方差+组间方差/mB.组内方差C.组间方差D.组间方差×m答案:A21.对网络数据,若采用随机图模型ER(n,p),则度分布服从()A.二项B.泊松C.正态D.幂律答案:A22.在因果图模型中,若X←Z→Y且X→Y,则Z为()A.混杂因子B.中介因子C.碰撞因子D.工具变量答案:A23.对面板数据固定效应模型,若n固定T→∞,则组内估计量()A.一致B.不一致C.有效D.有偏答案:A24.若使用AIC选模,其惩罚项为()A.2kB.klnnC.kD.2klnn答案:A25.在MCMC中,若接受率趋于0,则建议分布方差()A.过大B.过小C.最优D.无关答案:A26.对非参数核回归,若使用高斯核,最优带宽h~n^(1/5)依据()A.AMISE最小化B.CV最小化C.BIC最小化D.R²最大答案:A27.在贝叶斯因子BF₀₁=3.2,则证据强度属于()A.正向B.强C.极强D.无答案:A28.对计数数据使用负二项回归,若α→0,则模型退化为()A.泊松B.二项C.正态D.伽马答案:A29.在控制图应用中,若ARL₀=370,则假警报概率约为()A.0.0027B.0.05C.0.01D.0.1答案:A30.对函数型数据,若采用FPCA,则得分向量协方差为()A.对角B.单位C.稠密D.秩1答案:A二、多项选择题(每题2分,共20分。每题至少有两个正确答案,多选少选均不得分)31.下列属于非概率抽样方法的有()A.便利抽样B.雪球抽样C.配额抽样D.判断抽样答案:ABCD32.对高维回归,下列方法具备变量选择一致性的有()A.SCADB.MCPC.LassoD.ElasticNet答案:ABCD33.在因果推断中,满足非混杂假设的可行做法包括()A.随机化B.工具变量C.双重差分D.回归断点答案:ABCD34.下列统计量可用于检验正态性的有()A.ShapiroWilkB.AndersonDarlingC.LillieforsD.JarqueBera答案:ABCD35.对时间序列ARCH效应检验,可采用()A.LjungBoxB.LM检验C.EngleARCHD.McLeodLi答案:BCD36.在贝叶斯分析中,属于无信息先验的有()A.Jeffreys先验B.Reference先验C.Flat先验D.Haldane先验答案:ABCD37.对空间面板模型,固定效应估计方法包括()A.组内变换B.时间均值差分C.正交变换D.Helmert变换答案:ABC38.下列属于重抽样方法的有()A.BootstrapB.JackknifeC.PermutationD.Crossvalidation答案:ABCD39.对高维分类,可缓解过拟合的策略有()A.DropoutB.L₂正则C.早停D.数据增强答案:ABCD40.在生存树构建中,节点分裂准则可采用()A.Logrank统计量B.似然比C.基尼指数D.均方误差答案:AB三、判断题(每题1分,共10分。正确打“√”,错误打“×”)41.对任意随机变量,若相关系数为0则必独立。()答案:×42.在双重机器学习框架中,交叉拟合可缓解过拟合导致的偏差。()答案:√43.当T→∞时,单位根检验ADF统计量极限分布服从标准正态。()答案:×44.对泊松回归,若存在过度离散,标准误将被低估。()答案:√45.在Bootstrap百分位区间中,无需对统计量进行枢轴化。()答案:√46.若设计矩阵列满秩,则岭回归估计量唯一。()答案:√47.对任意核函数,NadarayaWatson估计在边界处偏差增大。()答案:√48.在EM算法中,每次迭代似然函数单调不减。()答案:√49.对分位数回归,目标函数处处可导。()答案:×50.若使用BayesianLasso,后验众数等价于频率派Lasso估计。()答案:√四、填空题(每空2分,共20分)51.对总体N=1000,n=100的简单随机抽样,样本比例方差公式为________。答案:p(1p)(Nn)/(N1)/n52.若X~Bin(20,0.3),则P(X=5)精确到四位小数为________。答案:0.178953.在随机效应meta分析中,τ²表示________方差。答案:异质54.对MA(1)模型Xₜ=εₜ+θεₜ₋₁,其自相关函数ρ₁=________。答案:θ/(1+θ²)55.若使用Gini指数衡量节点不纯度,则二分类问题Gini=________。答案:1∑pᵢ²56.对指数分布Exp(λ),其危险函数为常数________。答案:λ57.在函数型线性模型中,系数函数β(s)属于________空间。答案:L²58.若Bayes估计采用平方损失,最优估计为后验________。答案:均值59.对空间权重矩阵行标准化后,每行元素之和为________。答案:160.在控制图EWMA中,平滑参数λ越大,对________越敏感。答案:大偏移五、简答题(每题8分,共40分)61.简述双重差分法识别因果效应所需关键假设,并给出图示说明。答案:需平行趋势假设,即无干预时处理组与对照组结果趋势相同;图示:横轴时间,纵轴结果,干预前两线平行,干预后处理组线突变,差分即因果效应。62.说明高维回归中“OracleProperty”定义,并指出具备该性质的两类惩罚估计。答案:OracleProperty指估计量渐近等价于已知真实子集后的最小二乘估计;SCAD、MCP具备。63.写出Bootstrapt区间构造步骤,并指出其与百分位区间的优劣。答案:1.Bootstrap重抽样得θ̂;2.计算t=(θ̂θ̂)/se;3.用t分布分位数校正;优点:二阶精确;缺点:需稳定标准误估计,计算量大。64.解释空间计量模型中“空间溢出效应”含义,并给出SAR模型下的数学表达式。答案:溢出指某地解释变量变化对邻近地被解释变量的间接影响;SAR中∂E(Y)/∂xᵣ=(IρW)⁻¹β,对角线元素为直接效应,非对角为溢出。65.说明FPCA对函数型数据降维的数学原理,并给出累计方差贡献率公式。答案:对协方差算子C(s,t)做谱分解得特征值λₖ与特征函数φₖ;投影得分ξₖ=∫X(t)φₖ(t)dt;累计贡献率=∑₁ᴹλₖ/∑₁^∞λₖ。六、计算与综合题(共80分)66.(15分)对总体{2,5,8,11},n=2不放回简单随机抽样:(1)列出所有可能样本并计算样本均值;(2)验证E(x̄)=μ;(3)计算Var(x̄)并与公式对比。答案:(1)6样本,x̄分别为3.5,5,6.5,6.5,8,9.5;(2)E(x̄)=6.5=μ;(3)Var(x̄)=3.25,公式得(Nn)/(N1)·σ²/n=3.25,一致。67.(15分)给定二维数据(x,y):(1,2),(2,3),(3,5),(4,4),(5,6),用最小二乘估计线性回归,并计算R²。答案:β̂₁=0.9,β̂₀=1.3,R²=0.81。68.(20分)对PoissonGamma混合模型,Y|λ~Poisson(λ),λ~Gamma(α,β),求:(1)边缘分布;(2)E(Y);(3)Var(Y);(4)解释过度离散。答案:(1)负二项NB(α,p=β/(β+1));(2)E(Y)=α/β;(3)Var(Y)=α/β+α/β²;(4)Var>E,存在过度离散。69.(15分)设X₁,…,Xₙ来自f(x)=θx^{θ1},0<x<1,θ>0,求θ的MLE及其渐近分布。答案:θ̂=n/∑lnXᵢ;√n(θ̂θ)→N(0,θ²)。70.(15分)对AR(1)Xₜ=φXₜ₋₁+εₜ,|φ|<1,εₜ~iidN(0,σ²),求:(1)自协方差函数γₖ;(2)谱密度f(ω);(3)给出φ=0.5,σ²=1时γ₀。答案:(1)γₖ=σ²φ^{|k|}/(1φ²);(2)f(ω)=σ²/[2π|1φe^{iω}|²];(3)γ₀=4/3。七、案例分析题(共40分)71.(20分)某市欲评估限行政策对PM2.5影响,收集2018年1月—2022年12月日均浓度及气象变量,采用双重差分:(1)写出计量模型;(2)说明平行趋势检验步骤;(3)若存在季节效应,如何调整;(4)给出政策效应动态图示方法。答案:(1)Yₜ=α+βPostₜ×Treatₜ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论