2026统计数据分析题常考题型总结 覆盖95%考试重点_第1页
2026统计数据分析题常考题型总结 覆盖95%考试重点_第2页
2026统计数据分析题常考题型总结 覆盖95%考试重点_第3页
2026统计数据分析题常考题型总结 覆盖95%考试重点_第4页
2026统计数据分析题常考题型总结 覆盖95%考试重点_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026统计数据分析题常考题型总结覆盖95%考试重点

一、单项选择题(每题2分,共20分)1.在正态总体方差未知且小样本条件下,对总体均值进行双侧检验时应选用的分布是A.标准正态分布B.t分布C.χ²分布D.F分布2.若随机变量X服从参数为λ的泊松分布,则其方差为A.λ²B.λC.1/λD.√λ3.对一组右偏样本数据做Box-Cox变换,若λ=0,则实际采用的变换是A.平方变换B.对数变换C.倒数变换D.恒等变换4.在多元线性回归中,若某自变量的VIF=8.5,则一般认为A.无多重共线性B.存在轻微多重共线性C.存在严重多重共线性D.无法判断5.对两独立正态总体方差比进行检验,应使用的检验统计量服从A.χ²分布B.t分布C.F分布D.标准正态分布6.在Bootstrap估计中,当原始样本量n=50,重复抽样B=2000次,则Bootstrap标准误的期望等于A.样本标准差B.样本标准误C.总体标准差D.07.若时间序列的ACF在滞后1阶后截尾,PACF呈拖尾,则初步可判定为A.AR(1)B.MA(1)C.ARMA(1,1)D.ARIMA(0,1,1)8.对分类变量做卡方拟合优度检验,要求期望频数小于5的单元格比例不超过A.10%B.20%C.25%D.50%9.在贝叶斯估计中,若先验为Beta(2,2),似然为二项分布Bin(n,θ),则后验分布为A.Beta(2+n,2+n-x)B.Beta(2+x,2+n-x)C.Beta(x,n-x)D.Beta(2,n)10.对高维数据做主成分分析,若保留前k个主成分,则累计贡献率应至少达到A.60%B.70%C.80%D.95%二、填空题(每题2分,共20分)11.若样本偏度为−0.4,则数据分布的形态为________偏。12.在简单随机抽样下,样本均值的标准误公式为________。13.当显著性水平α=0.01,双侧Z检验的临界值为________。14.若两变量Spearman秩相关系数为0.85,则其反映的是________相关。15.对指数分布Exp(λ)而言,其生存函数S(t)=________。16.在单因素方差分析中,组间均方MSB的自由度为________。17.若Logistic回归模型截距项为−2,则当自变量取0时事件发生的概率为________。18.对AR(1)模型X_t=φX_{t-1}+ε_t,若|φ|≥1,则过程________平稳。19.在K-means聚类中,常用的距离度量是________距离。20.若Lasso回归的调节参数λ→∞,则回归系数将被________到0。三、判断题(每题2分,共20分,正确写“T”,错误写“F”)21.对于任意随机变量,切比雪夫不等式给出的概率上界总是紧的。22.在假设检验中,p值越大,拒绝原假设的证据越强。23.若两变量线性相关系数为0,则它们必定独立。24.对正态总体,样本均值与样本方差相互独立。25.当样本量趋于无穷时,t分布收敛于标准正态分布。26.在多元回归中,调整R²可能小于0。27.对计数数据使用过离散检验时,若离散参数显著大于1,应选用负二项回归。28.时间序列差分次数越多,必然使序列更平稳。29.在Bootstrap置信区间构造中,BCa法具有二阶精度。30.对高维协方差矩阵估计,Ledoit-Wolf收缩估计可改善样本协方差矩阵的病态性。四、简答题(每题5分,共20分)31.简述在构建多元线性回归模型时,诊断异方差性的三种常用方法,并指出各自的核心思想。32.说明AIC与BIC在模型选择中的差异,并给出在样本量增大时二者倾向的结论。33.写出非参数核密度估计的基本公式,并说明带宽选择对估计结果的影响。34.列举导致主成分分析结果难以解释的两个主要原因,并给出对应的改进策略。五、讨论题(每题5分,共20分)35.讨论在观察性研究中使用倾向得分匹配控制混杂时,需满足的关键假设,并说明如何检验其合理性。36.高维数据下,经典最小二乘估计面临哪些挑战?请结合岭回归与Lasso回归的数学机理比较其优劣。37.时间序列分析中,单位根检验与协整检验的关系如何?请阐述Engle-Granger两步法的逻辑及局限。38.贝叶斯统计中,先验分布的选取对后验推断具有重要影响。请讨论无信息先验与主观先验在实际应用中的权衡,并举例说明稳健性分析的方法。答案与解析一、1B2B3B4C5C6B7B8B9B10D二、11左12σ/√n13±2.57614单调15e^(−λt)16k−1170.11918非19欧氏20压缩三、21F22F23F24T25T26T27T28F29T30T四、31.残差图法:绘制拟合值与残差散点图,观察漏斗或扇形;Breusch-Pagan检验:将残差平方对自变量回归,得LM统计量;White检验:加入自变量平方与交叉项,检验异方差形式。核心思想均为检验残差方差是否与模型变量相关。32.AIC=−2lnL+2k,BIC=−2lnL+klnn;AIC惩罚轻,易选复杂模型;BIC惩罚重,样本增大时倾向真模型;n→∞,BIC具有一致性,AIC不具一致性。33.f̂(x)=1/(nh)ΣK((x−X_i)/h),带宽h越小,估计曲线波动大、方差大;h越大,曲线平滑、偏差大;最优带宽需权衡偏差与方差,常用交叉验证选择。34.原因1:变量量纲差异大导致主成分受高方差变量主导,可标准化;原因2:主成分为原始变量线性组合,难以赋予实际意义,可采用旋转(如Varimax)或稀疏主成分(SPCA)提升解释性。五、35.关键假设为条件独立性和共同支撑;条件独立要求给定协变量后处理分配与潜在结果独立,可用敏感性分析检验;共同支撑要求处理组与对照组倾向得分重叠,可绘制重叠图并剔除非重叠区域;进一步可检验平衡性,确保匹配后协变量分布一致。36.挑战:维数灾难导致(X^TX)不可逆、估计方差爆炸;岭回归通过加λI使矩阵可逆,偏差小但保留全部变量;Lasso引入L1惩罚,兼具变量选择,产生稀疏解;岭回归适合多重共线,Lasso适合变量筛选;弹性网结合二者优势,同时处理相关变量与稀疏性。37.单位根检验判断单变量平稳性,协整检验关注多变量长期均衡;Engle-Granger第一步对残差做ADF检验,若平稳则存在协整;第二步用ECM建模;局限:小样本下残差检验势低,协整向量唯一,难推广至多变量;Johansen法可检验多重协整关系并估计向量。38.无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论