2025年统计学原理测试题及答案_第1页
2025年统计学原理测试题及答案_第2页
2025年统计学原理测试题及答案_第3页
2025年统计学原理测试题及答案_第4页
2025年统计学原理测试题及答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年统计学原理测试题及答案一、单项选择题(每题2分,共20分)1.在抽样调查中,若总体方差未知且样本量较小,估计总体均值时应采用的分布是A.正态分布  B.t分布  C.χ²分布  D.F分布答案:B解析:小样本、总体方差未知时,样本均值经标准化后服从t分布。2.设随机变量X~N(μ,σ²),则P(μ-1.96σ≤X≤μ+1.96σ)的近似值为A.0.90  B.0.95  C.0.99  D.0.50答案:B解析:1.96为双侧95%置信区间对应的临界值。3.在简单线性回归模型y=β₀+β₁x+ε中,若ε~N(0,σ²),则β₁的最小二乘估计量β̂₁的抽样分布为A.N(β₁,σ²/Σxᵢ²)  B.N(β₁,σ²/Σ(xᵢ-x̄)²)  C.t(n-2)  D.χ²(n-2)答案:B解析:β̂₁服从正态分布,其方差为σ²/Σ(xᵢ-x̄)²。4.对同一组数据分别建立95%与99%置信区间,则A.前者更宽  B.后者更宽  C.两者等宽  D.无法比较答案:B解析:置信水平越高,临界值越大,区间越宽。5.在假设检验中,若显著性水平α由0.05降至0.01,则A.Ⅰ型错误概率降低,Ⅱ型错误概率升高  B.Ⅰ型错误概率升高,Ⅱ型错误概率降低C.两者均降低  D.两者均升高答案:A解析:α与β呈反向变动关系。6.对于列联表资料,欲检验两分类变量是否独立,应采用的检验统计量为A.Z统计量  B.t统计量  C.χ²统计量  D.F统计量答案:C解析:独立性检验使用Pearsonχ²检验。7.若样本偏度为-0.8,则分布形态可描述为A.左偏  B.右偏  C.对称  D.尖峰答案:A解析:偏度小于0表示左偏,即左侧尾部更长。8.在单因素方差分析中,组间均方MSB的期望值为A.σ²  B.σ²+nτ²  C.σ²+τ²  D.σ²/(k-1)答案:B解析:MSB期望为σ²+nτ²,其中τ²为处理效应方差。9.若两独立样本均值之差的95%置信区间不包含0,则在α=0.05下A.必拒绝H₀:μ₁=μ₂  B.必不拒绝H₀  C.可能拒绝也可能不拒绝  D.无法判断答案:A解析:置信区间与双侧检验完全等价。10.对某时间序列拟合ARIMA(1,1,1)模型后,残差Ljung-Box检验p值为0.003,则A.残差为白噪声  B.模型充分  C.模型不充分  D.需增加差分阶数答案:C解析:p值小于0.05,拒绝“残差为白噪声”的原假设,模型需改进。二、多项选择题(每题3分,共15分,多选少选均不得分)11.下列关于中心极限定理的说法正确的有A.样本量足够大时,样本均值分布近似正态  B.总体必须为正态分布C.样本均值的期望等于总体均值  D.样本均值的方差等于总体方差答案:A、C解析:中心极限定理不要求总体正态;样本均值方差为σ²/n。12.下列属于非参数检验方法的有A.Wilcoxon符号秩检验  B.Kruskal-Wallis检验  C.Mann-WhitneyU检验  D.Durbin-Watson检验答案:A、B、C解析:Durbin-Watson用于检验序列相关,属诊断量而非非参检验。13.在多元线性回归中,多重共线性的常见表现有A.VIF>10  B.特征根接近0  C.R²高但单个系数不显著  D.残差呈喇叭形答案:A、B、C解析:D为异方差表现。14.关于Bootstrap方法,正确的有A.属于重抽样技术  B.可估计统计量标准误  C.需假设总体分布已知  D.可构造置信区间答案:A、B、D解析:Bootstrap为非参数方法,不依赖总体分布假设。15.下列关于贝叶斯估计的说法正确的有A.后验分布∝似然×先验  B.先验分布可主观设定  C.贝叶斯因子用于模型选择  D.后验均值总是等于MLE答案:A、B、C解析:后验均值仅在特殊先验下与MLE重合。三、判断题(每题1分,共10分,正确打“√”,错误打“×”)16.样本中位数一定是总体中位数的无偏估计。答案:×解析:小样本下中位数可有偏。17.若随机变量X与Y独立,则Cov(X,Y)=0。答案:√解析:独立⇒协方差为0,反之不成立。18.在假设检验中,p值越大,拒绝原假设的证据越强。答案:×解析:p值越小证据越强。19.对正态总体,样本方差s²是σ²的极大似然估计。答案:√解析:正态情形下MLE即为s²。20.若回归模型存在异方差,OLS估计量仍无偏但非有效。答案:√解析:异方差不影响无偏性,但降低效率。21.χ²分布具有可加性,即独立χ²变量之和仍服从χ²分布。答案:√解析:自由度相加。22.在时间序列中,若自相关系数r₁显著,则序列必平稳。答案:×解析:平稳需满足一系列条件,单一r₁不足。23.非参数检验的检验效能总是低于参数检验。答案:×解析:若总体满足参数假设,参数检验效能更高;反之非参可能更优。24.贝叶斯置信区间称为可信区间,其含义与频率学派置信区间完全相同。答案:×解析:解释哲学不同。25.当样本量趋于无穷时,样本分位数的渐近分布为正态。答案:√解析:中心极限定理推广至分位数。四、填空题(每空2分,共20分)26.设X~B(n,p),则Var(X)=________。答案:np(1-p)27.若随机变量Z~N(0,1),则P(Z>2.58)≈________。答案:0.004928.在简单随机抽样中,估计总体比例所需最小样本量n≥________(置信水平95%,绝对误差d,总体比例p)。答案:z₀.₉₅²p(1-p)/d²29.对同一组数据,R²=0.80,调整R²=________(已知n=50,k=5)。答案:0.7826解析:Adj-R²=1-(1-R²)(n-1)/(n-k)=1-0.2×49/45=0.782630.设样本容量n=16,样本标准差s=6,则总体方差σ²的95%置信区间为________。答案:[s²(n-1)/χ²₀.₉₇₅,s²(n-1)/χ²₀.₀₂₅]=[36×15/27.488,36×15/6.262]=[19.65,86.24]31.在秩和检验中,两组样本量分别为8与12,则秩和统计量T的期望值为________。答案:n₁(n₁+n₂+1)/2=8×21/2=8432.若ARIMA(0,1,1)模型写为(1-B)yₜ=(1-θB)εₜ,则其移动平均部分阶数为________。答案:133.设θ̂为参数θ的无偏估计,若Var(θ̂)达到Cramér-Rao下界,则称θ̂为________估计。答案:有效34.对k=4组样本做单因素方差分析,组内平方和SSE=120,总平方和SST=200,则F统计量为________。答案:(SSB/(k-1))/(SSE/(n-k))=(80/3)/(120/(n-4)),需n,设n=20,则F=80/3÷120/16=3.5635.若Logistic回归模型logit(p)=-2+0.3x,则x每增加1单位,优势比变为原来的________倍。答案:e⁰·³≈1.35五、简答题(每题8分,共24分)36.简述矩估计与极大似然估计的区别,并举例说明当两者不一致时如何取舍。答案:矩估计通过样本矩匹配总体矩获得,计算简单但未必有效;极大似然估计通过最大化似然函数获得,具有一致性、渐近有效性与渐近正态性,但需已知分布形式且可能计算复杂。例如对Gamma(α,β)分布,矩估计α̂=x̄²/s²,β̂=s²/x̄;MLE需数值迭代。当样本量小且分布假设可靠时优先MLE;若分布未知或计算资源受限,可采用矩估计。37.说明多重共线性对回归模型造成的具体影响,并给出三种诊断方法与两种解决方案。答案:多重共线性导致系数估计方差膨胀、t检验失效、系数符号反常。诊断:①方差膨胀因子VIF>10;②特征值条件数κ>30;③相关系数矩阵|rij|>0.9。解决方案:①删除或合并高度相关变量;②采用岭回归、Lasso等正则化方法。38.解释“p值分布”概念,并说明在重复实验中p值均匀分布于[0,1]的数学条件。答案:当原假设H₀为真且检验统计量连续时,p值作为随机变量服从U(0,1)分布。这是因为p值定义为P(T≥t|H₀),即统计量T的尾部概率,其累积分布函数F(T)本身服从均匀分布。该性质是构造p值合并、多重检验校正(如FDR)的基础。六、计算与综合题(共61分)39.(10分)某生产线袋装食品标准重500g,现随机抽取25袋,测得平均重498g,样本标准差5g。假定重量服从正态分布。(1)在α=0.05下检验是否显著不足(单侧);(2)求总体均值的95%单侧置信上限;(3)若要求检验效能1-β=0.90,在真实均值μ=497g时,求所需样本量。答案:(1)H₀:μ=500vsH₁:μ<500,t=(498-500)/(5/5)=-2.0,临界值-t₀.₀₅,₂₄=-1.711,-2.0<-1.711,拒绝H₀,显著不足。(2)上限=x̄+t₀.₀₅,₂₄·s/√n=498+1.711×1=499.71g。(3)效应量δ=|500-497|/5=0.6,单样本t检验,n=[(z₀.₉₅+z₀.₉₀)/δ]²≈(1.645+1.282)²/0.36=24.3,取25,与现样本量一致。40.(12分)为比较两种化肥对小麦产量的影响,随机分配10块地到A、B两组,得产量(kg):A:3234313533B:3638373940(1)检验方差齐性(α=0.10);(2)选择合适方法检验均值差异;(3)给出均值差的95%置信区间;(4)若B组第3个数据误记为57,重新检验并讨论结果变化。答案:(1)F=s²B/s²A=1.72²/1.58²=1.18<F₀.₀₅,₄,₄=6.39,不拒绝,方差齐。(2)合并方差t检验,t=(38-33)/√(1.65²(1/5+1/5))=5/1.04=4.81>t₀.₀₂₅,₈=2.306,显著。(3)差值置信区间:(38-33)±2.306×1.04=[2.6,7.4]kg。(4)修正后B组均值37.4,sB=1.52,t=4.4,仍显著,但区间略缩,显示异常值对标准误影响有限。41.(12分)某电商记录日点击量x(千次)与成交额y(万元),数据n=20,得:Σx=200,Σy=150,Σx²=2200,Σy²=1300,Σxy=1800。(1)建立简单线性回归方程;(2)检验H₀:β₁=0(α=0.05);(3)当x=12时,求y的90%预测区间;(4)若模型残差呈现明显漏斗形,说明什么问题并给出改进措施。答案:(1)x̄=10,ȳ=7.5,lxx=2200-2000=200,lxy=1800-1500=300,lyy=1300-1125=175,β̂₁=300/200=1.5,β̂₀=7.5-1.5×10=-7.5,方程ŷ=-7.5+1.5x。(2)SSE=lyy-β̂₁lxy=175-450=-275→175-225=-50,s²=50/18=2.78,sβ̂₁=√(2.78/200)=0.118,t=1.5/0.118=12.7>t₀.₀₂₅,₁₈=2.101,显著。(3)ŷ=10.5,s_pred=√2.78×(1+1/20+(12-10)²/200)=1.75,t₀.₀₅,₁₈=1.734,区间10.5±3.04=[7.46,13.54]。(4)漏斗形提示异方差,可采用加权最小二乘或对y取对数变换。42.(13分)为研究教育程度(高/中/低)与收入等级(高/中/低)是否独立,调查300人得列联表:高教育:高收入40、中收入30、低收入30中教育:中收入50、低收入40低教育:高收入20、中收入30、低收入60(1)完成3×3列联表并计算期望频数;(2)进行χ²独立性检验(α=0.05);(3)计算列联系数C;(4)若发现低收入单元格期望频数小于5,给出替代检验方法并说明理由。答案:(1)完整表:40 30 30 10030 50 40 12020 30 60 13090 110 130 300期望频数eij=ri·cj/n,如e11=100×90/300=30,e12=36.67,e13=43.33;e21=36,e22=44,e23=40;e31=30,e32=36.67,e33=43.33。(2)χ²=Σ(o-e)²/e=(40-30)²/30+…=16.8>χ²₀.₀₅,₄=9.488,拒绝独立。(3)C=√(χ²/(n+χ²))=√(16.8/316.8)=0.23。(4)低收入期望频数均>5,无需替代;若<5,可用Fisher精确检验或合并相邻类别。43.(14分)某城市过去12个季度房租

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论