大学《统计思想综述》题库试题附加答案_第1页
大学《统计思想综述》题库试题附加答案_第2页
大学《统计思想综述》题库试题附加答案_第3页
大学《统计思想综述》题库试题附加答案_第4页
大学《统计思想综述》题库试题附加答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大学《统计思想综述》题库试题附加答案一、单项选择题(每题2分,共20分)1.在频率学派框架下,参数θ的95%置信区间是指A.随机区间包含θ的概率为95%B.θ落在该区间的概率为95%C.样本均值落在该区间的概率为95%D.区间宽度为95%答案:A解析:置信区间是随机区间,其覆盖固定参数θ的概率为95%,而非θ落入固定区间的概率。2.若随机变量X~N(μ,σ²),则统计量T=(X̄-μ)/(S/√n)服从A.N(0,1)B.t(n-1)C.χ²(n-1)D.F(1,n-1)答案:B解析:样本标准差S代替σ后,T服从自由度为n-1的t分布。3.在贝叶斯推断中,若先验为π(θ),似然为L(θ|x),则后验分布正比于A.π(θ)B.L(θ|x)C.π(θ)L(θ|x)D.π(θ)/L(θ|x)答案:C解析:由贝叶斯定理,后验∝先验×似然。4.对线性模型Y=Xβ+ε,ε~N(0,σ²I),若X列满秩,则β的最小二乘估计的协方差矩阵为A.σ²(XᵀX)⁻¹B.σ²XᵀXC.σ²ID.σ²X答案:A解析:Cov(β̂)=σ²(XᵀX)⁻¹。5.在假设检验中,增大样本量n而其他条件不变,则A.第一类错误概率α一定减小B.第二类错误概率β一定减小C.检验的p值一定增大D.功效一定减小答案:B解析:样本量增大,检验功效1-β提高,β减小;α由研究者事先设定,不随n自动变化。6.若随机变量X,Y独立,则Cov(X,Y)等于A.0B.1C.Var(X)D.Var(Y)答案:A解析:独立必不相关,协方差为0。7.对泊松分布Pois(λ),其费雪信息I(λ)为A.1/λB.λC.1D.λ²答案:A解析:I(λ)=E[(∂logL/∂λ)²]=1/λ。8.在Bootstrap中,非参数百分位置信区间的构造基于A.理论正态近似B.经验分布的分位数C.极大似然估计D.贝叶斯后验答案:B解析:Bootstrap用经验分布的分位数直接构建区间。9.若X₁,…,Xₙi.i.d.来自U(0,θ),则θ的极大似然估计为A.X̄B.max{Xᵢ}C.min{Xᵢ}D.2X̄答案:B解析:均匀分布的MLE为样本最大值。10.对高维回归(p≫n),Lasso估计通过哪种方式实现变量选择A.岭惩罚B.L₁惩罚C.L₂惩罚D.无惩罚答案:B解析:Lasso使用L₁范数惩罚,具有稀疏性。二、多项选择题(每题3分,共15分)11.下列哪些方法可用于检验正态性A.Shapiro-Wilk检验B.Q-Q图C.Kolmogorov-Smirnov检验D.Anderson-Darling检验答案:A,B,C,D解析:四种方法均可评估样本是否来自正态分布。12.关于充分统计量,以下说法正确的是A.若T为充分统计量,则给定T后样本条件分布与参数无关B.充分统计量一定存在C.因子分解定理可用于寻找充分统计量D.充分统计量必为最小充分统计量答案:A,C解析:B错,某些分布族不存在充分统计量;D错,充分统计量不一定最小。13.下列哪些属于非参数回归方法A.Nadaraya-Watson核回归B.局部线性回归C.样条回归D.多项式回归答案:A,B,C解析:多项式回归仍属参数方法,需预设阶数。14.在贝叶斯线性模型中,若使用共轭先验,则A.后验分布与先验属于同一族B.后验均值是先验均值与MLE的加权平均C.后验分布的解析形式易得D.先验必须无信息答案:A,B,C解析:共轭先验允许解析更新,D错,共轭先验可有信息。15.关于EM算法,以下正确的是A.每次迭代似然非减B.适用于存在隐变量的问题C.保证收敛到全局最优D.M步最大化完全数据对数似然的期望答案:A,B,D解析:C错,EM可能收敛到局部极值。三、填空题(每空2分,共20分)16.若X~Bin(n,p),则E[X]=____,Var(X)=____。答案:np;np(1-p)17.对假设H₀:μ=μ₀vsH₁:μ≠μ₀,若σ已知,检验统计量为Z=(X̄-μ₀)/(σ/√n),在H₀下Z~____。答案:N(0,1)18.在线性回归中,决定系数R²=1-____/____。答案:RSS;TSS(残差平方和与总平方和)19.若X₁,…,Xₙi.i.d.来自Exp(λ),则λ的矩估计为____。答案:1/X̄20.对高维协方差矩阵估计,Ledoit-Wolf估计量是样本协方差与____的线性收缩。答案:单位矩阵(或恒等矩阵)21.若随机变量X的矩母函数为M_X(t)=exp(μt+σ²t²/2),则X~____。答案:N(μ,σ²)22.在Bootstrap-t方法中,需对每次Bootstrap样本重新计算____。答案:t统计量(或标准化统计量)23.对分类问题,若使用逻辑回归,则链接函数为____函数。答案:logit24.若X~Pois(λ),则其概率质量函数P(X=k)=____。答案:e^{-λ}λ^{k}/k!25.在随机森林中,通过____降低树间相关性。答案:Bootstrap抽样与随机子空间(或特征随机选择)四、计算与推导题(共30分)26.(8分)设X₁,…,Xₙi.i.d.来自N(μ,σ²),μ未知,σ²已知。求μ的95%置信区间,并证明其覆盖概率。答案:置信区间:X̄±z_{0.975}σ/√n证明:P(μ∈[X̄-zσ/√n,X̄+zσ/√n])=P(-z≤(X̄-μ)/(σ/√n)≤z)=Φ(z)-Φ(-z)=2Φ(z)-1=0.95其中z=1.96,Φ为标准正态CDF。27.(10分)对线性模型Y=Xβ+ε,ε~N(0,σ²I),X为n×p列满秩矩阵。(1)求β的最小二乘估计β̂;(2)证明β̂为无偏估计;(3)求Cov(β̂)。答案:(1)β̂=(XᵀX)⁻¹XᵀY(2)E[β̂]=(XᵀX)⁻¹XᵀE[Y]=(XᵀX)⁻¹XᵀXβ=β(3)Cov(β̂)=(XᵀX)⁻¹XᵀCov(Y)X(XᵀX)⁻¹=σ²(XᵀX)⁻¹28.(12分)设样本X₁,…,Xₙi.i.d.来自密度f(x|θ)=θx^{θ-1},0<x<1,θ>0。(1)求θ的极大似然估计θ̂;(2)计算费雪信息I(θ);(3)求θ̂的渐近分布。答案:(1)对数似然:l(θ)=nlogθ+(θ-1)∑logXᵢ令导数为0:n/θ+∑logXᵢ=0⇒θ̂=-n/∑logXᵢ(2)得分函数:U=∂l/∂θ=n/θ+∑logXᵢ∂²l/∂θ²=-n/θ²⇒I(θ)=-E[∂²l/∂θ²]=n/θ²(3)由MLE渐近理论,√n(θ̂-θ)⇒N(0,1/I(θ))=N(0,θ²)五、综合应用题(共15分)29.某电商平台想评估新页面设计对转化率p的影响。随机抽取n=1000个用户,新页面组n₁=500,转化x₁=65;旧页面组n₂=500,转化x₂=50。(1)建立假设检验,判断新页面是否显著提高转化率(α=0.05);(2)计算p值并给出结论;(3)求两组转化率差p₁-p₂的95%置信区间。答案:(1)H₀:p₁≤p₂vsH₁:p₁>p₂(2)样本率:p̂₁=65/500=0.13,p̂₂=50/500=0.10合并率:p̂=(65+50)/1000=0.115Z=(0.13-0.10)/√[0.115×0.885×(1/500+1/500)]=0.03/0.0202≈1.485单侧p值=1-Φ(1.485)=0.0688>0.05,不拒绝H₀(3)差值标准误:SE=√[0.13×0.87/500+0.10×0.90/500]=0.020395%CI:0.03±1.96×0.0203=(-0.0098,0.0698)结论:无显著证据表明新页面提高转化率,差值置信区间包含0。六、证明题(共10分)30.设T为参数θ的充分统计量,证明:若θ̂为任意无偏估计,则E[θ̂|T]仍为无偏估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论