版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年数理统计与数据分析考试试题及答案1.(单选)设X₁,…,Xₙi.i.d.∼N(μ,σ²),σ²未知。若检验H₀:μ=μ₀对H₁:μ≠μ₀,取拒绝域|X̄−μ₀|/(S/√n)>c,则当显著性水平α=0.05时,c的值为A.t₀.₀₂₅(n−1) B.t₀.₀₅(n−1) C.z₀.₀₂₅ D.z₀.₀₅答案:A解析:σ²未知,用样本标准差S,统计量服从t(n−1)分布,双侧检验取α/2分位数,故c=t₀.₀₂₅(n−1)。2.(单选)对同一组数据分别用矩估计与最大似然估计拟合Gamma(α,β)模型,若样本偏度显著大于0,则A.矩估计α̂_MLE>α̂_MM B.矩估计α̂_MLE<α̂_MM C.两者相等 D.无法确定答案:B解析:Gamma偏度=2/√α,样本偏度大⇒α小。矩估计把样本三阶中心矩直接代入,受极端值影响更大,得到的α̂_MM偏小;MLE通过似然迭代更稳健,α̂_MLE相对较大,故α̂_MLE>α̂_MM不成立,反方向成立。3.(单选)在线性模型Y=Xβ+ε,ε∼N(0,σ²I)中,若设计矩阵X的列向量正交,则Cov(β̂)A.为对角阵 B.为单位阵 C.与X′X无关 D.为奇异阵答案:A解析:Cov(β̂)=σ²(X′X)⁻¹,X列正交⇒X′X对角⇒逆亦对角。4.(单选)对p维多元正态Nₚ(μ,Σ),若Σ为对角阵,则样本均值X̄与样本协方差SA.独立 B.不独立但无关 C.仅当p=1独立 D.仅当μ=0独立答案:A解析:多元正态下,Σ对角⇒分量独立,由Basu定理,完全充分统计量(X̄,S)与参数无关部分独立,故X̄与S独立。5.(单选)设X∼Bin(n,p),若采用Jeffreys先验π(p)∝p⁻¹/²(1−p)⁻¹/²,则后验均值E[p|X]为A.(X+1/2)/(n+1) B.X/n C.(X+1)/(n+2) D.(X+2)/(n+4)答案:A解析:后验为Beta(X+1/2,n−X+1/2),其均值为(X+1/2)/(n+1)。6.(单选)对泊松过程N(t)∼Poisson(λt),记录到第r次事件的时间T_r,则Var(T_r)A.r/λ² B.rλ C.λ/r D.1/(rλ²)答案:A解析:T_r∼Gamma(r,λ),方差r/λ²。7.(单选)若随机变量X的矩母函数M_X(t)=exp{λ(e^t−1)+μt},则X的分布为A.泊松+正态混合 B.泊松平移 C.正态+泊松卷积 D.泊松与正态独立和答案:B解析:MGF可分解为Poisson(λ)与退化μ之和,即X=Y+μ,Y∼Poisson(λ)。8.(单选)在Bootstrap置信区间构造中,若采用BCa方法,其加速系数a的估计基于A.刀切法影响函数 B.经验似然 C.密度核估计 D.经验分布分位数答案:A解析:BCa中的a由刀切法估计影响函数第三矩得到。9.(单选)对高维回归p≫n,若设计矩阵满足RestrictedEigenvalue条件,则Lasso估计的ℓ₂误差界速率在σ已知时为A.σ√(slogp/n) B.σslogp/n C.σ√(logp/n) D.σp/n答案:A解析:经典结果,s为非零系数个数,速率σ√(slogp/n)。10.(单选)若X₁,…,Xₙi.i.d.∼Uniform(0,θ),则P(X_(n)≤θ≤X_(n)/α^{1/n})的置信水平为A.1−α B.α C.1−α/2 D.α/2答案:A解析:P(θ≥X_(n))=1,P(θ≤X_(n)/α^{1/n})=P(X_(n)≥θα^{1/n})=1−α,故区间覆盖概率1−α。11.(填空)设X∼N(0,1),Y∼χ²(k)且独立,则T=X/√(Y/k)的密度函数在t=0处的值为________。答案:Γ((k+1)/2)/(√(kπ)Γ(k/2))解析:t分布密度f(t)=Γ((k+1)/2)/(√(kπ)Γ(k/2))(1+t²/k)^{-(k+1)/2},代入t=0即得。12.(填空)对线性模型Y=Xβ+ε,若采用岭估计β̂_λ=(X′X+λI)⁻¹X′Y,则当λ→∞时,β̂_λ的极限方向为________。答案:0向量解析:λ→∞⇒(X′X+λI)⁻¹≈(λI)⁻¹→0,故β̂_λ→0。13.(填空)若X₁,…,Xₙi.i.d.∼Exp(λ),则P(X₁+⋯+Xₙ≤t)的表达式为________。答案:1−e^{-λt}∑_{k=0}^{n−1}(λt)^k/k!解析:和为Gamma(n,λ),其CDF为不完全伽马函数,化简即得。14.(填空)对二维正态(X,Y)′∼N₂(0,0,1,1,ρ),则E[max(X,Y)]=________。答案:√((1−ρ)/π)解析:利用max(x,y)=(x+y+|x−y|)/2及正态绝对值期望公式。15.(填空)若样本k阶中心矩m_k=1/n∑(X_i−X̄)^k,则对正态样本m₄的期望为________。答案:3(n−1)σ⁴/n解析:正态四阶中心矩3σ⁴,经样本修正得。16.(解答)设X₁,…,Xₙi.i.d.∼f(x;θ)=θx^{θ−1},0<x<1,θ>0。(a)求θ的矩估计θ̂_MM;(b)求θ的最大似然估计θ̂_MLE;(c)比较两者渐近方差并说明优劣。答案:(a)EX=θ/(θ+1),令X̄=θ/(θ+1)⇒θ̂_MM=X̄/(1−X̄)。(b)似然L=θⁿ∏x_i^{θ−1},logL=nlogθ+(θ−1)∑logx_i,令导数为0得θ̂_MLE=−n/∑logx_i。(c)计算Fisher信息I(θ)=n/θ²,MLE渐近方差θ²/n。矩估计需Delta方法,Var(θ̂_MM)≈[θ/(θ+1)²]²Var(X̄)=[θ/(θ+1)²]²θ²/[n(θ+2)]=θ⁴/[n(θ+1)⁴(θ+2)]。比较得Var(θ̂_MLE)=θ²/n<θ⁴/[n(θ+1)⁴(θ+2)]=Var(θ̂_MM)对所有θ>0成立,故MLE更有效。17.(解答)某电商平台记录每日订单量Y_t,t=1,…,365。假设Y_t=β₀+β₁t+β₂sin(2πt/7)+ε_t,ε_t∼N(0,σ²)独立。(a)写出设计矩阵X的维度与第t行;(b)给出β̂的表达式;(c)若σ²未知,给出其无偏估计;(d)构造β₁的95%置信区间;(e)若实际数据出现异方差Var(ε_t)=σ²w_t,提出一种可行加权最小二乘步骤。答案:(a)X为365×3,第t行(1,t,sin(2πt/7))。(b)β̂=(X′X)⁻¹X′Y。(c)σ̂²=(Y−Xβ̂)′(Y−Xβ̂)/(365−3)。(d)令se=σ̂√[(X′X)⁻¹_{22}],区间β̂₁±t₀.₀₂₅(362)se。(e)步骤:1.先用OLS得残差e_t;2.回归loge_t²对t与三角项得方差估计ŵ_t=exp(fitted);3.权重W=diag(1/ŵ_t);4.加权最小二乘β̂_WLS=(X′WX)⁻¹X′WY。18.(解答)设(X,Y)联合密度f(x,y)=2θ^{-2}exp{−(x+y)/θ},0<x<y<∞。(a)求X的边缘密度;(b)求E[Y|X=x];(c)求θ的充分统计量;(d)给出θ的UMVUE。答案:(a)f_X(x)=∫_x^∞2θ^{-2}e^{−(x+y)/θ}dy=2θ^{-1}e^{-2x/θ},x>0,即Exp(θ/2)。(b)E[Y|X=x]=∫_x^∞yf(y|x)dy,其中f(y|x)=θ^{-1}e^{−(y−x)/θ},y>x,故E[Y|X=x]=x+θ。(c)联合密度可写为2θ^{-2}exp{−(x+y)/θ}I(x<y),由因子分解定理,T=X+Y为充分统计量。(d)令Z=X+Y,则Z∼Gamma(2,θ),E[Z]=2θ,故θ̂=Z/2为无偏,且为充分完全统计量的函数,因此是UMVUE。19.(解答)某实验室对新型电池进行寿命测试,记录n=20支电池寿命(千小时):2.3,3.1,4.0,2.8,3.5,3.9,4.2,5.1,3.7,4.4,4.8,3.3,3.6,4.5,5.0,4.1,3.8,4.3,4.6,4.7。假设寿命服从Weibull(λ,k),密度f(t)=kλ^kt^{k−1}exp{−(λt)^k}。(a)写出对数似然函数;(b)给出λ,k的得分方程;(c)用Newton-Raphson求k的MLE(迭代两步,初值k₀=2);(d)检验H₀:k=1对H₁:k≠1(似然比检验,α=0.05)。答案:(a)ℓ=nlogk+nklogλ+(k−1)∑logt_i−λ^k∑t_i^k。(b)∂ℓ/∂λ=nk/λ−kλ^{k−1}∑t_i^k=0⇒λ=(n/∑t_i^k)^{1/k};∂ℓ/∂k=n/k+nlogλ+∑logt_i−λ^k∑t_i^klog(λt_i)=0。(c)代入数据,初值k₀=2,得λ₀=(20/∑t_i²)^{1/2}=0.221。计算得分与二阶导,第一步k₁=2.38,第二步k₂=2.41,收敛至k̂=2.41。(d)全空间ℓ_max=−20(logk̂+k̂logλ̂)+(k̂−1)∑logt_i−λ̂^{k̂}∑t_i^{k̂}=−38.42;H₀下k=1,λ̂₀=1/(∑t_i/20)=0.256,ℓ₀=−42.15。似然比统计量Λ=2(ℓ_max−ℓ₀)=7.46>χ²₀.₀₅(1)=3.84,拒绝H₀,认为k≠1,非指数分布。20.(解答)考虑高维分类问题,样本(X_i,y_i),X_i∈ℝ^p,y_i∈{−1,+1},p=5000,n=100。采用L2正则逻辑回归:min_{β}1/n∑log(1+exp(−y_iX_i′β))+λ‖β‖²。(a)写出目标函数的梯度;(b)给出坐标下降更新公式;c)若采用十折交叉验证选择λ,描述一种并行化方案;(d)若测试集上发现预测概率校准不足,提出一种后处理校正方法并给出步骤。答案:(a)令p_i=1/(1+exp(−y_iX_i′β)),梯度=−1/n∑(y_iX_i(1−p_i))+2λβ。(b)对第j坐标,固定其余,更新β_j^(new)=S(1/n∑y_iX_{ij}(1−p_i^{(−j)}),λ)/(2λ+1/n∑X_{ij}^2p_i^{(−j)}(1−p_i^{(−j)}),其中S为软阈值。(c)方案:将数据均分10份,每轮训练与验证任务独立,映射到10核CPU或GPU流,每核输出验证误差,主进程汇总平均误差选λ。(d)采用Platt缩放:1.在验证集上得原始预测得分s_i=X_i′β̂;2.拟合逻辑模型P(y=1|s)=1/(1+exp(As+B)),得A,B;3.测试集上校正概率p̂_corr=1/(1+exp(As_test+B)),可提升校准。21.(综合)某城市地铁刷卡数据给出工作日早高峰7:00–9:00期间进站人数N_t每5分钟统计,t=1,…,24。观测值显示过度离散,拟合负二项NB(μ_t,ϕ),其中logμ_t=β₀+β₁t+β₂cos(2πt/24)+β₃sin(2πt/24)。(a)写出负二项对数似然;(b)给出β,ϕ的得分;(c)若检验过度离散H₀:ϕ→∞对H₁:ϕ<∞,构造Score检验统计量;(d)实际数据n=200个5分钟段,得Score统计量S=4.72,求p值并结论;(e)给出预测间隔t=25时μ_{25}的95%区间。答案:(a)ℓ=∑[logΓ(ϕ+N_t)−logΓ(ϕ)−logΓ(N_t+1)+ϕlog(ϕ/(ϕ+μ_t))+N_tlog(μ_t/(ϕ+μ_t))]。(b)∂ℓ/∂β=∑(N_t−μ_t)/(ϕ+μ_t)X_t,X_t=(1,t,cos,sin)′;∂ℓ/∂ϕ=∑[ψ(ϕ+N_t)−ψ(ϕ)+log(ϕ/(ϕ+μ_t))+(μ_t−N_t)/(ϕ+μ_t)],ψ为digamma。(c)Score检验在ϕ→∞下,统计量S=(∑(N_t−μ̂_t)²−μ̂_t)/(√(2∑μ̂_t²)),μ̂_t为泊松MLE。(d)S=4.72,近似标准正态,p=1−Φ(4.72)<0.0001,强烈拒绝H₀,存在过度离散。(e)用Delta方法,logμ̂_{25}方差=X_{25}′Cov(β̂)X_{25},得se=0.12,区间exp(logμ̂_{25}±1.96se),即(μ̂_{25}e^{-0.235},μ̂_{25}e^{0.235})。22.(证明)设X₁,…,Xₙi.i.d.∼f(x;θ)=θx^{θ−1},0<x<1,θ>0。证明T=−∑logX_i为完全充分统计量,并求θ的UMVUE。答案:联合密度θⁿexp{(θ−1)∑logx_i}=θⁿexp{−(θ−1)T},由指数族形式,T为充分统计量。对任意可测函数g,若E[g(T)]=0∀θ,则∫g(t)θⁿe^{−(θ−1)t}dt=0⇒g(t)=0a.e.,故T完全。E[T]=n/θ,令θ̂=(n−1)/T,则E[θ̂]=θ,且为T的函数,因此是UMVUE。23.(证明)对线性模型Y=Xβ+ε,ε∼N(0,σ²I),证明Cov(β̂,e)=0,其中β̂=(X′X)⁻¹X′Y,e=Y−Xβ̂。答案:Cov(β̂,e)=Cov((X′X)⁻¹X′Y,(I−H)Y)=(X′X)⁻¹X′Cov(Y,Y)(I−H)′=σ²(X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烧伤康复题库及答案
- 起重司机安全教育培训试题(含答案)
- hr证书考试题库及答案
- 妇幼保健考试题及答案解析大全
- 职业暴露培训考试考试练习题(附答案)
- 中式烹调师(初级)职业资格证考试试卷及答案【完整版】
- 高频dba面试题及答案
- 盘锦市公共基础辅警考试笔试题库及答案
- l临床医生三基考试试题及答案
- XX年质检员管理实务强化模拟题及答案
- 办公楼物业服务投标方案(技术方案)
- 品质例会管理制度
- DG-TJ08-2235-2024 地下建筑增扩与改建技术标准
- 山东省菏泽市牡丹区2024-2025学年八年级上学期期末语文试题(含答案)
- 养老院老年人能力评估表
- 《110kV三相环氧树脂浇注绝缘干式电力变压器技术参数和要求》
- DB53∕T 1269-2024 改性磷石膏用于矿山废弃地生态修复回填技术规范
- 前列腺增生的护理2
- GB/T 43869-2024船舶交通管理系统监视雷达通用技术要求
- 福彩刮刮乐培训课件
- QB∕T 3826-1999 轻工产品金属镀层和化学处理层的耐腐蚀试验方法 中性盐雾试验(NSS)法
评论
0/150
提交评论