版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
海量高质量统计学基础练习题库及参考答案一、描述统计与数据可视化1.【单选】某城市120名网约车司机周均接单量(单位:单)的茎叶图如下,则其众数为0|891|000122233334455566778892|01122345567893|02345A.10B.13C.17D.20答案:B解析:出现次数最多的叶值是“3”,对应茎“1”,即13单,共出现4次,为最高频。2.【单选】若一组右偏收入数据取自然对数后呈对称分布,则原数据的中位数m与几何平均G的关系为A.m=GB.m>GC.m<GD.无法确定答案:C解析:右偏数据均值>中位数;对数对称⇒原数据服从对数正态,此时中位数=exp(μ),几何平均=exp(μ−σ²/2),故m>G。3.【多选】箱线图可直观展示A.中位数B.极差C.四分位距D.偏态方向E.峰度大小答案:ABCD解析:箱线含中位线、箱体(Q1−Q3)、触须(min/max或1.5IQR),可判偏态;峰度需计算矩,箱线无法直接显示。4.【填空】某电商6天日销售额(万元)为:12.5,13.8,14.2,15.0,15.6,16.1。其第60百分位数为______万元(保留1位小数)。答案:15.2解析:位置i=0.6×(6+1)=4.2,第4与第5线性插值:15.0+0.2×(15.6−15.0)=15.12≈15.2。5.【计算】某校抽样测得50名本科生每日手机使用时长(min)的均值为268,标准差为46。若将单位换为小时,求新的变异系数。答案:0.287解析:单位换小时,均值=268/60=4.467,标准差=46/60=0.767;CV=0.767/4.467=0.287。6.【综合】某城市PM2.5浓度(μg/m³)年度数据直方图呈双峰,左侧峰对应“优良天气”,右侧峰对应“污染天气”。试给出两种可能产生双峰的统计原因(非气象因素)。答案:1.混合分布:监测站点同时受“背景清洁区”与“工业排放区”两类不同总体叠加。2.数据截断:仪器在低于12μg/m³时记录为12,导致左侧堆积;同时高值未截尾,形成右峰。二、概率论基础7.【单选】事件A,B满足P(A)=0.4,P(B|A)=0.5,P(B|Aᶜ)=0.2,则P(A|B)为A.1/2B.2/3C.3/5D.5/7答案:B解析:P(B)=P(B|A)P(A)+P(B|Aᶜ)P(Aᶜ)=0.5×0.4+0.2×0.6=0.32;P(A|B)=P(B|A)P(A)/P(B)=0.2/0.32=2/3。8.【单选】设X~Poisson(λ),则E[X(X−1)]=A.λB.λ²C.λ²+λD.λ²−λ答案:B解析:E[X(X−1)]=E[X²−X]=Var(X)+(E[X])²−E[X]=λ+λ²−λ=λ²。9.【多选】下列函数中可作为连续型随机变量密度的是A.f(x)=2x,0<x<1B.f(x)=0.5e^(−|x|)C.f(x)=1−|x|,−1<x<1D.f(x)=1/π(1+x²)E.f(x)=x/(1+x²),x>0答案:ABCD解析:需非负且积分为1;E积分发散,不满足。10.【填空】若X~N(0,1),则E[|X|³]=______(可用Γ函数表示)。答案:2√(2/π)解析:E|X|³=2∫₀^∞x³φ(x)dx=2/√(2π)∫₀^∞x³e^(−x²/2)dx;令t=x²/2,得2/√(2π)∫₀^∞2te^(−t)dt/t^(1/2)=2√(2/π)Γ(2)=2√(2/π)。11.【证明】设连续型随机变量X的矩母函数M_X(t)=E[e^(tX)]在|t|<h存在,证明:若M_X(t)=M_Y(t)对所有|t|<h成立,则X与Y同分布。答案:由唯一性定理,矩母函数在0的邻域内唯一决定分布函数;故F_X(x)=F_Y(x)对所有x成立,即同分布。12.【应用】某保险单年度索赔次数N服从λ=0.8的泊松分布,每次索赔额(万元)服从Exp(0.05)。若保单约定免赔额1万元,求年度总赔付期望。答案:12.13万元解析:单次赔付E[max(0,X−1)]=∫₁^∞(x−1)0.05e^(−0.05x)dx=e^(−0.05)/0.05=0.9512/0.05=19.025;总期望=E[N]×19.025=0.8×19.025=12.22(四舍五入12.13)。三、随机变量与分布变换13.【单选】设X~U(0,1),则Y=−ln(1−X)的分布为A.Exp(1)B.Exp(1/2)C.Gamma(2,1)D.Weibull(1,1)答案:A解析:F_Y(y)=P(Y≤y)=P(−ln(1−X)≤y)=P(X≤1−e^(−y))=1−e^(−y),即Exp(1)。14.【单选】若(X,Y)服从二维正态,且Cov(X,Y)=0,则下列一定独立的是A.X与YB.X²与Y²C.e^X与YD.X+Y与X−Y答案:A解析:二维正态下不相关等价于独立;其余非线性变换未必。15.【多选】设X₁,X₂i.i.d.∼N(0,1),则A.X₁+X₂∼N(0,2)B.X₁²+X₂²∼χ²(2)C.X₁/X₂∼t(1)D.X₁²/X₂²∼F(1,1)E.(X₁+X₂)²/2∼χ²(1)答案:ABDE解析:C应为Cauchy,即t(1),但严格写法需X₂≠0;题目未限定,故C不严谨,不选。16.【填空】若T∼t(8),则E[T²]=______。答案:8/(8−2)=1.6解析:t(ν)的二阶矩ν/(ν−2),ν>2。17.【计算】设X的密度f_X(x)=2x,0<x<1,求Y=1/X的密度。答案:f_Y(y)=2/y³,y>1解析:变换法:x=1/y,|dx/dy|=1/y²;f_Y(y)=f_X(1/y)·1/y²=2(1/y)(1/y²)=2/y³,y>1。18.【证明】若X~Gamma(α,λ),Y~Gamma(β,λ)独立,证明Z=X+Y~Gamma(α+β,λ)。答案:利用矩母函数:M_X(t)=(λ/(λ−t))^α,M_Y(t)=(λ/(λ−t))^β;M_Z(t)=M_X(t)M_Y(t)=(λ/(λ−t))^(α+β),即Gamma(α+β,λ)的矩母函数,由唯一性得证。四、大样本与极限定理19.【单选】设{X_i}i.i.d.,E[X_i]=μ,Var(X_i)=σ²<∞,则A.√n(X̄−μ)⟶P0B.√n(X̄−μ)⟶dN(0,σ²)C.X̄⟶a.s.μD.S²⟶Pσ²答案:BCD解析:A应为⟶d,不是概率;B中心极限定理;C强大数律;D一致估计。20.【单选】用蒙特卡洛计算π,独立投点n=5×10⁵,估计值π̂的渐近标准误约为A.0.0005B.0.0016C.0.0025D.0.0056答案:B解析:π̂=4p̂,p=π/4;SE(π̂)=4√{p(1−p)/n}=4√{(π/4)(1−π/4)/5×10⁵}≈0.0016。21.【填空】设X_ii.i.d.∼Bernoulli(p),则对假设H₀:p=0.5,当n=100,观测到60次成功,得分检验统计量为______(保留2位小数)。答案:4.00解析:得分统计量U=(p̂−p₀)/√{p₀(1−p₀)/n}=0.1/√(0.25/100)=0.1/0.05=2.00;平方得4.00。22.【计算】用Delta方法求g(p)=p(1−p)的渐近方差,若√n(p̂−p)⟶dN(0,p(1−p))。答案:p(1−p)(1−2p)²解析:g′(p)=1−2p;渐近方差=[g′(p)]²p(1−p)=(1−2p)²p(1−p)。23.【证明】设{X_i}i.i.d.,E[X_i]=0,E[X_i⁴]<∞,证明:√n(X̄²)⟶d0答案:X̄=O_p(1/√n),则X̄²=O_p(1/n),故√nX̄²=O_p(1/√n)⟶P0,从而⟶d0。五、参数估计24.【单选】设X₁,…,X_ni.i.d.∼N(μ,σ²),μ已知,则σ²的MLE为A.1/nΣ(X_i−μ)²B.1/(n−1)Σ(X_i−X̄)²C.1/nΣ(X_i−X̄)²D.Σ(X_i−μ)²/(n−2)答案:A解析:μ已知,似然对σ²求导得MLE=1/nΣ(X_i−μ)²。25.【单选】若T_n为θ的无偏估计,且Var(T_n)→0,则T_n是θ的A.均方一致B.渐近正态C.充分统计量D.有效估计答案:A解析:无偏+方差→0⇒MSE→0,即均方一致。26.【多选】下列关于矩估计的说法正确的是A.不一定唯一B.总是无偏C.具有一致性D.可能超出参数空间E.渐近正态答案:ACDE解析:矩估计可因方程组多解而不唯一;非线性变换可产生偏差;一致+渐近正态由大样本理论保证;可能产生非法值(如方差<0)。27.【填空】设X∼Geom(p),则p的矩估计量为______(用X̄表示)。答案:1/X̄解析:E[X]=1/p,令X̄=1/p̂⇒p̂=1/X̄。28.【计算】某电子元件寿命服从Exp(λ),随机观测10件,总失效时间Σt_i=2850小时,求λ的MLE及Fisher信息。答案:λ̂=1/285=0.00351;I(λ)=n/λ²=10/λ²=8.12×10⁵解析:似然L=λ^ne^(−λΣt_i),得λ̂=n/Σt_i;Fisher信息I(λ)=−E[∂²lnL/∂λ²]=n/λ²。29.【证明】CramérRao下界对任意无偏估计成立的前提是答案:1.支撑集不依赖参数;2.可交换微分与积分;3.Fisher信息有限且正定。六、假设检验30.【单选】两独立正态总体,方差未知但相等,检验H₀:μ₁=μ₂,应使用A.Z检验B.单样本tC.配对tD.两样本合并方差t答案:D31.【单选】若p值=0.027,显著性水平α=0.05,则A.拒绝H₀且H₀概率为0.027B.拒绝H₀且犯第一类错误概率为0.05C.不拒绝H₀D.检验功效为0.973答案:B32.【多选】下列属于非参数检验的是A.Wilcoxon秩和B.KruskalWallisC.符号检验D.游程检验E.卡方拟合优度答案:ABCDE33.【填空】卡方拟合优度检验,分类k=7,估计参数m=2,样本量n=500,则检验统计量渐近分布自由度为______。答案:4解析:df=k−1−m=7−1−2=4。34.【计算】某A/B测试,对照组200人转化28人,实验组200人转化42人,求差值p₁−p₂的95%置信区间(用WilsonScore)。答案:(0.011,0.189)解析:合并Score区间公式,经计算得下限0.011,上限0.189。35.【证明】证明:对任意水平α的检验,其功效函数β(θ)在H₀下满足β(θ)≤α。答案:由定义,功效=1−第二类错误,在H₀下第一类错误概率=β(θ)≤α,由显著性水平定义直接得。七、方差分析与回归36.【单选】单因素ANOVA,因素A有3水平,每水平重复10次,则误差自由度为A.27B.28C.29D.30答案:A解析:df_E=n−k=30−3=27。37.【单选】在多元线性回归中,若某自变量X_j的VIF=8.5,则其A.与响应高度相关B.存在严重多重共线C.系数显著D.应被剔除答案:B38.【多选】关于残差诊断,正确的是A.QQ图检验正态B.残差vs拟合值图检验方差齐性C.Cook距离衡量影响点D.杜宾瓦特森检验序列相关E.偏残差图可检视非线性答案:ABCDE39.【填空】对模型Y=β₀+β₁X+ε,若用n=20对观测得Σx_i=100,Σy_i=150,Σx_iy_i=900,Σx_i²=600,则β̂₁=______。答案:0.5解析:β̂₁=[Σx_iy_i−nx̄ȳ]/[Σx_i²−nx̄²]=[900−20×5×7.5]/[600−20×25]=150/100=1.5(更正:x̄=5,ȳ=7.5,得β̂₁=1.5)。40.【计算】给出回归ANOVA表:SSR=450,SSE=150,n=30,p=3,求调整R²。答案:0.728解析:R²_a=1−(SSE/(n−p−1))/(SST/(n−1))=1−(150/26)/(600/29)=0.728。41.【综合】某研究者将剂量作为分类变量(低、中、高)纳入线性模型,发现“高”水平系数为负且显著,但散点图显示Y随剂量单调增。请解释可能原因并给出改进方案。答案:原因:分类变量模型未利用剂量数值顺序,且“高”组样本特殊(如存在高剂量抑制子群)。改进:1.将剂量作为连续变量,加入二次项检验非线性;2.检查高剂量组异常值;3.使用分段回归或样条。八、贝叶斯统计42.【单选】若X|θ∼Bin(n,θ),θ∼Beta(α,β),则后验分布为A.Beta(α+x,β+n−x)B.Beta(α−x,β−n+x)C.Bin(n+x,θ)D.Beta(α+n,β+x)答案:A43.【单选】对平方误差损失,贝叶斯估计量为A.后验均值B.后验中位数C.后验众数D.先验均值答案:A44.【多选】下列属于共轭先验的是A.正态正态B.泊松伽马C.指数伽马D.二项贝塔E.多项狄利克雷答案:ABCDE45.【填空】若θ∼N(0,1),样本X|θ∼N(θ,1),n=1,观测X=2,则后验均值=______。答案:1解析:后验均值=(0/1+2/1)/(1/1+1/1)=1。46.【计算】设寿命X∼Exp(λ),λ∼Gamma(α,β),观测到r次失效,总时间T,求λ的贝叶斯估计(平方损失)及后验标准差。答案:后验λ|data∼Gamma(α+r,β+T);贝叶斯估计=(α+r)/(β+T);后验标准差=√(α+r)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物材料在中枢神经再生中的引导策略
- 生物可降解支架DAPT时长真实世界研究
- 生物制品稳定性试验与工艺变更评估
- 生物制品保存条件优化与稳定性设计
- 生物制剂失应答后IBD的术后复发预防策略
- 深度解析(2026)《GBT 20482-2017牧区雪灾等级》
- 销售岗位技能提升市场营销人员面试题集
- 生活质量导向的个体化免疫调节方案设计
- 银行信贷档案管理员面试题集及答案解析
- 瓣膜介入术后抗血小板治疗策略
- 劳动保障规章制度
- 地理八上期末考试试卷及答案
- 浏阳市社区工作者招聘笔试真题2024
- 红外线治疗的操作流程讲课件
- 广东建筑介绍
- 美容管理营销课程培训
- 高层建筑火灾风险评估与管理策略研究
- GB/T 37507-2025项目、项目群和项目组合管理项目管理指南
- 华为管理手册-新员工培训
- 社保补缴差额协议书
- 2025成人有创机械通气气道内吸引技术操作
评论
0/150
提交评论