统计学原理试题与答案_第1页
统计学原理试题与答案_第2页
统计学原理试题与答案_第3页
统计学原理试题与答案_第4页
统计学原理试题与答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学原理试题与答案1.单项选择题(每题2分,共20分)1.1某城市连续7天的日最高气温(℃)为:28,30,29,31,27,28,29。若定义“气温异常日”为当日气温与7天中位数之差的绝对值大于1.5℃,则异常日有几天?A.1  B.2  C.3  D.4答案:B解析:先排序得27,28,28,29,29,30,31,中位数为29。计算各日偏离:|28-29|=1,|30-29|=1,|29-29|=0,|31-29|=2,|27-29|=2,|28-29|=1,|29-29|=0。绝对值大于1.5的有31℃与27℃两天,故选B。1.2设随机变量X服从参数为λ的泊松分布,若P(X=2)=3P(X=1),则λ等于A.2  B.3  C.4  D.6答案:D解析:泊松概率质量函数P(X=k)=e^{-λ}λ^{k}/k!。由题意e^{-λ}λ^{2}/2!=3·e^{-λ}λ^{1}/1!,化简得λ/2=3,故λ=6。1.3对正态总体N(μ,σ²)进行n次独立观测,若σ已知,μ的1-α置信区间长度L与样本量n的关系为A.L∝1/√n  B.L∝1/n  C.L∝√n  D.L与n无关答案:A解析:区间长度L=2·z_{α/2}·σ/√n,显然L与1/√n成正比。1.4在单因素方差分析中,若因素水平数k=4,每组样本量n_i=5,则误差自由度为A.16  B.19  C.20  D.15答案:A解析:总自由度N-1=20-1=19,因素自由度k-1=3,误差自由度=19-3=16。1.5设X₁,X₂,…,X_n为来自U(0,θ)的样本,θ>0未知,则θ的极大似然估计为A.样本均值  B.样本中位数  C.样本最大值  D.样本最小值答案:C解析:均匀分布的似然函数L(θ)=θ^{-n}I_{[X_{(n)},∞)}(θ),在θ≥X_{(n)}时取最大值,故MLE为样本最大值X_{(n)}。1.6若随机变量X的矩母函数M_X(t)=(1-βt)^{-α},t<1/β,则X的方差为A.αβ  B.αβ²  C.α²β  D.α²β²答案:B解析:对M_X(t)求二阶导得E[X²]=α(α+1)β²,E[X]=αβ,故Var(X)=αβ²。1.7对同一总体进行两次独立抽样,样本量分别为n₁=100,n₂=400,样本均值分别为x̄₁=50,x̄₂=48,若合并样本方差S²=36,则合并均值为A.48.2  B.48.4  C.48.6  D.48.8答案:B解析:合并均值=(100·50+400·48)/500=48.4。1.8在线性回归模型Y=Xβ+ε,ε~N(0,σ²I)中,若设计矩阵X列满秩,则β的最小二乘估计的协方差矩阵为A.σ²(X'X)^{-1}  B.σ²X'X  C.σ²I  D.σ²X答案:A解析:经典结论Cov(β̂)=σ²(X'X)^{-1}。1.9设X~Bin(n,p),Y~Bin(m,p)且独立,则X+Y的分布为A.Bin(n+m,p)  B.Bin(nm,p)  C.Poisson(np+mp)  D.N(np+mp,np(1-p))答案:A解析:二项分布的可加性。1.10若随机变量X的密度f(x)=2x,0<x<1,则P(X≤0.5|X≤0.8)等于A.0.25  B.0.3125  C.0.5  D.0.64答案:B解析:P(X≤0.5|X≤0.8)=P(X≤0.5)/P(X≤0.8)=∫₀^{0.5}2xdx/∫₀^{0.8}2xdx=0.25/0.64=0.3125。2.多项选择题(每题3分,共15分,多选少选均不得分)2.1下列关于t分布的叙述正确的有A.当自由度→∞时趋近标准正态  B.对称于0  C.方差总大于1  D.可用于小样本均值推断答案:ABD解析:t分布方差=df/(df-2),df>2时存在且大于1,但df≤2时方差不存在,故C不严谨。2.2对于简单随机样本,样本均值x̄作为总体均值μ的估计量,具有A.无偏性  B.相合性  C.有效性  D.充分性答案:AB解析:x̄是μ的UMVUE,故无偏、相合、有效;但对一般分布未必充分,故D不选。2.3在线性回归中,若出现多重共线性,则可能出现A.系数估计方差膨胀  B.t检验容易不显著  C.R²急剧下降  D.预测值仍无偏答案:ABD解析:共线性使信息矩阵接近奇异,方差膨胀,t值变小,但R²未必下降,预测无偏性保持。2.4下列属于非参数检验方法的有A.Wilcoxon符号秩检验  B.Kruskal-Wallis检验  C.Mann-WhitneyU检验  D.Durbin-Watson检验答案:ABC解析:Durbin-Watson用于自相关,属回归诊断,非非参检验。2.5若X~N(0,1),Y~N(0,1)且独立,则A.X+Y~N(0,2)  B.X-Y~N(0,2)  C.X/Y服从Cauchy分布  D.X²+Y²~Exp(1/2)答案:ABC解析:X²+Y²~χ²(2),即Exp(1/2),故D也正确;但题目要求“下列”,系统默认选ABC即可。3.填空题(每空2分,共20分)3.1设X的密度f(x)=θx^{θ-1},0<x<1,θ>0,则θ的矩估计量为________。答案:θ̂=(1-X̄)/X̄解析:E[X]=∫₀¹xθx^{θ-1}dx=θ/(θ+1),令样本均值等于期望解得θ̂。3.2若随机变量X的偏度为0,峰度为3,则X________服从正态分布。(填“一定”或“不一定”)答案:不一定解析:存在非正态分布亦满足偏度0峰度3,如t分布df>4时峰度3。3.3对同一总体进行有放回抽样,样本量n=100,样本比例p̂=0.18,则比例的标准误为________。答案:0.0384解析:√[0.18·0.82/100]=0.0384。3.4在假设检验中,若显著性水平α=0.05,当p值=0.04时,应________原假设。(填“拒绝”或“不拒绝”)答案:拒绝3.5若X~Poisson(λ),则P(X为偶数)=________。答案:e^{-λ}cosh(λ)解析:∑_{k=0}^{∞}e^{-λ}λ^{2k}/(2k)!=e^{-λ}(e^{λ}+e^{-λ})/2。3.6设X₁,…,X_n来自N(μ,σ²),则样本方差S²是σ²的________估计。(填“无偏”或“有偏”)答案:无偏3.7若Cov(X,Y)=0,则X与Y________独立。(填“一定”或“不一定”)答案:不一定解析:仅说明线性无关,可存在非线性关系。3.8对同一正态总体,若样本量由n增至4n,则置信区间长度将变为原来的________倍。答案:1/2解析:长度∝1/√n。3.9设X~Exp(λ),则其中位数为________。答案:ln2/λ解析:解F(x)=1-e^{-λx}=0.5。3.10若随机变量X的密度f(x)=1/π(1+x²),则E[X]________存在。(填“不”或“”)答案:不解析:柯西分布期望不存在。4.计算与证明题(共45分)4.1(8分)设X₁,…,X_n独立同分布,密度f(x)=θ^{-1}e^{-x/θ},x>0,θ>0未知。(1)求θ的极大似然估计θ̂;(2)证明θ̂是θ的充分统计量;(3)计算E[θ̂]并判断其无偏性。答案与解析:(1)似然函数L(θ)=θ^{-n}exp(-∑X_i/θ),对数似然l(θ)=-nlnθ-∑X_i/θ,令导数为0得θ̂=X̄。(2)由因子分解定理,联合密度可写为g(T|θ)h(x),其中T=∑X_i,故T充分,从而θ̂=T/n亦充分。(3)E[θ̂]=E[X̄]=θ,故无偏。4.2(10分)某生产线包装量服从N(μ,4²)。质检部门希望检验H₀:μ=500vsH₁:μ≠500。现抽取n=25,得x̄=497.2。(1)计算检验统计量;(2)在α=0.05下给出决策;(3)求μ的95%置信区间;(4)若真实μ=498,求第二类错误概率β。答案与解析:(1)z=(497.2-500)/(4/√25)=-3.5。(2)临界值±1.96,|z|>1.96,拒绝H₀。(3)497.2±1.96·4/5→(495.63,498.77)。(4)真实均值498,临界域|x̄-500|>1.568。标准化:β=P(498.43<x̄<501.57|μ=498)=P(0.11<Z<4.39)=Φ(4.39)-Φ(0.11)=0.456。4.3(9分)设(X,Y)的联合密度f(x,y)=2,0<x<y<1。(1)求边缘密度f_X(x);(2)求条件密度f_{Y|X}(y|x);(3)计算E[Y|X=x];(4)判断X与Y是否独立。答案与解析:(1)f_X(x)=∫_x^12dy=2(1-x),0<x<1。(2)f_{Y|X}(y|x)=f(x,y)/f_X(x)=1/(1-x),x<y<1。(3)E[Y|X=x]=∫_x^1y/(1-x)dy=(1+x)/2。(4)f(x,y)≠f_X(x)f_Y(y),故不独立。4.4(8分)为比较三种肥料对小麦产量的影响,随机区组设计,得如下数据(kg/亩):肥料A:48,50,47  肥料B:52,54,51  肥料C:46,45,44(1)写出方差分析表(含SS、df、MS、F);(2)在α=0.05下检验肥料效应是否显著;(3)若显著,用Tukey法进行多重比较,求临界差异HSD。答案与解析:总均值=48.67,SSA=3[(48.67-48.67)²+…]=3[(48.67-48.33)²+(52.33-48.67)²+(45-48.67)²]=3(0.11+13.44+13.44)=80.97,dfA=2,MSA=40.48;SSE=(48-48.33)²+…=8.67,dfE=6,MSE=1.445;F=MSA/MSE=28.0>F_{0.05}(2,6)=5.14,显著。q_{0.05}(3,6)=4.34,HSD=4.34·√(1.445/3)=3.01。均值差:A-B=-4,|A-B|>3.01,A与B差异显著;A-C=3.33,不显著;B-C=7.33,显著。4.5(10分)设Y_i=β₀+β₁x_i+ε_i,ε_i~N(0,σ²)独立,i=1,…,n。已知∑x_i=0,∑x_i²=n。(1)求β̂₁的分布;(2)证明Cov(β̂₀,β̂₁)=0;(3)若n=20,σ²=9,x_i取值为-0.9,-0.8,…,0.9,求β̂₁的标准误;(4)构造β₁的95%置信区间。答案与解析:(1)β̂₁=∑x_iY_i/∑x_i²=∑x_iY_i/n~N(β₁,σ²/n)。(2)Cov(β̂₀,β̂₁)=Cov(Ȳ,∑x_iY_i/n)=σ²∑x_i/n²=0。(3)∑x_i²=n=20,故SE(β̂₁)=√(9/20)=0.67。(4)t_{0.025}(18)=2.101,区间:β̂₁±2.101·0.67。5.综合应用题(共40分)5.1(12分)某电商平台记录用户日点击次数X,历史数据表明X~Poisson(λ)。为提升活跃度,运营团队推出新界面,随机抽取30天,得∑X_i=810,∑X_i²=22500。(1)计算样本均值与样本方差;(2)在α=0.05下检验“新界面使λ提高”,即H₀:λ=25vsH₁:λ>25;(3)求λ的95%单侧置信下限;(4)若真实λ=28,求检验功效1-β。答案与解析:(1)x̄=810/30=27,s²=(22500-30·27²)/29=51.72。(2)大样本z=(27-25)/√(25/30)=2.19>1.645,拒绝H₀。(3)下限:27-1.645·√(27/30)=25.48。(4)真实λ=28,临界值25+1.645·√(25/30)=26.50,标准化:z=(26.50-28)/√(28/30)=-1.74,功效=Φ(1.74)=0.959。5.2(14分)某城市公交IC卡记录显示,乘客上下车时间间隔T(分钟)服从某右偏分布。随机抽取200趟,得平均间隔7.8min,标准差3.2min。(1)利用中心极限定理,求P(T̄<7.5);(2)构建总体中位数m的95%置信区间(使用顺序统计量法);(3)若认为T~Exp(λ),用矩估计求λ̂,并计算P(T>10);(4)在指数假设下,检验H₀:λ=0.15vsH₁:λ≠0.15,α=0.05。答案与解析:(1)CLT:T̄≈N(7.8,3.2²/200),z=(7.5-7.8)/0.226=-1.33,P=Φ(-1.33)=0.091。(2)顺序统计量:k₁=200/2-1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论