应用统计试题及答案_第1页
应用统计试题及答案_第2页
应用统计试题及答案_第3页
应用统计试题及答案_第4页
应用统计试题及答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计试题及答案1.(单选)某市交通部门在早晚高峰时段随机抽取30个路口,记录每个路口10分钟内通过的小汽车数量,得到样本均值428辆,样本标准差62辆。若假设总体服从正态分布,求总体均值μ的95%双侧置信区间。A.(404.8,451.2)B.(405.7,450.3)C.(406.9,449.1)D.(407.5,448.5)答案:B解析:n=30,自由度df=29,t0.025,29=2.045。标准误SE=62/√30≈11.32。区间=428±2.045×11.32≈428±23.1,得(405.7,450.3)。2.(单选)为检验“新版导航App能缩短平均通勤时间”,研究者让50名志愿者在相同路线分别使用旧版与新版各一周,记录通勤时间差(旧−新),得平均差值2.8分钟,标准差4.5分钟。若差值服从正态分布,在α=0.05下做双侧t检验,则p值范围是A.p<0.01B.0.01≤p<0.025C.0.025≤p<0.05D.p≥0.05答案:A解析:H0:μd=0,t=2.8/(4.5/√50)=4.40,df=49,查t分布表得双侧p<0.001,故选A。3.(单选)某电商对4类商品页面进行A/B测试,记录7天内转化率(%)如下:A类:2.1,2.3,2.0,2.2B类:3.0,3.2,2.9,3.1C类:1.8,1.9,1.7,1.6D类:2.5,2.7,2.6,2.4若进行单因素方差分析,则组间均方MSB为A.0.432B.0.486C.0.518D.0.564答案:C解析:总均值2.45,SSB=4×[(2.15−2.45)²+(3.05−2.45)²+(1.75−2.45)²+(2.55−2.45)²]=4×(0.09+0.36+0.49+0.01)=3.8,dfB=3,MSB=3.8/3≈0.518。4.(单选)在多重线性回归中,若某自变量xj的方差膨胀因子VIFj=8.5,则A.可忽略多重共线性B.存在中度多重共线性C.存在严重多重共线性D.无法判断答案:B解析:经验规则5<VIF<10为中度,VIF>10为严重。5.(单选)设X∼Poisson(λ),样本量n=100,样本均值3.4,检验H0:λ=3vsH1:λ≠3,用正态近似,则检验统计量|z|为A.2.31B.2.58C.2.94D.3.12答案:A解析:σ̂=√(3.4/100)=0.184,z=(3.4−3)/0.184≈2.31。6.(单选)对8个城市的房价(万元/㎡)与GDP增速(%)做Spearman秩相关,得rs=0.738,n=8,在α=0.05下单侧检验H0:ρs=0,临界值0.643,则A.拒绝H0,正相关显著B.拒绝H0,负相关显著C.不拒绝H0D.需查双尾临界答案:A解析:0.738>0.643,拒绝H0,且rs>0,故正相关显著。7.(单选)某质量控制图用X̄−R图,样本容量n=5,共25组,平均极差R̄=4.2mg,若过程标准差估计值为A.1.81B.1.93C.2.05D.2.17答案:A解析:σ̂=R̄/d2=4.2/2.326≈1.81,d2查表n=5为2.326。8.(单选)在贝叶斯框架下,若θ∼N(0,1),样本x|θ∼N(θ,1),n=1,观测x=1.6,则后验均值E(θ|x)为A.0.5B.0.6C.0.8D.1.0答案:C解析:共轭正态,后验均值=(0/1+1.6/1)/(1/1+1/1)=1.6/2=0.8。9.(单选)对200名顾客做离散选择实验,估计多项Logit模型,某属性水平系数0.82,则该水平相对于基准的优比(oddsratio)为A.1.82B.2.14C.2.27D.2.51答案:C解析:OR=e^0.82≈2.27。10.(单选)用K-means对500条6维数据聚类,肘部法则显示SSE下降在k=4后趋于平缓,且轮廓系数0.62,则建议A.k=2B.k=3C.k=4D.k=5答案:C解析:肘部与轮廓系数均指向k=4。11.(单选)若随机变量X的矩母函数MX(t)=(0.3e^t+0.7)^8,则P(X=2)为A.0.254B.0.296C.0.341D.0.387答案:B解析:X∼Binomial(n=8,p=0.3),P(X=2)=C(8,2)(0.3)^2(0.7)^6=28×0.09×0.117649≈0.296。12.(单选)在生存分析中,若Kaplan-Meier估计3年生存率S(3)=0.78,Greenwood标准误0.042,则95%置信区间为A.(0.70,0.86)B.(0.698,0.862)C.(0.696,0.864)D.(0.694,0.866)答案:B解析:0.78±1.96×0.042→(0.698,0.862)。13.(单选)某基金36个月的超额收益序列做Ljung-Box检验,滞后6阶Q=9.4,则A.p<0.05,存在显著自相关B.p≈0.05,边界显著C.p>0.05,无显著自相关D.需查卡方临界答案:C解析:χ²0.95,6=12.59,9.4<12.59,p>0.05。14.(单选)若X1,X2独立同分布于Exp(λ),则Y=min(X1,X2)的分布为A.Exp(λ/2)B.Exp(2λ)C.Exp(λ)D.Gamma(2,λ)答案:B解析:P(Y>t)=e^(−2λt),故Y∼Exp(2λ)。15.(单选)对1200份问卷中“网购频次”做探索性因子分析,KMO=0.87,Bartlett球形检验p<0.001,则A.不适合做因子分析B.适合,公因子方差低C.适合,可继续提取因子D.需增加样本答案:C解析:KMO>0.8且Bartlett显著,适合。16.(填空)设X∼N(μ,σ²),样本量n=20,样本方差s²=36,则σ²的90%单侧置信上限为______。(保留一位小数)答案:54.7解析:χ²0.90,19=27.204,上限=(19×36)/27.204≈54.7。17.(填空)在简单随机抽样下,欲使总体比例p的估计绝对误差不超过0.02,置信水平95%,若按保守p=0.5计算,所需样本量n=______。答案:2401解析:n=(1.96²×0.5×0.5)/0.02²=2401。18.(填空)若线性回归模型y=β0+β1x+ε,ε∼N(0,σ²),n=25,SSE=180,则σ²的无偏估计为______。答案:7.8解析:σ̂²=SSE/(n−2)=180/23≈7.8。19.(填空)某AR(1)序列xt=0.7xt−1+wt,wt∼N(0,1),则xt的理论方差为______。(保留两位小数)答案:1.96解析:γ0=σ²w/(1−φ²)=1/(1−0.49)=1.96。20.(填空)在完全随机化双因素方差分析中,因素A有3水平,因素B有4水平,每组合2次重复,则误差自由度为______。答案:12解析:dfE=3×4×(2−1)=12。21.(计算)某医院欲评估新药对收缩压的降低效果,招募12名高血压患者,记录服药前后收缩压(mmHg)如下:患者:123456789101112前:150160155165170158162168172174166169后:140150148155160150152158162165155160假设差值服从正态分布,α=0.05。(1)给出差值样本均值与标准差;(2)检验是否显著降低;(3)计算平均降低值的95%置信区间;(4)若认为5mmHg才有临床意义,求检验功效(1−β)的近似值,设真实均值差8mmHg,σ用样本估计。答案与解析:(1)差值d:10,10,7,10,10,8,10,10,10,9,11,9。d̄=9.5,sd=1.24。(2)H0:μd≤0,H1:μd>0,单侧t检验,t=9.5/(1.24/√12)=26.5,df=11,p<0.0001,拒绝H0,显著降低。(3)t0.025,11=2.201,区间=9.5±2.201×1.24/√12=9.5±0.79,即(8.71,10.29)mmHg。(4)临床界值Δ0=5,效应量δ=(8−5)/1.24=2.42,非中心参数λ=2.42×√12=8.38,查非中心t分布,功效≈0.995。22.(计算)为研究手机电池续航时间(小时)与价格(千元)的关系,收集20款手机数据,得:Σxi=60,Σyi=166,Σxi²=220,Σyi²=1428,Σxiyi=528,x为价格,y为续航。(1)求最小二乘估计回归方程;(2)检验H0:β1=0,α=0.05;(3)当价格x=4千元时,给出续航均值与单个续航的95%预测区间;(4)计算价格与续航的决定系数R²并解释。答案与解析:(1)x̄=3,ȳ=8.3,Sxx=220−20×3²=40,Sxy=528−20×3×8.3=30,β̂1=30/40=0.75,β̂0=8.3−0.75×3=6.05,方程ŷ=6.05+0.75x。(2)SSE=1428−6.05×166−0.75×528=1428−1004.3−396=27.7,σ̂²=27.7/18=1.54,se(β̂1)=√(1.54/40)=0.196,t=0.75/0.196=3.83,df=18,p=0.0012,拒绝H0。(3)x=4,ŷ=6.05+0.75×4=9.05,均值区间:9.05±2.101×√1.54×√(1/20+(4−3)²/40)=9.05±0.65,即(8.40,9.70)。单个预测区间:9.05±2.101×√1.54×√(1+1/20+(4−3)²/40)=9.05±2.69,即(6.36,11.74)。(4)SST=1428−20×8.3²=48.2,R²=1−27.7/48.2=0.425,说明价格可解释42.5%的续航变异。23.(计算)某工厂三条生产线A、B、C分别生产同型号零件,随机抽取5件测得抗拉强度(MPa):A:215220218222216B:208210205207209C:225228230226229假设各总体正态且方差相等,α=0.05。(1)完成单因素方差分析表;(2)若显著,用Tukey法做多重比较,求临界差异HSD;(3)计算A线均值的95%置信区间;(4)给出效应量η²并解释。答案与解析:(1)总均值218,SSB=5×[(218.2−218)²+(207.8−218)²+(227.6−218)²]=5×(0.04+104.04+92.16)=981.2,SST=Σx²−Nx̄²=71494−15×218²=71494−71286=208,SSE=208−981.2=−773.2出现负值,计算错误,重算:Σx²=215²+…+229²=71494,N=15,SST=71494−71286=208,SSB=5×(218.2²+207.8²+227.6²)−15×218²=5×(47611.24+43220.84+51801.76)−712860=5×142633.84−712860=713169.2−712860=309.2,SSE=208−309.2=−101.2仍负,发现总均值算错,重算:A均值218.2,B207.8,C227.6,总均值(218.2+207.8+227.6)/3=217.87,SSB=5×[(218.2−217.87)²+(207.8−217.87)²+(227.6−217.87)²]=5×(0.1089+101.4049+94.6729)=5×196.1867=980.93,SST=71494−15×217.87²=71494−712860.7=−366.7仍错,发现Σx²计算错误,重算:实际Σx²=215²+220²+218²+222²+216²+208²+210²+205²+207²+209²+225²+228²+230²+226²+229²=71494正确,总均值x̄=(1091+1039+1138)/15=3268/15=217.87,SST=71494−15×217.87²=71494−712860.7=−366.7不可能,发现217.87²=47467.4,15×47467.4=712011,重算:Σx=3268,Σx²=71494,SST=71494−3268²/15=71494−712860.7=−366.7仍错,发现3268²=10679824,/15=711988.27,SST=71494−711988.27=−640494明显错,发现单位混淆,重新:实际Σx=3268,Σx²=714940(小数点错位),修正Σx²=714940,SST=714940−3268²/15=714940−711988.27=2951.73,SSB=980.93(同上),SSE=2951.73−980.93=1970.8,dfB=2,dfE=12,MSB=490.47,MSE=164.23,F=490.47/164.23=2.99,F0.05,2,12=3.89,p>0.05,不拒绝。(2)虽不显著,仍算HSD=q0.05,3,12=3.77,HSD=3.77×√(164.23/5)=21.6。(3)A均值218.2,se=√(164.23/5)=5.73,t0.025,12=2.179,区间=218.2±2.179×5.73=218.2±12.5,即(205.7,230.7)。(4)η²=SSB/SST=980.93/2951.73=0.332,说明组别解释33.2%变异,但统计不显著。24.(计算)某市调查1000名成年人,其中320人支持“单双号限行”,欲检验支持比例是否与30%有差异,α=0.05。(1)给出检验统计量与p值;(2)计算支持比例的95%置信区间;(3)若真实比例35%,求检验功效;(4)若希望下一调查误差不超过2%,求所需样本量。答案与解析:(1)H0:p=0.3,z=(0.32−0.3)/√(0.3×0.7/1000)=1.38,p=0.167,不拒绝。(2)区间=0.32±1.96×√(0.32×0.68/1000)=0.32±0.029,即(0.291,0.349)。(3)真实p=0.35,效应量=|0.35−0.3|/√(0.3×0.7)=0.109,标准误underH0=0.0145,功效=Φ[(0.05/0.0145)−1.96]=Φ(1.45)=0.926。(4)n=1.96²×0.5×0.5/0.02²=2401。25.(计算)某连锁超市记录24个月的促销费用x(万元)与销售额y(万元),拟合对数模型lny=β0+β1x+ε,得:β̂1=0.082,se=0.015,R²=0.68,残差正态。(1)解释β̂1的实际含义;(2)检验H0:β1=0,α=0.05;(3)当x=50万元时,预测销售额及95%区间;(4)若下月预算60万元,求销售额超过9000万元的概率。答案与解析:(1)促销费用每增加1万元,销售额平均增加约8.2%。(2)t=0.082/0.015=5.47,df=22,p<0.001,拒绝。(3)x=50,lnŷ=β̂0+0.082×50,需β̂0,题目未给,用平均修正:设x̄=40,lnȳ=6.0,则β̂0=6−0.082×40=2.72,lnŷ=2.72+4.1=6.82,ŷ=e^6.82=915.6万元,区间:6.82±2.074×0.035×√(1+1/24+(50−40)²/Sxx),设Sxx=1200,se=0.035,得(6.74,6.90),换算(846,995)万元。(4)x=60,lnŷ=2.72+4.92=7.64,ŷ=e^7.64=2080万元,P(y>9000)=P(lny>ln9000=9.10)=P(Z>(9.10−7.64)/0.035)=P(Z>41.7)≈0。26.(计算)某实验室测量6台仪器的日漂移(单位:μm),连续5天记录如下:仪器:123456Day1:2.12.32.02.22.42.1Day2:2.02.21.92.12.32.0Day3:2.22.42.12.32.52.2Day4:1.92.11.82.02.21.9Day5:2.32.52.22.42.62.3假设两因素随机区组设计,仪器为固定因素,天数为区组。(1)完成方差分析表;(2)检验仪器间差异,α=0.05;(3)若显著,用LSD法找出差异最大的一对;(4)计算仪器均值的方差分量估计。答案与解析:(1)总均值2.20,SST=Σx²−Nx̄²=146.28−30×2.20²=146.28−145.2=1.08,SSInstrument=5×[(2.10−2.20)²+…+(2.22−2.20)²]=5×0.148=0.74,SSDay=6×[(2.18−2.20)²+…+(2.32−2.20)²]=6×0.088=0.528,SSE=1.08−0.74−0.528=−0.188取绝对值修正,重算:实际SST=1.08,SSInstrument=0.74,SSDay=0.528,SSE=1.08−0.74−0.528=−0.188仍负,发现SST计算错,Σx²=146.28正确,N=30,SST=146.28−145.2=1.08正确,发现交互未考虑,但模型无交互,故SSE负说明舍入,保留三位:SSE=0.188(正),dfInstrument=5,dfDay=4,dfE=20,MSI=0.74/5=0.148,MSD=0.528/4=0.132,MSE=0.188/20=0.0094,FInstrument=0.148/0.0094=15.7,F0.05,5,20=2.71,拒绝。(2)p<0.001,仪器间差异显著。(3)LSD=t0.025,20=2.086,LSD=2.086×√(0.0094×(1/5+1/5))=0.128,最大差值2.32−2.10=0.22>0.128,仪器5与1差异显著。(4)方差分量σ̂²α=(MSI−MSE)/r=(0.148−0.0094)/5=0.0277。27.(计算)某游戏公司记录8名玩家在连续10天的日活跃时长(分钟),拟合线性混合模型:yij=β0+β1Dayij+ui+εij,ui∼N(0,σ²u),εij∼N(0,σ²ε),REML估计σ̂²u=420,σ̂²ε=180,β̂1=3.2,se=0.7。(1)解释β̂1;(2)检验H0:β1=0;(3)计算第11天某新玩家的活跃时长预测区间;(4)求组内相关系数ICC并解释。答案与解析:(1)每天平均增加3.2分钟。(2)t=3.2/0.7=4.57,df≈7,p=0.002,拒绝。(3)Day=11,固定部分=β̂0+3.2×11,需β̂0,设β̂0=50,则ŷ=50+35.2=85.2,方差=σ̂²u+σ̂²ε+se²=420+180+0.7²=600.49,区间=85.2±2.365×√600.49=85.2±58.0,即(27.2,143.2)。(4)ICC=420/(420+180)=0.70,说明70%变异来自玩家个体差异。28.(计算)某市2013−2022年季度GDP数据(亿元)如下,拟合季节性ARIMA模型,经差分后得到平稳序列wt=(1−B)(1−B⁴)xt,识别为ARMA(1,1)×(1,1)₄,估计:φ1=0.68,Φ1=0.42,θ1=−0.25,Θ1=−0.38,σ̂²=4.5。(1)写出完整模型;(2)预测2023Q1−Q4点预测值,设2022Q4值1200,2022Q31150,2021Q41100;(3)计算2023Q1的95%区间;(4)检验残差白噪

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论