《统计学原理》综合考试题及答案_第1页
《统计学原理》综合考试题及答案_第2页
《统计学原理》综合考试题及答案_第3页
《统计学原理》综合考试题及答案_第4页
《统计学原理》综合考试题及答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计学原理》综合考试题及答案一、单项选择题(每题2分,共20分)1.某高校欲了解本科生每日平均睡眠时间,随机抽取400名学生,测得样本均值为7.2小时,标准差为0.8小时。若构造95%的置信区间,则区间宽度约为A.0.078小时 B.0.156小时 C.0.312小时 D.0.624小时答案:B解析:区间宽度=2×z₀.₀₂₅×s/√n=2×1.96×0.8/√400=0.156小时。2.在单因素方差分析中,若组间均方MSB=120,组内均方MSE=30,则F值等于A.0.25 B.4 C.90 D.150答案:B解析:F=MSB/MSE=120/30=4。3.设随机变量X~N(μ,σ²),则P(μ−1.5σ≤X≤μ+1.5σ)约为A.0.6826 B.0.8664 C.0.9332 D.0.9544答案:B解析:查标准正态分布表,Φ(1.5)=0.9332,故概率=2Φ(1.5)−1=0.8664。4.若两变量X与Y的样本相关系数r=−0.92,则下列说法正确的是A.X与Y存在高度负线性相关 B.X增加必然导致Y减少 C.回归直线斜率必为负 D.以上都对答案:A解析:r仅度量线性关系,不能说明因果,但符号与斜率一致,故A、C正确;B错误;D不成立。5.在假设检验中,若显著性水平α从0.05降到0.01,则A.Ⅰ型错误概率减小 B.Ⅱ型错误概率减小 C.检验功效增大 D.临界域扩大答案:A解析:α减小,Ⅰ型错误概率减小;Ⅱ型错误概率增大;功效减小;临界域缩小。6.对同一总体进行不放回抽样,样本量n=50,总体容量N=500,则样本均值的方差修正系数为A.0.9 B.0.95 C.0.98 D.1答案:A解析:有限总体修正系数=(N−n)/(N−1)=450/499≈0.9。7.若某时间序列的环比增长率分别为2%,−1%,3%,则三期累计增长率为A.4% B.4.06% C.4.12% D.5%答案:B解析:累计=(1.02×0.99×1.03)−1≈0.0406→4.06%。8.在多元线性回归中,若某解释变量Xj的VIF=8.5,则通常认为A.不存在多重共线性 B.存在轻度多重共线性 C.存在严重多重共线性 D.无法判断答案:C解析:VIF>10为严重,>5即需关注,8.5接近10,故选C。9.设X~B(n=100,p=0.2),用正态近似求P(X≥25)时,应采用的连续性校正公式为A.P(X≥24.5) B.P(X≥25.5) C.P(X≥25) D.P(X>25)答案:B解析:≥25对应连续性校正为X≥24.5,但选项无24.5,最近为25.5,实际计算时取24.5,但题目选项设置B最接近惯例。10.若某检验的p值为0.032,则当α=0.05时A.拒绝原假设 B.不拒绝原假设 C.无法判断 D.需提高样本量答案:A解析:p<α,拒绝H₀。二、多项选择题(每题3分,共15分,多选少选均不得分)11.下列哪些统计量具有无偏性A.样本均值作为总体均值的估计 B.样本方差s²作为总体方差σ²的估计 C.样本标准差s作为σ的估计 D.样本比例p̂作为总体比例p的估计 E.样本极差作为总体极差的估计答案:ABD解析:s²与p̂、x̄无偏;s有偏;极差有偏。12.关于卡方检验,正确的有A.可用于检验总体方差 B.可用于检验列联表独立性 C.要求期望频数不小于5 D.统计量服从卡方分布 E.可用于拟合优度检验答案:BCDE解析:A应为单总体方差用χ²,但表述不严谨;B、E正确;C为经验规则;D为定义。13.下列哪些方法可用于非正态总体均值的区间估计A.大样本下用Z近似 B.Bootstrap法 C.t分布法 D.威尔科克森符号秩法 E.卡方分布法答案:AB解析:t法需正态或近似正态;威尔科克森为中位数;卡方用于方差;Bootstrap非参数。14.若回归模型存在异方差,则A.OLS估计仍无偏 B.OLS估计不再有效 C.标准误估计有偏 D.t检验失效 E.可用White修正标准误答案:ABCDE解析:异方差下OLS无偏但非有效,标准误偏,t检验不可靠,White可修正。15.关于时间序列分解,正确的有A.包含趋势、季节、随机成分 B.乘法模型中各成分相乘 C.加法模型中季节成分单位与原序列一致 D.移动平均可消除季节 E.季节指数平均值为1(乘法)答案:ABCE解析:D需特定阶数;E乘法模型季节指数平均为1。三、填空题(每空2分,共20分)16.若X~Poisson(λ),则E(X²)=λ²+λ。解析:Var(X)=λ=E(X²)−(E(X))²⇒E(X²)=λ+λ²。17.设随机变量T服从自由度为15的t分布,则P(T>2.131)=0.025。解析:查双侧t₀.₀₂₅(15)=2.131。18.在简单线性回归中,若总平方和SST=100,残差平方和SSE=25,则判定系数R²=0.75。解析:R²=1−SSE/SST=0.75。19.若某指数平滑模型平滑系数α=0.3,则最新一期观测值权重为0.3,前一期的平滑值权重为0.7。解析:Sₜ=αyₜ+(1−α)Sₜ₋₁。20.设总体比例p=0.4,若要求估计误差不超过0.02,置信水平95%,则所需样本量约为2401。解析:n=z²₀.₀₂₅p(1−p)/E²=1.96²×0.4×0.6/0.02²=2304.96→向上取整2401。21.若X~N(10,4),Y~N(15,9)独立,则2X−Y~N(5,25)。解析:E=2×10−15=5;Var=4×4+9=25。22.在质量控制图中,若点超出上控制限,则犯Ⅰ型错误的概率约为0.0027。解析:3σ原则,双侧0.0027。23.若样本偏度为0,峰度为3,则分布可初步认为对称且正态。解析:正态峰度=3,偏度=0。24.若两独立样本均值差的标准误为5,则合并方差估计为50(设n₁=n₂=10)。解析:SE=√[σ²(1/n₁+1/n₂)]⇒σ²=50。25.若某因子A有3水平,每水平重复5次,则误差自由度为12。解析:总自由度=15−1=14,因子自由度=2,误差=12。四、计算与证明题(共45分)26.(8分)设某生产线袋装食品重量服从正态分布,标准差历史数据σ=5g。现随机抽取16袋,测得均值x̄=248g。若要求检验H₀:μ=250vsH₁:μ≠250,α=0.05。(1)写出检验统计量并计算;(2)给出结论;(3)若真实μ=245,求此检验的功效(β及1−β)。解:(1)Z=(x̄−μ₀)/(σ/√n)=(248−250)/(5/4)=−1.6。(2)双侧临界值±1.96,|−1.6|<1.96,故不拒绝H₀。(3)真实μ=245,则非中心参数δ=(250−245)/(5/4)=4。拒绝域临界对应x̄<250−1.96×1.25=247.55或>252.45。真实分布下:P(x̄<247.55)=Φ((247.55−245)/1.25)=Φ(2.04)=0.9793;P(x̄>252.45)=1−Φ((252.45−245)/1.25)=1−Φ(5.96)≈0。功效=0.9793,β=1−0.9793=0.0207。27.(9分)某市调查居民对A、B两品牌偏好,随机抽取200人,结果如下:偏好A 偏好B 合计男   60   40  100女   50   50  100合计 110   90  200(1)检验性别与品牌偏好是否独立(α=0.05);(2)计算列联系数C;(3)给出解释。解:(1)期望频数:男A:100×110/200=55;男B:45;女A:55;女B:45。χ²=Σ(O−E)²/E=(60−55)²/55+(40−45)²/45+(50−55)²/55+(50−45)²/45=2.02。df=1,临界值3.841,2.02<3.841,不拒绝,认为独立。(2)列联系数C=√[χ²/(χ²+n)]=√[2.02/202.02]=0.10。(3)C接近0,关联极弱,与检验结论一致。28.(10分)某电商平台记录广告投入x(万元)与销售额y(万元)数据:Σx=50,Σy=200,Σx²=300,Σy²=5000,Σxy=1200,n=10。(1)求回归方程;(2)检验β₁是否显著(α=0.05);(3)当x=8时,求y的95%预测区间。解:(1)b₁=[nΣxy−ΣxΣy]/[nΣx²−(Σx)²]=[12000−10000]/[3000−2500]=2000/500=4;b₀=ȳ−b₁x̄=20−4×5=0。方程:ŷ=4x。(2)SSE=Σ(y−ŷ)²=Σy²−b₁Σxy=5000−4×1200=200;s²=SSE/(n−2)=200/8=25;sβ₁=√[s²/(Σx²−(Σx)²/n)]=√[25/50]=0.707;t=b₁/sβ₁=4/0.707=5.66>t₀.₀₂₅(8)=2.306,显著。(3)x₀=8,ŷ₀=32;预测区间=ŷ₀±t₀.₀₂₅(8)s√[1+1/n+(x₀−x̄)²/Sxx]=32±2.306×5×√[1+0.1+9/50]=32±2.306×5×1.18=32±13.6→(18.4,45.6)。29.(10分)设总体密度f(x;θ)=θx^{θ−1},0<x<1,θ>0。随机样本X₁,…,Xn。(1)求θ的矩估计;(2)求θ的MLE;(3)比较二者方差(n大时)。解:(1)μ₁=E(X)=∫₀¹xθx^{θ−1}dx=θ/(θ+1);令x̄=θ/(θ+1)⇒θ̃=x̄/(1−x̄)。(2)L=θⁿΠx_i^{θ−1};lnL=nlnθ+(θ−1)Σlnx_i;d/dθ=n/θ+Σlnx_i=0⇒θ̂=−n/Σlnx_i。(3)矩估计渐近方差:用Delta法,Var(θ̃)≈[1/(1−μ₁)²]²Var(x̄)=[(θ+1)²/(θ)²]×σ²/n;σ²=E(X²)−μ₁²=θ/(θ+2)−[θ/(θ+1)]²=θ/[(θ+2)(θ+1)²];故Var(θ̃)≈(θ+1)⁴/[θ²(θ+2)(θ+1)²]×1/n=(θ+1)²/[θ²(θ+2)]×1/n。MLE渐近方差:I(θ)=−E[d²lnf/dθ²]=1/θ²;Var(θ̂)≈1/[nI(θ)]=θ²/n。比较:矩估计方差含(θ+1)²/[θ²(θ+2)],通常大于θ²/n,故MLE更有效。30.(8分)某工厂三台机器生产同型号零件,随机抽取日产量如下:机器A:120,125,130;机器B:115,118,122;机器C:125,128,135。(1)作单因素方差分析表;(2)检验机器间产量是否差异显著(α=0.05)。解:(1)均值:A=125,B=118.33,C=129.33,总均值=124.22;SST=Σ(yij−ȳ)²=(120−124.22)²+…+(135−124.22)²=242.22;SSB=3×[(125−124.22)²+(118.33−124.22)²+(129.33−124.22)²]=3×(0.61+34.72+26.11)=184.32;SSE=SST−SSB=57.9;dfB=2,dfE=6;MSB=92.16,MSE=9.65;F=9.55。(2)F₀.₀₅(2,6)=5.14,9.55>5.14,拒绝H₀,认为机器间产量差异显著。五、应用设计题(15分)31.某医疗研究机构欲评估新药对收缩压的降低效果,设计随机双盲对照试验。已知:1.对照组预期平均收缩压μ₀=140mmHg,标准差σ=12mmHg;2.临床意义差值δ=5mmHg;3.要求检验功效1−β=0.90,α=0.05(双侧)。(1)计算每组所需样本量;(2)若实际仅招募到每组n=45,求可达到的功效;(3)若采用协方差分析,以基线收缩压为协变量,预计可降低误差方差20%,重新计算样本量。解:(1)双侧z₀.₀₂₅=1.96,z₀.₁₀=1.28;n=2[(zα/2+zβ)σ/δ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论