《应用统计学》练习试题和答案解析_第1页
《应用统计学》练习试题和答案解析_第2页
《应用统计学》练习试题和答案解析_第3页
《应用统计学》练习试题和答案解析_第4页
《应用统计学》练习试题和答案解析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《应用统计学》练习试题和答案解析一、单项选择题(每题2分,共20分)1.某电商平台想研究“618”大促期间用户下单金额是否受优惠券面额影响,随机抽取1000名用户,记录其使用优惠券面额与最终实付金额。下列哪种图形最适合初步观察两变量间线性关系强弱?A.直方图 B.箱线图 C.散点图 D.雷达图答案:C解析:散点图用横纵坐标分别表示两个连续变量,点的分布趋势可直观反映线性相关强弱;直方图、箱线图用于单变量分布,雷达图适合多指标对比,均不满足需求。2.在简单线性回归y=β₀+β₁x+ε中,若ε服从N(0,σ²),则β₁的OLS估计量β̂₁的抽样分布为:A.t(n-2) B.N(β₁,σ²/Σ(xi-x̄)²) C.χ²(n-1) D.F(1,n-2)答案:B解析:高斯-马尔可夫定理下,β̂₁是β₁的无偏估计,且Var(β̂₁)=σ²/Sxx,其中Sxx=Σ(xi-x̄)²;又因ε正态,故β̂₁~N(β₁,σ²/Sxx)。3.对同一组数据分别建立95%置信区间与99%置信区间,则:A.两者宽度相同 B.95%更宽 C.99%更宽 D.无法比较答案:C解析:置信水平越高,临界值zα/2或tα/2越大,区间半宽越大,因此99%区间更宽。4.某质检部门每天抽检10件产品,记录不合格数,连抽30天,欲建立控制图监控过程质量,应选:A.x̄-R图 B.p图 C.c图 D.u图答案:B解析:每件产品只有“合格/不合格”两种结果,属二项分布,样本量固定为10,故选p图监控不合格率;c图、u图用于计点数据,x̄-R图用于连续变量。5.在单因素方差分析中,若F统计量=4.5,分子自由度=3,分母自由度=20,查表得F₀.₀₅(3,20)=3.10,则:A.拒绝原假设,说明所有总体均值全相等 B.拒绝原假设,说明至少一对均值不等 C.不拒绝原假设 D.需再作多重比较才能下结论答案:B解析:F=4.5>3.10,p<0.05,拒绝H₀;拒绝仅表明“不全相等”,并非“全不相等”,也无需先做多重比较即可得出“至少一对不等”的结论。6.对某城市1200名成年人进行血型调查,得到A:B:AB:O=270:240:90:600,欲检验该分布是否符合“民族学理论比例”2:2:1:5,应采用的检验为:A.单样本t检验 B.配对t检验 C.卡方拟合优度检验 D.独立样本非参数检验答案:C解析:比较观测频数与理论频数差异,属多项分布拟合问题,用χ²拟合优度检验;t检验用于均值,非参数检验不针对比例。7.若随机变量X~Poisson(λ),则Var(X)与E(X)的比值为:A.λ² B.1 C.1/λ D.λ答案:B解析:泊松分布的期望与方差均为λ,故比值为1。8.在多元回归中,若某自变量xk的VIF=8.5,则通常认为:A.不存在多重共线性 B.存在轻度多重共线性 C.存在严重多重共线性 D.模型必定错误答案:C解析:经验规则VIF>10为严重,5~10为中度偏高,8.5已接近10,应视为“严重”门槛边缘,需警惕。9.对同一总体,若样本量从n增大到4n,则样本均值的抽样标准误将:A.不变 B.变为原来1/2 C.变为原来1/4 D.变为原来2倍答案:B解析:标准误=σ/√n,√(4n)=2√n,故新标准误为σ/(2√n)=原标准误的一半。10.在时间序列加法模型Y=T+S+C+I中,若采用移动平均法估计趋势T,则季节指数计算步骤中,首先应:A.对原序列做中心化移动平均 B.对原序列做差分 C.用回归拟合趋势 D.直接求各月平均答案:A解析:加法模型下,用中心化12期移动平均可消除季节与不规则成分,得到趋势循环分量TC,再用Y-TC得SI,继续求季节指数。二、多项选择题(每题3分,共15分,多选少选均不得分)11.下列关于假设检验的陈述,正确的有:A.p值是H₀为真时,出现当前样本及更极端结果的概率 B.显著性水平α是犯第一类错误的最大允许概率 C.当p>α时,可认为H₀必定为真 D.降低α会同时降低检验功效 E.双侧检验的p值总是单侧的两倍答案:A、B、D解析:C错误,p>α仅表示“无充分证据拒绝”,非“证明为真”;E错误,仅当抽样分布对称且观测值位于单侧尾部时才成立,非普遍。12.关于χ²分布的性质,正确的有:A.取值非负 B.为对称分布 C.随着自由度增加,逐渐趋近正态 D.独立χ²变量之和仍服从χ²,自由度相加 E.均值等于自由度答案:A、C、D、E解析:χ²为右偏,非对称,故B错;其余均正确。13.在简单随机抽样下,估计总体比例p时,所需样本量n与下列哪些因素有关:A.允许误差d B.置信水平对应的zα/2 C.总体大小N(当N有限) D.预估比例p E.总体方差σ²答案:A、B、C、D解析:比例估计的公式n₀=z²p(1-p)/d²,若N有限再修正n=n₀/(1+n₀/N),与σ²无关。14.下列哪些方法可用于检验数据是否来自正态总体:A.Q-Q图 B.Shapiro-Wilk检验 C.Kolmogorov-Smirnov检验 D.Jarque-Bera检验 E.Levene检验答案:A、B、C、D解析:Levene检验用于方差齐性,不针对正态性。15.若建立Logistic回归模型logit(π)=β₀+β₁x,则:A.π表示事件发生的概率 B.e^β₁表示x增加一个单位时的优势比 C.参数估计采用最大似然法 D.残差服从正态分布 E.可用Hosmer-Lemeshow检验拟合优度答案:A、B、C、E解析:Logistic回归残差非正态,D错。三、填空题(每空2分,共20分)16.若X~N(μ,25),抽取n=16的样本,得x̄=18,则μ的95%置信区间为(____,____)。(保留一位小数)答案:(15.5,20.5)解析:σ=5,σx̄=5/√16=1.25,z₀.₀₂₅=1.96,区间=18±1.96×1.25=18±2.45。17.在单因素方差分析中,已知SSB=180,SSE=420,k=4组,n=60,则MSB=____,MSE=____,F=____。答案:60;7.5;8解析:dfB=k-1=3,MSB=180/3=60;dfE=n-k=56,MSE=420/56=7.5;F=60/7.5=8。18.若随机变量T服从自由度为15的t分布,则P(T>2.131)=____。(查表得t₀.₀₂₅(15)=2.131)答案:0.025解析:双侧尾部对称,单尾概率为0.025。19.某指数平滑模型中,平滑系数α=0.3,上期平滑值Sₜ₋₁=120,本期观测yₜ=135,则本期平滑值Sₜ=____。答案:124.5解析:Sₜ=αyₜ+(1-α)Sₜ₋₁=0.3×135+0.7×120=40.5+84=124.5。20.在质量控制中,若过程均值偏移1.5σ,则采用3σ控制图时,ARL(平均运行长度)约为____。答案:14解析:查偏移1.5σ的ARL表,得近似14。四、计算与综合题(共45分)21.(10分)某高校欲估计本科生月均生活费,历史σ=180元。现希望估计误差不超过20元,置信水平95%,求所需样本量。若预算限制最多调查400人,问允许误差变为多少?解:n₀=z²σ²/d²=1.96²×180²/20²=3.8416×32400/400=311.17→312人。若n=400,则d=zσ/√n=1.96×180/√400=352.8/20=17.64元。答案:需312人;若仅400人,误差降至约17.6元。22.(12分)为比较三种包装材料对零食保质期的影响,随机分配15批产品,每批5包,记录保质期(天):材料A:185190188184187材料B:180178182181179材料C:175173176174175(1)提出假设;(2)完成方差分析表;(3)若显著,用TukeyHSD做多重比较(α=0.05)。解:(1)H₀:μA=μB=μC;H₁:至少一对不等。(2)计算:x̄A=186.8,x̄B=180,x̄C=174.6,总均值x̄=180.47SSB=5[(186.8-180.47)²+(180-180.47)²+(174.6-180.47)²]=5(40.07+0.22+34.45)=373.7SSE=Σ(xij-x̄i)²=[(185-186.8)²+…+(187-186.8)²]+…=10.8+10+4.8=25.6dfB=2,dfE=12,MSB=186.85,MSE=2.133,F=87.6查F₀.₀₅(2,12)=3.89,87.6>3.89,拒绝H₀。(3)Tukey临界值q₀.₀₅(3,12)=3.77,标准误=√(MSE/5)=0.653,HSD=3.77×0.653=2.46|x̄A-x̄B|=6.8>2.46,|x̄A-x̄C|=12.2>2.46,|x̄B-x̄C|=5.4>2.46,均显著。结论:三种材料保质期差异显著,材料A最佳,C最差。23.(10分)某城市出租车公司想预测日均订单量y(千单),收集连续12个月数据,得回归方程:ŷ=2.5+0.8x₁-0.6x₂,其中x₁为“雨天比例(%)”,x₂为“油价(元/升)”。已知:SST=48,SSR=36,n=12,se(β̂₁)=0.15,se(β̂₂)=0.2。(1)计算R²并解释;(2)检验β₁是否显著(α=0.05);(3)若x₁=30%,x₂=7.2元,求y的点预测及95%近似置信区间。解:(1)R²=SSR/SST=36/48=0.75,表示雨天比例与油价可解释75%的订单量波动。(2)t₁=β̂₁/se=0.8/0.15=5.33,t₀.₀₂₅(9)=2.26,|5.33|>2.26,拒绝H₀,β₁显著。(3)ŷ=2.5+0.8×30-0.6×7.2=2.5+24-4.32=22.18千单MSE=(SST-SSR)/(n-3)=12/9=1.33,s=√1.33=1.154近似区间=ŷ±t₀.₀₂₅(9)×s=22.18±2.26×1.154≈(19.6,24.8)。24.(13分)某连锁咖啡店推出新品,随机选择200家门店,其中100家设置“限时折扣”为实验组,另100家为对照组。一周后记录每家门店新品销量(杯):实验组:x̄₁=520,s₁=80对照组:x̄₂=480,s₂=75(1)检验折扣是否有效(α=0.05);(2)计算效应量Cohen’sd;(3)若总体为5000家门店,求实验组总销量提升的95%置信区间;(4)讨论结果商业意义。解:(1)H₀:μ₁≤μ₂,H₁:μ₁>μ₂(单侧)合并标准误sp²=[(99×80²+99×75²)/198]=6018.75,sp=77.58t=(520-480)/(77.58×√(1/100+1/100))=40/10.97=3.65t₀.₀₅(198)=1.65,3.65>1.65,拒绝H₀,折扣显著有效。(2)d=(x̄₁-x̄₂)/sp=40/77.58≈0.52,中等效应。(3)提升均值=40杯/店,总量提升=40×5000=200000杯标准误=10.97×50=548.5,区间=200000±1.96×548.5×50→(146000,254000)杯(4)折扣带来约14.6~25.4万杯增量,按毛利5元/杯,可增73~127万元利润,扣除折扣成本后仍可观,建议推广但需监控长期品牌溢价。五、软件输出解读题(共20分)25.下表为R输出Logistic回归部分结果,因变量为“是否复购”,自变量为“满意度评分(1~5)”与“配送时长(分钟)”:|系数  |估计值|标准误|z值 |Pr(>|z|)||----------|--------|--------|------|----------||截距  |-6.200|1.100 |-5.64|<0.001||满意度 |1.200 |0.250 |4.80 |<0.001||配送时长|-0.030|0.008 |-3.75|<0.001|(1)写出回归方程;(2)解释满意度系数;(3)计算满意度从3提升到5时,优势比变化百分比;(4)若配送时长缩短20分钟,求优势比变化;(5)预测满意度4分、配送30分钟顾客的复购概率。解:(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论