2026年《统计学》期末考试题及答案_第1页
2026年《统计学》期末考试题及答案_第2页
2026年《统计学》期末考试题及答案_第3页
2026年《统计学》期末考试题及答案_第4页
2026年《统计学》期末考试题及答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年《统计学》期末考试题及答案一、单项选择题(每题2分,共20分)1.某社交媒体平台2026年第一季度用户年龄数据中,“25-30岁”组的频数为1200,频率为0.3,若“31-35岁”组的频率为0.25,则该平台该季度总用户数及“31-35岁”组频数分别为()。A.4000,1000B.3000,750C.5000,1250D.2000,5002.设随机变量X~N(μ,σ²),样本容量为n的简单随机样本均值为X̄,则X̄的分布为()。A.N(μ,σ²/n)B.N(μ,σ²)C.t(n-1)D.χ²(n-1)3.为检验某新型电池平均续航时间是否超过12小时,抽取25节电池测试,样本均值为12.8小时,标准差为1.5小时(总体标准差未知)。若显著性水平α=0.05,应采用的检验统计量及临界值分别为()。A.Z=(12.8-12)/(1.5/√25),Z0.05=1.645B.t=(12.8-12)/(1.5/√25),t0.05(24)=1.711C.Z=(12.8-12)/(1.5/√25),Z0.025=1.96D.t=(12.8-12)/(1.5/√25),t0.025(24)=2.0644.某地区2020-2025年GDP数据的环比增长速度分别为5%、6%、4%、7%、8%,则2025年较2020年的定基增长速度为()。A.5%×6%×4%×7%×8%-1B.(1.05×1.06×1.04×1.07×1.08)-1C.(5%+6%+4%+7%+8%)D.(1.05+1.06+1.04+1.07+1.08)/5-15.若回归模型Y=β0+β1X+ε中,X的回归系数β1的t检验p值为0.03(α=0.05),则结论为()。A.拒绝H0:β1=0,X对Y有显著影响B.不拒绝H0:β1=0,X对Y无显著影响C.拒绝H0:β1≠0,X对Y无显著影响D.无法判断6.方差分析中,组间平方和(SSB)反映的是()。A.各样本均值与总均值的差异B.各样本内部数据与样本均值的差异C.所有数据与总均值的差异D.随机误差的大小7.某分类变量有3个类别,采用卡方检验分析其与另一二分类变量的独立性时,卡方统计量的自由度为()。A.3B.2C.6D.(3-1)(2-1)=28.若时间序列的长期趋势为线性增长,季节指数显示第一季度为0.8,第二季度为1.2,第三季度为1.1,第四季度为0.9,则剔除季节因素后的第一季度数据应()。A.原数据×0.8B.原数据/0.8C.原数据×(1-0.8)D.原数据/(1-0.8)9.对100名消费者进行满意度调查(1-5分),计算得均值为3.8,中位数为4,众数为5,则数据分布形态为()。A.左偏(负偏)B.右偏(正偏)C.对称D.无法判断10.分层抽样与整群抽样的主要区别在于()。A.分层抽样抽取的是层内个体,整群抽样抽取的是群B.分层抽样要求层内差异小,整群抽样要求群内差异大C.分层抽样用于无限总体,整群抽样用于有限总体D.分层抽样是概率抽样,整群抽样是非概率抽样二、简答题(每题10分,共40分)1.简述中心极限定理的核心内容及其在统计推断中的作用。2.解释“显著性水平α”与“p值”的区别,并说明如何根据p值进行假设检验决策。3.简述一元线性回归模型中判定系数R²的含义及其与相关系数r的关系。4.比较简单随机抽样、分层抽样和系统抽样的优缺点,并说明各自适用的场景。三、计算题(每题15分,共30分)1.某食品厂生产的饼干重量服从正态分布,现从生产线中随机抽取20袋饼干,测得重量(单位:克)如下:102.5,101.8,103.2,100.9,102.1,101.5,103.8,102.7,101.2,102.4,100.7,102.9,101.6,103.1,102.0,101.3,102.6,103.4,101.9,102.8(1)计算样本均值、样本标准差(保留2位小数);(2)以95%的置信水平估计该生产线饼干平均重量的置信区间(t0.025(19)=2.093)。2.某企业为研究广告投入(X,万元)对月销售额(Y,万元)的影响,收集了2023-2025年共36个月的数据,建立一元线性回归模型,得到以下结果:回归方程:Ŷ=25+4.2X样本方差SST=1200,残差平方和SSE=240广告投入的样本均值X̄=15,样本标准差sX=5(1)计算判定系数R²,并解释其经济意义;(2)计算回归系数β1的标准误(Sb1)(提示:Sb1=√(MSE)/sX×√(n-1));(3)检验回归系数β1的显著性(α=0.05,t0.025(34)=2.032)。四、综合分析题(20分)某电商平台为分析不同促销策略对用户下单转化率的影响,选取了A、B、C三种促销策略,分别在3个独立的用户群体中测试,每个群体各1000名用户,观测1周内的下单情况,数据如下表:促销策略下单用户数未下单用户数A220780B250750C180820(1)计算三种策略的下单转化率(保留2位小数);(2)检验三种促销策略的下单转化率是否存在显著差异(α=0.05,χ²0.05(2)=5.991);(3)若需进一步比较A与B策略的转化率差异,应采用何种方法?简要说明步骤;(4)结合业务背景,为该平台提出促销策略优化建议。答案一、单项选择题1.A(总用户数=1200/0.3=4000,“31-35岁”频数=4000×0.25=1000)2.A(正态总体均值的抽样分布为N(μ,σ²/n))3.B(总体标准差未知,小样本用t检验,单侧检验临界值t0.05(24)=1.711)4.B(定基增长速度=总发展速度-1=各环比发展速度连乘积-1)5.A(p=0.03<0.05,拒绝原假设,认为β1显著不为0)6.A(组间平方和反映不同组均值与总均值的差异)7.D(自由度=(r-1)(c-1)=(3-1)(2-1)=2)8.B(季节指数<1表示该季度数据低于趋势值,剔除季节因素需除以季节指数)9.A(均值<中位数<众数,左偏分布)10.B(分层抽样要求层内同质性高,整群抽样要求群内异质性高)二、简答题1.中心极限定理核心内容:无论总体分布如何,当样本容量n足够大时,样本均值X̄的抽样分布近似服从正态分布N(μ,σ²/n)。作用:为大样本下用正态分布近似处理非正态总体的统计推断(如参数估计、假设检验)提供了理论依据,是统计学中连接描述统计与推断统计的关键定理。2.显著性水平α是预先设定的拒绝原假设的最大风险概率(即犯第一类错误的概率);p值是在原假设成立时,观测到样本统计量极端值或更极端值的概率。决策规则:若p值≤α,拒绝原假设;若p值>α,不拒绝原假设。α是人为设定的阈值,p值是基于样本数据计算的实际风险。3.判定系数R²=SSR/SST=1-SSE/SST,表示回归模型中自变量对因变量变异的解释比例(0≤R²≤1)。R²与相关系数r的关系:在一元线性回归中,R²=r²(符号与回归系数一致),但R²是平方关系,消除了相关系数的符号,仅反映线性相关的强弱。4.简单随机抽样:优点是完全随机,无偏性好;缺点是对大总体操作复杂,可能抽到分散样本。适用于总体同质性高、无明显结构的情况。分层抽样:优点是提高估计精度(层内同质性高),可对各层单独分析;缺点是需先掌握分层信息。适用于总体存在明显类别差异(如按地区、年龄分层)的情况。系统抽样:优点是操作简便,样本分布均匀;缺点是若总体存在周期性波动可能引入偏差。适用于总体排列无明显周期规律的情况。三、计算题1.(1)样本均值X̄=(102.5+101.8+…+102.8)/20=102.23克(计算过程:求和得2044.6,均值=2044.6/20=102.23);样本标准差s=√[Σ(Xi-X̄)²/(n-1)]=√[((102.5-102.23)²+…+(102.8-102.23)²)/19]≈0.89克(计算得Σ(Xi-X̄)²≈14.65,s=√(14.65/19)≈0.89)。(2)置信区间=X̄±tα/2(n-1)×(s/√n)=102.23±2.093×(0.89/√20)=102.23±0.41,即(101.82,102.64)克。2.(1)R²=1-SSE/SST=1-240/1200=0.8,说明广告投入可解释80%的月销售额变异,模型拟合效果较好。(2)MSE=SSE/(n-2)=240/34≈7.06;Sb1=√(MSE)/sX×√(n-1)=√7.06/(5×√35)≈2.66/29.58≈0.09(注:公式修正为Sb1=√(MSE)/[sX×√(n-1)]可能有误,正确公式应为Sb1=√(MSE)/[sX×√(n-1)],但更准确的公式是Sb1=√(MSE)/[sX×√(n-1)],实际正确公式为Sb1=√(MSE)/[sX×√(n-1)],但标准误正确计算应为Sb1=√(MSE)/[sX×√(n-1)],经修正后正确计算应为:sX=5,n=36,MSE=240/34≈7.06,Sb1=√(7.06)/(5×√(36-1))=√7.06/(5×5.916)≈2.66/29.58≈0.09)。(3)t=β1/Sb1=4.2/0.09≈46.67>t0.025(34)=2.032,p值≈0<0.05,拒绝H0,认为广告投入对月销售额有显著影响。四、综合分析题(1)转化率:A=220/1000=22.00%,B=250/1000=25.00%,C=180/1000=18.00%。(2)卡方检验:期望频数Eij=(行合计×列合计)/总样本数,总样本数=3000,下单合计=650,未下单合计=2350。E_A下单=1000×650/3000≈216.67,E_A未下单=1000×2350/3000≈783.33;同理E_B下单=216.67,E_B未下单=783.33;E_C下单=216.67,E_C未下单=783.33。卡方统计量=Σ[(O-E)²/E]=((220-216.67)²/216.67+(780-783.33)²/783.33+(250-216.67)²/216.67+(750-783.33)²/783.33+(180-216.67)²/216.67+(820-783.33)²/783.33)≈(0.05+0.01+5.11+1.42+6.14+1.70)=14.43>5.991,拒绝原假设,认为三种策略转化率存在显著

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论