2025年统计学期末考试试题及答案_第1页
2025年统计学期末考试试题及答案_第2页
2025年统计学期末考试试题及答案_第3页
2025年统计学期末考试试题及答案_第4页
2025年统计学期末考试试题及答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年统计学期末考试试题及答案一、单项选择题(每题2分,共20分)1.下列统计量中,不依赖于总体分布未知参数的是()。A.样本均值的期望B.总体方差的极大似然估计C.样本中位数D.总体均值的置信区间上限2.某高校2024级学生身高数据服从正态分布N(μ,σ²),从中随机抽取36名学生,测得平均身高为172cm,样本标准差为5cm。若要估计总体均值μ的95%置信区间,应使用()。A.Z分布(σ已知)B.t分布(σ未知)C.卡方分布D.F分布3.若两个变量X与Y的相关系数r=0.85,且X的方差为16,Y的方差为25,则Y关于X的一元线性回归方程的斜率为()。A.0.85×(4/5)B.0.85×(5/4)C.0.85×(16/25)D.0.85×(25/16)4.进行单因素方差分析时,若组间平方和(SSB)为600,组内平方和(SSW)为1200,总样本量为30(分为3组,每组10个样本),则F统计量为()。A.5B.10C.15D.205.某产品合格率的历史数据为p=0.9,现抽取100件产品检验,发现92件合格。若检验当前合格率是否高于历史水平(α=0.05),应采用()。A.双侧Z检验B.单侧Z检验C.双侧t检验D.单侧卡方检验6.若随机变量X~N(5,4),Y=2X+3,则Y的分布为()。A.N(13,8)B.N(13,16)C.N(10,16)D.N(10,8)7.以下关于p值的描述中,错误的是()。A.p值是原假设成立时,出现当前样本或更极端情况的概率B.p值越小,拒绝原假设的证据越强C.p值大于显著性水平α时,应拒绝原假设D.p值的计算依赖于检验统计量的分布8.某班级数学成绩的偏度系数为-0.3,峰度系数为2.8,说明该数据分布()。A.左偏,比正态分布更陡峭B.左偏,比正态分布更平缓C.右偏,比正态分布更陡峭D.右偏,比正态分布更平缓9.若总体服从均匀分布U(a,b),则样本均值的渐近分布为()。A.均匀分布B.正态分布C.指数分布D.t分布10.进行卡方独立性检验时,若列联表为3×4,则卡方统计量的自由度为()。A.6B.12C.5D.11二、填空题(每题3分,共15分)1.一组数据:12,15,18,20,22,其样本方差为______(保留2位小数)。2.设X₁,X₂,…,Xₙ为来自N(μ,σ²)的样本,样本均值为X̄,则X̄的分布为______。3.若总体比例p的95%置信区间为(0.62,0.78),则样本比例p̂=______,边际误差E=______。4.单样本t检验中,原假设H₀:μ=μ₀,备择假设H₁:μ≠μ₀,样本量n=25,计算得t=2.35,α=0.05,则临界值为______(保留3位小数),结论为______(拒绝/不拒绝H₀)。5.简单线性回归模型Y=β₀+β₁X+ε中,ε需满足的基本假设是______(至少写出2条)。三、简答题(每题6分,共30分)1.简述中心极限定理的核心内容,并说明其在统计推断中的作用。2.假设检验中,“拒绝原假设”和“不拒绝原假设”的结论有何本质区别?3.比较点估计与区间估计的优缺点,并举例说明区间估计的实际意义。4.方差分析的基本思想是什么?单因素方差分析中,总平方和(SST)如何分解?5.简述简单线性回归中判定系数R²的定义及其经济意义(或实际意义)。四、计算题(每题10分,共40分)1.某公司10名员工的月销售额(单位:万元)如下:18,22,25,28,30,32,35,38,40,45。(1)计算样本均值、中位数、标准差(保留2位小数);(2)判断数据是否存在异常值(使用1.5倍四分位距法)。2.某品牌手机电池续航时间服从正态分布N(μ,σ²),σ=2小时。随机抽取36块电池,测得平均续航时间为12小时。(1)计算μ的99%置信区间;(2)若要求边际误差不超过0.5小时,至少需要抽取多少块电池(α=0.01)?3.某高校为检验两种教学方法的效果,分别对A班(30人)和B班(35人)采用方法1和方法2教学,期末数学成绩如下:A班平均82分,标准差8分;B班平均78分,标准差7分。假设两总体方差相等,检验两种教学方法的效果是否有显著差异(α=0.05)。4.某企业记录了12个月的广告投入(X,万元)与销售额(Y,万元)数据,计算得:∑X=180,∑Y=1200,∑XY=19000,∑X²=3000,∑Y²=125000,n=12。(1)求Y关于X的一元线性回归方程;(2)计算判定系数R²,并解释其含义;(3)当广告投入为20万元时,预测销售额(保留2位小数)。五、应用题(每题15分,共30分)1.某城市2023年居民人均月收入为6500元,2024年随机调查了200户居民,得到人均月收入为6800元,标准差为1200元。(1)检验2024年居民人均月收入是否显著高于2023年(α=0.05);(2)若实际人均月收入为6700元,计算该检验的功效(β错误的概率),并说明其实际意义(Z₀.₀₅=1.645,Z₀.₁₀=1.282,Z₀.₂₀=0.842)。2.某医院为研究三种新药对高血压的疗效,将60名患者随机分为三组,每组20人,分别服用药物A、B、C,治疗后血压降低值(mmHg)的组间平方和为1800,组内平方和为2400。(1)完成方差分析表(列出自由度、均方、F统计量);(2)检验三种药物的疗效是否有显著差异(α=0.05,F₀.₀₅(2,57)=3.16);(3)若需进一步比较两两药物的疗效差异,应采用何种方法?简要说明步骤。答案一、单项选择题1.C2.B3.A4.A5.B6.B7.C8.B9.B10.A二、填空题1.43.36(计算过程:均值=(12+15+18+20+22)/5=17.4;方差=[(12-17.4)²+…+(22-17.4)²]/(5-1)=(29.16+5.76+0.36+6.76+21.16)/4=63.2/4=15.8?此处可能计算错误,正确应为:数据为12,15,18,20,22,均值=17.4,各偏差平方为(12-17.4)²=29.16,(15-17.4)²=5.76,(18-17.4)²=0.36,(20-17.4)²=6.76,(22-17.4)²=21.16,总和=29.16+5.76=34.92+0.36=35.28+6.76=42.04+21.16=63.2,样本方差=63.2/(5-1)=15.8,保留两位小数为15.80。原答案可能笔误,正确应为15.80)2.N(μ,σ²/n)3.0.70,0.08((0.62+0.78)/2=0.70;0.70-0.62=0.08)4.±2.064(t₀.₀₂₅(24)=2.064),拒绝(t=2.35>2.064)5.E(ε)=0,Var(ε)=σ²(或ε独立同分布,ε~N(0,σ²))三、简答题1.核心内容:当样本量n充分大时,无论总体服从何种分布,样本均值的抽样分布近似服从正态分布N(μ,σ²/n)。作用:为大样本统计推断(如置信区间、假设检验)提供理论依据,使非正态总体的均值推断可行。2.区别:“拒绝原假设”是在显著性水平α下,有足够证据支持备择假设;“不拒绝原假设”仅说明现有样本未提供足够证据拒绝原假设,不代表原假设一定成立(可能因样本量不足或检验功效低)。3.点估计:用单一数值估计参数,简单直观但无精度信息(如用样本均值估计总体均值);区间估计:用区间表示参数的可能范围,包含估计的精度(如95%置信区间)。实际意义:例如估计某城市居民平均收入时,区间估计能说明“有95%把握认为平均收入在[6000,7000]元之间”,比点估计更全面。4.基本思想:通过比较组间变异与组内变异,判断各总体均值是否存在显著差异。总平方和分解为组间平方和(SSB,反映不同组均值差异)和组内平方和(SSW,反映组内随机误差),即SST=SSB+SSW。5.R²=回归平方和/总平方和,取值[0,1]。意义:表示因变量Y的变异中可由自变量X解释的比例。例如R²=0.85,说明Y的变异有85%可由X的变化解释,模型拟合效果较好。四、计算题1.(1)均值=(18+22+…+45)/10=313/10=31.30万元;中位数=(30+32)/2=31.00万元;标准差=√[∑(xᵢ-31.3)²/(10-1)]=√[(18-31.3)²+…+(45-31.3)²]/9≈√(176.89+86.49+39.69+10.89+3.61+0.49+13.69+44.89+75.69+187.69)/9≈√(640.01)/3≈25.30/3≈8.43万元(保留2位小数为8.43)。(2)Q₁=第2.5个数=(22+25)/2=23.5,Q₃=第7.5个数=(35+38)/2=36.5,IQR=36.5-23.5=13,下限=23.5-1.5×13=4,上限=36.5+1.5×13=56,所有数据在[4,56]内,无异常值。2.(1)置信区间=12±Z₀.₀₀₅×(2/√36)=12±2.576×(2/6)=12±0.859,即(11.14,12.86)小时。(2)n=(Zₐ/₂×σ/E)²=(2.576×2/0.5)²≈(10.304)²≈106.18,取n=107。3.假设H₀:μ₁=μ₂,H₁:μ₁≠μ₂。合并方差Sₚ²=[(30-1)×8²+(35-1)×7²]/(30+35-2)=[29×64+34×49]/63=(1856+1666)/63=3522/63≈55.90,检验统计量t=(82-78)/√(55.90×(1/30+1/35))=4/√(55.90×0.0619)≈4/√3.46≈4/1.86≈2.15。自由度df=30+35-2=63,t₀.₀₂₅(63)=2.00(近似),因2.15>2.00,拒绝H₀,认为效果有显著差异。4.(1)b₁=(n∑XY-∑X∑Y)/(n∑X²-(∑X)²)=(12×19000-180×1200)/(12×3000-180²)=(228000-216000)/(36000-32400)=12000/3600≈3.333;b₀=Ȳ-b₁X̄=1200/12-3.333×(180/12)=100-3.333×15=100-50=50,回归方程:Ŷ=50+3.33X。(2)SST=∑Y²-(∑Y)²/n=125000-(1200)²/12=125000-120000=5000;SSR=b₁²×[n∑X²-(∑X)²]/n=(3.333)²×3600/12≈11.11×300≈3333;R²=SSR/SST=3333/5000≈0.6666,即约66.67%的销售额变异可由广告投入解释。(3)X=20时,Ŷ=50+3.33×20=50+66.6=116.60万元。五、应用题1.(1)H₀:μ≤6500,H₁:μ>6500;检验统计量Z=(6800-6500)/(1200/√200)=300/(84.85)≈3.54;Z=3.54>Z₀.₀₅=1.645,拒绝H₀,认为2024年人均收入显著高于2023年。(2)功效=P(拒绝H₀|μ=6700)=P(Z>(6500+1.645×84.85-6700)/84.85)=P(Z>(6500+140-6700)/84.85)=P(Z>(-60)/84.85)=P(Z>-0.707)=1-Φ(-0.707)=Φ(0.707)≈0.76,即当实际μ=6700时,有76%的概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论