版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学考试题及答案1.某市交通部门连续30天记录早高峰时段(7:00—9:00)通过跨江大桥的机动车流量(单位:千辆/日),数据如下:28.331.729.430.132.533.027.830.629.931.230.832.128.931.530.429.732.833.230.031.929.230.532.331.128.630.731.429.832.030.9(1)计算样本均值、中位数、众数、极差、方差、标准差、偏度与峰度;(2)以“26.5—27.5,27.5—28.5,…,33.5—34.5”为组距,绘制频数分布表与直方图,并在直方图上叠加正态密度曲线,据此评价流量分布的正态性;(3)若流量服从正态分布,求日均流量超过32.5千辆的概率,并给出95%置信区间估计;(4)检验“日均流量总体中位数为30.5千辆”的假设,显著性水平α=0.05,给出详细步骤与结论;(5)利用箱线图识别异常值,并解释其业务含义;(6)构建一个泊松近似模型,说明为何在拥堵时段车辆到达可视为泊松过程,并计算1分钟内到达车辆数大于10辆的概率(假设平均到达率为8辆/分钟)。答案与解析:(1)样本均值x̄=∑x_i⁄30=918.3⁄30=30.61千辆中位数:将数据排序后第15、16位为30.7与30.8,中位数30.75千辆众数:出现次数最多的数值为30.0、30.9、31.2、32.0等,各出现1次,故无明确众数,记“无众数”极差R=33.2−27.8=5.4千辆方差s²=∑(x_i−x̄)²⁄(n−1)=30.472⁄29=1.050标准差s=1.025千辆偏度g₁=[n∑(x_i−x̄)³]⁄[(n−1)(n−2)s³]=−0.184,左偏但接近对称峰度g₂=[n(n+1)∑(x_i−x̄)⁴]⁄[(n−1)(n−2)(n−3)s⁴]−3(n−1)²⁄[(n−2)(n−3)]=−0.627,稍平峰(2)频数分布表组界组中值频数累积频数26.5–27.527.00027.5–28.528.02228.5–29.529.04629.5–30.530.071330.5–31.531.082131.5–32.532.052632.5–33.533.032933.5–34.534.0130直方图略。正态密度曲线与直方图基本重合,但右侧尾部略短,Shapiro–Wilk检验W=0.984,p=0.862>0.05,不拒绝正态性。(3)若X~N(30.61,1.025²),则P(X>32.5)=1−Φ((32.5−30.61)/1.025)=1−Φ(1.844)=0.032795%置信区间:x̄±t₀.₀₂₅,₂₉·s/√n=30.61±2.045·1.025/√30=30.61±0.38→(30.23,30.99)千辆(4)符号检验:H₀:M=30.5,H₁:M≠30.5大于30.5的数据有17个,小于11个,等于2个(剔除),有效样本n=28检验统计量S=min(17,11)=11P=2·P(Bin(28,0.5)≤11)=2·0.057=0.114>0.05,不拒绝H₀,无充分证据表明中位数偏离30.5(5)箱线图上下四分位Q₁=29.80,Q₃=32.05,IQR=2.25下限=Q₁−1.5IQR=26.43,上限=Q₃+1.5IQR=35.42所有数据均在[26.43,35.42]内,无异常值,说明流量稳定(6)泊松过程假设:车辆到达独立、平稳、稀有,满足泊松条件λ=8辆/分钟,P(N>10)=1−P(N≤10)=1−∑_{k=0}^{10}e^{−8}8^k/k!查表或计算得0.1842.某电商平台随机抽取800名付费用户,记录其过去12个月累计消费额Y(千元)与对应订单数X,拟合简单线性回归Y=β₀+β₁X+ε,得:β̂₁=0.872,S_{β̂₁}=0.036,SSE=4261.5,SST=18230.4,x̄=42.1,ȳ=38.5,n=800(1)写出回归方程,并解释β₁的经济含义;(2)计算判定系数R²与调整R²,评价模型拟合;(3)构造β₁的95%置信区间,并检验H₀:β₁=1vsH₁:β₁≠1;(4)预测当X=50时的平均消费额,并给出其95%置信带;(5)若发现残差呈现“漏斗”形扩散,简述如何修正模型;(6)引入二次项后,新模型Y=β₀+β₁X+β₂X²+ε,其R²增至0.812,而调整R²反而下降至0.809,请解释原因并给出建议。答案与解析:(1)回归方程:Ŷ=β̂₀+β̂₁X,β̂₀=ȳ−β̂₁x̄=38.5−0.872·42.1=1.779方程:Ŷ=1.779+0.872Xβ₁=0.872表示每增加1个订单,平均消费额增加872元(2)R²=1−SSE/SST=1−4261.5/18230.4=0.766调整R²=1−(1−R²)(n−1)/(n−2)=1−0.234·799/798=0.766,几乎相同,因n很大(3)95%CI:β̂₁±t₀.₀₂₅,798·S_{β̂₁}=0.872±1.96·0.036→(0.801,0.943)t=(0.872−1)/0.036=−3.56,|t|>1.96,拒绝H₀,β₁显著小于1,说明边际消费额随订单增加而递减(4)X=50,Ŷ=1.779+0.872·50=45.379千元置信带:Ŷ±t₀.₀₂₅,798·√MSE·√[1/n+(X−x̄)²/Sxx]MSE=SSE/(n−2)=4261.5/798=5.341,Sxx=∑(X−x̄)²=(SST−SSE)/β̂₁²=15968.9/0.872²=21000.4标准误=√5.341·√[1/800+(50−42.1)²/21000.4]=0.28895%带:45.379±1.96·0.288→(44.81,45.95)(5)残差方差随X增大而增大,存在异方差。可采用加权最小平方(WLS),或对Y做对数变换lnY,再拟合线性模型(6)增加二次项后R²上升,但调整R²下降,说明二次项带来的解释力不足以抵消参数惩罚。建议采用交叉验证或AIC/BIC选择模型,若二次项系数β₂不显著(p>0.05),则保留简单线性模型3.某制药公司研发新型降压药,采用双盲随机对照试验,将240名轻中度高血压患者均分至试验组(T)与对照组(C),治疗8周后收缩压下降量(mmHg)如下:T组:n₁=120,x̄₁=18.7,s₁²=49.0C组:n₂=120,x̄₂=12.4,s₂²=46.2(1)检验两组总体方差是否相等(α=0.10);(2)在(1)基础上,检验试验药是否显著优于对照(α=0.05,单侧);(3)计算效应量Cohen’sd,并解释其实际意义;(4)若欲在后续试验中检测到Δ=4mmHg的差异,功效1−β=0.90,α=0.05(双侧),需多少样本(每组相等)?(5)已知T组有8例出现轻度头晕,C组有3例,构建两组不良反应率差的95%置信区间;(6)若进一步按性别分层,得男性亚组T/C各60人,x̄₁=20.1,x̄₂=13.0;女性亚组T/C各60人,x̄₁=17.3,x̄₂=11.8,交互检验p=0.041,请阐述交互作用的统计与临床解释。答案与解析:(1)F=s₁²/s₂²=49.0/46.2=1.06,df₁=119,df₂=119双侧p=0.72>0.10,不拒绝方差齐性(2)合并方差s_p²=[(n₁−1)s₁²+(n₂−1)s₂²]/(n₁+n₂−2)=47.6t=(x̄₁−x̄₂)/√[s_p²(1/n₁+1/n₂)]=6.3/√(47.6·2/120)=6.3/0.891=7.07单侧p<0.0001,拒绝H₀,试验药显著更优(3)Cohen’sd=(x̄₁−x̄₂)/s_p=6.3/6.90=0.91,大效应,临床意义显著(4)n=2[(z_{α/2}+z_β)σ/Δ]²=2[(1.96+1.28)·6.90/4]²=2·8.46²=143.1→每组144例(5)率差p̂₁−p̂₂=8/120−3/120=0.041795%CI:0.0417±1.96√[p̂(1−p̂)(1/n₁+1/n₂)],p̂=11/240=0.0458→0.0417±0.052→(−0.010,0.094),包含0,差异不显著(6)交互p=0.041<0.05,表明药效受性别调节。男性差异7.1mmHg,女性5.5mmHg,临床需分别报告,可能提示女性对药物反应略低4.某高校统计系欲评估在线学习平台效果,随机抽取100名大二学生,记录其期中成绩X与期末成绩Y,二者均服从近似二元正态,r=0.78,x̄=72,ȳ=76,s_X=8.5,s_Y=9.2(1)建立Y对X的线性回归方程,并解释回归系数;(2)给定X=80,求Y的条件期望与条件标准差;(3)若某学生期中X=80,期末实际Y=65,计算其标准化残差,并评价该生表现;(4)检验总体相关系数ρ是否大于0.70(α=0.05,单侧);(5)若将成绩按X分为低(<65)、中(65–80)、高(>80)三组,拟合单因素方差分析,得组间SS=4320,组内SS=5680,完成方差分析表并检验组间差异;(6)说明(4)与(5)两种方法在假设、结论与应用场景上的差异。答案与解析:(1)β̂₁=r·s_Y/s_X=0.78·9.2/8.5=0.844β̂₀=ȳ−β̂₁x̄=76−0.844·72=15.23方程:Ŷ=15.23+0.844X,每增加1分期中,期末平均提高0.844分(2)X=80,E(Y|X)=15.23+0.844·80=82.75条件标准差σ_{Y|X}=s_Y√(1−r²)=9.2√(1−0.78²)=5.74(3)残差e=65−82.75=−17.75标准化残差z=e/σ_{Y|X}=−17.75/5.74=−3.09,|z|>3,异常低,需关注学习状态(4)Fisher变换z_r=0.5ln[(1+r)/(1−r)]=1.045H₀:ρ=0.70,z_ρ=0.5ln[(1+0.7)/(1−0.7)]=0.867检验U=(z_r−z_ρ)√(n−3)=1.78,单侧p=0.037<0.05,拒绝H₀,ρ显著>0.70(5)方差分析表来源SSdfMSF组间4320221602160/58.37=37.0组内56809758.37总计1000099F=37.0,p<0.001,组间差异显著(6)相关分析要求二元正态,度量线性强度;方差分析仅要求组内正态与方差齐,用于分类自变量。结论一致:成绩相关/分组均显著,但相关分析提供预测方程,方差分析提供组间比较,场景不同5.某市气象局研究PM2.5浓度(μg/m³)与气象因素关系,采集连续100天数据,建立多元线性模型:Y=β₀+β₁X₁+β₂X₂+β₃X₃+β₄X₄+ε其中X₁:风速(m/s),X₂:相对湿度(%),X₃:气温(℃),X₄:逆温层高度(10m)回归结果:系数估计标准误tpβ₀185.321.48.66<0.001β₁−12.41.8−6.89<0.001β₂0.310.122.580.011β₃−1.070.25−4.28<0.001β₄−0.860.33−2.610.010R²=0.713,调整R²=0.701,F=60.2,p<0.001(1)写出回归方程,并解释β₁与β₃的实际含义;(2)检验整体模型显著性,并说明判定系数含义;(3)计算X₁=2.5,X₂=65,X₃=18,X₄=12时的预测浓度,并求其95%预测区间;(4)若发现X₂与X₃的VIF分别为4.8与5.2,诊断共线性问题;(5)采用逐步回归后,仅保留X₁、X₃、X₄,其调整R²升至0.718,简述变量选择准则与结论;(6)若残差滞后1阶自相关系数r₁=0.28,DW=1.45,n=100,检验序列相关(α=0.05),并提出修正策略。答案与解析:(1)方程:Ŷ=185.3−12.4X₁+0.31X₂−1.07X₃−0.86X₄风速每增加1m/s,PM2.5平均下降12.4μg/m³;气温每升高1℃,PM2.5平均下降1.07μg/m³(2)F=60.2,p<0.001,模型整体显著;R²=0.713表示71.3%的PM2.5变异可由四因素解释(3)Ŷ=185.3−12.4·2.5+0.31·65−1.07·18−0.86·12=185.3−31+20.15−19.26−10.32=144.87μg/m³MSE=(1−R²)SST/(n−p−1)=未给出,需先算SST,假设s_Y=35,则SST=35²·99=121275MSE=SSE/(n−p−1)=34890/95=367.3,s=19.16预测标准误s_pred=√[MSE(1+h₀)],h₀=x₀ᵀ(XᵀX)⁻¹x₀,近似取0.05s_pred≈19.16·1.025=19.6595%预测区间:144.87±1.96·19.65→(106.3,183.4)(4)VIF<10,尚不构成严重共线性,但X₂、X₃接近5,需留意(5)剔除X₂后调整R²上升,说明X₂边际贡献不足,遵循简约原则,保留X₁、X₃、X₄(6)DW=1.45,查表d_L=1.63,d_U=1.72,1.45<d_L,存在正自相关可采用Cochrane–Orcutt迭代或引入滞后项修正6.某游戏公司研究玩家日活跃时长(分钟)与付费金额(元)关系,随机抽取500名玩家,发现付费额右偏严重,取对数后lnM近似正态。建立分位数回归,考察不同付费水平下活跃时长对数lnD的影响:(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 我国上市公司定向增发的法律问题剖析与完善路径
- 聚丁烯装置操作工岗前情绪管理考核试卷含答案
- 物料输送及烟气净化工操作管理能力考核试卷含答案
- 印染成品定等工班组评比竞赛考核试卷含答案
- 2026广西柳州市事业单位公开考试招聘工作人员1111人备考题库及完整答案详解一套
- 烟机设备操作工班组评比评优考核试卷含答案
- 印花电脑分色工安全文化测试考核试卷含答案
- 病虫害防治工岗前班组考核考核试卷含答案
- 摄影基础知识
- 安全口号响彻全场讲解
- pvc地胶施工方案
- 河南省三门峡市2024-2025学年高二上学期期末调研考试英语试卷(含答案无听力音频及听力原文)
- 睡眠科普课课件
- (正式版)DB15∕T 3227-2023 《集中供热单位产品能耗限额》
- 苏教版数学三年级上册备课计划
- 2025年中远海运集团招聘笔试备考题库(带答案详解)
- 大采高综采工作面操作规程
- 保密车间出入管理制度
- 智能网联汽车技术课件:车路协同控制
- 劳务派遣培训计划方案
- 空气能热泵中央热水系统调试
评论
0/150
提交评论