版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学试题及答案1.单选题(每题4分,共40分)1.1某电商平台想评估“618”大促期间页面加载时间对成交转化率的影响,随机抽取了200个访问会话,记录加载时间x(秒)与是否成交y(0/1)。若建立Logistic回归logit(p)=β₀+β₁x,下列说法正确的是A.β₁的单位是“秒⁻¹”B.当β₁>0时,加载时间越短成交概率越低C.若x增加1秒,成交优势比将乘以e^{β₁}D.若模型拟合优度检验p值=0.03,说明模型整体显著答案:C解析:Logistic回归系数β₁的含义是“x每增加1单位,对数优势比增加β₁”,因此优势比乘以e^{β₁}。A错,β₁无单位;B错,β₁>0表示加载时间越长成交概率越高;D错,拟合优度检验p值小说明模型可能存在欠拟合,而非整体显著。1.2对同一批受试者先后使用A、B两种血压计测量收缩压,欲检验两种仪器是否存在系统误差,最合适的检验方法是A.两独立样本t检验B.配对样本t检验C.卡方检验D.Wilcoxon符号秩检验答案:B解析:同一批受试者属于配对设计,检验系统误差即检验差值总体均值是否为零,用配对t检验;若差值非正态,可用Wilcoxon符号秩检验,但题目未提示非正态,优先选B。1.3某工厂每天生产零件长度服从N(μ,σ²)。现连续抽取5天,每天抽4件,共20件,欲建立x̄-R控制图,下列计算正确的是A.x̄图中心线CL=Σx̄/5B.R图中心线CL=ΣR/20C.x̄图上下控制限=CL±A₂R̄,其中A₂查表与样本容量n=20有关D.若某天x̄超出控制限,即可判定μ一定发生变化答案:A解析:x̄图中心线为各subgroup均值的平均,即Σx̄/5;B错,R图中心线为ΣR/5;C错,A₂与subgroup大小(此处为4)有关;D错,点出界仅提示可能异常,需结合规则判断。1.4在多重线性回归中,若某自变量VIF=8.5,则A.该变量与因变量无线性关系B.该变量与其他自变量存在中度多重共线性C.该变量必须被剔除D.该变量系数估计标准误将缩小答案:B解析:VIF=8.5>10常作为强共线性经验阈值,8.5属中度;A错,VIF不衡量与y关系;C错,是否剔除需结合业务与模型稳定性;D错,VIF高则标准误膨胀。1.5对某城市空气质量指数AQI做时间序列分解,得到季节因子S_t。若采用乘法模型Y_t=T_t×S_t×I_t,当S_t<1时,说明该季A.长期趋势向下B.该季AQI低于年平均C.随机波动剧烈D.序列非平稳答案:B解析:乘法模型中S_t<1表示该季实际值低于趋势成分,即低于年平均;A、C、D均与季节因子定义无关。1.6在聚类分析中,使用Ward法合并两类A、B,合并后类内平方和增加量ΔESS=ESS_{AB}-(ESS_A+ESS_B),则Ward准则倾向于合并A.使ΔESS最大B.使ΔESS最小C.使轮廓系数最小D.使类间距离最大答案:B解析:Ward法追求合并后类内平方和增加最小,即ΔESS最小,从而保持类内同质性。1.7某研究采用Bootstrap估计均值μ的置信区间,原始样本n=50,重抽样B=2000次,得到Bootstrap均值分布。若该分布右偏,则A.原始样本一定右偏B.应采用Bootstrapt区间以校正偏态C.原始样本均值一定大于中位数D.Bootstrap无法处理偏态答案:B解析:Bootstrap分布右偏提示抽样分布非正态,可用Bootstrapt区间或BCa区间校正;A错,Bootstrap分布偏态不一定反映原始样本偏态;C错,无法直接推出;D错,Bootstrap正是为复杂分布设计。1.8在贝叶斯估计中,若先验θ~N(0,1),似然x̄|θ~N(θ,0.5²),n=16,则后验均值E(θ|x̄)为A.x̄/2B.16x̄/17C.x̄D.0答案:B解析:正态共轭,后验均值=(1/σ₀²·μ₀+n/σ²·x̄)/(1/σ₀²+n/σ²)=(0+16/0.25·x̄)/(1+16/0.25)=16x̄/17。1.9对二项分布X~Bin(n=100,p)进行假设检验H₀:p=0.3vsH₁:p>0.3,若观测x=39,则精确p值为A.P(X≥39|p=0.3)B.P(X≤39|p=0.3)C.P(X=39|p=0.3)D.P(X≥39|p=0.7)答案:A解析:右侧检验,精确p值为在H₀下取得≥39的概率。1.10在实验设计中,若采用2³全因子设计,中心点重复3次,共运行11次实验,则中心点的作用是A.估计三阶交互B.提供纯误差估计并检验弯曲C.减少区组效应D.提高主效应分辨率答案:B解析:中心点用于估计纯误差并检验模型是否存在二次弯曲,若弯曲显著则需增加轴点进入响应面设计。2.多选题(每题5分,共30分,每题至少有两个正确答案,多选少选均不得分)2.1关于主成分分析PCA,下列说法正确的是A.第一主成分方向是数据方差最大方向B.主成分得分间样本协方差为零C.若原始变量单位不同,应先标准化D.保留主成分数可依据Kaiser准则(特征值>1)E.PCA可降低模型过拟合风险答案:ABCDE解析:PCA通过正交变换使得分不相关;标准化避免量纲影响;Kaiser准则常用;降维可减少变量数,降低过拟合。2.2下列哪些方法可直接处理缺失数据机制为MNAR(非随机缺失)A.多重插补B.selectionmodelC.patternmixturemodelD.完整案例分析E.逆概率加权答案:BC解析:MNAR需建模缺失机制,selectionmodel与patternmixturemodel显式建模;多重插补与IPW默认MAR;完整案例导致偏倚。2.3在控制图应用中,关于平均运行长度ARL,正确的有A.ARL₀表示过程受控时平均点到信号长度B.ARL₁表示过程失控时平均点到信号长度C.若ARL₀=370,则虚发警报概率≈0.0027D.增加控制图系数k可减小ARL₁E.EWMA控制图对中小漂移的ARL₁小于Shewhart图答案:ABCE解析:ARL₀=1/α,α=0.0027对应ARL₀≈370;增加k会扩大控制限,ARL₁增大;EWMA对中小漂移更敏感,ARL₁更小。2.4下列哪些技术可用于变量选择以避免过拟合A.LASSOB.RidgeC.ElasticNetD.逐步回归E.贝叶斯模型平均答案:ACDE解析:Ridge只收缩不置零,不能变量选择;其余均可实现变量选择或模型平均。2.5关于Kruskal-Wallis检验,正确的有A.是Mann-WhitneyU检验的多组推广B.要求各组方差齐性C.原假设为各组中位数相等D.若p<0.05,可进一步进行Dunn多重比较E.适用于有序分类数据答案:ACD解析:K-W不假设方差齐性;原假设为分布相同,实用中常解释为位置参数/中位数;Dunn用于事后比较;有序分类可用,但需数值编码。2.6在Meta分析中,导致异质性的可能原因有A.研究设计差异B.人群基线不同C.测量工具差异D.发表偏倚E.随机抽样误差答案:ABC解析:随机误差属内研究变异,异质性指间研究变异;发表偏倚影响合并效应而非直接产生异质性。3.计算与综合题(共80分)3.1(15分)某医药公司研发新型降压药,采用交叉设计,20名高血压患者随机分两组,先后服用试验药T与对照药C,间隔2周清洗期。记录服药后4小时收缩压下降值(mmHg):患者1234567891011121314151617181920顺序TCCTTCCTCTTCCTTCTCCTTCCTTCCTCTTCCTTCCTTCT下降1822152520192117231624142618192022152117C下降121810201614151319111792114151618101712(1)给出适当的统计模型,并说明假设。(2)计算两种药物平均下降差异的点估计与95%置信区间。(3)在α=0.05下给出检验结论。答案与解析:(1)交叉设计常用模型:Y_{ijk}=μ+τ_i+π_j+γ_{k}+ε_{ijk},其中τ为药物效应,π为周期效应,γ为个体效应随机。假设:差值d=T-C服从正态,个体间独立,周期效应可忽略或通过模型校正。(2)计算每位患者d_i:d:6,4,5,5,4,5,6,4,4,5,7,5,5,4,4,4,4,5,4,5d̄=4.8,s_d=0.83,n=2095%CI=d̄±t_{0.025,19}·s_d/√n=4.8±2.093×0.83/√20=4.8±0.39→(4.41,5.19)(3)H₀:μ_d=0,t=d̄/(s_d/√n)=4.8/(0.83/4.472)=25.9,p<0.001,拒绝H₀,试验药降压效果显著优于对照。3.2(15分)某市交通部门欲建立多元线性回归预测高峰时段公交车运行时间(分钟)。采集100条线路数据,变量:y=运行时间,x1=里程(km),x2=停靠站数,x3=专用道比例(%),x4=天气指数(1~5)。全模型回归结果:系数β̂0=5.2,β̂1=2.1,β̂2=0.8,β̂3=−0.06,β̂4=1.5标准误SE1=0.15,SE2=0.20,SE3=0.04,SE4=0.50R²=0.81,调整R²=0.80,RSS=1200,TSS=6320。(1)写出回归方程,并解释β̂3含义。(2)检验x3系数是否显著(α=0.05)。(3)计算x4对y的偏决定系数,并解释。(4)若某线路里程15km,停靠20站,专用道比例40%,天气指数3,预测运行时间及95%预测区间(s²=RSS/(n-p)=1200/95≈12.63)。答案与解析:(1)ŷ=5.2+2.1x1+0.8x2−0.06x3+1.5x4;β̂3=−0.06表示在其余变量不变下,专用道比例每增加1%,运行时间平均减少0.06分钟。(2)t=β̂3/SE3=−0.06/0.04=−1.5,|t|<t_{0.025,95}≈1.985,p>0.05,不显著。(3)先拟合不含x4的简化模型,得RSS₄=1800,则偏决定系数R²_{y4|123}=(RSS₄−RSS)/RSS₄=(1800−1200)/1800=0.333,即控制x1,x2,x3后,x3可解释33.3%的剩余变异。(4)ŷ=5.2+2.1×15+0.8×20−0.06×40+1.5×3=5.2+31.5+16−2.4+4.5=54.8min预测方差=s²(1+x₀'(X'X)^{-1}x₀),设x₀'(X'X)^{-1}x₀≈0.06(题设给定),则SE_pred=√12.63×1.06≈3.66,t_{0.025,95}≈1.98595%PI=54.8±1.985×3.66→(47.5,62.1)min。3.3(20分)某质量工程师记录连续30天的产品缺陷数:3,2,5,4,6,2,1,0,3,4,5,7,3,2,4,6,5,3,2,4,5,6,8,4,3,2,5,7,6,4假设数据服从Poisson分布,建立c控制图。(1)计算中心线与上下控制限(3σ)。(2)判断过程是否受控。(3)若第31天缺陷数为9,是否应报警?(4)若实际过程均值从λ₀=4升至λ₁=6,计算ARL₁(使用正态近似)。答案与解析:(1)c̄=Σc/30=120/30=4UCL=c̄+3√c̄=4+6=10,LCL=c̄−3√c̄=4−6=−2→取0(缺陷数非负)(2)所有点∈[0,10],无异常模式,过程受控。(3)9<UCL,不报警;但已接近上限,需警惕。(4)ARL₁≈1/β,β为第二类错误概率。控制限[0,10],λ₁=6,正态近似N(6,6)β=P(0≤c≤10|λ=6)≈Φ((10.5−6)/√6)−Φ((−0.5−6)/√6)=Φ(1.84)−Φ(−2.65)=0.967−0.004=0.963ARL₁=1/(1−β)=1/0.037≈27天。3.4(15分)某高校欲评估线上教学效果,随机抽取8门课程,记录学生平均满意度y与教师数字素养得分x:x:6870727578808285y:7274757880828386(1)建立简单线性回归模型,给出方差分析表。(2)计算x与y的Pearson相关系数,并检验H₀:ρ=0(α=0.05)。(3)若某教师数字素养得分90,预测其课程满意度及95%置信区间。答案与解析:(1)计算得:x̄=76.25,ȳ=78.75,Sxx=354.5,Syy=338.5,Sxy=344.5β̂1=Sxy/Sxx=0.972,β̂0=ȳ−β̂1x̄=4.68回归方程:ŷ=4.68+0.972xSSReg=β̂1Sxy=334.8,RSS=Syy−SSReg=3.7,TSS=338.5ANOVA:F=(SSReg/1)/(RSS/6)=334.8/0.617=542.6,p<0.001,显著。(2)r=Sxy/√(SxxSyy)=344.5/√(354.5×338.5)=0.996t=r√(n−2)/√(1−r²)=0.996×√6/0.089=27.4,p<0.001,拒绝H₀。(3)x₀=90,ŷ=4.68+0.972×90=92.2SE_pred=√[MSE(1/n+(x₀−x̄)²/Sxx)]=√[0.617(1/8+13.75²/354.5)]=1.23t_{0.025,6}=2.44795%CI=92.2±2.447
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 摩托车修理工班组评比强化考核试卷含答案
- 工程热处理工岗前理论实操考核试卷含答案
- 稀土萃取工岗前安全生产规范考核试卷含答案
- 手工等离子切割工诚信品质水平考核试卷含答案
- 梁式窑石灰煅烧工保密意识强化考核试卷含答案
- 闪速炉熔炼工诚信品质模拟考核试卷含答案
- 名品彩妆讲解培训课件
- 老年痴呆患者家属照护决策的长期支持方案
- 2026北京市育英学校科学城学校招聘备考题库及答案详解参考
- 2026安徽芜湖臻鑫智镁科技有限公司招聘2人备考题库带答案详解
- 2026年基因测序技术临床应用报告及未来五至十年生物科技报告
- 服装销售年底总结
- 文物安全保护责任书范本
- 广东省惠州市某中学2025-2026学年七年级历史上学期期中考试题(含答案)
- 2025公文写作考试真题及答案
- 停电施工方案优化(3篇)
- DB64∕T 1279-2025 盐碱地综合改良技术规程
- 2025年度耳鼻喉科工作总结及2026年工作计划
- 2024年执业药师《药学专业知识(一)》试题及答案
- 高压氧进修课件
- 2025年第三类医疗器械经营企业质量管理自查报告
评论
0/150
提交评论