版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026统计数据分析题押题卷连续3年押中85%考题
一、单项选择题(每题2分,共20分)1.在简单随机抽样中,样本均值的标准误差与总体标准差σ的关系是A.与σ成正比,与样本量n成反比B.与σ成反比,与样本量n成正比C.与σ²成正比,与n²成反比D.与σ²成反比,与n成正比2.若X~N(μ,σ²),则P(μ-1.96σ≤X≤μ+1.96σ)的近似值为A.0.90B.0.95C.0.99D.0.503.对同一总体进行两次独立抽样,样本量分别为n₁、n₂,则两样本均值差的标准误差为A.σ√(1/n₁+1/n₂)B.σ√(1/n₁-1/n₂)C.σ²(1/n₁+1/n₂)D.σ(1/n₁+1/n₂)4.在单因素方差分析中,若组间均方MSB=120,组内均方MSE=30,则F统计量的值为A.0.25B.4C.90D.1505.当回归模型存在完全多重共线性时,OLS估计量的性质是A.无偏且有效B.无偏但方差无限大C.有偏但方差最小D.有偏且方差无限大6.对二项分布B(n,p)进行正态近似时,需满足A.np≥5且n(1-p)≥5B.np≥10且n(1-p)≥10C.n≥30D.p≈0.57.在时间序列的AR(1)模型中,若自回归系数φ=0.8,则序列的半衰期约为A.2期B.3期C.4期D.5期8.对同一假设检验,若显著性水平α从0.05降到0.01,则A.第一类错误概率减小,第二类错误概率增大B.第一类错误概率增大,第二类错误概率减小C.两类错误概率均减小D.两类错误概率均增大9.在贝叶斯估计中,若先验分布为Beta(2,2),样本似然为二项分布,则后验分布为A.Beta(2+x,2+n-x)B.Beta(x,n-x)C.Beta(2x,2n-2x)D.Beta(2+n,2+x)10.对一组右偏数据取对数后,其偏态A.不变B.加剧右偏C.趋于对称D.变为左偏二、填空题(每题2分,共20分)11.若样本方差s²=36,样本量n=9,则总体方差σ²的95%置信区间为____。12.在泊松分布中,若λ=4,则其偏度系数为____。13.对多元线性回归,若调整后的R²=0.85,样本量n=50,自变量k=5,则R²=____。14.若随机变量X服从t分布,自由度为10,则其方差为____。15.在指数平滑法中,若平滑系数α=0.2,则对新观测权重衰减到不足0.01所需的最小期数为____。16.对2×2列联表进行卡方检验,当期望频数均大于5时,卡方统计量近似服从自由度为____的分布。17.若两独立样本的秩和检验中,n₁=8,n₂=10,则Wilcoxon统计量W的取值范围是____。18.在Bootstrap估计中,若原始样本量为n,采用有放回抽样生成B个样本,则每个Bootstrap样本中未被抽到的观测期望比例为____。19.对正态总体均值进行双侧检验,若p值=0.03,则在α=0.05水平下的决策为____。20.若X~Uniform(0,1),则Y=-2lnX服从的分布为____。三、判断题(每题2分,共20分)21.对于任意随机变量,切比雪夫不等式给出的概率下界总是可达的。22.在简单线性回归中,若残差呈现喇叭形,则表明误差项存在异方差。23.当样本量趋于无穷大时,样本中位数是总体中位数的无偏估计。24.对正态总体,样本均值与样本方差相互独立。25.在聚类分析中,Ward方法以组内平方和增量最小为准则。26.若两变量间的Spearman秩相关系数为0,则它们必然独立。27.对时间序列进行一阶差分可消除确定性趋势,但对随机游走亦有效。28.在假设检验中,若置信区间不包含原假设值,则p值一定小于显著性水平。29.对二分类问题,若ROC曲线下面积AUC=0.5,则模型无判别能力。30.当自变量存在测量误差时,OLS估计量必然向上偏。四、简答题(每题5分,共20分)31.简述中心极限定理的核心内容及其在统计推断中的作用。32.说明多重共线性对回归模型估计与解释的具体影响,并给出两种常用诊断方法。33.写出时间序列平稳性的严格定义,并指出检验平稳性的两种单位根检验方法。34.比较参数Bootstrap与非参数Bootstrap的适用场景及实施步骤差异。五、讨论题(每题5分,共20分)35.某城市交通管理部门拟评估新信号灯方案对平均通行时间的影响,请设计一套包含抽样、对照、数据分析与因果推断的完整方案,并讨论潜在混杂因素及控制策略。36.在医学诊断试验中,灵敏度与特异度往往此消彼长,请结合ROC曲线讨论如何权衡二者,并说明若患病率极低时应如何调整筛查策略。37.大数据环境下,传统随机抽样面临“样本即总体”的新局面,请讨论此时统计推断理念需如何转变,并评估经典显著性检验在超大样本下的局限性。38.生成对抗网络(GAN)产生的模拟数据日益逼真,请探讨将其作为“人工总体”进行统计模拟的优劣,并分析其对传统蒙特卡洛方法的补充与风险。答案与解析一、1A2B3A4B5B6A7B8A9A10C二、11.[14.4,94.4]12.0.513.0.8714.10/8=1.2515.2116.117.36~11618.e⁻¹≈0.36819.拒绝20.Exp(1/2)三、21×22√23√24√25√26×27√28√29√30×四、31.中心极限定理指出,独立同分布随机变量之和经标准化后依分布收敛于标准正态。该定理奠定大样本下均值推断的正态近似基础,使置信区间与假设检验无需知晓总体分布即可实施。32.多重共线性使设计矩阵近似降秩,导致系数估计方差膨胀、t值下降、符号反转。诊断可用方差膨胀因子VIF>10或条件数>30判定;补救可删冗余变量、主成分回归或岭回归。33.严平稳要求联合分布对任意时移不变;宽平稳要求均值常数、协方差仅依赖时差。单位根检验可用ADF检验与PP检验,原假设均为存在单位根即非平稳。34.参数Bootstrap假设总体分布已知,用估计参数生成新样本;非参数Bootstrap直接从经验分布有放回抽样。前者需分布假设但效率高,后者稳健但需大样本。五、35.采用分层随机抽样选路口,配对设计将相似路口随机分实验组与对照组;记录早晚高峰通行时间,用双重差分法控制时间效应;混杂因素包括天气、车流量,通过协变量调整与固定效应模型控制;最后使用随机化推断验证显著性。36.ROC曲线下面积最大者最优;若患病率极低,提高特异度减少假阳性更关键,可采用两步法:先高灵敏度初筛,再在高特异度检测中确诊,以平衡成本与收益。37.超大样本使微小差异亦显著,需转向效应量及实
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤层气采购管理制度范本
- 燃料公司采购管理制度
- 物业公司采购流程及制度
- 物品采购与发放制度
- 物料采购制度
- 物资采购出入库管理制度
- 物资采购报审制度
- 物资采购评比制度
- 猪厂原料采购管理制度
- 现金及采购报销制度
- 上海交通大学生态学课件第二章:生物与环境
- 读懂孩子行为背后的心理语言课件
- 颅内高压患者的监护
- 七十岁换证三力测试题库
- 医生进修申请表(经典版)
- Unit 4 A glimpse of the future Starting out Listening-高中英语外研版(2019)选择性必修第三册
- 园林苗圃学复习2014概要
- GB/T 3390.1-2013手动套筒扳手套筒
- 2022年德清县文化旅游发展集团有限公司招聘笔试试题及答案解析
- 液压与气压传动全版课件
- 小学数学人教三年级上册倍的认识教学设计倍的认识
评论
0/150
提交评论