下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026统计数据分析题母题100道所有考题都是母题变体
一、单项选择题(每题2分,共20分)1.在简单随机抽样中,若总体大小N=1200,样本量n=60,则抽样比为A.0.02B.0.05C.0.20D.0.502.对同一组数据分别计算样本方差s²与总体方差σ²,若n=100,则s²与σ²的期望关系为A.s²=σ²B.s²<σ²C.s²>σ²D.无法确定3.在双因素方差分析中,若因素A有3水平,因素B有4水平,重复次数r=2,则误差自由度为A.12B.24C.6D.234.若随机变量X~N(μ,σ²),则P(|X-μ|≤1.96σ)的近似值为A.0.90B.0.95C.0.975D.0.995.对同一总体进行两次独立抽样,样本量分别为n₁=50,n₂=80,则两样本均值差的标准误估计公式为A.√(s₁²/50+s₂²/80)B.√(s₁²/49+s₂²/79)C.√(s₁²+s₂²)/130D.√(s₁²/50+s₂²/80)/26.在泊松回归中,若偏移量log(t)被加入线性预测器,则其作用是A.调整离散参数B.实现稳健估计C.控制暴露时间D.降低多重共线7.对高维数据做主成分分析时,若前三个主成分累计贡献率达88%,则通常认为A.信息损失不可接受B.可降至3维C.需至少7维D.应保留全部变量8.若时间序列模型AR(1)的滞后1自相关系数为0.8,则其平稳条件是A.|0.8|<1B.0.8>0C.0.8<0.5D.0.8≠09.在K-means聚类中,若初始中心点选择不当,最可能导致的后果是A.类内平方和增大B.类间平方和增大C.收敛速度加快D.维度灾难10.对二分类问题使用逻辑回归,若某变量系数为-0.6,则其优势比OR为A.e^0.6B.e^-0.6C.-0.6D.0.6二、填空题(每题2分,共20分)11.若样本偏度为0,峰度为3,则该样本分布近似________分布。12.在简单线性回归中,判定系数R²等于回归平方和与________平方和的比值。13.当总体比例π未知时,计算其95%置信区间所需的最小样本量公式中,边际误差E的平方应位于分母的________位置。14.若随机变量T服从自由度为15的t分布,则其方差为________。15.对p维正态总体做均值向量检验,若样本量n=30,则HotellingT²统计量服从________分布。16.在非参数检验中,Mann-WhitneyU检验用于比较两组________数据的位置参数。17.若某指数平滑模型平滑系数α=0.1,则最新观测值对下一期预测的权重为________。18.对分类变量做卡方拟合优度检验时,期望频数小于5的单元格比例不应超过________%。19.若Bootstrap重抽样次数B=1000,则置信区间端点通常取排序后样本的________分位数。20.在贝叶斯估计中,若先验为Beta(2,2),后验为Beta(7,3),则观测到的成功次数为________。三、判断题(每题2分,共20分,正确打“√”,错误打“×”)21.对于任意分布,样本中位数总是无偏估计总体中位数。22.在多元回归中,若VIF>10,则一定存在严重多重共线。23.当样本量趋于无穷时,样本分位数的渐近分布服从正态。24.对时间序列差分一次即可消除任意阶非平稳性。25.在假设检验中,降低显著性水平α必然导致检验功效1-β提高。26.若两变量X与Y的Copula为独立Copula,则它们一定线性无关。27.对右偏数据取对数后,其偏度绝对值通常会减小。28.在随机森林中,增加树的数量可以降低过拟合风险。29.对同一数据,AIC值越小说明模型拟合优度越差。30.在生存分析中,Kaplan-Meier估计要求风险率服从指数分布。四、简答题(每题5分,共20分)31.简述在构建多元线性回归模型时,诊断异方差性的三种常用方法,并指出哪一种对非线性形式最敏感。32.说明Bootstrap-t置信区间与百分位置信区间的主要区别,并指出前者在何种样本情形下更具优势。33.给出时间序列ARIMA(p,d,q)模型中p、d、q三参数的含义,并说明如何借助ACF与PACF图进行初步定阶。34.解释“多重检验问题”导致的假阳性率上升机制,并列举两种控制家族错误率(FWER)的校正方法。五、讨论题(每题5分,共20分)35.某电商平台欲评估新推荐算法对GMV的提升效果,讨论如何设计随机对照试验,并说明在分析阶段需重点关注的因果推断假设与统计模型选择。36.在高维回归(p>>n)场景下,比较岭回归、Lasso与弹性网在变量选择、偏差-方差权衡及计算复杂度三方面的异同,并给出实际应用中的选择策略。37.针对政府公开的时空犯罪数据,讨论如何结合空间自相关与时空扫描统计量构建预警系统,并评估其对社会治理的潜在风险与伦理挑战。38.某医疗研究欲利用真实世界证据(RWE)评估新药有效性,讨论倾向得分匹配与双重差分法结合使用的可行性,并指出如何验证共同趋势假设及剩余混杂的敏感性。答案与解析一、1B2B3D4B5A6C7B8A9A10B二、11正态12总13分母1415/13≈1.1515F(p,n-p)16独立170.11820192.5%与97.5%205三、21×22√23√24×25×26√27√28√29×30×四、31.残差-拟合值图、Breusch-Pagan检验、White检验;White检验对非线性形式最敏感。32.Bootstrap-t利用学生化枢轴量,百分位直接取Bootstrap分布分位;样本量小或分布偏态时Bootstrap-t更优。33.p为AR阶数,d为差分次数,q为MA阶数;ACF拖尾、PACF截尾提示AR,反之提示MA,两者皆拖尾提示ARMA。34.多次检验增大至少一次拒绝真原假设概率;Bonferroni、Holm等校正FWER。五、35.随机化到用户级别,确保无干扰、无偏;需检验SUTVA、一致性假设;采用分层线性模型或广义混合效应模型处理用户-商品层级数据。36.岭回归不稀疏、偏差小;Lasso稀疏、易过选;弹性网折中;n稍大且需稀疏选Lasso,高度共线选弹
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深度解析(2026)《FZT 81015-2016婚纱和礼服》
- 深度解析(2026)《FZT 54127-2020循环再利用涤纶单丝》
- 人教统编六年级语文下册第五单元《习作:插上科学的翅膀飞》教学课件
- 深度解析(2026)《FZT 07004-2019纺织行业绿色工厂评价导则》
- 深度解析(2026)《EJT 20121-2016反应堆事故条件下操作干预水平的制定与修正》
- 初中户外活动时间保障政策执行-基于全国幼儿园户外活动监测数据
- 《JBT 8445-1996三相同步发电机负序电流承受能力试验方法》专题研究报告
- 瑞幸咖啡2025品牌年终报告
- 文化教育信息咨询公司信息化管理办法
- 2026年高考物理复习(习题)第六章第2讲 动量守恒定律及其应用 功能关系
- 脑卒中急救绿色通道建设
- 2026年贵州省贵阳国家经济技术开发区招聘聘用制人员11人易考易错模拟试题(共500题)试卷后附参考答案
- 滚动轴承常见故障诊断案例分析
- (2025年)甘肃省兰州市【统招专升本】计算机真题(含答案)
- 部编版八年级历史下册第12课《民族大团结》课件
- 2025年口腔护理学第四版题库及答案
- 应急预案充电桩智能化
- 2026年上海市中考语文备考之非连续性文本阅读例题摘选(附参考答案)
- 2026年《三级老年人能力评估师》考试复习题及参考答案
- 2025年高考物理真题分类汇编专题07 动量(全国)(解析版)
- 纺织业:新质生产力的转型路径
评论
0/150
提交评论