版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年数据回归问题测试题及答案
一、单项选择题(每题2分,共20分)1.在经典线性回归模型y=Xβ+ε中,若ε~N(0,σ²I),则β的最小二乘估计量β̂的分布为A.N(β,σ²(X'X)⁻¹)B.N(0,σ²I)C.t(n-k-1)D.χ²(n-k-1)2.当解释变量存在完全多重共线时,X'X矩阵的秩A.等于样本量nB.等于解释变量个数kC.小于k+1D.等于k+13.若回归残差呈现“喇叭口”形散点图,应首先考虑A.加入二次项B.使用加权最小二乘C.增加样本量D.采用岭回归4.对于异方差稳健标准误(White标准误),下列说法正确的是A.假定方差函数已知B.可消除异方差本身C.仍保持OLS点估计不变D.需假定误差服从正态5.在逐步回归中,若采用AIC准则,选入变量的临界值变化趋势为A.随样本量增大而降低B.随样本量增大而升高C.与样本量无关D.与RSS成反比6.当随机误差项存在一阶自相关且ρ>0时,OLS估计量的方差公式A.仍适用σ²(X'X)⁻¹B.被低估C.被高估D.等于07.若使用Lasso回归,当调节参数λ→∞时,系数估计值A.全部趋于0B.全部趋于OLS估计C.不变D.趋于无穷8.在Logistic回归中,若某变量系数为0.8,则其优势比OR为A.0.8B.1.8C.2.23D.0.459.对回归模型进行刀切法(Jackknife)估计的主要目的是A.降低偏差B.提高R²C.检验多重共线D.计算AIC10.若某变量VIF=10,则其对应的R²约为A.0.1B.0.5C.0.9D.0.99二、填空题(每题2分,共20分)11.若回归方程ŷ=3+2x₁–0.5x₂,当x₁增加2单位而x₂不变时,ŷ平均增加______单位。12.当解释变量个数为5、样本量为25时,调整后的R²公式中的分母自由度为______。13.若DW统计量近似等于4,则误差项的一阶自相关系数ρ的估计值约等于______。14.在Box-Cox变换中,若λ=0,则变换函数为______变换。15.若某模型R²=0.85,RSS=120,则TSS=______。16.当使用10折交叉验证时,每次训练集占原始样本比例约为______%。17.若岭回归估计量为β̂=(X'X+λI)⁻¹X'y,则当λ=0时,该估计量退化为______估计量。18.在泊松回归中,均值与方差的关系为______。19.若某变量标准化后的回归系数为0.6,则该变量每增加1个标准差,因变量平均增加______个标准差。20.当使用Breusch-Pagan检验时,辅助回归的因变量为______。三、判断题(每题2分,共20分)21.若误差项服从t分布,则OLS估计量仍是无偏的。22.当样本量趋于无穷时,AIC与BIC选择的模型必然相同。23.在存在异方差时,加权最小二乘估计量比OLS更有效。24.若变量间相关系数为0.9,则一定存在严重多重共线。25.对于时间序列数据,DW检验适用于高阶自相关检测。26.Lasso回归能够自动进行变量选择并压缩系数。27.若模型遗漏重要变量,则随机误差项必然出现自相关。28.当解释变量为虚拟变量时,VIF计算失去意义。29.在Logistic回归中,伪R²可直接与线性回归R²比较大小。30.若残差直方图呈明显双峰,则表明误差项可能非正态。四、简答题(每题5分,共20分)31.简述异方差对OLS估计量性质的影响,并给出两种检验方法名称。32.说明岭回归与Lasso回归在解决多重共线问题上的异同。33.写出多元线性回归模型下F检验的假设及统计量表达式。34.解释“过拟合”概念,并列举两种防止过拟合的回归技术。五、讨论题(每题5分,共20分)35.讨论在时间序列回归中,若同时存在异方差与自相关,应如何修正估计程序并评估其效果。36.当样本量远小于变量维度时,比较逐步回归、主成分回归与弹性网络三种策略的优劣。37.探讨在医疗数据分析中,使用Logistic回归与Cox回归的选择标准及潜在风险。38.结合实例讨论因果推断框架下,回归模型如何与双重差分法结合以评估政策效应。答案与解析一、单项选择题1.A2.C3.B4.C5.A6.B7.A8.C9.A10.C二、填空题11.412.2413.-114.对数15.80016.9017.OLS18.相等19.0.620.残差平方三、判断题21.T22.F23.T24.F25.F26.T27.F28.T29.F30.T四、简答题31.异方差使OLS估计量仍无偏但方差不再有效,标准误估计有偏,导致t、F检验失效。检验方法:White检验、Breusch-Pagan检验。32.同:均通过惩罚项缓解共线;异:岭回归用L2惩罚使系数收缩但保留全部变量,Lasso用L1惩罚可将部分系数压至0实现选择。33.H0:β1=β2=…=βk=0;H1:至少一个βj≠0。统计量F=[(TSS-RSS)/k]/[RSS/(n-k-1)]。34.过拟合指模型过度捕捉样本噪声致泛化性能下降。防止技术:①交叉验证选择惩罚参数;②正则化回归如弹性网络。五、讨论题35.先采用可行广义最小二乘(FGLS):先用OLS残差估计异方差结构,再用Cochrane-Orcutt或Prais-Winsten变换消除自相关;最后用Newey-West标准误稳健评估,比较DW、BG检验与RMSE下降幅度评估修正效果。36.逐步回归易陷入局部最优且不稳定;主成分回归降维无损信息但解释性弱;弹性网络结合L1与L2在高维下兼顾选择与收缩,预测精度高,解释性优于主成分,计算成本低于逐步,故高维小样本场景优先。37.若结局为二分类且随访时间齐,用Logistic回归,关注OR;若存在时间到事件且可能删失,用Cox回归,关注HR。风险:Logistic忽略时间可能掩盖滞后效应;Cox比例风险假设被违反会导致偏倚,需Schoenf
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预制预应力空心板楼盖安装施工建设方案
- 小学三年级下册音乐乐器介绍教学设计
- 食品qc考核试题及答案
- 三本护理面试题及答案
- 2026及未来5年中国多功能电脑包装机行业发展研究报告
- 2026年碧中海考核测试题及答案
- 2026年专业取向测试题及答案
- 2026年王小九智力测试题及答案
- 2026年价值观定位测试题及答案
- 2026年救援培训测试题及答案
- 2026年教材教法考试试题及答案英语
- 2026年建筑普通脚手架架子工习题库及答案
- 2026年辽宁锦州海通实业有限公司计划招录28人备考题库完整参考答案详解
- 2026中国银行博士后科研工作站博士后研究人员招收笔试备考题库及答案解析
- 2026年征兵政治考核面试题库及参考答案
- (正式版)T∕GDSTD 023-2026 广东省自然资源资产配置方案编制指南
- 2025年北京市八年级地生会考真题试卷(含答案)
- 2026年7月日历表(带农历-含周数-每月一张可打印)
- 五年级下册《道德与法治》简答题及答案
- 上海市松江区2026年生物八年级第二学期期末学业水平测试试题含解析
- 肾病透析导管并发症
评论
0/150
提交评论