版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(2025年)《应用回归分析》课后习题答案全文习题1:简单线性回归模型参数估计与显著性检验某城市2020-2023年各月平均气温(X,单位:℃)与居民用电量(Y,单位:百万千瓦时)的月度数据共48组,部分数据如下(X均值=18.5,Y均值=32.7,Σ(Xi-X̄)(Yi-Ȳ)=1245.6,Σ(Xi-X̄)²=382.4,Σ(Yi-Ȳ)²=5120.8)。(1)建立Y关于X的简单线性回归模型,并计算回归系数;根据简单线性回归模型Y=β0+β1X+ε,参数估计公式为:β1=Σ(Xi-X̄)(Yi-Ȳ)/Σ(Xi-X̄)²=1245.6/382.4≈3.257β0=Ȳ-β1X̄=32.7-3.257×18.5≈32.7-60.25≈-27.55因此,回归方程为Ŷ=-27.55+3.257X。(2)计算判定系数R²并解释其意义;总平方和SST=Σ(Yi-Ȳ)²=5120.8,回归平方和SSR=β1²Σ(Xi-X̄)²=(3.257)²×382.4≈10.60×382.4≈4053.4残差平方和SSE=SST-SSR=5120.8-4053.4=1067.4R²=SSR/SST=4053.4/5120.8≈0.792,表明居民用电量的变异中约79.2%可由气温的线性变化解释。(3)检验回归系数β1的显著性(α=0.05);首先计算β1的标准误:se(β1)=√(SSE/((n-2)Σ(Xi-X̄)²))=√(1067.4/(46×382.4))≈√(1067.4/17590.4)≈√0.0607≈0.246t统计量=t=β1/se(β1)=3.257/0.246≈13.24自由度df=n-2=46,查t分布表得t0.025(46)≈2.013,由于|t|=13.24>2.013,拒绝原假设,β1显著不为0,气温对用电量有显著影响。(4)检验回归模型的整体显著性(α=0.05);F统计量=F=(SSR/1)/(SSE/(n-2))=(4053.4/1)/(1067.4/46)≈4053.4/23.20≈174.7分子自由度df1=1,分母自由度df2=46,查F分布表得F0.05(1,46)≈4.05,由于F=174.7>4.05,模型整体显著。习题2:多元线性回归模型构建与逐步回归某机构收集2022年某城市120套二手房交易数据,因变量Y为房价(万元),自变量包括X1(建筑面积,m²)、X2(房龄,年)、X3(卧室数量,间)。经计算得到以下结果(括号内为标准误):初始全模型:Ŷ=15.2+0.85X1-1.20X2+12.5X3(se:2.1,0.12,0.35,5.8),R²=0.89,调整R²=0.88,F=92.3(p<0.001)。逐步回归过程:第一步:单变量回归中,X1的R²=0.82(最高),保留X1;第二步:加入X2,模型R²=0.87,X2的t=-3.43(p=0.001),显著,保留;第三步:加入X3,模型R²=0.89,X3的t=2.16(p=0.033),在α=0.05下显著,保留;第四步:检查已保留变量的显著性,X1(t=7.08,p<0.001)、X2(t=-3.43,p=0.001)、X3(t=2.16,p=0.033)均显著,逐步回归结束。(1)解释全模型中X1的系数含义;X1的系数为0.85,表示在房龄和卧室数量不变的情况下,建筑面积每增加1平方米,房价平均增加0.85万元。(2)说明逐步回归选择变量的逻辑;逐步回归通过“向前引入-向后剔除”的迭代过程选择变量:首先引入对因变量解释力最强的变量(X1),然后依次引入能显著提高模型拟合优度的变量(X2、X3),同时检查已引入变量是否因新变量加入而变得不显著(本例中无剔除情况),最终保留所有显著变量的模型。习题3:异方差检验与修正基于习题2的全模型,残差平方e²与X1的散点图显示“喇叭形”分布,怀疑存在异方差。(1)使用White检验判断是否存在异方差(α=0.05);White检验的辅助回归模型为:e²=α0+α1X1+α2X2+α3X3+α4X1²+α5X2²+α6X3²+α7X1X2+α8X1X3+α9X2X3+ν估计后得到R²=0.23,n=120,检验统计量nR²=120×0.23=27.6。自由度=辅助回归中解释变量个数(不含常数项)=9,查χ²分布表得χ²0.05(9)=16.92,由于27.6>16.92,拒绝原假设,存在异方差。(2)采用加权最小二乘法(WLS)修正异方差,假设权重w=1/X1²,给出修正后的回归结果;对原模型进行加权变换:Y=Y/√X1,X1=1/√X1,X2=X2/√X1,X3=X3/√X1,模型变为Y=β0X1+β1+β2X2+β3X3+ε。估计得:Ŷ=-0.52X1+0.88+(-1.15)X2+11.2X3(se:0.18,0.09,0.28,4.5),调整R²=0.91,F=105.6(p<0.001)。还原为原变量形式:Ŷ=-0.52+0.88X1-1.15X2+11.2X3(权重调整后系数更稳健,标准误减小)。习题4:自相关检验与广义差分法某地区2000-2023年年度GDP数据(Y,亿元)与固定资产投资(X,亿元)的简单线性回归模型中,残差et的序列相关图显示一阶正相关。(1)计算DW统计量并判断自相关存在性(α=0.05);已知n=24,k=1(解释变量个数),Σ(etet-1)²=850,Σet²=1200,DW=Σ(etet-1)²/Σet²=850/1200≈0.708。查DW临界值表:n=24,k=1,α=0.05时,dL=1.27,dU=1.45。由于DW=0.708<dL=1.27,存在一阶正自相关。(2)使用广义差分法修正自相关,写出具体步骤;步骤①:估计自相关系数ρ≈1-DW/2=1-0.708/2≈0.646;步骤②:对变量进行广义差分变换:Yt=YtρYt-1,Xt=XtρXt-1(t=2,3,…,24);步骤③:对变换后的数据(共23组)进行OLS回归,得到新的回归方程Ŷt=β0+β1Xt+εt;步骤④:原模型的长期系数为β1,截距项为β0/(1-ρ)。习题5:多重共线性诊断与处理在习题2的全模型中,X1(建筑面积)与X3(卧室数量)的相关系数r=0.82,方差膨胀因子(VIF)计算结果为:VIF(X1)=12.3,VIF(X2)=2.1,VIF(X3)=11.8。(1)判断多重共线性的严重程度;一般认为VIF>10时存在严重多重共线性。X1和X3的VIF分别为12.3和11.8,远大于10,说明二者之间存在严重多重共线性;X2的VIF=2.1<10,无显著共线性。(2)提
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三明医学科技职业学院《大学写作训练》2025-2026学年期末试卷
- 长春财经学院《儿童发展》2025-2026学年期末试卷
- 厦门海洋职业技术学院《中医急诊学》2025-2026学年期末试卷
- 集美大学《外科学总论》2025-2026学年期末试卷
- 福建农林大学《大学生心理健康教育》2025-2026学年期末试卷
- 江西农业大学《经济法学》2025-2026学年期末试卷
- 阳泉职业技术学院《材料力学》2025-2026学年期末试卷
- 黎明职业大学《高级财务管理学》2025-2026学年期末试卷
- 长春工业大学人文信息学院《中国文化概论》2025-2026学年期末试卷
- (2026年)科室常见负压引流装置护理课件
- 内蒙古自治区鄂尔多斯市校联考2023-2024学年七年级4月月考语文试题
- JT-T-978.3-2015城市公共交通IC卡技术规范第3部分:读写终端
- 2023年山东济南新旧动能转换起步区所属单位招聘考试真题
- 遗传性脑小血管病诊断思路
- 数学一模质量分析
- 火力发电厂机组A级检修监理大纲
- 小狐狸买手套
- 气流组织课件
- GB/T 15587-2023能源管理体系分阶段实施指南
- 职业技能竞赛钢结构工程质量检测决赛钢结构焊缝质量检测理论题库多选题
- 数据库原理及应用-课件
评论
0/150
提交评论