




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章线性回归分析变量之间的关系有两种: 确定型的函数关系 不确定型的函数关系这里主要研究不确定型的函数关系,如收入与受教育程度之间的关系,等等问题。 但它们之间存在明显的相互关系(称为相关关系),又是不确定的。回归分析是研究随机变量之间相关关系的统计方法。其研究一个被解释变量(因变量)与一个或多个解释变量(自变量)之间的统计关系。例 :人均收入 X 与人均食品消费支出 Y 的散点图的关系如图。1.一元线性回归是研究一个自变量与一个因变量的统计关系。一 . 一元线性回归人均收入 X人均食品支出Y这两个变量之间的不确定关系,可以用下式表示:式 中,人均食品消费支出 Y 是被解释变量, 人均收入 X 是解释变量, 1, 2是待估计参数; u 是随机干扰项, 且与 X 无关, 它反映了 Y 被 X 解释的不确定性 。如果随机干扰项 u 的均值为 0, 对上式求条件均值,有反映出从 “平均 ”角度看,是确定性关系。例: 地区的多孩率与人均国民收入的散点图如下:人均收入 X多孩率 Y这两个变量之间的不确定关系,大致可以用下式表示:设 Z =Ln X , 可将上式线性关系为:线性回归的任务: 就是用恰当的方法,估计出参数 1, 2 ,并且使估计出来的参数具有良好的统计特征,所以,回归问题从某种视角看,视同参数估计问题。如果把 X, Y的样本观测值代到线性回归方程中,就得到i =1,2, ,n, n 为样本容量 .从 重复抽样的角度看, Xi, Yi也 可以视为随机变量。2. 高斯基本假设对于线性回归模型i =1,2, ,n, n 为样本容量 .高斯基本假设如下 :(1) ui 为随机变量 ( 本假设成立 , 因为我们研究就是不确定关系 ).(2) E(ui) =0, 随机干扰项的期望值等于零 (本假设成立 , 如果其均值不是零 , 可以把它并入到 1 中 ).(3) Var(ui) =2u , 随机干扰项的方差等于常数 (本假设有可能不成立 , 以后讨论不成立时如何处理 ).(4) E(uiuj)=0 (ij) 随机干扰项协方差等于零 (本假设有可能不成立 , 以后讨论不成立时如何处理 ).(5) ui 服从 N(0, 2u )分布 ;(6) E(Xiuj)=0, 对 Xi 的性质有两种解释 :a. Xi 视为随机变量 , 但与 uj无关 , 所以 (6)成立 .b. Xi 视为确定型变量 , 所以 (6)也成立 .3. 普通最小二乘法 (OLS)设线性回归模型其中 为 1, 2 的估计值 , 则 Y 的计算值 , 可以用 下式表达 :所要求出待估参数 , 要使 Y 与其计算值 之间的 “误差平方和 ”最小 . 即: 使得最小 . 为此 , 分别求 Q 对 的偏导 , 并令其为零 :由上两式 , 就可求出待估参数 的值 .4. 所求参数的计算公式的 另一个表达式为 :例 :: 在上述家庭 可支配收入 -消费支出 例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表进行。 参数估计的计算表 iX iY ix iy ii yx 2ix 2iy 2iX 2iY 1 800 594 -1350 -973 1314090 1822500 947508 640000 352836 2 1100 638 -1050 -929 975870 1102500 863784 1210000 407044 3 1400 1122 -750 -445 334050 562500 198381 1960000 1258884 4 1700 1155 -450 -412 185580 202500 170074 2890000 1334025 5 2000 1408 -150 -159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 762 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 6760000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 4318084 9 3200 2585 1050 1018 1068480 1102500 1035510 10240000 6682225 10 3500 2530 1350 963 1299510 1822500 926599 12250000 6400900 求和 21500 15674 5769300 7425000 4590020 53650000 29157448 平均 2150 1567 因此,由该样本估计的回归方程为: 5. 几何解释残差向量 e =Y = (Y-Y) - (-Y) = y- 向量 y, , e 三者之间关系如图所示 ,普通最小二乘法要使残差平方和 e2i 最小 , 也就是要使 e 的长度尽可能小 , 等价于在几何上 e x . 或者说 , 的长度应当是 y 在 x 上的投影长度 .yxe二 . 多元线性回归本节要研究一个被解释变量 (因变量 ) , 多个解释变量 (自变量 )的线性模型 , 即1. 基本假设(1) u 为随机变量向量 ;(2) E(u) =0;(3) cov(u) =E(u uT) = 2u In (包含了两个其本假设:一是不存在序列相关,即 ij 时 , cov(ui, uj)=E(uiuj)=0;二是具有同方差性 (齐次方差性 ), 即 Var(ui) =2u ).(4) u N(0, 2u In ) (5) E(XTu) =0 , 或者 , X 为确定矩阵(6) 秩 ( X ) = k, ( k f(k-1, n-k), 就表示回归效果是好的 , 在 水平下 , 已解释方差 (Y的变化中已经解释的部分 )明显大于未解释方差 (Y的变化中尚未解释的部分 ).8. F与 R2的关系F 统计量与 R2的统计量的关系 , 可以从下式的推演中看到 :推演中用到勾股定理: 。一个二元线性回归的例子销 售 额 、人口数和年人均收入数据地区编 号销 售 额(万元) y人口数(万人 ) x1年人均收入(元 )x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例】【例】 一家百货公司在一家百货公司在 10个地区设有经销分公司。个地区设有经销分公司。公司认为商品销售额与该公司认为商品销售额与该地区的人口数和年人均收地区的人口数和年人均收入有关,并希望建立它们入有关,并希望建立它们之间的数量关系式,以预之间的数量关系式,以预测销售额。有关数据如下测销售额。有关数据如下表。试确定销售额对人口表。试确定销售额对人口数和年人均收入的线性回数和年人均收入的线性回归方程,并分析回归方程归方程,并分析回归方程的拟合程度,对线性关系的拟合程度,对线性关系和回归系数进行显著性检和回归系数进行显著性检验验 (=0.05)。一个二元线性回归的例子(Excel 输出的结果 )一个二元线性回归的例子(计算机输出结果解释 )销售额与人口数和年人均收入的二元回归方程为2. 多重判定系数多重判定系数 R2= 0.9373; 调整后的调整后的 R2= 0.91943. 回归方程的显著性检验回归方程的显著性检验 F = 52.3498 FF0.05(2,7)=4.74, 回归方程显著回归方程显著4. 回归系数的显著性检验回归系数的显著性检验 t= 9.3548t=0.3646,;,; t2 = 4.7962 t=2.3646;两个回归系数均显著两个回归系数均显著一个含有四个变量的回归9. 校正的判定系数( Adjusted R2)统计量 R2中不含有自由度。所谓校正的判定系数,就是指 “考虑了自由度的判定系数 R2adj”。 其定义如下:这样, R2adj剔除了自由度的影响。10. 回归系数的 T 检验假设 Ho: j=0;备择假设 H1: j 0 (即 Ho 不成立 ).用 统计量 : 服从 t (n-k), 可以完成上述假设检验 .当 时 , H1成立 , 即 j 显著异于 0.( n 5 时 , 若取 =0.05, 则当 t 2 时 , 有 H1 成立 , 即 j显著异于 0 )针对回归系数的 t 统计量的显著性检验 , 决定了相应的变量能否作为解释变量进入回归方程 .注意 :11. 回归系数的置信区间得到区间 为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高二英语EQIQ课件
- 新质生产力效率变革
- 重庆市饲料买卖合同样书4篇
- 药专业知识培训文案课件
- 农业产业集群产业园区创新生态构建与政策支持报告
- 服装培训课件
- 餐桌礼仪培训课件
- 金融行业数据治理与隐私保护技术市场前景与预测报告2025
- 港口智能化升级策略:2025年智慧港口建设实施方案与效益分析
- 学校第一届家长委员会成立仪式校长发言:解锁“3个密码”从“孤军奋战”到“家校同盟”
- 如何申请非遗
- 越剧《梁山伯与祝英台》剧本
- 广东省广州市越秀区2024年八年级下学期期末英语试卷附答案
- JJF1030-2023温度校准用恒温槽技术性能测试规范
- 矿山压力与岩层控制(第二章)
- 幼儿园低结构材料清单
- 注塑标准成型条件表电子表格模板
- 冶金传输原理课件
- 《健康是1财富是》课件
- 最常用2000个英语单词-(含注释)
- 《输血制度及流程》课件
评论
0/150
提交评论