



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章多元线性回归模型多元线性回归模型主要内容n多元线性回归模型的一般形式 n参数估计( OLS估计)n假设检验n预测一. 多元线性回归模型n问题的提出n解析形式n矩阵形式问题的提出n现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。n例如,产出往往受各种投入要素资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。n所以在一元线性模型的基础上,提出多元线性模型解释变量个数 2多元线性回归模型的假设n解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即无多重共线性。n随机误差项具有0均值和同方差n随机误差项不存在序列相关关系n
2、随机误差项与解释变量之间不相关n随机误差项服从0均值、同方差的正态分布uXbXbXbbYkk22110多元模型的解析表达式ikikiiikiiiikkuXbXbXbbYniXXXYnuXbXbXbbY221102122110, 2 , 1),(得:个样本观测值nknknnnkkkkuXbXbXbbYuXbXbXbbYuXbXbXbbY2211022222121021121211101uuubbbbXXXXXXXXXYYYnkknkknnn2121021222211121121111多元模型的矩阵表达式UXBYuuubbbbXXXXXXXXXYYYnkknkknnnUBXYUXBY2121021
3、222211121121111矩阵形式二. 参数估计(OLS)n参数值估计n参数估计量的性质n偏回归系数的含义n正规方程n样本容量问题1.参数值估计(OLS)nininiiXbXbbYyyQkikiiiie1212121100000210kbQbQbQbQ00001102110211101110XXbXbbxYXXbXbbXYXXbXbbXYXbXbbYkikikikiiikikiiiikikiiikikii得到下列方程组求参数估计值的实质是求一个k+1元方程组正规方程正规方程变成矩阵形式ikikikkiikiikiiiikikiiiiikikiiYXXbXXbXXbXbYXXXbXXbXbX
4、bYXbXbXbbn222110111222111022110ikiiiikkikiikiikiikiiiiikiiiYXYXYbbbbXXXXXXXXXXXXXXXn121022111221121正规方程正规方程矩阵形式YXXXBYXBXX1)(22111221121kikiikiikiikiiiiikiiiXXXXXXXXXXXXXXXnXXkbbbbB210ikiiiiYXYXYYX1最小二乘法的矩阵表示1002)()()()(), 0(2112122kneeYXXXBBXXYXBQBXXBYXBYYYXBBXYBXXBYXBBXYYYBXYXBYQBXYBXYeeBXYYYEyyQNU
5、UXBYBXYniiiniie?为什么2.1最小二乘估计量的性质n(1)线性(估计量都是被解释变量观测值的线性组合)n(2)无偏性(估计量的数学期望=被估计的真值)n(3)有效性(估计量的方差是所有线性无偏估计中最小的)无偏估计(是最佳线性估计式结论:在古典假定下,BLUEOLSOLS估计量的性质(续)正态)的线性函数是正态,又的线性函数是正态(个元素。中对角线上第)是(其中,在古典假定下,jjiijjjjjjjjYuYujccVarkjVarNY, XX,)(,.,2 , 1),(,()4(12线性YXXXB)(1无偏性BNXEXXBNXXXXBXXXENXBXXXEYXXXEBE)()()
6、()()()()()(11111有效性)()()()()()()()()()()()()()()() )()()() )()(121111111111)1()1(2XXXXXXXXNNEXXXNNEXXXXXXNNXXXEBNXBXXXBNXBXXXEBYXXXBYXXXEBBBBEBEBBEBEBCovxExExCovkk回忆:2.2 OLS回归线的性质n完全同一元情形:不相关与残差)解释变量(不相关;与残差)应变量估计值(的均值为剩余项(残差)的均值的均值等于实际观测值估计值)回归线过样本均值(iiiiiiikikiieXeYeYYXXXY540)3()2(.1332212.3 随机扰动项
7、方差的估计个),待估参数有(比较:一元情形:为待估参数个数。为样本容量,其中估计:扰动项的方差2222222neknkneii注解:k与k+1n凡是按解释变量的个数为k的,那么共有k+1个参数要估计。而按参数个数为k的,则实际有k-1个解释变量。总之两者相差1而已!要小心所用的k是什么意思!n所以如果本来是用解释变量个数的k表示的要转换成参数个数的k则用k-1代换原来的k就可以了!3.偏回归系数的意义n多元回归模型中的回归系数称为偏回归系数n某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动4.正规方程n由最小二乘法得到的
8、用以估计回归系数的线性方程组,称为正规方程ikikikkiikiikiiiikikiiiiikikiiYXXbXXbXXbXbYXXXbXXbXbXbYXbXbXbbn222110111222111022110YXBXX正规方程的结构nY 被解释变量观测值 n x 1nX 解释变量观测值(含虚拟变量n x (k+1) )nXX 设计矩阵(实对称(k+1) x (k+1)矩阵 )nXY 正规方程右端 n x 1n 回归系数矩阵( (k+1) x 1 )n 高斯乘数矩阵, 设计矩阵的逆n 残差向量( n x 1 )n 被解释变量的拟合(预测)向量 n x 1B1)(XXUY5.多元回归模型参数估计
9、中的样本容量问题n样本是一个重要的实际问题,模型依赖于实际样本。n获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。n最小样本容量:满足基本要求的样本容量最小样本容量 n k+1n(XX)-1存在| XX | 0 XX 为k+1阶的满秩阵nR(AB) min(R(A),R(B)nR(X) k+1n因此,必须有nk+1YXXXB1)(满足基本要求的样本容量n一般经验认为:n 30或者n 3(k+1)才能满足模型估计的基本要求。n 3(k+1)时,t分布才稳定,检验才较为有效第三节 多元线性回归模型的检验n本节主要介绍:n3.1 拟合优度检验(判定系数及其校正)n3.2 回归参数的显著性
10、检验(t检验)n3.3 回归方程的显著性检验(F检验)n3.4 拟合优度、t检验、F检验的关系3.1.1 拟合优度检验 总平方和、自由度的分解n目的:构造一个不含单位,可以相互比较,而且能直观判断拟合优劣的指标。n类似于一元情形,先将多元线性回归作如下平方和分解:1-k k -n 1-n )()( )(222自由度:回归平方和残差平方和总离差平方和ESSRSSTSSYYYYYYiiii对以上自由度的分解的说明1)() 1(,0,.,0,.,2211,12121222).(kknnRSSTSSESSknnkeekikiRSSnYnYTSSdfdfYXXYYYdfYYERikiikiiTii知再由
11、:所以,约束个对个方程方程求出,共有由而所以一个方程的约束受3.1.2 判定系数n判定系数的定义:n意义:判定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。n取值范围:0-1TSSRSSTSSESSTSSESSTSSRSSESSRSSTSSR1122R3.1.3 校正判定系数n为什么要校正?n判定系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的。n导致解释变量个数不同模型之间对比困难。n判定系数只涉及平方和,没有考虑自由度。n校
12、正思路: 引进自由度校正所计算的平方和。2R校正判定系数 (续)0; 1 , 0 )3(.,1k )2(111 ) 1 () 1/()/(122222222定取值可能为负,这时规但是,)非负(取值在判定系数得慢些!未校正的判定系数增加也就是说校正的比两者的差距将越来越大且随着解释变量的增加时,)(的判定系数的关系:校正判定系数和未校正RRRRRknnRRnTSSknRSSR2R3.2 回归参数的显著性检验 t检验的假设检验。统计量来进行回归系数以下可用得统计量代替,未知。用标准化。一般有将列的元素。行第的第)为(其中布,由前面知道:先要找出回归系数的分tkntcccNjjjjjjjjjjj)(
13、 tjjXX ),( 2212以下给出t-检验的具体过程备择假设。反之则反。拒绝原假设,接受判断:若,查表,得临界值给出显著水平根据样本计算提出假设:),(| t | )4()( )3(0t )2(,.,2 , 1j 0 :H 0 :H ) 1 (2/2/jjjjj1j0kntkntccckjjjjjj3.3 回归方程的显著性检验 (F检验)n 回归系数的t检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?n这即是下面所要进行的F-检验。3.3.1 方差分析表以下用表格的形式列出平方和、自由度、方差平方和来源平方和自由度均方和源于
14、回归K-1源于残差n-k总平方和n-12)(YYTSSi2)(iiYYRSS2)(YYESSi) 1/( kESS) 1/( nTSS)/(knRSS3.3.2 F检验(单侧检验)。反之则反。接受备择假设拒绝原假设,判断:若,查表,得给出显著性水平计算统计量)选择、(根据样本)(不全为,), 1()4();, 1() 3(), 1()/() 1/( 20,.,:H 0.: ) 1 (321320knkFFknkFknkFknRSSkESSFHkk3.4 各种检验之间的关系n3.4.1 经济意义检验和其他检验的关系联系: 判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计
15、检验。3.4.2 拟合优度和F检验的关系(1)都是对回归方程的显著性检验;(2)都是把总平方和分解,以构成统计量进行检验;(3)两者同增同减,具有一致性。FkknnRRkknF) 1(11R ,11222关系在数量上,它们有如下拟合优度和F检验的关系(续)n区别:(1)F检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,判定系数(校正判定系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论;3.4.2 F检验和t检验的关系n在一元的情形,两者是一致的,等价的。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2 (所以在一元情形,只需要进行一种检验)n多元中,不存在以上关系。回归模型假设检验的步骤n查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客房应急房管理制度
- 室外休息区管理制度
- 库房领用料管理制度
- 影像科费用管理制度
- 微商城推广管理制度
- 心理健康室管理制度
- 快递站消毒管理制度
- 怎样学餐饮管理制度
- 总商会培训管理制度
- 慈善会日常管理制度
- 2025年高考河北卷物理真题(解析版)
- 2025春季学期国开电大本科《经济学(本)》一平台在线形考(形考任务1至6)试题及答案
- 三基考试试题及答案护士
- 2025年中考物理一轮复习知识清单专题14 电学基础(6大模块知识清单+5个易混易错+7种方法技巧+典例真题精析)(解析版)
- 2025年乡村振兴战略相关知识考试题及答案
- 2024-2025年第二学期散学典礼活动方案-书香盈夏韵成长向新程
- 哈尔滨市第九中学校2024-2025学年高二下学期期中地理试卷
- CJ/T 315-2009城市市政综合监管信息系统监管案件立案、处置与结案
- 辽宁邮政招聘笔试题库2025
- 中国多式联运发展报告2024-交通运输部规划研究院
- 二手房砸墙合同协议书
评论
0/150
提交评论