应用回归分析课后习题_第1页
应用回归分析课后习题_第2页
应用回归分析课后习题_第3页
应用回归分析课后习题_第4页
应用回归分析课后习题_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、y1 1 x11 x12y2 1 x21 x22x1p01x2p1 +2 I1即 y=x +xnp pnyn 1 xn1 xn2基本假定(1)解释变量x1,x2,xp是确定性变量,不是随机变量,且要求 rank(X)=p+1<n,表明设计矩阵X中自变量列之间不相关,样本量的个数应大于解释变量的个数(2)随机误差项具有零均值和等方差,即高斯马尔柯夫条件(3)对于多元线性回归的正态分布假定条件的矩阵模型为N (0,2In)随即向量 yN(X , 2In)当(XTX)1存在时,回归参数的最小二乘估计为(XTX) 1XTY ,要求出回归参数,即要求XTX是一个非奇异矩阵, XTX 0,所以可逆矩

2、阵XTX为p+1阶的满 秩矩阵,又根据两个矩阵乘积的秩不大于每一因子的秩 rank(X) p+1,而X为n (p+1) 阶矩阵,于是应有n p+1结论说明,要想用最小二乘法估计多元线性回归模型的未知参数,样本量n必须大于 模型自变量p的个数。nE(e2)11n p 11n p 1nD(e) (E(e)2注 tr(H)1n(11nh1D(e)1nK J1 h) 2不能断定(n(p 1)SSE (y y)2 e12 e22en21_2_1 1_ n 2E( ) E(KS阳 KE(ie)这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n有关,当样本量个数n太小,而自变量又较多,

3、使样本量与自变量的个数接近时,R2易接近1,其中隐藏一些虚假成分。当接受H。时,认定在给定的显着性水平下,自变量x1,x2,xp对因变量y无显着影响,于是通过x1,x2,xp去推断y也就无多大意义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描述,而误用了线性模型,使得自变量对因变量无显着影响;另一方面可能是在考虑自变量时,把影响因变量y的自变量漏掉了,可以重新考虑建模问题。当拒绝儿时,我们也不能过于相信这个检验, 认为这个回归模型已经完美了, 当 拒绝Ho时,我们只能认为这个模型在一定程度上说明了自变量 x1,x2, xp与自变量 y的线性关系,这时仍不能排除排除我们漏掉了一些重要

4、的自变量。中心化经验回归方程的常数项为 0,回归方程只包含p个参数估计值 1, 2, p比一 般的经验回归方程减少了一个未知参数,在变量较多时,减少一个未知参数,计算 的工作量会减少许多,对手工计算尤为重要。在用多元线性回归方程描述某种经济现象时,由于自变量所用的单位大都不同,数据的大小差异也往往很大,这就不利于在同一标准上进行比较,为了消除量纲不同和数量级的差异带来的影响,就需要将样本数据标准化处理,然后用最小二乘法估计未知参数,求得标准化回归系数。对 y o 1X12X 2PXP进行中心化处理得y y1(x 1 X1)2(x 2X2)p(x PXP)再将等式除以因变量的样本标准差国则有y

5、*=y-y ,Lyy1(X 1 X1)Lyy2(X 2. LyyX2)p一(x p xp)LyyX1)2 . L22 (i L11J L yyX 2X2),L22p - L pp (X p xp)*-=1 X 1*2X2所以jj,*1,2,.Lyyr12;3Lyy Lppij为相关阵(rij)pp第i行,(1)12第j列的代数余子式)1211 ? 22SSR(j)1SSEFj = (n p 1)(n P 1)(1)111 r23 r321(n P 1)SSE(j)( SSE(j)r 21r 23r311(1)221门3r31121r23r31.(11232)(1r132)SSRj) (n P

6、1)SSESSE(j) )(n SS耳j) SSE(j)小于1, Fj与瑞一一对应,所以Fj与堤等价证彳# R2F (n P 1) PSSE(j)SSEP 1)(n(ryjP 1)SSE(j)( SSE(j)SSE(j)SSE2 r yj (n P 1)("-21ryj2 ryj相关性yx1x2x3yPearson 相关性1.556*.731*.724显着性(双侧).095.016.018N10101010x1Pearson 相关性.5561.113.398显着性(双侧).095.756.254N10101010x2Pearson 相关性*.731.1131.547显着性(双侧).0

7、16.756.101N10101010x3Pearson 相关性_ *.724.398.5471显着性(双侧).018.254.101N10101010*.在 水平(双侧)上显着相关。(2) (3) (4) (5) (6)模型汇总调整R标准估计模型 R R方 方 的误差1.898 a .806.708a.预测变量:(常量),x3, x1, x2Anovab模型平方和df均方FSig.1回归3.015a残差6总计9a.预测变量:(常量),x3, x1, x2 。b.因变量:y系数模型非标准化系数标准系数tSig.B标准误差试用版1(常量).096x1.385.100x2.535.049x3.27

8、7.284a. 因变量:y1回归方程为y= +2复相关系数R二,决定系数为,拟合度较高。3方差分析表,F=, P!=,表明回归方程高度显着,说明 x1,x2,x3,整体上对y有高度显着的线性影响4回归系数的显着性检验x1工业总产值的P值=X2农业总产值的P值=X3居民非产品支出的P彳4 =在的显着性水平上,x3未通过检验,应将其剔除掉输入/移去的变量b模型输入的变量移去的变量方法1x2, x1 a.输入a.已输入所有请求的变量。b.因变量:y模型汇总调整R 标准估计模型 R R方 方 的误差1.872 a.761.692a.预测变量:(常量),x2, x1。Anovab模型平方和df均方FSi

9、g.1回归2.007 a残差7总计9a.预测变量:(常量),x2, x1b.因变量:y系数a标准系模型非标准化系数Sig.B标准误差试用版1(常量).020x1.479.037x2.676.008a. 因变量:y1回归方程为y= +2复相关系数R二,决定系数为,由决定系数看回归方程接近高度相关3方差分析表,F=, P4 =,表明回归方程高度显着说明 x1,x2,整体上对y有高度显着 的线性影响4回归系数的显着性检验x1工业总产值的P值=X2农业总产值的P值=在的显着性水平上,自变量x1,x2对y均有显着影响(7)系数模型非标准化系数标准系数tSig.B的%置信区间B标准误差试用版下限上限1(常

10、量).020x1.479.037.381x2.676.008a. 因变量:y(8 )标准化回归方程y=+(9) 把x01=75,x02=42 带入 y= + 得丫=y置信水平95%勺区间估计为(,)y置信水平95%勺近似区间估计为(,)E (y)置信水平95%勺区间估计为,(10)由于X3的回归系数显着性检验未通过,所以居民非商品支出对货运总量影响不 大,但是回归方程整体对数据拟合较好。输入/移去的变量b模型输入的变量移去的变量方法1x2, x1 a.输入a.已输入所有请求的变量b.因变量:y模型汇总模型RR方调整R方标准估计的误差1.999.999输入/移去的变量b模型输入的变量移去的变量方法1x2, x1 a.输入a.预测变量:(常量),x2, x1Anovab模型平方和df均方FSig.1回归2.000 a残差12总计14a.预测变量:(常量),x2, x1 。b.因变量:y模型非标准化系数标准系数tSig.共线性统,B标准误差试用版容差VIF1(常量).050x1.607.299.081.065.050x2.074.921.000.050a系数a. 因变量:yVIF的值都大于10,所以变量之间存在多重共线性共线性诊断a模型维

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论