线性相关与回归分析_第1页
线性相关与回归分析_第2页
线性相关与回归分析_第3页
线性相关与回归分析_第4页
线性相关与回归分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章相关与回归分析第一节简单线性相关分析一、简单线性相关(直线相关)的概念:二、相关关系的种类:(一)按相关程度划分可分为完全相关、不完全相关、和不相关(二)按相关方向划分可分为正相关和负相关(三)按相关的形式划分可分为线形相关和非线形相关(四)按变量多少划分可分为单相关、复相关和偏相关三、相关分析相关分析一样能够借助相关系数与相关图来进行相关分析。(一)相关系数1 .简单相关系数的含义反映两个变量之间线性相关紧密程度和相关方向的统计测定,它是其他相关系数形成的基础。2 .简单相关系数的计算.z-()WOE或化简为:一,立'()3 .相关系数的性质(1)相关系数的取值范围在-1和+1

2、之间,即:-lWrWlo(2)计算结果,假设r为正,那么说明两变量为正相关;假设r为负,那么说明两变量为负相关。(3)相关系数r的数值越接近于1(-1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。若是或-1,那么表示两个现象完全直线性相关。若是0,那么表示两个现象完全不相关(不是直线相关)。(4)判定两变量线性相关紧密程度的具体标准为:0<|/j<0,3,称为微弱相关;0.3<|r|<0,5,称为低度相关;0.5<|/j<0,8,称为显著相关;0.84|vl称为高度相关。(二)相关图相关图又称散点图。它是以直角坐标系的横轴代表标量X,纵轴代表标量

3、Y,将两个变量间相对应的变量值用坐标点的形式刻画出来,用来反映两变量之间相关关系的图形。四.相关系数的假设查验1 .目的:相关系数查验的目的是判定两变量的整体是不是有相关关系。查验样本相关系数r是不是整体相关系数为0的整体,如概率P<,以为两变量存在相关关系。2 .方式:有t查验和查表法。(1) t查验法:统计量计算为:v 二 n-2(2)查表法:是直接查相关系数界值表取得相应的概率po统计量r绝对值越大,p越小。第二节简单线性回归分析一、回归分析的概念与种类二、一元线性回归1 .一元线性回归模型丁=自+用+£2 .一元线性回归方程Y=abX3 .回归模型的前提条件1)线性:是

4、指反映变量Y的整体平均值与自变量X呈线性关系;2)独立性:任意两个观看值之间彼此独立;3)正态性:是指关于给定的X值,其对应的Y值的整体和线性模型的误差项£均服从正态散布;(£均服从均数为0的正态散布)4)等方差性:不管X如何取值,Y都有相同的方差。4 .回归方程的查验回归方程的显著性查验查验自变量和因变量之间的线性关系是不是显著。具体方式是将回归离差平方和(SS同剩余离差平方和(S组加以比较,应用尸查验来分析二者之间的不同是不是显著,若是是显著的,两个变量之间存在线性关系;若是不显著,两个变量之间不存在线性关系。SS总=SS回+SS剩SS呵为回归平方和,它反映在Y的总变异

5、中,由于X与Y的直线关系,而使得Y变异减小的部份,也即在总平方和中能够用X说明的部份。SS回越大,说明回归成效越好。SS制为剩余平方和,它反映X对Y的线性阻碍之外的因素,对Y的总变异的阻碍,也即在总平方和中无法用X说明的部份。SS利越小,说明直线回归的估量误差越小。回归系数的显著性查验bt=关于一元线性回归,回归方程的显著性查验与回归系数的显著性查验是等价的。可通过方差分析或t查验进行。三、相关与回归分析应用注意事项2.直线相关与回归的区别与联系(1)区别:相关分析耍求两个变量均服从正态散布,而回归分析那么有两种不同的模型。I型回归:定x后对y进行测量,y须服从正态散布;II型回归:x,y均须

6、服从正态散布,如体重依身高的变更关系。关于同一资料,只能计算一个相关系数,而H型回归能够计算由x推y和由y推x的两个回归方程,但二者不是反函数的关系。回归反映两变量间的依存关系,相关反映两变量间的彼此关系。有相关联系不必然是因果联系。(2)联系:同一资料r与b符号相同。同一资料r与b的假设查验结果是等价的。r与b能够相互换算。相关是彼此关系,两边向,-1WrW+1,无单位,有相关不必然有回归;回归是依存关系,单方向,无穷,有单位,有回归必然有相关。第三节秩相关秩相关又称品级相关,是一种用品级数据进行直线相关分析的非参数统计方式,适用于双变量不服从正态散布的资料;整体散布型未知;品级资料或无确切

7、数值资料。秩相关用品级相关系数二表示紧密程度及方向。其取值范围为-1WrW+1;r>0为正相关,r<0为负相关;尸0,表示无线性相关关系,为零相关。第十一章多重线性回归一.大体概念:多重线性回归的概念:1 .多重线性回归是研究多个自变量与一个因变量之间线性依存关系的方式。2 .多重线性相关(复相关)是研究多个变量与一个变量线性相关关系的方式。3 .多元线性回归是研究多个自变量与多个因变量线性依存关系的方式。4 .多元线性相关是研究多个变量与多个变量之间线性相关关系的方式。5 .偏相关是研究在多个变量中排除其它变量阻碍后一变量与另一变量的相关关系。二、多重线性回归模型1 .意义:多重

8、线性回归模型用于研究一个被说明变量(因变量)受多个说明变量(自变量)的阻碍,多重线性回归模型与一元线性回归模型大体类似,只只是说明变量由一个增加到两个以上,被说明变量y与多个说明变量如a之间存在线性关系。2 .模型与方程: 假定被说明变量y与多个说明变量xi,x2Xk之间具有线性关系,成立多重线性回归模型为:)'=)+月内+外士+,+功+£(一元y=A0+gx+£)其中y为被说明变量,为k个说明变量,也为偏(部份)回归系数,£为随机误差项。 被说明变量y的期望值与说明变量x的多重线性回归方程为:Y=a+bX+b2X2+-+bkXk 参数估量的方式:一样需要

9、运算机软件完成。如以儿子身高为因变量,父、母身高和体育锻炼次数为自变量,成立方程如下:Y=+ .多重线性回归模型的假设(条件):1、因变量Y和说明变量X之间是线性关系;2、X是自变量,并在两个或多个自变量之间没有精准的线性关系;3、误差项的所有观测值的期望值为0,方差相等;4、误差项的观测值之间彼此独立,不相关;5、误差项服从正态散布。三、参数与参数估量:1 .参数估量方式:参数估量方式是最小二乘法。一样用统计软件完成。2 .偏回归系数£,(幻:表示除工外的其他自变量固按时,工改变一个单位后F的平均转变。3 .标准回归系数:偏回归系数因各自变量值的单位不同,不能直接比较其大小。对变量

10、值作标准化变换,取得的回归系数为标准回归系数,可直接比较其大小,反映各自变量对因变量的奉献大小。四、多重回归的假设查验:1.回归方程(模型)的假设查验:查验模型是不是成立,或方程是不是成心义。(1)方差分析:(2)整体复相关系数的假设查验:2 .回归系数的假设查验:_Z?,-0'=SE(bJ3 .确信系数计算:确信系数为:/=2=1一号SSTSSTSST=sse+SSR总离差平方和二残差平方和+回归平方和R表示总变差中由多元回归方程“说明”的比例;正可说明模型的拟合优度,残差平方和越小,决定系数越接近1,回归方程的拟合程度越好。四.回归分析中的变量挑选:五.多重回归分析的要紧用途:六.多重回归分析的一样步骤:七.多重相关和偏相关:应用条件:同简单线性相关一样,仅当人,乂,y为多元正态散布的随机变量时才能考虑相关分析。i.复相关系数(多重相关系数):多重相关的实质确实是y的实际观看值与由个自变量预测的)值的相关。也既复相关系数反映一个因变量与一组自变量之间的相关程度。前而计算的确信系数是y与v相关系数的平方,那么复相关系数确实是确信系数的平方根。r2 .偏相关系数(部份相关系数):部份相关系数反映校正其它变量后某一变量与另一变量的相关关系,校正的意思能够明白得为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论