研一spss复习资料06-回归分析_第1页
研一spss复习资料06-回归分析_第2页
研一spss复习资料06-回归分析_第3页
研一spss复习资料06-回归分析_第4页
研一spss复习资料06-回归分析_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

现代统计理论与方法,第6章回归分析,6.1回归分析基本概念,相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用面不同。在回归分析中,变量y称为因变量,处于被解释的特殊地位;而在相关分析中,变量y与变量x处于平等的地位,研究变量y与变量x的密切程度和研究变量x与变量y的密切程度是一样的。,在回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;而在相关分析中,变量x和变量y都是随机变量。相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度。,回归分析主要解决以下几方面的问题。通过分析大量样本数据,确定变量之间的数学关系式对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。,在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。本课程以线性回归分析为主,6.2一元线性回归分析,定义:一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。一元线性回归分析只涉及一个自变量的回归问题。设有两个变量x和y,y的取值随着x直线方程:y=0+1X+(6-2-1),式(6-2-1)称为一元线性总体回归模型。式中0+1是未知参数,0称为回归常数,1称为回归系数;称为随机扰动项,代表主观或客观原因造成的不可观测的随机误差,它是一个随机变量,通常假定满足,式(6-2-2)中E(i)表示的数学期望,Var(i)表示的方差.,(6-2-2),从式(6-2-1)可以看出,随机变量y由两部分组成,一部分是其均值部分E(y)=0+1x(6-2-3)另一部分是随机扰动项.,由式(6-2-3)可以得到一元线性总体回归方程y=0+1x(6-2-4),在实际问题中,由于所要研究的现象的总体单位数一般是很多的,在许多场合甚至是无限的,因此无法掌握因变量y总体的全部取值。即总体回归方程事实上是未知的,需要利用样本的信息对其进行估计。显然,样本回归方程的函数形式应与总体回归方程的函数形式一致。一元线性回归模型的样本回归方程可以表示为,(6-2-5),(6-2-5),(6-2-6),(6-2-6),(6-2-8),通过样本数据建立一个回归方程后,不能立即就用于对某个实际问题的预测。因为,应用最小二乘法求得的样本回归直线作为对总体回归直线的近似,这种近似是否合理,必须对其作各种统计检验。一般经常作一些统计检验。,(1)拟合优度检验,回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。回归方程的拟合优度检验一般用判定系数R2实现。该指标是建立在对总离差平方和进行分解的基础之上。,(2)回归方程的显著性检验(F检验),回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。,(3)回归系数的显著性检验(t检验),回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。,回归参数显著性检验的基本步骤。提出假设计算回归系数的t统计量值根据给定的显著水平确定临界值,或者计算t值所对应的p值作出判断,菜单选项:Analyze-Regression-Linear研究问题:打开数据文件“儿童身高体重”以身高为自变量,体重为因变量,建立一元线性回归方程,并对该回归模型进行评价,6.3多元线性回归分析,一元线性回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响。因此,在许多场合,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似。,(6-3-1),Cov(i,j)=0,(6-3-3),对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显著性。(1)拟合优度检验测定多元线性回归的拟合程度,与一元线性回归中的判定系数类似,使用多重判定系数,其定义为,检验所有自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示H0:1=2=k=0多元线性回归方程的显著性检验一般采用F检验,利用方差分析的方法进行F=平均的回归平方和/平均的剩余平方和F(k,n-k-1)如果F值较大,说明自变量造成的因变量的线性变动大于随机因素对因变量的影响,自变量于因变量之间的线性关系较显著,(2)回归方程的显著性检验(F检验),(3)回归系数的显著性检验(t检验),回归系数的显著性检验是检验各自变量x1,x2,对因变量y的影响是否显著,从而找出哪些自变量对y的影响重要,哪些不重要H0:i=0与一元线性回归一样,要检验解释变量对因变量y的线性作用是否显著,要使用t检验。,线性回归方程的残差分析,Standardizeresidualplots:绘制残差序列直方图和累计概率图,检测残差的正态性绘制指定序列的散点图,检测残差的随机性、异方差性ZPRED:标准化预测值ZRESID:标准化残差SRESID:学生化残差,线性回归方程的残差分析,残差序列的正态性检验绘制标准化残差的直方图或累计概率图残差序列的随机性检验绘制残差和预测值的散点图,应随机分布在经过零的一条直线上下,残差序列独立性检验,残差序列是否存在后期值与前期值相关的现象,利用D.W(Durbin-Watson)检验D-W=0:残差序列存在完全正自相关;D-W=4:残差序列存在完全负自相关;0D-W2:残差序列存在某种程度的正自相关;2Linear研究问题打开数据文件“公司职工”以当前薪金为因变量,起始薪金、职务、受教育年限等为自变量,建立回归方程并进行评价,6.4曲线估计,在一元回归分析中,一般首先绘制自变量和因变量间的散点图,然后通过数据在散点图中的分布特点选择所要进行回归分析的类型,是使用线性回归分析还是某种非线性的回归分析。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论