《回归分析)》PPT课件_第1页
《回归分析)》PPT课件_第2页
《回归分析)》PPT课件_第3页
《回归分析)》PPT课件_第4页
《回归分析)》PPT课件_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章,回归分析,本章内容,在数量分析中,经常会看到变量与变量之间存在着一定的联系要了解变量之间如何发生相互影响的,就需要利用相关分析和回归分析本章介绍回归分析基本概念,回归分析的主要类型,9.1回归分析基本概念,相关分析和回归分析都是研究变量间关系的统计学课题在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用面不同在回归分析中,变量y称为因变量,处于被解释的特殊地位而在相关分析中,变量y与变量x处于平等的地位,研究变量y与变量x的密切程度和研究变量x与变量y的密切程度是一样的,在回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量而在相关分析中,变量x和变量y都是随机变量,相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数而回归分析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度,具体地说,回归分析主要解决以下几方面的问题通过分析大量的样本数据,确定变量之间的数学关系式对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度,作为处理变量之间关系的一种统计方法和技术,回归分析的基本思想和方法以及“回归(Regression)”名称的由来都要归功于英国统计学家FGalton(18221911),在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析多元线性回归分析非线性回归分析曲线估计、时间序列的曲线估计含虚拟自变量的回归分析和逻辑回归分析等类型,9.2一元线性回归分析,9.2.1统计学上的定义和计算公式,是在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响,在实际问题中,由于所要研究的现象的总体单位数一般是很多的,在许多场合甚至是无限的,因此无法掌握因变量y总体的全部取值。也就是说,总体回归方程事实上是未知的,需要利用样本的信息对其进行估计。显然,样本回归方程的函数形式应与总体回归方程的函数形式一致。,通过样本数据建立一个回归方程后,不能立即就用于对某个实际问题的预测。因为,应用最小二乘法求得的样本回归直线作为对总体回归直线的近似,这种近似是否合理,必须对其作各种统计检验。一般经常作以下的统计检验。,(1)拟合优度检验回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度回归方程的拟合优度检验一般用判定系数R2实现。该指标是建立在对总离差平方和进行分解的基础之上,(2)回归方程的显著性检验(F检验)回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验回归方程的显著性检验一般采用F检验,利用方差分析的方法进行,(3)回归系数的显著性检验(t检验)所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量因此,可以通过回归系数显著性检验对每个回归系数进行考察,回归参数显著性检验的基本步骤:提出假设计算回归系数的t统计量值根据给定的显著水平确定临界值,或者计算t值所对应的p值作出判断,案例分析1线性回归数据来自国泰安数据服务中心的经济研究数据库。全国各地区能源消耗量与产量,地区包括我国30个省、直辖市、自治区。,9.2.2SPSS中实现过程,9.2.2SPSS中实现过程,实现步骤,图9-1在菜单中选择“线性”命令,图9-2“线性回归”对话框(一),图9-3“线性回归:统计量”对话框,图9-2“线性回归”对话框(一),图9-4“线性回归:图”对话框,图9-2“线性回归”对话框(一),图9-5“线性回归:保存”对话框,图9-2“线性回归”对话框(一),图9-6“线性回归:选项”对话框,图9-2“线性回归”对话框(一),9.2.3结果和讨论,F=62.265,p0.001,代表该回归模型是显著的。,9.2.3结果和讨论,R称为多元相关系数,R方(R2)代表模型的拟合优度。可以看到,R2=0.991,该模型拟合优度良好。,得到的多元线性回归方程:Y=-0.126+0.574X1+0.802X20.721X4+0.337X18,结果和讨论,F=843.821.265,p0.001,代表该回归模型是显著的。,结果和讨论,R称为多元相关系数,R方(R2)代表模型的拟合优度。可以看到,R2=0.969,该模型拟合优度良好。,得到的多元线性回归方程:Y=38.084+0.903X1-0.552X2-0.050X4+0.004X18,结论:能源消费总量主要受煤炭消费总量的影响,成正相关;与原油消费量和汽油消费量成一定的反比。,案例分析2数据文件选取了从1978年到2008年山东省国民生产总值与固定资产投资的年度数据,数据来源于山东省统计年鉴。下面将利用山东省国民生产总值作为被解释变量,固定资产投资作为解释变量来建立线性回归模型,分析固定资产投资与国民生产总值的关系。,实现步骤,结果和讨论,F=693.222,p商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响影响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。,因此,在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。这就产生了测定多因素之间相关关系的问题,研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成,对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显著性(1)拟合优度检验测定多元线性回归的拟合程度,与一元线性回归中的判定系数类似,使用多重判定系数,其定义为,(2)回归方程的显著性检验(F检验)多元线性回归方程的显著性检验一般采用F检验,利用方差分析的方法进行,(3)回归系数的显著性检验(t检验)回归系数的显著性检验是检验各自变量x1,x2,对因变量y的影响是否显著,从而找出哪些自变量对y的影响是重要的,哪些是不重要的。与一元线性回归一样,要检验解释变量对因变量y的线性作用是否显著,要使用t检验。,案例分析3对某种商品的需求量及其价格和消费者的收入进行联合调查,所得数据如下表所示。建立商品的需求量对价格及消费者收入的回归方程。,实现步骤,结果和讨论,F=53.333,p0.001,代表该回归模型是显著的。因此可以判断由价格及消费者收入对需求量解释的部分非常显著。,R称为多元相关系数,R方(R2)代表模型的拟合优度。可以看到,R2=0.870,该模型拟合优度较好。,得到的线性回归方程:Y=140.00010.000X1线性回归模型中的常数和价格的t值分别为140.000和-7.303,相应的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论