回归分析法讲稿_第1页
回归分析法讲稿_第2页
回归分析法讲稿_第3页
回归分析法讲稿_第4页
回归分析法讲稿_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于回归分析法第一张,PPT共四十六页,创作于2022年6月 7.1 概述 7.2 一元线性回归分析法 7.3 多元线性回归分析法 7.4 非线性回归分析法第二张,PPT共四十六页,创作于2022年6月7.1 概述1.回归分析的内涵 在信息分析研究中,我们经常会发现所研究的对象事物之间往往存在某种相关关系,它们互相联系、互相影响、互相制约。当研究对象的一个或多个变量X1,X2,Xm的变化会引起另一个或多个变量Y1,Y2,Yn发生变化时,我们就说它们之间存在着某种相关关系。其中诸X带有“原因”的性质,故称为自变量;诸Y带有“结果”的性质,称之为因变量。 第三张,PPT共四十六页,创作于2022年

2、6月7.1 概述2. 回归分析与相关分析的区别 回归(Regression,或Linear Regression)和相关都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。第四张,PPT共四十六页,创作于2022年6月3. 回归分析法主要解决以下两个问题一是确定几个变量(X与Y)之间是否存在因果关系、相关 关系( X1与X2等),如果存在,找出他们之间适当的 数学表达式;二是根据一个或几个变量的值,预测或控制另一个或几 个变量的值,且

3、要估计这种控制或预测可以达到何种精 确度。 7.1 概述第五张,PPT共四十六页,创作于2022年6月7.1 概述7.1.2 类型回归方程为线性的称为线性回归,否则称为 非线性回归。 线性回归是回归分析的基本模型,很多复杂 的情况都是转化为线性回归进行处理的。 回归方程的自变量只有一个的称为一元回归, 多于一个的称为多元回归。 第六张,PPT共四十六页,创作于2022年6月7.1.2 类型一元线性回归,即只有一个自变量的线性回归,用于两 个变量接近线性关系的场合,如y=a+bx 。多元线性回归,用于一个因变量Y同多个自变量X1,X2 ,Xm线性相关的问题,如y=a+b1x1+ b2x2+ bn

4、xn 非线性回归,又可分为两类:一类可通过数学变换变成 线性回归,如取对数可使乘法变成加法等;另一类可 直接进行非线性回归,如多项式回归。第七张,PPT共四十六页,创作于2022年6月7.1.3 步骤根据自变量与因变量的现有数据以及关系,绘制散点图, 并观察散点图是否近于呈直线趋势,若是,则设定回归 方程y=a+bx;求出合理的回归系数(对于一元线性回归而言,即用最 小二乘法求出a、b),并确定回归方程;进行相关性检验,确定相关系数;在符合相关性要求后,即可根据已得的回归方程与具体 条件相结合,来确定事物的未来状况;并计算预测值的 置信区间. 第八张,PPT共四十六页,创作于2022年6月 7

5、.1 概述 7.2 一元线性回归分析法 7.3 多元线性回归分析法 7.4 非线性回归分析法第九张,PPT共四十六页,创作于2022年6月7.2.1 设定回归方程两个定距变量的回归是用函数y= f(x)来分析的。我们最常用的是一元回归方程其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。第十张,PPT共四十六页,创作于2022年6月7.2.1 设定回归方程例题:现在我们来研究全国技术贸易额的变化规律并进行预测。全国每年的技术贸易额与很多因素有关,但经过分析,它主要受全国GDP这一因素的影响和制约,于是,我们来寻求二者之间的统计规律,并进行预测。以x表示自

6、变量全国GDP数量,以y表示因变量全国技术贸易额。谁是自变量?谁是因变量?第十一张,PPT共四十六页,创作于2022年6月7.2.1 设定回归方程表7-1 全国GDP及技术贸易额统计数据第十二张,PPT共四十六页,创作于2022年6月7.2.1 设定回归方程根据表列数据,我们可以在直角坐标系中绘出散点图 从散点图中,我们假定y与x之间大致呈线性关系,可用直线方程: y=a+bx (7-1)这条直线称为y对x的回归直线其表达式(7-1)称为回归方程,a、b称为回归系数 第十三张,PPT共四十六页,创作于2022年6月7.2.1 设定回归方程根据表列数据,我们可以在直角坐标系中绘出散点图 从散点图

7、中,我们假定y与x之间大致呈线性关系,可用直线方程: y=a+bx (7-1)这条直线称为y对x的回归直线其表达式(7-1)称为回归方程,a、b称为回归系数 第十四张,PPT共四十六页,创作于2022年6月7.2.2 确定回归系数例题:现在我们来研究全国技术贸易额的变化规律并进行预测。全国每年的技术贸易额与很多因素有关,但经过分析,它主要受全国GDP这一因素的影响和制约,于是,我们来寻求二者之间的统计规律,并进行预测。根据最小二乘法原理,求得a=-69.8587b= 0.0073Y=-69.8587+0.0073Xr=0.9471第十五张,PPT共四十六页,创作于2022年6月7.2.2 设定

8、回归方程 用SPSS软件实现演示(在变量窗口中建立变量)第十六张,PPT共四十六页,创作于2022年6月7.2.2 设定回归方程 用SPSS软件实现演示(在数据窗口中输入数据)第十七张,PPT共四十六页,创作于2022年6月7.2.2 设定回归方程 用SPSS软件实现演示(分析-回归分析-线性)第十八张,PPT共四十六页,创作于2022年6月7.2.2 设定回归方程 用SPSS软件实现演示(分析-回归分析-线性)第十九张,PPT共四十六页,创作于2022年6月7.2.2 设定回归方程回归系数相关系数 用SPSS软件实现演示(得到相关输出结果)第二十张,PPT共四十六页,创作于2022年6月7.

9、2.2 设定回归方程 用SPSS软件实现演示(绘制散点图)第二十一张,PPT共四十六页,创作于2022年6月7.2.2 设定回归方程第二十二张,PPT共四十六页,创作于2022年6月7.2.3 相关性检验1.相关性检验的含义 对回归模型描述实际数据的近似程度,也即对所得的回归模型的可信程度进行检验,称为相关性检验。 2.相关性检验的规则 0|r| 1,当|r|越接近1时,剩余平方和的值越接 近于0,则回归模型描述y与x的关系的近似程度越好, y与x的关系越接近于线性. 当|r| =1时,为完全线性相关; 当|r| =0时,称无线性相关.第二十三张,PPT共四十六页,创作于2022年6月3.r的

10、取值情况 情况一图7-2第二十四张,PPT共四十六页,创作于2022年6月情况二图7-23.r的取值情况 第二十五张,PPT共四十六页,创作于2022年6月情况三图7-23.r的取值情况 第二十六张,PPT共四十六页,创作于2022年6月情况四图7-23.r的取值情况 第二十七张,PPT共四十六页,创作于2022年6月4.相关系数临界值 上面的讨论中,知道只有当r比较大时,才可以用回归直线来近似地描述y与x的关系.那么r应该至少大到什么程度,才可以使得用回归直线来描述y与x的关系达到足够好的近似程度?相关系数的最低值称为相关系数临界值,记为ra,它是相关性检验的标准。第二十八张,PPT共四十六

11、页,创作于2022年6月 7.1 概述 7.2 一元线性回归分析法 7.3 多元线性回归分析法 7.4 非线性回归分析法第二十九张,PPT共四十六页,创作于2022年6月 多元线性回归的提出背景 在信息分析研究中,研究对象的变化往往和多个因素有关,是多个因素的同时作用导致研究对象的变化,而不是只受一个因素的影响。在某些情况下,这多个因素的作用能够分出明显的主次,这样我们就可以找出一个主要因素,而忽略其他次要因素,进而研究该对象和该主要因素之间的定量关系并预测对象的发展。但在许多实际问题中,一元线性回归分析只不过是回归分析中的一种特例,它通常是我们对影响某种现象的许多因素进行了简化考虑的结果。在

12、实践活动过程中,我们更多遇到的是,一个因变量往往与多个自变量有关。 第三十张,PPT共四十六页,创作于2022年6月 案例引入 某公司管理人员要预测来年该公司的销售额y时,研究认为影响销售额的因素不只是广告宣传费x1,还有个人可支配收入x2、价格x3、研究与开发费用x4、各种投资x5、销售费用x6等。这样因变量y就与多个自变量x1 ,x2 ,x3 ,x4 ,x5 ,x6有关。因此,我们就需要进一步讨论多元线性回归问题。 第三十一张,PPT共四十六页,创作于2022年6月 多元线性回归例题1 土地问题是当今世界令人瞩目的重大经济问题,人口和经济发展都和土地之间存在着密不可分的联系。人口数(X1)

13、、粮食总产量(X2)和粮食作物面积(X3)是影响土地面积(Y)的重要因素。因变量土地面积与三个自变量之间呈线形相关,因此用三元线形回归方程来分析。某地区的基本数据见 第三十二张,PPT共四十六页,创作于2022年6月 用SPSS进行求解(在变量窗口中建立变量)第三十三张,PPT共四十六页,创作于2022年6月 用SPSS进行求解(在数据窗口中输入数据)第三十四张,PPT共四十六页,创作于2022年6月 用SPSS进行求解(分析-回归分析-线性)第三十五张,PPT共四十六页,创作于2022年6月 用SPSS进行求解(选择变量)第三十六张,PPT共四十六页,创作于2022年6月 用SPSS进行求解

14、回归系数相关系数第三十七张,PPT共四十六页,创作于2022年6月 多元线性回归例题2 某地区1973年到1990年水稻产量和水稻播种面积、化肥使用量、生猪存栏数以及水稻扬花期降水量的数据资料,数据中有18个观测样本,代表了1973到1990共18个年份,有7个属性变量:id(序号)、x1(水稻播种面积)、x2(化肥使用量)、x3(生猪存栏数)、x4(水稻扬花期降水量)、y水稻产量、year(年份)。问题:用线性回归分析为该地区水稻产量寻求一个恰当的回归模型,分析产量对它具有显著影响因素之间的关系。第三十八张,PPT共四十六页,创作于2022年6月请看现场演示!第三十九张,PPT共四十六页,创

15、作于2022年6月均值标准差观测量总数 描述性统计量解读:第四十张,PPT共四十六页,创作于2022年6月从表中看到Y(水稻总产量)与自变量X1,X2,X3之间相关系数一次为0.798,0.913,0.887,反映水稻总产量与播种面积、化肥施用量、生猪存栏数之间存在显著的相关关系。化肥使用量(X2)对粮食作物产量的增长有显著的作用;自变量X4与因变量Y之间的相关系数为0.293,它与其他几个自变量之间的相关系数也很小,说明他们之间的线性相关不显著。这反映降水过程作为完全随机自然现象,与生产活动中人为控制的自变量之间的关系本来就应该是相互独立的。 相关系数矩阵解读:第四十一张,PPT共四十六页,创作于2022年6月此外,播种面积X1与化肥施用量X2、生猪存栏数X3之间的相关系数分别为0.774和0.782,说明它们之间存在较为显著的相关关系,这也符合常识。化肥施用量X2与生猪存栏数X3之间的相关系数为0.826,说明两者关系也是显著的。第四十二张,PPT共四十六页,创作于2022年6月该表说明模型整体拟合效果,模型的拟合优度系数为0.956,反映了因变量与自变量之间具有高度显著的线性关系。 模型表解读:调整后的R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论