相关和回归分析(3)课件_第1页
相关和回归分析(3)课件_第2页
相关和回归分析(3)课件_第3页
相关和回归分析(3)课件_第4页
相关和回归分析(3)课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于相关与回归分析 (3)第一张,PPT共五十二页,创作于2022年6月1 相关的意义和种类一、相关关系的概念函数关系:函数关系是一种严格的依存关系,这种关系可以用y = f(x)的方程来表现。 (一对一的关系)第二张,PPT共五十二页,创作于2022年6月设有两个变量x和y ,变量y 随变量x 一起变化,并完全依赖于x ,当变量x 取某个数值时,y 依确定的关系取相应的值,则称y 是 x 的函数,记为y = f (x),其中x 称为自变量,y 称为因变量是一一对应的确定关系各观测点落在一条线上 xy第三张,PPT共五十二页,创作于2022年6月 函数关系的例子某种商品的销售额(y)与销售量(

2、x)之间的关系可表示为 y = p x (p 为单价)圆的面积(S)与半径之间的关系可表示为S = R2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 第四张,PPT共五十二页,创作于2022年6月变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个xy相关关系:相关关系是一种不完全确定的随机关系。(一对多的关系)第五张,PPT共五十二页,创作于2022年6月 相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出

3、(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系二、相关的种类第六张,PPT共五十二页,创作于2022年6月按相关程度划分:1、完全相关:指某变量的变化,另一变量有一确定的值对它对应。(函数);2、不完全相关:指两个变量之间有数量联系,但是数量是不确定的关系。3、零相关:指两个现象在数量上完全独立,在一定的形式下,互不影响,互不相干的关系。(“零相关”不能称为“不相关”,因为事物的联系是绝对的,而孤立是相对的,只有在某种形式下它才能互不影响互不相干。)第七张,PPT共五

4、十二页,创作于2022年6月按相关的方向划分:1、正相关:指两个变量按照相同的变量变化。或者说某个现象的数量增加,另一个现象的数量增加的现象。2、负相关:指两个变量按照相反的方向变化,或者说某个现象的数量增加,另一个现象的数量减少的现象。第八张,PPT共五十二页,创作于2022年6月按相关形式划分: 1、线性相关:指两个变量之间呈线性关系的相关。 2、非线性相关:指变量之间的关系为非线性的相关关系。第九张,PPT共五十二页,创作于2022年6月按变量多少划分:1、单相关:指两个因素之间的相关关系。2、复(多元)相关:反映一个变量与其他多个因素之间的相关关系。3、偏相关:指在某一现象和多种现象相

5、关的场合,假定其他变量不变,其中的两个变量间的相关关系。第十张,PPT共五十二页,创作于2022年6月按相关性质划分:1、真实相关:现象之间确实具有内在联系的相关。2、虚假相关:现象之间只是表面存在,实质上并没有内在联系的相关。(精神病患者GDP人口总量)第十一张,PPT共五十二页,创作于2022年6月1、按相关的程度划分完全相关不完全相关无相关2、按相关的方向划分正相关负相关3、按相关的形式划分线性相关非线性相关4、按影响因素的多少划分单相关复相关第十二张,PPT共五十二页,创作于2022年6月三、相关分析的内容:1、确定现象之间有无关系,以及相关的形态。(相关图、表)2、确定相关关系的密切

6、程度。(相关系数)3、选择合适的数学模型。(建立回归方程)4、测定变量估计值的可靠程度。(估计标准误差)第十三张,PPT共五十二页,创作于2022年6月2 简单线性相关分析一、相 关 表主要有定性判断、相关表、相关图、相关系数。 它是把取得的数据以表的形式显示出来,据此观察变量的走势是否有关,从而判断有无相关关系的方法。(一)简单相关表 其中一个变量的值按顺序排列,将两个变量的值一一对应地填列在同一张表格上,即形成简单相关表。适用于项目较少的情况。第十四张,PPT共五十二页,创作于2022年6月表1 家庭人均月收入与家庭人均月支出简单相关表 家庭人均月收入(元) 家庭人均月支出(元)51548

7、0515490519500530500530506530510570520570540600560680590第十五张,PPT共五十二页,创作于2022年6月(二)分组相关表 1、单变量分组相关表 它是一个变量分组,另一个变量不分组的相关表。 第十六张,PPT共五十二页,创作于2022年6月表2 家庭人均月收入与家庭人均月支出单变量分组相关表 家庭人均月收入(元) 户数家庭人均月支出(元) 515248551915005303 5053 570253060015606801590第十七张,PPT共五十二页,创作于2022年6月2、双变量分组相关表它是两个变量都分组的相关表。第十八张,PPT共五

8、十二页,创作于2022年6月表3 家庭人均月收入与家庭人均月支出双变量分组相关表家庭人均月支出(元) 家庭人均月收入(元) 合计 510570 570630 630690 475500 22500525 415525550 11550575 11575600 11合计63110第十九张,PPT共五十二页,创作于2022年6月二、相关图可通过Excel绘制相关图(散点图)。三、相关系数 (简单相关系数 )相关系数可以测定变量之间相关的密切程度。第二十张,PPT共五十二页,创作于2022年6月(一)原始公式及判断标准 1、原始公式 它是著名英国统计学家卡尔.皮尔逊设计的。 以上公式中,除去 、 ,

9、剩下的叫做x与y的协方差,用COV或 表示。 第二十一张,PPT共五十二页,创作于2022年6月所以 ,协方差的作用:显示 x 与 y 是正相关,还是负相关。相关系数的正负完全取决于协方差的正负。显示 x 与 y 相关程度的大小。 协方差的绝对值小,表示相关程度低;协方差的绝对值大,表示相关程度高。第二十二张,PPT共五十二页,创作于2022年6月 但x与y的协方差是名数,不同现象的变异情况不同,相关程度不能直接以协方差大小加以比较。需要以x与y的标准差加以标准化,使协方差化为无名数,使相关系数可以比较不同现象相关程度的高低。而且以x与y的标准差加以标准化以后,使相关系数的绝对值不超过1。标准

10、差的作用第二十三张,PPT共五十二页,创作于2022年6月2、判断标准(2)相关系数的取值范围在-1至1 之间。 其值大小反映两变量之间相关的密切程度,(1)相关系数有正负号,分别表示正相关和负相关。(3)表明两变量完全直线相关;表明两变量不存在直线相关;3、习题:试证明完全正直线相关时,r等于1;完全负直线相关时,r等于-1。 第二十四张,PPT共五十二页,创作于2022年6月-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加第二十五张,PPT共五十二页,创作于2022年6月(二)常用计算公式 由1、2、第二十六张,PPT共五十二页,创作于2022

11、年6月相关系数计算分析例题 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4 5 6 7 8生产费用 月产量序 号1.444.009.6114.4425.0017.2151.8464.00207.54384473966400121001322517424182252560010421474.4172.0248.0418.0575.0805.2972.01280.04544.6例:7-2-1第二十七张,PPT共五十二页,创作于2022年6月根据计算结果可知:则相关系数为:说明产量和生产费用之

12、间存在高度正相关。第二十八张,PPT共五十二页,创作于2022年6月1、两个变量都是连续性的;2、必须是成对数据,且每对数据相互独立;3、两个变量的总体都接近正态分布;4、两个变量的关系是线性的;(三)直线积差相关系数的应用条件5、排除共变因素的影响。 6、只能描述两变量之间线性关系的密切程度和方向,不能阐明二者的本质联系。7、一般地说,n小于30时计算出的r缺乏有效意义。第二十九张,PPT共五十二页,创作于2022年6月3 回 归 分 析一、回归分析的概念 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知

13、量,为估算预测提供一个重要的方法。第三十张,PPT共五十二页,创作于2022年6月相关与回归分析区别联系:相关分析:用一个指标来表明现象间依存关系的密切程度。 回归分析:根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。第三十一张,PPT共五十二页,创作于2022年6月区别: (1)相关分析不说明谁是自变量,谁是因变量,而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒。(2)相关分析中的每一个变量都是随机的;回归分析中自变量是一般变量,因变量是随机变量。 联系: (1)相关分析要依靠回归分析来表现现象数量相关的具体形式;(2)回归分析必须依靠相关关系来表

14、明变量之间的密切程度。 因此,相关分析与回归分析被合称为广义的相关分析。第三十二张,PPT共五十二页,创作于2022年6月二、回 归 的 种 类按自变量的个数分一元回归多元回归按回归线的形态分线性回归非线性回归第三十三张,PPT共五十二页,创作于2022年6月回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归第三十四张,PPT共五十二页,创作于2022年6月三、简单线性回归方程的求解1、方程式为:(一)方程式第三十五张,PPT共五十二页,创作于2022年6月2、回归系数b的经济涵义:当自变量变动一个单位时,因变量的平均变动值。b0,x与y为

15、正相关b0,x与y为负相关 3、条件:所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。第三十六张,PPT共五十二页,创作于2022年6月1、用最小平方法配合回归直线的基本思想是:在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点: 、原数列与趋势线的离差平方和为最小值。即、原数列与趋势线的离差之和为零。即:(三)a、b的最小二乘估计 第三十七张,PPT共五十二页,创作于2022年6月通过求a、b的一阶偏导可得到求解a、b的联立方程:解联立方程得到:2、具体求解 第三十八张,PPT共五十二页,创作于2022年6月简单直线回归方程建立的步骤为: 确定自变量x

16、和因变量y; 计算x2、xy、x、y、x2、xy; 代入公式,先求b,再求a。第三十九张,PPT共五十二页,创作于2022年6月 4544.6 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0104214 3844 7396 6400 12100 13225 17424 18225 25600207.54 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4

17、5 6 7 8生产费用 月产量序 号例7-3-1:根据例7-2-1资料配合生产费用依产量变化的回归方程:第四十张,PPT共五十二页,创作于2022年6月则回归方程为:回归系数b的涵义:月产量每增加1000吨,生产费用平均增加12.9万元。计算得到:第四十一张,PPT共五十二页,创作于2022年6月 670 82 90 100 114 140 144耐用消费品销售额(万元) 2820 340 380 450 470 560 620人均年收入(元)合计200020012002200320042005时间要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。例7-3-2某地区人均年

18、收入与耐用消费品销售额资料如下:第四十二张,PPT共五十二页,创作于2022年6月答案:相关系数 r = 0.98 b = 0.24 a = -1.13 yc = -1.13+0.24x回归系数b的涵义:人均年收入每增加一元,耐用消费品销售额平均增加0.24万元。第四十三张,PPT共五十二页,创作于2022年6月四 回归系数与相关系数的关系因为:所以:第四十四张,PPT共五十二页,创作于2022年6月4 估计标准误差一、估计标准误差的涵义二、估计标准误差的测定它是用来说明回归直线代表性大小的指标,用 表示第四十五张,PPT共五十二页,创作于2022年6月例7-4-1:用两种方法计算例7-3-1

19、中的估计标准误差解:法一,根据公式 有y628680110115132135160yc66.877.191.3100.3115.8130.0144.2154.523.04 79.21 127.69 94.09 0.64 4 84.64 30.25 则有 = 第四十六张,PPT共五十二页,创作于2022年6月法二,根据公式有第四十七张,PPT共五十二页,创作于2022年6月三、相关系数与估计标准误差的关系1、相关系数与估计标准误差呈反向关系2、当变量之间为完全直线相关时,估计标准误差为03、当变量之间不存在直线相关时,估计标准误差等于y的标准差,即回归直线和y数列的平均线重合第四十八张,PPT共五十二页,创作于2022年6月第七章 相关与回归一、判 断 对 错1、施肥量与收获率是正相关关系。( )2、利用一个回归方程,两个变量可以互相推算。 ( )3、若直线回归方程为 yc= 170 2.5X, 则变量X与Y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论