版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章第九章 相关与回归分析法相关与回归分析法 第九章第九章 相关与回归分析法相关与回归分析法 第一节第一节 相关与回归分析概述相关与回归分析概述 相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、 测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的 具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各 种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、 预测和控制的重要工具。预测和控制的重要工具。 一种商品的销售收入与其销售量:一种商品的销售收入与其销售量: 销售收入销售收入=销售量销售量 商品价格商品价格
2、 PQG 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。 相关关系相关关系 一、相关关系与相关分析 现象之间的相互联系,在许多情况下表现现象之间的相互联系,在许多情况下表现 为一定的因果关系,将这些现象数量化则为一定的因果关系,将这些现象数量化则 成为变量:成为变量: 自变量自变量X 因因 变量变量Y 4.按涉及变量的多少分为按涉及变量的多少分为 按相关的形式不同分为按相关的形式不同分为 按相关的方向不同分为按相关的方向不同分为 直线相关直线相关 曲线相关曲线相关 负相关负相关 正相关正相关 按相关的程度不同分为按相关的程度不同分为 完全
3、相关完全相关 不完全相关不完全相关 不相关不相关 复相关复相关 单相关单相关 相关分析相关分析 回归分析回归分析 二、回归与回归分析 按回归方程的形式分为按回归方程的形式分为 直线回归直线回归 曲线回归曲线回归 按自变量的个数分为按自变量的个数分为 复回归复回归 简单回归简单回归 q有共同的研究对象:现象之间的相关关系;有共同的研究对象:现象之间的相关关系; q互相补充:互相补充:相关分析要依靠回归分析表明现相关分析要依靠回归分析表明现 象数量相关的具体形式;而回归分析要依靠相象数量相关的具体形式;而回归分析要依靠相 关分析来表明现象数量的相关程度。只有变量关分析来表明现象数量的相关程度。只有
4、变量 之间存在着高度相关时,进行回归分析寻求其之间存在着高度相关时,进行回归分析寻求其 相关的具体形式才有意义。相关的具体形式才有意义。 三、相关分析与回归分析的关系 q相关分析不必确定自变量和因变量,所涉相关分析不必确定自变量和因变量,所涉 及的都是随机变量;回归分析事先要确定自及的都是随机变量;回归分析事先要确定自 变量和因变量,只有因变量为随机变量。变量和因变量,只有因变量为随机变量。 q内容上:相关分析研究相关的方向和程度,内容上:相关分析研究相关的方向和程度, 不能指出相关的具体形式,无法从一个变量不能指出相关的具体形式,无法从一个变量 的变化推测另一个变量的变化;而回归分析的变化推
5、测另一个变量的变化;而回归分析 研究变量之间相互关系的具体形式,可根据研究变量之间相互关系的具体形式,可根据 回归模型从已知量估计和预测未知量。回归模型从已知量估计和预测未知量。 q方法上:相关分析通过编制相关表、绘制方法上:相关分析通过编制相关表、绘制 相关图、计算相关系数;回归分析通过建立相关图、计算相关系数;回归分析通过建立 回归模型。回归模型。 定性分析定性分析 定量分析定量分析 第二节第二节 简单线性相关分析简单线性相关分析 企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y 1 2 3 4 5 6 7 8 1.2 2.0 3.1 3.8 5.0 6.1
6、 7.2 8.0 62 86 80 110 115 132 135 160 八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用 平均每昼平均每昼 夜产量夜产量 固定资产原值固定资产原值 3540404545505055556060656570 600650 1 1 550600 123 500550 213 450500 1517 400450 224 350400 0 300350 22 223543120 (百万元)(百万元) (吨)(吨) Y f X f 20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量 正正 相相 关关 负负 相
7、相 关关曲线相关曲线相关不不 相相 关关 x y x y x y x y 又称又称,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量, y轴代表因变量,将两个变量间相对应的变量轴代表因变量,将两个变量间相对应的变量 值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关 点分布状况的图形。点分布状况的图形。 在在的条件下,用以反映的条件下,用以反映两变量两变量间间 密切程度的统计指标,用密切程度的统计指标,用r表示表示 )( 22 22 2 积差法 yyxx yyxx nyynxx nyyxx r yx xy xy Lyx n xyyyxx 1 )(令 xx L
8、x n xxx 222 )( 1 )( yy Ly n yyy 222 )( 1 )( yyxx xy LL L r :则 2222 )()(yynxxn yxxyn r yx n y n x n xy yx yxxy 相关系数相关系数r r的取值范围:的取值范围: r0 为为正相关正相关,r 0 为为负相关负相关; |r|=0 表示不存在表示不存在关系;关系; |r|1 表示表示完全完全相关相关; |r| 0.3 为微弱相关为微弱相关(基本无关基本无关); 0.3 |r| 0.5为低度相关;为低度相关; 0.5 |r| 0.8为显著相关为显著相关(中度相关中度相关) ; 0.8 |r| 1.
9、0为为高度高度相关相关(强相关强相关) 。 相关系数的取值及其意义图示 序号序号 能源消耗量能源消耗量 (十万吨)(十万吨)x 工业总产值工业总产值 (亿元)(亿元)y x2y2xy 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 35 38 40 42 49 52 54 59 62 64 65 68 69 71 72 76 24 25 24 28 32 31 37 40 41 40 47 50 49 51 48 58 1225 1444 1600 1764 2401 2704 2916 3481 3844 4096 4225 4624 4761 5041 518
10、4 5776 576 625 576 784 1024 961 1369 1600 1681 1600 2209 2500 2401 2601 2304 3364 840 950 960 1176 1568 1612 1998 2360 2542 2560 3055 3400 3381 3621 3456 4408 合计合计916625550862617537887 能 源 消 耗 量 807060504030 工业总产值 60 50 40 30 20 () 9757. 0= 625-2617516916-5508616 625916-3788716 = )(- - = 26175=,5508
11、6=,37887= ,625=,916=,16= 22 22 2 2 22 yynxxn yxxyn r yxxy yxn解:已知 结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存 在高度的正相关关系。在高度的正相关关系。 回归分析回归分析 指根据变量之间相关关系的指根据变量之间相关关系的 具体形态,建立一个数学方具体形态,建立一个数学方 程(回归方程)来描述变量程(回归方程)来描述变量 之间关系;对给定的之间关系;对给定的自变量自变量 x x,揭示,揭示因变量因变量y y在数量上的在数量上的 平均变化并求得因变量的预平均变化并求得因变量的预 测值的统计分析方法。测值的统计
12、分析方法。 第三节第三节 简单线性回归分析简单线性回归分析 XY 为随机误差项为模型参数,与式中: : XYEY )(YE X XY 截距截距斜率斜率 一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0 XYEY bxay 以样本统计量估计总体参数以样本统计量估计总体参数 斜率(回归系数)斜率(回归系数) 截距截距 截距截距a 表示在自变量表示在自变量x为为0时,其它各种因素时,其它各种因素 对因变量对因变量y的平均影响;的平均影响;回归系数回归系数b 表明自变表明自变 量量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动b个单个单 位。位。 ii
13、iii ybxay y yxbxay )( 值应为 的实际而变量之间的平均变动关系, 变量与是理论模型,表明 10名学生的身高与体重散点图10名学生的身高与体重散点图 4040 4545 5050 5555 6060 6565 7070 7575 158158163163168168173173178178 身高(X )身高(X ) 体重(Y )体重(Y ) bxay xbay 残差:残差:e bxay 最小平方法最小平方法 基本数学要求:基本数学要求: min)( 0 2 yy yy 02 012 min,min ) ( 2 2 xbxay bxay ba bxayyy ,有求偏导数,并令其
14、为零、分别对函数中 ,有由 2 xbxaxy xbnay xby n x b n y a yxxy L L xxn yxxyn b xxx xy 222 )( 9757. 0=r ,55086,37887 ,625,916,16 2 xxy yxn由计算表知 bxay 5142. 6 16 916 7961. 0 16 625 7961. 0 9165508616 6259163788716 22 2 xbya xxn yxxyn b xy7961.05142.6 0 x bxay y x xy7961.05142.6对于 若若 x = 80(十万吨),则:(十万吨),则: 亿元1738.57
15、807961. 05142. 6y r0 r0 r=0 b0 b0 b=0 x y y x rbbr ; 10名学生的身高与体重散点图10名学生的身高与体重散点图 4040 4545 5050 5555 6060 6565 7070 7575 158158 160160 162162 164164 166166 168168 170170 172172 174174 176176 178178 身高(X )身高(X ) 体重(Y )体重(Y ) y y yy yy yy 2 )(yySST 2 ) (yySSE 2 ) ( yySSR 误差平方和误差平方和 回归回归 平方和平方和 总离差平方和
16、总离差平方和 ) ()(yyyyyy 2 2 ) ()()(yyyyyy ) )(2 ) ()( 22 yyyyyyyy 0 )( ) )( exbxeb exbabxayyyy 222 ) ()()(yyyyyy QyyUyyLyy yy 222 ) (,)(,)(令 QUL yy :则 总离差平方和的分解:总离差平方和的分解: 222 )/()(nynyyyLSST yy xyyyyy bLLULbxayQSSE 2 )( )( )( )()() ( )( 22 2 222 2 xxnn yxxyn bLL L L b xxbxbabxayyUSSR xyxx xx xy 10 2 r 判
17、定系数取值范围:判定系数取值范围: 2 2 2 )( )( yy yy L U r yy 判定系数是评价回归方程拟合优度的指判定系数是评价回归方程拟合优度的指 标,可以说明回归方程的代表性大小。标,可以说明回归方程的代表性大小。 判定系数与相关系数的关系判定系数与相关系数的关系 2 )(rbr的符号 22 )( yyxx xy yy xy xx xy yy xy yy LL L L L L L L bL L U r 无方向性,无方向性,则有方向,则有方向, 其方向与样本回归系数其方向与样本回归系数 b 相同;相同; 说明变量值的总离差平方和中说明变量值的总离差平方和中 可以用回归线来解释的比例,主要用于评可以用回归线来解释的比例,主要用于评 价回归方程的拟合优度;价回归方程的拟合优度;只说明只说明 两变量间关联程度及方向,主要用于评价两变量间关联程度及方向,主要用于评价 两变量间线性关系的密切程度。两变量间线性关系的密切程度。 是因变量各实际值与其估计值之间的是因变量各实际值与其估计值之间的 平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实 际值代表性的强弱;其值越小,回归际值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教 八年级 语文 下册 第5单元《18. 教材习题课件》课件
- 外研八下英语Unit 3 Presenting ideas-Reflection《单元写作》课件
- 2025 网络基础中网络数据保护标准的制定与实施课件
- 2026年事后后补合同(1篇)
- 2026年业务开票无合同(1篇)
- 2026年及未来5年市场数据中国山茶籽提取物行业市场深度分析及投资策略咨询报告
- 2025 高中信息技术数据与计算之数据安全的同态加密数据库应用课件
- 2026年春季消防安全技能培训
- 2025 高中信息技术数据与计算之数据与计算促进在线教育虚拟实验室建设课件
- 2025 高中信息技术数据与计算之 Python 的自然语言处理命名实体识别模型强化课件
- 2026年青海省海南藏族自治州单招职业适应性测试题库附参考答案详解(模拟题)
- 2026春牛津译林版英语八年级下册Unit+8+Reading+(同步课件)
- 第一单元(单元测试 基础夯实)-高二语文人教统编版选择性必修下册
- 2025山西中煤一局集团有限公司应届高校毕业生招聘20人笔试历年典型考点题库附带答案详解2套试卷
- 2026年安克创新行测笔试题库
- 违反无菌技术操作
- AI养鱼:智慧渔业新模式
- 2025年《三级公共营养师》考试练习题库及答案
- 煤矿调度专项培训课件
- 2026年时事政治测试题库100道含完整答案(考点梳理)
- 2026年度安全培训计划
评论
0/150
提交评论