统计学第六章相关回归ppt课件_第1页
统计学第六章相关回归ppt课件_第2页
统计学第六章相关回归ppt课件_第3页
统计学第六章相关回归ppt课件_第4页
统计学第六章相关回归ppt课件_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/4/19,统计学讲义 游士兵,1,统计学 Statistics,武 汉 大 学 商 学 院 副教授 游 士 兵 经济学博士 电 话13307175789 E-mail: ,2019/4/19,统计学讲义 游士兵,2,第六章 相关与回归分析 correlation regression analysis,章前导语: 1、有其父,必有其子。-古人和现代人都这么说 2、“真的”,公爵夫人说:“火烈鸟和芥末都很刺鼻。那意思是说物以类聚。” “但芥末并不是鸟”,Alice说。 “是的,象往常那样,”公爵夫人说“你具有多么清晰的表达方式!” - Alice漫游奇境记,2019/4/19,统计学讲义 游士兵,3,一、基本问题 1、相关分析(correlation analysis) (1)什么是相关关系? 相关关系是指现象之间客观存在的非确定性的数量对应关系。,2019/4/19,统计学讲义 游士兵,4,(2)相关关系的种类,按相关关系涉及变量的多少,分: 单相关(又称一元相关) 复相关(又称多元相关) 按相关的表现形式,分: 线性相关 曲线相关,2019/4/19,统计学讲义 游士兵,5,按相关的方向,分: 正相关 负相关 按相关的程度,分: 零相关 低度相关 中度相关 显著相关 高度相关 完全相关,2019/4/19,统计学讲义 游士兵,6,2、回归分析 (regression analysis),(1)“回归”的词源 (2)相关分析与回归分析的区别和联系 区别:A、相关关系所研究的变量是对等关系,而回归分析所研究的变量不是对等关系,分为自变量和因变量; B、相关分析对资料的要求是两个变量都必须是随机变量,而回归分析中自变量是可以控制的变量(给定的变量),因变量是随机变量。 C、相关分析的目的是研究变量之间的相关方向、程度以及相关的表现形式是什么;而回归分析的目的是拟合变量之间的表现形式,(回归方程),并据此进行回归预测。,2019/4/19,统计学讲义 游士兵,7,联系:,A、相关分析是回归分析的基础和前提; (通过相关分析的结论,才能引入回归分析) B、回归分析是相关分析的深入和继续。 (通过回归分析的继续,最终达到对相关变量之间有关预测,并为管理决策服务),2019/4/19,统计学讲义 游士兵,8,3、本章主要内容,(1)相关系数(the correlation coefficient) (2)回归模型(the regression model) 一元线性回归模型 多元线性回归模型 可化为线性回归的曲线回归模型介绍 (3)估计标准误差(standard error of estimate),2019/4/19,统计学讲义 游士兵,9,二、相关系数 the correlation coefficient,1、相关系数的概念和种类 概念:相关系数是反映客观现象之间相关关系的方向和程度的统计分析指标。 种类:简单相关系数 偏相关系数 复相关系数 本章着重介绍简单相关系数,如果不作说明,相关系数往往指简单相关系数。,2019/4/19,统计学讲义 游士兵,10,2、相关系数的主要内容,(1)相关系数公式来源介绍 (2)相关系数的简捷计算公式:,2019/4/19,统计学讲义 游士兵,11,(3)相关系数的应用说明,相关系数是一个相对数,是一个抽象化的统计指标; 相关系数为正,表示X与Y为正线性相关;相关系数为负,表示X与Y为负相关; 相关系数的取值范围为:-1到1之间。 相关系数的绝对值的大小反映线性相关程度的高低,越接近1,表示线性相关程度越高,越接近0,表示线性相关程度越低。 一般来说:r的绝对值在0.3以下,为零相关 在0.3到0.6, 为低度相关 在0.6到0.9, 为显著相关 在0.9以上, 为高度相关,2019/4/19,统计学讲义 游士兵,12,(4)相关系数的应用举例,某企业资料如下: 月份 产量 生产费用 X2 Y2 xy (千吨)x (万元)y 1 1.2 62 1.44 3844 74.4 2 2.0 86 4.00 7396 172.0 3 5.0 115 25.00 13225 575.0 4 3.1 80 9.61 6400 248.0 5 3.8 110 14.44 12100 418.0 6 8.0 160 64.00 25600 1280.0 7 6.1 132 37.21 17424 805.2 8 7.2 135 51.84 18225 972.0 合计 36.4 880 207.54 104214 4544.6,2019/4/19,统计学讲义 游士兵,13,三、回归模型the regression model,(一)一元线性回归模型的性质 一元线性回归模型是用于分析一个自变量(X)与一个因变量(Y)之间线性关系的数学方程。其一般形式为: Yc=a+bx 式中:X是自变量, Yc是因变量Y的估计值,又称理论值。,2019/4/19,统计学讲义 游士兵,14,几点说明:,a和b通常称为回归模型的参数。 a是回归直线的截距,即X=0时Yc的起始值; b是回归直线的斜率,又称回归系数,表示自变量每增加或减少一个单位时, Yc的平均增减量。 回归直线表明的是两个变量之间的平均变动关系。 回归分析的主要目的是建立回归模型,借以给定X值来估计Y值。模型是否合适?估计的误差怎样?怎样进行判断和检验?都从回归模型的特点出发。,2019/4/19,统计学讲义 游士兵,15,(二)一元回归模型的确定,确定一元回归模型的关键是计算参数a和b 而求参数a和b的最佳方法是最小平方法 最小平方法的基本思想 (Y-Yc )=0 (Y-Yc)2=最小 最小平方法的标准方程式 Y=na+b x xy=ax+bx2,2019/4/19,统计学讲义 游士兵,16,应用举例:,某企业资料如下: 月份 产量 生产费用 X2 Y2 xy (千吨)x (万元)y 1 1.2 62 1.44 3844 74.4 2 2.0 86 4.00 7396 172.0 3 5.0 115 25.00 13225 575.0 4 3.1 80 9.61 6400 248.0 5 3.8 110 14.44 12100 418.0 6 8.0 160 64.00 25600 1280.0 7 6.1 132 37.21 17424 805.2 8 7.2 135 51.84 18225 972.0 合计 36.4 880 207.54 104214 4544.6,2019/4/19,统计学讲义 游士兵,17,解:根据上述标准方程有: 880=8a+b36.4 4544.6=a36.4+b207.54 解方程组,得到: a=51.323 b=12.896 则,产量和生产费用的回归直线方程为: Yc =51.323+12.896X,2019/4/19,统计学讲义 游士兵,18,(三)多元线性回归模型,多元线性回归模型是用于分析两个以上自变量与一个因变量之间线性关系的数学方程。其一般形式为: Yc= a+b1x1+b2x2+-+bnxn 对于有两个自变量的二元线性回归模型,有:Yc= a+b1x1+b2x2 式中: a为截距,b1和b2称为偏回归系数,其均有一定的统计含义,2019/4/19,统计学讲义 游士兵,19,多元回归模型的确定仍然按照最小平方法的原理得到求a和b1、 b2的标准方程组: Y=na+b1X1+b2X2 X1Y=aX1+b1X12+b2X1X2 X2Y=aX2+b1X1X2+b2X22 计算说明,2019/4/19,统计学讲义 游士兵,20,(四)可化为线性回归的曲线回归模型,在实际问题中,有时因变量和自变量之间的关系并非是线性形式,而是某种曲线,这时,就需要拟合适当类型的曲线模型,统计学上称为曲线回归模型。 统计学上通常采用变量代换法将曲线形式转换

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论