《统计学原理与实务(第三版)》课件 第6章 相关与回归分析_第1页
《统计学原理与实务(第三版)》课件 第6章 相关与回归分析_第2页
《统计学原理与实务(第三版)》课件 第6章 相关与回归分析_第3页
《统计学原理与实务(第三版)》课件 第6章 相关与回归分析_第4页
《统计学原理与实务(第三版)》课件 第6章 相关与回归分析_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Statistics第6章相关与回归分析2第一节相关分析

一、相关分析的意义二、相关关系的测定3联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率

事物相互间关系的质的解释:自然的、社会的、经济的、心理的…

事物相互间关系的量的分析:两变量或多变量间的数量关系。在可以解释的质的关系基础上进行相关分析和回归分析4一、变量间的关系变量间的关系有两种类型:

函数关系相关关系5

是一一对应的确定关系。设有两个变量x和y,变量y完全依赖于x

,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量。各观测点都严格落在一条线上。函数关系圆的面积(S)与半径之间的关系可表示为S=

R2

;某种商品的销售额(y)与销售量(x)之间的关系可表示为y=p

x(p为单价)6

变量间确实存在的、但数量上不固定的相互依存的关系。这种关系不能用函数关系精确表达;一个变量的取值不能由另一个变量惟一地确定;当变量x取某个值时,与之相关的变量y的取值可能有若干个;各观测点分布在一条直线或曲线周围.相关关系7

商品的消费(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度之间的关系(x)

父亲身高(y)与子女身高(x)之间的关系

……相关关系的例子8区分相关关系与函数关系相关关系与假相关

——没有本质联系,只是表面数字的偶然的巧合;如上证指数与气温的关系相关关系与因果关系因果关系属于相关关系相关关系不一定是因果关系。9二、相关关系的类型1、按相关关系涉及的因素多少分为:单相关——一元相关,两变量间的相关关系;复相关——多元相关,三个(或以上)变量间的相关关系2、按相关的表现形态分为:直线相关——观察点的分布大致呈现为一条直线;曲线相关——观察点的分布大致呈现为一条曲线10(续)3、按相关方向分为:正相关——两变量大体上呈同方向变化;负相关——两变量大体上呈反方向变化。11三、相关关系的测定进行相关分析的一般程序:定性分析定量分析相关表和相关图计算相关系数与判定系数12(一)相关表和相关图——称为散点图。一对数据对应坐标图上一个点,将成对的观察数据表现为坐标图的散点而形成的图。相关表——将一个变量按大小顺序排序,另一个变量对应排列而成的表格。相关图编制相关表、图的意义——有助于分析者判断相关的有无、方向、形态、密切程度。13相关关系的图示完全正线性相关

完全负线性相关

负线性相关

正线性相关

不相关

非线性相关14(二)相关系数correlationcoefficient是对变量之间关系密切程度的度量;相关关系(Pearson)的计算公式或化简为例1:已知某企业2022年在10个地区的销售情况与广告支出情况,请两者之间的相关系数。15第1步:绘制散点图16第2步:计算相关系数1718相关系数取值及其意义

r

的取值范围是[-1,1]|r|=1,为完全相关;r=1,为完全正相关r=-1,为完全负相关

r

=0,不存在线性相关关系;-1

r<0,为负相关;0<r

1,为正相关19|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切。20第二节一元线性回归分析SimpleLinearregression21——通过一个或几个变量的变化去解释另一变量的变化。包括找出自变量与因变量、设定数学模型、检验模型、估计预测等环节。一、回归分析(regression)概述回归分析(regression)回归:向平均水平退回regression1877年弗朗西斯•高尔顿爵士遗传学研究回归线平均身高23

自变量(independentvariable):解释变量,给定的或可以控制的、用来解释、预测应变量的变量。

因变量(dependentvariable):响应变量,由自变量来解释其变化的变量。XYXY••••••••24二、一元线性回归方程的确定具有线性相关关系的两个变量的关系可表示为:

y=α

+b

x+e线性部分反映了由于x的变化而引起的y的变化.误差项

是随机变量;反映了除x和y之间的线性关系之外的其他因素对y的影响参数误差项假定:E(

)=025一元线性(总体)回归方程的形式如下

E(y)=α

+

x方程的图示是一条直线,因此也称为直线回归方程α是回归直线在y轴上的截距,是当x=0时y的期望值,是回归直线是起始值;

是直线的斜率,表示当x每变动一个单位时,y的平均变动值。26用样本数据来估计总体参数以样本统计量估计总体参数27估计参数的最小二乘法1.最小二乘法——使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法,即:2829a和b

的计算公式根据最小平方法的原则,利用微分求解极值(最优值)的原理,可得求解a

和b

的标准方程组如下:30学生身高x体重yABCDEFGHIJ15816016216416616817017217417647504855626052617065

1670570例子31x2y2xy2496425600262442689627556282242890029584302763097622092500230430253844360027043721490042257426800077769020102921008088401049212180114402792203303295546322.回归系数与相关系数同号(从二者的计算公式可推导它们之间的关系):1.样本回归直线必定经过各散点的中心:说明33回归估计标准差反映的是因变量各实际值与其回归估计值之间的平均差异程度;是实际观察值与回归估计值离差平方的平方根;计算公式如下:一、回归估计标准误差Se第三节回归估计的评价

分母之所以是(n-2),而不是n,是因为根据样本资料用最小平方法求参数α和β时,受两个标准方程的约束,失去了两个自由度。343435回归估计标准差的作用其值越小,估计值(或回归方程)的代表性越强,用回归方程估计或预测的结果越准确。反映实际观察值在回归直线周围的分散状况;说明了回归直线的拟合程度(衡量回归方程的代表性,测定回归估计的精度);36二、判定系数

对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示。变差来源于两个方面:1、由于自变量x的取值不用造成的;2、除x以外的其他因素(包括x对y的非线性影响、测量误差等)的影响。(一)变差或离差37离差的分解图xyy{}}

a

+bx382.两端平方后求和有:从图上看有:总变差=回归变差+剩余变差记为:SST=SSR+SSE或Lyy=U+Q总变差平方和(SST)回归平方和(SSR)残差平方和(SSE){{{39(SST-Sumofsquaresoftotal)反映因变量的n个观察值与其均值的总离差总离差平方和SST(SSR-Sumofsquaresofregression

)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化。回归平方和SSR(SSE-Sumofsquaresoferrors

)反映除x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论