《统计学-基于Excel》(第 4 版)课件 第8章 相关与回归分析(Excel-4)_第1页
《统计学-基于Excel》(第 4 版)课件 第8章 相关与回归分析(Excel-4)_第2页
《统计学-基于Excel》(第 4 版)课件 第8章 相关与回归分析(Excel-4)_第3页
《统计学-基于Excel》(第 4 版)课件 第8章 相关与回归分析(Excel-4)_第4页
《统计学-基于Excel》(第 4 版)课件 第8章 相关与回归分析(Excel-4)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

贾俊平2025/4/10统计学—基于Excel(第4版)21世纪统计学系列教材课程内容描述统计、推断统计、其他方法使用软件Excel学分与课时

2或3学分,1~17周,每周2或3课时课程简介贾俊平2025/4/108.1相关分析与回归分析8.2一元线性回归模型的估计和检验8.3利用回归方程进行预测8.4残差分析第8章相关与回归分析问题与思考同一种商品在不同的电商平台上的销售价格也有差异,人们认为销售价格稍贵的电商配送速度更快,也就是配送时间更短。你认为销售价格和配送时间有关系吗?如果有关系,你知道它们的关系有多强呢?如果有人问你:身高和体重有关系吗?你的回答是什么?怎样让人信服你的回答?如果你想用收入来预测支出,你认为该怎么做?假定你的支出总是大于收入,用收入预测支出的结果是错误的吗?如果你支出的误差中只有45%是由收入决定的,你的预测是哪里出了问题?

8.1

相关分析与回归分析相关分析相关分析是回归建模的基础。在建立回归模型时,首先需要确定变量之间的关系,然后依据变量间的关系建立适当的模型相关分析(correlationanalysis)是对变量间关系形态和关系强度所作的分析,其内容主要包括:(1)变量之间是否有关系;(2)如果有,它们之间是什么关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系相关分析

8.1

相关分析与回归分析相关分析——散点图——例题分析【例8-1】

25家药品生产企业,得到它们的销售收入和广告支出数据。绘制散点图描述销售收入与广告支出之的关系。

8.1

相关分析与回归分析相关分析——关系强度的度量——相关系数——性质与解读度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为r也称为Pearson相关系数(Pearson’scorrelationcoefficient)样本相关系数的计算公式

性质1:r的取值范围是[-1,1]|r|=1,为完全相关;r=0,不存在线性相关关系-1

r<0,为负相关;0<r

1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱性质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx性质3:r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及计量尺度,并不改变r数值大小性质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意为着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系性质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系

8.1

相关分析与回归分析相关分析——相关系数——例题分析【例8-2】

沿用例81。计算销售收入与广告支出之的相关系数,并分析其关系强度

8.1

相关分析与回归分析回归模型与回归方程

模型假定——因变量x与自变量y之间为线性关系在重复抽样中,自变量x的取值是固定的,即假定x是非随机的误差项

满足正态性。是一个服从正态分布的随机变量,且期望值为0,即

~N(0,

2)。对于一个给定的x值,y的期望值为E(y)=

0+

1x方差齐性。对于所有的x值,

的方差一个特定的值,的方差也都等于2都相同。同样,一个特定的x值,y的方差也都等于

2独立性。独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关;对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关

8.2

一元线性回归模型的估计和检验参数的最小二乘估计

8.2

一元线性回归模型的估计和检验参数的最小二乘估计——例题分析——Excel输出

8.2

一元线性回归模型的估计和检验参数的最小二乘估计——例题分析——Excel输出预测结果残差图

8.2

一元线性回归模型的估计和检验模型的拟合优度——误差分解总平方和(SST—totalsumofsquares)反映因变量的n个观察值与其均值的总误差回归平方和(SSR—sumofsquaresofregression)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(SSE—sumofsquaresoferror)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和

8.2

一元线性回归模型的估计和检验模型的拟合优度——决定系数R方——估计标准误

标准误差——实际观察值与回归估计值误差平方和的均方根反映实际观察值在回归直线周围的分散状况对误差项

的标准差

的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量反映用估计的回归方程预测y时预测误差的大小计算公式为

8.2

一元线性回归模型的估计和检验模型的显著性检验——F检验——t检验

8.2

一元线性回归模型的估计和检验置信区间和预测区间

8.3

利用回归方程进行预测置信区间和预测区间——例题分析——Excel输出【例8-4】

沿用例8-1。求25家企业销售收入的95%的置信区间和预测区间

8.3

利用回归方程进行预测残差与标准化残差残差—因变量的观测值与预测值之差,用e表示反映了用估计的回归方程去预测而引起的误差可用于确定有关误差项

的假定是否成立标准化残差—残差除以它的标准差

8.4

残差分析残差分析——残差图

8.4

残差分析残差图——例题分析【例8-5】沿用例8-1。绘制25家企业销售收入预测的残差图,判断所建立的回归模型是否合理残差图显示,各残差基本上位于一条水平带中间,而且没有任何固定的模式,呈随机分布。这表明所尽力的销售收入与广告支出的一元线性回归模型是合理的,关于模型的各种假定也都是成立的

8.4

残差分析确定关系线性建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论