统计学七相关与回归分析PPT课件_第1页
统计学七相关与回归分析PPT课件_第2页
统计学七相关与回归分析PPT课件_第3页
统计学七相关与回归分析PPT课件_第4页
统计学七相关与回归分析PPT课件_第5页
已阅读5页,还剩118页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章关联和回归分析,制作时间:2004-2005,内容摘要,1,相关关系概念和类型2,相关分析3,一元线性回归分析4,多线性回归分析5,曲线回归分析,学习目标,1。了解相关关系的概念确定线性回归的基本原理和参数的最小二乘估计确定回归线的拟合度确定回归方程的显著性测试确定使用回归方程的估计和预测Excel进行回归分析,第一节相关性概述,一个,变量之间的关系,(a)函数关系在一个对应决策关系中有两个变量x和y,变量y随变量x变化,完全依赖于x。变量x获取数值时,y是x的函数,并将其记录为y=f (x)。其中x为收购,y为函数关系,根据变量,每个观察点位于一条线上(几个实例),函数关系的实例可以用

2、y=px (p为单价)圆表示商品销售y与销售x之间的关系s=R2企业的原材料冲减金额y与生产x1、产量冲减x2、原材料价格x3之间的关系y=x1 x2(b)变量之间的关系不能用函数关系准确表示的关系(correlation),一个变量的值不能由另一个变量唯一确定变量x取值时,变量y的值会分布在线周围,相关关系(几个例子),相关关系的例子父亲键y与子女键x的关系收入水平y与教育程度x的关系样式无产量y与肥料量x1,降雨量x2 气温x3之间的关系商品消费y和居民收入x的关系商品销售y和广告费支出x的关系,第二,相关关系的种类,单管,1,相关形式:线性相关,非线性相关,2,正在研究的变量数分为: 复

3、合关联,3,按相关方向划分:正关联,负关联,4,按相关程度划分:完全关联,不完全关联,部分关联,散点图,3,相关关系分析方法,2、是回归分析的基础。3、分析方法主要包括绘制散点图、准备相关表、计算项关系数等。(b)回归分析(Regression)调查具有相关关系的变量值之间的常规数量更改关系,即参数更改时变量的平均更改程度。建立回归方程式以完成分析。回归方程不仅可以用于研究相关变量之间的一般数量波动关系,还经常用于预测或控制基于一个或多个变量的值的其他相关变量的值的预测,用于说明此预测或控制的准确性,回归模型的类型,(3)回归分析和相关分析的差异,主要用于说明两个变量之间线性关系的接近性。回归

4、分析可以由回归方程预测和控制,以及变量之间的一般数量波动关系。在相关分析中,变量x变量y处于等效位置。在回归分析中,变量y称为原因变量,位于解析的位置,x称为参数,用于预测与变量更改相关的分析中涉及的变量x和y都是随机变量。在回归分析中,变量y是随机变量,参数x可以是随机变量或非随机确定变量,第二部分相关分析,1,相关表和相关图形,相关表和相关图形(概念点),1,相关表和相关图表是研究相关关系的直观工具。一般来说,在进行详细的定量分析之前,可以利用它们大致判断现象之间存在的相关关系的方向、形态和密切程度。2、相关表是反映变量之间相关性的统计表。根据一个变量的值的大小排列一个变量,然后并行排列与

5、该变量相关的其他变量的对应值,就可以得到一个简单的相关表。3、相关图表,也称为散点图。正交坐标系的水平轴显示变量x,垂直轴显示变量y,两个变量之间对应变量的值显示为坐标点,从而反映两个变量之间的相关性的图形。相关表(实例分析)、居民收入和消费的原始数据计量单位:100元,居民消费和收入相关表计量单位:100元,分散(实例分析),实例大型商业银行在多个地区设有分行,其业务主要是基础设施建设、国家核心项目建设、固定资产投资等项目近年来,该银行的贷款额持续增加,但不良贷款额也大幅度增加,给银行业务发展带来了巨大压力。为了确定不良贷款的发生原因,利用有关银行业务的资料进行了一些定量分析,探讨了对不良贷

6、款的控制方案。以下是2002年银行所属的25家分行的业务数据、分布式(案例分析)、分布式(案例分析)、ii、相关系数和检查以及相关系数。衡量变量之间关系密切程度的值(指标)衡量两个变量之间的线性相关程度称为单个相关系数。相关系数如果根据整个数据计算,则称为整体相关系数;如果根据样本数据计算,则称为样本相关系数、r、相关系数(计算公式)、样本相关系数的计算公式或减少,以及相关系数(值及其含义)。r的范围包括-1,1 |r|=1、完全相关r=1、完全正相关r=-1、完全负正相关r=0、线性无关-1 r0、负相关0t、H0拒绝TT(25-25 样本、(a)一元线性回归函数和模型的数学表达式,其中0是

7、y轴上回归线的截骨,x=0点y的期望值。 1是直线的斜率,称为回归系数,表示每次x变化一个单位时y的平均变化值。、(2)一元线性回归函数对模型意义的图形解释,(3)一元线性回归模型的基本假设,1 .错误项u是估计值0的正态分布随机变量,即2 .对于所有x值,u的方差2相等。也就是说3。对于特定x值,该u与其他x值对应的u无关。也就是说,4 .对于特定的x值,该y值与其他x对应的y值无关:、x、y、x1、x2、x3示例循环基于示例数据进行拟合,每次提取每个示例时,可以拟合一条循环线。2,整个回归方程的参数未知,但确定。样本回归方程的参数是取决于样本的随机变量。3、整个回归模型的ui是Yi和整个回

8、归线(由于变量实际观测)之间的垂直距离,不能直接观测。在范例回归模型中,ei是Yi和范例回归线之间的垂直距离,该距离可在根据范例资料拟合范例回归线时计算ei的特定值。第二,模型参数的估计,(a)回归系数的估计-允许变量的观察和估计值的偏差最小化求和的方法的最小二乘估计。即,x和y之间的关系和表示实际数据误差的最小二乘法估计(图)、最小二乘法(和的计算公式)、根据最小二乘法要求求解的和公式查找最小二乘法(案例分析)、错误贷款贷款馀额的回归(方程)函数,回归方程为y=-0.8295.037895s越小,回归线的代表性越强。否则,则相反。除了,1和2之外,一元线性回归模型还包含另一未知参数,该参数是

9、整个随机误差项的方差K5;2可以反映理论模型误差的大小,这是测试模型时必须使用的重要参数。由于不能直接观察K使用Excel进行回归分析,步骤1:选择工具下拉菜单步骤2:选择数据分析选项步骤3:在分析工具中选择回归。然后选择“确定”(ok)步骤4。显示对话框时,在“设置y值输入区域”框中输入y的“数据区域x值输入区域”“设置输入区域”框中输入x的“数据区域置信度”选项中提供所需的数值在“输出选项”下,从“输出区域选择残差分析选项”中选择所需的选项,以使用Excel进行回归分析,如果它们不符合实际科学的理论及人们的实践经验,说明模型不能很好地说明现实。原因可能是样品太小,不能代表标准回归分析所需的

10、前提条件。2、统计检验(第一次检验)统计测试是在统计中使用抽样理论测试样本回归方程的可靠性,包括适用性测试和显著性检验。统计检查是所有现象在进行回归分析时必须经过的检查。3、计量经济学检查(二次检查)计量经济学检查是检查标准回归方程的假设条件是否满足。(a)模型测试的内容,(b)模型拟合度测试,即样本回归方程的样本观测的代表性大小。测量此问题的指标称为确定系数,数学表达式包括:(regression sum of square),(resdual sum of square),(total deviation sum of square),(total deviation sum of squ

11、are)因为变量y的值不同,所以y值的这种变化称为变化。变形来自x对y的非线性影响、测量误差等非x因素的两个方面对特定观测值的影响,以及实际观测值和相应平均值之间的差异引起的波动分解(图标)、偏差平方和分解(3平方和关系)、偏差平方和分解(3平方和意义)、 total decimation(SST)反映变量的n次观测值及其平均值的总偏差回归平方和(SSR),反映参数x随变量y值的变化而发生的变化,或x和y之间的线性关系导致的y值的变化。可解释平方和残差求和(SSE)反映除x之外的其他因素对y值的影响。 也称为未解释平方和或剩余平方和,2,确定系数R2的特性,(1)非负(2) R2的值越接近1,

12、SSR越接近SST。也就是说,说明回归方程与实际观测的拟合程度。否则,反之亦然。(3)可确定系数是样品观测的函数,也是随机变量。(4)晶体系数的平方根是相关系数,公式为:确定系数R2(案例分析),是计算贷款馀额回归的不良贷款的确定系数,其含义确定系数的实际含义如下:在不良贷款价值变动中,71.16%可能是不良贷款馀额和贷款馀额之间的线性关系,也可能是不良贷款金额变动中的71.16%由贷款馀额决定。也就是说,不良贷款购买金额的三分之二以上将决定为贷款馀额。坏账与贷款余额之间有很强的线性关系,(c)显著性检查,显著性检查(概念要点),回归分析中显著性检查包括两个方面。一、各回归系数的显著性检验;回

13、归系数的显著性检查一般使用t测试,第二种使用整个回归方程的显著性测试。回归方程的显著性检验是基于方差分析的f检验。在一元线性回归模型中,只有一个参数x,因此=0的t检查与整个方程的f检查相同。因此,这里仅介绍回归系数的显著性检查,并在多元统计分析中介绍回归方程的显著性检查。(c)回归系数检查、回归系数检查(概念要点)、2。检查x和y之间是否存在线性关系,或检查参数x对变量y的影响是否显着,3 .理论基础是回归系数的取样分布,1 .基于样本估计结果,假设整体回归系数为0的测试。回归系数的测试(样本统计的分布)是基于最小二乘法的样本统计,正态分布数学期望值:标准差:未知,因此需要估计sy代替结果估计的标准差,回归系数检查(检验阶段)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论