版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-6-11第五章第五章 相关分析相关分析2022-6-12第一节 相关分析概述2022-6-13一、相关关系的概念o社会经济现象之间的关系有两大类,一类是函数关社会经济现象之间的关系有两大类,一类是函数关系,一类是相关关系。系,一类是相关关系。o函数关系函数关系o相关关系:现象之间确实存在的、保龄球关系数值相关关系:现象之间确实存在的、保龄球关系数值不固定的相互依存关系。不固定的相互依存关系。o相关分析:对于若干变量之间相互关系密切程度的相关分析:对于若干变量之间相互关系密切程度的研究,称为相关分析。研究,称为相关分析。o回归分析:研究若干变量之间的方程式,给出自变回归分析:研究若干变
2、量之间的方程式,给出自变量一个数值以推断因变量的可能值,则称回归分析量一个数值以推断因变量的可能值,则称回归分析。2022-6-18相关关系产生的原因相关关系产生的原因o第一,受干扰的因果关系,第一,受干扰的因果关系,o第二,同一原因的诸多结果之间的关系第二,同一原因的诸多结果之间的关系o第三,因果关系不同而局部出现相同走势第三,因果关系不同而局部出现相同走势2022-6-19o相关关系的特点:相关关系的特点:o1、相关关系是指现象之间确实存在的相互、相关关系是指现象之间确实存在的相互依存关系。依存关系。o相关关系不是虚构的。相关关系不是虚构的。o2、现象之间的数量依存关系的具体关系值、现象之
3、间的数量依存关系的具体关系值是不固定的。是不固定的。o不如函数关系那么精确。不如函数关系那么精确。2022-6-110二、相关关系的种类二、相关关系的种类o1、按影响因素的数量不同,可分为单相关、复、按影响因素的数量不同,可分为单相关、复相关和偏相关。相关和偏相关。o单相关单相关:两个变量之间的相关关系。:两个变量之间的相关关系。o复相关复相关:3个或个或3个以上变量之间的相关关系(见个以上变量之间的相关关系(见P126)。)。o偏相关偏相关:在三个及三个以上的复相关变量中,若只反:在三个及三个以上的复相关变量中,若只反映其中两个变量的相关关系,而假定其他变量不变。映其中两个变量的相关关系,而
4、假定其他变量不变。o2、按相关关系表现形态分这线性相关和非线性相关。、按相关关系表现形态分这线性相关和非线性相关。o线性相关线性相关:诸变量之间的联系可以近似地表现为一条:诸变量之间的联系可以近似地表现为一条直线。直线。2022-6-111o非线性相关非线性相关:诸变量之间的联系可近似地表现为某:诸变量之间的联系可近似地表现为某种曲线方程的关系。种曲线方程的关系。o3、按现象变化的方向可分为正相关和负相关、按现象变化的方向可分为正相关和负相关o正相关正相关:两个变量按相同的方向变化,一个变量增:两个变量按相同的方向变化,一个变量增加(或减少),另一个变量也随着增加(或减少),加(或减少),另一
5、个变量也随着增加(或减少),这种相关关系称为正相关。这种相关关系称为正相关。o负相关负相关:两个变量按不同的方向变化,一个变量增:两个变量按不同的方向变化,一个变量增加(或减少),另一个变量却减少(或增加),这加(或减少),另一个变量却减少(或增加),这种相关关系称为负相关。种相关关系称为负相关。2022-6-112o4、按变量之间的相关程度可分为完全相关、按变量之间的相关程度可分为完全相关、不完全相关和零相关。不完全相关和零相关。o完全相关:就是函数关系。完全相关:就是函数关系。o零相关:两个变量之间,各自的变化是独立零相关:两个变量之间,各自的变化是独立的,互不影响,互不相干。的,互不影响
6、,互不相干。o不完全相关:介于上述两种情况之间的相关不完全相关:介于上述两种情况之间的相关关系称为不完全相关。关系称为不完全相关。2022-6-113三、相关分析的主要内容三、相关分析的主要内容o1、分析现象之间是否存在相关关系,以及、分析现象之间是否存在相关关系,以及相关关系的表现形式。相关关系的表现形式。o有无相关关系?是什么类型的相关关系?有无相关关系?是什么类型的相关关系?o2、确定相关关系的密切程度、确定相关关系的密切程度o可以通过图表和计算可以通过图表和计算相关系数相关系数判断判断o3、确定相关关系的数学表达式,以测定变、确定相关关系的数学表达式,以测定变量之间的一般关系值。量之间
7、的一般关系值。2022-6-114o4、测定因变量估计值的误差程度。、测定因变量估计值的误差程度。o计算计算估计标准误差估计标准误差,可测定因变量估计值与,可测定因变量估计值与实际值之间的差异程度,从而可以衡量一般实际值之间的差异程度,从而可以衡量一般关系值对实际问题代表性在大小。关系值对实际问题代表性在大小。2022-6-115第二节第二节 简单线性相关分析简单线性相关分析2022-6-116一、相关图表的编制一、相关图表的编制o(一)相关表(一)相关表o相关表是根据相关资料编制出反映变量之间相关表是根据相关资料编制出反映变量之间相关关系的统计表。相关关系的统计表。o1、简单相关表、简单相关
8、表o简单相关表是资料未曾分组,只将自变量的简单相关表是资料未曾分组,只将自变量的变量值按照从小到大的顺序并配合因变量的变量值按照从小到大的顺序并配合因变量的变量值一一对应而平行排列在一张表格上,变量值一一对应而平行排列在一张表格上,以观察相关关系。以观察相关关系。o例如:例如:P127表格表格。2022-6-117o2、分组相关表、分组相关表o在简单相关表的基础上,将相关资料加以分组,排在简单相关表的基础上,将相关资料加以分组,排列在一张表格上,以观察相关关系。列在一张表格上,以观察相关关系。o(1)单变量分组相关表)单变量分组相关表o它是将自变量分为若干组并计算各组次数,而因变它是将自变量分
9、为若干组并计算各组次数,而因变量不分组,只计算相应平均值的一种相关表。量不分组,只计算相应平均值的一种相关表。o这种分组表与简单相关表相比,能清楚地表明变量这种分组表与简单相关表相比,能清楚地表明变量之间的相关关系。之间的相关关系。o例如:例如:P127表格表格。2022-6-118o(2)双变量分组相关表。它是对自变量和)双变量分组相关表。它是对自变量和因变量都进行分组而制成的相关表因变量都进行分组而制成的相关表。oP128。o(二)相关图(二)相关图o相关图又称散点图或散布图,它是利用直角相关图又称散点图或散布图,它是利用直角坐标第一象限,把反映现象之间相互关系的坐标第一象限,把反映现象之
10、间相互关系的有关资料用相应的坐标点描绘出来,以表明有关资料用相应的坐标点描绘出来,以表明相关点分布状况的图形。相关点分布状况的图形。2022-6-119o相关图与相关表的作用相同,都是判断两个相关图与相关表的作用相同,都是判断两个变量之间是否存在相关关系以及相关关系的变量之间是否存在相关关系以及相关关系的类型。但相关关系的程度必须计算相关系数类型。但相关关系的程度必须计算相关系数才能判断。才能判断。2022-6-120散点图(scatter diagram)2022-6-121散点图(例题分析)o【例】【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固
11、定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 2022-6-122散点图(例题分析)2022-6-123散点图(例题分析) 不良贷款与贷款余额的散点图024681012140100200300400贷款余额不良贷款不良贷款与贷款项目个数的散点图02468101214010203040贷款项目个数不良贷款不良贷款与固定资产投资额的散点图02468101214050100150
12、200固定资产投资额不良贷款 不 良 贷 款 与 累 计 应 收 贷 款 的 散 点 图024681 01 21 401 02 03 0累 计 应 收 贷 款不良贷款2022-6-124二、相关系数的计算二、相关系数的计算o相关系数:它表明现相关系数:它表明现象之间相关关系的相象之间相关关系的相对密切程度。对密切程度。o(一)相关系数的一(一)相关系数的一般公式般公式的协方差与变量也称为变量的平均数代表两个变量离差乘积yx,yynxxnyyxxnrxyyxxy2222)(1)(1)(12022-6-125因此,相关关系可表述为:的标准差之乘积标准差与变量变量的协方差与变量变量相关系数yxyx2
13、022-6-126相关系数 (计算公式)o 样本相关系数的计算公式22)()()(yyxxyyxxr2222yynxxnyxxynr2022-6-127o上述公式表明,在直线相关的情况下,协方上述公式表明,在直线相关的情况下,协方差为正值时,相关系数也为正值,表示正相差为正值时,相关系数也为正值,表示正相关;协方差负值时,相关系数也为负值,表关;协方差负值时,相关系数也为负值,表示负相关;协方差为示负相关;协方差为O时,表示两个变量不时,表示两个变量不相关。相关。2022-6-128相关系数大小的含义相关系数大小的含义o0.30以下关系微弱;以下关系微弱;o3-0.5低度相关低度相关o0.5-
14、0.8显著相关显著相关o0.8以上高度相关以上高度相关2022-6-129第三节 一元线性回归分析2022-6-130一、回归分析的概念和种类o相关分析解决了变量之间有无关系和关系密切程度的问题,但变量之间具体的数值关系没有解决。这一问题留给了回归分析。o回归分析:把具有相关关系的两个或两个以上变量之间的变动加以模型化,求出回归方程,以便进行估计或预测的统计方法。o从变量的数量分:一元和多元回归。o从回归的形式分:线性和非线性回归。o重点关注线性回归。2022-6-131一、一元线性回归o(一)一元线性回归分析的特点o这些特点是在与相关分析的比较中得出的:o1、两个变量之间不是对等关系。必须确
15、定自变量和因变量。o2、在没有明显的因果关系的两个变量x和y之间可以求得两个回归方程,而相关系数只有一个。o3、回归方程可以用于推算或估计具体的数值,而象相关系数那么抽象。o4、回归系数与相关系数有内在联系。o5、资料要求不一样。2022-6-132o(二)一元线性回归方程(二)一元线性回归方程o方程基本形式:方程基本形式:oa,c为直线的起点值,数学上为截距;为直线的起点值,数学上为截距;ob,d为回归系数。数学上为斜率。为回归系数。数学上为斜率。oa,c, b,d都叫待定参数。根据实际资料求出参数值后,都叫待定参数。根据实际资料求出参数值后,变量之间的一般关系的回归直线就确定下来了。变量之
16、间的一般关系的回归直线就确定下来了。:yxyabxxyxcdy倚 回归方程倚 回归方程2022-6-133o求解参数的最常用的方法是最小平方法求解参数的最常用的方法是最小平方法o解释为什么用这种方法求参数。解释为什么用这种方法求参数。2022-6-134参数的最小二乘估计最小niiiniiibxayyy1212)()(01xy10 xbyaxxnyxyxnbniniiiniiniiniii1212111ba018295. 0268.120037895. 0728. 3037895. 07 .300637.516543252 .937 .300614.17080252abb2022-6-139估
17、计方程的求法(例题分析)o不良贷款对贷款余额回归方程的图示不良贷款对贷款余额的回归直线不良贷款对贷款余额的回归直线-2024681012140100200300400贷款余额不良贷款2022-6-140三、估计标准误差v利用回归方程可以推断因变量的值。这个值是利用回归方程可以推断因变量的值。这个值是许多可能数值中的平均值。回归线就是一条平许多可能数值中的平均值。回归线就是一条平均线,要说明它的代表性需要计算估计值的标均线,要说明它的代表性需要计算估计值的标准误差。准误差。v估计标准误差:又称回归标准差,是指实际值估计标准误差:又称回归标准差,是指实际值 与估计值与估计值 的平均离差。的平均离差
18、。v估计标准误差的大小的含义(解释)。估计标准误差的大小的含义(解释)。yy2022-6-141估计标准误差的计算公式2()1.2yxy ySnn为 因 变 量 的 项 数 ,n-2为 自 由 度在 简 单 线 性 回 归 中 ,参 数 是 a,b两 个 ,所 以 由 n-2表 示表 示 估 计 回 归 线 时 已 经 推 动 了 两 个 自 由 度在 参 数 不 只 两 个 时 ,自 由 度 为 n-m-1(m为 自 变 量 的 数 目 )2022-6-142举例序号xy1234567891096.8109.06116.85125.59136.34153.84175.42187.81206.
19、12233.6440.4947.7352.1354.7558.9969.6279.4481.0689.90101.3642.5147.8751.2855.1059.8167.4676.9082.3190.32102.36-1.57-10140.85-0.35-0.822.162.54-1.25-0.42-12.46490.01960.72250.12250.67244.66566.45161.56250.17641合计1514.47675.92-17.8580.18021 0.43731yxyy2()yy2022-6-1435 . 125 . 12) (2nxybyaysnyysyy2022-
20、6-144估计标准误差的作用o第一,用来衡量回归模型的拟合优度(有效第一,用来衡量回归模型的拟合优度(有效程度)程度)o第二,用来对实际的值第二,用来对实际的值Y落到估计值周围的落到估计值周围的区间做出一个大概的说明。区间做出一个大概的说明。o实际上,实际值落在估计值加减一个标准误实际上,实际值落在估计值加减一个标准误差范围内的概率有差范围内的概率有68.27%;落在估计值加落在估计值加减减2个标准误差范围内的概率有个标准误差范围内的概率有95.45%;落在估计值加减落在估计值加减3个标准误差范围内的概率个标准误差范围内的概率有有99.73%.2022-6-145四,可化为线性回归的非线性回归o1、指数函数o2、幂函数o3、双曲函数o4、对数函数o5、S型曲线oP139-1412022-6-146五,相关分析与回归分析的特点o1、注意现象质的界限及相关关系作用的范、注意现象质的界限及相关关系作用的范围围o2、计算相关系数时,两个变量不必区分自、计算相关系数时,两个变量不必区分自变量与因变量,但在回归分析时,必须区分变量与因变量,但在回归分析时,必须区分自变量与因变量自变量与因变量o3、相关系数表示的是变量之间关系的紧密、相关系数表示的是变量之间关系的紧密程度,回归分析能反映变量之间的相互影响程度,回归分析能反映变量之间的相互影响关系和数量规律性关系和数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年中耳癌靶点检测用药避坑指南
- 26年靶向治疗继发肿瘤随访
- 晨会防火安全教育
- 髌骨骨折健康教育
- 典型教育主题班会教案设计
- 会员积分兑换活动方案
- 2026护理学会胰岛素皮下注射团体标准解读
- 春季主题营销活动方案
- 老年公寓设计项目规划方案
- 理想交付流程
- 2026年滁州凤阳大明旅游发展(集团)有限公司招聘导游员(讲解员)15名笔试备考题库及答案详解
- T∕SZSSIA 019-2026 反恐怖防范管理规范 总则
- 江苏苏豪控股集团秋招面笔试题及答案
- 24J113-1 内隔墙-轻质条板(一)
- 药食同源食品管理办法实施细则
- 律师事务所内部惩戒制度
- 校园校园环境智能监测系统方案
- (2025年)资阳市安岳县辅警考试公安基础知识考试真题库及参考答案
- 政治监督培训课件模板
- 桥架培训课件
- 地球概论PPT完整全套教学课件
评论
0/150
提交评论