版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节相关分析概述一、相关关系的概念在自然界和社会现象中,任何事物都不是孤立的,而是普遍联系和相互制约的。这种相互联系、相互依赖、相互制约的关系就是事物或现象之间的相互依存关系。所有现象之间的依存关系可以分为两种不同的类型。(一)函数关系函数关系反映现象之间存在着严格的、确定的相互依存关系。在这种关系中,对于某一变量的每一数值,都有另一变量的确定的值与之相对应,并且这种关系可以用一个数学表达式反映出来。例如,S=πR2,这里圆的面积是随半径大小而变动的。自然界和社会现象中,广泛存在着函数关系。下一页返回第一节相关分析概述(二)相关关系相关关系反映现象之间确实存在的,而数量关系不严格、不确定的依存关系。理解相关关系要把握以下两个要点:(1)相关关系是现象之间确实存在着数量上的相互依存关系。两个现象之间,一个现象发生了数量上的变化,另一个也必然发生相应的变化。(2)现象之间的依存关系不是确定的和严格的,就是对现象的一个标志值,可以有若干的变量与之相对应。上一页下一页返回第一节相关分析概述(三)相关关系和函数关系的关联和区别如前所述,相关关系和函数关系的区别在于相关关系是现象间存在的一种不确定的、不严格的数量关系,而函数关系是现象之间存在的一种确定的、严格的数量关系。但同时它们之间也是有联系的,可以相互转化。二、相关关系的种类根据相关关系的现象之间的不同特征和研究方法,相关关系可分成以下几类:(1)按照相关关系涉及变量(或因素)的多少,相关关系可分为单相关和复相关。单相关又称一元相关,是指两个变量之间的相关关系。复相关又称多元相关,是指三个或三个以上变量之间的相关关系。上一页下一页返回第一节相关分析概述(2)按照相关关系的表现形式不同,相关关系可分为直线相关和曲线相关。直线相关又称线性相关,是指当一个变量变动时,另一变量随之发生大致均等的变动。从图形上看,其观察点的分布近似地表现为一条直线,如图9-1所示。曲线相关又称非线性相关,是指当一个变量变动时,另一变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等,如图9-2所示。上一页下一页返回第一节相关分析概述(3)按照相关现象变化的方向不同,相关关系可分为正相关和负相关。正相关是指当一个变量的值增加或减少,另一个变量的值也随之增加或减少,如工人劳动生产率提高,产品产量也随之增加,如图9-1所示。负相关是指当一个变量的值增加或减少时,另一变量的值反而减少或增加,如商品流转额越大,商品流通费用率越低。又如劳动生产率提高,生产单位产品所耗时间则减少,如图9-2所示。(4)按照相关的程度不同,可分为不相关、完全相关和不完全相关。不相关是指如果两个变量的彼此数量关系完全独立,则这种关系称为不相关,如图9-3所示。完全相关是指如果一个变量的变化完全由另一个变量的数量变化所决定,则两个变量之间的关系称为完全相关。这种情况实际是一种函数关系。上一页下一页返回第一节相关分析概述三、相关分析与回归分析的基本内容相关分析与回归分析是研究相关关系的重要手段。相关分析与回归分析的内容如下:第一,判断现象间是否存在相关关系,相关关系的表现形式如何。对现象间是否存在相关关系的判断取决于现象间是否的确存在着本质的客观联系,这往往通过定性分析得知,而不能仅从数量变化表面存在着依存关系而下结论,否则会得到虚假相关。如随着时间的变化,人们对粮食品种不断改良,粮食产量增加,但粮食产量与时间之间实际并不存在相关关系。通过对现象数量变化特征的分析,可以判断线性相关与曲线相关。上一页下一页返回第一节相关分析概述第二,确定相关关系的密切程度。统计学中利用相关系数测定现象间相关关系的密切程度。变量间的相关密切程度越高,它们之间的关系越重要;反之,变量间的相关密切程度越低,则它们之间的关系越不重要。第三,选择合适的数学模型,用此模型近似描述现象间数量上的对应关系。如果现象间呈线性相关,则建立线性模型;如果现象间呈曲线相关,则建立曲线模型。第四,测定数学模型的准确性。根据相关变量间数量上的对应关系建立的数学模型是近似的,需要对此模型的准确性进行测定。测定的方法之一是计算估计标准误差。上一页返回第二节相关关系的测定一、相关关系的判断相关关系的一般判断:在进行相关分析之前,首先要分析现象之间是否存在相关关系,当现象之间确实存在相关关系时,才有进一步分析的必要,这一过程叫作定性分析。定性分析只能依靠研究者的理论知识、专业知识和实际经验来进行。在定性分析的基础上,编制相关表,绘制相关图,有助于直观地分析判断现象之间的相关关系的密切程度和表现形式。相关表是一种反映变量之间相关关系的统计表。将某一变量值按其取值的大小排列,然后再将与其相关的另一变量的对应值对应排列,便可以得到相关表。通过相关表可以初步看出相关关系的形式、密切程度和相关方向。下一页返回第二节相关关系的测定相关图也称散点图,是根据原始资料,利用直角坐标系第一象限,将两个变量相对应的变量值用坐标点的形式标明,用来反映两变量之间相关关系的图形。根据表9-1的资料绘制的相关图如图9-4所示。其大致呈现直线上升趋势,可以说明广告费和销售额之间呈现正的线性相关,如图9-4所示。相关表和相关图虽然可以帮助我们对变量之间的相关关系做出一般性的判断,但只是大体的初步判断,不能明确地反映出变量之间相关的密切程度。在相关分析中,相关系数是测定两个变量之间是否存在直线相关以及直线相关密切程度、相关方向的重要的分析指标。上一页下一页返回第二节相关关系的测定二、相关系数相关系数是在直线相关条件下,说明两个变量之间直线相关密切程度的统计分析指标。相关系数通常用r表示。相关系数的定义公式为上式可以简化为上一页返回第二节一元线性回归分析一、回归分析的概念和特点(一)回归分析的概念“回归”(Regression)一词源于19世纪英国生物学家葛而登(FrancisGalton,1822—1911年)在对人体遗传特征进行试验研究时的发现:个子高的父母,其子女身高也会偏高;而个子矮的父母其子女身高则会偏矮,但人类的身高却没有因此出现两极分化的现象,而是趋于一个平均高度。在生物遗传学中把这种现象称为“回归”。统计学中借用了这一概念,来表示现象之间的依存关系并加以应用,形成了一套有独特理论和方法体系的回归分析。下一页返回第二节相关关系的测定回归分析就是对具有相关关系的变量之间关系形式的确定,借助一个数学关系式,把具有变量之间的相关关系表现出来,来近似地表示变量之间的平均变化关系的一种统计分析方法。它实际上是现象之间相关关系的一般化和规则化。根据变量值的相关关系种类和形式,配合适当的线性或非线性数学方程式,这种方程式称为回归方程。回归分析的内容很多,按变量的多少分为一元回归分析和多元回归分析;按分析变量之间的相关关系表现形式不同,分为线性回归分析和非线性回归分析。我们在本章中只介绍最简单的一种回归分析方法,即一元线性回归分析。上一页下一页返回第二节相关关系的测定(二)回归分析与相关关系的区别和联系1.回归分析与相关分析的区别(1)相关关系所研究的两个变量之间是对等关系;回归分析的两个变量不是对等关系,必须根据研究目的,先确定哪一个是自变量,哪一个是因变量。(2)对于变量x和y来讲,相关分析只能计算出一个相关系数,改变x和y的位置,并不改变相关系数的数值;回归分析则要根据研究目的,分别确定两个方程。一个是以x为自变量,y为因变量的“y倚x回归方程”;另一个是以y为自变量,x为因变量的“x倚y回归方程”。(3)在相关分析中要求两个变量都是随机变量;在回归分析中,自变量是给定的,而因变量是随机变量。上一页下一页返回第二节相关关系的测定2.回归分析与相关分析的联系(1)相关分析是回归分析的基础和前提。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归分析的结果越可靠。因此,相关系数是判定回归效果的一个重要依据。(2)回归分析是相关分析的深入和继续。相关分析只是说明现象之间有相关关系,只有通过回归分析,拟合回归方程,才能通过现象之间的相关关系进行回归预测,这样相关分析才有实际意义。上一页下一页返回第二节相关关系的测定二、一元线性回归分析通过相关系数,只能了解自变量和因变量之间相关关系的密切程度和方向,但是不能通过自变量的变化来推测因变量的变化。为了根据某一变量的数值来推断另一变量的数值,就需要进行回归分析。进行一元线性回归分析,需要借助一元线性回归模型。一元线性回归模型又称简单直线回归模型,是根据两个存在线性相关关系的变量数据,借助于直线方程式,根据自变量的变动,来推测因变量的变动,这个直线方程式称为一元线性回归方程。上一页下一页返回第二节相关关系的测定设自变量为x,因变量为y,且x与y之间存在着线性相关关系,则一元线性回归模型的基本形式为y^=a+bx(9-5)式中,y^表示因变量的估计值或称理论值;x表示自变量;a和b表示待定参数,其中a表示直线方程在纵轴上的截距,是自变量为零时因变量的估计值;b表示直线方程的斜率,称为回归系数,表示自变量每变动一个单位,因变量的平均增加(减少)值。配合直线方程的方法,统计中使用最多的方法是最小二乘法,又称最小平方法。上一页下一页返回第二节相关关系的测定三、估计标准误差(一)估计标准误差的概念根据自变量的数值,通过一元线性回归方程y^=a+bx,就可以把因变量的估计值预测出来。但实际值和估计值往往并不完全相同,存在着误差。估计值和实际值误差的大小,反映着回归方程代表性的高低。在统计中,通常用估计标准误差来反映回归方程代表性的高低,用sy表示。估计标准误差越小,说明回归方程的代表性越高,实际值与估计值越接近;估计标准误差越大,说明回归方程的代表性越低,实际值与估计值误差较大。上一页下一页返回第二节相关关系的测定(二)估计标准误差的计算估计标准误差,是指实际值与估计值之间误差的平均值。其定义公式为对于一元线性回归方程而言,估计标准误差的计算公式为但当观测值较多,而且数值较大时,根据定义公式进行计算将非常麻烦,一般使用估计标准误差的计算公式:上一页下一页返回第二节相关关系的测定(三)估计标准误差与相关系数的关系估计标准误差与相关系数具有如下关系:在实际应用中,一般不用以上两个关系式进行相互推算。因为首先要做相关分析,计算相关系数,只有在相关程度较高的情况下,才能继续进行回归分析,否则进行回归分析是没有意义的。另外,通过上述关系式计算出的相关系数,无法确定是正相关还是负相关。从估计标准误差与相关系数的关系式可以看出,相关系数和估计标准误差的变化方向是相反的。相关系数越大,估计标准误差越小,这时相关密切程度越高,回归方程的代表性较强;反之,相关系数越小,估计标准误差越大,回归方程的代表性越低。上一页返回第四节应用相关分析与回归分析应注意的问题一、注意定性分析与定量分析相结合相关分析是分析社会经济现象间相关关系的,相关系数的计算、回归方程的建立都是基于现象间所固有的客观联系之上的。而现象间是否一定存在相关关系,主要是靠定性分析,即依据社会经济理论、专业知识、实际经验对事物进行分析来判定的。不通过定性分析,直接根据样本观测数据进行量化分析,构建模型,有时就可能得出错误的结论。因为任何两列数据,即使是毫不相关的两个现象,都可以计算出相关系数,构建出回归模型,因此相关分析中的一切量化分析都应建立在定性分析的基础之上。下一页返回第四节应用相关分析与回归分析应注意的问题二、注意客观现象质的规定性现象间所存在的相互依存关系都是有一定数量界限的。例如,一般来说,施肥量越多,粮食产量就越高,但是超过一定的限度,施肥量增加,粮食产量可能反而下降。同样,固定资产投资与国民经济发展速度的关系也是有一个数量界限的。也就是说,某些现象之间的相关关系在一定的限度内是正相关,而超过某一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年及未来5年市场数据中国重型钢结构行业发展运行现状及投资潜力预测报告
- 配电房值班制度
- 2026年及未来5年市场数据中国富硒蛋行业市场深度研究及投资战略咨询报告
- 2026新余高新区聚能融资担保有限公司招聘工作人员6人考试备考题库及答案解析
- 2026云南怒江州泸水市司法局公益性岗位招聘2人考试参考题库及答案解析
- 2026山东省交通运输厅工程建设事务中心招聘人员1人笔试备考题库及答案解析
- 留学归国就业竞争力分析
- 汽车代驾员风险评估竞赛考核试卷含答案
- 2026中铁交通投资集团有限公司春季社会招聘35人笔试备考试题及答案解析
- 桩工机械维修工安全意识评优考核试卷含答案
- 2026煤矿井下电气题库
- 2026年春季人教PEP版四年级下册英语Unit 3 Time for school 教案(共6课时)
- 海关相关知识
- 山东省地质勘查预算操作细则
- 2025年湖北日报传媒集团招聘工作人员45人笔试参考题库附带答案详解
- 2026年考研英语(二)真题及答案
- 2026年幕墙工程专项安全监理实施细则
- 2025年高速路巡查员入职考试题库及答案
- 阿司匹林应用指南2025年版
- 免疫细胞疗法在癌症治疗中的应用
- 卵巢早衰的课件
评论
0/150
提交评论