




免费预览已结束,剩余31页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相关与回归分析,第十章,第十章相关与回归分析,学习目标:1、了解相关关系的概念及种类;2、掌握相关系数的计算方法和相关系数的取值含义;3、掌握一元线性回归直线方程的建立方法、回归方程的显著性检验和回归预测的方法;4、了解多元线性回归直线方程的建立方法。,10.1相关分析概述,10.1.1函数关系与相关关系10.1.2相关关系的种类10.1.3相关分析的主要内容,10.1.1函数关系与相关关系,1.函数关系当一个或几个变量取一定的值时,另一个变量有确定的值与之相对应,我们称这种关系为确定性的函数关系。例如,某种产品的总成本S与该产品的产量以及该产品的单位成本P之间的关系可用S=PQ表达,这就是一种函数关系。通常把作为影响因素的变量称为自变量,把发生相应变化的量称为因变量。在本例中,S是因变量,P与Q则是自变量。,10.1.1函数关系与相关关系,2.相关关系当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,变量间的这种相互关系,称为具有不确定性的相关关系。例如,商品销售额与商品流通费之间的关系。一般说来,商品销售额增加,商品流通费便要相应增加;反之,就要相应减少。但是商品销售额与商品流通费之间不存在一一对应的确定性关系。因为商品流通费的支付不仅与商品销售数量有关,而且与商品性质、运价、运输里程、运输方式、广告宣传、经营管理等诸多因素有关。在商品销售额相同的情况下各企业支付的流通费用有高有低。,10.1.2相关关系的种类,1.按相关关系涉及的变量(因素)多少来划分,可分为单相关和复相关单相关是指一个自变量与一个因变量的依存关系。复相关是指一个因变量与两个或两个以上自变量之间的依存关系。2.按相关关系的表现形态来划分,可分为线性相关和非线性相关当自变量数值发生变动,因变量数值随着发生大致均等的变动(增加或减少),从图形上看,其观察点的分布近似地表现为一条直线形式,称为线性相关。当自变量数值发生变动,因变量数值随着也发生变动,但不是均等的变动,从图形上看,其观察点的分布近似地表现为各种不同的曲线形式,如抛物线、双曲线等,称为非线性相关。,3.按变量之间相互关系的方向,分为正相关和负相关当自变量的数值增加,因变量的数值也随之相应的增加,即相关的变量同一方向变化,称为正相关。自变量数值增加时,因变量数值随之减少,即相关的变量反方向变化,称为负相关。4.按变量之间相关的程度划分,可分为完全相关、不相关(也称零相关)和不完全相关因变量数值完全随自变量数值变动而变动,这时相关关系实际上就转化为函数关系,称为完全相关。变量之间的变动完全不存在任何依存关系时,称为不相关。变量之间关系介于完全相关与不完全相关之间,称为不完全相关。,10.1.2相关关系的种类,10.1.3相关分析的主要内容,1.确定现象之间有无相关关系及相关关系的表现形式。主要通过定性分析判断和相关图、相关表观察得出结论。这是相关分析的出发点。2.确定相关关系的表现形式。若存在相关关系,就需进一步确定相互关系的表现形式。例如,是线性相关还是非线性相关,这时相关分析的主要内容。3.确定相关关系的密切程度和方向。通过相关分析,可以判定现象之间相关关系的密切程度和方向。例如,变量之间是完全相关、不完全相关还是完全不相关。,10.2相关关系的测定,10.2.1客观现象之间的定性分析10.2.2利用相关图表进行判断,10.2相关关系的测定,要进行相关分析首先要判断现象之间有没有相关关系和具有什么样的相关关系。我们一般是先对现象之间的关系作直观判断,然后再进行相应的定量分析。直观判断的方法主要有两种:一是运用理论知识、专业知识及实际经验对现象之间存在的关系作定性的判断;二是利用相关表和相关图对现象之间存在的相关关系的方向、形式及紧密程度作出大致判断。定量分析则主要是计算相关系数。,10.2.1客观现象之间的定性分析,根据一定的社会经济理论与实践经验的总结,对社会经济现象进行定性分析,以判断它们之间是否具有相关关系以及相关关系的种类。只有在定性分析的基础上,才能从数量上测定现象之间的相关关系。这是判断相关关系的一种重要的方法,也是相关分析的重要的前提。,10.2.2利用相关图表进行判断,判断现象之间的相关关系,一般是先做定性分析,然后再做定量分折。如果定性分析确有相关关系进一步编制相关图与相关表、可以判断现象之间大致呈现何种关系形式,以此计算相关系数作定量分析,精确反映相关关系的方向和程度。1.编制相关表将反映变量之间相互关系的原始资料按照一定的顺序叫做相关表。相关表按其资料是否分组可分为简单相关表和分组相关表。2.绘制相关图相关图也叫散点图,它是利用直角坐标系,将自变量确定在横铀,因变量确定在纵轴上,两变量的对应值用坐标点画出来。通过观察相关点的分布情况来判断两个变量之间有无相关关系以及相关关系的密切程度、方向和形式。3.相关系数的计算相关图表只能粗略地大体上反映变量间相关关系的方向、形式和密切程度,要确切地反映相关关系的密切程度,还需计算相关系数。我们着重研究线性的单相关系数即直线相关系数,简称相关系数。,10.2.2.3相关系数的计算,相关系数的测定方法有若干种,最简单的一种称为积差法,用积差法计算相关系数的公式为:(10-1),10.2.2.3相关系数的计算,其中,称为xy的协方差,是变量x的标准差;,是变量y的标准差因此,相关系数可表现为如下形式:(10-2),10.2.2.3相关系数的计算,相关系数的取值范围在1和1之间,即。当时,表明x与y之间无线性相关关系。即x与y之间不相关或曲线相关。当时,变量x与y为完全线性相关,当时,称为完全正相关;当时,称为完全负相关。当时,表示两变量之间呈正相关,即随着自变量x的增加(或减少),因变量y也相应增加(或减少)。随着r取值的增大,其相关程度也相应地增强。当时,表明两变量之间呈负相关,即随着自变量x地增加(或减少),因变量y相应减少(或增加)。相关系数r越接近于1,即两变量地负相关程度越高。通常判断标准是:称为微弱直线相关,称为低度直线相关,称为显著相关或中度相关,称为高度相关。,例10-1已知某种商品需求量和价格的数据,见表10-1,根据表中的资料,计算该商品需求量和价格的相关系数。,解:按相关系数公式计算将表中数据代入公式:由于,且,则说明该种商品的需求量和该种商品的价格是高度负相关的。,10.3回归分析,10.3.1一元线性回归模型的描述10.3.2一元线性回归方程的拟合10.3.3一元线性回归方程的显著性检验10.3.4预测,10.3回归分析,相关分析中的相关系数可以从数量上说明变量之间相关关系的方向和密切程度。但它不能反映一个变量发生一定数量的变化时,另一个变量会相应的发生多少变动。为了解决这个问题,就必须采用回归分析的方法。回归分析是指对具有相关关系的变量,依据其关系形态,选择一个合适的数学模型,用来近似的表示变量之间数量平均变化关系的一种统计方法。回归分析的内容很多,按分析变量的多少不同,可分为一元回归分析和多元回归分析;按分析变量的表现形态不同,可分为线性回归分析与非线性回归分析等。本节只讨论一元线性回归分析的理论与方法。,10.3.1一元线性回归模型的描述,一元线性回归模型也称为简单直线回归模型,是分析两个变量x与y之间相互关系的数学方程式。我们假定x为自变量,y为因变量,y值除了受自变量x的影响之外,还受其它因素的影响;在构建回归模型时,应该包括随机误差,x与y之间的关系可以用数学公式表示:(10-3),10.3.1一元线性回归模型的描述,一元线性回归模型也称为简单直线回归模型,是分析两个变量x与y之间相互关系的数学方程式。我们假定x为自变量,y为因变量,y值除了受自变量x的影响之外,还受其它因素的影响;在构建回归模型时,应该包括随机误差,x与y之间的关系可以用数学公式表示:(10-3)在实际研究问题时,为了便于对参数做出区间估计和假设检验,我们假定。因此,我们可以用下式近似的描述x与y之间的关系:(10-4)式中为因变量的估计值;x为自变量的实际值;a,b为待定参数;上述公式称为变量y对x的一元线性回归模型。a,b的几何意义是:a为直线方程的截距,b为直线的斜率。其经济意义是:a表示自变量x为零时的因变量y的估计值;b表示当自变量x每增加一个单位时因变量y的平均变化,b也称为y对x的回归系数。,10.3.2一元线性回归方程的拟合,最小二乘法的基本思想是:选择a和b,使得观测值与理论值的离差平方和最小。即选择a和b,使得最小值(10-5),10.3.2一元线性回归方程的拟合,用直线方程代入公式得:最小值(10-6)用数学中对二元函数求极值的原理,计算Q关于a和b的偏导数,并令其等于零,即(10-7),10.3.2一元线性回归方程的拟合,经整理,得到参数a和b的计算公式:(10-8),例10-2利用表10-2所给的资料,建立广告费用支出与销售额的一元线性回归方程。解:根据表10-2所给出的数据,列出计算表10-3表10-3一元线性回归计算表,将表中数据代入(10-8),得到于是,广告费与销售额的一元线性回归方程为,10.3.3一元线性回归方程的显著性检验,1.回归系数b的显著性检验回归系数b的显著性检验就是要验证总体两变量x与y的线性关系是否真正存在。因此,我们对线性模型(10-8)提出如下假设:如果原假设成立,说明x对y没有影响,回归方程不具有实用价值。如果原假设不成立,则可以认为x对y有显著影响,我们求出线性回归方程是有意义的。为此,我们需要构造一个检验的统计量。我们把y的n个观测值之间的差异,用观测值与其平均值的偏差平方和来表示,称为总离差平方和,记为SST。,(10-9)将其分解:(10-10)不难证明交叉项等于零,若记(10-11),则有(10-12)这里,SSR叫回归平方和,它反映了回归方程的理论值对平均值的离散程度;SSE叫残差平方和,它是实际观测值与回归值的离差平方和,反映了随机因素对y取值的影响。可以证明,当成立时,(10-13)因此,我们可以作出决策,对于给定的显著性水平,若,则拒绝,表明x与y之间存在线性关系,x对y的影响时显著的。否则,变量x与y之间不存在线性关系,x对y的影响不显著。,2.回归方程的显著性检验回归方程显著性检验,是对回归模型总体的显著性检验,即对回归模型中所有因变量与自变量之间的线性关系在总体上是否显著成立作出推断。回归方程显著性检验,实际上是对回归方程拟合优度的检验,采用F统计量,所以又称为F检验。首先,构造统计量(10-14),10.3.3一元线性回归方程的显著性检验,当为真时,因此,我们可以作出决策,对于给定的显著性水平,若,则拒绝,表明总体回归方程线性关系成立,总体回归方程是显著的。否则,接受,总体回归方程不显著。需要说明的是,在一元线性回归中,只有一个自变量,t检验和F检验是一致的。但是在多元回归分析中,t检验和F检验是不同的。T检验是检验回归方程中回归系数的显著性,F检验则是检验整个方程回归关系的显著性。,例10-3根据表10-2的资料拟合的回归方程进行回归系数的显著性检验和回归方程的显著性检验。解:(1)回归系数的显著性检验(t检验)我们提出如下假设:若成立,说明广告费对销售额的影响不显著,两者之间不存在线性关系。,在成立的条件下,计算t统计量的值:当显著性水平时,此时,因此拒绝原假设。说明回归系数是显著的,广告费用和销售额之间的线性关系确实存在,广告费用是影响销售额的显著因素。,(2)回归方程的显著性检验(F检验)首先计算统计量的值:当显著性水平时,此时,因此拒绝原假设,说明回归方程是显著的。,10.3.4预测,对于给定x的任一值,由一元线性模型知道,不可能求出y相应的精确值,但是我们可以预测y的观测值的取值范围。对于给定的置信度,求出的置信区间,称之为预测区间。求预测区间的方法与抽样推断中的区间估计原理相同。对于给定的置信度,置信度为的预测区间为(10-15)其中(10-16),10.3.4预测,若对于任意x,作曲线(10-17)及(10-18)则可以预测大约有100(1)%的试样点落入这两条曲线所形成的带形区域内。在实际应用时,样本容量n常常很大,因此有,且对于附近的x,可得到较短的预测区间。此时y得置信度为的预测区间近似地等于(10-19),本章小结,1、现象之间存在的不确定性的数量依存关系叫做相关关系。对现象之间相互关系的密切程度的研究称为相关分析。相关关系可以从不同角度进行分类,如:按相关关系涉及的变量(因素)多少分为单相关和复相关;按相关关系的表现形态可分为线性相关和非线性相关;按变量之间相互关系的方向分为正相关和负相关;按变量之间相关的程度划分为完全相关、不相关(也称零相关)和不完全相关。2、相关分析的主要内容包括:确定现象之间有无相关关系及相关关系的表现形式;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC TS 63527:2025 EN Safe management and operation of electrical installations
- 旧房改造协议书
- 新解读《GB-T 30570-2014金属冷冲压件 结构要素》
- 重庆火锅绘画课件
- 重庆幼小衔接课件加盟
- 老年人购物安全知识培训课件
- 重力与质量关系课件
- 完形填空20篇(10空题)-2023学年七年级英语上学期
- 水溶液中离子反应(讲义)-高考化学二轮复习
- 泰山海拔多少米最高
- 2025年浙江省杭州市杭州第二中学高考化学试题模拟训练试题含解析
- 小型公司合伙合同范本
- 老带新活动方案
- T-CAS 952-2024 基于荧光标记二抗的免疫组织化学检测 质量控制规范
- 企业员工健康管理方案
- 2025年福建省现场流行病学调查职业技能竞赛理论参考试题库(含答案)
- 2024国家安全教育大学生读本题库
- 样品确认流程培训
- 《基于管理需求下的酒店设计研究》
- 2025中国电信浙江公司社会招聘179高频重点提升(共500题)附带答案详解
- 外研版九年级上册英语Module 1~12全册教案(大单元教学设计)
评论
0/150
提交评论