线性相关分析20132修改参考PPT_第1页
线性相关分析20132修改参考PPT_第2页
线性相关分析20132修改参考PPT_第3页
线性相关分析20132修改参考PPT_第4页
线性相关分析20132修改参考PPT_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 相关与回归分析,学习目标 1、掌握相关关系的概念和种类 2、掌握相关分析的基本方法 3、掌握一元线性回归的基本原理和参数的最小 二乘估计法 4、利用回归方程进行统计预测 分两节来讲: 第一节 相关关系与相关分析 第二节 简单线性回归分析,第一节 相关关系与相关分析,一、变量间的关系 (一)函数关系,设有两个变量 x 和 y ,变量 y 随变量 x的变 化而变化,并完全依赖于 x ,则称 y 是 x 的函 数,记为 y = f (x),其中 x称为自变量,y 称为因 变量。 函数关系是一一对应的确定性关系。, 函数关系的例子 在价格一定的情况下,某种商品的销售额(y)与销售量(x)之间的

2、关系 可表示为 y = p x (p 为单价) 圆的面积(S)与半径之间的关系 可表示为 S = R2,(二)相关关系,特点: 1、一个变量的取值不是完全由另一个(或一组)变量唯一确定。 2、当变量 x 取某个值时,变量 y 的取值可能有几个,不是一一对应关系 概念:相关关系是变量之间确实存在着的数量上的相互依存关系,但关系值是不固定的。,相关关系示图, 相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量( y )与施肥量( x1 ) 、降雨量( x2 ) 、温度( x3 )之间的关系 收入水平( y )与受教育程度( x )

3、之间的关系 父亲身高(y)与子女身高(x)之间的关系,二、相关关系的种类,(一)按相关程度不同分 1、完全相关:即函数关系 2、不完全相关:研究重点 3、完全不相关:即相互独立,(二)按相关的方向分 1、正相关:变动方向一致。 如:消费支出与工资收入 投入与产出 2、负相关:变动方向相反 如:商品销售额与商品流通费用率 物价与消费量,(三)按相关形式分: 1、线性相关 当变量x值发生变动时,变量y值发生大致均等的变动;或从图形上看,观察点的分布情况大致散布在一条直线周围。 2、非线性相关 当变量x值发生变动时,变量y值也随之发生变动,但这种变动是不均等的;或从图形上看,观察点的分布情况表现为各

4、种不同的曲线形式。,(四)按涉及的变量的多少分 1、单相关:2个变量之间的相关关系 2、复相关:3个或3个以上的变量之间的相 关关系。可分解为多个单相关 进行分析。,三、相关分析,(一)概念: 就是对变量之间的相关关系进行分析。分析 一个变量与另外一个(或一组)变量之间的相关关系的密切程度和方向的一种统计分析方法。,(二)方法 1、相关表: 例:教材P246页表9.1 2、相关图:散点图 3、指标计算:相关系数(线性相关条件下),四、相关系数,(一)概念,相关系数是直线相关条件下说明两个变量之间相关密切程度的统计分析指标,用“r”表示。,(二)计算公式(积差法):,或化简为,相关系数的取值范围

5、及其意义: r 的取值范围是 -1,1 | r | = 1,为完全相关 r = 1,为完全正相关 r = -1,为完全负相关 r = 0,不存在线性相关关系,【例】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到19811993年的样本数据(xi ,yi),i =1,2,,13,数据见表,计算相关系数。,解:根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系数为 0.9987,相关分析的不足: 相关分析只能分析出变量之间是否有相关关系,相关关系的形式、方向和程度。但对于一个变量是如何随着另一个(或一组)变量的变动而变动(即变量之间的数量

6、变动关系)无法说明。 这就需要在相关分析的基础进一步进行回归分析。,第二节 回归分析,一、回归分析 从一组样本数据出发,确定变量之间的数学关系式 选择适当的回归模型,采用最小二乘法估计回归模型中的待定系数。 利用所求的关系式,来预测或控制另一个特定变量的取值。,3、回归分析与相关分析的区别,相关分析中,变量 x 变量 y 处于平等的地位; 回归分析 中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分 析中,因变量 y 是随机变量,自变量 x 可以是随机变量 也可以是非随机的确定变量 相关分析主要是描述两个

7、变量之间相关关系的密切程度和方向; 回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制,二、回归模型的类型,三、一元线性回归分析,(一)概念,当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归。,(二)一元线性回归模型形式,只涉及一个自变量的简单线性回归模型可表示为:,(三)参数 a 和 b 的最小二乘估计,使因变量的观察值(y)与估计值( ) 之间的离差平方和达到最小来求回归方程中的待 定系数 a 和 b ,即最小二乘估计法。,最小二乘法示图,最小二乘法( a 和 b 的计算公式),四、回归方程的评价(估计标准误差

8、 Sy,实际观察值与回归估计值离差平方和的均方根 反映实际观察值在回归直线周围的分散状况,反映回归方程拟合的程度。 计算公式为:,五、利用回归方程进行估计和预测(点估计),对于自变量 x 的任一给定值x0 ,根据回归 方程可得到因变量 y 的一个估计值。,习题1,有10个同类企业的固定资产和总产值资料如下:,根据以上资料计算 (1)协方差和相关系数; (2)建立以总产值为因变量的一元线性回归方程; (3)当固定资产改变200万元时,总产值平均改变多少? (4)当固定资产为1300万元时,总产值为多少?,解:计算表如下:,固定资产,总产值,(1)1)协方差用以说明两指标之间的相关方向。 计算得到

9、的协方差为正数,说明固定资产和总产值之间存在正相关关系。,2)相关系数用以说明两指标之间的相关方向和相关的密切程度。 计算得到的相关系数为0.95,表示两指标为高度正相关。,(2) 回归直线方程为:,(3)当固定资产改变200万元时,总产值平均改变多少? 当固定资产改变200万元时,总产值平均增加180万元。,(4)当固定资产为1300万元时,总产值为多少? 当固定资产为1300万元时,总产值为1562.85万元。,习题:某地区19982003年人均收入与某商品的销售额资料如下: 要求:(1)判断人均收入与商品销售额之间的相关关系 的形式 (2)用最小平方法建立直线回归方程 (3)预测当人均收

10、入为5000元时,该商品销售额 将达多少?,1、7个同类企业生产性固定资产年平均价值和年 总产值资料资料如下: (单位:万元),要求:(1)建立以年总产值为因变量的直线回归方程 (2)说明生产性固定资产价值每增加1万元, 年总产值增加多少万元?,某农副产品收购站,收购某种农副产品资料如下:,要求:(1)计算价格综合指数和由于收购价格的提高使 农民增加的收益。 (2)计算收购量综合指数和由于产品质量的提高 使农民增加的收益。,第八章 相关分析与回归分析,一、目的与要求 通过本章的学习应理解相关关系的概念;掌握相关关系的测定方法,特别是相关系数的意义、计算及作用。回归分析主要掌握一元线性回归,能够

11、用最小平方法求回归方程,了解应用相关与回归分析时应该注意的几个问题。,二、重点与难点,本章介绍的基本概念是相关关系的概念,重点是相关关系的测定,即相关系数的意义、计算和一元线性回归方程的建立。难点是相关系数的计算,一元线性回归方程中两个待定参数的计算。,三、思考与练习,(一)填空题 1、相关关系按其相关的程度不同,可分为 、 和 。,2、相关系数的正负表示相关关系的方向,r为正值,两变量 是 ;r为负数,两变量是 。,3、r=0,说明两个变量之间 ;r=+1,说明两个变量之间 ;r=-1说明两个变量之间 。,4、一元线性回归方程 中的参数a代表 ,数学上称为 ;b代表 ,数学上称为 。,5、

12、分析要根据研究的目的确定哪一个为自变量,哪一个为因变量,在这一点与 分析时不同。,6、相关关系按方向不同,可分为 和 。,7、完全线性相关的相关系数r值等于 。,8、计算回归方程要注意资料中因变量是 的,自变量是 的。,9、回归方程只能用于由 推算 。,(二)单项选择题(在每小题备选答案中,选出一个正确答案),1、相关分析研究的是( ) A.变量之间关系的密切程度 B.变量之间的因果关系 C.变量之间严格的相互依存关系 D.变量之间的线性关系,2、相关关系是( ) A、现象间客观存在的依存关系 B、现象间的一种非确定性的数量关系 C、现象间的一种确定性的数量关系 D、现象间存在的函数关系,3、

13、下列情形中称为正相关的是( ) A.随着一个变量的增加,另一个变量也增加 B.随着一个变量的减少,另一个变量增加 C. 随着一个变量的增加,另一个变量减少 D.两个变量无关,4、当自变量x的值增加,因变量y的值也随之增加,两变量之间存在着( ) A、曲线相关 B、正相关 C、负相关 D、无相关,5、相关系数r的取值范围是( ) A. B. C. D.,6、当自变量x的值增加,因变量y的值也随之减少,两变量之间存在着( ) A、曲线相关 B、正相关 C、负相关 D、无相关,7、相关系数等于零表明两变量( ) A.是严格的函数关系 B.不存在相关关系 C. 不存在线性相关关系 D. 存在曲线相关关

14、系,8、相关系数r的取值范围是( ) A、从0到1 B、从-1到0 C、从-1到1 D、无范围限制,9、相关分析对资料的要求是( ) A.两变量均为随机的 B.两变量均不是随机的 C.自变量是随机的,因变量不是随机的 D.自变量不是随机的,因变量是随机的,10、相关分析与回归分析相比,对变量的性质要求是不同的,回归分析中要求( ) A、自变量是给定的,因变量是随机的 B、两个变量都是随机的 C、两个变量都是非随机的 D、因变量是给定的,自变量是随机的,11、回归方程 中的回归系数 b说明自变量变动一个单位时,因变量( ) A.变动b个单位 B. 平均变动b个单位 C. 变动a+b个单位 D.

15、变动a个单位,12、一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是( ) A、负相关 B、正相关 C、零相关 D曲线相关,13、回归系数与相关系数的符号是一致的,其符号均可判断现象( ) A.线性相关还是非线性相关 B.正相关还是负相关 C.完全相关还是不完全相关 D.简单相关还是复相关,14、配合回归方程比较合理的方法是 ( ) A、移动平均法 B、半数平均法 C、散点法 D、最小平方法,15、在相关分析中不能把两个变量区分为确定性的自变量和随机性的因变量,在回归分析中( ) A.也不能区分自变量和因变量 B.必须区分自变量和因变量 C.能区分,但不重要 D.可以区分

16、,也可以不区分,16、价格愈低,商品需求量愈大,这两者之间的关系是( ) A、复相关 B、不相关 C、正相关 D、负相关,17、按最小平方法估计回归方程 中参数的实质是使( ) A. B. C. D. 最小值,18、判断现象之间相关关系密切程度的方法是( ) A、作定性分析 B、制作相关图 C、计算相关系数 D、计算回归系数,19、在线性相关条件下,自变量的标准差为2,因变量的标准差为5,而相关系数为0.8,其回归系数为( ) A.8 B.12.5 C.0.32 D.2.0,20、已知某产品产量与生产成本有直线关系,在这条直线上,当产量为1000件时,其生产成本为50000元,其中不随产量变化

17、的成本为12000元,则成本总额对产量的回归方程是( ) A、Y=12000+38X B、Y=50000+12000X C、Y=38000+12X D、Y=12000+50000X,21、已知 ,则相关系数为( ) A.不能计算 B. C. D.,22、相关图又称( ) A、散布表 B、折线图 C、散点图 D、曲线图,23、相关分析与回归分析的一个重要区别是( ) A、前者研究变量之间的关系程度,后者研究变量间的变动关系,并用方程式表示 B、前者研究变量之间的变动关系,后者研究变量间的密切程度 C、两者都研究变量间的变动关系 D、两者都不研究变量间的变动关系,24、当所有观测值都落在回归直线上

18、,则这两个变量之间的相关系数为( ) A、1 B、-1 C、+1或-1 D、大于-1,小于+1,25、一元线性回归方程y=a+bx中,b表示 ( ) A、自变量x每增加一个单位,因变量y增加的数量 B、自变量x每增加一个单位,因变量y平均增加或减少的数量 C、自变量x每减少一个单位,因变量y减少的数量 D、自变量x每减少一个单位,因变量y增加的数量,(三)多项选择题(在每小题备选答案中,至少有两个答案是正确的),1、直线回归方程 中,两个变量x和y ( ) A.前一个是自变量 ,后一个是因变量 B.两个变量都是随机变量 C.两个都是给定的量 D. 前一个是给定的量 ,后一个是随机变量 E.前一

19、个随机变量 ,后一个是给定的量,2、相关分析( ) A、分析对象是相关关系 B、分析方法是配合回归方程 C、分析方法主要是绘制相关图和计算相关系数 D、分析目的是确定自变量和因变量 E、分析目的是判断现象之间相关的密切程度,并配合相应的回归方程以便进行推算和预测,3、相关分析的特点有 ( ) A. 两个变量是对等的关系 B.它只反映自变量和因变量的关系 C.可以计算出两个相关系数 D.相关系数的符号都是正的 E.相关的两个变量必须都是随机的,4、下列现象中存在相关关系的有( ) A、职工家庭收入不断增长,消费支出也相应增长 B、产量大幅度增加,单位成本相应下降 C、税率一定,纳税额随销售收入增

20、加而增加 D、商品价格一定,销售额随销量增加而增加 E、农作物收获率随着耕作深度的加深而提高,5、相关关系与函数关系的区别在于( ) A.相关关系是变量间存在相互存在依存关系,而且函数关系是因果关系 B. 相关关系的变量间是确定不变的,而函数关系值是变化的 C.相关关系是模糊的,函数关系是确定的 D.两种关系没有区别,6、商品流通费用率与商品销售额之间的关系是( ) A、相关关系 B、函数关系 C、正相关 D、负相关 E、单相关,7、为了揭示变量x与y之间的相互关系,可运用( ) A. 相关表 B. 回归方程 C.相关系数 D.散点图,8、相关系数( ) A、是测定两个变量间有无相关关系的指标

21、 B、是在线性相关条件下测定两个变量间相关关系密切程度的指标 C、也能表明变量之间相关的方向 D、其数值大小决定有无必要配合回归方程 E、与回归系数密切相关,9、可以借助回归系数来确定( ) A.两变量之间的数量因果关系 B.两变量之间的相关方向 C.两变量之间的相关的密切程度 D.揭示它与相关系数的数量关系,即,10、直线回归方程( ) A、建立前提条件是现象之间具有较密切的直线相关关系 B、关键在于确定方程中的参数a和b C、表明两个相关变量间的数量变动关系 D、可用来根据自变量值推算因变量值,并可进行回归预测 E、回归系数b=0时,相关系数r=0,11、可用来判断现象相关方向的指标有(

22、) A.相关系数 B.回归系数 C.回归参数a D.协方差 E.估计标准误差,12、某种产品的单位成本y(元)与工人劳动生产率x(件/人)之间的回归直线方程Y=50-0.5X,则( ) A、0.5为回归系数 B、50为回归直线的起点值 C、表明工人劳动生产率每增加1件/人,单位成本平均提高0.5元 D、表明工人劳动生产率每增加1件/人,单位成本平均下降0.5元 E、表明工人劳动生产率每减少1件/人,单位成本平均提高50元,13、对于回归系数,下列说法中正确的有( ) A.b是回归直线的斜率 B.b的绝对值介于0-1之间 C. b接近于零表明自变量对因变量影响不大 D.b与相关系数具有以下关系:

23、 E.b满足方程组,14、相关关系的特点是( ) A、现象之间确实存在数量上的依存关系 B、现象之间不确定存在数量上的依存关系 C、现象之间的数量依存关系值是不确定的 D、现象之间的数量依存关系值是确定的 E、现象之间不存在数量上的依存关系,15、回归方程可用于( ) A.根据自变量预测因变量 B.给定因变量推算自变量 C.给定自变量推算因变量 D.推算时间数列中缺失的数据 E.用于控制因变量,16、建立一元线性回归方程是为了( ) A、说明变量之间的数量变动关系 B、通过给定自变量数值来估计因变量的可能值 C、确定两个变量间的相关程度 D、用两个变量相互推算 E、用给定的因变量数值推算自变量的可能值,17、在直线回归方程中,两个变量x和y( ) A、一个是自变量,一个是因变量 B、一个是给定的变量,一个是随机变量 C、两个都是随机变量 D、两个都是给定的变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论