版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章相关与回归分析第一节相关分析的意义和种类一、相关分析的概念现象之间的相互关系可以分为两种不同的类型:(一)函数关系它反映现象之间存在着严格的依存关系,在这种关系中,对于某一个变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可用一个函数式表达出来。例如:圆周长L与圆半径r之间存在严格的确定性关系,因而两者的相关关系为函数关系,即。(二)相关关系它反映现象之间客观存在的、不严格、不确的相互依存关系。这种关系不能通个别现象体现其关系的规律性,必须在大量现象中才能体现出来。相关分析是研究一个变量(y)与另一个变量(x)之间相关方向与相关密切程度的一种统计分析方法。二、相关关系的种
2、类(一) 按相关的方向分为正相关和负相关正相关是指两个变量之间的变化方向一致,都是增长趋势或下降趋势。负相关是指两个变量之间的变化趋势方向相反,一个上升而另一个下降。(二)按相关的形式可分为直线相关的非直线相关直线相关,又称线性相关。是指当相关关系的一个变量变动时,另一个变量也相应地发生大致均等的变动。非直线相关,又称非线性相关或曲线相关。是指当相关关系的一个变量变动时,另一个蛮量也相应地发生变动,但这种变动是不均等的。正、负相关散点图及曲线相关散点图下如:三、相关分析的主要内容1、确定现象之间有无关系存在,以及相关关系的形态。2、确定相关关系的密切程度。3、确定相关关系的数学表达式。如果现象
3、之间的关系是直线相关,则配合线性方程;如果是曲线相关,则配合曲线方程。这是进行判断、推算和预测的依据。4、确定因变量估计值误差程度。确定因变量估计值误差大小的指标是估计标准误差,估计标准误差大,表明估计不太精确;估计标准误差大小,表明估计较精确。第二节 相关关系的测定一、相关表和相关图(一)简单相关表和相关图对资料较少的,可不分组,只将自变的变量值值按大小顺序加以排列,因变量的变量值一一加以对应,排列其变量值则可编成简单相关表。例:某企业工人劳动生产率和利润率相关表如下:序号工人劳动生产率(千元)利润率(%)序号工人劳动生产率(千元)利润率(%)123458101011125.56.06.57
4、.07.967891012141618198.08.59.010.512.5根据表中资料,可绘制相关图如下:(二)分组相关表和相关图1、单变量分组相关表和相关图单变量分组相关表,是将两个变量中的一个变量进行分组,而另一个变量不分组,并对分组的变量计算各组的次数,对不分组的变量则计算其平均数。例:某地水稻浇水量和产量相关表如下:浇水深度(公分)田块数平均亩产(公斤)35781012131554366757235317348405463478380365相关图与前面绘图技术相似。2、双变量分组相关表双变量分组相关表,就是对两个变量都进行分组而编制的相关表。例:30个同类企业产量和单位成本相关表:单
5、位成本y(元/件)产量(件)x合计200300400500800180160441321311321449107150140合计9556530双变量分组表,由于对两个变量都进行了分组,加权的方法要复杂一些。一般情况下很少使用双变量分组表进行计算。二、相关系数(一)相关系数的意义相关系数是直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标,记为r 。相关系数的特点:1、两个变是是对等的,不分自变量与因变量。因此,相关系数只有一个。2、相关系数有正、负号,正号表示正相关,负号表示负相关。3、计算相关系数对资料的要求是,相关的两个变量必须都是随机的,这也反映对等关系。(二)相关系数的计算
6、方法1、积差法先计算三个指标:所以相关系数可以写成:上面公式的分子和分母中,都有公因子,同时约掉,相关系数的公式可写成:该公式是通过将各个离差相乘的方法来说明相关程度的,所以把它叫做“积差法”相关系数公式。2、简捷法上述“积差法”相关系数公式,是根据,的数值计算的,当和为除不尽的小数时,计算既麻烦又影响其准确性。在实际中,可运用简捷法计算相关系数。简捷法公式可由“积差法”相关系数计算公式推导得出:用同样方法可得:把以上结果代入积差法相关系数公式;即可得出相关系数简捷法公式,即:现引入以下几个符号(这些符号在回归分析中也要使用),即:则相关系数公式可写成:从此式中可以看出:r的正负号取决于分子,
7、当为正值时,得出r为正相关,当为负值时,得出r为负相,r与的符号保持一致。(三)相关系数的密切程度相关系数的数值范围,是在-1和+1之间,即。计算结果r0为正相关,r0为负相关。的数值越接近于1(-1或+1),越接近于0,表示相关关系越弱。,表示两个现象完全直线相关。,表示两个现象完全不相关。但可能存在其他非直线类型的关系。判断相关关系密切程度的划分方法: 无直线相关; 低度直线相关; 显著直线相关; 高度相关。例:某城市10家商店人均月销售额和利润率的资料如下表序号人均月销售额(千元)x利润率(%)yx2y2xy123456786581476312.610.418.53.08.116.312
8、.36.236256811619369158.76108.16342.259.0065.61265.69151.2938.4475.052.0148.03.032.4114.173.818.6910376.616.894943.56282.2419.8117.6合计50110.82941465.00654.9根据表中资料,试用简捷法公式计算相关系数。计算结果表明,人均月销售额和利润率之间存在着高度的正相关关系。第三节 回归分析一、 回归分析的意义(一)什么是回归分析回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,建立一个相应的数学表达式,(即回归方程式),用来近似的
9、表示变量间的平均变化关系的一种统计分析方法。(二)回归分析的特点就一般意义而言,相关分析包括回归与相关两方面内容,但就具体方法所解决问题而言,回归分析与相关分析是有明显区别的,因而两者是既有联系又有区别的不同统计分析方法。1、与相关分析(狭义的)比较,回归分析的特点(1)两个变量不是对等的,要区分自变量和因变量。(2)回归分析可以依据回归方程,用自变量数值推算因变量的估计值。(3)在互为因果关系的x、y两个变量中,可以根据研究目的不同分别建立两个不现的回归方程:一个是以x为自变量,y为因变量的回归方程,称为“y倚x回归方程”,即;另一个是以y为自变量,x 为因变量的回归方程,称为“x倚y回归方
10、程”,即: 。两个方程是互相独立的,不能互相替换。(4)直线回归方程中的回归系数有正负号,正回归系数表示上升直线,说明两变量之间是同方向变动;负回归系数表示下降直线,说明两变量之间是反方向变动。(5)回归分析对资料的要求,因变量是随机的,而自变量不是随机的,是给定的数值。2、回归分析与相关分析的联系(1)相关分析是回归分析的基础和前提。(2)回归分析是相关分析的深入和继续。回归分析有四种类型,即:一元线性回归方程、多元线性回归方程、一元非线性回归方程和多元非线性回归方程。二、一元线性回归方程一元线性回归方程,又称简单直线回归方程。它只有一个自变量和一个因变量,而且两个变量的增量按一定的比例变化
11、。一元线性回归方程虽然简单,但是最基本的、重要的,因为现象数量之间的变化,常常是按比例变化的,而且许多非线性变化在较短时间内也近似于线性变化,可以利用线性分析方法。(一)一元线性回归方程的建立一元回归分析的任务,就是在若干分散的具有线性相关的相关点之间,配合一条最优直线,以表明两变量之间具体的变动关系。一元线性回归方程的基本形式是:以上两种回归方程中,只是x和y的位置互换罢了,实际上其计算方法是一致的。在两种变量只有单方面的因果关系时,只能用一个回归方程式表示,一般是y倚x回归直线方程:式中:x为自变量,为因变量y的估计值(或理论值),在直角坐标图形中a为纵轴上的截距,表示直线的起点,b为直线
12、的斜率,称为y对x 的回归系数,表明x每变动一个单位时,影响y平均变动的数量,a和b 都是待定参数。求出这两个参数,回归方程也就确定了。统计中估计a、b的参数最常用的方法是最小二乘法。最小二乘法的原理是:y与的离差平方和为最小。用这种方法求出的回归线是原资料的最优直线,就y倚x 回归线来讲:这里的最小二第六法与动态数列一章中长期趋势测定的最小二乘法是同一方法。实际上,长期趋势测定也是回归法的一种,它是把时间作为自变量,动态指标点作为加变量计算的,因此,那里讲的有关公式,这里都适用,只要把时间变量的符号t改为自变量x即可。两个标准方程式为:解之可得:将a、b值代入中即为所求的回归直线方程。如果已
13、用积差法计算了相关系数,有了相应资料,可利用相应资料求b值。例个企业生产某种产品的月产量与生产费用与生产费用资料及有关计算如下表:序号产品产量(千吨)x生产费用(万元)yxyxy11.2621.44384474.466.7922.944122.0864.007396172.077.1179.032133.1809.616400248.091.30127.690043.811014.4412100418.0100.3393.508955.011525.0013225575.0115.810.656166.113237.2117424805.2130.004.000077.213551.84182
14、25972.0144.1984.456188.016064.00256001280.0154.5130.1401合计36.4880207.544544.6880.00442.4274根据上表资料计算相关系数,并建立直线回归方程。(1)计算相关系数计算结果表明产品产量与生产费用之间存在着高度正相关关系。(2)建立直线回归方程(以产量为自变量)将a、b值代入直线回归方程这个回归方程表明,月产量每增加1000吨,生产费用平均增加12.9万元。根据这个方程式,把8个企业的月产量实际值(x)逐项代入,就可计算出相应的生产费用估计值()如上表,把这些估计值(亦称预测值)画成图形,就是一条上升的直线,截距为
15、51.31,斜率为12.9。从上表中还可看出, 例2:某企业产量与单位成本资料及有关计算如下表:月份产量(千件)单位成本(元/件)x2y2xy12345234347372717369491691653295184504153294761146216284219276737371917009719170090.53290.00810.82811.18811.1881656825462434068270.0729合计214267930268148142663.8182根据上表资料计算相关系数,并建立直线回归方程。(1)计算相关系数计算结果表明,产量与单位成本之间存在着高度的负相关关系。(2)建立直
16、线回归方程(以产量为自变量)这里回归系数b表明,产量每增加1千件,单位成本平均下降1.82元。根据回归方程可计算单位成本的估计值如上表,同时还可进行预测,例如,当产为4500件时,单位成本为:(二)估计标准误差1、什么是估计标准误差估计标准误差就是用来说明回归方程计算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。2、估计标准误差的计算(1)根据因变量实际值与估计值的离差计算式中:Syxy倚x回归方程估计标准误差;y因变量数列的实际值;根据回归方程推算出来的估计值,n因变量的项数;根据例1的资料计算:说明实际生产费用与估计生产费用平均相差8.59万元。根据例2的资料
17、计算:说明实际单位成本与估计单位成本平均相差0.97元。(2)根据a、b两个参数值计算根据例1的资料计算:根据例2的资料计算:(三)估计标准误差相关系数的关系上述公式表明,r和Syx的变化方向是相反的。(四)回归系数与相关系数的关系上述公式表明,r与b变化方向是一致的。*三、多元线性回归方程在实际中,往往影响因变量的因素不只是一个,而是很多个。因此,我们必须应用两个或更多的自变量来估计因变量,这就叫多元线性回归分析。在这里我们以二元线性回归方程为例进行讨论。(一) 二元线性回归方程二元线性回归方程是多元线性回归方程中最简单的一种,它是研究一个因变量y值的变动受二个自变量x1和x2的影响,其线性
18、回归方程为:求二元回是方程中的a、b1、b2的数值,与一元回归方程相似,亦是采用最小平方法。求a、b1、b2的标准方程为:解联立标准方程,可求得a、b1、b2之值,以之代入中,即得二元线性回归方程。例:某地12个商店利润额、销售额和资金占用额资料如下表,试据此建立二元线性回归方程。某地12个商店资料表编号利润额(万元)y销售额(万元)x1资金占用额(万元)x2129312251011535100134510514561081566124177813216851121796132181049917114901812310220合计601298192根据上表资料进行有关计算如下表:多元线性回归计算表编号x12x1yx22x2yx1x2186492791443611164.31-1.311.71762102015052257515154.530.470.22093100005001696513004.710.230.05294110255251967014705.05-0.050.00255116646482259016205.150.850.722561537674428910221086.24-0.240.0576717424105625612821127.120.880.77448125445602898519045.18-0.180.0324
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物流行业仓储经理物流成本控制绩效考核表
- 互联网产品市场营销经理绩效评定表
- 人力资源业务伙伴工作绩效评定表
- 《历史时间线复习:高中历史专题复习课教案》
- 人教部编版语文二年级上册第一二三单元测试题及答案
- 医院护理核心制度执行自查自纠整改工作总结报告
- 人教版七年级地理下册期末复习第一单元检测试题及答案
- 2025-2026学年早操教案小班
- 2025-2026学年穷人教学设计张祖庆
- 公司各部门内部协作制度
- 继电保护装置调试作业指导书电气调试方案
- 保安中介合同范例
- 印刷工艺技术培训课件
- 2025新译林版英语七年级下单词默写表
- 洒水降尘方案
- 2022新教材苏教版科学5五年级下册全册教学设计
- unesco -让每一所学校都成为健康促进学校实施指南
- 《飞机结构与系统》课件-机翼结构
- 消毒供应中心护士长工作述职报告
- (正式版)JBT 3300-2024 平衡重式叉车 整机试验方法
- 农村信用社借款合同
评论
0/150
提交评论