统计学课件 第6章 相关分析与回归分析_第1页
统计学课件 第6章 相关分析与回归分析_第2页
统计学课件 第6章 相关分析与回归分析_第3页
统计学课件 第6章 相关分析与回归分析_第4页
统计学课件 第6章 相关分析与回归分析_第5页
已阅读5页,还剩45页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章相关分析与回归分析主要内容本章结构相关分析

线性回归分析

非线性回归分析

相关分析相关关系与函数关系函数关系;相关关系相关关系的种类1、按相关方向分为:正相关和负相关2、按相关程度分为:完全相关、不完全相关和不相关3、按相关形式分为:线性相关(直线相关)和非线性相关(曲线相关)4、按所研究的变量的多少分为:单相关(A与B)、复相关(A与B、C、D)和偏相关(B、C不变A与D)5、按相关系数分为:r=1,完全相关;0.8r1,高度相关;0.5r0.8,显著相关;0.3r0.5,低度相关;0r0.3,微弱相关;r=0,不相关;相关分析涵义利用一个指标来反映现象间相互依存关系的密切程度。用相关系数r来表示。特点可以了解现象间的相关方向和程度相关分析中所涉及的现象间地位是平等的,不存在自变量与因变量之分。相关表和相关图(例6.01)

相关系数单相关系数的含义是反映两变量之间的相关程度。总体相关系数用表示,样本相关系数用表示。单相关系数的公式总体相关系数公式6.01;样本相关系数公式6.02单相关系数的特点◆

r只是对x与y的线性相关关系的度量。◆

0r

1;◆

r=0时,x与y没有线性关系;◆

0r1,x与y存在一定的线性关系;◆

r=1,x与y完全线性相关;单相关系数的计算例6.02;练习6.01单相关系数的检验等级相关系数及其检验

复相关系数与偏相关系数

回归分析回归分析涵义根据相关关系的具体形态,选择一个恰当的数学模型,来近似地表达现象间的变化关系。特点变量地位不平等,自变量与因变量存在因果关系可以反映现象间的具体形态,并且根据变量变化可以推算在建立回归模型时,自变量必须是给定的相关分析与回归分析的联系与区别一元线性回归分析总体线性回归函数与回归直线方程样本回归函数与回归直线方程误差项的标准假定一元线性回归模型的估计回归系数的估计:例6.05;练习6.02标准误差的估计:公式6.03;例6.06;练习6.03一元线性回归模型的检验一元线性回归模型预测多元线性回归分析标准的多元线性回归模型多元线性回归模型的估计多元线性回归模型的检验多元线性回归模型的预测非线性回归分析非线性回归模型抛物线型采用差量法,如果Δxt接近于常数,Δy2t的绝对值也接近于常数时,变量y与x之间的关系表现为抛物线型。其公式为:双曲线型当变量y随变量x的增加而增加(或减少)时,而且最初增加(或减少)很快,以后逐渐趋缓,则判定变量间的关系存在双曲线趋势,可选用双曲线模型。其公式为:指数型当参数a>0,b>1时,曲线随着x值的增加而弯曲上升,趋于+∞;当a>0,0<b<1时,曲线随着x值的增加而弯曲下降趋于0,则变量x与y呈指数型。其公式为:

对数型随着变量x的增大,x的单位变动对因变量y的影响效果不断递减,这时变量x与y之间呈对数型关系。公式为:◆圆面积S与半径R的关系S=πR2◆价格P一定时,销售额Y与销售量X的关系Y=PX……◆函数关系:是反映现象之间严密的依存关系。表现为:

◆家庭收入与恩格尔系数,家庭收入高,则恩格尔系数低;◆粮食亩产量与每亩施肥量之间的关系,在一定范围内,施肥量多些,产量就高些;◆人体的体重与身高之间的关系,身高高些,体重就重些;◆居民家庭的人均收入与家庭的储蓄额之间的关系

;◆家长年龄与家庭收入之间的关系;

相关关系:反映变量之间的一种不完全确定的依存关系。表现为:联系二者具有共同的研究对象,且在应用中相互补充。相关分析依靠回归分析来表明现象间的相关程度。(只有显著以上的相关,进行回归分析才有意义)。区别◆相关分析可以反映现象间的相关方向与程度;但不能反映具体形态,也无法从一个变量的变化推测另一个变量的情况。(变量间无地位变化)。◆回归分析能反映现象间的具体形态,可以从一个变量的变化推出另一个变量的变化。(变量间有地位的变化)。相关表与相关图二者是研究相关关系的直观工具,利用它们可以大致地分析相关方向、形式与程度。相关表是一种反映变量之间相关关系的统计表。通常是将A变量按大小顺序排列,与之对应的B变量列入相应的表中。相关图(散点图)是将相关表的资料在坐标轴中描述出来的一系列点。

星期12345完成量(小时)4030208050单位成本(元)15.015.616.814.214.8上述资料整理得相关表完成量(小时)2030405080单位成本(元)16.815.615.014.814.2

例6.01:分析某公司劳务产品的完成量与其单位产品成本的关系,调查了该公司1周的资料,得到原始数据如下:劳务完成量(小时)平均单位成本(元)y17161514204050607030相关图x公式6.01公式6.02公式6.03公司序号销售总额(万元)x利润总额(万元)yABCDEFG16034044045068071080025907285231175201For

example6.02、603、605和606:万象集团公司下属子公司的销售总额与利润总额的资料如下:

解:由题可得:

直线方程为:

Practice6.01和6.02和6.03:

2000年我国部分省市自治区城镇居民人均消费性支出和人均可支配收入资料如下:省市可支配收入(元)x消费支出(元)y北京上海天津河北山西辽宁吉林江苏浙江安徽福建

1035011718814156614724535848106800927952947432

84948868612143493942435640215323702042335639合计

79567

62366资料来源:国家统计局中国统计摘要中国统计出版社2001解:由题可得:

NEXT6.03NEXT6.02单相关系数的检验建立假设原假设:对立假设:计算相关系数的t值

确定临界值。根据事先给定的显著性水平α和自由度(n-2),查找临界值。进行判断。若,表示r是显著的;若,表示r不显著。【例603】根据例602,当α=0.05时,r≈0.9961,试问该公司的销售收入与利润总额之间是否存在显著的线性相关关系?检验建立假设

原假设:对立假设:计算相关系数的t值

确定临界值α=0.05时,查表得进行判断因为,即,所以拒绝原假设,接受对立假设。等级相关系数等级相关是把品质标志表现或数量标志表现按等级次序排列,再测定标志等级间相关程度的一种方法。等级相关系数的公式为:其中x和y分别为两现象按大小(或优劣)排列的等级例6.04

等级相关系数的检验方法与单相关系数的检验方法相同例6.05例6.04

鑫利公司某车间的间的工作时间与产量的资料如下表所示。试计算并判断该公司生产车间的工作时间与产量的等级相关关系。

表工作时间与产量的资料工作时间(小时)产量(件)d=x-y原始数据排队等级x原始数据排队等级y653824325140403545303.53.52510.5-0.5000合计1519015-解:设工作时间的排序为x,产量的排序为y,则得说明该车间的工作时间与产量之间存在等级高度相同的正相关关系。例6.05

根据例6.04的资料,设α=0.05,试检验该车间的工作时间与产量之间是否存在显著的等级相关。

检验:建立假设原假设:对立假设:确定临界值α=0.05查表得:计算t统计量

比较判断因为,即,所以拒绝原假设,接受对立假设,即工作时间与产量存在高度显著的正相关关系。复相关系数偏相关系数居民可支配收入居民消费支出XY随机误差项:

ui=Yi-E(Yi)

总体回归模型总体回归线ui

Yi居民可支配收入居民消费支出xy残差项:

ei=yi-

样本回归模型

yiei样本回归线误差项的标准假定

误差项的期望值为0,即对所有的t有误差项的方差为常数,即对所有的t总有误差项之间不存在自相关关系,其协方差为0,即(独立性)。当时,有:自变量是给定的变量,与随机误差项线性无关。(独立性);随机误差项服从正态分布。误差项的期望值为0,即对所有的t有误差项的方差为常数,即对所有的t总有误差项之间不存在自相关关系,其协方差为0,即(独立性)。当时,有:自变量是给定的变量,与随机误差项线性无关。(独立性);随机误差项服从正态分布。回归系数的估计

残差越小越好。为了避免正负残差抵消,故取平方得:

和求偏导数,并令其等于零,即加以整理,得求解和的标准方程组:

整理得:解得:一元线性回归模型的检验理论意义的检验拟合优度检验拟合优度是指样本观测值聚集在样本回归线周围的紧密程度,通常用判定系数表示,它表示因变量中有多少是由自变量来决定的。判决系数的特征:(1)判决系数具有非负性(2)判决系数取值范围在0≤r2≤1。(3)判决系数是样本观测值的函数,是一个统计量。【例】根据例6.02的资料,计算判决系数。解:或显著性检验一方面是对回归系数的显著性进行检验,通常采用t检验;另一方面是对整个回归方程的显著性进行检验,采用F检验。(1)提出假设原假设:备选假设:(2)确定显著性水平α显著性水平的大小根据犯哪种错误的损失更大来决定,通常选择0.05或0.01。(3)计算回归系数的t统计量

(4)确定临界值根据显著性水平α和自由度(n-2),查t分布表得到临界值。

(5)比较判断

比较t统计量和临界值,如果,则接受对立假设;反之接受原假设。

【例】根据例6.02、例6.03、例6.05和例6.06的计算结果,以1%的显著性水平检验回归系数β1是否显著。检验:根据题意,需要进行双侧检验。(1)建立假设原假设:H0:β1=0备选假设:H1:β1≠0(2)显著性水平α=0.01,查t分布表得临界值。

(3)计算t统计量(4)比较判断因为,即,所以拒绝H0,接受H1,即回归系数β1是显著的。一元线性回归模型的预测回归点公式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论