统计基础第八章课件_第1页
统计基础第八章课件_第2页
统计基础第八章课件_第3页
统计基础第八章课件_第4页
统计基础第八章课件_第5页
已阅读5页,还剩147页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计基础----谢家发11/17/20221统计基础11/11/20221第八章

相关分析与回归分析相关关系与相关分析的一般问题相关关系的判断回归分析与线性回归应用相关分析与回归分析应注意的问题11/17/20222第八章

相关分析与回归分析相关关系与相关分析的一般问题11第一节

相关关系与相关

分析的一般问题

相关关系的一般问题相关分析的一般问题11/17/20223第一节

相关关系与相关

分析的一般问题相关关系的一般问题一、相关关系的一般问题相关关系的含义及特点

相关关系的种类

11/17/20224一、相关关系的一般问题相关关系的含义及特点11/11/20(一)相关关系的含义及特点相关关系的含义相关关系的特点11/17/20225(一)相关关系的含义及特点相关关系的含义11/11/20221.相关关系的含义函数关系是指变量之间客观存在的、完全确定的依存关系。就是说变量之间的关系值是固定的,即当自变量取一个值时,因变量就有一个完全确定的值与它对应。函数关系通常可以用数学公式确切地表现出来。相关关系是指现象之间客观存在的、不完全确定的依存关系。就是说现象之间的关系值不是固定的,即当一个现象发生数量变化时,与它相关联的另一个现象虽然也发生相应的数量变化,但其关系值却是不固定的,往往同时出现几个不同的数值,在一定范围内变动着,这些数值分布在它们的平均数周围。11/17/202261.相关关系的含义函数关系相关关系11/11/20226例如,某地区有关国内生产总值与固定资产投资资料年份固定资产投资

GDP固定资产投资增长量

GDP增长量

198919901991199219931994199519961997199844455580130170200229249284169185216266346467584678744783-11025504030292035-1631508012111794663911/17/20227例如,某地区有关国内生产总值与固定资产投资资料年份固定资产投2.相关关系的特点现象之间确实存在着数量上的依存关系

现象之间数量上的关系不是确定的

11/17/202282.相关关系的特点现象之间确实存在着数量上的依存关系现象之(二)相关关系的种类11/17/20229(二)相关关系的种类11/11/20229例如11/17/202210例如11/11/20221011/17/20221111/11/20221111/17/20221211/11/202212二、相关分析的一般问题相关分析的含义相关分析的作用相关分析的内容

11/17/202213二、相关分析的一般问题相关分析的含义11/11/202213(一)相关分析的含义对现象之间相关关系密切程度和变化规律的研究以及对现象变动的影响因素和作用程度的分析就叫相关分析。相关分析的研究对象是相关关系

函数关系是相关分析的工具

11/17/202214(一)相关分析的含义对现象之间相关关系密切程度和变化规律的研(二)相关分析的作用确定现象之间是否存在依存关系

确定相关关系的表现形式

判断相关关系的密切程度和方向

11/17/202215(二)相关分析的作用确定现象之间是否存在依存关系11/11(三)相关分析的内容

在定性与定量分析的基础上,正确选择变量,确定变量之间有无相关关系,并确定相关关系的表现形式、密切程度、变化规律、变动方向等;对具有相关关系的变量如何建立它们之间的数学模型或回归方程,并对建立的数学模型以及参数或回归系数进行相关性检验;根据一个或几个变量的数值,预测或控制另一个变量的数值,并且了解这种预测或控制的精确度。11/17/202216(三)相关分析的内容在定性与定量分析的基础上,正确选择变量第二节

相关关系的判断定性分析判断

相关图表判断

相关系数判断

11/17/202217第二节

相关关系的判断定性分析判断11/11/202217一、定性分析判断

在相关关系判断中,如果对客观现象和事物进行了定性分析之后,能够肯定它们之间确实没有什么内在联系,那么也就没有必要再去对它们进行相关分析了。11/17/202218一、定性分析判断在相关关系判断中,如果对客观现象和事物进行二、相关图表判断

相关表判断相关图判断11/17/202219二、相关图表判断相关表判断相关图判断11/11/20221(一)相关表判断

将现象之间的相互依存关系通过表格形式来反映,这样一种表格就叫相关表。编制相关表时,要求变量值按照大小顺序一一对应排列。11/17/202220(一)相关表判断将现象之间的相互依存关系通过表格形简单相关表。它是指各个变量值没有进行分组归类,只是按照自变量数值从小到大顺序,因变量数值与之逐一对应排列的相关表。

单变量分组相关表。是指只按自变量分组并计算次数,而对应的因变量不分组,只计算与自变量数值所在组对应的因变量数值的平均数。

双变量分组相关表。是指对两个变量都进行分组,交叉排列,并列出两个变量各组间共同次数的分配数列,这种特殊的数列就叫双变量分组相关表。

11/17/202221简单相关表。它是指各个变量值没有进行分组归类,只是按照自变量(二)相关图判断

运用图形的方式来反映客观现象之间的相互依存关系,从而直观判断各变量之间所存在的相关形态、方向和密切程度,这种图形就叫相关图。

11/17/202222(二)相关图判断运用图形的方式来反映客观现象之间的相互依存三、相关系数判断相关系数的意义

相关系数的计算

用CORREL函数求相关系数

相关系数的显著性检验

11/17/202223三、相关系数判断相关系数的意义11/11/202223(一)相关系数的意义相关系数则是专门用来说明两个变量之间相关关系密切程度的指标,它可以更概括、更准确地说明其相关的程度。

11/17/202224(一)相关系数的意义相关系数则是专门用来说明两个变量之间相关(二)相关系数的计算11/17/202225(二)相关系数的计算11/11/202225例,据某公司员工的受教育时间以及收入水平资料,计算相关系数,并进行相关分析判断。

受教育时间x收入水平(元)yx2y2xy812141516171819202116024399258873162531685482265952765128725206431365000488310641441962252562893243614004412700595311201670136769100014062510039392252325747076354346372942416563845259150400413616196942250000002700070737819519231064444275047527577161610119591172304137788012862601365000840888011/17/202226例,据某公司员工的受教育时间以及收入水平资料,计算相关系数,解:11/17/202227解:11/11/202227相关系数的性质

当|r|=1时,x与y变量为完全线性相关,x与y之间存在着确定的函数关系。当0<|r|<1时,表示x与y存在着一定的线性相关。|r|的数值越大,越接近于1,表示x与y直线相关程度越高;反之,|r|的数值越小,越接近于0,表示x与y直线相关程度越低。一般划分为如下几个范围,即:|r|<0.3称为微弱相关0.3≤|r|<0.5称为低度相关0.5≤|r|<0.8称为显著相关0.8≤|r|<1称为高度相关11/17/202228相关系数的性质当|r|=1时,x与y变量为完全线性相关,x(三)用CORREL函数求相关系数在EXCEL中有一个专用于求相关系数的函数CORREL。使用此函数,只需输入两个变量所有原始数据的起止行列号,不必进行表上各项运算,即可求得相关系数。特别在数组多并数据大的情况下,使用CORREL函数计算相关系数,则显得非常简便,结果准确。

11/17/202229(三)用CORREL函数求相关系数在EXCEL中有一个专用于(四)相关系数的显著性检验用样本相关系数估计总体相关系数时,就有一个它能否具有代表性的问题,这就需要对样本相关系数进行显著性检验。检验的方法是,先计算t统计量,其计算公式是:

11/17/202230(四)相关系数的显著性检验用样本相关系数估计总体相关系数时,例如,依据上例资料,进行显著性检验。11/17/202231例如,依据上例资料,进行显著性检验。11/11/202231第三节

回归分析与线性回归回归分析与相关分析的区别和联系

一元线性回归模型

估计标准误差

案例

多元线性回归模型

非线性回归模型

11/17/202232第三节

回归分析与线性回归回归分析与相关分析的区别和联系1一、回归分析与相关分析

的区别和联系回归分析的意义

回归分析与相关分析的区别与联系

11/17/202233一、回归分析与相关分析

的区别和联系回归分析的意义(一)回归分析的意义回归分析就是针对存在相关关系的两个或两个以上变量之间数量变化的形态,选择一个合适的数学模型来描述它们之间的平均变化关系,并据此进行变量之间的相互推算和预测的一种统计分析方法。

11/17/202234(一)回归分析的意义回归分析就是针对存在相关关系的两个或两个(二)回归分析与相关分析的区别与联系区别相关分析的各个变量是对等的,而回归分析的各个变量必须明确谁是自变量,谁是因变量;只有两个变量的依存关系中,在进行相关分析时,无论x与y的地位怎样变化,都只能计算一个而且相等的反映两个变量之间相关密切程度的相关系数,而在进行回归分析时,则会因x与y地位的改变,建立两个不同的回归方程;相关分析时要求两个变量都是随机变量,而回归分析时则要求自变量是可以控制的的变量,因变量是随机变量。联系相关分析是回归分析的基础和前提;回归分析是相关分析的深入和继续。11/17/202235(二)回归分析与相关分析的区别与联系区别联系11/11/20二、一元线性回归模型一元线性回归模型的概念

配合最佳的回归直线模型的条件

用未分组资料配合回归直线模型

用分组资料配合回归直线模型

用INTERCEPT函数求截距,SLOPE函数求斜率

11/17/202236二、一元线性回归模型一元线性回归模型的概念11/11/20(一)一元线性回归模型的概念通过测定相关系数,了解到两组数据之间相关关系的密切程度和方向,并且在相关图上各相关点近似地表现为一条直线,就可以拟合一元线性回归模型。其模型为:11/17/202237(一)一元线性回归模型的概念通过测定相关系数,了解到两组数据式中,a表示直线在y轴上的截距,即自变量x取值为0时因变量y的估计值;b表示直线的斜率,称为y对x的回归系数,表明x每增加一个单位时,影响y平均增加的数量;是在自变量x取值一定时因变量y的估计值,或称理论值、趋势值。其中:a和b是表示确定回归直线模型的两个待定参数。要确定上述具体的回归方程,关键是求出a、b两个参数的值。

11/17/202238式中,a表示直线在y轴上的截距,即自变量x取值为0时因变量y求解a、b参数的公式为:

11/17/202239求解a、b参数的公式为:11/11/202239(二)配合最佳的回归直线模型的条件配合最佳的回归直线模型的首要条件是两个变量之间确实存在显著的相关关系,并且是直线相关关系;其次是a、b两个参数运用了最小平方法来确定。

11/17/202240(二)配合最佳的回归直线模型的条件配合最佳的回归直(三)用未分组资料配合回归直线模型根据前例资料拟合直线回归模型如下:

11/17/202241(三)用未分组资料配合回归直线模型根据前例资料拟合直线回归模

根据下列线性模型:

对前例进行回归推测不同受教育时间条件下的收入水平,结果见下表所示。11/17/202242

根据下列线性模型:

受教育时间(年)平均收入水平(元)收入水平趋势值

8121415161718192021

24399258873162531685482265952765128725206431365000

14775318034031744574488315308857345616026585970116

16048831048831011/17/202243受教育时间(年)平均收入水平(元)收入水平趋势值8243911/17/20224411/11/202244(四)用分组资料配合回归直线模型只要对各变量数值求和过程中进行加权即可,其计算a、b两个参数的计算公式可以表示为:11/17/202245(四)用分组资料配合回归直线模型只要对各变量数值求和过程中进例如:xfyxfyfx2fxyf

8121415161718192021

531906116591192721

24399258873162531685482265952765128725206431365000

42422808417409441871625134021129314749185301897503675460284533465479758615219580401286266500033922736011762610015104317929169747800441103451765902236026565005513190045525344111315491055073637202760257252013650001604744883106395163148369021523550384511/17/202246例如:xfyxfyfx2fxyf8532439942412解:11/17/202247解:11/11/202247根据上述线性模型对前例进行回归推测不同受教育时间条件下的收入水平,结果见下表所示。xfyyf趋势值加权趋势值8121415161718192021

53190611659119272124399258873162531685482265952765128725206431365000129314749185301897503675460284533465479758615219580401286266500012948285883640840318442284813852047559575986763777686260543170921844746768512609428529513468427151084811973463777160474488310163148364422761631499311/17/202248根据上述线性模型对前例进行回归推测不同受教育时间条件下的收入(五)用INTERCEPT函数求截距,SLOPE函数求斜率在EXCEL中,有一个求截距的函数INTERCEPT和一个求斜率的函数SLOPE。

11/17/202249(五)用INTERCEPT函数求截距,SLOPE函数求斜率在三、估计标准误差估计标准误差的意义估计标准误差的计算方法

估计标准误差与相关系数的关系用LINEST函数建立直线回归模型并检验

11/17/202250三、估计标准误差估计标准误差的意义11/11/202250(一)估计标准误差的意义趋势值与真正的实际值之间可能没有误差,也可能误差很小,也可能误差很大。数值越大说明拟合的直线回归方程代表性越强;估计标准误差就是说明直线回归方程代表性的指标。11/17/202251(一)估计标准误差的意义趋势值与真正的实际值之间可能没有误差(二)估计标准误差的计算方法11/17/202252(二)估计标准误差的计算方法11/11/202252例如,仍依据前例资料计算估计标准误差。11/17/202253例如,仍依据前例资料计算估计标准误差。11/11/20225(三)估计标准误差与相关系数的关系11/17/202254(三)估计标准误差与相关系数的关系11/11/202254(四)用LINEST函数建立直线回归模型并检验将前表三列资料依次输入到EXCEL工作表中的A列、B列和C列后,选定D、E两列的2至6行作为记录计算结果的位置;在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框;在“粘贴函数”对话框的左侧选择“统计”,右侧选择“LINEST”,回车进入“LINEST”对话框;在“LINEST”对话框中并列有四个框。在第一个Known-y´s框中输入“C2:C11”,在第二个Known-x´s框中输入“A2:A11”。在第三个Sonst框中输入“TRUE”,在第四个Stats框中输入“TRUE”;按Ctrl+Shift+Enter组合键结束操作,得各种计算结果如下表所示。

11/17/202255(四)用LINEST函数建立直线回归模型并检验将前表三列资料参数计算表

斜率4256.571429-19274.14截距斜率的标准差743.703163212220.29截距的标准差判定系数0.8037206838799.6145估计标准误差F统计量32.758242528自由度回归平方和SSR2536576046619465722剩余平方和SSE11/17/202256参数计算表斜率4256.571429-19274.14截检验如下:11/17/202257检验如下:11/11/202257四、案例现有某公司下属12个企业的产量和生产费用资料如下表所示。要求充分运用EXCEL统计分析软件的运算功能,绘制相关图、计算相关系数、建立回归方程并估计各企业的生产费用、计算标准误差并在显著性水平为0.05条件下对系数、方程等进行显著性检验。11/17/202258四、案例现有某公司下属12个企业的产量和生产费用资料如下表所某公司下属12个企业的产量和生产费用资料

企业编号产量(千件)生产费用(千元)1234567891011124042505565788410011612513014013015015514015015416517016718017518511/17/202259某公司下属12个企业的产量和生产费用资料企业编号产量(千件1.用EXCEL统计分析软件绘制相关图

11/17/2022601.用EXCEL统计分析软件绘制相关图11/11/2022.用EXCEL统计分析软件计算相关系数

r=0.92023211/17/2022612.用EXCEL统计分析软件计算相关系数r=0.92023.用EXCEL统计分析软件建立回归方程

11/17/2022623.用EXCEL统计分析软件建立回归方程11/11/204.用EXCEL统计分析软件计算标准误差sy=6.76211/17/2022634.用EXCEL统计分析软件计算标准误差sy=6.76215.用EXCEL统计分析软件检验相关系数、回归方程、回归系数的显著性

相关系数显著性检验

回归方程显著性检验

回归系数显著性检验

11/17/2022645.用EXCEL统计分析软件检验相关系数、回归方程、回归系(1)相关系数显著性检验

按自由度10,显著性水平0.05,查t分布表,得t临界值为1.81,t统计量大于t临界值,说明产量与生产费用之间的相关系数是显著的。11/17/202265(1)相关系数显著性检验按自由度10,显著性水平0.05,(2)回归方程显著性检验

按第一自由度1、第二自由度10,显著性水平0.05,查F分布表,得F临界值为4.96,F统计量远大于F临界值,即知道产量与生产费用之间的线性关系是显著的。

11/17/202266(2)回归方程显著性检验按第一自由度1、第二自由度10,显(3)回归系数显著性检验按自由度10,显著性水平0.05,查t分布表,得t临界值为1.81,t统计量远大于t临界值,说明产量与生产费用之间的回归系数是显著的。11/17/202267(3)回归系数显著性检验按自由度10,显著性水平0.05,查五、多元线性回归模型多元线性回归,就是一个因变量的变动同时要受到两个或两个以上自变量变动的影响,这种依存关系可用多元线性回归方程表示为:11/17/202268五、多元线性回归模型多元线性回归,就是一个因变量的变动同时要在上式中,参数a表示截距,参数bi表示斜率,求此参数要涉及多个变量,因此斜率、截距的计算其难度和复杂程度都是很大的。但如果运用EXCEL统计分析软件来处理则是非常容易的。但需要注意的是,其回归模型与上式不同,即:11/17/202269在上式中,参数a表示截距,参数bi表示斜率,求此参数要涉及多六、非线性回归模型抛物线回归模型

双曲线回归模型

幂曲线回归模型指数曲线回归模型多项式曲线回归模型龚珀兹曲线回归模型皮尔曲线回归模型

11/17/202270六、非线性回归模型抛物线回归模型11/11/202270(一)抛物线回归模型许多现象的变化往往会呈现近似于抛物线形态,适合于拟合抛物线模型。它的回归模型可表示为:11/17/202271(一)抛物线回归模型许多现象的变化往往会呈现近似于抛物线形态例如,某农业研究所研制出了一种特效复合肥,并进行了试验,在其它条件相同的前提下,选择了10个地块进行施用,结果如下表所示。

施肥量x平均单产yx2x3x4xyx2y理论值024681012141618

258329452500536562548503461398

04163664100144196256324

086421651210001728274440965832

0162561296409610000207363841665536104976

065818083000428856206576704273767164

0131672321800034304562007891298588118016128952

260296334376420467517569625683

90454711401620024532843532541520454711/17/202272例如,某农业研究所研制出了一种特效复合肥,并进行了试验,在其解:11/17/202273解:11/11/20227311/17/20227411/11/202274(二)双曲线回归模型11/17/202275(二)双曲线回归模型11/11/202275第四节

相关分析与回归分

析中需注意的问题定性分析是定量分析的基础

要注意现象质的界限及相关关系作用的范围

从实际出发,具体问题具体分析,不可机械照搬

要考虑社会经济现象的复杂性

对回归模型中计算出来的参数的有效性应进行检验

11/17/202276第四节

相关分析与回归分

析中需注意的问题定性分析是定量分析统计基础----谢家发11/17/202277统计基础11/11/20221第八章

相关分析与回归分析相关关系与相关分析的一般问题相关关系的判断回归分析与线性回归应用相关分析与回归分析应注意的问题11/17/202278第八章

相关分析与回归分析相关关系与相关分析的一般问题11第一节

相关关系与相关

分析的一般问题

相关关系的一般问题相关分析的一般问题11/17/202279第一节

相关关系与相关

分析的一般问题相关关系的一般问题一、相关关系的一般问题相关关系的含义及特点

相关关系的种类

11/17/202280一、相关关系的一般问题相关关系的含义及特点11/11/20(一)相关关系的含义及特点相关关系的含义相关关系的特点11/17/202281(一)相关关系的含义及特点相关关系的含义11/11/20221.相关关系的含义函数关系是指变量之间客观存在的、完全确定的依存关系。就是说变量之间的关系值是固定的,即当自变量取一个值时,因变量就有一个完全确定的值与它对应。函数关系通常可以用数学公式确切地表现出来。相关关系是指现象之间客观存在的、不完全确定的依存关系。就是说现象之间的关系值不是固定的,即当一个现象发生数量变化时,与它相关联的另一个现象虽然也发生相应的数量变化,但其关系值却是不固定的,往往同时出现几个不同的数值,在一定范围内变动着,这些数值分布在它们的平均数周围。11/17/2022821.相关关系的含义函数关系相关关系11/11/20226例如,某地区有关国内生产总值与固定资产投资资料年份固定资产投资

GDP固定资产投资增长量

GDP增长量

198919901991199219931994199519961997199844455580130170200229249284169185216266346467584678744783-11025504030292035-1631508012111794663911/17/202283例如,某地区有关国内生产总值与固定资产投资资料年份固定资产投2.相关关系的特点现象之间确实存在着数量上的依存关系

现象之间数量上的关系不是确定的

11/17/2022842.相关关系的特点现象之间确实存在着数量上的依存关系现象之(二)相关关系的种类11/17/202285(二)相关关系的种类11/11/20229例如11/17/202286例如11/11/20221011/17/20228711/11/20221111/17/20228811/11/202212二、相关分析的一般问题相关分析的含义相关分析的作用相关分析的内容

11/17/202289二、相关分析的一般问题相关分析的含义11/11/202213(一)相关分析的含义对现象之间相关关系密切程度和变化规律的研究以及对现象变动的影响因素和作用程度的分析就叫相关分析。相关分析的研究对象是相关关系

函数关系是相关分析的工具

11/17/202290(一)相关分析的含义对现象之间相关关系密切程度和变化规律的研(二)相关分析的作用确定现象之间是否存在依存关系

确定相关关系的表现形式

判断相关关系的密切程度和方向

11/17/202291(二)相关分析的作用确定现象之间是否存在依存关系11/11(三)相关分析的内容

在定性与定量分析的基础上,正确选择变量,确定变量之间有无相关关系,并确定相关关系的表现形式、密切程度、变化规律、变动方向等;对具有相关关系的变量如何建立它们之间的数学模型或回归方程,并对建立的数学模型以及参数或回归系数进行相关性检验;根据一个或几个变量的数值,预测或控制另一个变量的数值,并且了解这种预测或控制的精确度。11/17/202292(三)相关分析的内容在定性与定量分析的基础上,正确选择变量第二节

相关关系的判断定性分析判断

相关图表判断

相关系数判断

11/17/202293第二节

相关关系的判断定性分析判断11/11/202217一、定性分析判断

在相关关系判断中,如果对客观现象和事物进行了定性分析之后,能够肯定它们之间确实没有什么内在联系,那么也就没有必要再去对它们进行相关分析了。11/17/202294一、定性分析判断在相关关系判断中,如果对客观现象和事物进行二、相关图表判断

相关表判断相关图判断11/17/202295二、相关图表判断相关表判断相关图判断11/11/20221(一)相关表判断

将现象之间的相互依存关系通过表格形式来反映,这样一种表格就叫相关表。编制相关表时,要求变量值按照大小顺序一一对应排列。11/17/202296(一)相关表判断将现象之间的相互依存关系通过表格形简单相关表。它是指各个变量值没有进行分组归类,只是按照自变量数值从小到大顺序,因变量数值与之逐一对应排列的相关表。

单变量分组相关表。是指只按自变量分组并计算次数,而对应的因变量不分组,只计算与自变量数值所在组对应的因变量数值的平均数。

双变量分组相关表。是指对两个变量都进行分组,交叉排列,并列出两个变量各组间共同次数的分配数列,这种特殊的数列就叫双变量分组相关表。

11/17/202297简单相关表。它是指各个变量值没有进行分组归类,只是按照自变量(二)相关图判断

运用图形的方式来反映客观现象之间的相互依存关系,从而直观判断各变量之间所存在的相关形态、方向和密切程度,这种图形就叫相关图。

11/17/202298(二)相关图判断运用图形的方式来反映客观现象之间的相互依存三、相关系数判断相关系数的意义

相关系数的计算

用CORREL函数求相关系数

相关系数的显著性检验

11/17/202299三、相关系数判断相关系数的意义11/11/202223(一)相关系数的意义相关系数则是专门用来说明两个变量之间相关关系密切程度的指标,它可以更概括、更准确地说明其相关的程度。

11/17/2022100(一)相关系数的意义相关系数则是专门用来说明两个变量之间相关(二)相关系数的计算11/17/2022101(二)相关系数的计算11/11/202225例,据某公司员工的受教育时间以及收入水平资料,计算相关系数,并进行相关分析判断。

受教育时间x收入水平(元)yx2y2xy812141516171819202116024399258873162531685482265952765128725206431365000488310641441962252562893243614004412700595311201670136769100014062510039392252325747076354346372942416563845259150400413616196942250000002700070737819519231064444275047527577161610119591172304137788012862601365000840888011/17/2022102例,据某公司员工的受教育时间以及收入水平资料,计算相关系数,解:11/17/2022103解:11/11/202227相关系数的性质

当|r|=1时,x与y变量为完全线性相关,x与y之间存在着确定的函数关系。当0<|r|<1时,表示x与y存在着一定的线性相关。|r|的数值越大,越接近于1,表示x与y直线相关程度越高;反之,|r|的数值越小,越接近于0,表示x与y直线相关程度越低。一般划分为如下几个范围,即:|r|<0.3称为微弱相关0.3≤|r|<0.5称为低度相关0.5≤|r|<0.8称为显著相关0.8≤|r|<1称为高度相关11/17/2022104相关系数的性质当|r|=1时,x与y变量为完全线性相关,x(三)用CORREL函数求相关系数在EXCEL中有一个专用于求相关系数的函数CORREL。使用此函数,只需输入两个变量所有原始数据的起止行列号,不必进行表上各项运算,即可求得相关系数。特别在数组多并数据大的情况下,使用CORREL函数计算相关系数,则显得非常简便,结果准确。

11/17/2022105(三)用CORREL函数求相关系数在EXCEL中有一个专用于(四)相关系数的显著性检验用样本相关系数估计总体相关系数时,就有一个它能否具有代表性的问题,这就需要对样本相关系数进行显著性检验。检验的方法是,先计算t统计量,其计算公式是:

11/17/2022106(四)相关系数的显著性检验用样本相关系数估计总体相关系数时,例如,依据上例资料,进行显著性检验。11/17/2022107例如,依据上例资料,进行显著性检验。11/11/202231第三节

回归分析与线性回归回归分析与相关分析的区别和联系

一元线性回归模型

估计标准误差

案例

多元线性回归模型

非线性回归模型

11/17/2022108第三节

回归分析与线性回归回归分析与相关分析的区别和联系1一、回归分析与相关分析

的区别和联系回归分析的意义

回归分析与相关分析的区别与联系

11/17/2022109一、回归分析与相关分析

的区别和联系回归分析的意义(一)回归分析的意义回归分析就是针对存在相关关系的两个或两个以上变量之间数量变化的形态,选择一个合适的数学模型来描述它们之间的平均变化关系,并据此进行变量之间的相互推算和预测的一种统计分析方法。

11/17/2022110(一)回归分析的意义回归分析就是针对存在相关关系的两个或两个(二)回归分析与相关分析的区别与联系区别相关分析的各个变量是对等的,而回归分析的各个变量必须明确谁是自变量,谁是因变量;只有两个变量的依存关系中,在进行相关分析时,无论x与y的地位怎样变化,都只能计算一个而且相等的反映两个变量之间相关密切程度的相关系数,而在进行回归分析时,则会因x与y地位的改变,建立两个不同的回归方程;相关分析时要求两个变量都是随机变量,而回归分析时则要求自变量是可以控制的的变量,因变量是随机变量。联系相关分析是回归分析的基础和前提;回归分析是相关分析的深入和继续。11/17/2022111(二)回归分析与相关分析的区别与联系区别联系11/11/20二、一元线性回归模型一元线性回归模型的概念

配合最佳的回归直线模型的条件

用未分组资料配合回归直线模型

用分组资料配合回归直线模型

用INTERCEPT函数求截距,SLOPE函数求斜率

11/17/2022112二、一元线性回归模型一元线性回归模型的概念11/11/20(一)一元线性回归模型的概念通过测定相关系数,了解到两组数据之间相关关系的密切程度和方向,并且在相关图上各相关点近似地表现为一条直线,就可以拟合一元线性回归模型。其模型为:11/17/2022113(一)一元线性回归模型的概念通过测定相关系数,了解到两组数据式中,a表示直线在y轴上的截距,即自变量x取值为0时因变量y的估计值;b表示直线的斜率,称为y对x的回归系数,表明x每增加一个单位时,影响y平均增加的数量;是在自变量x取值一定时因变量y的估计值,或称理论值、趋势值。其中:a和b是表示确定回归直线模型的两个待定参数。要确定上述具体的回归方程,关键是求出a、b两个参数的值。

11/17/2022114式中,a表示直线在y轴上的截距,即自变量x取值为0时因变量y求解a、b参数的公式为:

11/17/2022115求解a、b参数的公式为:11/11/202239(二)配合最佳的回归直线模型的条件配合最佳的回归直线模型的首要条件是两个变量之间确实存在显著的相关关系,并且是直线相关关系;其次是a、b两个参数运用了最小平方法来确定。

11/17/2022116(二)配合最佳的回归直线模型的条件配合最佳的回归直(三)用未分组资料配合回归直线模型根据前例资料拟合直线回归模型如下:

11/17/2022117(三)用未分组资料配合回归直线模型根据前例资料拟合直线回归模

根据下列线性模型:

对前例进行回归推测不同受教育时间条件下的收入水平,结果见下表所示。11/17/2022118

根据下列线性模型:

受教育时间(年)平均收入水平(元)收入水平趋势值

8121415161718192021

24399258873162531685482265952765128725206431365000

14775318034031744574488315308857345616026585970116

16048831048831011/17/2022119受教育时间(年)平均收入水平(元)收入水平趋势值8243911/17/202212011/11/202244(四)用分组资料配合回归直线模型只要对各变量数值求和过程中进行加权即可,其计算a、b两个参数的计算公式可以表示为:11/17/2022121(四)用分组资料配合回归直线模型只要对各变量数值求和过程中进例如:xfyxfyfx2fxyf

8121415161718192021

531906116591192721

24399258873162531685482265952765128725206431365000

42422808417409441871625134021129314749185301897503675460284533465479758615219580401286266500033922736011762610015104317929169747800441103451765902236026565005513190045525344111315491055073637202760257252013650001604744883106395163148369021523550384511/17/2022122例如:xfyxfyfx2fxyf8532439942412解:11/17/2022123解:11/11/202247根据上述线性模型对前例进行回归推测不同受教育时间条件下的收入水平,结果见下表所示。xfyyf趋势值加权趋势值8121415161718192021

53190611659119272124399258873162531685482265952765128725206431365000129314749185301897503675460284533465479758615219580401286266500012948285883640840318442284813852047559575986763777686260543170921844746768512609428529513468427151084811973463777160474488310163148364422761631499311/17/2022124根据上述线性模型对前例进行回归推测不同受教育时间条件下的收入(五)用INTERCEPT函数求截距,SLOPE函数求斜率在EXCEL中,有一个求截距的函数INTERCEPT和一个求斜率的函数SLOPE。

11/17/2022125(五)用INTERCEPT函数求截距,SLOPE函数求斜率在三、估计标准误差估计标准误差的意义估计标准误差的计算方法

估计标准误差与相关系数的关系用LINEST函数建立直线回归模型并检验

11/17/2022126三、估计标准误差估计标准误差的意义11/11/202250(一)估计标准误差的意义趋势值与真正的实际值之间可能没有误差,也可能误差很小,也可能误差很大。数值越大说明拟合的直线回归方程代表性越强;估计标准误差就是说明直线回归方程代表性的指标。11/17/2022127(一)估计标准误差的意义趋势值与真正的实际值之间可能没有误差(二)估计标准误差的计算方法11/17/2022128(二)估计标准误差的计算方法11/11/202252例如,仍依据前例资料计算估计标准误差。11/17/2022129例如,仍依据前例资料计算估计标准误差。11/11/20225(三)估计标准误差与相关系数的关系11/17/2022130(三)估计标准误差与相关系数的关系11/11/202254(四)用LINEST函数建立直线回归模型并检验将前表三列资料依次输入到EXCEL工作表中的A列、B列和C列后,选定D、E两列的2至6行作为记录计算结果的位置;在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框;在“粘贴函数”对话框的左侧选择“统计”,右侧选择“LINEST”,回车进入“LINEST”对话框;在“LINEST”对话框中并列有四个框。在第一个Known-y´s框中输入“C2:C11”,在第二个Known-x´s框中输入“A2:A11”。在第三个Sonst框中输入“TRUE”,在第四个Stats框中输入“TRUE”;按Ctrl+Shift+Enter组合键结束操作,得各种计算结果如下表所示。

11/17/2022131(四)用LINEST函数建立直线回归模型并检验将前表三列资料参数计算表

斜率4256.571429-19274.14截距斜率的标准差743.703163212220.29截距的标准差判定系数0.8037206838799.6145估计标准误差F统计量32.758242528自由度回归平方和SSR2536576046619465722剩余平方和SSE11/17/2022132参数计算表斜率4256.571429-19274.14截检验如下:11/17/2022133检验如下:11/11/202257四、案例现有某公司下属12个企业的产量和生产费用资料如下表所示。要求充分运用EXCEL统计分析软件的运算功能,绘制相关图、计算相关系数、建立回归方程并估计各企业的生产费用、计算标准误差并在显著性水平为0.05条件下对系数、方程等进行显著性检验。11/17/2022134四、案例现有某公司下属12个企业的产量和生产费用资料如下表所某公司下属12个企业的产量和生产费用资料

企业编号产量(千件)生产费用(千元)1234567891011124042505565788410011612513014013015015514015015416517016718017518511/17/2022135某公司下属12个企业的产量和生产费用资料企业编号产量(千件1.用EXCEL统计分析软件绘制相关图

11/17/20221361.用EXC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论