




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、相关分析相关分析线性回归分析线性回归分析提纲提纲相关分析相关分析偏相关分析偏相关分析回归分析回归分析曲线估计曲线估计4321一、相关分析一、相关分析 一一. 变量相关的概念变量相关的概念 二二. 相关系数及其计算相关系数及其计算变量间的关系变量间的关系函数关系函数关系1. 是一一对应的确定关系是一一对应的确定关系 设有两个变量设有两个变量 x 和和 y ,变量,变量 y 随变量随变量 x 一起变化,并完一起变化,并完全依赖于全依赖于 x ,当变量,当变量 x 取某取某个数值时,个数值时, y 依确定的关系依确定的关系取相应的值,则称取相应的值,则称 y 是是 x 的的函数,记为函数,记为 y
2、= f (x),其中,其中 x 称为自变量,称为自变量,y 称为因变量称为因变量2. 各观测点落在一条线上各观测点落在一条线上 函数关系的例子函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)圆的面积(S)与半径之间的关系可表示为 S = R2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 相关关系的例子相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(
3、x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系变量间的关系变量间的关系相关关系相关关系 1.变量间关系不能用函数关系变量间关系不能用函数关系精确表达精确表达 2.一个变量的取值不能由另一一个变量的取值不能由另一个变量唯一确定个变量唯一确定 3.当变量当变量 x 取某个值时,变量取某个值时,变量 y 的取值可能有几个的取值可能有几个4.各观测点分布在直线周围各观测点分布在直线周围 相关关系和函数关系的联系相关关系和函数关系的联系 函数关系在实际中往往通过相关关系表现出来函数关系在实际中往往通过相关关系表现出来 相关关系常常要使用函数关系的形式来
4、表现,以相关关系常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式便找到相关关系的一般数量表现形式相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关相关关系的图示相关关系的图示相关关系的测度相关关系的测度相关系数相关系数1.对变量之间关系密切程度的度量对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单对两个变量之间线性相关程度的度量称为简单相关系数相关系数3.若相关系数是根据总体全部数据计算的,称为若相关系数是根据总体全部数据计算的,称为总体相关系数,
5、记为总体相关系数,记为4.若是根据样本数据计算的,则称为样本相关系若是根据样本数据计算的,则称为样本相关系数,记为数,记为 r 相关系数的计算相关系数的计算 样本相关系数的计算公式样本相关系数的计算公式22)()()(yyxxyyxxr2222 yynxxnyxxynr相关系数取值及其意义相关系数取值及其意义1. r 的取值范围是的取值范围是 -1,12. |r|=1,为完全相关为完全相关r =1,为完全正相关,为完全正相关r =-1,为完全负正相关,为完全负正相关3. r = 0,不存在不存在线性相关线性相关关系关系4. -1 r0,为负相关为负相关5. 0t,拒绝,拒绝H0 若若tt,接受
6、,接受H0)2(122ntrnrt示例示例 对前例计算的相关系数进行显著性检对前例计算的相关系数进行显著性检(0.05)1. 提出假设:提出假设:H0: ;H1: 02. 计算检验的统计量计算检验的统计量9809.649987. 012139987. 02t相关分析相关分析SPSS操作操作案例案例为研究高等院校人文社会科学研究中立项课题数受为研究高等院校人文社会科学研究中立项课题数受哪些因素的影响,收集到某年哪些因素的影响,收集到某年31个省市自治区部分个省市自治区部分高校有关社科研究方面的数据,研究高校有关社科研究方面的数据,研究立项课题数立项课题数(当年)(当年)与与投入的具有高级职称的人
7、年数(上年)投入的具有高级职称的人年数(上年)、发表的论文数(上年)发表的论文数(上年)之间是否具有较强的线性关之间是否具有较强的线性关系。系。思路思路 1、绘制、绘制散点图散点图,直观展现变量之间的统计关系,直观展现变量之间的统计关系 图形图形旧对话框旧对话框散点散点矩阵分布矩阵分布 选取相应变量到选取相应变量到“矩阵变量矩阵变量”中中 2、计算、计算相关系数相关系数,以数值的方式反映变量间线,以数值的方式反映变量间线性相关的强弱程度性相关的强弱程度 分析分析相关相关双变量双变量 选择参加相关系数的变量到选择参加相关系数的变量到“变量变量”中中 选择计算哪种相关系数选择计算哪种相关系数练习练
8、习1 利用利用SPSS软件完成软件完成【例例8.1】二、偏相关分析二、偏相关分析 1、分析、分析相关相关偏相关偏相关 2、选择参与分析的变量、选择参与分析的变量 3、选择一个或多个控制变量、选择一个或多个控制变量偏相关分析也称净相关分析,在偏相关分析也称净相关分析,在控制其他变量控制其他变量的线性影响的线性影响的条件下的条件下分析两变量间的线性相关分析两变量间的线性相关,所采用的工具是偏相,所采用的工具是偏相关系数(净相关系数)。关系数(净相关系数)。三、回归分析三、回归分析 线性回归模型线性回归模型 回归参数的最小二乘估计回归参数的最小二乘估计 回归方程的拟合优度检验回归方程的拟合优度检验
9、回归方程的显著性检验回归方程的显著性检验 回归系数的显著性检验回归系数的显著性检验知识点回顾知识点回顾什么是回归分析?什么是回归分析?1. 从一组样本数据出发,确定变量之间的数学从一组样本数据出发,确定变量之间的数学关系式关系式2. 对这些关系式的可信程度进行各种统计检验,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著些变量的影响显著,哪些不显著3. 利用所求的关系式,根据一个或几个变量的利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,取值来预测或控制另一个特定变量的取
10、值,并给出这种预测或控制的精确程度并给出这种预测或控制的精确程度回归分析与相关分析的区别回归分析与相关分析的区别1. 相关分析中,变量相关分析中,变量 x 变量变量 y 处于平等的地位;回处于平等的地位;回归分析中,变量归分析中,变量 y 称为因变量,处在被解释的地称为因变量,处在被解释的地位,位,x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2. 相关分析中所涉及的变量相关分析中所涉及的变量 x 和和 y 都是随机变量;都是随机变量;回归分析中,因变量回归分析中,因变量 y 是随机变量,自变量是随机变量,自变量 x 可可以是随机变量,也可以是非随机的确定变量以是随机变量
11、,也可以是非随机的确定变量3. 相关分析主要是描述两个变量之间线性关系的密相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量切程度;回归分析不仅可以揭示变量 x 对变量对变量 y 的影响大小,还可以由回归方程进行预测和控制的影响大小,还可以由回归方程进行预测和控制 回归模型与回归方程回归模型与回归方程回归模型回归模型1. 回答回答“变量之间是什么样的关系?变量之间是什么样的关系?”2. 方程中运用方程中运用因变量因变量(响应变量响应变量)被预测的变量被预测的变量自变量自变量 (解释变量解释变量)用于预测的变量用于预测的变量3.主要用于预测和估计主要用于预测和估计回归模型
12、的类型回归模型的类型回归模型回归模型多元回归多元回归一元回归一元回归线性回线性回归归非线性非线性回归回归线性回线性回归归非线性非线性回归回归一元线性回归模型一元线性回归模型1. 当只涉及一个自变量时称为当只涉及一个自变量时称为一元回归一元回归,若因变,若因变量量 y 与自变量与自变量 x 之间为线性关系时称为之间为线性关系时称为一元线一元线性回归性回归2. 对于具有线性关系的两个变量,可以用一个线对于具有线性关系的两个变量,可以用一个线性方程来表示它们之间的关系性方程来表示它们之间的关系3. 描述因变量描述因变量 y 如何依赖于自变量如何依赖于自变量 x 和误差项和误差项 的方程称为的方程称为
13、回归模型回归模型一元线性回归模型一元线性回归模型 对于只涉及一个自变量的简单线性回归模型可对于只涉及一个自变量的简单线性回归模型可表示为表示为 y = b + b1 x + 模型中,模型中,y 是是 x 的线性函数加上误差项的线性函数加上误差项线性部分反映了由于线性部分反映了由于 x 的变化而引起的的变化而引起的 y 的变化的变化误差项误差项 是随机变量是随机变量反映了除反映了除 x 和和 y 之间的线性关系之外的随机因素对之间的线性关系之外的随机因素对 y 的影响的影响是不能由是不能由 x 和和 y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性b b0 和和 b b1 称为模型的
14、参数称为模型的参数基本假定基本假定1. 误差项误差项是一个期望值为是一个期望值为0的随机变量,即的随机变量,即E()=0。对于一个给定的对于一个给定的 x 值,值,y 的期望值为的期望值为 E ( y ) =b 0+ b 1 x2. 对于所有的对于所有的 x 值,值,的方差的方差2 都相同都相同3. 误差项误差项是一个服从正态分布的随机变量,且相互是一个服从正态分布的随机变量,且相互独立。即独立。即N( 0 ,2 )独立性意味着对于一个特定的独立性意味着对于一个特定的 x 值,它所对应的值,它所对应的与与其他其他 x 值所对应的值所对应的不相关不相关对于一个特定的对于一个特定的 x 值,它所对
15、应的值,它所对应的 y 值与其他值与其他 x 所所对应的对应的 y 值也不相关值也不相关回归方程回归方程1. 描述描述 y 的平均值或期望值如何依赖于的平均值或期望值如何依赖于 x 的方的方程称为程称为回归方程2. 简单线性回归方程的形式如下简单线性回归方程的形式如下 E( y ) = b0+ b1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程b b0是回归直线在是回归直线在 y 轴上的截距,是当轴上的截距,是当 x=0 时时 y 的期望值的期望值b b1是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当 x 每变动一个单位每变动
16、一个单位时,时,y 的平均变动值的平均变动值估计估计(经验经验)的回归方程的回归方程0b1b0b1b0b1b0b1bxy10bb+参数参数 0 和和 1 的最小二乘估计的最小二乘估计最小二乘法最小二乘法图例图例xy10bb+最小二乘法最小二乘法最小niiniieyyQ121210) (),(bb0b1b 和和 的计算公式的计算公式0b1b根据最小二乘法的要求,可得求解 和 的标准方程如下 b b b b b b xyxxnyxyxn10n1i2n1ii2in1iin1iin1iii10b1b估计方程的求法估计方程的求法实例实例 【例】根据例根据例8.1中的数据,配合人均消中的数据,配合人均消费
17、金额对人均国民收入的回归方程费金额对人均国民收入的回归方程 根据根据 和和 的求解公式得的求解公式得2229.54526378. 073077.98652638. 061538.5735 .1282777.160733231374575 .1282799.91561731301021bbbb0b1b 人均消费金额对人均国民收入的回归方程为人均消费金额对人均国民收入的回归方程为020040060080010001200140005001000150020002500人均消费与人均国民收入的回归人均消费与人均国民收入的回归回归方程的显著性检验回归方程的显著性检验1、拟合优度的检验、拟合优度的检验2
18、、线性关系的检验、线性关系的检验3、回归系数的检验、回归系数的检验离差平方和的分解离差平方和的分解1. 因变量因变量 y 的取值是不同的,的取值是不同的,y 取值的这种波动称取值的这种波动称为为变差变差。变差来源于两个方面。变差来源于两个方面由于自变量由于自变量 x 的取值不同造成的的取值不同造成的除除 x 以外的其他因素以外的其他因素(如如x对对y的非线性影响、测量误的非线性影响、测量误差等差等)的影响的影响2. 对一个具体的观测值来说,变差的大小可以通过对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差该实际观测值与其均值之差 来表示来表示yy 图示图示yxy10bb+yy
19、 yyyy ),(iiyx三个平方和的关系三个平方和的关系2. 两端平方后求和有 yyyyyy+niiniiniiyyyyyy121212三个平方和的意义三个平方和的意义1. 总平方和(SST)反映因变量的反映因变量的 n 个观察值与其均值的总离差个观察值与其均值的总离差2. 回归平方和(SSR)反映自变量反映自变量 x 的变化对因变量的变化对因变量 y 取值变化的影取值变化的影响,或者说,是由于响,或者说,是由于 x 与与 y 之间的线性关系引之间的线性关系引起的起的 y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3. 残差平方和(SSE)反映除反映除 x 以外的其他因
20、素对以外的其他因素对 y 取值的影响,也取值的影响,也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和图示图示yxy10bb+yy yyyy ),(iiyx拟合优度检验拟合优度检验判定系数判定系数 r2 1. 回归平方和占总离差平方和的比例niiniiniiniiyyyyyyyySSTSSRr12121212212. 反映回归直线的拟合程度反映回归直线的拟合程度3. 取值范围在取值范围在 0 , 1 之间之间4. r2 1,说明回归方程拟合的越好;,说明回归方程拟合的越好;r20,说明回归方程拟合的越差说明回归方程拟合的越差5. 判定系数等于相关系数的平方,即判定系数等于相关系
21、数的平方,即r2(r)2拟合优度检验拟合优度检验估计标准误差估计标准误差 Sy1. 实际观察值与回归估计值离差平方和的均方根实际观察值与回归估计值离差平方和的均方根2. 反映实际观察值在回归直线周围的分散状况反映实际观察值在回归直线周围的分散状况3. 从另一个角度说明了回归直线的拟合程度从另一个角度说明了回归直线的拟合程度4. 计算公式为计算公式为22111212nyxbyaynyySniiiniiniiniiiy线性关系的检验线性关系的检验1. 检验自变量和因变量之间的线性关系是否显著检验自变量和因变量之间的线性关系是否显著2. 具体方法是将回归离差平方和具体方法是将回归离差平方和(SSR)
22、同剩余离差平同剩余离差平方和方和(SSE)加以比较,应用加以比较,应用F检验来分析二者之间检验来分析二者之间的差别是否显著的差别是否显著如果是显著的,两个变量之间存在线性关系如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系如果不显著,两个变量之间不存在线性关系检验的步骤检验的步骤1. 提出假设H0:线性关系不显著:线性关系不显著)2,1 (21211212nFnyyyynSSESSRFniinii回归系数的显著性检验回归系数的显著性检验1b样本统计量样本统计量 的分布的分布1b1. 1. 是根据最小二乘法求出的样本统计量,它有自己是根据最小二乘法求出的样本统计量,它
23、有自己的分布的分布2. 2. 的分布具有如下性质的分布具有如下性质分布形式:正态分布分布形式:正态分布数学期望:数学期望:标准差:标准差:由于由于 未知,需用其估计量未知,需用其估计量S Sy y来代替得到来代替得到 的估计的标的估计的标准差准差21xxSSiyb21xxib11)(bbE1b1b1b样本统计量样本统计量 的分布的分布1b1b11)(bbE1b21xxSSiyb回归系数的显著性检验步骤回归系数的显著性检验步骤1. 提出假设提出假设H0: b b1 = 0 (没有线性关系没有线性关系) H1: b b1 0 (有线性关系有线性关系) 2. 计算检验的统计量计算检验的统计量) 2(
24、11ntStbb实例实例1. 提出假设提出假设H0:b b1 = 0 人均收入与人均消费之间无线性关系人均收入与人均消费之间无线性关系H1:b b1 0 人均收入与人均消费之间有线性关系人均收入与人均消费之间有线性关系2. 计算检验的统计量计算检验的统计量0758.65827.341603495.1452638. 02t1、一元线性回归分析案例、一元线性回归分析案例现有现有1997-2013年某地区全社会固定资产投资总额年某地区全社会固定资产投资总额NINV和国内生产总值和国内生产总值GDP两个指标的年度数据。两个指标的年度数据。试研究试研究NINV和和GDP的数量关系,并建立全社会的数量关系
25、,并建立全社会NINV和和GDP的线性回归方程。的线性回归方程。思路和主要步骤思路和主要步骤 绘制散点图绘制散点图 计算相关系数计算相关系数 线性回归分析线性回归分析 1、分析、分析回归回归线性线性 2、选择被解释变量(因变量)、选择被解释变量(因变量) 3、选择解释变量(自变量)、选择解释变量(自变量)练习练习1 完成上例,并对输出结果进行解释完成上例,并对输出结果进行解释2、多元线性回归分析案例、多元线性回归分析案例 利用利用“高校科研研究高校科研研究”数据,分析数据,分析立项课题数立项课题数(X5)与与投入人年数(投入人年数(X2)、投入高级职称的人投入高级职称的人年数(年数(X3)、投
26、入科研事业费(投入科研事业费(X4)、专著数专著数(X6)、论文数(论文数(X7)、获奖数(获奖数(X8)之间的之间的线性关系线性关系主要步骤主要步骤 1、分析、分析回归回归线性线性 2、选择被解释变量(因变量)、选择被解释变量(因变量) 3、选择解释变量(自变量)、选择解释变量(自变量) 4、选择回归分析中解释变量的筛选策略、选择回归分析中解释变量的筛选策略 5、练习练习2 完成上例,尽量解释输出结果完成上例,尽量解释输出结果四、曲线估计四、曲线估计1、SPSS中的本质线性模型中的本质线性模型0122012012110 10101(Quadratic):(Compound):()ln( )ln()(Growth)ln()ln(二二次次曲曲线线复复合合曲曲线线增增长长曲曲:)线线xbb xybb xb xybb xb xxxyb bybb xyeybb x+ +1、SPSS中的本质线性模型中的本质线性模型0110101112301232301213212/0111001(ln( )ln( )(,)ln(Logarithmic):(Cubic):( ):(Ex)(ponenti1/)ln( )ln()al):对对数数曲曲线线三三次次曲曲线线曲曲线线指指数数曲曲(线线bbx
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025修订后造价师聘用合同
- 2025物业管理服务合同(派遣制范本)
- 《临床风险管理与教育》课件
- 2025年河北新劳动合同样本
- 纵隔积气护理查房
- 《错误的识别与解决》课件
- 2025年广东清远市英德市兴德投资有限公司招聘笔试参考题库附带答案详解
- 2025年福建龙岩夏商盛龙教育科技有限公司招聘笔试参考题库附带答案详解
- 2025年福建平潭自由贸易区两岸发展有限公司招聘笔试参考题库含答案解析
- 2025年中国东方航空股份有限公司北京分公司招聘笔试参考题库含答案解析
- 小学三年级音乐《马兰谣》课件
- “当代文化参与”学习任务群相关单元的设计思路与教学建议课件(共51张PPT)
- 提高卧床患者踝泵运动的执行率品管圈汇报书模板课件
- 同理心的应用教学教材课件
- DB4102-T 025-2021海绵城市建设施工与质量验收规范-(高清现行)
- 城市轨道交通安全管理隐患清单
- 锡膏使用记录表
- 儿童保健学课件:绪论
- 中小学校园安全稳定工作岗位责任清单
- 校园安全存在问题及对策
- NY∕T 309-1996 全国耕地类型区、耕地地力等级划分
评论
0/150
提交评论