版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章 回归分析 9.1 回归分析概述 回归分析是一种应用极为广泛的数量分析方法。它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,帮助人们准确把握变量受其他一个或多个变量影响程度,进而为预测提供科学依据。 9.1.1 回归线和回归模型 利用样本数据获得回归线通常可采用两类方法:第一,局部平均;第二,函数拟合。 9.1.2 回归分析的一般步骤 1确定回归方程中的解释变量和被解释变量2确定回归模型3建立回归方程4对回归方程进行各种检验5利用回归方程进行预测9.2 线性回归分析观察被解释变量和一个多个解释变量的散点图,当发现与的线性回归模型。在线
2、性回归分析中,根据模型中解释变量的个数,可将线性回归模型分成一元线性回归模型和多元线性回归模型,相应的分析称为一元线性回归分析和多元线性回归分析。 9.2.1一元线性回归模型 一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。现实社会经济现象中,某一事物(被解释变量)总会收到多方面因素(多个解释变量)的影响。一元线性回归分析是在不考虑其他影响因素或在是比较理想化的分析。一元线性回归数学模型是 01yx9.2.2多元线性回归模型多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。多元线性回归的数
3、学模型是 01 122+ppyxxx 9.2.3 回归参数的普通最小二乘估计 线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各个参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则,在该准则下得到的回归参数的估计称为普通最小二乘估计。 9.2.4 回归方程的统计检验 通过样本数据建立回归方程后一半不能立即用于对实际问题的分析和预测,通常要进行各种统计检验,主要包括回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差分析等。 回归方程的拟合优度检验 对于一元线性回归方程 一元线性回归方程的拟合优度检验采用 统计量。该
4、统计量称为判定系数或决定系数,数学定义为:222112211()()=1()()nniiiinniiiiyyyyRyyyy 2R对于多元线性回归方程多元线性回归方程的拟合优度检验采用 统计量。该统计量称为调整的判定系数或调整的决定系数,数学定义为2R21= 1 -1S S EnpRS S Tn 回归方程的显著性检验 对于一元线性回归方程检验采用统计量,其数学定义为2121()=() /(2)niiniiiyyFyyn对于多元线性回归方程检验采用统计量,其数学定义为 2121() /=() /(1)niiniiiyypFyynp 回归系数的显著性检验 回归系数的显著性
5、检验的主要目的是研究回归方程中的每个解释变量与被解释变量之间是否存在显著性的线性关系,也就是研究解释变量能否有效地解释被解释变量的线性变化,它们能否保留在线性回归方程中。 回归系数显著性检验是围绕回归系数(或偏回归系数)估计值得抽样分布展开的,由此构造服从某种理论分布的检验统计量,并进行检验。对于一元线性回归方程 一元线性回归方程的回归系数显著性检验的零假设是 ,即回归系数与零无显著差异。它意味着,当回归系数为0时,无论取值如何变化都不会引起的线性变化,无法解释的线性变化,它们之间不存在线性关系。1=0对于多元线性回归方程多元线性回归方程显著性检验的零假设是 : ,即第个偏回归系数与零无显著差
6、异。它意味着当偏回归系数为 =0时,无论取值如何变化都不会引起的线性变化,所有无法解释的线性变化,它们不存在线性关系。0ii 残差分析 所谓的残差是指由回归方程计算所得的预测值与实际样本值之间的差距,定义为 1.残差均值为0的正态分布分析当前面的讨论中知道,当解释变量取某个特定的值时,对应的残差必然有正有负,但总体上应服从以0为均值的正态分布。可以通过绘制残差图对该问题进行分析。残差图也是一直散点图。图中一般横坐标是解释变量(也可以是被解释变量的预测值),纵坐标为残差。01122()iiiiiippieyyyxxx 2.残差的独立性分析残差独立性分析可以通过以下三种方式实现:
7、一、绘制残差序列的序列图二、计算残差的自相关系数三、DurbinWatson 检验 3. 异方差分析一、绘制残差图可以通过绘制残差图分析是否存在异方差。二、等级相关分析得到残差序列后首先对其取绝对值,然后分别计算出残差和解释变量的秩,最后计算Spearman 等级相关系数,并进行等级相关分析。 9.2.5 多元回归分析中的其他问题 在多元回归分析中,由于解释变量会受众多因素的共同影响,需要由多个解释变量解释的,于是会出现诸如此类的问题:多个变量是否都能够进入线性回归模型,解释变量应以怎样的策略和顺序进行方程,方程中多个解释变量之间是否存在多重共线性等。 变量筛选问题在多元线性回
8、归分析中,模型中应引入多少解释变量是需要重点研究的。如果引入的变量较少,回归方程将无法很好地解释说明被解释变量的变化。但是也并非引入的变量越多越好,因为这些变量之间可能存在多重共线性。因此有必要采取一些策略对变量引入回归方程加以控制和筛选。多元回归分析中,变量的筛选一般有向前筛选、向后筛选、逐步筛选三种基本策略。 向前筛选(Forward)处理 向后筛选(Backward)处理 逐步筛选(Stepwise)策略 变量的多重共线性问题所谓多重共线性是指解释变量之间存在线性相关关系的现象。解释变量间高度的多重共线性会给回归方程带来许多影响。如偏回归系数估计困难,偏回归系数的估计方差随
9、解释变量相关性的增大而增大,偏回归系数的置信区间增大,偏回归系数估计值的不稳定性增强,偏回归系数假设检验的结果不显著等。测度解释变量间多重共线性一般有以下方式:容忍度方差膨胀因子(VIF)特征根和方差比条件指数9.4曲线估计9.4.1 曲线估计概述 变量间相关关系的分析中,变量之间的关系并不总表现出线性关系,非线性关系也是极为常见的,可通过绘制散点图的方式粗略考察这种非线性关系。对于非线性关系通常无法直接通过线性回归来分析,无法直接建立线性模型,但可通过变量变换化为线性关系,并可最终进行线性回归分析建立线性模型9.5 二项Logistic回归 二次曲线(Quadratic) 复合曲线(Comp
10、ound) 增长曲线(Growth) 对数曲线(Logarithmic) 三次曲线(Cubic) S曲线 指数曲线(Exponential) 逆函数(Inverse) 幂函数(Power) 逻辑函数(Logistic) 9.5.1 二项Logistic回归概述 二项Logistic回归应用背景作为标准的统计分析工具,多元回归分析在诸多行业和领域的数据分析应用中发挥着极为重要的作用。尽管如此,在运用多元回归分析方法时仍不应忽略方法应用的前提假设条件。违背了某些关键假设,得到的分析结论很可能是不合理和不可信的。 二项Logistic回归模型当被解释变量为0/1二值变
11、量时,虽然无法直接采用一般线性多元回归模型建模,但仍然可以充分利用其模型建立的理论和思路,得到以下启示:第一,可以证明,当被解释变量为0/1二值变量时,如果仍采用简单线性回归模型,即,则被解释变量的均值是解释变量为时=1的概率值。由此给出的启示是,可以利用一般的线性多元回归模型对被解释变量取值为1的概率P进行建模,此时模型被解释变量的取值范围是01之间,即 第二,由于概率P的取值范围是01之间,而一般线性回归模型被解释变量取值于的要求给出的启示是,可以对概率P作合理转换处理,其取值范围与一般线性回归吻合。第三,采用一般线性模型建立关于被解释变量取值为1时的概率的回归模型时,模型中解释变量与概率
12、值之间的关系是线性的。但实际应用中,这个概率与解释变量之间往往是一种非线性关系。由此,对概率P的转换处理应采用非线性转化。 二项Logistic回归方程回归系数的含义 由于Logistic回归模型的残差不再服从正态分布,而是二值离散型分布,于是采用极大似然估计法对模型的参数进行估计。在各种统计检验通过以后,需要对模型参数的含义给予合理的解释。 二项Logistic回归方程的检验 为进行Logistic回归方程的检验应需要首先了解回归方程参数估计的原则和方法。Logistic回归方程的参数求解采用极大似然估计法。极大似然估计是一种在总体分布密度函数和样本信息的基础
13、上,求解模型中未知参数估计值的方法。它基于总体的分布密度函数构造一个包含未知参数的似然函数,并求解在似然函数值最大下的未知参数的估计值。1. 回归方程的显著性检验2. 回归系数的显著性检验3. 回归方程的拟合优度检验 (1) 统计量 (2)统计量 (3) 错判矩阵2R 二项Logistic回归分析中的虚拟变量 通常回归分析中,作为解释变量的变量都是定距型变量,他们对被解释变量有线性解释作用。实际应用中,被解释变量的变化不仅受到定距型变量的影响,也会为非定距的品质变量的影响。品质型数据通常不能像定距变量那样直接作为解释变量进入回归方程。9.6 案例分析一线性回归数据来自于国泰安数据服务中心的经济研究数据库。网址:http:/ 9.6.1 数据预处理 9.6.2 回归分析9.7 案例分析二1、一企业排水的COD及B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出差为何不算考勤制度
- 小学控辍保学考勤制度
- lee门店考勤制度
- 城管严格遵守考勤制度
- 工厂保洁考勤制度
- 养生门店考勤制度
- 汽车销售顾问面试常见问题与解析
- 企业财务制度及报表分析手册
- 国有企业高管薪酬福利制度面试解析
- 装配式检查井施工方案
- 2025年本科院校基建处招聘笔试预测试题及答案
- 《文秘实务》全套教学课件
- 风电项目道路施工交底模板
- 五金仓库管理培训课件
- 实验室改造汇报
- 2023年高考历史真题新课标卷及解析
- 夏季奥林匹克“丁一杯”数学竞赛省级选拔赛四年级试题(B)卷(含解析)2025年浙江省
- 框架协议管理办法
- 寒假作业的数学试卷
- 2025-2030年中国太阳能光伏发电行业市场深度调研及前景趋势与投资研究报告
- 驾校教练车承包协议
评论
0/150
提交评论