版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第1章 回归分析概述教学内容 变量间的关系;回归方程与回归名称的由来;回归分析的主要内容及其一般模型;建立实际问题回归模型的过程;回归分析应用与发展述评。目的和要求(1)深刻理解和掌握变量间相关关系的定义; (2)何谓回归方程;(3)了解回归分析的主要内容及其一般模型;(4)了解回归分析的应用与发展。教学方法 讲授式、启发式教学方式 板书结合PPT讲授教学过程一.变量间的关系函数关系1. 是一一对应的确定关系2. 设有两个变量和,变量随变量一起变化,并完全依赖于,当变量取某个数值时,依确定的关系取相应的值,则称是的函数,记为,其中称为自变量,称为因变量3. 各观测点落在一条线上 函数关系(几个
2、例子) 函数关系的例子 某种商品的销售额与销售量之间的关系可表示为 (为单价) 圆的面积与半径之间的关系可表示为 企业的原材料消耗额与产量、单位产量消耗、原材料价格之间的关系可表示为 相关关系(correlation)1. 变量间关系不能用函数关系精确表达2. 一个变量的取值不能由另一个(或某一些)变量唯一确定3. 当变量取某个值时,变量的取值可能有几个4. 各观测点分布在直线周围 相关关系 (几个例子)父亲身高与子女身高之间的关系;收入水平与受教育程度之间的关系;粮食亩产量与施肥量、降雨量、温度之间的关系;商品的消费量与居民收入之间的关系;商品销售额与广告费支出之间的关系。在推断统计中,我们
3、把上述变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,称为变量间的统计关系或相关关系。统计关系的研究 相关分析 回归分析回归分析与相关分析的区别1. 相关分析中,变量和变量处于平等的地位;回归分析中,变量称为因变量,处在被解释的地位,称为自变量,用于预测因变量的变化2. 相关分析中所涉及的变量和都是随机变量;回归分析中,因变量是随机变量,自变量可以是随机变量,也可以是非随机的确定变量3. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量对变量的影响大小,还可以由回归方程进行预测和控制 相关关系 (类型)相关关系不相关线性相关完全相关非线性相关
4、负相关负相关正相关正相关二.回归方程与回归名称的由来回归函数:称给定x时y的条件数学期望 (1.1)为随机变量对的回归函数。(1.1)式从平均意义上刻画了变量与之间的统计规律。样本观测值: (1.2)建立一个公式回归方程(regression equation)1. 描述因变量 的平均值或期望值如何依赖于自变量的方程2.一元线性回归方程的形式如下 (1.3) 方程的图示是一条直线,也称为直线回归方程 是回归直线在轴上的截距,是当时的期望值,称为回归常数 是直线的斜率,称为回归系数,表示当每变动一个单位时,的平均变动值由样本数据(1.2)去估计,得到估计的回归方程 (1.4)什么是回归分析?(R
5、egression)1.从一组样本数据出发,确定变量之间的数学关系式2. 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3. 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度高尔顿(研究父代与子代身高的关系)以父母亲的平均身高为,取儿子的身高为回归效应:大自然具有一种约束力,使人类身高的分布在一定时期内相对稳定而不产生两极分化三.回归分析的主要内容及其一般模型主要内容 一元线性回归 线性回归 多元线性回归 多个因变量与多个自变量的回归 讨论如何从数据推断回归模型基本假设的合理性
6、 当基本假设不成立时如何对数据进行修正回归诊断 判定回归方程拟合的效果 选择回归函数的形式 回归变量的选择 自变量选择的准则回归分析 逐步回归分析方法 岭回归 参数估计方法的改进 主成分回归 偏最小二乘法 一元非线性回归 非线性回归 分段回归 多元非线性回归 含有定性变量的回归 自变量含定性变量的情况 因变量是定性变量的情况回归模型( regression model)1. 一个因变量与一个及一个以上自变量的回归2. 描述因变量如何依赖于自变量和误差项的方程,称为多元回归模型3. 涉及个自变量的多元回归模型可表示为 (1.6) 该模型中由两部分组成:一部分是确定性函数关系,另一部分是随机误差项
7、 正是因为随机误差项的引入,才将变量之间的关系描述为一个随机方程,才能借助随机数学方法研究 与的关系随机误差项主要包括下列因素的影响:1. 由于人们认识的局限或时间、费用、数据质量等制约未引入回归模型但又对回归被解释变量有影响的因素;2. 样本数据的采集过程中变量观测值的观测误差的影响;3.理论模型设定误差的影响;4.其他随机因素的影响多元回归模型(multiple regression model)涉及 p 个自变量的多元线性回归模型可表示为 (1.7) 是参数 是被称为误差项的随机变量 是的线性函数加上误差项 包含在里面但不能被个自变量的线性关系所解释的变异性 给定(1.7)式中变量的一组
8、观测值则线性回归模型可表示为: (1.8)其中为了估计模型参数的需要,线性回归模型通常应满足几个基本假设:Gauss-Markov假设1. 误差项是一个期望值为0的随机变量,即2. 对于自变量的所有值,的方差都相同3. 误差项是彼此相互独立的 解释变量 是非随机变量,观测值是常数 正态分布的假定 为了便于数学上的处理,要求四.建立实际问题回归模型的过程回归建模步骤流程图经济决策预测经济因素分析经济变量控制模型运用修改模型检 验估计模型参数构造理论模型收集整理数据设置指标变量具体(社会经济)问题一)根据研究目的设置指标变量* 回归分析模型主要是揭示事物间相关变量的数量联系。首先是根据所研究问题的
9、目的设置因变量y,然后再选取与有统计关系的一些变量作为自变量。* 通常情况下,希望因变量与自变量之间具有因果关系,被解释变量为“果”,解释变量为“因”。* 选择变量时与一些专门领域的专家合作,有助于确定模型变量。例如,研究中国通货膨胀问题,通常把全国零售物价总指数作为衡量 通货膨胀的重要指标,那么,全国零售物价总指数作为被解释变量,国民收入、居民存款、工农业总产值、货币流通量、职工平均工资、社会商品零售总额等18个指标确定为解释变量。二)收集、整理统计数据* 回归模型的建立是基于回归变量的样本统计数据。数据的收集是建立经济问题回归模型的重要一环,是一项基础性工作* 样本数据分为时间序列数据和横
10、截面数据 时间序列数据就是按时间顺序排列的统计数据 (容易产生模型中随机误差项的序列相关) 横截面数据为在同一时间截面上的统计数据 (容易产生异方差性) 对于收集到的时间序列资料要特别注意数据的可比性和数据的统计口径问题* 统计数据的整理中要把一些变量进行折算、差分、对数化、中心化等国民生产总值(GNP)按国民原则计算,反映一国常住居民当期在国内外所从事的生产活动;国内生产总值(GDP)则以国土为计算原则,反映一国国土范围内所发生的生产活动量。三)确定理论回归模型的数学形式* 绘制变量 与的样本散点图是选择数学模型形式的重要环节* 经济回归模型的建立,通常要依据经济理论和一些数理经济学结果 例
11、:C-D生产函数 随机模型为, 是随机项 四)模型参数的估计* 未知参数的经典估计方法是普通最小二乘法* 对于不满足模型基本假设的回归问题,常用岭回归、主成分回归、偏最小二乘估计法等* 用TSP、SPSS、 SAS等统计软件去完成五)模型的检验与修改* 模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定* 统计检验:回归方程的显著性检验,回归系数的显著性检验,拟合优度的检验,随机误差项的序列相关检验,异方差性检验,解释变量的多重共线性检验等* 回归模型未通过某种统计检验,或者没有合理的经济意义时,需对模型进行修改 六)回归模型的运用1. 描述变量之间的关系回归方程描述了因变量和自变量之间的相依关系2. 分析变量之间的相互关系3. 预测(给定自变量的一组特定值,可以预测对应的因变量值)4. 控制控制问题只不过是预报的反问题。若要求观测值在一定范围内取值,只要将的取值加以控制,我们就能以95(或99.7)的把握保证, 中包含在回归模型的运用中,注意定性分析和定量分析的有机结合。定性分析是对某一社会现象以现有的文献资料或经验材料为依据,运用演绎、归纳、比较、分类、矛盾分析等方法,对某种事物进行分析的一种类型。其目的是把握事物质的规定性。定量分析是运用概率、统计原理对社会现象的数量特征、数量关系和事物发展过程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 免疫化疗患者的护理沟通
- 2026年及未来5年市场数据中国梅子酒行业发展前景预测及投资战略咨询报告
- 艾灸疗法的操作流程与护理实践
- 感染科护理新进展分享
- 2026年及未来5年市场数据中国保单质押贷款市场运行动态及行业投资潜力预测报告
- 医院内部审计投制度
- 企业基建审计制度
- 团支部绩效考核制度
- 局内部财务审计检查制度
- 学科教育培训管理制度
- 2026年注册监理工程师(监理工作)考题及答案
- 多个项目合同范本
- 2026年江苏信息职业技术学院单招职业倾向性测试必刷测试卷附答案
- 2026年皖北卫生职业学院单招职业适应性测试题库附答案
- 海事局国考面试题及答案
- 2026年江西电力职业技术学院单招职业技能考试题库及参考答案详解1套
- 妇科肿瘤及早期症状
- 谈话室装修合同范本
- 化肥产品生产许可证实施细则(一)(复肥产品部分)2025
- 骨关节疾病的pt康复教案
- 备战2026年中考语文5年中考2年模拟真题作文探究-【浙江省】(解析版)
评论
0/150
提交评论