版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第二讲第二讲 回归分析概述回归分析概述u变量间关系的度量变量间关系的度量u总体回归函数总体回归函数u样本回归函数样本回归函数引子引子: :中国旅游业将到达世界旅游强国程度中国旅游业将到达世界旅游强国程度 提出,到提出,到“十二五十二五期末,中国的旅游业初步建立成为国民经济的战略性支柱期末,中国的旅游业初步建立成为国民经济的战略性支柱产业和人民群众更加称心的现代效力业。力争产业和人民群众更加称心的现代效力业。力争2020年我国旅年我国旅游产业规模、质量、效益根本到达世界旅游强国程度。游产业规模、质量、效益根本到达世界旅游强国程度。 2019年中国旅游业总收入到达年中国旅游业总收入到达2.3万亿
2、元,年均增长率为万亿元,年均增长率为10%,旅游业添加值占全国,旅游业添加值占全国GDP的比重提高到的比重提高到4.5%,占效力,占效力业添加值的比重到达业添加值的比重到达12%,旅游消费相当于居民消费总量的,旅游消费相当于居民消费总量的比例到达比例到达10%。 什么决议性要素能使中国旅游业总收入超越什么决议性要素能使中国旅游业总收入超越2.3万亿元万亿元? 旅游业的开展与这种决议性要素的数量关系终究是什么?旅游业的开展与这种决议性要素的数量关系终究是什么? 怎样详细测定旅游业开展与这种决议性要素的数量关系怎样详细测定旅游业开展与这种决议性要素的数量关系?2需求研讨经济变量之间数量关系的方法需
3、求研讨经济变量之间数量关系的方法 对旅游起决议性影响的要素有:对旅游起决议性影响的要素有:“中国居民中国居民的收入程度以及的收入程度以及“入境旅游人数等要素。入境旅游人数等要素。 “旅游业总收入旅游业总收入Y Y与与“居民平均收入居民平均收入X1X1或者或者“入境旅游人数入境旅游人数X2X2有怎样的数有怎样的数量关系呢?量关系呢? 能否用某种线性或非线性关系式能否用某种线性或非线性关系式 Y= f ( X ) Y= f ( X ) 去表现这去表现这 种数量关系呢种数量关系呢? ? 详细该怎样去表现和详细该怎样去表现和计量呢计量呢? ?4三种情况三种情况: 确定性的函数关系确定性的函数关系 Y=
4、f (X) 变量之间有确定的一一对应关系,可用数学方法变量之间有确定的一一对应关系,可用数学方法计算计算 相关关系相关关系 Y= f(X)+ (为随机变量为随机变量) 不确定的统计关系不确定的统计关系 ,可用统计方法分析,可用统计方法分析 没有关系没有关系 不用分析不用分析 经济变量之间的相互关系经济变量之间的相互关系 变量间的关系函数关系变量间的关系相关关系变量间的关系相关关系o变量间关系不能用函数关系准确表达o一个变量的取值不能由另一个变量独一确定o当变量 x 取某个值时,变量 y 的取值能够有几个o各观测点分布在直线周围 统计分析的目的在于如何根据统计数据确定变量之间的关系形状及其关联的
5、程度,并探求出其内在的数量规律性。变量间的关系相关关系变量间的关系相关关系88 相关关系的类型 从涉及的变量数量看简单相关多重相关复相关从变量相关关系的表现方式看线性相关,分布图接近一条直线非线性相关,分布图接近一条曲线从变量相关关系变化的方向看正相关,变量同方向变化,同增同减负相关,变量反方向变化,一增一减不相关相关关系的图示相关关系的图示【例】一家大型商业银行在多个地域设有分行,其业务主要是进展根底设备建立、国家重点工程建立、固定资产投资等工程的贷款。几年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的开展带来较大压力。为弄清楚不良贷款构成的缘由,管理者希望利用银
6、行业务的有关数据做些定量分析,以便找出控制不良贷款的方法。不良贷款与贷款余额、应收贷款、贷款工程和固不良贷款与贷款余额、应收贷款、贷款工程和固定资产投资等要素有无关系?什么关系?关系强定资产投资等要素有无关系?什么关系?关系强度?度?不良贷款与各项贷款余额有明显线性关系不良贷款与各项贷款余额有明显线性关系不良贷款与本年累计应收贷款有线性关系不良贷款与本年累计应收贷款有线性关系不良贷款与贷款工程个数有线性关系不良贷款与贷款工程个数有线性关系不良贷款与本年固定资产投资额无明显线性关系不良贷款与本年固定资产投资额无明显线性关系o 相关系数相关系数o 根据样本数据计算的度量两个变量之间线性根据样本数据
7、计算的度量两个变量之间线性关系强度的统计量。关系强度的统计量。o 假设相关系数是根据总体全部数据计算的,称假设相关系数是根据总体全部数据计算的,称为总体相关系数,记为为总体相关系数,记为;o 假设是根据样本数据计算的,那么称为样本相假设是根据样本数据计算的,那么称为样本相关系数,记为关系数,记为r。 相关程度的度量相关系数 13 相关程度的度量相关系数 假设 和 总体的全部数据都知, 和 的方差和协方差也知,那么 X和Y的总体线性相关系数: 其中: -X 的方差 -Y的方差 -X和Y的协方差特点:总体相关系数只反映总体两个变量 和 的线性相关程度对于特定的总体来说, 和 的数值是既定的,总体相
8、关系数 是客观存在的特定数值。总体的两个变量 和 的全部数值通常不能够直接观测,所以总体相关系数普通是未知的。 (, )()( )Cov X YVar X Var Y(, )Cov X Y()Var X( )Var YXXXXYYYYYX14假设只知道假设只知道 X 和和 Y 的样本观测值,那么的样本观测值,那么X和和Y的样本线的样本线性性相关系数为:相关系数为: 其中:其中: 和和 分别是变量分别是变量X和和Y的样本观测值,的样本观测值, 和和 分别是变量分别是变量 X 和和Y 样本值的平均值样本值的平均值留意留意: 是随抽样而变动的随机变量。是随抽样而变动的随机变量。iY_X_Y_22()
9、()()()iiXYiiXXYYrXXYYiXXYrX和和Y的样本线性相关系数:的样本线性相关系数:相关系数较为简单相关系数较为简单, , 也可以在一定程度上测定变量也可以在一定程度上测定变量间的数量关系间的数量关系, ,但是对于详细研讨变量间的数量规律但是对于详细研讨变量间的数量规律性还有局限性。性还有局限性。1-1r+12对称性 rxy=ryx (3) r的大小与数据原点及尺度无关。4r仅仅是x与y之间线性关系的一个度量,它不能描画非线性关系。5 r 虽然是两个变量线性关系的一个度量,却不一定意味着x与y之间有因果关系。6|r|0.8时,高度相关;0.5| r|0.8,中度相关;0.3|
10、r|0.5,低度相关;| r| t /2 (n-2), 那么回绝原假设那么回绝原假设.阐明总体的两个变量之间存在显著的线性关系。阐明总体的两个变量之间存在显著的线性关系。212|rnrtt(n-2)相关关系的显著性检验相关关系的显著性检验统计实际统计实际曾经证明曾经证明)(rE2121222nrnrrr)2(1202ntrnrrtr【例】根据计算的相关系数,检验不良贷款与贷款余额之间的相关系数能否显著(=0.05)第第1步步:提出假设提出假设H0: =0; H1: 0第第2步步:计算检验的统计量计算检验的统计量5344.78436.01225|8436.0|12|22rnrt第第3步步:进展决
11、策。进展决策。 查表得,查表得,t /2 (n-2)=2.0687 , 由于由于t=7.5344 t /2 (n-2)=2.0687, 所以回绝原假设。所以回绝原假设。 阐明不良贷款与贷款余额之间存在显著的正线性关系。阐明不良贷款与贷款余额之间存在显著的正线性关系。21回归分析回归分析回归的古典意义: 高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系)子女的身高有向人的平均身高回归的趋势回归的现代意义: 一个被解释变量对假设干个解释变量依存关系的研讨回归的目的本质: 由解释变量去估计被解释变量的平均值。o回归分析回归分析(regression analysis)是研讨一个变量关是研讨一个变
12、量关于另一个些变量的详细依赖关系的计算方法于另一个些变量的详细依赖关系的计算方法和实际。和实际。o回归分析就是对具有相关关系的两个或两个以回归分析就是对具有相关关系的两个或两个以上的变量之间的数量变化进展测定,配合一定的上的变量之间的数量变化进展测定,配合一定的数学模型后对因变量进展估计或预测的一种统计数学模型后对因变量进展估计或预测的一种统计分析方法。分析方法。o被解释变量被解释变量Explained Variable或应变量或应变量Dependent Variable。o解释变量解释变量Explanatory Variable或自变量或自变量Independent Variable。回归分
13、析的根本概念回归分析的根本概念 回归分析目的:经过后者的知或设定值,去估计和回归分析目的:经过后者的知或设定值,去估计和或预测前者的总体均值。或预测前者的总体均值。 回归分析所要处理的问题回归分析所要处理的问题:从一组样本数据出发从一组样本数据出发,确定出变量之间的数学关系式确定出变量之间的数学关系式;对这些关系式的可信程度进展各种统计检验对这些关系式的可信程度进展各种统计检验, 并从影响并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著某一特定变量的诸多变量中找出哪些变量的影响是显著的的, 哪些是不显著的哪些是不显著的;利用所求的关系式利用所求的关系式,根据一个或几个变量的取值来估计或
14、根据一个或几个变量的取值来估计或预测另一个特定变量的取值预测另一个特定变量的取值,并给出这种估计或预测的可并给出这种估计或预测的可靠程度。靠程度。回归模型的类型回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归 相关分析的义务是确定两个变量之间相关的方向和亲密程度。回归分析的义务是寻觅因变量对自变量依赖关系的数学表达式;相关分析不用确定两变量中哪个是自变量,哪个是因变量,而回归分析中必需区分因变量与自变量;相关分析中两变量是对等的改动两者的位置,并不影响相关系数的数值,只需一个相关系数。而在回归分析中,互为因果关系的两个变量
15、可以编制两个独立的回归方程;相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。回归分析与相关分析的区别回归分析与相关分析的区别回归分析与相关分析的联络回归分析与相关分析的联络 相关分析是回归分析的根底和前提。只需在相关分析确定了变量之间存在一定相关关系的根底上建立的回归方程才有意义; 回归分析是相关分析的继续和深化。只需建立了回归方程才干阐明变量之间的依赖关系,并进一步进展预测。27 被解释变量被解释变量Y Y的条件分布和条件概率:的条件分布和条件概率: 当解释变量当解释变量X X取某固定值时条件,取某固定值时条件,Y Y 的值不确定,的值不确定,Y Y的不同取值会
16、构成一定的分布,这是的不同取值会构成一定的分布,这是 Y Y 的条件分布。的条件分布。 X X取某固定值时,取某固定值时,Y Y 取不同值的概率称为条件概率。取不同值的概率称为条件概率。 被解释变量被解释变量 Y Y 的条件期望:的条件期望: 对于对于 X X 的每一个取值,的每一个取值, 对对 Y Y 所构成的分布确所构成的分布确 定其期望或均值,称定其期望或均值,称 为为 Y Y 的条件期望或条件均的条件期望或条件均 值,用值,用 表示。留意表示。留意:Y:Y的条件期望是随的条件期望是随X X的变动而的变动而变动的变动的 iX)(iXYE)(iXYEYX明确几个概念为深化了解明确几个概念为
17、深化了解“回归回归28回归线:对于每一个回归线:对于每一个X的取值的取值 ,都有都有Y的条件期望的条件期望 与之对应,代表与之对应,代表Y的条件期的条件期望的点的轨迹构成的直线或曲线称望的点的轨迹构成的直线或曲线称为回归线。为回归线。回归函数:被解释变量回归函数:被解释变量Y的条件期望的条件期望 随随解释变量解释变量X的变化而有规律的变化而有规律的变化,假设把的变化,假设把Y的条件期的条件期望表现为望表现为 X 的某种函数的某种函数 ,这个函数称为回归函数。这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数分为:总体回归函数和样本回归函数回归函数 iXX YiX()iE Y X()
18、iE Y X()iE Y XE()()iiY Xf X29每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X3000350040004500500055006000650070007500181920272269230426462917306833834107426718472118236424352819302834883797431348001907221224242467293431663689410944575004每每2055224824732726302833213755426146185241月月219523132523282831313527389945464757540
19、8家家224524812581294632443690392047574972庭庭230725412675297634083829425347715172消消24092686271631503496399344414872费费270228173174352241744673支支281229363349367743504764出出2954338437764474Y Y302535143919313636584119332737472098241427303047336336793995431246284944()iE Y X举例举例: 假设知由假设知由100个家庭构成的总体的数据个家庭构成的总体
20、的数据 (单位单位:元元)总体回归函数总体回归函数 population regression function, PRF30消费支出的条件期望与收入关系的图形消费支出的条件期望与收入关系的图形 对于本例的总体,家庭消费支出的条件期望对于本例的总体,家庭消费支出的条件期望与家庭收入与家庭收入 根本是线性关系。根本是线性关系。 家庭消费支出的条件均值表示为家庭收入的线性函家庭消费支出的条件均值表示为家庭收入的线性函数:数:iiXXYE)()(iXYE)(iXYEiXiX31总体回归函数的概念前提:假设知所研讨的经济景象的总体的被解释变量Y和解释变量X的每个观测值难度较大!,那么,可以计算出总体被
21、解释变量Y的条件期望,将其表现为解释变量X的某种函数:这个函数称为总体回归函数PRF本质:总体回归函数实践上表现的是特定总体中被解释变量随解释变量的变动而变动的某种规律性。计量经济学的根本目的是要探寻变量间数量关系的规律,也就要努力去寻求总体回归函数。)()(iiXfXYE)(iXYE32iuiXXY)(iXYEiY条件期望表现方式条件期望表现方式例如例如Y的条件期望的条件期望 是解是解 释变量释变量X的线性函数,可表示为:的线性函数,可表示为: 个别值表现方式随机设定方式个别值表现方式随机设定方式 对于一定的对于一定的 ,Y的各个别值的各个别值 并不一定等于条件期望,而并不一定等于条件期望,
22、而是分布在是分布在 的周围,假设令各个的周围,假设令各个 与条件期望与条件期望 的的偏向为偏向为 ,显然,显然 是个随机变量是个随机变量 那么有那么有 iYiYiX)(iXYE12()()iiiiE Y Xf XX)(iXYE)(iXYEiuiuiiiiiiXYXYEYu21)(12iiiYXu总体回归函数的表现方式总体回归函数的表现方式PRF作为总体运转的客观规律,总体回归函数是客观存在作为总体运转的客观规律,总体回归函数是客观存在的,但在实践的经济研讨中总体回归函数通常是未知的,的,但在实践的经济研讨中总体回归函数通常是未知的,只能根据经济实际和实际阅历去设定。只能根据经济实际和实际阅历去
23、设定。 计量经济学研讨中计量经济学研讨中“计量的根本目的就是要寻求总体计量的根本目的就是要寻求总体回归函数。回归函数。我们所设定的计量模型实践就是在设定总体回归函我们所设定的计量模型实践就是在设定总体回归函数的详细方式。数的详细方式。总体回归函数中总体回归函数中 Y Y 与与 X X 的关系可以是线性的,也可的关系可以是线性的,也可以是非线性的。以是非线性的。 33如何了解总体回归函数如何了解总体回归函数34,类似的方法去估计其参数,都可以归于线性回归。iiiXXYE21)(12()lniiiE Y XXiiiXXYE21)(“线性的判别线性的判别概念在总体回归函数中,各个的值与其条件期望的偏
24、向有很重要的意义。假设只需的影响,与不应有偏向。假设偏差存在,阐明还有其他影响要素。实践代表了排除在模型以外的一切要素对Y的影响。性质是其期望为0有一定分布的随机变量重要性:随机扰动项的性质决议着计量经济分析结果的性质和计量经济方法的选择35iuiuiY)(iiXYEiuiXXY()iE Y XiYiuiY)(iiXYEXiu随机扰动项随机扰动项 是未知影响要素的代表是未知影响要素的代表( (实际的模糊性实际的模糊性) ) 是无法获得数据的知影响要素的代表是无法获得数据的知影响要素的代表( (数据欠缺数据欠缺) ) 是众多细小影响要素的综合代表是众多细小影响要素的综合代表( (非系统性影响非系
25、统性影响) ) 模型能够存在设定误差模型能够存在设定误差( (变量、函数方式的设定变量、函数方式的设定 模型中变量能够存在观测误差模型中变量能够存在观测误差( (变量数据不符合实践变量数据不符合实践) ) 变量能够有内在随机性变量能够有内在随机性( (人类经济行为的内在随机性人类经济行为的内在随机性) )36iu引入随机扰动项引入随机扰动项 的缘由的缘由样本回归线:样本回归线: 对于对于X的一定值,获得的一定值,获得Y的样本观测值,可计算其条件均值,的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹,称为样本回归线。样本观测值条件均值的轨迹,称为样本回归线。样本回归函数:样本回归函数:假设把被解释变量假设把被解释变量Y的样本条件均值的样本条件均值 表示为解释变量表示为解释变量X的某种函数,的某种函数,这个函数称为样本回归函数这个函数称为样本回归函
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年智能净水器项目营销方案
- 2026年生物基包装材料项目投资计划书
- 2026年宠物用品电商项目投资计划书
- 2026年合成燃料项目投资计划书
- 2026年体感互动游戏项目营销方案
- 2026河北秦皇岛市教育局关于秦皇岛市第二十中学选调教师招聘6人备考题库有完整答案详解
- 2026年即时零售 一刻钟便民生活圈项目公司成立分析报告
- 2026江西赣州市招聘章贡区商会工作人员1人备考题库含答案详解(a卷)
- 2026江西新余高新区国有企业招聘8人备考题库及答案详解(各地真题)
- 2026年智能车载多媒体系统项目公司成立分析报告
- 2026 昆明市高三市统测 三诊一模 英语试卷
- 市政设施巡查及维护方案
- 大型活动安保工作预案模板
- 2025年文化遗产数字化保护与开发:技术创新与经济效益研究报告
- 1.2 宪法的内容和作用 课件 (共28张) 八年级道法下册
- 山西焦煤考试题目及答案
- 加盟酒店合同范本
- (2025版)成人肺功能检查技术进展及临床应用指南解读课件
- 《春秋》讲解课件
- 铁路信号基础设备维护实训指导课件 5.认识25Hz相敏轨道电路
- T-ZGKSL 022-2025 头皮毛发健康理疗师职业能力评价规范
评论
0/150
提交评论