版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章回归技术与需求估计第1页,共65页,2023年,2月20日,星期三
§一、回归技术1.估计系数表4-1假设的总成本和总产量数据生产期总成本(Yi)
总产量(Xi)110002150
531608424010523015637023741025第2页,共65页,2023年,2月20日,星期三总成本、总产量和估计的回归方程第3页,共65页,2023年,2月20日,星期三
统计学家告诉我们,对现行函数的最佳估计,就是让拟合的直线从各数据点中通过,使每一点到该直线的垂直距离的平方和最小。这种技术成为最小乘回归估计(least-squareregressionestimation),根据表中产量和成本数据,可求得最小二乘回归方程如下:的实际值和预测值之间的离差(即这些点与直线之间的垂直距离),称为残值(residual)或预测误差(predictionerror)第4页,共65页,2023年,2月20日,星期三
有很多数字可选为a和b的估计值,但只有其中的一组所规定的直线能使离差的平方和最小[即使最小]。计算最小二乘估计值和的公式为:和式中,和分别为X和Y变量的均值(4-2)(4-1)第5页,共65页,2023年,2月20日,星期三根据例子中基本的成本和产量数据,进行必要的运算如表(4-2)把相关的值代入式(4-1)和式(4-2),可算得和的估计值为:第6页,共65页,2023年,2月20日,星期三成本产量
1000-137.14-12.29151.041685.451505-87.14-7.2953.14635.251608-77.14-4.2918.40330.93240102.86-2.295.24-6.5523015-7.142.717.34-19.3537023132.9610.71114.701422.9341025172.8612.71161.542197.05表4-2第7页,共65页,2023年,2月20日,星期三因而,总成本函数的估计方程为:系数的估计值为87.08,是固定成本的估计值。的值是对产量变化1个单位引起的总成本的变化(即边际成本)做出的估计。美元,意思是产量变化1个单位,平均导致总成本变化12.21美元,因而是边际成本的估计值。第8页,共65页,2023年,2月20日,星期三小结一最小二乘回归技术是用来估计函数的系数的,方法是让一条拟合的直线通过数据点,以使离差的平方和[即]最小。估计函数的系数的值可用下列方程:
的值是垂直截距的估计值,或当X=0时Y的估计值。的值是X变化1个单位引起的Y变化的估计值。第9页,共65页,2023年,2月20日,星期三参数估计出来之后,因变量和自变量之间的关系强度可以用两种方法来度量。第一种方法是使用可决系数,即用R2来度量整个方程是否很好地解释因变量的变化。第二种方法是只用以检验因变量和一个自变量之间的关系强度。
2.检验回归估计第10页,共65页,2023年,2月20日,星期三检验总的解释能力
我们把任一个和的均值之间离差的平方[即]定义为的变差。总变差就等于所有因变量的值的离差平方之和。即:(4-3)第11页,共65页,2023年,2月20日,星期三
总变差可以分为两部分:已解释变差和未解释变差。两个概念可以解释如下。对每一个的值来说,把代入估计出来的回归方程,就可以算出的预测值(用表示):
预测值和均值的差的平方[即]就定义为已解释变差(explainedvariation)。“已解释”的意思是对均值的偏离是由的变化所引起的(即可由的变化来解释)。这些离差的平方和就是全部已解释变差:全部已解释变差=(4-4)第12页,共65页,2023年,2月20日,星期三未解释变差(unexplainedvariation)是指和之间的差额。即在与均值之间的离差,有一部分已经被自变量所解释。余下的离差,,就是未被解释的。这些差额的平方和就是全部未解释变差:
全部未解释变差=(4-5)第13页,共65页,2023年,2月20日,星期三回归模型中变差的来源第14页,共65页,2023年,2月20日,星期三(4-6)
可决系数(coefficientofdetermination)(R2)度量在因变量的总变差中,已由回归方程解释的部分所占的比重,即:第15页,共65页,2023年,2月20日,星期三R2值的范围是从0到1。如果回归方程一点也不解释Y的变差(即自变量和因变量之间没有联系),R2就为0。如果方程能解释全部变差(即全部已解释变差=总变差),R2就等于1。一般地,R2的值越大,回归方程就“越好”。
拟合(fit)这个词常用来表示回归方程的解释能力。如果R2的值大,就说方程对数据拟合得较好;如果R2的值小,就说明拟合得不好。第16页,共65页,2023年,2月20日,星期三根据已估计的总成本和产量的回归方程,即就可使用表4-3中不同来源的变差数据,计算可决系数:R2的值为0.954,意思是在总成本中有95%以上的变差是有产量的变化来解释的。因而,这个方程对数据拟合得很好。第17页,共65页,2023年,2月20日,星期三表4-3计算一个回归模型的各种来源的变差第18页,共65页,2023年,2月20日,星期三我们用(t-test)来确定因变量和每个自变量之间是否存在显著的关系。这个检验要求计算被估计的回归系数的标准离差(或标准差)。因变量和一个自变量之间的关系不是固定的,因为对不同的数据样本来说,的估计值会是不同的。从其中一个回归方程中得出的的标准差是对的变动性的估计。计算这个标准的方程为:评价单个自变量的解释能力第19页,共65页,2023年,2月20日,星期三式中,n为观察次数。对本节的成本--产量的例子来说,n=7,因此,的标准差为:
第20页,共65页,2023年,2月20日,星期三
由于具有变动性,有时候就需要确定一个区间或范围来估计参数的真正的值。根据统计学原理,可以用一下方程来估计的95%的置信区间:式中,为一种特定的概率分布,即学生的分布(Student'stdistribution)的值。下标是自由度数,其中n为观察次数或数据点数;k为方程中自变量的数目。第21页,共65页,2023年,2月20日,星期三在这个例子中,95%的置信区间为:或9.15~15.27。意思是,成本—产量之间真正的边际关系(即的值)落在这个区间的概率为95%表4-4供估计95%置信区间用的简化的学生的t分布表第22页,共65页,2023年,2月20日,星期三如果自变量和因变量之间没有关系,参数b将为0。在统计学上,检验Y和X之间的关系是否很强的方法是:检查在95%的置信区间内是否包括零值。如果不包括零,我们就说由所度量的X和Y之间的关系在统计上显著(significant);
如果包括零,就说不显著(nonsignificant),意思是两个变量之间并不存在较强的联系。第23页,共65页,2023年,2月20日,星期三这种检验的另一种方法是把估计的系数除以标准差。这一比率的概率分布与t分布一样,因而被称为。如果这一比率的绝对值等于或大于表上的自由度为的,我们就说在统计上显著。根据产量—成本数据,可计算如下:一般来说,如果比率的绝对值大于表上的自由度的值,我们就说系数在统计上显著。
第24页,共65页,2023年,2月20日,星期三小结二
可决系数R2,是用来度量在因变量的总变差中,有多大部分是由回归方程“解释”的。参数的95%置信区间估计值等于。如果这以区间不包括零,我们说,在统计上显著,意思是因变量和自变量之间存在较强的关系。回归系数的估计值与它的标准差之间的比率(统计量)也能用来检验一个自变量的统计显著性。第25页,共65页,2023年,2月20日,星期三3.利用回归方程进行预测估计值的标准差就是对预测的可能误差的度量。这一标准差的计算公式为:4-7预测值称为因变量值的点估计(pointestimate),以区别于对置信区间的估计。例如,已知因变量的预测值,95%的置信区间估计为:第26页,共65页,2023年,2月20日,星期三4.多元回归对具有一个以上自变量的方程的参数进行估计称为多元回归(multipleregression)。
由于大多数经济关系涉及的不仅仅是一个因变量和一个自变量之间简单的关系,多元回归技术在经济学中得到了广泛的应用。第27页,共65页,2023年,2月20日,星期三小结三回归方程可用来预测因变量的值,如果自变量的值是给定的。估计值的标准是对预测中的误差的度量。在多元回归中,假定其他变量的影响不变,每一个估计出来的系数是对一个变量对因变量的影响的度量。第28页,共65页,2023年,2月20日,星期三§二、需求估计
回归分析的过程很复杂,但通常包括四个步骤:(1)建立理论模型;(2)收集数据;(3)选择函数形式;(4)估计和解释结果。本节就结合需求方程的估计来讨论这些步骤。第29页,共65页,2023年,2月20日,星期三◆1.建立理论模型
在使用回归技术时,分析者必须建立有关经济关系的理论模型。这一模型必须建立在正确的经济理论基础上,并用数学式子来表示。建立模型的过程包括确定在分析中应包括哪些变量和是否有一种理论可以用来预测变量之间的性质和大小。第30页,共65页,2023年,2月20日,星期三◆2.数据的收集
为了估计需求,必须首先取得影响需求的每个变量的数据。这些数据可以来自调查、市场实验或各种现成的来源。可用时间序列数据,也可以用横断面数据。时间序列数据是由影响需求的每个变量在特定市场上逐期的观察数据所组成。横断面数据是建立在同一时点上许多市场的基础上的。例如,横断面数据可能包括:在最近一年中,在100个不同市场上的,关于需求量、收入、价格以及爱好和偏好的数据。第31页,共65页,2023年,2月20日,星期三一、德尔菲法(专家意见法)(Delphitechnique)(一)背景德尔菲法最早出现于20世纪50年代末,是当时美国为了预测在其“遭受原子弹轰炸后,可能出现的结果”而发明的一种方法。1964年美国兰德(RAND)公司的赫尔默(Helmer)和戈登(Gordon)发表了“长远预测研究报告”,首次将德尔菲法用于技术预测中。据美国《未来》杂志报导,从60年代末到70年代中,专家会议法和德尔菲法(以德尔菲法为主)在各类预测方法中所占比重由20.8%增加到24.2%。80年代以来,我国不少单位也采用德尔菲法进行了预测、决策分析和编制规划工作。第32页,共65页,2023年,2月20日,星期三(二)程序1.确定调查目的,拟订调查提纲。首先必须确定目标,拟订出要求专家回答问题的详细提纲,并同时向专家提供有关背景材料,包括预测目的、期限、调查表填写方法及其它希望要求等说明。2.选择一批熟悉本问题的专家,一般至少为10人左右,包括理论和实践等各方面专家。每一轮时间约7到10天,总共约一个月左右即可得到大致结果。第33页,共65页,2023年,2月20日,星期三3.以通信方式向各位选定专家发出调查表,征询意见。4.对返回的意见进行归纳综合、定量统计分析后再寄给有关专家,如此往复,经过三、四轮意见比较集中后进行数据处理与综合得出结果。第34页,共65页,2023年,2月20日,星期三(三)利弊1.简便易行,具有一定科学性和实用性,可以避免会议讨论时产生的害怕权威随声附和,或固执已见,或因顾虑情面不愿与他人意见冲突等弊病。2.可使大家发表的意见较快收敛,参加者也易接受结论,具有一定程度综合意见的客观性。第35页,共65页,2023年,2月20日,星期三3.由于专家一般的时间紧,回答总是往往比较草率,同时由于预测主要依靠专家,因此归根到底仍属专家们的集体主观判断。4.在选择合适的专家方面也较困难,征询意见的时间较长,对于需要快速判断的预测难于使用等。5.费用较高。第36页,共65页,2023年,2月20日,星期三
二、调查尽管消费者需要的调查能为预测提供有用的数据,但调查的价值在很大程度上取决于调查者的技巧。调查数据的另一个潜在问题是被调查人的回答不一定成为其实际行为。第37页,共65页,2023年,2月20日,星期三回归分析的第一步是根据经济学理论建立模型。经济学理论可用来评价所估计的系数的符号和大小。时间序列数据是有一个市场上在一段时期内的观察数据所组成。横断面数据则来自许多市场在同一时点上的信息。小结四第38页,共65页,2023年,2月20日,星期三◆3.选择函数形式
式(4-8)表示需求量和影响需求量的诸因素之间的一般关系。即
但用回归分析法进行估计,还需要选择方程的具体函数形式。最简单的形式是线性方程。与式(4-8)的一般关系相对应的线性方程为:(4-8)(4-9)第39页,共65页,2023年,2月20日,星期三
用于回归分析的函数形式可以是多样的。出了线性方程外,最常用的是幂函数形式。对估计需求来说,幂方程为:
像现在这个形式,这个方程是不能用普通最小二乘法来估计,因为它不是线性的。但对方程作简单的转换后,就可以用最小二乘法来估计。首先对式(4-10)的两侧取对数值。结果是:(4-10)第40页,共65页,2023年,2月20日,星期三
积的对数等于对数之和,因此:
由于一个有几次幂的数的对数等于幂数乘以该数的对数,因此,方程可进一步简化为:(4-11)第41页,共65页,2023年,2月20日,星期三
由于这个由原变量的对数来表示的方程是线性的,就可以以用普通最小二乘法来估计系数。
在式(4-10)和式(4-11)中的系数,,和有重要的意义。运用微分,就能很容易地说明它们是有关变量的弹性。就那价格弹性来说,就式(4-10)对价格的导数,可得:
方程两侧均乘以,得:
但因此
第42页,共65页,2023年,2月20日,星期三
幂函数形式的优点是它提供弹性的估计值,与线性方程中的弹性相比较,这些弹性都是常数,不受自变量变化的影响。幂函数形式的另一个特点是,因自变量变化一个单位引起的需求量的变化,不像线性函数那样是个常数。它不仅取决于该变量,还取决于其他自变量的值。选择什么样的函数形式好?这取决于理论模型和用途。如果认为,需求量是自变量的线性函数,那么线性函数是适宜的。如果目的是为了估计弹性,或为了考虑变量之间的非线性关系,那么,就应该选择幂函数形式。第43页,共65页,2023年,2月20日,星期三第44页,共65页,2023年,2月20日,星期三第45页,共65页,2023年,2月20日,星期三第46页,共65页,2023年,2月20日,星期三
要估计的方程的函数形式,应当根据经济理论和估计的用途来选择。线性方程的估计参数表示每个自变量的变化会带来什么影响。幂方程的参数的估计值,不需要进一步计算就可解释为弹性。一个方程的参数的估计值,可以通过检查它们的符号和大小来评价。相应的t值可以同来检验统计显著性假设。小结五第47页,共65页,2023年,2月20日,星期三§三、回归分析中的问题
尽管回归分析对于估计需求函数和其他经济关系很有用,但如果分析者在建立模型和解释结果上不加小心也可能出现严重问题。本节将讨论三个可能出现的问题:(1)变量遗漏(2)识别问题(3)多重共线性第48页,共65页,2023年,2月20日,星期三◆1.变量遗漏
我们已经看到,经济理论能用来确定哪些变量应当包括在回归方程之中,但如果有变量被遗漏了,回归分析的结果就可能产生误导。下面的例子有助于解释包括所有相关变量的重要性。第49页,共65页,2023年,2月20日,星期三假定某足球守门员的薪水(S)取决于该守门员在赛季里失球的次数(K)。失球越多,薪水越低。因此,估计的回归系数的符合应该为负。
根据150个守门员的数据,估计出方程为:第50页,共65页,2023年,2月20日,星期三假定守门员的薪水取决于失球和扑出点球(H)。其中,扑出点球的系数应该为正。则,得出新的回归方程:第51页,共65页,2023年,2月20日,星期三
在多元回归中,回归系数度量每个自变量的净影响,或在所有自变量中,该变量的部分影响,假定其他自变量的影响保持不变。第52页,共65页,2023年,2月20日,星期三◆2.识别问题(identificationproblem)
年份价格(美元)
交易量1101002812036140第53页,共65页,2023年,2月20日,星期三
产生识别问题的基本原因是,在供给和需求方程之间存在着同时性。就是说,需求量和供给量两者都受到物品价格变化的影响。因此无法确定价格对需求量和供给量的影响。图4-3(a)单条需求曲线图4-3(b)多条需求曲线第54页,共65页,2023年,2月20日,星期三
识别真正的供给和需求关系的关键是在每个方程中增加一个或几个新的变量。例如,关于汽油的供给和需求问题。基本的需求和供给模型为:
式中,为汽油的价格。包括方程是因为观察数据是均衡交易量和均衡价格。需求量始终等于供给量,因而无法得出参数,,和的值。所以,哪一个函数也不能识别。第55页,共65页,2023年,2月20日,星期三
需要的是要有另一个只影响需求和另一个只影响供给的变量。
注意,在这个模型里因变量是交易量和汽油的价格。两个自变量是收入和原油的价格。三个方程和在一起称为结构型(steucturalform)模型第56页,共65页,2023年,2月20日,星期三
由于,需求和供给方程可以合成下列形式:解此方程求得把此式带入原来的需求方程,求交易量,得(4-12)(4-13)第57页,共65页,2023年,2月20日,星期三
式(4-12)和式(4-13)称为约简型(reducedform)方程,它们都是线性的,而且在右侧只有变量和。因而这些方程就可以用最小二乘法来估计,因为在这里同时性问题已经消除。两个方程看起来很复杂,但实际上并不复杂。当估计时,每个方程都有一个常数项,每个变量都有一个系数。假定:代入式(4-13),可得出:第58页,共65页,2023年,2月20日,星期三
参数的估计值A,g1和g2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年房地产行业新型住房供应模式探索研究报告及未来发展趋势预测
- 口腔修复学数字化种植技术的质量控制标准考核试卷
- 基于工业互联网的数控车床数据采集编程考核试卷
- 改善客户满意度的关键措施-服务行业顾问
- 2025湖南第二次招聘公益性岗位人员2人笔试考试备考题库及答案解析
- 新媒体对大学生创业的影响-新媒体创业竞争
- 2025贵州省农业信贷融资担保股份有限公司引进人才笔试考试参考题库及答案解析
- 2025贵州毕节市优师计划毕业生专项招聘306人笔试考试备考试题及答案解析
- 2025云南大理州洱源县洱海流域管理局委托洱源县人力资源有限责任公司招聘辅助执法人员3人笔试考试参考试题及答案解析
- 2026中国国际航空股份有限公司招收高中飞行学生30人(重庆市)笔试考试参考试题及答案解析
- 3.2.1探秘“钠女士”被困的原因 课件 高一上学期化学苏教版(2019)必修第一册
- 【9上英YL】芜湖市2024-2025学年九年级上学期期中英语素质教育评估试卷
- 2024版高中物理公式大全及知识结构图
- 江苏海洋大学《高分子材料分析与测试》2021-2022学年第一学期期末试卷
- 2025年日历表(A4版含农历可编辑)
- 2024年一建答案及真题通信与广电
- 甲苯歧化操作规程-大庆
- 上篇第一单元学会聆听大单元教学设计-高中音乐人音版必修音乐鉴赏
- DL-T2078.3-2021调相机检修导则第3部分:辅机系统
- 《Micro LED光学特性测试方法》
- MOOC 油藏工程-西南石油大学 中国大学慕课答案
评论
0/150
提交评论