




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章非线性回归模型的线性化
以上介绍了线性回归模型。但有时候变量之间的关系是非线性的。例如
匕=ao+%,i+%
y,=a0ea)+
上述非线性回归模型是无法用最小二乘法估计参数的。可采用非线性方法进行估
计。估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。计算机的出
现大大方便了非线性回归模型的估计。专用软件使这种计算变得非常容易。但本章不
是介绍这类模型的估计。
另外还有一类非线性回归模型。其形式是非线性的,但可以通过适当的变换,转
化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。称此类模型为可
线性化的非线性模型。下面介绍几种典型的可以线性化的非线性模型。
4.1可线性化的模型
⑴指数函数模型
=aebxtut(4.1)
/»。和MO两种情形的图形分别见图4.1和4.2o显然笛和),/的关系是非线性的。对上
式等号两侧同取自然对数,得
Lny=Lna+bxtut(4.2)
令Lnyt=y**,Lna=〃*,则
*=a*+bxt+ut(4.3)
变量V*和取己变换成为线性关系。其中"表示随机误差项。
图4.1图4.2)•尸。/75,(方<0)
⑵对数函数模型
=a+bLnxtth(4.4)
比>0和从0两种情形的图形分别见图4.3和4.4。2和"的关系是非线性的。令必*=。皿
=〃+/?2*+Z4(4.5)
图4.3yta-bLnxt+必,(b>0)
⑶嘉函数模型
b
=axteu,(4.6)
〃取不同值的图形分别见图4.5和4.6o力和y的关系是非线性的。对上式等号两
侧同取对数,得
(4.7)
Lfiy(=Lna+bLiix{+uf
令),**=L〃yr,a*=Lna,x**=Lnxt,贝U上式表
(4.8)
7T<头1v.*=〃*+hr.*+u.
变量),产和之间已成线性关系。其中〃,表示随机误差项。(4.7)式也称作全对数模
型。
图图
4.5JvI=axf>>€)•,4.6*vr=axrbe»,
(4)双曲线函数模型
11yt=a+b/xt+ut(4.9)
也可写成,
y,=\!(a+b/xt+ih)(4.10)
〃>0情形的图形见图4.7。兀和匕的关系是非线性的。令匕*=1/匕内*=1的得
*=a+bxt*+u(
图4.7>7=l/(fl+b/xt),(b>0)34.8y,=a+b/x,,(Z?>0)
双曲线函数还有另一种表达方式,
yt=a+b/xt+u,(4.11)
力>0情形的图形见图4.8。x/和v的关系是非线性的。令无*=1而得
yt=a+bxt*+lit
上式已变换成线性回归模型。
例4.2(P139,例3.5
⑸多项式方程模型
一种多项式方程的表达形式是
yt=bo+b\xt+匕2无2+/?&。3+出(4.12)
其中6>0,历>0,加>0和bivO,历>0,加<0情形的图形分别见图4.9和4.10o令x”
Xt2=xi2fr3=引,上式变为
yt=bo+b\XtI十%X,2十。Kf3十%(4.13)
这是一个三元线性回归模型。如经济学中的总成本曲线与图4.9相似。
itsoo
另一种多项式方程的表达形式是
=bo+b\xt+bixti+u,(4.14)
其中6>0,历>0和bivO,岳VO情形的图形分别见图411和4.12。令X\=xt,xt2=x!2f
上式线性化为,
y产bu+b\Xt\+Z?居2+〃r(4.15)
例4.3(P141例3.6)
⑹生长曲线(logistic)模型
1+e/o+ut(4.16)
一般/()=%+。"+42尸+...+“/〃,常见形式为/)=〃<)
(4.17)
1+e^ao-at>*uu1+be^ut
其中b=eaO。Q0情形的图形分别见图4.13和4.14。美国人口统计学家Pearl和Reed
广泛研究了有机体的生长,得到了上述数学模型。生长模型(或逻辑斯谛曲线,
Pearl-Reed曲线)常用于描述有机体生长发育过程。其中人和0分别为),’的生长上限
和下限oLimy=k,Limy=0。。力为待估参数。曲线有拐点,坐标为(口"Q,曲,f
32
线的上下两部分对称于拐点。
图4.13y/=^/(I+be-at+ut)图4.14yt=k/(1+beat^-u,)
为能运用最小二乘法估计参数〃”,必须事先估计出生曲线长上极限值晨线性化
过程如下。当火给出时,作如下变换,
kly,=1+be-….
移项,k/yt-1=be-ai+ui
取自然对数,Ln(kly,-\)=Lnb-at+ut(4.18)
令),**二L〃(Uy,-I),/?*=。仍,则
M*=b*-at+Ui
(4.19)
此时可用最小二乘法估计/产和a。
图4.15内地5月1日至28日每天非典数据一览
⑺龚伯斯(Gompertz)曲线
英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此
模型可用来描述一项新技术,一种新产品的发展过程。曲线的数学形式是,
图4A5y1=ke-be
曲线的上限和下限分别为攵和0,/力明二攵,〃明二0。4"为待估参数。曲线有拐点,rs
f----8
坐标为(。也但曲线不对称于拐点。一般情形,上限值k可事先估计,有了k值,
ae
龚伯斯曲线才可以用最小二乘法估计参数。线性化过程如下:当k给定时,
yjk=Jj,kly尸产…
a,
Ln(k/yt)=be~>Ln[Ln(k/yt)]=Lnb-at
令y*=Ln[Ln(k/yt)]yb*=Lnb,则
=b*-at
上式可用最小二乘法估计A*和a。
(8)Cobb-Douglas生产函数
下面介绍柯布道格拉斯(Cobb-Douglas)生产函数。其形式是
Q=kLaCi-a(4.24)
其中Q表示产量;L表示劳动力投入量;C表示资本投入量;攵是常数;o<a<i。这
种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面的数
据研究得出的。a的估计值是0.75,P的估计值是0.25。更习惯的表达形式是
y=P()xjxJeW(4.25)
tf2
这是一个非线性模型,无法用OLS法直接估计,但可先作线性化处理。上式两边同取
对数,得:
Lriyt—LnPo+P.LriAti+P2Lrixt2+ut(4.26)
取y*=Lnyt,瓦*=LnPo,x;/*=Lnxt1,H2*=xn,有
%*=Bo*+3i**+Bi'z2*+ut(4.27)
上式为线性模型。用OLS法估计后,再返回到原模型。若回归参数
3I+3?=I,称模型为规模报酬不变型(新古典增长理论);
3,+32>I,称模型为规模报酬递增型;
3,+32<1,称模型为规模报酬递减型。
对于对数线性模型,Lny=L〃3O+31Lnxt1+32Lnxt2+i”,31和3z称作弹性系数。以
3i为例,
31=S£〃2八=y「型=以/仁人一(4.28)
aL,LXt1xt1-1axnav«IA1ytai
可见弹性系数是两个变量的变化率的比。注意,弹性系数是一个无量纲参数,所以便于
在不同变量之间比较相应弹性系数的大小。
对于线性模型,p=aO+a,1Xrr+3.2Xt2+Ui,Hl和@2称作边际系数。以Hl为例,
ai=N(4.29)
BXn
通过比较(4.28)和(4.29)式,可知线性模型中的回归系数(边际系数)是对数线性回归模
型中弹性系数的一个分量。
例4.1(136P例3.4)略
4.2非线性化模型的处理方法
模型:)=〃+as+ag无论通过什么变换都不可能实现线性化,对于这种模型。
1122
称为非线性化模型。可采用高斯一牛顿迭代法进行估计,即将其展开泰勒级数后,再进
行迭代估计方法进行估计。
1、迭代估计法
思想是:通过泰勒级数展开,先使非线性方程在某组初始参数估计值附近线性
化,然后对这一线性方程应用OLS法,得出一组新的参数估计值。下一步是使非线性
方程在新参数估计值附近线性化,对新的线性方程再应用OLS法,又得出一组新的参
数估计值。不断重复上述过程,直至参数估计值收敛时为止。其步骤如下。
1)对模型:),=/(xi,.V2,,.x,b\,b2,,b)+〃在给定的参数初始值耳他。…bp。展
开泰勒级数:
y=f(xX2,,x,*%,bpo)+(b・b)
f小。bJb
Q取前两项,便有线性近似:
+_xx।A2/I(力一-b)(b-b)+u
2IdbdbInojjo
IT可'lo
y-f(x,x,tx,b,b,,b)+£b[-f-
I2k\020tvtoiOb
*—•(if人
/…„A
〃叵]+-注/u
=X(b-b)(b-b0^
i[Qb)2QbQb
=1M,,”
个版L山为"但的口f心,-3变看成一组新的自变量,这就已0b
2)将上式左端看成纽新的因变量,将右端/加
八八八
经成为标准线性模型,再对其就用OLS法,得出一组估计值匕力,,b。
1121pl
3)重复第一、二步,在参数估计&Ab,力侏近再做一次泰勒级数展开,得
1121pl
到新的线性模型「应用OLS法,又得出一组参数俏讦值,L22P2
4)如此反复,得出一组点序列b2,60=16,)直到其收敛为止;….
I/2/N
2、迭代估计法的EViews实现过程……
1)设定代估参数的初始值,方法有两种:
八、使用Param命令设定,
枚U如,Param10.52030则将待估的三个参数的初始值设成了0.5,0,0.
3、在工作文件窗口中双击序列C,并在序列窗口直接输入参数的初始值,
2)估计参数
A、命令方式
在命令窗口可以直接键入非线性模型的迭代估计命令NLSo格式为:
NLS被解释变量,=非线性函数表达式
例如,对于非线性回归模型行〃*+〃估计命令为x+c
NLSy=c(l)*(x-c(2))/(x-c(3))
B、菜单方式。
在数组窗口“procs—makeepuation;
在弹出的方程描述对话框中输入非线性回归模型的具体形式;
y=c(1)*(x-c(2))/(x-c(3))
选择估计方法为最小二乘法后单击(0K)
例(P146例3.7)略
4.3回归模型的比较
当经济变量呈现非线性关系时,经常可以采用多个不同数学形式的非线性模型。
如何选择?
1、图开观察分析
1)观察被解释变量和解释变量的趋势图。
2)观察被解释变量和解释变量的相关图
2、模型估计结果分析
1)回归系数符号和大小是否符合经济意义,
2)改变模型后,是否使决定系数的值明显提高。
3)T检验与F检验。
3、残差分析
残差反映了模型未能解释部分的变化情况。
1)残差分布表中,各期残差是否大都落在土。的虚线内。
2)残差分布是否具有某种规律性。
3)近期的残差分析情况。
例1:此模型用来评价台湾农业生产效率。用台湾1958-1972年农业生产总值(匕),
劳动力(%),资本投入(7)数据(见表4.1)为样本得估计模型,
Lny=-3.4+1.50Lnx,+0.49Lnx,(4.30)
12.78夕(4.80)/?2=0.89,F=48.45
还原后得,
yr=0.713X/11.50即20.49(4.31)
因为1.50+0.49=1.99,所以,此生产函数属规模报酬递增函数。当劳动力和资本投入
都增加1%时,产出增加近2%。
例2:用天津市工业生产总值(%),职工人数(4),固定资产净值与流动资产平
均余额(/o)数据(1949-1997)为样本得估计模型如下:
Ln丫=0.7272+0.2587。"+0.6986LnK
(3.12)(3.08)(18.75)
R2=0.98,s.e.=0.17,DW=0.42,F=1381.4
因为0.2587+0.6986=0.9573,所以此生产函数基本属于规模报酬不变函数。
例3:硫酸透明度与铁杂质含量的关系(摘自《数理统计与管理》1988.4,p.16)某
硫酸厂生产的硫酸的透明度一直达不到优质指标。经分析透明度低与硫酸中金
属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交
试验的方法发现铁是影响硫酸透明度的最主要原因"测量了47个样本,得硫酸透明
度
(y)与铁杂质含量(x)的散点图如下(file:nonli()1):
⑴>'=121.59-0.91x⑵l/y=0.069-2.37(1/x)
(10.1)(-5.7)(18.6)(-11.9)
R?=0.42,s.e.=366F=32Rz=().76,s.e.=0.009.F=142
⑶),=-54.40+6524.83(1〃)(4)L/?y=1.99+104.5(1/%)
(-7.2)(163)(22.0)(21.6)
心=0.86,s.e.=18.2,F=266^=0.91,s.e.=0.22,F=468
还原,Lny=Ln(7.33)+104.5(l/x)
y=7.33Jg”:)
⑸非线性估计结果是y=8.2965同'X)EViews命令Y=C(1)*EXP(C(2)*(1/X))
左=0.96,
例4中国铅笔需求预测模型(非线性模型案例,file:nonli6)
中国从上个世纪30年代开始生产铅笔。1985年全国有22个厂家生产铅笔。产量居
世界首位(33.9亿支),占世界总产量的1/3。改革开放以后,铅笔生产增长极为迅速。
1979-1983年平均年增长率为8.5%o铅笔销售量时间序列见图4.21。1961-1964年的销售
量平稳状态是受到了经济收缩的影响。文革期间销售量出现两次下降,是受到了当时
政治因素的影响。1969-1972年的增长是由于一度中断了的中小学教育逐步恢复的结果。
1977-1978年的增长是由于高考正式恢复的结果。1981年中国开始生产自动铅笔,对传
统铅笔市场冲击很大。1979-1985年的缓慢增长是受到了自动铅笔上市的影响,
初始确定的影响铅笔销量的因素有全国人口、各类在校人数、设计人员数、居民消
费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等。经过多
次筛选、组合和逐步回归分析,最后确定的被解释变量是匕(铅笔年销售量,千万支);
解释变量分别是七|(自动铅笔年产量,百万支);七2(全国人口数,百万人);,3(居
民年均消费水平,元);七,(政策变量)。因政策因素影响铅笔销量出现大幅下降时,
政策变量取负值。例如1967、1968年的汹值取-2,1966、1969-1971、1974-1977年的加
值取-1)。
由图4.22知中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系。由图
4.23知全国人口与铅笔销量存在线性关系。说明人口越多,对铅笔的需求就越大。由图
4.24知居民年均消费水平与铅笔销量存在近似对数的关系。散点图说明居民年均消费
水平越高,则铅笔销量就越大。但这种增加随着居民消费水平的增加变得越来越缓慢。
图4.25显示政策变量与铅笔销量也呈线性关系。
350
铅笔销售量时间序列(1961-1985)(文件名nonli6)
Y.X1散点图Y.X2散点图
Y.X3散点图Y.X4散点图
基于上述分析建立的模型形式是
匕二Po+Pl七l+民七2+氏Ln(xt3)+P4x4+ut
V与必3呈非线性关系。估计结果如下。
=-907.94-2.95x+0.31x+170.19Mx+45.51x(4.41)
11/2/3
(-6.4)(-3.7)(4.8)(4.4)(12.6)
R-=0.9885,DW=2.09,F=429,se=10.34
上式说明,在上述期间自动铅笔年产量每增加1百万支,平均使铅笔的年销售量减少
2950万支。全国人口数每增加1百万人,平均使铅笔的年销售量增加31()万支。对数的
居民年均消费水平每增加1个单位,平均使铅笔的年销售量增加17亿支。一般性政策
负面变动使铅笔的年销售量减少4.551亿支。当政策出现大的负面变动时,铅笔的
年销量会减少9.102亿支。
当匕对所有变量都进行线性回归时(见下式),显然估计结果不如(4.41)式好。
=-254.26-3.29x+0.42x+0.66x+40.74x(4.42)
yt11t2r3i4
(-12.0)(-3.0)(8.6)(3.5)(11.7)
R?=0.9857,DW=1.77,F=346,s.e.=11.5
案例5:厦门市贷款总额与GDP的关系分析(1990~2003,Hle:bank08)
数据和散点图如下。从散点图看,用多项式方程拟合比较合理。
obsLOANGDP
199063,7000057,10000
199178,0000072,00000
1992112.700097,70000
LOAN•
1993151.8000132.3000
1994209.6000107.0000800
1995260.8000250.6000■
1996306.8000306.4000600*
1997■
352.3000370.3000■
1998397.3000410.10004oa*
1999435.3000458.3000•
2000488.3000501.2000oa*
2■
2001552.0000556.0000*
2002646.0000640.00000.GDP
2003898.0000760.0000c2004006008C
2
Loan,=P{)+P\GDPt+笆GDPt+生.专3+lit
Ont=-24.5932+1.6354GDPi-0.0026GJ2+0.0000027GDPn
(-2.0)(11.3)(-6.3)(7.9)
R2=0.9986,DW=2.6
o4nn60nRfK
DependentVariable:LOANMethod:LeastSquaresDate:07/22/04Time:22:02Sample:
19902003Includedobservations:14
VariableCoefficientStd.Errort-StatisticProb.
C-24.5932312,53127-1.9625490.0781
GDP1.6353720.14441111,324440.0000
GDPA2-0.0026220.000419-6.2538320.0001
GDP叼2.70E-063.42E-077.0990550.0000
R-squared0.998649Meandependentvar353.7571
AdjustedR-squared0.998243S.D.dependentvar238.3038
S.E.ofregression9.908309Akaikeinfocriterion7.675664
Sumsquaredresid997.6631Schwarzcriterion7.850252
Loglikelihood-49.72965F-statistic2463.275
Durbin-Watsonstat2.505063Prob(F-statistic)0.000000
例6钉螺存活率曲线曲le:nonli3)(生长曲线模型)
在冬季土埋钉螺的研究中,先把一批钉螺埋入土中,以后每隔一个月取出部分钉
螺,检测存活个数,计算存活率。数据见表4.3。散点图见图4.20。
V,存活率(%)人十埋月数
,100.00
93.01
92.32
88.03
84.74
82.05
48.46
41.()7
15.08
5.29
3.510
1.311
0.512
设定匕的上渐近极限值k=101(因为已有观测值匕=100,所以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年花城版五年级音乐教师培训计划
- 2024-2025学年度语文八年级下册跨学科教学计划
- 物联网在缫丝机械中的应用-洞察阐释
- 数字货币在P2P借贷中的应用与挑战-洞察阐释
- 物联网驱动的农机系统优化与管理-洞察阐释
- 架构可扩展性研究-洞察阐释
- 第六单元《百分数(一)》(原卷)
- 核废料处理技术交流-洞察阐释
- 通信行业招投标专员职责概述
- 短视频平台如何影响用户的媒介消费行为决策-洞察阐释
- 2025届广西柳州市名校高考冲刺押题(最后一卷)化学试卷含解析
- 业主投诉处理制度
- 2025年博士思政面试题及答案
- 一个土豆店创业计划书
- 电站的应急预案范文(9篇)
- 2025年机动车检测站全套管理制度(全套)
- 《智能媒体传播》课程教学大纲
- 数字化设计与制造技术基础知识单选题100道及答案
- 变电站设备危险源辨识清单及预控措施
- 艾灸疗法课件
- 银行职业介绍课件
评论
0/150
提交评论