版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济预测与决策技术及MATLAB实现第10章灰色预测法
10.1灰色预测基本内容10.2.1社会消费品零售总额预测10.2案例分析10.2.2房地产开发投资预测10.2.3城镇居民消费支出预测10.2.4股票灰色灾变预测10.2.5重大风暴潮灾害预测练习与提高(十)1982年我国学者邓聚龙先生创立了灰色系统理论,目前许多国家及国际组织的知名学者从事灰色系统的理论和应用研究工作。灰色系统研究的是“部分信息明确,部分信息未知”的“小样本,贫信息”不确定性系统,它通过对已知“部分”信息的生成去开发了解、认识现实世界。着重研究“外延明确,内涵不明确”的对象。第10章灰色预测法
10.1灰色预测基本内容
一、灰色预测的概念(1)灰色系统、白色系统和黑色系统
白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全充分的。
黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。
灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。
灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色预测是对既含有已知信息又含有不确定信息的系统进行预则,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。
(3)灰色预测法
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。
畸变预测即通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。系统预测
通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。拓扑预测
将原始数据做曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。
二、生成列
为了弱化原始时间序列的随机性,在建立灰色预测模型之前,需先对原始时间序列进行数据处理,经过数据处理后的时间序列即称为生成列。
灰色系统常用的数据处理方式有累加和累减两种。
(1)数据处理方式累加是将原始序列通过累加得到生成列。累加的规则:
将原始序列的第一个数据作为生成列的第一个数据,将原始序列的第二个数据加到原始序列的第一个数据上,其和作为生成列的第二个数据,将原始序列的第三个数据加到生成列的第二个数据上,其和作为生成列的第三个数据,按此规则进行下去,便可得到生成列。记原始时间序列为:生成列为:累减
累减是累加的逆运算,累减可将累加生成列还原为非生成列,在建模中获得增量信息。一次累减的公式为:三、关联度
关联度分析是分析系统中各因素关联程度的方法,在计算关联度之前需先计算关联系数。(1)关联系数设则关联系数定义为:为第k个点的绝对误差;和ρ称为分辨率,0<ρ<1,一般取ρ=0.5;
对单位不一,初值不同的序列,在计算关联系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。为两级最小差;为两级最大差;(2)关联度和的关联度为:年份汽车产量/万辆(X1)粗钢产量/万t(X2)焦炭产量/万t(X3)发电量/亿KW·h(X4)20152450.3580382.544822.5458145.7320162811.9180760.9444911.4861331.6020172901.8187074.0943142.5566044.4720182782.7492903.8444834.2071661.3320192567.6799541.8947126.1675034.2820202532.49106476.6847116.1277790.60【例10-1】我国2015--2020年汽车产量、粗钢产量、焦炭产量和发电量的年产值如表10-1所示,试计算粗钢产量、焦炭产量和发电量对汽车产量的关联度。%数据X1=[2450.35 2811.91 2901.81 2782.74 2567.67 2532.49];X2=[80382.5 80760.9487074.0992903.84 99541.89106476.68];X3=[44822.54 44911.4843142.5544834.247126.1647116.12];X4=[58145.73 61331.666044.4771661.3375034.28 77790.6];%初始化处理Y1=X1./X1(1);Y2=X2./X2(1);Y3=X3./X3(1);Y4=X4./X4(1);%绝对差Z2=abs(Y2-Y1);Z3=abs(Y3-Y1);Z4=abs(Y4-Y1);%两级最小最大差u=min(min([Z2,Z3,Z4]));v=max(max([Z2,Z3,Z4]));%分辨率r=0.5;%关联系数aita2=(u+r*v)./(Z2+r*v);aita3=(u+r*v)./(Z3+r*v);aita4=(u+r*v)./(Z4+r*v);%关联度r12=mean(aita2)r13=mean(aita3)r14=mean(aita4)r12=0.6312r13=0.7201r14=0.6183焦炭产量对汽车产量的关联度最大,粗钢产量对汽车产量影响其次,发电量对汽车产量关联度最小。
10.1.2灰色预测GM(1,1)模型一、GM(1,1)模型的建立
设时间序列有n个观察值:通过累加生成新序列
令为的紧邻均值生成序列
则GM(1,1)的灰微分方程模型为:
其中:α称为发展灰数;μ称为内生控制灰数。设为待估参数向量,可利用最小二乘法求解。解得:其中称微分方程:
为灰色微分方程的白化方程,也称影子方程。(1)白化方程的解也称时间响应函数,其为(2)GM(1,1)灰微分方程的时间响应序列为(3)取
(4)还原值二、模型检验(1)残差检验按预测模型计算并将累减生成然后计算原始序列与的绝对误差序列及相对误差序列。灰色预测检验一般有残差检验、关联度检验和后验差检验。给定a,当成立,称模型为参差合格模型.a取0.01、0.05、0.1所对应的模型分别为:优、合格、勉强合格(2)关联度检验根据前面所述关联度的计算方法算出与原始序列的关联系数,然后计算出关联度,根据经验,当ρ=0.5时,关联度大于0.6便满意了。(3)后验差检验a.计算原始序列标准差:b.计算绝对误差序列的标准差:c.计算方差比:d.计算小误差概率:令:则3.GM(1,1)模型群在实际建模中,原始数据序列的数据不一定全部用来建模。在原始数据序列中取出一部分数据就可以建立一个模型。
定义1:设数据列为:
将取为时间轴的原点,则称为过去,为现在,为未来。定义2:设数据列为:其GM(1,1)时间响应式的累减还原值为:(1)当称为模型模拟值
定义3:设数据列为:(1)用建立的GM(1,1)模型称为全数据GM(1,1)
(2)当称为模型预测值
(2)用
建立的GM(1,1)模型称为部分数据GM(1,1)
(3)用
建立的GM(1,1)模型称为新信息
GM(1,1)
(4)用
建立的GM(1,1)模型称为新陈代谢
GM(1,1)
4.模型建立的条件(1)光滑性检验给定的时间序列数据集,其累加生成列为,要建立GM(1,1)模型,通常要检验光滑性条件:当t充分大时上式都成立,则说明可用GM(1,1)建模。(2)发展灰数a适用范围
:一般地,当|a|<2时,GM(1,1)模型有意义
1)当时,GM(1,1)的1步预测精度在98%以上,2步和5步预测精度都在97%以上,可用于中长期预测;2)当时,GM(1,1)的1步和2步预测精度都在90%以上,10步预测精度都也高于80%,可用于短期预测;3)当时,用于短期预测应十分慎重;4)当时,GM(1,1)的1步预测精度已低于70%,应采用残差修正模型;5)当,不宜采用GM(1,1)模型。10.1.3GM(1,1)参差修正模型可获得生成序列的预测值(1)若用原始序列建立的GM(1,1)模型
对于参差序列若存在,使得当时,的符号一致,且则称参差序列为可建模参差尾部。的累加生成序列其GM(1,1)时间响应式为计算参差序列求导数其中正负号取值与参差尾部符号一致得修正模型(2)利用原始数据与其预测值之差作为残差序列,即再通过累减得出经过残差修正的原始序列预测值:对于参差序列同样如果按原始数据建立的GM(1,1)模型,经检验不合格,则对原模型进行修正的最简单的方法,就是对模型预测值都加上残差平均值,即修正后的预测值为
+E,这种方法所得新模型称为残差均值修正模型。这样可以十分容易地大大提高新模型的预测精度。2.残差均值修正模型3.尾部数列GM(1,1)修正模型如果用建立的GM(1,1)模型在进行检验时不合格,并发现自某一项之后,预测值明显的比实际值偏大或者偏小,说明这时进行修正才是有意义的。人们在实践中发现,与其应用残差GM(1,1)修正模型,不如直接对原始数列的后半部分(即预测值明显比实际值偏大或者偏小部分),重新建立GM(1,1)模型,然后还原求得预测模型,这种方法所得新模型称为尾部数列修正模型。如果考虑得系统由若干个相互影响的因素组成:为系统特征数据序列,而其相关因素序列有Z为的紧邻均值生成序列
10.1.4GM(1,N)模型设为的累加生成列,则GM(1,N)的灰微分方程模型为:
可利用最小二乘法求解。解得:其中称微分方程:
为灰色微分方程的白化方程,也称影子方程。(1)白化方程的解(响应序列形式)为
(2)累减还原值
(5)灰色系统理论采用参差检验、关联度检验、后验差检验三种方法检验,判断模型的精度。10.1.5灾变预测
灰色灾变预测的任务是给出下一个或几个异常值出现的时刻,以便人们提前预防,采取政策,减少损失。定义:设原始序列为给定上限异常值则称满足的序列为上灾变序列。且称为灾变日期序列。命题:设且灾变日期序列GM(1,1)序号响应式为:其累加序列为的紧邻生成序列为则称为灾变GM(1,1)模型。
即定义:设原始序列为n为现在,给定异常值相应的灾变日期序列其中为最近一次灾变发生的日期,则称为下一次灾变发生的预测日期,为未来第k次灾变的预测日期。10.2.1社会消费品零售总额预测10.2案例分析按照GM(1,1)模型的方法与步骤进行案例预测
【例10-2】我国全社会消费品零售总额2014--2021年的数据如表所示,试建立GM(1,1)预测模型,并预测2022--2024年的全社会消费品零售总额预测值。年份20142015201620172018201920202021消费品零售总额25.9528.6631.5834.7337.7840.8039.2044.08(1)输入原始数据X0MATLAB程序如下:clearX0=[25.95 28.66 31.58 34.73 37.78 40.80 39.2044.08](2)产生累加生成列X1X1=cumsum(X0)(3)构造数据矩阵B和数据向量Yfork=2:length(X0)z(k)=(1/2)*(X1(k)+X1(k-1));endzB=[(-z(2:end))’ones(length(z)-1,1)]Y=(X0(2:end))'(4)计算模型参数bata=inv(B'*B)*B'*Y;a=bata(1)b=bata(2)c=b/ad=X1(1)-c(5)写出GM(1,1)预测模型a=-0.0647b=27.3289c=-422.4752d=448.4252(6)残差检验%根据模型求出预测序列值X2X2(1)=X1(1);form=1:length(X0)-1X2(m+1)=(X0(1)-b/a)*exp(-a*m)+b/a;endX2%还原累减生成列X3X3(1)=X2(1);form=1:length(X0)-1X3(m+1)=X2(m+1)-X2(m);endX3Delta0=abs(X0-X3)%绝对残差序列Phi=Delta0./X0%相对残差序列mPhi=mean(Phi)%平均相对残差(7)关联度检验
eta=(min(Delta0)+0.5*max(Delta0))./(Delta0+0.5*max(Delta0))%关联系数r=mean(eta)%关联度(8)后验差检验。mX0=mean(X0)%原始数据均值sX0=std(X0)%原始数据均方差mDelta0=mean(Delta0)%残差均值sDelta0=std(Delta0)%残差均方差C=sDelta0/sX0%均方差比%计算小残差概率S0=0.6745*sX0e=abs(Delta0-mDelta0)p=length(find(e<S0))/length(e)%小残差概率(9)预测。k=length(X0):length(X0)+2%2022年至2024年X2(k+1)=(X0(1)-b/a)*exp(-a*k)+b/a;%预测值X2X3(k+1)=X2(k+1)-X2(k)%预测值的还原值X3(10)绘制预测图。t=1:length(X0)t1=1:length(X0)+3plot(t,X0,'+',t1,X3,'-O')xlabel('时间/年')ylabel('社会消费品零售总额/万亿元')legend('原始数据','预测值')10.2.2房地产开发投资预测利用本案例说明残差修正模型预测的方法
【例10-3】我国2013--2021年的房地产开发投资额数据如表,试用GM(1,1)残差修正模型预测2022--2024年的房地产开发投资额。(1)先建立GM(1,1)模型,并观察最后一个数据的残差和相对残差
年份201320142015201620172018201920202021投资额8.609.509.6010.2610.9812.0213.2214.1414.14clearX0=[7.188.609.509.6010.26 10.98 12.02 13.22 14.1414.76];%产生累加生成列X1X1=cumsum(X0)%构造数据矩阵B和数据向量Yfork=2:length(X0)z(k)=(1/2)*(X1(k)+X1(k-1));endzB=[(-z(2:end))'ones(length(z)-1,1)]Y=(X0(2:end))'%计算模型参数bata=inv(B'*B)*B'*Y;a=bata(1)b=bata(2)c=-a*(X0(1)-b/a)%根据模型求出原始数据预测序列值X2X2(1)=X0(1)fork=1:length(X0)-1X2(k+1)=(-a)*(X0(1)-b/a)*exp(-a*k);endX2%计算残差序列和相对残差序列E=X0-X2F=E./X0E=0-0.20900.0518-0.5338-0.6092-0.6779-0.4838-0.1912-0.2443-0.6681F=0-0.02430.0055-0.0556-0.0594-0.0617-0.0403-0.0145-0.0173-0.0453残差序列和相对残差序列的后面7项符号一致,都为负值,且误差相对较大,因此可以使用残差修正模型提高其精度。(2)下面利用残差对上述模型进行修正E0=-E(4:end)%产生累加生成列E1E1=cumsum(E0);%构造数据矩阵B2和数据向量Y2fork=2:length(E0)z2(k)=(1/2)*(E1(k)+E1(k-1));endB2=[(-z2(2:end))'ones(length(z2)-1,1)];Y2=(E0(2:end))';%计算模型参数a2,b2bata2=inv(B2'*B2)*B2'*Y2;a2=bata2(1)b2=bata2(2)c2=-a2*(E0(1)-b2/a2)%根据修正模型预测X3X3(1)=X0(1);fork=1:length(X0)-1ifk<3X3(k+1)=-a*(X0(1)-b/a)*exp(-a*k);%修正之前模型
elseX3(k+1)=-a*(X0(1)-b/a)*exp(-a*k)-(-a2)*(E0(1)-b2/a2)*exp(-a2*k);%修正之后模型
endendX3%计算修正之后残差序列和相对残差序列E2=X0-X3F2=E2./X0E2=0-0.20900.0518-0.0631-0.1810-0.2885-0.12970.13100.0487-0.4016F2=0-0.02430.0055-0.0066-0.0176-0.0263-0.01080.00990.0034-0.0272(3)对2022至2024年进行预测。k=length(X0):length(X0)+2X3(k+1)=-a*(X0(1)-b/a)*exp(-a*k)-(-a2)*(E0(1)-b2/a2)*exp(-a2*k)X3=7.18008.80909.44829.663110.441011.268512.149713.089014.091315.161616.305317.528018.8358最后三项即为2022年至2024年的房地产开发投资额预测值,其分别是16.3053万亿元、17.5280万亿元和18.8358万亿元10.2.3城镇居民消费支出预测利用多变量序列预测模型
【例10-4】我国在2014--2021年的城镇居民人均消费支出和可支配收入,以及城镇人口数量的调查统计数据如表所示,试建立多变量灰色预测模型,并预测2022年,当城镇人均可支配收入和人口数量分别为5万元和9.2亿人时的城镇居民人均消费支出。年份201420152016201720182019202020212022消费支出/万元2.002.142.312.442.612.812.703.03
可支配收入/万元2.883.123.363.643.934.244.384.745.00人口数/亿人7.677.938.198.438.648.849.029.149.20(1)建立GM(1,3)模型clearX10=[2.00 2.14 2.31 2.44 2.61 2.81 2.70 3.03];%支出X20=[2.88 3.12 3.36 3.64 3.93 4.24 4.38 4.74];%收入X30=[7.67 7.93 8.19 8.43 8.64 8.84 9.02 9.14];%人口数%生成列X11=cumsum(X10)X21=cumsum(X20)X31=cumsum(X30)%求参数,建立模型fork=2:length(X11)Z1(k)=(1/2)*(X11(k)+X11(k-1));endZ1B=[-(Z1(2:end))',(X21(2:end))',(X31(2:end))'];Y=(X10(2:end))';C=inv(B'*B)*B'*YC=1.76110.67660.2231(2)建立的GM(1,3)模型为
(2)残差检验%用建立模型预测模拟值fork=0:7X12(k+1)=(X10(1)-1/C(1)*(C(2)*X21(k+1)+C(3)*X31(k+1)))...*exp(-C(1)*k)+1/C(1)*(C(2)*X21(k+1)+C(3)*X31(k+1));endX12%累减还原X13=[X12(1),diff(X12)]%残差检验Delta0=abs(X10-X13)%绝对残差序列Phi=Delta0./X10%相对残差序列mPhi=mean(Phi)%平均相对残差
(3)预测2022年人均消费支出。X20(9)=5;%给定2022年人均收入X30(9)=9.20;%给定2022年人口数X21(9)=X21(8)+X20(9);X31(9)=X31(8)+X30(9);k=8;X12(k+1)=(X10(1)-1/C(1)*(C(2)*X21(k+1)+C(3)*X31(k+1)))...*exp(-C(1)*k)+1/C(1)*(C(2)*X21(k+1)+C(3)*X31(k+1));X13(9)=X12(9)-X12(8)X2022=X13(9)X13=2.00001.88922.58422.56662.63182.75542.82682.97923.0763X2022=3.0763
10.2.4股票灰色灾变预测利用灰色灾变预测模型可对股票的阴变集(今日股价比昨日股价低)和阳变集(今日股价比昨日股价高)进行预测。【例10-5】中国建设银行在2022年1月10日至25日的股票收盘价数据如表,试对阴变集(下灾变集)进行灰色预测。序号123456789101112日期1月10日1月11日1月12日1月13日1月14日1月17日1月18日1月19日1月20日1月21日1月24日1月25日收盘价6.126.146.086.116.025.986.076.056.136.076.086
(1)先找阴变集所在的位置clearx=[6.126.146.086.116.025.986.076.056.136.076.086];y=diff(x);q=find(y<0)+1
(2)现选用阴线,对阴线下灾变集日期集进行预测Q0=q;Q1=cumsum(Q0);%生成列k=Q0(2:end)./Q1(1:end-1)%检验光滑forn=2:length(Q0)z(n)=(1/2)*(Q1(n)+Q1(n-1));endB=[(-z(2:end))'ones(length(z)-1,1)]Y=(Q0(2:end))'bata=inv(B'*B)*B'*Y;a=bata(1)b=bata(2)q=35681012
%根据模型求出预测序列值Q2Q2(1)=Q1(1);form=1:length(Q0)-1Q2(m+1)=(Q0(1)-b/a)*exp(-a*m)+b/a;endQ2%还原累减生成列Q3Q3(1)=Q2(1);form=1:length(Q0)-1Q3(m+1)=Q2(m+1)-Q2(m);endQ3将Q3与Q0比较,模拟值的整数完全与阴变集一致Q3=3.00004.99876.23437.77549.697412.0944
%残差检验Delta0=abs(Q0-Q3)%绝对残差序列Phi=Delta0./Q0%相对残差序列mPhi=mean(Phi)%平均相对残差
%后验差检验mQ0=mean(Q0)%原始数据均值sQ0=std(Q0)%原始数据均方差mDelta0=mean(Delta0)%残差均值sDelta0=std(Delta0)%残差均方差C=sDelta0/sQ0%均方差比%计算小残差概率S0=0.6745*sQ0e=abs(Delta0-mDelta0)p=length(find(e<S0))/length(e)%小残差概率%预测阴线日的时间m=length(Q0):length(Q0)+2%下三个阴线日的时间Q2(m+1)=(Q0(1)-b/a)*exp(-a*m)+b/a;Q3(m+1)=Q2(m+1)-Q2(m)注:将本程序中的Q0=q用Q0=x(q)替换,其它程序不变,即得下三个阴线的价格的预测值。Q3=3.00004.99876.23437.77549.697412.094415.084118.812723.4629Q3数列中的后三位数取整数值,即得序号为15、19、23对应的三个日期是阴线,说明这一天的价格比上一天的价格低Q3=6.08006.01406.01906.02406.02906.03406.03906.04406.0490
10.2.5重大风暴潮灾害预测【例10-6】我国广东省重大风暴潮灾害时常发生,现将1996年以来由强台风、强热带风暴单次造成的直接经济损失超过50亿元以上作为下限异常值进行统计,数据如表所示,其中序号是发生特大风暴潮的某年所在的时间位置,试运用灰色灾变模型预测2020年以后若干次风暴潮灾变发生的日期。序号11113182225年份199620062008201320172020直接经济损失/亿元201.2577.06132.7464.9350.69129.03(1)建立预测模型clearQ0=[1 11 13 18 22 25];Q1=cumsum(Q0);k=Q0(2:end)./Q1(1:end-1)%检验光滑forn=2:length(Q0)z(n)=(1/2)*(Q1(n)+Q1(n-1));endB=[(-z(2:end))',ones(length(z)-1,1)];Y=(Q0(2:end))';bata=inv(B'*B)*B'*Y;a=bata(1)b=bata(2))c=(1-exp(a))*(Q0(1)-b/a)(2)残差检验%根据模型求出预测序列值Q2Q2(1)=Q1(1);form=1:length(Q0)-1Q2(m+1)=(Q0(1)-b/a)*exp(-a*m)+b/a;endQ2%还原累减生成列Q3Q3(1)=Q2(1);form=1:length(Q0)-1Q3(m+1)=Q2(m+1)-Q2(m);endQ3Delta0=abs(Q0-Q3)%绝对残差序列Phi=Delta0./Q0%相对残差序列mPhi=mean(Phi)%平均相对残差%后验差检验mQ0=mean(Q0)%原始数据均值sQ0=std(Q0)%原始数据均方差mDelta0=mean(Delta0)%残差均值sDelta0=std(Delta0)%残差均方差C=sDelta0/sQ0%均方差比%计算小残差概率S0=0.6745*sQ0e=abs(Delta0-mDelta0)p=length(find(e<S0))/length(e)%小残差概率%预测未来灾变日的日期m=length(Q0):length(Q0)+2%下三个灾变日期Q2(m+1)=(Q0(1)-b/a)*exp(-a*m)+b/a;Q3(m+1)=Q2(m+1)-Q2(m)Q3=1.000011.296613.874017.039320.926925.701431.565238.766947.6116从结果来看,Q3中的后三个近似整数32、39、48,即为下三个特大风暴潮灾害日期的序列号,以2020年(序号为25)作为最后一个特大灾害年,则其未来三个特大风暴潮灾害年对应的时间大约是:2020+(32-25)=2027(年)2020+(39-25)=2034(年)2020+(48-25)=2043(年)经济预测与决策技术及MATLAB实现第11章景气预测法11.1景气预测基本理论11.2案例分析练习与提高(十一)
11.2.1国房景气指数11.2.2上海房地产景气指数第11章景气预测法11.1景气预测基本理论11.1.1景气指标体系基本概念景气预测是通过正确地选择景气指标体系来实现的经济的景气状态,是通过一系列经济指标来描述的,称为景气指标。景气指标是从众多的经济指标中挑选出来的,分为先行指标、同步指标和滞后指标三类。景气循环又称经济波动,也称经济周期。一个标准的经济周期,通常包括扩张和收缩两个时期,分为四个阶段:复苏、高涨、衰退和萧条。11.1.2景气循环法预测过程景气循环法预测步骤(1)确定时差关系的参照系——基准循环,这是关键的一步;(2)选择景气指标;(3)划分先行、同步、滞后指标;(4)对先行、同步、滞后指标分别编制扩散指数和合成指数;(5)对计算结果进行分析,了解当前经济状况,预测未来经济波动。1.基准循环的确定方法(1)以重要的经济指标(GNP、GDP、工业总产值等)的周期为基准循环;(2)专家意见及专家评分;(3)经济大事记和经济循环年表;(4)初选几项重要指标计算历史扩散指数;(5)以一致合成指数转折点为基础。2.景气指标的筛选(1)聚类分析:是将要分析的m个指标变量各自看作一类,然后计算各类之间的关系密切程度(相关系数或距离),并将关系最密切的两类归为一类,把另外一些彼此之间相似程度大的指标聚合为另一类。(2)非参数检验:检验同类指标之间是否具有显著性差异。(3)指标筛选流程
对搜集到得所有指标,进行分类,分别在每一类中进行聚类分析,并将聚类结果中单独一类的指标直接纳入预警指标体系。对于指标个数的大于两个的子类,则进行显著性差异检验。如果有显著性差异,则对此类中的指标继续进行聚类分析。直到同类的指标不再有显著性差异为止如果同类指标没有显著性差异,对于指标个数为2的子类,通过主观判断,从二者选择一个纳入预警指标体系;对指标个数大于2的子类,对指标进行相关分析(求指标间的相关系数),并对每一指标的相关系数求和,数值最大者,认为它在此子类中与同类其它指标具有较高的相关性,因此代表性较强,纳入预警指标体系。3.景气指标的划分(1)时差相关分析.是利用相关系数验证时间序列先行、一致或滞后关系的一种方法。计算方法是以一个重要的能够敏感反应当前市场活动的指标作为基准指标,然后使被选择指标超前或滞后若干期,计算它们的相关系数。l:为时差或延迟数,取负数表示超前,取正数表示滞后,L为最大延迟数,是数据取齐后的数据个数。在选择景气指标时,取最大的时差相关系数,作为反应被选指标与基准指标超前、滞后或同步的时差相关关系,相应l
的表示超前或滞后期。(2)K-L信息量K-L信息量,用以判定两个概率分布的接近程度。设基准指标做归一化处理得到序列为p,被选择指标归一化处理得到序列为q,则K-L信息量计算公式:l:为时差或延迟数,取负数表示超前,取正数表示滞后,L为最大延迟数,是数据取齐后的数据个数。在选择景气指标时,取最小的K-L信息量,作为反应被选指标与基准指标超前、滞后或同步的时差相关关系,相应l
的表示超前或滞后期。K-L信息量越小,越接近于零,说明指标x与基准指标y越接近。一般情况下,当K-L信息显小于50时,就可以认为两个指标之间的概率分布较为接近。4.景气指数计算方法(1)扩散指数(DI):是(先行、一致或滞后)指标组内在某个时期扩张(上升)指标个数占组内所采用指标个数的比率。DI(t)为t时刻的扩散指数;Xi(t)为第i个变量指数在t时刻的波动测定值;Wi为第i个变量指标分配的权数;n为变量指标总数;s为两比较指标值的时间差。从扩散指数的定义可知,DI(t)始终处于0到100%之间当0<DI(t)<50%:经济向扩张方向运动,经济系统运行于不景气空间后期;当50%<DI(t)<100%:经济运行于景气空间,经济状况发生重大转折,随着DI(t)向100%不断逼近,经济越来越热当100%>DI(t)>50%:经济处于景气空间后期,经济系统处于降温阶段;当50%>DI(t)>0:经济运行发生重大转折,经济系统处于全面收缩阶段,进入一个新的不景气空间前期。利用扩散指数可预测和监控经济运行,能有效分析和预测经济波动的转折点,但不能说明经济波动的程度。(2)合成指数又称景气综合指数,是由一类特征指标以各自的变化幅度为权数的加权综合平均数,即以多个指标的加权平均。计算方法1)单指标的对称变化率和标准化对称变化率就是本期比上期的增长量与两期的平均值比较得出的数值。Cit中表示第i个指标第t年的对称变化率,用百分数表示。和分别表示第i个指标第t年和第t-1年的原始数据。用Ai表示第i个指标对称变化率时间序列的序时平均数,N表示标准化的期数,则有:用Sit表示第i个指标t期对称变化率的标准化数值,则有2)多指标对称变化率标准化后的加权平均数Rt:多指标综合的平均对称变化率,Sit表示第i个指标第t年的对称变化率的标准化数值,Wi表示第i个指标的权数,i=1,2,...,k表示指标项目数。3)平均变化率以同步指数标准化标准化因子F的计算公式是Rt表示超前指标或滞后指标的综合平均对称变化率第t期的数值,Pt表示一致指标的综合平均对称变化率时间序列的t期数据,N表示期数。平均变化率以同步指数标准化的计算公式是:t=2,3,...,m表示期数。4)计算合成指数首先计算初始指数的时间序列,即环比原始指数,t=2,3,...,m表示期数。用
表示所选基准年份的平均值,由此得到合成指数为:11.1.3景气综合评分——预警系统1.预警系统原理是选择一组反映经济发展状况的敏感指标,运用有关的数据处理方法,将多个指标合并为一个综合性指标,通过一组类似于交通管制信号红、黄、绿灯的标识,利用这组指标和综合指标对当时的经济状况发出不同的信号,通过观察信号的变动情况,来判断未来经济增长的趋势。2.预警指标状态区域划分和临界点确定(1)区域划分:将判断区域分为过热、偏热、正常、偏冷和过冷五个域,分别以红灯、黄灯、绿灯、浅蓝灯和蓝灯表示。绿灯区居中,代表常态区或稳定区,概率一般定为50%;红灯区和蓝灯区属于极端区,经济含义为过热和过冷,概率各占10%;黄灯区和浅蓝灯区为相对稳各占15%。(2)临界值的确定:先给出各种灯区的分界线检查值,再求出综合指标的各时期的评分数,最后将这些综合评分数与各灯区的分界线对应。如假定参与综合的指标数为M,每个指标的满分为5分,则总满分为5M。按惯例取满分的85%为红灯区与红黄灯区的分界线。其总分数为5M×85%=4.25M分,满分的75%和50%为绿灯区的上、下分界线,它对应的分数为5×M×75%=3.75M和5×M×50%=2.5M,满分的40%为浅蓝灯与蓝灯的分界线,对应的分数为5×M×40%=2M。3.计算景气综合评分将每类指标所包含的各指标所处灯区对应的分值加总,得到景气综合评分,并判断综合评分落在哪个区域,显示哪种灯色。根据综合指数的信号判断宏观经济的运行状况,根据各预警指标信号分析导致综合指数信号处于当前状态的具体原因,为宏观调控提供参考和建议。11.2案例分析11.2.1国房景气指数一、我国国房景气指数体系
国房景气指数是全国房地产开发景气指数的简称,其过程为:1.确定指标体系计算国房景气指数的指标包括:(1)土地出让收入指数;(2)本年完成开发土地面积指数(3)房地产开发投资指数;(4)本年资金来源指数;(5)商品房销售价格指数;(6)新开工面积指数;(7)房屋竣工面积指数;(8)空置面积指数。分析报告用的指数指标包括:(1)新开工面积指数;(2)房屋施工面积指数;(3)国有单位投资指数;(4)国内贷款指数;(5)利用外资指数;(6)自筹资金指数;(7)住宅销售价格指数;(8)办公楼销售价格指数;(9)商业营业用房销售价格指数;(10)个人商品房销售额指数;(11)竣工房屋价值指数;(12)住宅空置面积指数;(13)办公楼空置面积指数;(14)商业营业用房空置面积指数。2.建立指标数据库及数据调整对指标体系确定的各项指标,建立历史资料数据库。有些指标如房地产销售价格指标必须先计算后才能得到。有些指标如资金来源、空置面积等必须先进行推算,以保证有必要的数据长度。3.消除量纲影响的方法由于各指标的计量单位不同,不能直接相加综合平均,必须采用消除量纲影响的方法来对数据进行同度量处理,同时,也满足了合成指数编制中对指标进行标准化处理的要求。国房景气指数采用功效系数法,消除量纲的影响比较符合国房景气指数的特点。4.权数的确定
确定参加计算的8个指标的权数。根据我国房地产开发业的发展状况,征求部分专家意见初步确定了国家级各分类指数权数值。分类指数权重代号权重取值性质房地产开发投资指数W120-30同步资金来源指数W2<10同步土地出让收入指数W3<10超前土地开发面积W410-20超前新开工面积指数W5<10同步竣工面积指数W6<10滞后空置面积指数W710-20滞后商品房销售价格指数W810-20同步5.确定基准对比时期分析我国房地产特点,确定1995年3月份为国房指数的基准对比期。6.季节和价格因素调整季节因素调整:用X-11程序进行季节因素调整。价格因素调整:房地产开发投资、到位资金、土地转让收入和销售价格4个指标涉及到价格调整问题。7.指数计算模型(1)分类指数的计算分类指数(K1-K8)的计算采用了环比指数的计算方法:Z(t)表示报告期t期各项指标数据,Z(t-1)表示上一年同期各项指标数据。(2)国房指数的计算在计算8个分类指标后,采用固定权重的算术加权平均法,得到综合指数
将综合指数与基准综合指数对比,得到国房指数G:对空置面积分类指数K7,由于空置面积属于逆指标,其指数值越小,表明景气状况越好,因此,在计算综合指数时,K7是以倒数形式出现。8.计算结果和景气评价根据上述流程和确定的权数,计算国房景气指数值说明房地产业的发展状况。国房指数以100为景气分界点,100以上为景气空间,100以下为不景气空间。为更好发挥国房指数的景气监测作用,应设计合理预警界限,当国房指数突破某预警界限时,系统能发出“报警”信号。1.景气区域的划分过热区:表示房地产发展已经过热,必须降温,该区为极端区趋热区:也称偏热区,表示房地产发展有过热倾向,需引起关注,该区为警告区;适度区:表示房地产发展适度,该区为稳定区;趋冷区:也称偏冷区,表示房地产萎缩倾向,需引起关注,该区为警告区;过冷区:表示房地产处于萧条状态,需要扶持,该区为极端区二、国房指数预警系统根据我国房地产发展趋势的判断,我们认为“适度”区的落地点概率为80%,“偏热”区和“偏冷”区的落地点概率为7.5%,“过热”区和“过冷”区的落地点概率为2.5%的比例比较合理。根据
原理,即假定国房指数服从正态分布:2.分界限的确定首先确定指数波动的中心线,以此作为“适度“区地中心。选取国房指数样本,用其平均值来估计均值和均方差“适度”区地上、下限为:“偏热”区与“过热”区的分界限为“偏冷”区与“过冷”区的分界限为3.对各序列在各时期所处的景气状态标上各色信号。分别以红灯、黄灯、绿灯、浅蓝灯和蓝灯表示。【例11-1】给出2000年至2015年的我国国房景气指数数据如表11-2所示,其中2008年(含)以前每年国家公布12个月数据,从2009年开始,每年1月份数据不公布,即每年公布11个月数据,试划分出我国国房景气指数在这期间的“过热”、“偏热”、“适度”、“偏冷”和“过冷”五个区域,以及景气和不景气空间,来说明我国的房地产发展状况。年\月1234567891011122000102.2102.6101.8101.9102.2102.7102.9103.3103.5103.4103.7104.02001105.2105.0106.2106.9106.5106.0106.4106.4105.9105.6105.1105.32002103.9103.5103.9104.4104.6104.7104.3104.5105.0105.2104.9104.22003108.9109.1107.3106.9106.3107.0107.3106.9106.7106.7106.5106.22004106.6106.6106.1105.5105.0104.8104.8104.9105.0104.7104.2103.72005103.1102.7102.4102.3102.2102.1102.0101.8101.4101.0100.7100.62006100.8101.1101.5101.6101.9102.9103.5103.3103.1103.4103.9103.02007102.4101.8101.2102.7103.3103.6104.0104.5105.0105.7106.6106.52008106.1105.6104.7104.1103.3103.1102.4101.8101.299.798.596.52009
94.994.794.895.996.698.0100.1101.1102.0102.8103.72010
105.5105.9105.7105.1105.1104.7104.1103.5103.6103.2101.82011
102.9103.0103.2103.2101.8101.5101.1100.4100.399.998.92012
97.996.995.694.994.794.694.694.494.695.795.62013
97.997.697.497.397.397.497.397.396.996.497.22014
96.996.495.895.094.894.894.894.794.894.393.92015
93.893.192.692.492.693.093.593.493.393.493.3X=[…];%表数据,共185个,按时间序列排序plot(X)m=mean(X)%均值为适度中心线s=std(X)%标准差Y1=m-1.96*s%偏冷区与过冷区分界线Y2=m-1.28*s%适度区下限Y3=m%适度区中心线Y4=m+1.28*s%适度区上限Y5=m+1.96*s%偏热区与过热区分界线holdon%绘制五个区域图x=1:length(X);Z1=Y1.*ones(size(x));Z2=Y2.*ones(size(x));Z3=Y3.*ones(size(x));Z4=Y4.*ones(size(x));Z5=Y5.*ones(size(x));plot(x,Z1,'-b',x,Z2,'-c',x,Z3,':k',x,Z4,'-k',x,Z5,'-r')axis([0,200,88,115])text(60,112,'过热区')text(60,108,'偏热区')text(60,105,'适度区')text(60,98,'适度区')text(60,95,'偏冷区')text(60,91,'过冷区')text(50,102,'适度中心线’)%绘制景气不景气空间图Z6=100.*ones(size(x));plot(x,Z6,'-.')text(160,100,'景气分界线')text(160,103,'景气空间')text(160,98,'不景气空间')t1=[0:8]*12;%2008年前每年12个月数据t2=[10:17]*11;%2009年开始每年11个月数据set(gca,'XTick',[t1,t2])set(gca,'XTickLabel',{'2000';'2001';'2002';'2003';'2004';'2005';'2006';'2007';...'2008';'2009';'2010';'2011';'2012';'2013';'2014';'2015';'2016'})set(gca,'YTick',[93.296.1100101.5106.9109.8])set(gca,'YTickLabel',{'93.2';'96.1';'100';'101.5';'106.9';'109.8’})xlabel('年份')ylabel('景气指数')holdoff11.2.2上海房地产景气指数【例11-2】现已搜集上海房地产市场有关的指标数据(见表11-3),试求:(1)使用聚类分析和假设检验等方法筛选景气指数;(2)利用时差相关性分析判断超前指标、同步指标和滞后指标;(3)计算超前指标、同步指标的合成指数,说明上海房地产市场的景气发展状况。
一、选取房地产统计指标并收集资料数据1.经过上海房地产市场的数据收集,建立上海房地产市场21指标数据库国内生产总值(x1),房地产业增加值(x2),房地产开发投资额(x3),建筑业总产值(x4),社会消费品零售总额(x5),人均可支配收入(x6),房地产业各项贷款余额(x7),房地产开发企业资金(x8),供应土地占地面积(x9),房地产从业人数(x10),房屋竣工面积(x11),房屋新开工面积(x12),房屋施工面积(x13),房屋出租面积(x14),房地产开发企业总收入(x15),商品房销售面积(x16),住宅商品房销售额(x17),新建商品住宅销售价格指数,固定资产投资价格指数(x19),居民消费价格指数(x20),住宅房屋销售价格(x21)2.房地产统计指标分类总量指标(x1-x4),购买力指标(x5~x7),生产类指标(x8-x13)、交易类指标(x14-x19)和价格类指标(x19~x21)二、筛选景气指标以生产类指标:房地产开发企业资金(x8),供应土地占地面积(x9),房地产从业人数(x10),房屋竣工面积(x11),房屋新开工面积(x12),房屋施工面积(x13)共6个指标为例进行分析。年份房地产开发企业资金(x8)/百亿元供应土地占地面积(x9)/百万m2房地产从业人数(x10)/万人房屋竣工面积(x11)/百万m2房屋新开工面积(x12)/百万m2房屋施工面积(x13)/百万m2201032.2924.859.1419.4130.31112.95201134.4431.487.6522.4136.44129.83201239.6922.317.4223.0527.24132.50201350.9322.247.1022.5427.06135.17201452.7018.626.8623.1327.82146.90201555.3210.006.4626.4726.05150.95201664.098.916.3625.5128.41151.11201753.8510.256.3833.8826.18153.62201853.3013.086.4631.1626.87146.72201954.4513.136.3826.7030.63148.03202055.1622.645.8928.7834.41157.40在进行聚类以前,应首先对这6个指标进行无量纲处理,为了保持原有指标的变异特性,选择归一化处理:A=[32.29 24.85 9.14 19.41 30.31 112.9534.44 31.48 7.65 22.41 36.44 129.8339.69 22.31 7.42 23.05 27.24 132.5050.93 22.24 7.10 22.54 27.06 135.1752.70 18.62 6.86 23.13 27.82 146.9055.32 10.00 6.46 26.47 26.05 150.9564.09 8.91 6.36 25.51 28.41 151.1153.85 10.25 6.38 33.88 26.18 153.6253.30 13.08 6.46 31.16 26.87 146.7254.45 13.13 6.38 26.70 30.63 148.0355.16 22.64 5.89 28.78 34.41 157.40];%归一化处理B=sum(A);X=[A(:,1)/B(1),A(:,2)/B(2),A(:,3)/B(3),A(:,4)/B(4),A(:,5)/B(5),A(:,6)/B(6)];%将X进行转置,进行聚类分析Y=pdist(X')%计算指标之间的距离Z=linkage(Y)%形成系统聚类树dendrogram(Z)%显示系统聚类树T=cluster(Z,4)%不同閥值的分类结果对这6个指标,采用聚类法进行聚类结果:分成四类:x11,x13;x8;x10,xl2;x9;由于x8和x9只有一个指标的子类,因此将这两个指标直接纳入预警指标体系。对于x11和x13,x10和x12分别进行显著性检验--秩和ranksum检验,判断指标之间是否具有显著性差异。对x11和x13的秩和ranksum检验:[p1,h1,stats1]=ranksum(X(:,4),X(:,6))运行结果如下:p1=0.5545h1=0检验结果h=0表示x11和x13的总体差别不显著,一定程度上商品房竣工面积比施工面积更能够衡量一定时间点上的商品房供应量.故将商品房竣工面积x11纳入预警指标体系。对x10和x12的秩和ranksum检验:[p2,h2,stats2]=ranksum(X(:,3),X(:,5))运行结果如下:p2=1h2=0检验结果h=0表示x10和x12的总体差别不显著,房地产开发企业从业人数比房屋新开工面积更能说明市场景气现象,因此将房地产开发企业从业人数x10纳入预警指标体系。按照此算法,将总量指标、购买力指标、交易类指标、价格类指标各进行分类指标筛选,最终得出预警指标体系:类型原始指标预警指标总量指标x1~x4国内生产总值x1、房地产业增加值x2、房地产开发投资额x3购买力指标x5~x7全体居民人均可支配收入x6、房地产贷款余额x7生产类指标x8~x13房地产开发企业本年资金x8、供应土地占地面积x9、房地产开发企业平均从业人数x10、房屋竣工面积x11交易类指标x14~x18房屋出租面积x14,商品房销售面积x16、住宅商品房销售额x17价格类指标X19~x21居民消费价格指数x20、住宅房屋平均销售价格x21四、利用时差相关分析划分超前、同步、滞后指标选定基准指标与比较指标,可以直接用原始数据计算超前或滞后若干期的相关系数;也可以先求原始数据的变化率,利用变化率数据再计算超前或滞后若干期的相关系数。下面计算商品房销售面积与其它景气指标的变化率数据,并以最大的时差相关系数为两年来分析。三、确定基准指标计算房地产景气指数的首要工作是确定基准指标,商品房销售面积,是房地产市场供给和需求共同作用的结果,它同房地产市场的兴衰具有直接同步性。%其它景气指标矩阵D=[171.6612.4219.813.0445.4632.2924.859.1419.4112.6220.6123.95104.51.43191.9612.8922.543.4747.6334.4431.487.6522.41 13.0517.9119.82104.51.36201.8215.0123.813.8651.6339.6922.317.4223.0513.5518.9822.09102.211.39218.1819.1728.204.2255.7950.9322.247.122.5412.0623.8232.64102.41.62235.6821.2132.064.6065.6452.7018.626.8623.1311.4220.8529.23102.61.64251.2324.0434.694.9968.4755.3210 6.4626.4712.0224.3143.2102.32.15281.7931.0337.095.4362.3964.098.916.3625.5113.2327.0652.33103.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职业培训课程内容策划与评估标准
- 借款合同范本
- 培训课程设计与教学目标制定指南
- 住院医师规范化培训《口腔全科》复习题含参考答案
- 9月住院医师规范化培训《放射肿瘤科》模拟习题(含参考答案)
- 2026年四川乐山峨眉山市社区工作者招聘考试面试试题-含参考答案
- 生物基聚氨酯泡沫材料生产技术咨询服务2025年的合同协议
- 2026年度技术合作逆向物流合同书
- 试题难度怎么确定答案
- 方言试题及答案
- 2025年河南省新乡市八年级学业水平考试地理试题
- 数字治理课件 第二章 数字治理理论
- 卡西欧手表GPW-1000(5410)中文繁体说明书
- 沈阳师范大学《儿童文学与绘本阅读》2023-2024学年第一学期期末试卷
- 机电工程安全法规试题及答案
- 2025定远事业单位笔试真题
- 视频监控系统运维服务投标方案
- 2025鲁教版高中地理必修一知识点归纳总结(复习必背)
- 2025年七年级下学期地理教学工作总结(2篇)
- 乙方和甲方对赌协议书范本
- 2024北京东城区初二(下)期末数学及答案
评论
0/150
提交评论