




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 地理要素间的相关分析与回归分析 地理要素间的相关分析地理要素间的回归分析空间趋势面分析 地理要素的时间序列分析地理要素的逐步回归模型分析 第1节 相关分析 相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。地理要素间的相关类型根据相关所涉及变量的多少,相关关系分为单相关与复相关。两个变量之间的相关关系称为单相关;多个变量之间的相关关系称为复相关。根据相关的形式不同,相关关系分为线性相关与非线性相关。如果变量之间的关系近似地表现为一条直线,则称为线性相关;如果变量之间的关系近似地表现为一条曲线,则称为非线
2、性相关或曲线相关。根据变量相关方向的不同,相关关系分为正相关与负相关。正相关是指两个变量之间的变化方向一致,都是增长或下降趋势,如居民收入增加,居民消费额随之增加,故它们是正相关;负相关是指两个变量变化趋势方向相反,如产品单位成本降低,利润随之增加,故它们是负相关。根据相关程度的不同,相关关系分为不相关、完全相关和不完全相关。如果两个变量彼此的数量变化相互独立,这种关系称为不相关;如果一个变量的数量变化完全由另一个变量的数量变化所唯一确定,这种关系称为完全相关;介于不相关与完全相关之间的关系,称为不完全相关。本节主要内容:两要素之间相关程度的测定多要素间相关程度的测定一、两要素之间相关程度的测
3、定相关系数的计算与检验秩相关系数的计算与检验相关系数的计算相关系数的计算 定义: 和 为两要素的平均值。 niiniiniiixyyyxxyyxxr12121)()()(yx(3.1.1)(一)相关系数的计算与检验(一)相关系数的计算与检验 说明 :- 1 = 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。 rr01. 0rxyr01. 0r二、多要素间相关程度的测定偏相关系数的计算与检验复相关系数的计算与检验 偏相关和复相关是两个相对应的概念 (一)偏相关系数的计算与检验(一)偏相关系数的计算与检验 定义:在多要素所构成的地理系统中
4、,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。n偏相关系数偏相关系数(partial correlation coefficient)624C2/ ) 1(2mmCm当研究2个相关变量x1、x2的关系时,用直线相关系数r12表示x1与x2线性相关的性质与程度。此时固定的变量个数为0,所以直线相关系数r12又叫做零级偏相关系数。当研究3个相关变量x1、x2、x3的相关时,我们把x3保持固定不变,x1与x2的相关系数称为x1与x2的偏相关系数,记为r12.3,类似地,还有偏相关系数r13.2、 r23.1。这3个偏相
5、关系数固定的变量个数为1,所以都叫做一级偏相关系数。当研究4个相关变量x1、x2、x3、x4的相关时,须将其中的2个变量固定不变,研究另外两个变量间的相关。即此时只有二级偏相关系数才真实地反映两个相关变量间线性相关的性质与程度。二级偏相关系数共有个:r12.34,r13.24,r14.23,r23.14,r24.13,r34.12。一般,当研究m个相关变量x1、x2、xm的相关时,只有将其中的m-2个变量保持固定不变,研究另外两个变量的相关才能真实地反映这两个相关变量间的相关,即此时只有m-2级偏相关系数才真实地反映了这两个相关变量间线性相关的性质与程度。m-2级偏相关系数共有个。xi与xj的
6、m-2级偏相关系数记为rij.(i,j=1,2,m,ij)。偏相关系数的取值范围为-1,1,即:-1rij.1。 计算:3个要素的偏相关系数)1)(1(2232132313123.12rrrrrr(3.1.5) (3.1.6) )1)(1(2232122312132.13rrrrrr)1)(1(2132121312231.23rrrrrr(3.1.7) 4个要素的偏相关系数(3.1.8) )1)(1(23.2423.143.243.143.1234.12rrrrrr)1)(1(22.3422.142.342.142.1324.13rrrrrr(3.1.9) )1)(1(22.4322.132.
7、432.132.1423.14rrrrrr(3.1.10) )1)(1(21.3421.241.341.241.2314.23rrrrrr(3.1.11) 例如:对于某4个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵: 1469.0950.0579.0469.01592.0346.0950.0592.01416.0579.0346.0416.0144434241343332312423222114131211rrrrrrrrrrrrrrrrR 利用公式计算一级偏向关系数,如表3.1.6所示:r1234r1324r1423r2314r2413r3412-0.
8、1700.8020.635-0.1870.821 -0.337r123r132r142r143r231r241r243r341r3420.8210.8080.6470.895-0.8630.9560.945-0.8750.371 利用公式计算二级偏相关系数,如表3.1.7所示: 4个要素的一级偏相关系数有12个,这里给出了9个;二级偏相关系数有6个,这里全部给出来了。 写出其余3个一级偏相关系数表表3.1.6 3.1.6 一级偏相关系数一级偏相关系数 表表3.1.7 3.1.7 二级偏相关系数二级偏相关系数 n 偏相关系数的性质偏相关系数的性质 偏相关系数分布的范围在-1到1之间; 偏相关系数
9、的绝对值越大,表示其偏相关程度越大; 偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即 R123|r123|。偏相关系数的显著性检验偏相关系数的显著性检验 偏相关系数的显著性检验,一般采用t检验法。其统计量计算公式为 式中: 为偏相关系数;n为样本数;m为自变量个数。 11341223412 mnrrtmm(3.1.14) mr312 查t分布表,在自由度为23-3-1=19时,t0.001=3.883,显然 ,这表明在置信度水平 =0.001上,偏相关系数r2413是显著的。268. 61323821. 01821. 02ttt 譬如,对于上例计算得到的偏相关系数 ,由
10、于n=23,m=3,故821. 01324r小结偏相关分析 ( Partial ) 是研究在多变量的情况下,变量之间的复杂相关关系。在多变量的情况下, 2 个变量间的简单相关系数往往不能正确揭示这 2 个变量间的关系,只有在除去其他变量影响的情况下,计算它们之间的相关系数,才能更确切地揭示他们间的相关关系。简单相关关系有时不能真实反映现象的关系, 如:在研究商品的需求量和价格、消费者收入之间的关系时会发现,需求量和价格之间的相关关系实际上还包含了消费者收入对商品需求量的影响。 所以,我们在进行相关分析时往往要控制第三个变量,而研究变量之间的相关关系。(二)复相关系数的计算与检验(二)复相关系数
11、的计算与检验 复相关系数(analysis of multiple correlation) :反映几个要素与某一个要素之间的复相关程度 。复相关系数的计算复相关系数的计算 当有两个自变量时 当有三个自变量时(3.1.15) )1)(1 (11 . 221212.yyyrrR)1)(1)(1 (112. 321 . 2212123.yyyyrrrR(3.1.16)当有k个自变量时)1 )1)(1 (1)1.(12.21 .2212.12. kykyykyrrrR(3.1.17) 复相关系数的性质 复相关系数介于0到1之间,即1012.kyR 复相关系数越大,则表明要素(变量)之间的相关程度越密
12、切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。 复相关系数必大于或至少等于单相关系数的绝对值。复相关系数的显著性检验复相关系数的显著性检验 F检验法。其统计量计算公式为kknRRFkyky11212.212.(3.1.18)例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。 解:按照公式(3.1.16)计算 检验: ,故复相关达到了极显著水平。974.0337.01)(956.01)(579.01 (1)1)(1)(1 (1222212.4321 .42241123.4)rrrR3010. 57190.12001. 0F
13、F第2节 回归分析一元线性回归模型多元线性回归模型非线性回归模型一、一元线性回归模型 定义:假设有两个地理要素(变量)x 和y,x为自变量,y为因变量。则一元线性回归模型的基本结构形式为 式中:a和b为待定参数; 为各组观测数据的下标; 为随机变量。bxay(3.2.1) n,1,2,a 记 和 分别为参数a与b的拟合值,则一元线性回归模型为 (3.2.2)式代表x与y之间相关关系的拟合直线,称为回归直线; 是y的估计值,亦称回归值。a bxbay(3.2.2) y 参数a与b的最小二乘拟合原则要求yi与 的误差ei的平方和达到最小,即 根据取极值的必要条件,有 niiininiiiibxay
14、yyeQ121122min)()(niiiiniiixbxaybxay110)(0)((3.2.4) iy (一)参数(一)参数a、b的最小二乘估计的最小二乘估计 (3.2.3) niiniiixxxyxxyyxxLLb121)()(xbya2112111)(1)(1niiniininiiniiiixnxyxnyx(3.2.5) (3.2.6) 解上述正规方程组(3.2.4)式,得到参数a与b的拟合值 (二)一元线性回归模型的显著性检验(二)一元线性回归模型的显著性检验 方法:F 检验法。 总的离差平方和:在回归分析中,表示y的n次观测值之间的差异,记为 可以证明(3.2.9)niiyyyyL
15、S12)(总niiyyyyLS12)(总niniiiiUQyyyy1122)()((3.2.8) 在式(3.2.9)中,Q称为误差平方和,或剩余平方和 而 称为回归平方和。niiiyyQ12)(xyxxniiniiniiibLLbxxbxbabxayyU21221212)()()( 统计量F F越大,模型的效果越佳。统计量FF(1,n-2)。在显著水平下,若FF,则认为回归方程效果在此水平下显著。一般地,当FF0.10(1,n-2)时,则认为方程效果不明显。 2nQUF(3.2.10) (三)举例如何正确的分析和判断两个变量之间的关系是线性关系还是非线性关系?方法有多种:作散点图法、差分法、曲
16、度法以及计算器法等。主要介绍作散点图法。 从散点图可以看出:两个变量间关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);两个变量间关系的类型,是直线型还是曲线型(如果数据接近一条直线,则认为变量间存在线性关系;如果数据接近一条光滑的曲线,则称之为非线性关系);是否有异常观测值的干扰。 年份年份工业总产值工业总产值货运总量货运总量200020005 52 2200120016 64 42002200213135 52003200314149 92004200423231111二、多元线性回归模型回归模型的建立回归模型的建立 多元线性回归模型的结构形式为 aakaaaxxxyk221
17、10(3.2.11) 式中: 为待定参数; 为随机变量。 k,10a 回归方程: 如果 分别为式(3.2.11)中 的拟和值,则回归方程为 在(3.2.12)式中,b0为常数,b1,b2,bk称为偏回归系数。偏回归系数的意义是,当其他自变量都固定时,自变量 每变化一个单位而使因变量平均改变的数值。kkxbxbxbby22110(3.2.12) kbbb,10k,210ix 偏回归系数的推导过程:根据最小二乘法原理, 的估计值 应该使 由求极值的必要条件得 方程组(3.2.14)式经展开整理后得 min)()(122211012nakakaaanaaaxbxbxbbyyyQ(3.2.13) ),
18、 2, 1(0)(20)(2110kjxyybQyybQnajaaajnaaa), 2 , 1 , 0(kii)(k,1,2, 0iib(3.2.14) 方程组(3.2.15)式称为正规方程组。 引入矩阵nanaakanakkanakaakaanakananaaanakkaanaaaanaananaaanakkaanaaanaananaanakkanaaayxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb11122121101112122122121012111112121121011111212110)(.)()()()()()()()()()()()
19、()()( (3.2.15) knnnkkxxxxxxxxxxxxX2132313222121k211111.11knnnkkkknkkknnTxxxxxxxxxxxxxxxxxxxxxxxxXXA213231322212121113212232221113121111111111nakanakaanakaanakanakaanaanaaanaanakaanaaananaanakanaanaaxxxxxxxxxxxxxxxxxxxxxn12121111212212112111211211111211nyyyY21nbbbbb210 则正规方程组(3.2.15)式可以进一步写成矩阵形式BAb n
20、aakanaaanaaanaanknkkknnTyyyxyxyyyyyxxxxxxxxxxxxYXB112111321321223222111312111111求解得引入记号 YXXXBAbTT11)(najjiiajiijxxxxLL1)(naaiiaiyyyxxL1)((3.2.16) ),2, 1,(kji),2,1(ki正规方程组也可以写成kkkykkkkkykkykkxbxbxbybLbLbLbLLbLbLbLLbLbLbL2211022112222212111212111)51 . 2 . 3( n回归模型的显著性检验回归模型的显著性检验 回归平方和U与剩余平方和Q: 回归平方和
21、剩余平方和为 F统计量为 计算出来F之后,可以查F分布表对模型进行显著性检验。k21x,x,xQULSyy总nanaiyiLbyyU112)(nayyaaULyyQ12)()1/(/knQkUF非线性关系线性化的几种情况非线性关系线性化的几种情况对于指数曲线 ,令 , 可以将其转化为直线形式: , 其中, ; 对于对数曲线 ,令 , ,可以将其转化为直线形式: ;对于幂函数曲线 ,令 , ,可以将其转化为直线形式: 其中, ; 三、非线性回归模型 bxdyexbayxbaylnxbaybdxy xbayyylnxx dalnyy xxlnyylnxxlndaln对于双曲线 令 ,转化为直线形式
22、: ; 对于S型曲线 ,可 转化为直线形式: ; 对于幂乘积 ,只要令 ,就可以将其转化为线性形式 其中, ;xbay1xbayxxxyybaye,1,e1令xbaykkxxdxy2121kkxxxy22110 xxyy1,1kkxxxxxxyyln,ln,ln,ln2211dln0对数模型双曲线模型对于对数函数和 只要令 ,就可以将其化为线性形式 例例: :表3.2.1给出了某地区林地景观斑块面积(area)与周长(perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型 。 kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln
23、,ln,2211 序号面积A周长P序号面积A周长P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7124430 833.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.19
24、5243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921522 038.617320.396122 372.105199.667533 432.137253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表3.2.1 某地区各个林地景观斑块面积(m2)与周长(m) 15527 620.2006 545.291561
25、946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.7521822 809.1801 103.0705919 271.8201 011.1271971 195.9401 154.118608 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.46541
26、5.151646 617.270609.801246 205.016414.790 654 064.137437.355256 0619.0201 549.871665 645.820432.355261 4517.740791.943676 993.355503.7842731 020.1001 700.965684 304.281267.9512826 447.1601 246.977696 336.383347.136297 985.926918.312702 651.414292.235303 638.766399.725712 656.824298.4733158 5425.1001
27、1 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741 730.563172.1433427 422.5701 934.5967511 303.970881.0423543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298791 949.164228.4
28、033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.625225.84282564 370.80012 212.410 解解:(1)作变量替换,令: , ,将表3.2.1中的原始数据进行对数变换,变换后得到的各新变量对应的观测数据如表3.2.2所示。 AylnPxln序号y=lnAx=LnP序号y=lnAx=LnP1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 48731
29、0.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323 655 9.292 7427.552 8164610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.04
30、2 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 经对数变换后的数据127.771 5335.296 653538.140 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786 501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.560 7486.393 579588.984 40
31、86.573 3341810.034 927.005 852599.866 3996.918 8211911.173 197.051 092609.019 6016.523 136208.027 5565.501 457619.595 4087.118 1092113.059 259.0150 56628.416 2385.787 871228.655 0326.211 917639.484 7597.067 248239.031 156.028 643648.797 4386.413 133248.733 1136.027 773658.309 9576.080 7442511.012 36
32、7.345 927668.638 6716.069 247269.583 1276.674 49678.852 7166.222 1472710.342 397.438 951688.367 3655.590 8062810.182 97.128 478698.754 0635.849 717298.985 4366.822 537707.882 8485.677 56308.199 45.990 776717.884 8875.698 6783113.280 099.347 906727.521 3115.192 2133210.469 397.537 684737.388 1325.152
33、 181339.217 0996.209 381747.456 2025.148 3263410.219 127.567 654759.332 9096.781 1053510.670 627.065 966769.548 2256.458 6143610.961 037.729 906779.135 3126.759 3583710.248 997.187 502789.524 0376.569 1823813.116 879.167 568797.575 1565.431 1123910.096 386.902 648808.485 9125.782 227407.516 275.435
34、4718113.164 388.908 416417.383 1355.419 8378213.243 479.410 208 (2) 以x为横坐标、y为纵坐标,在平面直角坐标系中作出散点图。很明显,y与x呈线性关系。图3.2.2 林地景观斑块面积(A)与周长(P)之间的双对数关系 (3)根据所得表中的数据,运用建立线性回归模型的方法,建立y与x之间的线性回归模型,得到 对应于(3.2.19)式,x与y的相关系数高 达 =0.966 5。 (4)将(3.2.19)还原成双对数曲线,即 7505.0505.1xy(3.2.19)7505.0ln505.1lnPA (3.2.20)xyr第3节趋势
35、面分析(Trend-Surface Analysis )一、概念 趋势面分析是用数学曲面来拟合地理系统要素在空间的分布及变化趋势的一种数学方法。它实质上是通过回归分析原理,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。趋势面分析常常被用来模拟资源、环境、人口及经济要素在空间上的分布规律,它在空间分析方面具有重要的应用价值。 二、空间趋势面分析的一般原理 空间趋势面并不是地理要素的实际分布面,而是模拟地理要素空间分布的近似曲面。因此,通常把实际的地理曲面分解为趋势面趋势面和剩余面剩余面两部分 。前者反映地理要素的宏观分布宏观分布规律,属于确定性因素作用的结果;而后者则对应于
36、微观局域,是随机因素的结果。趋势面分析的一个基本要求就是所选择的趋势面模型应该是剩余值最小,而趋势值最大,这样拟合精度才能达到足够的精确性。 1.趋势面模型的建立 设 某 地 理 要 素 的 实 际 观 测 数 据 为zi(xi,yi)(i=1,2,n),趋势面拟合值为,则有式中,i为剩余值(残差值) 采用回归分析方法 在最小二乘法意义下的趋势面拟合。 用来计算趋势面的数学方程式有多项式和傅立叶级数,其中最常用的是多项式函数形式。 多项式趋势面的形式为:一次趋势面模型:二次趋势面模型: First-order (linear) trend surfaceSecond-order (quadra
37、tic) trend surfaceAn isoline map of a third-order trend surface created from 105 points with annual precipitation values (105个年降水量点)zx,y = b0 + b1x + b2y + b3x2 + b4xy + b5y2 + b6x3 + b7x2y + b8xy2 + b9y3 需要注意在实际应用中,往往用次数低的趋势面逼近变化比较小的地理要素数据,用次数高的趋势面逼近起伏变化复杂的地理要素数据。次数低的趋势面使用起来比较方便,但是具体到某点拟合较差;次数较高的趋势
38、面只在观测点附近效果较好,而在外推和内插时则效果较差。 2.趋势面模型的参数估计 将多项式回归(非线性模型)模型转化为多元线性回归模型。 若要偏差平方和Q达到最小,求偏差平方和Q对a0,a1,a2ap的偏导数,并令其等于0。经化简后得到正规方程组。用矩阵形式表示正规方程组则正规方程组为nnPPnnnzzzzaaaAXpnXXXXXXXXXXXX101021321123121111322211ZXXXAZXXAXTTTT1)(那么,三、趋势面模型的适度检验 1拟合度R2检验2.趋势面模型的显著性F检验 n为观测值的个数 p为自变量的个数关于自由度模型中样本值可以自由变动的个数,称为自由度自由度=
39、样本个数- 样本数据受约束条件(方程)的个数例如,样本数据个数=n,它们受k+1个方程的约束(这n个数必须满足这k+1个方程)那么,自由度df = n-k-13.趋势面适度的逐次检验四、应用举例课本例题:1建立趋势面模型Z=18.44-1.38x-1.54y(R2=0.915,F=119.74) Z=18.27-1.16143*x-1.49286y+0.07 xy -0.07143*x2-0.04286 y2(R2=0.92,F=43.73)2.模型检验(1)根据R2检验方法计算(2)显著性F检验。在显著性水平0.01下,二次趋势面的F值,大于临界值4.17;一次趋势面模型的F值大于临界值 5
40、.72。说明二者的整体显著性均很高 。(3)一次和二次趋势面回归模型的逐次检验方差分析表 离差来源平方和自由度均方差F检验2次回归214.77543.95543.722次剩余18.6625-5-10.9821次回归213.82106.9119.741次剩余19.6425-2-10.893由1次增高到2次的回归0.9730.3230.329结论:二次趋势面,F值不显著,则二次多项式对于回归并无新贡献。因此选取一次趋势面比较合适。 第4节 时间序列分析时间序列分析的基本原理 趋势拟合方法季节变动预测 自回归模型时间序列:时间序列:各种社会、经济、自然现象的数量指标按照时间次序排列起来的统计数据时间
41、序列分析模型:时间序列分析模型:解释时间序列自身的变化规律和相互联系的数学表达式一、时间序列分析的基本原理 (一)时间序列的组合成份(一)时间序列的组合成份 长期趋势(长期趋势(T, Trend T, Trend ) 是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。季节变动(季节变动(S,SeasonalS,Seasonal) 是指时间序列在一年中或固定时间内,呈现出的固定规则的变动。 循环变动循环变动(C,CyclicalC,Cyclical) 是指沿着趋势线如钟摆般地循环变动,又称景气循环变动(business cycle movement) 。不规则变动(不规则变动(I,Irr
42、egularI,Irregular) 是指在时间序列中由于随机因素影响所引起的变动。 405060708090100110120130123456789 10 11 12月销量无趋势60657075808590951001051357911 13 15 17 19 21 23月销量线性趋势9010011012013014015016017013579 11 13 15 17 19 21 23月销量非线性趋势02040608010012345678910 11 12月销售额第一年第二年季节成分DateSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999
43、SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990SALES12010080604020某企业从某企业从19901990年年1 1月到月到20022002年年1212月的销售数据月的销售数据(单位:百万元)(单位:百万元) (二)时间序列的组合模型(二)时间序列的组合模型 加法模型 假定时间序列是基于4种成份相加而成的。长期趋势并不影响季节变动。若以Y表示时间序列,则加法模型为Y=T+S+C+I乘法模型 假定时间序列是基于
44、4种成份相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为ICSTY (3.3.1) (3.3.2) ttYYY=T + S + C + IY=TS C I二、趋势拟合方法 时间序列分析的平滑法主要有三类 :移动平均法 设某一时间序列为 y1,y2,yt,则t+1时刻的预测值为 式中: 为t点的移动平均值; n称为移动时距。作用:消除干扰,显示序列的趋势性变化,并用于预测消除干扰,显示序列的趋势性变化,并用于预测趋势趋势)(1111101ntttntttnjjttyynynyyyynyty (一)平滑法(一)平滑法 (3.3.3) 滑动平均法滑动平均法 其计算公式为 式中:
45、为t点的滑动平均值;l为单侧平滑时距。 若l=1,则(3.3.4)式称为三点滑动平均,其计算公式为 若l=2,则(3.3.4)式称为五点滑动平均, 其计算公式为)(12111) 1(lttttltlttyyyyyylyty 3/)(11ttttyyyy5/ )(2112ttttttyyyyyy (3.3.4) (3.3.5) (3.3.6) 指数平滑法指数平滑法 一次指数平滑 为平滑系数。一般时间序列较平稳,取值可小一些,一般取(0.05,0.3);若时间序列数据起伏波动比较大,则应取较大的值,一般取(0.7,0.95)。本期预测值是前期实际值和预测值的加权和本期预测值是前期实际值和预测值的加
46、权和ttnjjtjtyyyy)1()1(101 (3.3.7) 高次指数平滑法 二次指数平滑法的预测公式为 三次指数平滑法的预测公式 为 2kckbaytttktkbayttkt (3.3.8) (3.3.9) 三种最常用的趋势线 直线型趋势线直线型趋势线指数型趋势线指数型趋势线 抛物线型趋势线抛物线型趋势线 btaytttaby2ctbtayt(二)趋势线法(二)趋势线法05010015020019811985198919931997汽车产量趋势值 汽车产量直线趋势汽车产量直线趋势(年份)汽车产量(万辆)二次趋势模型二次趋势模型描述抛物线型趋势变化的描述抛物线型趋势变化的数学模型数学模型Y
47、Yt t = b = b0 0 + b+ b1 1t + bt + b2 2t t2 2 + + t tYtt* tYt = b0 + b1t + b2t2二次曲线二次曲线048121619781980198219841986198819901992零售量趋势值零售量(亿件)针织内衣零售量二次曲线趋势针织内衣零售量二次曲线趋势(年份)指数增长趋势变化指数增长趋势变化时间序列模型时间序列模型Y Yt t = ab = abt t t t或或 Y Yt t = K + ab = K + abt t t tY Yt t = ae = aebtbt t tYtt*指数曲线指数曲线05010015020
48、025019811985198919931997汽车产量趋势值汽车产量指数曲线趋势汽车产量指数曲线趋势(年份)汽车产量(万辆)自相关性判断自相关性判断 时间序列的自相关,是指序列前后期数值之间的相关关系,对这种相关关系程度的测定便是自相关系数。 测度:设y1,y2,yt,yn,共有n个观察值。把前后相邻两期的观察值一一成对,便有(n1)对数据,即(y1,y2),(y2,y3),(yt,yt+1),(yn-1,yn)。(三)自回归模型其一阶自相关系数r1为1111211211111)()()(ntntttttntttttyyyyyyyyr二阶自相关系数r2为2121222221222)()()(
49、ntntttttntttttyyyyyyyyrk阶自相关系数为 kntkntktktktkntktktttkyyyyyyyyr11221)()()(自回归模型的建立自回归模型的建立 常见的线性自回归模型: 一阶线性自回归预测模型为 二阶线性自回归预测模型为 一般地,p阶线性自回归模型为 在以上各式中, 为待估计的参数值,它们可以通过最小二乘法估计获得。tttyy110ttttyyy22110tptpttyyy110), 2 , 1 , 0(pii基本步骤基本步骤 (1)对原时间序列求移动平均,以消除季节变动和不规则变动,保留长期趋势; (2)将原序列y除以其对应的趋势方程值(或平滑值),分离出
50、季节变动(含不规则变动),即 三、季节性预测法季节系数= TSCI/趋势方程值(TC或平滑值)=SI (3)将月度(或季度)的季节指标加总,以由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。 (4)求预测模型,若求下一年度的预测值,延长趋势线即可;若求各月(季)的预测值,需以趋势值乘以各月份(季度)的季节性指标。 求季节变动预测的数学模型(以直线为例)为 式中: 是t+k时的预测值; at、bt为方程系数; 为季节性指标。kttktkbay)(ktyk 例题:如表3.3.3所示,下面我们用上述步骤,预测该旅游景点2005年各季度的客流量。 表3.3.3 某旅游景点20022004年各季度客流量 解题步骤: (1)求时间序列的三次滑动平均值,见表3.3.3第5列。 (2)求季节性指标:将表3.3.3中第4列数据分别除以第5列各对应元素,得相应的季节系数。然后再把各季度的季节系数平均得到季节性指标,见表3.3.4。 季节性指标之和理论上应等于4。现等于 3.951 5,需要进行校正。校正方法是: 先求校正系数:=4/3.951 5=1.012 3。 然后将表中的第5行,分别乘以,即得校正后的季节性指标(见表3.3.4第6行)。表3.3.4 季节性指标及其校正值 (3)用二次指数平滑法,求预测模型系数:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年国际美术设计师考试基础内容及答案
- 篮球模拟测试题及答案
- 助理广告师试题及答案知识架构
- 2024年助理广告师备考心得与实战经验分享试题及答案
- 植物辨识考试题及答案
- 2024年国际设计师考试的综合准备建议试题及答案
- 于设计教育中的广告设计课程建设探讨试题及答案
- 新材料在纺织品设计中的应用举例试题及答案
- 小升初舞蹈测试题及答案
- 北大竞赛数学试题及答案
- 2024年广西区公务员录用考试《行测》真题及答案解析
- 电力系统运行控制规范
- 【工程法规】王欣 教材精讲班课件 38-第6章-6.3-施工单位安全生产责任制度
- 广播制作短视频化
- 《临床检验仪器与技术》考试复习题库(含答案)
- 2024年重庆高考化学试题卷(含答案解析)
- 急救护理学第五章-心搏骤停与心肺脑复苏
- 高校军事理论教育课教案
- 敦煌的艺术智慧树知到期末考试答案章节答案2024年北京大学
- 轨压阀打开故障原因
- 社区饮水机占地合同
评论
0/150
提交评论