私家车保有量增长的预测及调控_第1页
私家车保有量增长的预测及调控_第2页
私家车保有量增长的预测及调控_第3页
私家车保有量增长的预测及调控_第4页
私家车保有量增长的预测及调控_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、私家车保有量的增长的预测及调控摘 要本文针对私家车保有量的增长的预测及调控问题的几个要求,建立了多个模型进行解答。由于该问题总体上是一个确定性离散问题,无法通过分析问题对象的因果关系建立合乎机理规律的模型。因此,我们从数据处理入手,通过对数据的合理处理找寻其内部关系。 对于问题一,由于题目中给出的影响因素过于繁多,对模型的建立造成干扰,同时又因为数据形式是一个时间序列数据 ,各因素间可能会产生自相关现象,影响模型预测的准确度,因此我们先对数据进行了相关性分析,排除了部分因素。,因为私家车保有量与各剩余因素间的关系是非线性的,我们对私家车保有量取自然对数,使之变为线性关系,然后采用逐步回归的办法

2、,继续排除部分因素,确定最终的主要影响因素。接着对选取的主要影响因素进行数据拟合,并对相关数据建立多元线性回归模型,求得最终结果。我们也可以主成份分析,要综合评价和分析各种可能对私人汽车保有量的影响因素,我们可首先要对评价的指标进行分析,将各指标进行无纲量化,然后根据已知数据计算各指标的权重,即各因素对考察量的影响程度;也可以用spss求出他们的相关性矩阵,来观察各因素对私家车保有量的影响。对于预测未来私家车的保有量我们可以进行主成分分析,算出综合得分与私家车保有量的关系进行预测。对于问题二,:考虑到环境因素(即汽车排污量)对私人汽车保有量的约束,且以后一段时间内相关因素变量都是未知的,可以考

3、虑通过统计分析模拟,得到以后一段时间内其预测值,然后以此为以知条件,以排污量最小为目标函数,通过建立一个线性优化模型,来到到对未来一段时间该地区公交车及私人小汽车保有量的一个合理调控方案。问题一的结果:影响该地区私家车保有量的主要因素有人均国内生产总值,全社会消费品零售总额,运营公交车辆数和居民储蓄款余额;2010年该地区的私家车保有量约为239.5767万辆。问题二的结果:最终优化结果为调控后的公家车的数目为:8696辆,私家车的数目为:239.5399万辆。 关键词: 多元线性回归 主成份分析 线性规划一、问题重述 我国经济的快速发展为私人汽车提供了巨大的发展空间。据中国汽车工业协会估算,

4、截止到2006年底,中国私人汽车保有量约为2650万辆,占全国汽车保有量的60%左右。在2006年,我国汽车销量为710多万辆,私人购买比例超过77%,中国已经成为仅次于美国的全球第二大新车市场。据世界银行的研究,汽车保有量 (尤其是私人汽车)与人均国民收入成正比。私人汽车保有量与一个国家或地区的社会经济发展的有关数据有着密切关系。附表提供了我国某一经济发达地区的一些相关统计数据。然而,当我们快速迈进以私人汽车为主体的汽车社会的时候,也面临着新的考验,环境污染对汽车工业的发展提出了严格的要求。我国于上世纪1999年对生产的小汽车废气co、hc、nox和pm允许排放量制订了国家标准(相当于欧洲标

5、准)。从2007年7月1日起实施国排放标准,据有关资料介绍,在城市交通中,小汽车与公共汽车相比,单位小汽车排放的污染物比公共汽车高9倍。如果对这种快速增长不从战略的高度加以科学引导和调整,汽车的迅猛增长将不再单纯体现经济建设成就,巨大的负面效应也将成为社会发展的阻碍因素。问题1、根据附表中的相关数据建立数学模型,分析影响该地区私人汽车保有量的因素,并预测到2010年该地区私人汽车保有量有多少?问题2、 假设私人汽车的年运行公里数是公交车年运行公里数的五分之一。按照汽车废气国iii排放标准(欧iii)(要求co排放量每公里不超过2.3克,hc+nox排放量每公里不超过0.56克,pm排放量每公里

6、不超过0.05克), 如何根据该地区的汽车废气的排放情况,来调控公交车和私人汽车保有量?二问题假设和符号说明2.1符号说明符号说明:m1为符号欧ii标准标准的私家车的数量;n2为符号欧iii标准的私家车的数量;m1为符号欧ii标准标准的公家车的数量;m2符号欧iii标准的公家车的数量;t为时间年号s1为单位私家车年运行总数;s2为单位公家车年运行总数;a0 b0 c0 分别为国标ii私家车的三种污染物排放标准;a1 b1 c1分别为国标iii私家车的三种污染物排放标准;a2 b2 c2分别为国标ii公家车的三种污染物排放标准;a3 b3 c3分别为国标iii公家车的三种污染物排放标准;x1为人

7、均国内生产总值元x2为全社会消费品零售总额亿元x3为全社会固定资产投资总额亿元x4为运营公交车辆数(辆)x5为公交营运总数亿人次x6为城市交通干线噪音均值分贝x7为公交车营运总里程万公里x8为道路总长公里x9为居民人均可支配收入(元)x10为居民储蓄款余额亿元x11为汽油93号年均价元升x12为私人汽车保有量万辆z为由主成分分析得到的综合因素总得分关系式yi为各成分的因子t为时间单位年:如19962.2问题假设1.每辆小汽车平均每年运行的公里数是每辆公交车平均每年运行的公里数的1/5。2.每辆小汽车每公里排放的污染物比公交车高九倍。3.污染物仅为co、hc、nox和pm。三、问题分析和基本思路

8、3.1 问题分析和处理思路该问题是一个确定性离散性问题,由于对该问题本身的认识有很大的局限性,同时,问题内部规律过于复杂多变,无法通过分析问题对象的因果关系建立合乎机理规律的模型。因此,我们决定通过对题目中所提供的数据进行分析以此来探寻内部联系,建立模型。 (一) 问题1的分析问题一要求分析影响该地区私人汽车保有量的因素,并预测2010年该地区私人汽车保有量的数量。附表提供了我国某一经济发达地区的一些相关统计数据,该数据表主要包含了该地区的人均国内生产总值,全社会消费品零售总额额,全社会固定资产投资总额等十一类经济数据,以及各年份的私人汽车保有量。这些数据与私人汽车保有量的变化或多或少都有着一

9、些关系,为了准确完成对该地区2010年私人汽车保有量的预测,我们对这十一类数据进行相关性分析,选出主要影响因素,构造模型进行预测。(二) 问题2的分析问题二中给出了汽车排放污染物的一些标准,同时给出了私人汽车和公交车的排放污染物的关系, 要求通过这些关系和标准调控该地区的公交车和私人汽车保有量。问题三要求对公交车和私人汽车保有量进行调控,首先我们希望选定调控标准,即表示方法。由于题目中并没有给出具体的数据来显示该地区的公交车量数,因此我们没有办法给出具体到辆的调控方案,因此我们决定采用比例的形式给出调控方案。使得该地区私家车保有量与公交车辆数保持在一定的比例,只要给出总的汽车辆数,即可知道两类

10、车具体的数量。4 问题处理与求解4.1问题准备模型一(1).主因素的初步选取问题一是对某地区私人汽车保有量的影响因素进行分析,并预测2010年该地区私人汽车保有量的数量。考虑到题目中提供的经济因素过于繁多,从表中无法直接看出主要影响因素,因此,我们首先对表中的数进行处理,对其作相关性分析。定义指标:到为自变量,按顺序依次对应附表中的某地区相关统计数据;为私人汽车保有量,即应变量。需要寻找与间的相关关系。计算相关系数由三种方法:(1).pearson相关系数:度量两个变量之间的线性相关程度,其相关系数前的符号表示相关关系方向,绝对值表示相关程度大小,系数越大,相关性越强;(2).kendall偏

11、执相关系数:适用于度量等级变量或秩变量相关性的一种非参数度量;(3).spearman秩相关系数:主要基于数据的秩,适用于等级数据和不满足正态假定的等间隔数据。在这里我们采用第一种方法,即pearson相关系数。利用matlab统计工具箱中的corrcoef命令直接得到这十二个变量的相关系数矩阵,如下表所示:表一相关系数x1x2x3x4x5x6x7x8x9x10x11yx110.990570.993790.966240.9264-0.080710.961130.988970.97950.988240.961890.90241x20.9905710.9880.966150.93044-0.178

12、470.960430.987370.978330.98940.954750.90475x30.993790.98810.955960.90788-0.077050.947740.994160.981780.982590.940520.87757x40.966240.966150.9559610.94036-0.050850.997450.952110.910560.987190.968970.96098x50.92640.930440.907880.940361-0.058060.954520.895220.891130.95220.963060.96533x6-0.08071-0.17847

13、-0.07705-0.05085-0.058061-0.0254-0.14745-0.12283-0.081870.0069870.017236x70.961130.960430.947740.997450.95452-0.025410.939720.903530.98570.979450.97702x80.988970.987370.994160.952110.89522-0.147450.9397210.974090.979830.920250.86303x90.97950.978330.981780.910560.89113-0.122830.903530.9740910.955550.

14、921630.83562x100.988240.98940.982590.987190.9522-0.081870.98570.979830.9555510.970440.94499x110.961890.954750.940520.968970.963060.0069870.979450.920250.921630.9704410.97061x120.902410.904750.877570.960980.965330.0172360.977020.863030.835620.944990.970611在相关性分析中,一般认为只有两个变量的相关系数超过0.85时才具有显著的相关关系。由上表的

15、结果可知,与相关关系显著的有,这九个变量,排除了变量和。4.2问题1求解(1)线性回归分析影响汽车保有量的因素和预测2010年的汽保有量1.分析分析影响汽车保有量的因素仔细观察上表,不难发现在这十一个变量中两两之间的相关性几乎都很强,这就意味着这十一个因素之间对互相都有很大的影响。而我们认为,在这十一个因素中由于其互相影响性的存在,其中的某些因素对的影响必然可以因为其他相关因素的存在而显得多余,举个例子:若与,存在显著相关性,且与,与也分别存在显著的相关关系,则可以认为,有了,的存在,变量就是多余的,应该去掉。从而使模型变得尽量简单有效。基于以上分析,我们考虑通过逐步回归的方法对因素进行再次的

16、筛选,以使因素的数目进一步减少。我们进行逐步回归的基本思路如下:先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,依次进行,直到不能引入和移出为止,其中引入和移出都以给定的显著性水平为标准进行判别。我们对第一步中选出的十一个变量进行标号:按顺序依次为到,仍然为私有汽车保有量,即因变量。在进行逐步回归之前,我们先对因变量与这十一个因素中每一个因素之间的关系进行大致的分析,利用附表中的数据,分别作出对的散点图,这里我们给出与其中四个因素的散点图,其余的图均与之类似,如下图所示:图一从散点图中可以

17、看出,因变量分别与十一个自变量之间的关系均不是线性关系,从图形的走势来看接近于指数函数。这样的关系对逐步回归会产生一定的影响,因此我们考虑对因变量做一定的变化,对取自然对数得:,对新的因变量与这十一个因素中每一个因素之间的关系进行大致的分析,分别作出对的散点图,这里我们仍然给出与其中四个因素的散点图,其余的图均与之类似,如下图所示:图二从散点图中可以看出,因变量分别与十一个自变量之间的关系均近乎于线性关系,这正是我们希望看到的结果。接下来对因变量与十一个自变量进行逐步回归处理。按照逐步回归的基本思路,我们得到最终的结果为:剔除了因素,保留变量,即人均国内生产总值,全社会消费品零售总额,运营公交

18、车辆数和居民储蓄款余额。下面是逐步回归后得到的最终评价参数: 表示统计量值,sig表示显著水平。anovah模型平方和df均方fsig.1回归21.331102.1334961.639.000a残差.0012.000总计21.332122回归21.33192.3708267.009.000b残差.0013.000总计21.332123回归21.33182.66610205.939.000c残差.0014.000总计21.332124回归21.33073.04710549.962.000d残差.0015.000总计21.332125回归21.33063.5559970.513.000e残差.00

19、26.000总计21.332126回归21.32854.2668783.557.000f残差.0037.000总计21.332127回归21.32645.3327347.690.000g残差.0068.001总计21.33212上面的数据显示,残差平方和0.06,说明线性十分好。值远远超过检验的临界值,显著水平接近0远小于0.05,这些都表明模型中仅选取变量,是合适的。为了便于叙述,我们对得到的四个因素重新进行编号,按照顺序依次为:,。现利用上面选出的四个主要影响因素以及1996至2008年的数据进行线性回归,得到关于,的线性函数表示式为:下表为模型的参数估计值及参数置信区间:其中表示回归方程

20、的决定系数;表示统计量值;sig表示与统计量对应的概率值,sig为置信水平。从上图中可以看出,标准化残差呈正分布,散点在直线上或靠近直线,图中点基本都在直线附近,说明变量之间呈线性分布。从图可以看出,两变量呈线性趋势,这也进一步说明图的结论。所以,我们可以推断,回归分析满足线性以及方差齐次的检验。该表显示r2接近1,值远远超过检验的临界值,远小于,因而模型从整体来看可用。表中的回归系数给出了模型中,的估计值,检查它们的置信区间发现,估计值的置信区间均不包含零点,的置信区间包含零点,但区间的左端点距离零点很近,表明回归变量x对因变量的影响相对于其他因素不是太显著,但其区间的端点距离零点很近,因此

21、我们仍将变量x保留。代入估计值,得到函数为:为了验证该模型的可行性以及选取的四个因素是否恰当,我们通过下表可以看出各年预测值与实际值的,绝对误差为千分之一,可以认为人均国内生产总值,全社会消费品零售总额,运营公交车辆数和居民储蓄款余额因素选取正确,模型可信。2.预测2010年汽车保有量人均国内生产总值,全社会消费品零总额,运营公交车总数,居民储蓄余额的2010年预测值,通过线性回归分析可得; 人均国内生产总值即: 全社会消费品零总额即: 运营公交车总数即: 居民储蓄款余额 即:通过计算可得,2010年上述几个因素值:因素人均国内生产总值(元)全社会消费品零总额(亿元)运营公交车总数(辆)居民储

22、蓄款余额(亿元)2010年的预测值859422261.9 83724612.1代入回归方程可得到2010年该地区的私家车保有量为:239.5767万辆。4.3模型二主成分分析法问题分析针对问题一,要综合评价和分析各种可能对私人汽车保有量的影响因素,我们可首先要对评价的指标进行分析,将各指标进行无纲量化,然后根据已知数据计算各指标的权重,即各因素对考察量的影响程度;也可以用spss求出他们的相关性矩阵,来观察各因素对私家车保有量的影响。对于预测未来私家车的保有量我们可以进行主成分分析,算出综合得分与私家车保有量的关系进行预测。符号说明:x1为人均国内生产总值元x2为全社会消费品零售总额亿元x3为

23、全社会固定资产投资总额亿元x4为运营公交车辆数(辆)x5为公交营运总数亿人次x6为城市交通干线噪音均值分贝x7为公交车营运总里程万公里x8为道路总长公里x9为居民人均可支配收入(元)x10为居民储蓄款余额亿元x11为汽油93号年均价元升x12为私人汽车保有量万辆z为由主成分分析得到的综合因素总得分关系式yi为各成分的因子t为时间单位年:如1996建模求解1) 分析各因素对私家车保有量的影响a) 对数据无量纲化即评价标准矩阵 根据附表我们得到实测数据和标准化矩阵其中 利用matlab计算我们得到b(ij)矩阵如下:0.3408 0.1347 0.2435 0.3192 0.3075 0.9785

24、 0.2243 0.2487 0.5280 0.1478 0.3762 0.3865 0.1472 0.2903 0.3318 0.3382 0.9971 0.2410 0.2662 0.6019 0.1791 0.4376 0.4201 0.1916 0.3529 0.3363 0.2792 0.9986 0.2513 0.3016 0.6435 0.2181 0.4453 0.4253 0.2118 0.4235 0.3467 0.3782 1.0000 0.2667 0.3424 0.6552 0.2384 0.4568 0.5178 0.2437 0.4582 0.3506 0.401

25、1 0.9986 0.2770 0.4042 0.6998 0.2740 0.5240 0.5471 0.3769 0.5103 0.4197 0.4323 0.9785 0.3442 0.4592 0.7618 0.3476 0.5547 0.5810 0.4266 0.5860 0.4197 0.4664 0.9771 0.3491 0.5769 0.8070 0.4445 0.5413 0.6802 0.4960 0.7205 0.5866 0.4703 0.9842 0.5085 0.7085 0.8392 0.5566 0.5912 0.7482 0.5664 0.8123 0.64

26、55 0.4927 0.9914 0.6050 0.7807 0.8606 0.6644 0.6833 0.8143 0.6512 0.8744 0.7314 0.7334 0.9914 0.7307 0.8435 0.9220 0.8172 0.7639 0.8911 0.7570 0.9470 0.8772 0.8192 0.9914 0.9248 0.8819 0.9587 0.9476 0.9559 1.0000 0.8628 1.0000 0.9634 0.9064 0.9900 0.9896 0.9440 0.9728 0.9598 0.9789 0.9948 1.0000 0.6

27、893 1.0000 1.0000 0.9928 1.0000 1.0000 1.0000 1.0000 1.0000计算各指标的权重: 首先计算各列向量的均值和标准差:然后计算变异系数最后用matlab计算得到变异系数归化到各指标权向量为:w= 0.0799 0.1366 0.0925 0.1009 0.0991 0.0018 0.1298 0.1028 0.0434 0.1369 0.0764,从各指标的权重系数可知各因素指标对私家车保有量的影响程度,其中除城市交通干线噪音均值分贝的权重较小之外,其余的都很高,也就是说城市交通干线噪音均值分贝对私家车拥有量影响较小,x2为全社会消费品零售总

28、额亿元最高。b) 利用spss分析结果如下:相关性矩阵部分数据zscore: 全社会消费品零售总额(亿元)zscore: 全社会固定资产投资总额(亿元)zscore(运营公交车辆数(辆))zscore: 公交营运总数(亿人次)zscore: 城市交通干线噪音均值(分贝)zscore: 公交车营运总里程(万公里)zscore: 道路总长(公里)zscore(居民人均可支配收入(元))zscore: 居民储蓄款余额(亿元)zscore: 汽油(93号)年均价 (元/升)zscore: 私人汽车保有量(万辆)1.000.868.982.967-.058.976.979.966.984.975.944

29、从表中我们也可以看出交通干线噪音均值分贝的相关性是最低的,也就是它对私家车保有量的影响最小。最终可得对私人汽车的保有量的影响因素主要有: 人均国内生产总值元、全社会消费品零售总额亿元、全社会固定资产投资总额亿元、运营公交车辆数(辆)、公交营运总数亿人次、公交车营运总里程万公里、道路总长公里、居民人均可支配收入(元)、居民储蓄款余额亿元、汽油93号年均价元升且它们都几乎同等重要。2)对2010年私家车保有量的预测模型利用spss主成分分析部分因子得分:成份初始特征值合计方差的 %累积 %b19.58287.11387.113b21.0239.29996.412从表中数据我们可知前面两个主因子累积

30、得分已超过85%,因此我们选取这两主成分进行综合得分估计。主成分得分系数矩阵如下;由左边的表格我们可计算各成分因子的系数:等于成分等分系数的相对应指标乘以对应成分的特征根的开方.得各成分系数为如下右边的表格如下;成份得分系数矩阵 成份 a1a2zscore: 人均国内生产总值(元).104.003zscore: 全社会消费品零售总额(亿元).103-.043zscore: 全社会固定资产投资总额(亿元).096-.063zscore(运营公交车辆数(辆)).103.042zscore: 公交营运总数(亿人次).101.052zscore: 城市交通干线噪音均值(分贝)-.001.975zsco

31、re: 公交车营运总里程(万公里).103.055zscore: 道路总长(公里).103-.063zscore(居民人均可支配收入(元)).102-.054zscore: 居民储蓄款余额(亿元).104-.002zscore: 汽油(93号)年均价 (元/升).103.079 主成分1主成分20.3220330.003140.319773-0.043980.296588-0.063370.3188790.0422650.3116590.052595-0.00320.9864860.319130.055730.318548-0.06370.314445-0.054140.322133-0.00

32、2120.3181790.079673 因此 y1=0.322033*x1+0.319773*x2+0.296558*x3+0.318879*x4+0.311659*x5-0.0032*x6+31913*x7+0.318548*x8+0.314445*x9+0.322133*x10+0.318179*x11y2=0.00314*x1-0.04398*x2-0.06337*x3+ 0.04226*x4 +0.052595*x5+0.986486*x6+0.05573*x7-0.0637*x8 -0.05414*x9 -0.00212*x10 + 0.079673*x11z=0.87113*y1+

33、0.9299*y2计算综合得分如下:199617771.07199719838.52199821270.86199921909.19200024673.87200127581.27200229068.27200335461.77200439483.62200544490.7200651020.53200755210.62200855685.84 预测2010年的综合得分; 画散点图标准化预测值散点图如下: 由可知它们关系近于一次与二次函数,用一次线性回归得的结果为anovab模型平方和df均方fsig.1回归2.171e912.171e9226.215.000a残差1.056e81195972

34、01.652总计2.277e912a. 预测变量: (常量), 时间。b. 因变量: 总分得分可知该回归方程显著性很高,即 z=3453.804t-6680402.851求得2010年的总得分为:61743 由于散点图也很接近二次函数,在看看二次回归,利用matlab求得:z=192t2-7.687*105+7.6606*108求得2010的总得分为:71386我们折中取均值为:66564 求2010年私家车拥有量与总得分关系函数: 画散点图如下:很明显不符线性回归,跟接近二次函数或二次与三次之间,利用matlab进行二项拟合得: x12=10354*10(-7)z2 - 0.0047707*z + 58.983代入数据解得2010的预测量为200.192万辆。 为得到跟满意的结果我们再次进行三次拟合,得到结果如下;代入数据得到预测值为243.9683万辆,我们在看看它们的图像符合度:二 三次拟合函数图像比较:*为真实数据点,-为预测点二次拟合函数图像 有以上两图看出在有限域的范围内效果还是比较好多的,但三次拟合偏大了点,因此2010年的预测值大概应在200到245万之间,如果取均值则为222.0802万。如果用插值拟合预测每个变量在2010年的值,再算出2010年的总得分,再求出2010年的私家车保有量预测值为:206.8236万辆。4.4问题2的处理与求解(1)考虑到环境因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论