基于杭州出租车保有量的预测模型出租车保有量_第1页
基于杭州出租车保有量的预测模型出租车保有量_第2页
基于杭州出租车保有量的预测模型出租车保有量_第3页
基于杭州出租车保有量的预测模型出租车保有量_第4页
基于杭州出租车保有量的预测模型出租车保有量_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于杭州出租车保有量的预测模型出租车保有量 基于杭州出租车保有量的预测模型 摘要 本文主要讨论了如何确定合理的城市出租车的需求量的问题。以杭州为例,通过该市xx年到xx年的各项数据进行分析,建立多元统计回归模型,对未来几年的出租车保有量进行了预测。 首先,我们通过Excelxx软件画出城市出租车保有量和各解释变量之间的关系,然后建立了多元线性回归模型,在回归方程的确定过程中,按照统计检验的要求逐一对各个解释变量进行分析,然后运用EView5.0软件分别对两个线性回归方程进行了检验,模型在置信概率为95%的条件下通过检验,并画出相应模型的的残差图,以便于模型的最优化选择。 同时我们根据线性回归模型的分析,结合实际情况,构造了可线性化非线性模型,同样在置信概率为95%的条件下通过显著性检验。然后进行逐步回归分析,计算出各项的系数。最后通过分析及剔除变量法,并运用Excelxx对可化为线性的非线性回归方程的显著性检验,结合两个线性回归方程,最终得到一个比较合理的非线性回归模型。最终运用得到的回归模型给出了xx年杭州市区合理的出租车保有量为9237辆。 最后,我们对上述模型进行分析评价,提出了一些可能的改进方向。 关键字: 统计回归 线性方程 非线性方程 预测 残差 检验 一、 问题的重述与分析 近年来,随着人民生活水平的不断提高,对出行的要求也逐步提高。出租车作为公共交通的一种特殊方式,由于其快速、便利、舒适、安全等特性,受到越来越多的短途(市内)出行者的青睐,促进了出租车行业的迅速发展。然而,出租车行业蓬勃发展的同时,各式各样的问题也悄然而生,如“打的难”,“黑的”横行,出租车司机 _等问题。这些问题很大程度上是由于政府规制不合理导致的。政府规制主要包括出租车投放总量、行业经营模式、运营定价和服务规范等方面,其中如何测定城市出租车的需求量,确定合理的出租车投放量是政府规制的重要内容。 而影响城市出租车需求量的因素有: (1)城市经济发展水平 经济发展水平通过影响人们生产性出行和生活性出行总量以及出行质量影响着城市出租汽车容量。 (2)收入与消费水平 出租车出行需求受收入和消费水平直接影响,人均收入与消费水平高,对选择出租车出行的概率大,反之则较小。 (3)人口数量和结构 客运出租车的运输对象主要是人,因此人口数量的变化必然引起出租车需求的变化。 (4)城市布局 城市规模的扩大改变着居民的出行距离,使中长距离的出行在城市居民总体出行中所占的比重越来越大,一定程度上影响着居民出行方式的选择。 (5)自然旅游资源 随着 _的发展,旅游需求在生活需求中的比例也逐步上升,与旅游发展密切相关的就是运输需求的增加。城市旅游需求的增长将促进出租车需求量的增长。 (6)政府对出租汽车的 政府是限制还是鼓励发展对城市出租汽车需求量有直接的影响。 (7)城市其他客运方式对出租车需求量的影响 如公共交通,由于其道路利用率高、对城市环境污染少,优先发展大运量公共交通已经成为大城市的共识,作为大运量公共交通的一种有益补充,出租汽车的发展水平必然会受到城市常规公共交通方式的影响。 本文以杭州为例,结合杭州实际情况,综合以上考虑因素,这里我们选取城市的国内生产总值、市区人口数量、城市私家车数量、城市公交客运总量、居民个人可支配收入五个因素作为城市出租车保有量的主要影响因素,对杭州市区01年08年的数据进行分析,进而建立统计回归模型,预测杭州市区未来几年的城市出租车保有量。 二、模型的基本假设 假设1:城市出租车保有量和城市国民生产总值有关,我们认为国民生产总值越高,市民对出租车的需求量也越大。 假设2:城市出租车保有量与城市人口、居民可支配收入存在正相关关系,即城市出租车保有量随着城市人口、居民可支配收入的增加的而增加。 假设3:城市出租车保有量只与城市居民个人可支配收入、城市私家车数量、城市公交客运总量、市区人口数量、城市国民生产总值有关,其他因素在这里视为无关项。 三、符号说明 四、模型的建立与求解 4.1 建模准备 设城市出租车保有量为y,市区人口为x1万人,国民生产总值为x2万元,居民可支配收入为x3元,城市客运总量为x4万人次,私家车数量为x5万人。基于杭州01-08年以上各项数据1(见附录一),通过各个解释变量各自对应变量的散点图分析,对各个解释变量对出租车保有量影响有个大致了解。 用Excelxx软件绘出出租车保有量和各解释变量的散点图。 表一 市区人口对出租车数量的影响 表二 国民生产总值对出租车数量的影响 表三 个人可支配收入对出租车数量的影响 表四 客运总量对出租车数量的影响 表五 私家车数量对出租车数量的影响 通过散点图的结果,可以初步推断被解释变量(出租车数量)和其他五个解 释变量的关系。 4.2 模型的建立与求解 4.2.1(建立多元线性回归模型) 模型一:五元线性回归模型 基于上述散点图的分析,我们可以看到:市区人口、城市国民生产总值、居民可支配收入、城市公交客运量和私家车数量都对城市出租车需求量有较大的影响,所以我们通过Eviews5.0软件建立基于这五个解释变量的五元线性回归方程。 在命令窗口依次键入以下命令即可: CREATE U 8 DATA Y X1 X2 X3 X4 X5 输入数据后键入命令: LS Y C X1 X2 X3 X4 X5 即得如下结果(表六): 表六 五元线性回归模型的Eviews软件求解结果 由上述结果,我们可以得到城市出租车数量和市区人口、城市国民生产总值、居民可支配收入、城市公交客运量、私家车数量的函数关系式: ? y?33628.56?7.404x1?3.853x2?0.1761x3?0.5567x4?0.4668x5 2 t= (0.6974) (-0.5954) (1.0515) (-0.4741) (-0.5171) (-0.2410) R 2 ?0.9661 R 2 ?0.7963 F?5.6913 结果分析 从模型的求解结果,我们可以看到,市区人口每增加1000人,出租车的保有量就会下降7.4辆;城市国民生产总值每增加10亿元,城市出租车保有量将 增加3.85辆;居民可支配收入、城市公交客运量、私家车数量这三个解释变量的对出租车保有量的边际效益分别是(-0.1761)、(-0.5567)、(-0.4668). R 2 ?0.9661 ,R2?0.7963,说明模型的拟合度不错,具有一定的可信性。 模型一的显著性检验 1、F检验: 对于多元线性回归模型: yi?b0?b1x1i?b2x2i?bkxik?i 假设H0: b1?b2?bk?0 若假设成立,则意味着: yi?a?i 表明y的变化主要由模型之外的变量来决定,模型的线性关系不显著,所设定的模型没有意义。 在原假设H0成立的情况下,可以证明: ? ? F? ?yiy? ? 2 ? 2 k F(k,n?k?1) 2 ?ei (n?k?1) 所以,对于给定的显著水平?,可由F分布表查得临界值F?,如果根据样本数据计算得出: F?F? 则拒绝原假设H0,即回归系数b1,b2,?,bk中至少有一个显著地不为0;此时可以认为模型的线性关系式显著的。反之,则接受H0,认为模型的线性关系不显著。 结合该模型数据(图表六),在置信概率为95%的条件下,由F分布表查得临界值F?19.30,而实际模型中的F=5.69,即 F?F? 说明F检验是不显著的,说明市区人口、城市国民生产总值、居民可支配收 入、城市公交客运量、私家车数量对城市出租车保有量的总影响并不显著的。所以我们认为该模型与实际符合情况不是很理想,需要对上述五元线性回归模型作进一步调整,考虑到个人可支配收入的增加会引起私家车需求量的增加,两个解释变量之间存在重复,并且按照统计检验程序,一般剔除t统计量最好的解释变量,这里我们选择剔除城市私家车数量,重新建立回归模型。 模型二:剔除私家车数量后的四元线性回归模型 我们运用EView5.0软件进行求解: 在命令窗口依次键入以下命令即可: CREATE U 8 DATA Y X1 X2 X3 X4 输入数据后键入命令: LS Y C X1 X2 X3 X4 即得如下结果(表七) 表七 四元线性回归模型的Eviews5.0求解结果 由上述结果,我们可以得到城市出租车数量和市区人口、城市国民生产总值、居民可支配收入、城市公交客运量的函数关系式: y?46877.81?10.69x1?3.462x2?0.0035x3?0.8832x4 ? t= (1.475) (-1.28) (1.91) (-0.016) (-1.221) R 2 ?0.9664 R 2 ?0.9217 F?21.59 由模型的求解结果可以看出,市区人口、城市国民生产总值、居民可支配收 入、城市公交客运量这四个解释变量的对出租车保有量的边际效益分别是(-10.69)、(3.462)、(-0.0035)、(0.8832),这里R2?0.9664,R2?0.9217,该模型的拟合度相对于模型一要好。 模型二的显著性检验 1、F检验: 用模型显著性检验的方法,结合图表六的数据,我们可以得到这样的结论:在置信概率为95%的条件下,由F分布表查得临界值F?9.28,而实际模型中的F=21.59,即 F?F? 说明F检验是高度显著的,说明市区人口、城市国民生产总值、居民可支配收入、城市公交客运量对城市出租车保有量的总影响是显著的 2、解释变量的显著性检验(t检验): 如果模型通过了F检验,则表明模型中所有解释变量的“总影响是显著的, 但这并不同时意味着模型中的每一个解释变量对y都有重要的影响,或者说并不是每个解释变量的单独影响都是显著的。因此,有必要对模型中每个解释变量(影响)的显著性进行检验,检验过程仍然采用假设检验方法。 对于多元线性回归模型: yi?b0?b1x1i?b2x2i?bkxik?i 假设H0: b1?b2?bk?0 即假设xi对y没有显著影响。对于t统计量我们有: ? ? t? bi?bi ? t(n?k?1) 2 S(bi) 因此,对于给定的显著水平?,可以由t分布表查得临界t?,若|t|?t?,则 2 2 表明原假设H0是一个错误假设,应该拒绝,即认为系数bi显著的不等于0,xi对y有显著的影响:反之,则认为影响不显著,应该考虑xi从模型中剔除而重新建 立模型。 用模型显著性检验的方法,结合图表六的数据,我们可以得到这样的结论:在置信概率90%的条件下,由t分布表查得临界值t0.05?1.474,而实际模型中,除解释变量x2外,其他解释变量都不可以通过t检验。同样,按照统计检验的原则,剔除t统计量最小的解释变量(居民可支配收入),重新建立三元统计回归模型。 模型三:剔除居民可支配收入后的三元线性回归模型 我们运用EView5.0软件进行求解: 在命令窗口依次键入以下命令即可: CREATE U 8 DATA Y X1 X2 X3 输入数据后键入命令: LS Y C X1 X2 X3 即可得到以下结果(表八) 表八 四元线性回归模型的Eviews5.0求解结果 由上述结果,我们可以得到城市出租车数量和市区人口、城市国民生产总值、城市公交客运量的函数关系式: y?47161.61?10.76763x1?3.4689x2?0.8865x4 ? t= (2.0917) (1.91) (2.30) (-1.48) R 2 ?0.9664 R 2 ?0.9412 F?38.38 从上述函数关系中我们可以看到,模型的回归系数的符号和数值是较为合理 的。R2?0.9664,R2?0.9412,说明模型的拟合度很好。 1、F检验 用模型显著性检验的方法,结合图表八的数据,我们可以得到这样的结论:在置信概率为95%的条件下,由F分布表查得临界值F?6.59,而实际模型中的F=38.38,即 F?F? 说明F检验是高度显著的,即市区人口、城市国民生产总值、城市公交客运量对城市出租车保有量的总体影响是显著的。 2、t检验 用模型各个解释变量对总体显著性检验的方法,我们得到这样的结论:在信度为90%的条件下,由t分表查得临界值t0.05?1.397,而实际模型中的各个解释变量的t统计值都大于临界值,即各解释变量都可以通过显著性检验。 为了进一步检验模型的合适性,我们用EViews5.0软件可以得到模型的残差分析图: 表九 模型三的残差分析图 结合以上残差分析图3,我们可以看到:该模型的各期残差中大多数都落在 的虚线框内,且残差分别不存在明显的规律性。而且从求解结果可以看出,模型的回归系数的符号和数值是较为合理的。同时模型也具有较合理的现实意 ? 义,并且都通过了F检验和t检验,说明市区人口x1、城市国民生产总值x2、城市公交客运量x4对出租车需求量的影响是显著的,并且样本数据的拟合度也不错,理论上可以用来描述出租车需求量与各解释变量之间的关系,同时结合相关数据对未来几年的出租车保有量做合理的预测。 4.2.2(建立多元非线性回归模型) 基于上述线性回归模型的分析讨论,结合已知的历年数据和已经画出的城市出租车保有量和各解释变量的散点图,我们发现,应变量y和三个自变量x1、x2、 x4之间存在着复杂的非线性关系,于是对模型三中的线性回归模型进行修改, 并逐步加以分析。 模型四:可线性化的三元非线性回归模型 在从模型三的求解结果中,我们看到,城市出租车保有量随城市人口的增加而有所减少,这与事实不符,所以我们建立如下多元非线性化模型: y?0?1x1?2x2?4x4 ?1 这是一个可线性化模型。 令 x6?x1?1,即得: y?0?1x6?2x2?4x4 结合相关数据,运用Eviews5.0软件进行求解: 在命令窗口依次键入以下命令: CREATE U 8 DATA Y X6 X2 X4 输入数据后键入命令: LS Y C X6 X2 X4 即可得到以下结果(表十) 表十 三元非线性回归模型的Eviews5.0求解结果 y?36560?0.0001x6?3.4597x2?0.9491x4 ? t= (1.959) (2.361) (-1.546420) (-1.75) R 2 ?0.9672 R 2 ?0.9427 F?39.419 这个结果表明,在置信概率95%的条件下,由F分布表查得临界值 F0.05(3,4)?6.59 ,而本模型的F?39.419超过临界值,并且p?0.001小于0.05, 可以通过显著性检验。 根据R2检验与F检验的关系,即 F? n?k?1 n ? R 22 1?R 其中n为样本数据量,k为模型中的自变量。 用F的临界值代入该方程即可求出在较高拟合度下R2的最小值7 结合本模型求解结果可得: R2? nFnF?n?k?1 ?0.9294 而本模型中R2?0.96720.9294,即说明该模型的线性显著性的概率达到了95%(?0.05)。 因此这个模型从整体来看是可用的,回归系数的符号和数值是较为合理的。 R 2 ?0.9672 ,说明模型有很高的拟合优度,F检验也是显著的。 同样,为了进一步检验模型的合理性,我们也可以用EViews5.0软件可以得到模型的残差分析图: 表九 模型四的残差分析图 4.3(回归模型的比较及结果分析) 4.3.1回归模型的比较 由于在用回归模型拟合样本数据时,通过比较模型的优劣,选择相对较好的回归模型,我们在估计中必须检验一下内容以便选出最佳模型: (1)回归系数的符号及数值是否合理; (2)模型的更改是否提高了拟合优度; (3)模型中各个解释变量是否显著; (4)残差分布情况 对于模型一和模型二,不是所有解释变量都可以通过显著性检验,模型的拟合度相对与模型三、四都比较低,所以舍弃模型一和模型二。而对于模型三和模型四,两者都有较好的拟合度,模型的回归系数的符号和数值是较为合理的。两个模型都具有较合理的现实意义,并且都通过了F检验和t检验,理论上讲都可以描述城市出租车保有量和各解释变量之间的关系。但是通过表十和表八的比较,我们可以看到,两个模型的拟合度很接近,但是模型三的解释变量显著性更高,对于出租车保有量的影响更大,所以我们选择模型三来描述城市合适的出租车保有量。 4.3.1结果分析 根据以上模型比较分析,我们得到这样的结论:城市出租车保有量和城市人口、城市公交客运量和城市国民生产总值显著相关,并且回归模型和现实数据有较高的拟合度。我们可以通过任意年份三个解释变量的具体数值,代入回归模型, 得到该年的出租车保有量。通过该统计回归模型,我们知道,xx杭

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论