机动车保有量预测方法综述_第1页
机动车保有量预测方法综述_第2页
机动车保有量预测方法综述_第3页
机动车保有量预测方法综述_第4页
机动车保有量预测方法综述_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2015 年 1 月辽宁警专学报jan.2015第 1 期(总第 89 期)journal of liaoning police academyno.1(ser. no. 89)机动车保有量预测方法综述王立颖(辽宁警察学院治安管理系, 大连116036)摘 要:机动车保有量预测方法中最关键的要素是算法和影响因子。综述通过文献整 理分类提炼, 对回归算法、人工神经网络、支持向量机、聚类算法和基于实例的算法进行 了阐述,分析各种算法的利弊。最后依据历史样本的多寡, 通过总结提出以逻辑回归算法 和支持向量机作为基础算法, 结合其它算法的组合预测方法来解决机动车保有量预测这样 的非线性、高维度的复杂问

2、题。关键词:保有量;预测;算法;影响因子;综述中图分类号: d035.31文献标识码:a文章编号:1008-5378(2015)01 -0074-05近年来很 多学者提出 来了各种预 测机动车 保有量的方法,这些方法基本上都是基于统计学 理论,运用不同的机器学习算法,选择不同的影 响因子进行数学建模、计算、验证和对比,有些 还考虑的了经济发展的不确定性等因素,对国民 经济或区域经济管理提供了良好的参政意见。下 面就这些预测方法中不同的机器学习算法和影 响因子进行综述,以期对今后的机动车保有量预 测方法研究提供有益的借鉴。一、回归算法运用综述回归算法 是机动车保 有量预测方 法中运用 最多的算法

3、。回归算法是试图采用对误差的衡量 来探索变量之间的关系的一类算法。社会经济现 象之间的相关关系往往难以用确定性的函数关 系来描述,它们大多是随机性的,要通过统计观 察才能找出其中规律。回归算法是利用统计学原 理描述随机变量间相关关系的一种重要方法。(一)一元线性回归法薛佳平等(2013)认为汽车保有量主要与经济发展速度有关,将经济发展速度作为自变量, 汽车保有量作为因变量,建立了一元线性回归方 程,并对杭州市未来 5 年的民用汽车保有量进行 了预测。1一元线性回归算法的自变量只有一个,而影 响汽车保有量的因素是多重的,所以这种方法虽 然简单,但是预测是不够准确的。(二)弹性系数法薛佳平等(20

4、13)在同一篇文献中还使用了 弹性系数法对杭州市未来 5 年的汽车保有量进 行预测,并与一元回归进行对比。弹性系数法是 回归算法的延伸,在对一个影响因子发展变化预 测的基础上,通过弹性系数对另一个影响因子的 发展变化作出预测的一种间接预测方法。与一元线性回归算法的预测一样,这种方法 预测是不够准确的。(三)多元线性回归法多元线性 回归描述多 个自变量和 一个因变 量之间关系。多元回归算法是汽车保有量预测算 法中被采用最为广泛的算法,因为从问题描述中收稿日期:2014-10-06作者简介:王立颖(1972-),女,内蒙古包头人,副教授,硕士。基金项目:2012 年辽宁省社会科学学规划基金项目“大

5、中城市机动车保有量预警机制研究”(l12bglc011)。可以看到,需要解决的只有汽车保有量这一个因 变量,而影响汽车保有量的因素是多重的,所以 大多数人选择了多元线性回归算法。么丽欣等(2013)选取了人均可支配收入、 公路里程等 5 个影响因子作为自变量建立了多 元线性回归模型,并通过多元共线性检验、异方 差检验、自相关检验等检验修正方法减少模型的 系统误差,收集天津市近 10 年的历史数据,对 未来 5 年的汽车保有量进行了预测。2吴泗宗等(2010)选取了汽车总产量、全国 总人口、人均可支配收入 3 个影响因子作为自变 量建立了多元线性回归模型,因为汽车总产量和 人均可支配收入受经济发

6、展影响很大,具有较大 不确定性,因此辅以经济快速增长、平稳增长和 大幅调整三种情形分析,结合全国 19 年的历史 数据,对未来 2 年的汽车保有量进行了预测。3 高伟等(2011)选取了居民可支配收入、汽车年成本、车均城市道路面积 3 个影响因子作为 自变量建立了多元线性回归模型,通过 t 值检 验,剔除了影响不显著变量车均城市道路面积, 并以南昌市 2009 年和 2010 年汽车保有量数据进 行模型检验,得出了汽车保有量的显著影响因素 是居民收支比例。4多元线性回归算法,由于自变量较多,各个 影响因子的未来值还需要预测,降低了算法的精 度,而且计算量较大,不同的学者选取的影响因 子各不相同

7、,所以预测结果也是差异很大。(四)指数平滑法指数平滑 法是一种基 于时间序列 的回归算 法,它是通过计算指数平滑值,配合一定的时间 序列预测模型对现象的未来进行预测。其原理是 任一期的指数平滑值都是本期实际观察值与前 一期指数平滑值的加权平均。孙正一等(2013)在二元线性回归算法的基 础上,又运用一次指数平滑法和平均增长模型构 成组合预测方法,对西安市未来地 3 年的汽车保 有量进行了预测。5指数平滑法仅取时间作为参量,认为近期历 史数据的趋势会延续下去,忽略了经济长期发展 的不确定性影响,在经济稳定增长期间可以作为 短期预测方法。(五)逻辑回归法logistic 模型主要用来预测离散因变量

8、和 一组自变量之间的关系,它描述了概率与自变量 之间的关系是一种“s”形曲线。刘超(2011)在对各种算法进行了综述之后, 采用了 logistic 模型,认为汽车行业具有生命 周期曲线的特点,根据对各个阶段的预测从而较 好的发现总的汽车保有量增长趋势,然后利用模 型预测了中国汽车的最大保有量为 630 辆/千 人,并以日本为例进行了对比说明。6田 娟( 2011 ) 选 取 了 s 曲 线 预测法 中的 logistic 预测方法预测我国未来十年的汽车销 售量以及汽车销售量达到饱和状态所需要的时 间,具体分析出了未来汽车保有量以及到达峰值 年限。7赵菲(2012)从交通环境容量角度出发,运

9、用动态离散计量模型预测沈阳市交通环境承载 力约束条件下的汽车保有量。同时从城市交通需 求出发,根据沈阳市历年汽车保有量数据,运用 spss 软件拟合 logistic 增长曲线对沈阳市实际 的汽车保有量进行预测。8logistic 预测方法是基于产品生命周期理 论,所以效果较好。汽车属于大宗耐用消费品, 所以其增长曲线符合 s 型增长曲线,因此可以将 s 型曲线应用于汽车保有量的预测。二、人工神经网络运用综述人工神经 网络是一种 模仿生物神 经网络的 结构和功能的数学或算法模型。神经网络是由大 量的人工神经元联结进行计算,通常用于解决分 类和回归问题的非线性、自适应信息处理系统。 贲颖(200

10、7)运用人工神经网络 bp 算法,选取人口、国内生产总值、人均可支配收入、公 路客运量、公路货运量作为网络输入部分,通过 输入量归一化处理和样本训练,对 2005 年的汽 车保有量进行了预测。该文献认为 bp 神经网络 具有很强的非线性映射能力、自学习能力、容错 能力等特性,可以较好地解决非线性系统的预测 问题。9牟振华等(2009)运用人工神经网络 bp 算 法并结合主成分分析法,在初选人口等 7 个影响因子中提炼人口、gdp、人均 gdp3 个主成份,样 本经过 1800 次训练,对山东省 2010 年和 2020 年汽车保有量进行预测,认为通过主成分分析, 提炼出较少的与线性无关的新要素

11、作为输入变 量进行神经网络模拟,运行效率和精度很高。10 冯涛(2005)运用人工神经网络 bp 算法,选取了城市人口密度、人均 gdp、公交路网密度、 车价/收入、燃油价格和外界干扰因素等 6 个影 响因子建立了预测模型,认为外界政策是一个影 响较大的因子,首次把外界政策等不易量化的偶 然因素考虑到模型中来,模拟外界政策等因素对 汽车保有量的突变影响,并以大连市为例进行了 预测。11作为一种非线性预测算法,人工神经网络在 经济平衡运行的环境下,具有比较高的汽车保有 量预测精度,但人工神经网络的稳定性方法的理 论尚不完善,隐层层次和节点数靠运算确定,增 加了神经网络这种非线性预测方法的不确定性

12、。三、基于核的算法(支持向量机)运 用综述基于核的 算法中最著 名的当属支 持向量机 (svm)了。 基于核的算法把输入数据映射到 一个高阶的向量空间, 在这些高阶向量空间里, 有些分类或者回归问题能够更容易的解决。赵海龙(2009)结合美、日、韩等国家汽车 工业发展过程,运用合理的相似性假设,采用基 于情景分析方法,提出了一个基于相空间重构的 svm 支持向量机回归预测非线性预测的算例,对 2007 年中国汽车保有量的预测结果表明,基于 转导思维的非线性 svm 算法有着较高的预测精 度。做出了中国今后近 30 年汽车普及率的中长 期预测。12杨艳妮等(2010)在利用支持向量机方法进 行私

13、人汽车保有量预测时,为了充分利用最新的 信息,提高预测的准确性,采用了滚动预测的方 法。通过建立数据集、确定模型的结构等 6 个步 骤,对 2006-2008 年北京市私家车拥有量进行预 测,并得出支持向量机滚动预测模型的预测精度 控制在 3% 以内的结论。13svm 算法在解决小样本、非线性及高维度模式识别中表现出很多特有的优势。少数支持向 量决定了最终结果,不但可以帮助研究者抓住核 样本、排除大量冗余样本,而且表明这种算法不 但运算简单,而且具有较好的鲁棒性。 因为机动 车保有量受到多种影响因子的制约,长期发展来 说必然是一个非线性问题,而由于大多数情况 下,研究者所掌握的历史数据是有限的

14、,即样本 不足,所以支持向量机在此类问题的处理上具有 很大的优势。但 svm 算法对大规模训练样本较难 实施,贮存和计算耗费大量资源;另外用 svm 解 决多分类问题存在困难,需要多个 svm 协同,而 社会经济问题在数据挖掘中一般要解决多类的 分类问题。四、聚类算法运用综述聚类算法 通常按中心 点或者分层 的方式对 输入数据进行并归。所有的聚类算法都试图找到 数据的内在结构,以便按照最大的共同点将数据 进行归类。仲伟周等(2008)认为,既往对汽车保有量 的研究,在影响因子选取方面存在片面性,信息 不足或遗漏,导致预测的准确性和可信度下降。 该文献选取 2005 年全国 31 个省市自治区的

15、 31 种影响因子作为自变量,运用聚类算法得出影响 中国民用汽车保有量的生产消费、交通水利投 资、公路和批发零售 4 个相关因子,然后利用多 元回归算法进行了分析预测。14宗刚等(2008)通过对前人的研究总结出机 动车保有量预测中选取的影响因子主要有 13种,相关性强的有 12 种,而这 12 种影响因子之 间也有较强的关联性,进而使用 frisch 综合分 析法对其进行聚类。从相关系数 r、拟合优度 r2 和标准误差 3 个方面综合考虑,最终提取公路 总里程、钢材产量、工业总产值、城市化率等 4 个影响因子作为预测汽车保有量的自变量。15聚类算法能够降低问题的维度,使解决问题 的方法更加简

16、捷。在机动车保有量预测中,聚类 算法主要应用于在对于影响因子的分析上。由于 汽车保有量预测涉及的影响因素众多,而看似不 同的影响因子可能属于同类结构或相同属性,经 过聚类能够发现问题的核心或大类因素。但由于聚类算法方法很多,关键分出来的类内部相似度 高,类间相似度低,这是聚类效果比较好的表现, 在具体问题分析中,相似度是最影响聚类算法效 果的因素。五、基于实例的算法运用综述基于实例 的算法常常 用来对决策 问题建立 模型,这样的模型常常先选取一批样本数据,然 后根据某些近似性把新数据与样本数据进行比 较。通过这种方式来寻找最佳的匹配。李瑞敏等(2013)从近 20 年中国与其他典 型国家、地区

17、和城市的人均 gdp 、机动车保有 量及人口密度的数据着手,分析三者之间的关 系。指出在未实施机动车保有量控制政策的情况 下,人均机动车保有量与人均 gd p 有较强的正 相关关系,与人口密度有一定的负相关关系。该 文献选取日本和英国的样本数据做为对比,将机 动车保有量的发展趋势分为高、中、低保有量对 中国未来机动车保有量进行预测。16社会经济的发展具有相似性,很多发达国家 经历的过程也很可能会在中国出现,该算法考虑 了人类社会发展的共通性特点,具有较好的预测 作用。基于实例的算法的目的是寻找最佳的匹 配,而其它国家或地区的更加详尽的历史资料并 不容易搜集,因此所谓最佳匹配很难寻找,因此 该算

18、法也不为研究者常用。六、结论本综述力 求在基于对 预测算法模 型和影响 因子的分析和阐述,对预测方法的提出、算法组 合、影响因子提炼及不确定因素利用提出更有建 设性的意见。1回归算法作为成熟的机器学习算法, 在 机动车保有量预测中仍应作为基本算法加以妥 善利用,特别是在样本数量充足的情况下。一元 回归算法不适用于多影响因子的机动车保有量 预测;弹性系数法适宜作为其它以时间序列为基 础的算法的系数修正,不宜作为机动车保有量预 测的独立算法运用;多元线性回归算法在经济平 衡增长的发展中国家的机动车保有量短期预测 中具有较好的效果,影响因子的选取是关键,适宜作为短期预测或长期预测中的平稳阶段预测 使

19、用;指数平滑法不宜作为独立预测算法运用, 可应用于长期预测中的非线性过程或曲线拟合 不佳的情况,对预测模型进行修正;逻辑回归算 法是回归算法中比较符合事物发展生命周期的 方法,可以作为以回归算法为基础的组合预测方 法的基本模型。2人工神经网络作为一类高级机器学习算 法,尚有许多不成熟的地方,在样本学习过程中 可能存在学习不足或过度学习的不稳定性。对于 机动车保有量预测来说,如果通过其它算法利用 计算机能够很好的解决问题则不推荐使用此算 法,另外如果机动车保有量预测是用来指导城市 交通政策或产业发展政策时,人工神经网络并不 能保证结果的正确性,所以亦不推荐使用。人工 神经网络宜用于利用计算机算法

20、的预测方法的 补充,不宜独立作为预测方法运用。3支持向量机作为一种较好鲁棒性的非线 性预测算法,对于历史数据较少,同时认为影响 因素又较多的情况下,应作为首选算法加以利 用,得到相对准确的预测结果。4机动车保有量的影响因子确实是多方面 的,而对于社会经济固有影响因素来讲,都或多 或少的存在关联,因此聚类算法在影响因子提炼 方面具有非常好的优势,该算法避免了主观选择 因素,能够保证分类的科学性,适宜作为运用基 础算法进行预测的方法中影响因子选取的算法。 5基于实例的算法因其所谓最佳匹配的实现难度,不宜作为独立预测方法,在样本数据可 靠的提前下可以作为预测结果验证算法。6突发因素对于机动车保有量预

21、测来说是 一类不可忽视的不易量化的影响因子,因此无论 是运用哪种算法进行预测都应该考虑突发事件 的影响, 综述过程中有作者利用了情景分析方 法,是一种很好的补充。突发因素的预测适宜运 用基于实例的算法来确定。综上所述,在历史数据充足时,建议以逻辑 回归算法为基础,建立“s”曲线模型;在历史 数据不足时,建议以支持向量机为基础,建立非 线性模型;然后利用聚类算法提取核心影响因 子,利用指数平滑法或弹性系数修正非线性区域,线性区利用多元回归算法加以处理,最终通 过计算机运算得到更加精确的预测值。机动车保有量预测是复杂的,综述过程中受 文献搜集的制约,预测方法的分析并不全面,随 着统计学理论的丰富和

22、机器学习算法的进一步 成熟,还会出现更加科学的预测方法。参考文献: 1薛佳平,张黎丽弹性系数法和回归分析法在预测中的 比较j山西建筑,2013(5):199-2012么丽欣,张海波,白辰基于多元线性回归方法的城市 汽车保有量预测研究-以天津市为例j汽车工业研究, 2013(9):42-443吴泗宗,陈志超,张志伟全国民用汽车保有量情景预 测研究j上海管理科学,2010(1):105-1084高伟,程文明我国中部城市汽车保有量预测模型研究 j现代商贸工业,2011(20):1-35孙正一,赵双喜基于组合模型的西安市汽车保有量预 测j轻型汽车技术,2013(3):3-46刘超基于 logistic

23、 模型对中国汽车保有量的预测与分 析d南开大学,2011,47田娟汽车保有量极限以及年份预测j.黑龙江科技信 息,2012(23):72-778赵菲 沈阳基于交通环境承载力的汽车保有量研究 d辽宁大学,2012,49贲颖 神经网络对汽车保有量的预测j黑龙江交 通科技,2007(11):151-15410牟振华,李美玲,赵庆双基于神经网络的山东省机动 车保有量预测j 山东建筑大学学报, 2009(3): 229-23211冯涛城市汽车保有量预测及道路交通经济效果分析 d大连理工大学,2005,612赵海龙中国汽车保有量预测建模及其应用研究d湖 南大学,2009,413杨艳妮,陆化普基于支持向量机的城市私人汽车保有 量滚动预测j公路工程,2010(5):39-4314仲伟周,王军基于因子分析法的中国民用汽车保有量 影响因素分析及其政策含义j统计与信息论坛, 2008(11):16-2015宗刚,张广利基于计量经济学模型选取与汽车保有量 相关的因素j汽车工业研究,2008(7):2-5 16李瑞敏,何群,李帅中国机动车保有量发展趋势分析j城市交通,2013(5):69-75(责任编辑:李 刚)overview on forecasting method of motor vehicle ownershipwang li-ying(department of public ord

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论