版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录TOC\o"1-3"\h\u25339 159711.1广州港集装箱吞吐量的影响因素的实证分析 1135271.1.1指标构建 1257471.1.2指标选取与原始数据 2216851.1.3实证分析 4321861.1.4结果分析 8287011.2基于主成分分析-BP神经网络的预测模型介绍 99151.2.1预测的基本原则 9124161.2.2模型建立思想 9159311.2.3集装箱吞吐量预测模型步骤 10143921.3广州港集装箱吞吐量预测实例 11324201.3.1预测指标的主成分分析 11297971.3.2集装箱吞吐量预测 16177961.4结果分析 191.1广州港集装箱吞吐量的影响因素的实证分析1.1.1指标构建本节将在现有文献研究与机理以及广州港现状分析的基础上构建广州港集装箱吞吐量的影响指标体系,为后文预测奠定数据基础。该指标体系涵盖了自然条件、港口基础设施、港口服务质量、腹地经济、集疏运系统以及政府政策等8个一级指标以及36个二级指标,如下表1.1所示:表1.1广州港集装箱吞吐量影响因素指标体系一级指标二级指标一级指标二级指标自然条件地理位置航道水深岸线长度气候条件腹地经济广州GDP第一产业值第二产业值第三产业值进出口总额社会消费品总额港口基础设施港口泊位数装卸设备能力班轮班次港口通过能力锚地能力集疏运系统铁路货运量公路货运量水路货运量营商环境港口作业效率船舶平均停港时长港口服务质量港口费收信息化管理水平政策环境港口发展政策区域港口规划口岸政策财政收入全社会固定资产投资额人口因素人口总量人均GDP交通运输、仓储和邮政业从业人员数量人均全年可支配收入粤港澳大湾区建设大湾区贸易开放度(对外贸易依存度)大湾区GDP交通运输、仓储和邮政业基础设施投资额香港、深圳港口集装箱吞吐量1.1.2指标选取与原始数据从指标代表性、数据可获得性以及实证计算难度三个方面进行指标筛选,选取了:广州GDP、第一产业值、第二产业值、第三产业值、进出口总额、社会消费品总额、铁路货运量、公路货运量、水路货运量、泊位数、万吨级以上泊位数、总人口数量、人均GDP、交通运输、仓储和邮政从业人员数量、人均全年可支配收入、财政收入、全社会固定投资额、大湾区对外贸易依存度、大湾区GDP、交通运输、仓储和邮政基础设施投资额、港深集装箱吞吐总量等21个指标,具体如表1.2所示,选取2010-2019年作为原始数据(表1.3)。表1.2多元回归模型指标的选取指标类型一级指标指标名称指标符号因变量-广州港集装箱吞吐量Y自变量腹地经济广州GDPX1第一产业值X2第二产业值X3第三产业值X4进出口总额X5社会消费品总额X6集疏运系统铁路货运量X7公路货运量X8水路货运量X9港口条件泊位数X10万吨级以上泊位数X11人口因素总人口数量X12人均GDPX13交通运输、仓储和邮政业从业人员数量X14人均可支配收入X15政府政策财政收入X16全社会固定资产投资额X17粤港澳大湾区建设大湾区对外贸易依存度X18大湾区GDPX19交通运输、仓储和邮政业基础设施投资额X20港深集装箱吞吐量X21表1.32010-2019年广州港集装箱吞吐量及其影响指标原始数据年份X1/亿元X2/亿元X3/亿元X4/亿元X5/亿美元X6/亿元X7/万吨201010640.67168.624053.36418.751037.683809.046689201112199.69180.054632.687386.971161.684367.286441201213191.69185.444773.198236.051171.674899.696029201315050.4196.135318.459535.821188.965566.776137201416135.95200.815647.8510287.291305.906252.715324201517347.37206.525777.1711363.681338.686991.424811201618559.73216.035813.4512530.251293.097562.034884201719871.67220.455900.6113750.611432.508190.635121201821002.44229.186109.9514663.311485.058810.911989201923628.60251.376451.0016923.231450.199551.572105表1.3(续)年份X8/万吨X9/万吨X10/个X11/个X12/万人X13/元X14/人X15/元2010396961017063362806.148836137369330658.492011454481215265067811.589758839888034438.082012526971644965768822.3010590939965638053.522013591422290866268832.3112029446634042049.142014660402416767371842.4212847843698445791.512015712842300767874851.1913618845227546731.602016718603021280776870.4914193348560150940.702017770993750680776897.8715067850509555400.492018820324260880776927.6915549152730759982.102019883524457180978953.7215642755880665052.10表1.3(续)年份X16/亿元X17/亿元X18X19/亿元X20/亿元X21/万TEU广州集装箱吞吐量/万TEU20101399.163263.570.2857661.53449.814620.91251.5720111535.143412.20.2765666.17427.446951425.0420121579.683758.390.2771155.68456.8446061451.7420132088.144451.550.2775756.91593.5445631531.1120142318.844889.50.2781381.54670.7146271638.8620152391.335405.950.2287650.55631.6844271739.6620162218.485703.590.2094295.52792.2743791885.7720172841.835919.830.20102678.26883.2345982037.2020183173.755938.40.19113338.94911.0645342192.2120193367.896920.210.18115865.321060.94412.42323.62数据来源:各市区年鉴1.1.3实证分析线性回归以及最小二乘法是最常用的回归分析方法,然而能够应用该方法的前提条件是输入模型的自变量之间相互独立。但在上文对于广州港集装箱吞吐量的影响因素指标选取时,存在经济类影响因素,这类因素之间存在相互影响,各因素相关性较强,难以满足常用回归方法的要求。为了保证回归模型能够拥有较好的效果,剔除各因素之间多重共线性带来的问题,同时保证影响因素分析结果的准确性,本文将构建岭回归模型来消除多重共线性影响并筛选出显著影响的影响指标,求解模型参数[58]。1.1.3.1描述性统计以及相关性分析表1.4描述性统计表N极小值极大值均值标准差X11010640.6723628.616763.1214119.17765X210168.62251.37205.4621.76611X3104053.364545448.065746.77103X4106418.7516923.2311109.5963378.9742X5101037.681485.051286.54145.62755X6103809.049551.576600.5051945.50147X7101989668949531662.483X81039696883526536515903.673X91010170445712637512132.997X1010633809718.377.728X1110627871.65.211X1210806.14953.72862.17149.84101X131088361156427128131.724456.071X1410373693558806460463.760032.617X151030658.4965052.146910.07311112.345X16101399.163367.892291.724681.14231X17103263.576920.214966.6191222.48376X18100.180.280.2350.04035X191057661.53115865.3286545.04219858.46313X2010427.41060.9688.044218.48464X21104391.944705.24558.812101.92706y101251.572323.621748.278353.4084相关系数表由于篇幅较长,置于附表中。由相关系数表可知,各变量之间相关性较高,存在严重的多重共线性问题,因此不适宜采用线性回归以及最小二乘法,而岭回归模型则较为适用。1.1.3.2岭回归检验如表1.5所示,由于岭回归惩罚从0开始,步值为0.02,因模型步骤过多,所以这里仅给出1至20步的结果。结合岭路径图(图1.1)与岭回归剔除变量原则,将X7、X8、X12、X14、X16、X18等回归系数不稳定的变量剔除,并进行进一步回归分析。表1.521个解释变量岭回归模型模型惩罚(k值)规则化“R方”(1-误差)标准系数之和明显预测误差1011020.020.9980.6190.00230.040.9880.4610.01240.060.9980.1250.00250.080.9970.1240.00360.10.9960.1210.00470.120.9920.0420.00880.140.9620.2690.03890.160.9890.1210.011100.180.9860.0890.014110.20.9940.0140.006120.220.9990.0080.001130.240.9990.0060.001140.260.9970.0040.003150.280.9590.0460.041160.30.9950.0020.005170.320.9980.0020.002180.340.9980.0010.002190.360.9990.0010.001200.380.9990.0010.001图1.121个解释变量岭回归路径剔除以上6个变量后,得到完善后的15个解释变量岭回归模型,如表1.6所示。经过对比,k值在0.16后的系数变化较为稳定,因此选取k=0.16作岭参数作回归分析,其中R方为0.998,最终回归结果如表1.7所示。表1.615个解释变量岭回归模型模型惩罚(k值)规则化“R方”(1-误差)标准系数之和明显预测误差1011020.020.9970.7230.00330.040.9980.1070.00240.060.9950.1190.00550.080.9950.0640.00560.10.9940.0190.00670.120.9990.0070.00180.140.9980.0090.00290.160.9980.0030.002100.180.9970.0030.003110.20.9980.0080.002120.220.9980.0040.002130.240.980.0180.02140.260.9980.0020.002150.280.9970.0040.003160.30.9970.0040.003170.320.9960.0040.004180.340.9960.0040.004190.360.9980.0020.002200.380.9960.0040.004表1.7岭回归结果系数标准误t值p值常量59.240562.2612.140.047**X10.1580.0026.1890.000***X20.0330.0291.1440.267X33.0950.9773.5720.001***X42.1880.0045.5060.000***X50.2330.1821.9420.081*X66.0710.0065.7080.000***X90.0430.0023.3280.003***X106.6185.2431.2620.182X110.9120.4092.2280.049**X130.02870.2480.1150.945X150.0080.0021.6890.000***X170.022.0141.2400.251X190.0060.0016.0110.000***X200.4300.1071.0160.000***X21-0.1190.168-2.7350.008***因变量:广州港集装箱吞吐量注:***、**、*分表示在表示p<0.01、p<0.05、p<0.1置信水平显著1.1.4结果分析根据以上实证分析后我们可以得出以下结论:腹地经济因素中,广州市GDP(X1)、第二产业值(X3)、第三产业值(X4)、外贸进出口总额(X5)以及社会消费品总额(X6)对于广州港集装箱吞吐量的影响最为显著。其中广州第二产业值对于广州港集装箱吞吐量的显著水平为0.001,影响系数为3.095,说明在腹地经济因素中第二产业对于集装箱吞吐量的贡献最大。这一结论符合国内研究现状,第二产业产出的制造品大部分能够适用于集装箱运输,是集装箱运输的主要货源持。同时在诸多显著因素中,进出口总额对于集装箱吞吐量呈轻微正向促进作用,反而是社会消费品总额的影响系数较高,这一结果说明相比于国际贸易而言,广州港集装箱更多地依赖于内贸的发展。此外,第一产业值对于集装箱吞吐量的影响不显著,原因在于第一产业产出并非集装箱的主要货源,因此对于广州港集装箱吞吐量的影响较为轻微。集疏运系统中水路货运量(X9)对广州港集装箱吞吐量的影响最为显著;其显著水平为0.003,影响系数为0.043,说明水路货运量对集装箱吞吐量具有轻微正向影响。港口条件中万吨级以上泊位数(X11)对于集装箱吞吐量的贡献最大;其中显著水平为0.049,影响系数为0.912,说明万吨级以上泊位数每增加一个单位,集装箱吞吐量将上升0.912个百分点,二者之间显著正向影响。人口因素中则是人均可支配收入(X15)贡献度最大;人均可支配收入对广州港集装箱吞吐量的显著水平达0.000,表明人均可支配收入对集装箱吞吐量的显著程度非常高,但影响系数0.008则是说明人均可支配收入每增加一个单位,集装箱吞吐量仅上升0.008个百分点。粤港澳大湾区建设中大湾区GDP(X19)、交通运输、仓储和邮政业基础设施投资额(X20)以及港深集装箱吞吐量(X21)等对广州港集装箱吞吐量的影响较为显著。其中交通运输、仓储和邮政业基础设施投资对集装箱吞吐量的显著水平为0.000,影响系数达0.430,说明该变量与集装箱吞吐量呈显著正向关系;这一结果也符合学者研究以及粤港澳大湾区未来规划,《纲要》中明确指出将强化湾区交通基础设施建设,集装箱运输作为物流主要运输方式之一,完备的交通基础设施建设势必能够提升集装箱运输的效率。此外,港深集装箱吞吐量对于广州港集装箱吞吐量的显著水平为0.000,影响系数达-0.119,说明港深集装箱吞吐量每提高一个单位,广州港集装箱吞吐量将下降0.119个百分点。这一结果符合港口竞合理论,也说明了广州港与香港港、深圳港之间存在港口竞争,香港港和深圳港会在一定程度上分走广州港的集装箱货源。但由于主要因素数量达11个,若将这些作为BP神经网络模型的输入指标会存在指标冗余以及网络响应速度慢等问题,因此下文将采用主成分分析法,提炼出主要成分,降低BP神经网络的输入指标维度,以此提高预测精准度。1.2基于主成分分析-BP神经网络的预测模型介绍1.2.1预测的基本原则预测的实质是以预测目标的当前状况为基础,对未来的变化规律做出科学合理的推测。集装箱吞吐量预测作为常规的数据预测,也应当遵循以下预测的基本原则。(1)连贯性原则。任何事物的变化都离不开过去时间段的基础,在时间维度都具有连贯性,预测目标没有过去就不会有未来的发展,因此若对该目标的未来进行预测,那么就需要该预测目标过去的相关数据。该原则常作为传统时间序列预测方法的基础理论。(2)关联性原则。事物的变化受到其相关联因素的影响。在进行预测时,既需要将预测目标的特性作为构建模型的基础,也需要将与之相关的各类影响指标纳入考虑范围。回归分析的理论依据就是该关联性原则。(3)类推性原则。任何事物的变化规律都存在共同性,以近似预测目标的事物变化趋势类推至预测目标。这一原则在数据预测过程中不容忽视。1.2.2模型建立思想1.2.2.1主成分分析法主成分分析能够将多个具备一定关联性的输入指标重新提炼组合成几组互不影响的综合指标。最常见的方式是选取第一个线性组合F1的方差来体现各输入指标的关系,即Var(F1)越高,线性组合中包含的关系越紧密。所以在实际分析过程中将线性组合中Var(F1)最高的F1称作第一主成分。当F1对于输入指标表达不够充分时,可以选择方差第二高的作为第二主成分F2,在第二个线性组合中F1已包含的指标信息将不再出现,依此类推可以构造出第三、第四,……,第P个主成分。1.2.2.2BP神经网络BP神经网络的原型来源于人类大脑神经元,利用神经元进行信息的传递,可以正向传递输入信息,反向调节误差信息。BP神经网络通常采用调节各层的全职与阈值来提高网络的精准度,如果精准性达不到设定的目标值,将不断改变权阈值直到达成目标。BP神经网络包括三成结构:输入层、隐含层、输出层(如图1.2所示),再由每层的神经元将三层结构联系成一个整体。同。原始数据从输入层进入网络模型,在隐含层中利用神经元对数据进行处理,传递到输出层后对比目标数据,如果与目标数据差值过大则返回隐含层进行误差反向调节,该过程将一直进行到输出结果满足期望目标。图1.2BP神经网络结构1.2.3集装箱吞吐量预测模型步骤本文将先利用主成分分析法对原始变量预处理,通过分析各变量之间的关联性提取出P个主要成分,这一步既可以分析各变量占主成分的比重从而推导对预测结果的影响程度,也可以使BP神经网络的输入指标数量减为少量主成分,简化了神经网络的结构,提高了其稳定性与精准度,组合结构如下图1.3所示。这种组合预测方式具有两种模型的优点,使仿真结果更贴合预期目标。同时本文将对比该模型和传统BP神经网络的预测精准度,以确定组合模型能够推广应用。图1.3主成分分析-BP神经预测模型根据上节介绍的主成分分析法和BP神经网络的原理以及构建思想,本文预测的具体步骤如下:(1)将影响因素指标体系作为主成分分析的输入指标。(2)利用主成分分析模型,综合提炼出p个主成分。主要步骤如下:1)根据研究目的选取指标与数据;2)进行数据标准化处理
;3)进行指标之间的相关性判定;4)确定主成分个数m;5)确定主成分Fi表达式;6)进行主成分Fi命名;7)计算主成分得分系数矩阵并进行评价与研究。(3)将p个主成分作为BP神经网络的输入层节点。在得到p个主成分后,将其作为BP神经网络的输入层的节点,以此达到模型输入指标降维的效果,降维后的BP神经网络在理论上将更加精准,本文也会在后续实证过程中对比该模型与未降维传统BP神经网络的误差。(4)构建BP神经网络。BP神经网络的建立由指标选取、网络结构构建以及检验结果三个环节组成,其中网络的结构设计包括输入层、输出层、隐含层的设计、神经元的个数确定以及训练函数的选取。网络结构的设计能够直接影响预测的效果,而精准有效的网络结构通常具备以下特点:EQ\o\ac(○,1)神经网络在训练过程中输出的结果值与预测值相差较小;EQ\o\ac(○,2)在训练误差较小的情况下,能够对新数据进行精准的预测;EQ\o\ac(○,3)网络整体的收敛速度较快,对数据的处理能力相对较高。(5)训练BP神经网络。在构建完BP神经网络后,结合输入样本数据,经过神经网络模型的自我学习和处理会输出训练样本预测结果。训练样本预测结果的精准与否反映了模型的优劣以及能否用于推广应用,所以有必要对预测结果的精准度进行判断。本文选择平均绝对百分比误差(MAPE)来判断,若训练样本和检验样本的MAPE都较小,则该模型预测效果良好。若MAPE很大,则模型需要改进。MAPE的计算公式如下,其中y(t)是目标变量的实际值,y'(t)是目标变量的预测值。(1.1)(6)检验神经网络的泛能力并进行预测。对训练集输出结果与期望目标进行对比,当二者误差小于设定值时,此时的BP神经网络的阈值和权值就是训练后得到的最佳数值,该网络的精准度也较高。本文选择训练过程中误差相对较低的网络对需要进行预测的相关数据进行应用。1.3广州港集装箱吞吐量预测实例1.3.1预测指标的主成分分析1.3.1.1指标选取指标与数据在上文1.1中已经建立了影响广州港集装箱吞吐量的指标体系,并采用多元回归模型探究了各指标与集装箱吞吐量的相关影响度。因此本节将以1.1的实证结果为基础,选取主成分分析输入指标见表1.8所示,原始数据见上文表1.3所示:表1.8主成分分析指标选取一级指标指标名称指标符号腹地经济广州GDPX1第二产业值X3第三产业值X4外贸进出口额X5社会消费品总额X6集疏运系统水路货运量X9港口条件万吨级以上泊位数X11人口因素人均可支配收入X15粤港澳大湾区建设大湾区GDPX19交通运输、仓储和邮政业基础设施投资额X20港深集装箱吞吐量合计X211.3.1.2标准化处理为消除数据纲量造成的统计误差,对输入数据进行标准化处理,处理后数据如表1.9所示。表1.9主成分分析标准化后数据年份ZX1ZX3ZX4ZX5ZX62010-1.10785-1.09188-1.1017-0.85739-1.147892011-0.8663-0.90372-0.85042-0.78879-0.874232012-0.41579-0.17357-0.46576-0.67007-0.531352013-0.152260.26753-0.243360.13294-0.1787720140.141840.44070.07520.358040.2024720150.436160.489290.420440.044980.4942320160.754650.6060.78161.002280.8173320171.029170.886331.051711.363131.1361620181.666711.347051.720531.123761.516872019-1.10785-1.09188-1.1017-0.85739-1.14789表1.9(续)年份ZX9ZX11ZX15ZX19ZX20ZX212010-1.17226-0.88273-1.122351.39514-1.09039-1.454472011-0.8181-0.69083-0.7970.56399-1.19296-1.051382012-0.28575-0.69083-0.437440.15904-1.05822-0.774952013-0.18198-0.11514-0.100660.78281-0.43254-0.543252014-0.277590.46056-0.01579-1.11355-0.07934-0.2600220150.316250.844350.36272-1.59036-0.257980.0556720160.917420.844350.764050.497180.477040.3902920171.337920.844351.17635-0.104380.893360.8124120181.499711.228151.6326-1.268611.034471.349242019-1.17226-0.88273-1.122351.395141.706551.476461.3.1.3相关性判定在对数据标准化处理后,需要探究各类因素之间的相关性,由下表1.10可知,这11个影响因素相互之间的关联性很高,如果直接进行分析会带来严重的共线性问题。表1.10各输入指标成分的相关性表X1X3X4X5X6X9X11X15X19X20X21X110.9660.9980.9480.9960.9790.9560.9970.9890.978-0.659X30.96610.9490.9450.960.9230.9610.9560.9420.914-0.654X40.9980.94910.940.9950.9820.9460.9960.9910.984-0.653X50.9480.9450.9410.9580.9380.9420.9540.9640.906-0.483X60.9960.960.9950.95810.9780.9630.9940.9940.976-0.66X90.9790.9230.9820.9380.97810.9070.990.9870.983-0.552X110.9560.9610.9460.9420.9630.90710.9440.9490.901-0.684X150.9970.9560.9960.9540.9940.990.94410.9940.982-0.614X190.9890.9420.9910.9640.9940.9870.9490.99410.97-0.608X200.9780.9140.9840.9060.9760.9830.9010.9820.971-0.604X21-0.659-0.654-0.653-0.483-0.66-0.552-0.684-0.614-0.608-0.60411.3.1.4计算特征值以及特征值贡献率根据标准化后数据的协方差的矩阵来计算矩阵的特征值,并按照方差贡献率从大到小排列得到表1.11,结合碎石图1.4可知主成分1特征值为8.171,方差贡献率为90.791%;主成分2特征值为0.623,方差贡献率为6.924%,;主成分3特征值为0.13,方差贡献率为1.446%;主成分分析通常要求提取特征值大于1的主成分,但由于本文特征值大于1的主成分仅有一个且BP神经网络输入指标过少会降低网络精确性,因此在前三个主成分的累计贡献率可达99.161%的情况下,其特征值高于其他主成分,能较好反映原始指标携带的信息,本文将提取前三个主成分计算综合得分。表1.11主成分特征值与贡献率对比主成分特征值方差贡献率%累积贡献率%18.17190.79190.79120.6236.92497.71530.131.44699.16140.0410.45799.61850.0220.2499.85860.0110.1299.97870.0010.01699.99480.0010.00610099.14E-091.02E-07100图1.4主成分与特征值碎石图1.3.1.5因子载荷矩阵由上表可知主成分1、主成分2和主成分3的方差贡献率分别为90.791%、6.924%、1.446%,累计贡献率分别为90.791%、97.715%、99.161%,占主导地位;因此仅保留主成分1、主成分2和主成分3,并计算其因子载荷矩阵,载荷越大说明该因子与主成分的相关度较高,结果如表1.12所示。表1.12因子载荷矩阵指标主成分123X10.9980.009-0.03X30.969-0.0190.174X40.9950.016-0.075X50.9560.2080.179X60.9990.01-0.012X90.9770.14-0.134X110.967-0.0630.207X150.9950.068-0.057X190.9920.076-0.032X200.9740.065-0.193X21-0.6670.7440.025将成分矩阵的数据与主成分相对应的特征值相除,并将结果开平方根就可以得到主成分线性组合中每个指标所对应的系数,主成分系数矩阵如下表1.13所示:表1.13主成分得分系数矩阵指标主成分123X10.0990.014-0.177X30.096-0.0311.013X40.0990.024-0.437X50.0950.3271.039X60.0990.016-0.069X90.0970.22-0.78X110.096-0.0991.205X150.0990.107-0.329X190.0980.12-0.184X200.0960.102-1.12X21-0.0661.1710.144因此可得F1、F2和F3这3个主成分与标准化数据的线性组合为:F1=0.099X1+0.096X3+0.099X4+0.095X5+0.099X6+0.097X9+0.096X11+0.099X15+0.098X19+0.096X20-0.066X21(1.2)F2=0.014X1-0.031X3+0.024X4+0.327X5+0.016X6+0.22X9-0.099X11+0.107X15+0.12X19+0.102X20+1.171X21(1.3)F3=-0.177X1+1.013X3-0.437X4+1.039X5-0.069X6-0.78X9+1.205X11-0.329X15-0.184X19-1.12X20+0.144X21(1.4)得到上述主成分与标准化数据的线性组合后,将标准化后的数据(表1.10)带入计算得出主成分得分,该值将作为BP神经网络模型的输入指标进行预测分析,数据如表1.14所示:表1.14主成分得分F1F2F32010-1.49-0.02-1.272011-1.110.860.052012-0.830.07-0.192013-0.49-0.310.262014-0.170.6120150.16-1.410.2620160.5-1.860.2620170.690.791.8920181.181.31-0.9420191.56-0.02-1.31.3.2集装箱吞吐量预测1.3.2.1输入与输出指标的选取与归一化上一节中已经由主成分分析法对相关指标数据处理并得到了3个主成分,如表4-11所示。本小节将在此基础上以3个主成分作为BP神经网络的输入变量,将对应年份的广州港集装箱吞吐量作为网络模型的输出变量。将神经网络模型的输入变量进行归一化处理,即将原始变量数据映射在[0,1]上。归一化过程的表达公式和经过处理后的数据如公式(1.5)和表1.15所示。(1.5)表1.15BP神经网络归一化后数据值年份F1F2F3集装箱吞吐量原始数据(TEU)集装箱吞吐量归一化后数据2010010.151251.5702011010.591425.040.162012010.711451.740.19201300.2411531.110.26201400.6611638.860.3620150.94011739.660.452016100.911885.770.59201700.0812037.200.7320180.94102192.210.88201910.4502323.621同时,本模型将采用前8组数据进行模型训练,后2组数据作为测试样本集,以此来使本模型的误差值尽量贴合预期,预测结果尽量准确。1.3.2.2相关函数以及隐藏节点数的确定1.网络层数的确定本文采用3层结构的BP神经网络模型进行预测,即输入层、一个中间隐含层和输出层。其中输入层节点个数为3个,即上文主成分分析得到的F1、F2、F3,输出层节点个数为1个,即集装箱吞吐量,而隐含层的神经元数量则是需要通过不断训练来做出最优选择。2.训练函数的确定BP神经网络模型的训练函数选择依据在于学习速率、收敛速度等,本文采用trainlm训练函数,既Levenberg-Marquardt反向传播算法。它能够将其他非线性函数的平方和最小化,同时适用于以均方误差为指数的神经网络模型训练。尽管trainlm比其他算法计算量更大,但对于网络输入指标较少的网络而言,它仍然是最有效的训练算法。3.隐含层神经元个数的确定在模型网络层数已确定的情况下,隐含层神经元数量的选择对于模型精准度有决定性作用。神经元个数过少或过多都会影响网络获取信息的能力和过度拟合的问题,但其个数的确定不想网络结构一样具备确定性,选取方法没有一个明确的规定。本文将选采用经验公式(1.5)计算神经元数量选取的范围,再以最低神经元个数开始设置网络,逐渐提高隐含层神经元个数,采用同一组训练集来选取误差最低的隐含层神经元结构。(1.6)其中m是输入层指标数量,n是输出层指标数量,c则是1~10之间的正整数;根据以上公式,本文预测模型输入指标数量为3个,输出指标数量为1个,因此本文试算隐含层神经元数量范围为3~12;同样,传统BP神经网络的输入指标数量为11个,输出指标数量为1个,因此试算隐含层神经元数量范围为4~13。本文将选取试算误差最低的结果作为最终数据拟合的预测模型,试算结果见表1.16所示:表1.16BP神经网络预测模型隐层神经元对比试算结果隐层神经元个数基于主成分分析-BP神经网络-训练样本集平均MAPE基于主成分分析-BP神经网络-测试样本集平均MAPE传统BP神经网络-训练样本集平均MAPE传统BP神经网络-测试样本集平均MAPE30.67%2.46%--40.33%1.42%1.69%2.98%50.25%0.37%0.56%1.12%60.19%0.59%1.24%1.95%70.27%0.36%1.11%1.74%80.11%2.21%2.01%2.09%90.16%1.94%0.72%-2.47%100.09%0.74%0.32%-3.40%110.63%1.98%0.41%1.64%121.26%2.49%1.34%2.97%13--1.87%2.64%从试算结果可以得出以下结论:隐含层神经元数量为10个时,基于主成分分析-BP神经网络的训练样本集的平均误差为0.09%;但通常选取训练样本集和测试样本集都相对低的数据组,当神经元数量为7个时测试样本的平均误差为0.36%,适合进行推广预测。而传统BP神经网络在隐含层神经元数量为5个时,训练样本集的最低平均误差以及测试样本集的最低平均误差分别为0.56%和1.12%。因此本文将选取隐含层神经元数量为7个的主成分-BP神经网络组合模型以及隐含层神经元数量为5个的传统BP神经网络模型来进行结果拟合以及实验预测。1.3.2.3拟合与预测结果主成分分析法-BP神经网络的组合模型以及传统BP神经网络模型对于两组测试样本集的拟合结果如下表1.17所示,可以看出两种模型的输出值与实际值差距较小,其中组合预测模型精确度要更高于传统的BP神经网络模型,因此其比较适合进行推广测试。表1.17模型对广州港集装箱吞吐量的测试样本拟合结果年份实际值(TEU)基于主成分分析-BP神经网络结果值(TEU)MAPE传统BP神经网络结果值(TEU)MAPE20182192.212185.870.29%2092.801.75%20192323.622315.520.43%2265.30-2.51%在此基础上,将已训练完成的组合模型应用于广州港2020-2022年集装箱吞吐量的预测。由于组合模型中的输入指标是将对应年份的集装箱吞吐量影响因素原始数据进行综合提炼后得到的主成分,因此对于2020-2022年的集装箱吞吐量进行预测则需要这三年11项影响因素指标的相应数据,而其中广州港口泊位数和万吨以上泊位数的数据根据《广州综合交通枢纽总体规划》的建设规划,预计未来三年数据基本保持不变,因此该两项数据参考2019年;其余9项影响因素指标数据则采取基于时间序列的线性回归模型进行预测,计算结果见下表1.18:表1.182020-2022年集装箱吞吐量影响因素指标预测值2020年2021年2022年GDP/亿元25191.4426649.8228105.19第二产业值/亿元6572.506801.97031.19第三产业值/亿元18090.3919257.5520421.72进出口额/亿美元1436.781543.411581.9社会消费品总额/亿元9360.6310453.2911059.03水路货运量/万吨48393.35221656038万吨级以上泊位数/个787878人均全年可支配收入/元68873.6172695.1276516.63大湾区GDP/亿元122332.41128799.50135266.58交通运输、仓储和邮政业基础设施投资额/亿元1061.161131.431201.71港深集装箱吞吐总量/万TEU4425.884420.914397.93将以上数据结果带入已完成训练的组合模型后对广州港2020-2022年的集装箱吞吐量预测值进行计算,预测结果见表1.19;表1.19广州港集装箱吞吐量预测结果年份202020212022集装箱吞吐量/万TEU2338.252451.642565.02从以上预测结果可以得出,2020-2022年广州港集装箱吞吐量增长速度相对减缓,进入稳定发展期;集装箱吞吐量预计在2020年预计将达到2338.25万TEU,与2019年的2323.62万TEU相比仅增长了0.63%。此外,为了能够进一步探究粤港澳大湾区建设对于广州港集装箱吞吐量的影响,排除粤港澳大湾区建设带来的影响后,对2020-2022年广州港集装箱吞吐量进行预测,结果如表2.20所示:表1.20广州港集装箱吞吐量预测结果(排除粤港澳大湾区背景)年份202020212022集装箱吞吐量/万TEU2330.142411.722500.59对比而这两组预测数据结果后可以看出,2020年的数据相差相对较小,差值仅为8.11万TEU,而2021年和2022年的差值分别达36.92万TEU和61.43万TEU,差值随着年份的增加逐渐增大。下一节将对于两项预测结果做进一步的解释。1.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年名誉和友谊测试题及答案
- 2026年国际经典iq测试题及答案
- 艺术培训公司教师备课与教案审核管理制度
- 2026学年吉林省洮南市六年级数学期末自我评估核心强化题详细参考解析详细答案和解析
- 2026学年江苏省南通市五年级语文期末自测模拟绝密预测题附答案详细答案和解析
- 项目六任务1:ROS操作系统概述题库答案
- 预应力混凝土简支箱梁运架施工质量通病及防治措施
- 2026学年内蒙古自治区根河市三年级语文期末深度自测历年考试题附答案详细答案和解析
- 第1课 学习鉴赏美术作品 教学设计-2023-2024学年高中美术鲁美版必修美术鉴赏
- 汽轮机辅机值班员安全素养模拟考核试卷含答案
- 2026年贵州高考政治试卷附答案(新课标卷)
- 2026广西南宁市良庆区良庆镇人民政府招聘工作人员21人备考题库及一套完整答案详解
- 健康产业门店运营方案
- 2026上海青浦区白鹤镇基层单位招聘85名笔试模拟试题及答案详解
- 2026年高考英语全国二卷卷及答案(新课标卷)
- 海能达PD780-手持对讲机说明书
- 食品营养学(暨南大学)智慧树知到期末考试答案章节答案2024年暨南大学
- 子宫内膜病变的诊治课件
- MOOC 教学设计原理与方法-华南师范大学 中国大学慕课答案
- 【语文】浙江省杭州市西湖小学小学二年级下册期末试卷(含答案)
- 查摆问题清单查摆问题清单
评论
0/150
提交评论