【基于TICC算法的玉米市场价格的变化规律分析综述13000字】_第1页
【基于TICC算法的玉米市场价格的变化规律分析综述13000字】_第2页
【基于TICC算法的玉米市场价格的变化规律分析综述13000字】_第3页
【基于TICC算法的玉米市场价格的变化规律分析综述13000字】_第4页
【基于TICC算法的玉米市场价格的变化规律分析综述13000字】_第5页
已阅读5页,还剩24页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于TICC算法的玉米市场价格的变化规律分析综述目录TOC\o"1-3"\h\u16351基于TICC算法的玉米市场价格的变化规律分析综述 1157991.1玉米市场价格波动模式发现的模型分析 1204381.2TICC算法 263911.2.1相关符号的定义 260881.2.2算法基础 3170621.2.3模型框架 7272061.3玉米价格的模式发现模型 9246151.4玉米日价格的模式发现实证 9184211.1.1数据准备 10177071.1.2模型参数设置 10155741.1.3结果展示 1082891.1.4结果分析与验证 1632701.5玉米周价格的模式发现实证 20241821.5.1数据准备 20207351.5.2模型参数设置 21322661.5.3结果展示 21303721.5.4结果分析与验证 26本章以小麦市场价格、外三元价格、肉鸡价格、原油期货结算价、乙醇期货结算价为研究对象,挖掘玉米市场价格的模式。首先,分析与总结价格波动模式发现模型,其次,介绍TICC算法,然后,给出玉米市场价格的波动模式模型,最后,分别以玉米市场日价格和玉米市场周价格数据挖掘其波动模式为实证。1.1玉米市场价格波动模式发现的模型分析玉米生产与市场的健康稳定发展对确保我国粮食安全具有重要意义。本节对玉米市场价格的波动情况进行特征分析,挖掘某段时间内玉米市场价格波动情况出现了一些特定的重复发生的模式,以期对玉米市场价格趋势预测。近些年,根据农产品价格的时间序列在农产品价格波动及预测方向开展研究。研究对象可以分为单变量时间序列分析和多变量时间序列分析,大多数学者以单变量时间序列为研究对象,如,李翔等人采用单变量状态空间法构建电力需求模型,利用单变量状态法分析我国电力需求周期情况[108];曹鲁东以2009年1月到2012年12月期间的48期月度卷烟需求数据为研究对象采用季节性时间序列分析方法构建卷烟需求模型[109]。玉米市场价格及影响玉米市场价格的多种因素数据是一组连续的、存在交叉影响的多元时间序列数据集,且每日的价格数据具有前后相关性的特点,即今日的价格可能与昨天甚至前天的价格相关。要想实现对玉米市场的模式发现,需要同时对多元数据集进行分割和聚类,因为分割出来的多个片段可能属于同一个类,如图4-1所示,这比传统的时间序列分割更加困难,传统的时间序列聚类算法难以关注多变量之间的相关性,且聚类结果没有一个合理解释的标准,与高斯混合模型和动态时间规整等几种最先进的聚类算法相比,TICC方法在进行多变量时间序列聚类时具有较高的精度,而且在可扩展性和可解释性方面显著优于传统的聚类方法。图4-1TICC时间序列聚类算法与传统分割算法的比较因此,根据玉米市场价格及影响因素的价格数据具有连续性、时间相关性且多变量之间会相互影响的特点,结合TICC方法在识别和预测多元、非平稳农产品数据集中的精确和可解释结构方面的有效性和可靠性,本文采用TICC方法挖掘玉米市场价格波动模式,本文以黑龙江省玉米市场价格为因变量,使用TICC对玉米市场价格的波动规律进行分析,从5个影响玉米市场价格的指标的时间序列中寻找出价格模式,即玉米市场价格波动模式发现。该算法以玉米市场价格及其影响因素的多元时间序列数据集作为输入,利用马尔科夫随机场描述各因素之间的相互依赖关系,同时分割和聚类玉米市场价格数据集,输出玉米市场价格各时间戳对应的模式。1.2TICC算法本章将构建一个玉米市场价格波动模式发现模型,由于多元价格数据具有连续性、时间相关性且多变量之间相互影响的特点,因此,在寻找玉米市场模式的过程中,需要同时聚类和分割多维数据集。传统的时间序列聚类算法并未考虑玉米市场价格多变量之间的相关性,且聚类结果没有一个合理解释的标准。而TICC算法致力于多变量时间序列数据的聚类,并能解决其他聚类方法无法对各模式进行解释分析的缺点。与传统的聚类方法相比,基于托普利兹逆协方差的聚类算法是一种新型的基于模型的多变量时间序列聚类方法,能够在较长的时间序列数据中发现精确的、可解释的结构。TICC算法使用不同的马尔可夫随机场(MarkovRandomField,MRF)来定义不同的类,并应用期望最大化(ExpectationMaximization,EM)算法和交替最小化来解决在多维时间序列数据中同时分割和聚类的问题。1.2.1相关符号的定义时间序列是一段连续时间域上数据序列集合,为了便于表示,本文将原始的具有个时间戳的数据集合用表示,其中是第个多元观测值。由于数据的连续性及前后数据的相关性,TICC模型不单独研究某时间的数据,而是截取了一个长度为的子序列,,其中,长度为一个固定的时间窗。为了便于保持一致,仍然以表示序列。TICC算法可以将这些观测值聚集成个簇或类,其中第个簇的观测值集记为QUOTEPj,j=1,2,3,⋯k,。此外,通过高斯逆协方差QUOTEΘϵRnw×nw定义了一个马尔可夫随机场来分析每个类,更好地描述该类中不同变量之间的相互依赖关系。QUOTEΘi由w个子矩阵组成,每个子矩阵大小都是n*n,因此,可以用一个分块的Toeplitz矩阵表示(托普利兹矩阵是指主对角线上的元素相等且平行于主对角线的线上的元素也相等的矩阵):TICC算法通过依次解决两个关键问题来实现多元时间序列数据的同时聚类和分割,即:(1)分配数据点到类,这里将使用维特比算法来实现动态规划;(2)更新各类参数,这里将使用交替方向乘子法(AlternatingDirectionMethodofMultipliers,ADMM)来解决托普利兹矩阵Lasso问题。1.2.2算法基础(1)期望最大化期望最大化算法是一种用于计算特殊概率模型的最大似然解的技术,这种概率模型通常具有潜在的变量,即给定一个模型,其中各变量的观测值都由表示,所有潜在的(未知的)变量都用表示,用参数集描述系统的联合概率分布。EM算法的目的是使给定下的似然函数最大化,即:(4-1)在大多数情况下,最大化是一个复杂的问题,因为封闭形式的解往往是无法实现的,因此,在潜在变量上定义一个通用分布能简化算法,简化为:(4-2)(4-3)(4-4)其中,是与后验分布之间的相对熵(又被称为Kullback-Leiber散度),是的分布函数。EM算法是求最大似然解的两阶段优化方法。在E阶段中,公式4-3中的是固定时在上的最大值。由于不取决于,所以当Kullback-Leiber距离消失时,即当等于时,即可求出这个最大值问题的解。在随后的M阶段中,固定分布和以获得新的即。然后进行迭代操作。注意这里M步骤中最大值是完全数据可能性的期望值,导致增加,因此,对数似然函数会增加并最终收敛到它的最大值。(2)维特比算法维特比算法就是一种特殊的动态规划算法,可以准确地查找最有可能的维特比路径。因此,如果将时间序列中的点分配到不同的类的过程看成是动态规划问题,就可以使用维特比算法来进行求解。图4-2展示了将点分配到类问题的可视化过程,给定一个值,个观测值有种可能路径。QUOTElt,j表示时间的观测值分配给聚类的对数可能性。如果一个观测值被分配到与前一个观测值相同的类中,则不应用惩罚函数,否则将添加参数作为权重。图4-2将点分配到类问题的可视化过程基于期望最大化中E阶段的参数估计,可以计算出每一个多变量观测值的可能性QUOTElt,k。(3)Lasso算法在以往的统计建模过程中,人们往往会尽可能选择多样的自变量以提高模型的解释性和预测精度,然而在实际的建模过程中,变量越多越有可能造成交叉影响的问题,因此,如何选择适当、适量的变量是每个实验设计的重点,如何最大化的体现每个变量的特点也是建模的难点。Lasso(Leastabsoluteshrinkageandselectionoperator)算法的提出就是为了解决这一难题,Lasso被定义为一种压缩估计,它通过给某个变量施加一个惩罚函数来控制变量作用的大小,使得模型整体更为简练,一些系数得到了压缩。这种对部分变量的惩罚函数控制不仅能保留子集的优点,还使模型整体能有效处理复共线性数据的估计问题。Lasso的基本思路如下:在给定(即回归系数的绝对之值和小于一个定值)的条件下,求残差平方和最小的回归系数的估计值。此处,还可以写成等价形式:QUOTE∥y-Xβ∥2+λ∥β∥1,此公式也被称为型的Lasso回归。对于上述这种不等式问题的求解,主流方法是由0开始等距地增加的值,然后对求限制条件为等号时回归系数的估计值,从而求出一系列以的值为横轴的回归系数的估计值,该过程称为Lassoestimation。可计算此算法的时间复杂度为,其中为迭代次数为一次遍历需要所需要的时间。该算法的优点有:1)算法将回归的算法运用到极大似然估计上,使得算法过程更加简单、容易理解、便于实现,而且回归逼近速度较快。2)算法中的迭代过程可以利用原始矩阵的特殊稀疏结构,从而保持逆协方差矩阵的稀疏结构,这为分析数据的相关性提供了很好的条件。3)该算法在数据量大的情况下会有很好的表现,算法的收敛精度可以控制,算法的迭代次数可以自主设定,这使得算法在不同的条件下都可以使用。4)利用Lasso算法做回归的过程中,不会由于变量的选择问题,降低模型的精度率。(4)交替方向乘子法基于交替方向乘子法的分布式算法ADMM方法提出的目的是为了更好地实现可分离凸优化,该算法将对偶上升算法和多乘子算法相结合,因此能够充分利用目标函数的可分解性,对多个变量进行交替优化,从而解决具有等式约束的两个变量的目标函数最小化问题,目前ADMM己经被广泛地应用到机器学习和数据挖掘等领域。具体而言,ADMM主要解决如下形式的凸优化问题:(4-5)其中,和是两个需要优化的变量,和两个函数都是凸函数,和是等式约束的参数。如式4-5所示,目标函数关于两个变量和是可以分解的,因此,ADMM将原问题分解成两个子问题,然后对两个子问题同时进行交替优化,直到获得原问题的最优解。因此,4-5式的最优解可以用以下形式表示:(4-6)对于此类方程,一般解法是引入新的变量,比如可以采用增广拉格朗日方法对公式4-5进行求解,这里给出增广拉格朗日函数的表达式如4-7所示:(4-7)其中是对偶变量,是惩罚参数。该算法主要包括三个子问题,即的最小化问题、的最小化问题和的更新问题。另外,ADMM还可以通过缩放增广拉格朗日函数中的值,将函数中的线性项和二次项合并起来,使得目标函数得到简化,故4-7可以改写为:(4-8)其中。可以看出,缩放后的增广拉格朗日目标函数4-8与4-7是等价的,但公式更加简练,求解也更加方便。不同于多乘子法需要对问题4-8中的和两个变量进行同步优化,如下所示:(4-9)(4-10)ADMM在每次迭代的过程中,都会分两步完成优化:第一,分别对两个子问题进行局部交替优化,第二,更新对偶变量。因此,ADMM算法的步骤可以用如下公式进行表示:(4-11)一般来说,使ADMM算法达到收敛性必须同时具备两个条件:两个子问题和必须是实数函数、下半连续凸函数;函数4-7需要存在鞍点。假设条件(1)可以保证最小化问题、最小化问题都是可解决的,即存在变量和能够最小化其増广拉格朗日函数。假设条件(1)允许和两个函数是不可微的。假设条件(2)则意味着对于任意的、和,存在满足:(4-12)这使即问题4-5的解,并且满足,同时,是最优对偶解,定义残差可以表示为:。基于假设条件(1)和(2),ADMM的迭代满足以下几点:(1)残差的收敛。当迭代次数趋于无穷,残差会逐渐趋于0;(2)目标函数的收敛。当迭代次数趋于无穷,,ADMM算法的迭代可以得到最优解;(3)对偶变量的收敛。当迭代次数趋于无穷,,其中就是对偶变量的最优解。可见,只有同时满足两个假设条件,才能用最优性条件来分析残差约束、目标函数和对偶函数的收敛性。1.2.3模型框架1)分配数据点到类已知给定,分配数据点到某一集群的代价可以用以下负对数似然函数来表示:(4-13)此外,考虑到每日玉米市场价格数据前后的相关性及连续性,当相邻数据不属于同一类时,我们将施加一个平滑惩罚参数:(4-14)这就构成了一个典型的流水线调度问题,可以采用前文提到的动态规划算法进行有效地求解。动态规划是一种强大的技术,其基本思想是将一个复杂难解的公式分解成几个较为简单的子问题,然后对每个问题分别进行计算,从而降低整体问题的难度。另外,通常使用较为简单的数据结构来存储子问题的解决方案,比如数组、映射等,这可以减少运行内存,加快运行的速度。该算法的核心在于在分配第个观测值时只需考虑第i个观测值的代价,算法的伪代码如表4-所示:表4-1基于高斯图模型的Lasso算法算法1分配数据点到类1:给定参数2:初始化PrevCost=listofKzeros.3:CurrCost=listofKzeros.4:PrevPath=listofKemptylists.5:CurrPath=listofKemptylists.6:对每一个i=1,⋯,T做如下运算:7:对于每一个j=1,⋯,K做如下运算:8:MinIndex=indexofminimumvalueofPrevCost.9:如果PrevCost[MinIndex]PrevCost[j],那么:10:CurrCost[j]=PrevCost[j]11:CurrPath[j]=PrevPath[j].append[j].12:否则13:CurrCost[j]=PrevCost[minIndex]14:CurrPath[j]=PrevPath[minIndex].append[j].15:定义PrevCost=CurrCost.16:PrevPath=CurrPath.17:FinalMinIndex=indexofminimumvalueofCurrCost.18:FinalPath=CurrPath[FinalMinIndex].19:返回FinalPath.(2)更新聚类参数一旦某个时间点的价格数据值被分到某类中,我们可以通过求其最小化负对数似然函数来更新每个类的逆协方差,可以写成:(4-15)由于是独立于的,因此上式可以改写为它的等价形式:(4-16)其中||表示集群中的元素数量。类似地,可以被重写成迹的形式:(4-17)其中为由计算得来的协方差矩阵。为表征每个类的MRF的稀疏程度,添加另一个正则化参数:(4-18)其中为权重矩阵,为矩阵乘法,为对称的块状Toeplitz矩阵。为了提高更新参数的效率,可以将问题进行转化,通过使用1.2.2(4)中介绍的交替方向乘子法(ADMM)来实现这一思想,这是一种分布式凸优化方法,在大规模优化任务中表现良好。(4-19)其中为Toeplitz矩阵。表4-2更新聚类参数算法2更新参数1:初始化Clusterparameters;clusterassignmentsP.2:重复迭代3:E-step:Assignpointstoclusters→P.4:终止条件:收敛返回(,P)1.3玉米价格的模式发现模型基于TICC算法的玉米市场价格波动模式发现模型的主要结构如图4-3所示,首先,爬取玉米市场价格及其影响因素的数据,然后,采用标准化方法去量纲化,再然后,交替执行期望最大化算法的E步骤、M步骤,直到点到类的分配固定,期间采用维特比算法验证是否需要加入惩罚函数;其次,采用Lossa算法获得逆协方差矩阵,最后,使用ADMM算法得到每个时间戳对应的类序列,得到四种模式的玉米市场价格波动情况和每类模式的解释性矩阵。图4-3基于TICC算法的玉米市场价格波动模式发现模型为了更好地描述四种模式的具体特点,本文引进经济周期理论,并结合中介中心性得分情况,定义模式1代表繁荣的市场状态、模式2为衰退状态、模式3为萧条状态、模式4为经济复苏状态。1.4玉米日价格的模式发现实证本文选取2019年1月1日至2020年6月30日黑龙江省玉米市场价格为因变量,以黑龙江省小麦市场价格、黑龙江省外三元价格、黑龙江省肉鸡价格、原油期货结算价、乙醇期货结算价为自变量。为了避免不同量纲对于玉米市场价格的影响程度不同,采用最大最小归一化做去量纲化处理。然后,以标准化后数据为输入,采用TICC算法挖掘玉米市场价格波动模式。1.1.1数据准备本文采用最大最小归一化对原始数据标准化处理,部分数据标准化结果如表4-3所示。表4-3标准化后部分数据表日期小麦市场价格外三元肉鸡价格原油乙醇期货2019/1/10.470.020.090.720.862019/1/20.740.020.090.290.422019/1/30.750.020.090.820.892019/1/40.660.020.090.190.062019/1/50.640.010.090.70.672019/1/60.690.010.090.760.712019/1/70.7500.090.830.872019/1/80.2600.60.750.682019/1/90.260.010.60.750.732019/1/100.690.010.60.30.392019/1/110.650.010.260.950.632019/1/120.790.010.260.790.612019/1/130.510.030.530.70.772019/1/140.520.030.530.710.762019/1/150.520.030.530.710.762019/1/160.590.030.530.780.772019/1/170.540.040.530.390.42019/1/180.410.040.530.40.532019/1/190.410.030.530.760.82019/1/200.590.030.530.450.361.1.2模型参数设置模型包括输入、迭代聚类和输出三部分组成。参数的选择采用贝叶斯信息准则加以确定模式个数,当=4,=3时,效果最佳。因此,输入部分将窗口大小设置为3,类数量设置为4,将原始的5×547的数据矩阵标准化处理后,以csv文件的形式导入。将每个时间戳对应的类序列和各模式的定义矩阵分别以csv和txt文件的形式输出。1.1.3结果展示玉米市场价格波动模式发现结果与各模式中各因素的内在联系加以解释。(1)玉米市场价格波动模式发现2019年1月1日至2020年6月30日黑龙江省玉米市场价格为因变量,以黑龙江省小麦市场价格、黑龙江省外三元价格、黑龙江省肉鸡价格、原油期货结算价、乙醇期货结算价为自变量的玉米市场价格模式发现的结果,如图4-4所示,其中每条曲线各代表一个图4-4玉米市场价格波动模式发现图因素价格变化数据,按图例顺序所示分别为小麦收购价格、外三元猪肉价格、肉鸡价格、原油期货价格、乙醇期货价格。结果表明TICC的聚类结果将整个时间轴分为5段,其中2019年1月1日至2019年7月23日属于模式1;2019年7月24日至2019年12月9日和2020年02月05日至2020年03月17日属于模式2;2019年12月10日至2020年02月04日属于模式3;2020年03月17日至2020年06月30日属于模式4。因此,从长时间来看,玉米市场价格波动可被看成四种模式的重复。(2)玉米市场价格波动模式解释TICC将使用一个分块的、对称的托普利兹矩阵来定义每个簇或类,该矩阵用来表示该类中各变量之间的条件独立性结构,每个类的定义矩阵可能有较大的差异,是TICC算法用来聚类的标准,因此,分析其定义矩阵能更好地解释各模式的含义、讨论各变量之间的关系。本文使用表示第i个模式的定义矩阵。第1个模式具体分析结果如下:定义矩阵由3×3(时间间隔w=3)个子矩阵组成,每个子矩阵的大小都是5×5(变量数量n=5)。子块表示在某时间戳上各变量间的相关关系,表示在某时间戳时变量与变量之间的相关关系;子块表示各变量在时间和时间之间的相关性结构,表示变量和变量在时间和间的相关性;子块表示各变量时间和时间之间的相关性结构,表示变量和变量在时间和间的相关性。根据模式1托普利兹矩阵可知,模式1中对角线上的值分别为6.354、2.394、3.076、1.105和8.209,表示在模式1中各变量的自相关程度排序为因子5、1、4、3、2(分别为乙醇期货价格、小麦收购价格、原油期货价格、肉鸡价格、外三元猪肉价格)。对角线上各变量的自相关系数代表了不同的变量对于玉米市场价格的影响程度不同,通过数值比较,可以得到在模式1中乙醇期货价格对玉米市场价格的影响程度最大为8.209;外三元猪肉价格的影响最小为2.394。相比于其他模式,模式1的对角线的数值差距较小,说明该模式各变量对玉米市场价格波动的影响较为平稳。另外,和表示该模式中的变量2与变量1、3有较为明显的关系,切均为负向关系,其次,也可以看出变量1和变量2的关系更为密切,说明变量4和变量5对玉米市场价格的影响是负向的。第2个模式具体分析结果如下:根据模式2托普利兹矩阵可以看出,模式2中矩阵各变量及自相关程度数值为分别为小麦收购价格、外三元猪肉价格、肉鸡价格、原油期货价格、乙醇期货价格,对应的系数是8.541、1.247、3.582、0.64、8.586,其中,原油期货价格的自相关程度是最小的,对应的系数为0.64,最高的乙醇期货价格,对应的自相关系数达到8.586,两者的自相关性相差较大,说明乙醇期货价格对玉米市场价格的影响程度远高于原油期货价格,而且两者的自相关程度在这四种模式中相差最大,此时的市场并不稳定。此外,和表示该模式中的变量4与变量2、3存在相互影响,切均为负向关系,但通过观察数值发现相互影响的关系并不密切。第3个模式具体分析结果如下:根据模式3托普利兹矩阵可以看出,模式3中小麦收购价格、外三元猪肉价格、肉鸡价格、原油期货价格、乙醇期货价格,对应的定义矩阵中自相关系数分别为7.354、8.518、3.781、1.476、1.618,此时对玉米市场价格影响程度最大的是外三元猪肉价格,影响程度最小的是乙醇期货价格。矩阵表示该模式中的变量4与变量3存在相互影响,但关系并不密切。第4个模式具体分析结果如下:根据模式4托普利兹矩阵可以看出,模式4的各变量顺序为小麦收购价格、外三元猪肉价格、肉鸡价格、原油期货价格、乙醇期货价格,对应的自相关系数依次为8.071、3.339、2.928、1.396、8.586,此时乙醇期货价格对玉米市场价格的影响程度最大,外三元猪肉价格和肉鸡价格对玉米市场价格的影响比较接近。此外,,对应的不同变量间存在相互关系。为了更直观地展示出各模式中各变量之间的区别,将定义矩阵用图结构进行表示,如图4-5所示。由于实验中w设置为3,故每个定义矩阵的图结构有三层,不同层用不同的颜色绘制;由于实验中变量数目为5,故每层图层中都有5个节点,用白色小圆圈表示。图中用直线连接的两个节点表示,在同一时间戳中,两节点存在相关性,虚线连接的两个节点表示两个变量在所处的时间间隔中存在相互关系,无连线的节点则表示该两个节点之间的相关性为0。图4-5各模式可视化结构图从图4-5可以看出,4个模式之间有显著的区别,其中模式1、2、3、4中实线数量分别为3条、2条、1条、4条,实线数量越多,各变量之间的相关关系越复杂,可知模式4中各变量之间的相关关系较为复杂;另外模式1、4中的虚线数量也明显多于其他模式,可见这两个模式中各变量受时间相关性的影响也最为明显;再考虑各层次之间的关系,可以看出在各模式中,第1层和第2层之间的相关性最为密集,即时间t与时间t+1变量相关程度要高于时间t+2,这一现象也正符合农产品市场价格具有时间相关性的特点。1.1.4结果分析与验证本文从经济周期理论和中介中心性两方面分析各个模式。(1)经济周期理论为了分析黑龙江省玉米市场价格波动的4种模式,本文采用经济周期理论分析方法。经济活动中景气与萧条之间周期性波动的现象称为经济周期,一个经济周期通常会经历繁荣、衰退、萧条和复苏四个阶段。以此说明玉米市场经济也同样经历周期,特别是当经济开始衰退时,大宗商品价格下跌,市场需求下降,相应地,玉米市场价格也会发生变化;当经济达到繁荣时,价格上涨,生产又会迅速增加,玉米市场价格也会变化。因此,本文尝试使用经济周期理论来解释黑龙江省玉米市场价格的波动模式。(2)中介中心性本文采用托普利兹矩阵表现相关节点之间的关系,因此可以使用复杂网络的相关理论进行分析,本节引入复杂网络分析中的中介中心性来确定网络中每个节点的“相对重要性”。复杂网络是是具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的呈现高度复杂性的网络。中介中心性(BetweenCentrality)是在网络分析中描述节点中心度最直接、简便的方法,它通过计算一个复杂网络中经过某个节点并连接两点的最短路径数目与这两点之间的最短路径之比来刻画该节点的重要性。中介中心性的计算分为三步:(1)计算网络中所有两两节点之间的最短路径的数量和最短路径的长度;(2)依次选定某个节点,计算通过该节点并连接两点的最短路径数;(3)用(2)得到的数值与(1)的数值做比,就可以得到各节点的中介中心性。四种模式的中介中心性如表4-4所示。表4-4四种模式中各因素的中介中心性得分小麦市场价格外三元价格肉鸡价格原油期货价格乙醇期货模式112.9920.995.04511.54529.415模式23.9955.265003.9875模式31.9756.5700模式42.631.1851.4352.636.115采用经济周期理论和中介中心性分析玉米市场价格波动的4个模式,以解释各个模式玉米市场价格波动状态。复杂网络分析中中介中心性来确定网络中每个节点的“相对重要性”。从表4-4可以看出,模式1中各因素得分在四种模式中是最为均匀的,该模式下各因素中介中心性得分由大到小排序分别为乙醇期货价格、外三元价格、小麦价格、原油期货价格、肉鸡价格,即图4-6模式1中玉米市场价格及其影响因素价格变化趋势图此时乙醇期货价格的“相对重要性”程度最大,也就是说乙醇期货价格对玉米市场价格波动情况的影响最大。根据图4-6可以看出,该阶段乙醇期货价格处于波动上升状态,乙醇供应集中在东北,现货乙醇价格的增长导致乙醇期货价格上涨,进而影响作为原材料的玉米价格上涨;而作为“相对重要性”第二大的小麦市场价格从图4-6也可以看出,它的价格大幅度波动,随着小麦市场的不稳定,市场在小麦市场价格虚高的时候,会选择它的替代品玉米,这也导致玉米市场价格的增长;在多因素的共同影响下,该阶段玉米市场正处于一个上升的态势,市场一片繁荣景象,因此可以判断此时的玉米市场在这五种因素的协同作用下正处于较为繁荣的阶段。模式2中五个因素得分差异较大,三个非零得分的变量由大到小排序分别是外三元价格、小麦市场价格、乙醇期货价格,三个变量的得分相差不大,两个零分得分分别是肉鸡价格和原油期货价格,即当前模式不会受到肉鸡价格和原油期货价格的影响,这会使得玉米市场价格波动非常不稳定。如图4-7所示,虽然理论上外三元价格上涨会影响作为猪饲料原料之一的玉米,导致它的价格增长,但是影响玉米价格的是多种因素,从图4-7可以看出,小麦市场价格处于大幅度波动情况,且价格低的情况出现较多,这种情况下,小麦替代品的玉米价格就会下降,而且乙醇期货的价格在市场持续走低,作为乙醇原材料之一的玉米市场价格势必会被波及到,导致玉米市场价格下降,总之在多重因素的影响下,玉米市场价格波动较为明显,且波动幅度较大,是市场由盛转衰的过渡阶段。因此,可以预计这个模式表现了正处于衰退状态的玉米市场。图4-7模式2的各变量价格序列图模式3是4个模式中唯一乙醇期货与原油期货的“相对重要性”均为0的市场状态,肉鸡价格和外三元猪肉的“相对重要性”大,小麦市场价格的影响比较小,与模式2相似的是,由于乙醇期货和原油期货的中介中心性得分均为0,此时的市场也处于不稳定的状态;经过模式2超过两个季度的持续衰退,市场的活力大不如前,小麦价格持续波动,市场中玉米的竞争力不如小麦,反映到价格上就是玉米的市场价格在逐渐下降。外三元猪肉价格稳定,作为猪饲料的玉米稳定供应即可,它对玉米市场价格的影响程度不变,该模式的持续时间较短;通过观察图4-8,可以得到玉米市场价格整体向下波动,根据经济周期理论,该模式说明市场处于萧条的状态。图4-8模式3的各变量价格序列图图4-9模式4的各变量价格序列图模式4五个因素得分差异不是很大,其中“相对重要性”最大的是乙醇期货价格,也就是说通过定义矩阵与中介中心性得分得到的乙醇期货价格对玉米市场价格的影响程度都是最大的,通过观察图4-9,可以看出乙醇期货市场的价格在持续的稳定上涨,乙醇现货需求量增加,作为乙醇原材料的玉米需求量肯定也会增加,玉米市场价格也就“水涨船高”了;小麦市场价格和原油期货价格的中介中心性都位于第二位,小麦价格波动导致市场将需求倒向玉米,原油期货价格的上涨也导致作为原材料的玉米市场价格的上涨;外三元猪肉价格与鸡肉价格的“相对重要性”相近,也对应了定义矩阵得到的结果;从图4-9可以看出,当前玉米市场价格在这些变量的相互作用下是稳步上升的时期,因此模式4表现出玉米市场正处于在较为平缓的经济复苏时期。综上,模式1代表繁荣的市场状态、模式2为衰退状态、模式3为萧条、模式4为经济复苏状态,以此来解释各类是具有可信度的,模型与黑龙江省玉米市场的实际情况吻合较好。1.5玉米周价格的模式发现实证本文选取2019年1月1日至2020年6月30日玉米市场价格、小麦市场价格、外三元价格、肉鸡价格、原油期货结算价、乙醇期货结算价的79周价格波动数据,为了避免不同量纲对于玉米市场价格的影响程度不同,对79组玉米市场周价格波动数据进行去量纲化,本文采用最大最小归一化的方式使原始数据标准化;将标准化后的579的数据矩阵分别以csv的形式导入TICC算法中,得到每个时间戳对应的类序列和各模式的定义矩阵。通过对原始的多元时间序列数据与聚类结果进行可视化对比,得到了玉米市场价格波动的四种模式;与玉米市场日价格波动模型实证方法相似,通过中介中心性得分情况解释黑龙江省玉米市场价格波动的各个模式。最后,绘制玉米市场价格趋势变化图,与四个模式进行对比,验证本模型的可靠性。1.5.1数据准备本文采用最大最小归一化对原始数据进行标准化处理,部分数据标准化结果如表4-5所示。表4-5标准化后的部分数据集日期小麦市场价格外三元肉鸡价格原油乙醇期货2019/1/10.610.060.730.760.552019/1/80.610.170.70.780.612019/1/150.610.190.690.830.632019/1/220.580.230.690.860.642019/1/290.570.250.620.850.652019/2/50.680.250.60.880.662019/2/120.800.240.590.890.752019/2/190.790.240.600.930.642019/2/260.540.230.400.960.642019/3/50.860.230.191.000.632019/3/120.670.230.260.950.642019/3/190.760.230.390.960.622019/3/260.920.220.520.930.682019/4/21.000.220.590.800.822019/4/90.970.210.600.770.892019/4/160.870.200.590.831.002019/4/230.860.200.600.880.952019/4/300.770.210.400.920.702019/5/71.000.220.190.910.622019/5/140.840.220.380.810.641.5.2模型参数设置本节仍使用贝叶斯信息准则确定模式个数,结果当=4,=3时,实验效果最佳。因此,输入部分将窗口大小设置为3,类数量设置为4,将原始的5×79的数据矩阵标准化处理后,以csv文件的形式导入。将每个时间戳对应的类序列和各模式的定义矩阵分别以csv和txt文件的形式输出。1.5.3结果展示在此,说明玉米市场价格波动模式发现结果并解释各模式中各因素的内在联系。(1)玉米市场价格波动模式发现2019年1月1日至2020年6月30日黑龙江省的玉米市场价格为因变量,以黑龙江省小麦市场价格、黑龙江省外三元价格、黑龙江省肉鸡价格、原油期货结算价、乙醇期货结算价为自变量的玉米图4-10多元时间序列数据和聚类结果图市场价格模式发现的结果,如图4-10所示,其中每条曲线各代表一组原始的时间序列数据,按图例顺序所示分别为小麦市场价格、外三元猪肉价格、肉鸡价格、原油期货价格、乙醇期货价格。TICC的聚类结果将整个时间轴分为5段,其中第2段(2019年7月24日至2019年12月9日)和第4段(2020年2月5日至2020年3月17日)属于同一模式。因此,本文可以认为,玉米市场在这段时间轴上可被分为四种可重复的模式。(2)玉米市场价格波动模式解释通过分析其定义矩阵能更好地解释各模式的含义、讨论各变量之间的关系。本文使用表示第i个模式的定义矩阵。第1个模式具体分析结果如下:根据模式1的托普利兹矩阵可知,模式1中上小麦收购价格、外三元猪肉价格、鸡肉价格、原油期货价格、乙醇期货价格的自相关程度值分别为8.619、6.605、3.446、3.13、8.569,不同变量的自相关程度差异不大;对角线上各变量的自相关系数代表了不同的变量对于玉米市场价格的影响程度不同,通过数值比较,可以得到在模式1中乙醇期货价格对玉米市场价格的影响程度最大,达到了8.569;原油期货价格的影响最小,为3.13。相比于其他模式,模式一的对角线的数值差距较小,说明该模式各变量对玉米市场价格波动的影响较为平稳。、表示该模式中的变量4与变量2、3有相互关系。第2个模式具体分析结果如下:分析模式2的托普利兹矩阵可以看出,矩阵中各变量的自相关系数分别为8.890、5.477、3.954、0.035、8.792,对应的各变量分别为小麦收购价格、外三元猪肉价格、鸡肉价格、原油期货价格、乙醇期货价格,相比于其他模式,该模式的各变量自相关程度较低,尤其是原油期货价格对玉米市场价格的影响最低,为0.03;此外,、、表明变量4与变量2、变量3、变量5都存在相互关系。第3个模式具体分析结果如下:根据模式3的托普利兹矩阵可以看出,模式3中定义矩阵的各变量自相关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论