【《生猪价格预测研究的相关基本理论基础》6900字】_第1页
【《生猪价格预测研究的相关基本理论基础》6900字】_第2页
【《生猪价格预测研究的相关基本理论基础》6900字】_第3页
【《生猪价格预测研究的相关基本理论基础》6900字】_第4页
【《生猪价格预测研究的相关基本理论基础》6900字】_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生猪价格预测研究的相关基本理论基础目录TOC\o"1-3"\h\u27377生猪价格预测研究的相关基本理论基础 1105921.1生猪市场与价格 1286801.2价格波动 2208331.3时间序列波动度量方法及平稳性检验 371241.3.1速度法 314591.3.2X-12季节调整法 4282561.3.3趋势分解法 5316621.3.5变异率 538921.4区域划分 6117811.5聚类算法 7251771.6循环神经网络 111.1生猪市场与价格市场一词起源较早,一开始指买卖双方的交易地点,发展到现在指所有的交易行为总称,不仅指交易场所,它还囊括了全部的交易行为。商品市场是为生产者、销售者、需求者三方提供商品的交换地点、交换时间以及其它服务的场所[52-54]。在古时候,人类便已经学会使用货币来换取商品,货币作为一种等价物品,是一种特殊的商品,指用于支付商品劳务和清偿债务的物品,在宏观经济学中,货币不仅是指现金,而是现金加上一部分有形和无形的资产,但是在日常的市场中,人们用于交易的货币就是钱。而价格是用来衡量商品值多少货币,也就是说,价格是商品价值的体现,是商品在交易过程中最终的转化形式[55]。根据上述定义,可以得知生猪市场的定义,即以生猪产品为交易对象的商品市场。在生猪市场中主要包括生猪的供应方、生猪的需求方,而生猪的价值用价格来衡量。纵观全球各国,我国猪肉的消费量与生产量均位于世界首位,可见我国的猪产业经济在我国经济上的比重之大,这主要是由于我国的人口众多,而农村人口占据全国人口的一半左右,据可靠资料显示,2005年我国农民人数占比为63.76%,到2017年我国农民人口数量为57661万,占比为41.48%,虽然农民人口逐渐向城市化转变,但是仍然占有很大的比例,而我国大多数农民以养猪业为主要经济来源,因此生猪市场的动荡会严重损害我国绝大多数农民的利益,进而影响我国整个经济市场。而生猪市场的动荡就表现为生猪价格的波动,当市场中生猪的产销量失衡,生猪价格就会出现忽上忽下的波动,研究生猪价格的波动是稳定生猪市场的重要手段。从我国一些猪价格统计网站以及先前学者的研究成果中可知在我国用于研究的猪价格数据有多种,包括白条猪肉价格、仔猪价格以及生猪价格等,其中白条猪肉价格是指仅仅去除内脏、头脚等部位后没有经过其它任何加工的猪肉价格,仔猪价格是指从刚出生到30公斤左右的猪的价格,与猪肉价格及生猪价格论斤销售不同,一般来说仔猪价格是论头销售,而生猪价格是指生猪达到出栏标准用于屠宰进入市场的猪价格,对于这三种价格可以说生猪价格主要决定了白条猪肉的价格,而仔猪价格则是影响生猪价格的一小部分原因,对于整个猪肉市场来说,生猪价格的稳定性直接决定整个猪肉市场的稳定性。在以往对我国猪肉市场的研究中,多数专家也是以生猪价格作为研究对象对猪肉市场的波动进行研究。本文充分考虑研究效果并吸取以往学者的研究经验,选择生猪价格数据为研究对象,区别于所提到的白条猪肉价格与仔猪价格。利用生猪价格数据对我国生猪市场波动状态进行分析,能够得出更准确的结论,从而为稳定我国生猪及猪肉市场的供需平衡提出合理的建议。1.2价格波动波动(Fluctuation)一词是来自于物理学,用来描述物质的运动,详细地说,是指某物体在自主运动和受到外界冲击时,在一定时间和空间上表现出一种有规律的上下反复的运动状态,属于一种能量传递方式,它和物体运动的周期性有紧密的关系,运动一般伴随着周期性。其中,周期(Cycle)一词也属于物理名词,主要是一个时间概念,指物体从初始状态运动到相似状态所经历的时间间隔[56-58]。而价格本身围绕价值波动,从短期来看总是趋近于其本身所代表的价值,这是由价值规律所决定。在经济市场中,价格的波动使得生产者难以对市场做出正确的预期,进而做出错误的生产决策,使得下一时间段的产品供需量失衡,如此恶性循环下去,使经济难于处于平稳的状态,从而影响到整个国家的经济市场,研究价格的波动不但可以使生产者掌握一般情况下产品价格的波动规律,而且对于特殊因素影响下的价格波动,也能给出相对具有科学依据的建议,并且能够为政府稳定经济市场提供可行的指导。生猪价格是生猪内在价值的一种货币表现形式,一般而言,由生产生猪所消耗的社会必要劳动时间决定。但由于生猪生产过程的自身特征、疫病的大规模暴发以及政府的调控等综合因素的冲击下,生猪价格变得异常敏感,会呈现出大幅度或者小范围的波动情况,生猪价格上涨到一定程度开始下跌,下跌到一定程度又开始上涨,呈现出明显的周期性。详细地讲,我国生猪市场的波动的原因主要包括内在因素和外在冲击两大部分[11][59-60]。内在因素主要是指生猪市场本身的自我调节能力,而外部冲击就是指环境、政策等外部干扰。一般来讲,内部因素影响生猪价格波动的持续时间,而外部的冲击则会导致波动幅度增大。1.3时间序列波动度量方法及平稳性检验时间序列数据的波动性是经济领域最典型的特征,它衡量的是价格在某一特定时间段的波动情况,研究波动情况有利于掌握市场变化,并且通过分析波动的原因能够在一定程度上干扰市场,使其往好的方向发展。以往的研究中对时间序列波动性进行度量运用到的技术有很多,根据本文数据为各省的生猪价格时间序列的特点,这里依次利用环比增长率、X-12季节调整法、趋势分析曲线和变异率绘制生猪价格波动曲线并进行深入讨论。依次使用这些方法是因为生猪价格时间序列具有长期性、季节性、随机波动等特点,而这些方法可以将季节性波动和随机波动剔除掉并进行平稳性检验,最后利用变异率绘制出具有明确波动规律的价格曲线。然而,由于一些时间序列数据变化较为复杂,难以找到剔除长期趋势的最好模型表达式,导致得到的波动成分不平稳,无法进行接下来的研究。因此需要选择新的模型剔除趋势项,本节接下来对所用到的有关波动度量的技术进行介绍。1.3.1速度法速度法是通过计算变量的环比增长率,然后根据增长率的波峰和波谷位置衡量经济波动强弱的一种方法,公式可以表示为:(2-1)其中,表示时刻的实际观察值,表示时刻的实际观察值,表示时刻的环比增长率。样本的平均增长率计算公式为:(2-2)样本标准差为:(2-3)公式(2-3)表示的是某变量在整个考察期内增长率与其均值的绝对偏离程度。的值越大,表示波动的绝对偏离幅度就越大;相反,的值越小,表示波动的绝对偏离幅度就越小。1.3.2X-12季节调整法在经济学中一般认为一组时间序列数据的波动过程由长期趋势(Trend)、周期性波动(Cycle)、季节性波动(Season)和不规则波动(Irregular)四个部分组成。其中,长期趋势是时间序列数据中总体的长期趋势;周期波动是时间序列数据围绕某一水平位置周期性变化;季节性波动是时间序列数据随季节变化的波动;不规则波动是由于偶然的原因造成的时间序列数据随机的波动[61]。这四个部分的相互关系可以表示以下两种不同的模型:加法形式;乘法形式。其中,为原始经济序列,为趋势项,为周期项,为季节因子,为不规则波动。由于月度时间序列数据或者季度时间序列数据的波动过程中存在月度或季度性的波动,这样便会导致无法获取经济发展中的正确、客观的规律,所以,如果研究数据为月度或季度时间序列数据时,需要对其进行季节调整从而剔除掉季节性波动与不规则波动。目前针对季节调整的方法中,X-12季节调整法运用的最多,并且在进行价格波动的研究中也更具有说服力。本文利用X-12中的加法模型对我国生猪月度价格数据进行季节调整。此模型建立在移动平均法的基础上,把原始时间序列表示为趋势循环项、季节因子以及不规则波动三部分的和。模型公式如下:(2-4)然后采用X-12季节调整法,将原始时间序列中的季节性波动和不规则波动剔除,则剩余的部分为趋势项和周期项,这时可通过趋势分解法进一步分析时间序列的趋势项和周期项。1.3.3趋势分解法趋势分解法在目前的剔除长期趋势的研究中取得了较好的应用效果。当时间序列数据为月度数据,首先用X-12季节调整法剔除季节性波动和不规则波动,只剩下趋势项和周期项,然后再运用趋势分解法剔除长期趋势,则剩下的便是时间序列的周期性波动部分,对于计算长期趋势,常采用的确定性模型有以下三种:(1)线性模型:;(2)指数模型:;(3)二次函数模型:。从目前的研究成果来看,专家学者大多是利用这三种模型分别对所研究时间序列数据做关于时间的拟合,然后根据拟合优度选取相对较好的模型剔除长期趋势,并对波动成分进行单位根检验(AugmentedDickey-Fuller,ADF),波动成分显示平稳再进行下一步波动规律分析。ADF检验是运用的最多、效果最好的一种,也称为扩充单位干检验[62-66]。ADF的假设检验为:ADF检验统计量为:(2-5)1.3.5变异率变异率(RateofVariation)即波动指数,是用来表示时间序列波动的强弱程度[67],其计算公式可表示为:(2-6)其中,表示第时刻的实际观测值;为第时刻的预测值(也称趋势值);为剔除长期趋势后经济变量的绝对变动量,即第时刻实际值对其长期趋势的绝对偏差。既反映某变量对时间趋势值的相对波动,同时又反映了某变量的稳定情况。绝对值越大,说明变量离长期时间趋势越远,稳定性越差。本文在研究生猪价格波动时充分考虑上述方法的优缺点以及本文的数据特征,将速度法、X-12季节调整法、趋势分解法以及变异率结合起来进行生猪价格的波动规律研究。首先运用增长率描述各时刻的环比增长情况,然后运用X-12季节调整法剔除原始时间序列中的季节性波动和不规则波动,基于季节调整后的序列运用趋势分解法进行趋势分解,对趋势分解后的波动成分进行ADF检验,通过平稳性检验后运用变异率对波动强度进行测量,进行波动规律研究。1.4区域划分“区域”(Region)是一个普遍的概念,在不同的学科领域有不同的理解和定义:在地理学中,区域被定义为地球表面上的一个地理单元;在经济学中,区域被定义为一个在经济上较完整的经济单元;在政治学中,区域一般被理解为国家实施管理的行政单元;在社会学中,区域被定义为具有人类某种相同社会特征的聚居社区,比如语言相同、有共同的宗教信仰、民族相同、文化无差异等。美国著名区域经济学家埃德加·胡佛把区域定义为在进行分析、制定政策以及实施管理和规划时有用的地区统一体[68,69]。区域划分,顾名思义也就是字面上的意思,详细地讲就是将一个大区域依据一定的方法与理论合理地划分成若干个小区域,通过对每个小区域的特征进行研究而得出整个大区域的所处状况,从而避免直接研究整个大区域所得到的笼统的研究结果,使得对整个大区域的研究更加精确。在以往的研究中,区域划分问题通常被定义为聚类问题[70-72],因此,本文所研究的生猪市场的区域划分也属于聚类问题。本文的目的是根据中国30个省、直辖市、自治区2003年1月-2018年7月的生猪月价格时间序列数据对中国的生猪市场进行区域划分,根据经济学上的理解,中国30个省、直辖市、自治区的生猪价格是一个大的在经济上相对完整的经济单元,而区域划分后的各个区域的生猪价格是一个小的在经济上相对完整的经济单元,通过对划分后各个区域生猪价格的分析,从而得到全国生猪价格的特征。1.5聚类算法聚类算法分为许多种类型,与分类算法这样有监督的学习技术相比其属于无监督学习范畴。聚类算法就是按照某种特定的相似性度量标准(例如一些聚类算法运用距离作为相似性度量的标准),将一个数据群体划成不同的类别或簇,从而使得同一个类别或簇内的数据子群体间的相似性尽可能大,并且不在同一个类别或簇中的数据子群体的相似性尽可能小,即差异性尽可能大。也就是说,将同一类的数据子群体尽可能聚集到一起,而不同类的数据尽量分离开。随着国内外机器学习与数据挖掘技术的快速发展,相比于传统算法,神经网络凭借其强大的非线性逼近能力,极高的计算效率等特点已经成为最热门的机器学习技术之一。大数据时代对无标签数据处理的需求也日益迫切,为了解决这方面的问题,无监督学习与神经网络的结合的研究与日俱增。二十世纪九十年代初期辛普森首先提出了一种基于超盒和模糊隶属度函数构建出来的模糊极小极大神经网络方法(FMM)[73,74]。该方法能更好地模拟人脑的实际活动取决于其创新的超盒模糊集思想,它的基本元素超盒是指多维空间中的一个子区域。例如,二维空间中的超盒为一个矩形,三维空间中的超盒为一个立方体。图2-1三维空间中的超盒模糊集理论的基本思想是通过推广经典集合中的隶属关系,从而将隶属度映射到[0,1]之间的任意值,这样就可以定量地描述事件的模糊性。在FMM中,最小点和最大点被用来定义超盒和相应的超盒模糊集的隶属函数。每个单数据点可以被视为一个最小点和最大点与其自身相等的超盒。超盒模糊集可以定义如下:其中分别是的最小点和最大点。其中表示第个超盒的隶属度函数,为第个输入模式,为输入模式维数,为维单位超盒。该网络采用在线学习的方式从而避免了传统神经网络因需要迭代而产生的一些缺陷,例如数据遗忘,内存空间不够等问题。FMM的训练过程可以总结为三个阶段:扩张,重叠检测以及收缩。随着数据的不断进入,会形成若干个超盒,超盒与超盒根据扩张规则进行扩张,由此可能会产生不必要的重叠区域影响最后结果,所以需要对重叠区域进行检测并消除。最后得到任意数目的聚类簇,并通过计算数据在现有超盒簇中的最高隶属度来实现聚类。模糊极小极大聚类神经网络中隶属度函数采用,其中,为敏感度参数。模糊极小极大聚类神经网络具体实现过程如下:第一步是初始化,超盒会被分成两组,一组是其最小和最大点仍未被调整的未调整超盒,另一组是其最小和最大点已被调整的已调整超盒。在训练之前,超盒全部视为未调整。将最小点的每个元素设置为1,将最大点的每个元素设置为0。可以确保第一个根据进行调整的超盒等于第一个输入点,即。第二步是扩张操作,当输入新的数据样本时,FMM开始创建新的超盒,并将其视为新的簇,或者根据一些规则扩张现有的超盒簇,而无需重新训练。在给定一个新的数据样本后,根据隶属度从大到小检查现有已调整超盒是否满足下面的扩张条件:其中是扩张参数,。如果有超盒满足此条件,那么该超盒的最大最小点将会被调整为:如果没有找到符合规则的超盒,则选择一个未调整的超盒,并对其执行上述操作,将其视为新的簇。第三步是重叠检测和消除重叠区域。一个模式对于不同的超盒可以有不同的隶属度,但不能同时完全隶属于多个超盒。所以,应对可能导致这种混乱的重叠区域进行检测和消除。重叠测试规则和消除重叠区域的相应收缩操作如下:情况1:如果:情况2:如果:情况3:如果且:否则:情况4:如果且:否则:重复上述三个步骤,直到所有的训练数据都已输入完毕。这样,超盒模糊集就组成了任意数目的聚类簇,剩余的数据可以通过计算数据在现有超盒中的最高隶属度来实现聚类。为了直观地理解聚类算法的训练过程,本文举了一个简单的实例。图2-3为一个简单的二维空间中训练的例子。首先输入数据,由于原始空间中不存在超盒,所以将视为最小点和最大点相等的独立超盒。接着输入第二个数据,满足超盒扩张条件所以对进行扩张形成新的超盒。输入第三个数据由于不满足扩张条件所以将视为最小点和最大点相等的独立超盒其。输入第四个数据虽然距离较近,但是此二者由于不满足扩张规则所以不能进行扩张,而与距离次近的满足了扩张条件所以对进行了扩张形成新的,。这样就产生了重叠区域,聚类算法中不可以出现这种重叠区域所以最后要使用收缩操作来对其进行消除。图2-3FMM聚类训练过程示例本文的IMEFMM聚类算法引入模糊格框架中的包容性测度来代替模糊极小极大神经网络中的隶属度函数,在模糊极小极大神经网络中使用最小点和最大值来表示超盒,在模糊格框架下将欧式空间转化为区间的形式。以此构建的IMEFMM聚类算法在第三章进行生猪价格区域划分。1.6循环神经网络时间序列问题相比于回归问题增加了输入变量之间序列依赖性,因此时间序列的预测一直以来都是一个较难的建模问题。而循环神经网络(RNN)在二十世纪后期逐渐地开始被用于处理和预测时间序列数据,且具有较好的准确率。由于RNN是一种带有循环的神经网络,允许前列的信息或数据在后列数据中保留一段时间,从而能够体现出时间序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论