【《LSTM神经网络在极端天气事件预测中的潜力与挑战(论文)》19000字】_第1页
【《LSTM神经网络在极端天气事件预测中的潜力与挑战(论文)》19000字】_第2页
【《LSTM神经网络在极端天气事件预测中的潜力与挑战(论文)》19000字】_第3页
【《LSTM神经网络在极端天气事件预测中的潜力与挑战(论文)》19000字】_第4页
【《LSTM神经网络在极端天气事件预测中的潜力与挑战(论文)》19000字】_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LSTM神经网络在极端天气事件预测中的潜力与挑战摘要的方法,并采用专门解决普通循环神经网络长时依赖问题的长短时记忆网络(LONG题,提出使用ReLU激活函数以及加入正则化手段改进等策略,通过优化后 32相关技术 42.1引言 52.2经典时间序列预测方法 52.2.1时间序列的概念 52.2.2气温时间序列预测技术和方法 62.2.3循环神经网络 82.2.4LSTM神经网络 2.3数据处理一般流程 2.4其它时间序列预测模型 2.5深度学习 2.5.1深度学习概念 2.5.2深度学习流程 2.5.3损失函数定义 2.6本章小节 3基于LSTM的气象预测模型构建 3.1数据处理 3.2LSTM气温预测模型构建 4.LSTM模型实验结果与分析 244.1模型环境搭建 4.2模型效果评估指标 4.3LSTM模型实验结果与分析 4.4滑动时间窗改进 4.5本章小结 5总结与展望 335.1总结 5.2展望 参考文献 31绪论生命危害和重大财产损失。据美国国家气候数据中心报告,2012年间,美国有超过11从中可以看出一些端倪运输部门的报告显示,24%的汽车事故是因为天气原因;天气直在国外,MaqsoodI以及KhanMR等人通过对加拿大萨斯喀彻温省南部天气预报的适用性问题的考察,提出了多层感知器MLPN网络,Elman简单递归神经ERNN网络、单层霍普菲尔德HFM模型和基于径向基函数的RBFN网络四种模型,并分别使用温度,风速和相对湿度的数据在MATLAB中进行训练和提前24小时的预测,但仅仅是对几种预测方面,Singh,等人通过对气象中提出了基于时间序列的遗传算法(GA)和神经网络相结合的综合反向传播温度预测模型(GeneticAlgorithm)技术加BP神经网络的实时温度预测模型,在这特定情况下两者都考4实验,并未涉及精细化预测方面(薛宇峰,马思敏,2021)。AznarteJL和SiebertN将四个机器学习算法,广义线性模型(generalizedlinearmodels),多变量自适应回归样条(multivariateadaptiveregressionsplines),随机森林(randomforests)和分位数随机森林估实验方法,将多任务学习线性评估的思想引入,对于进行温度预测有很好借鉴意义(李国内针对气象预测的研究总体相对滞后,但也出现了不少值得学习的成果,体现出国内专家学者们对数值天气预测问题的重视。比如黄文杰,曹鸿兴等人早在上个世纪就在长期气象预测的应用中以ARIMA作为季节模型进行定量分析,这一时期ARIMA模型被广泛应用于时间序列的预测研究(王书恒,陈怡静,2022);刘星辰,邓思洁为了提高降雨量的预测精度,提出了一种时间序列预测(ARIMA)并结合小波进行变换的降雨量预测模型;云南省水利水电科学研究院的白致威等人建立了SPEI序列自回归移动平均模型(ARIMA),用于对干旱进行提前一步进行预测;就上述方案的调试而言,本文从理论探索与实践求证两方面着手。理论探索部分,深入分析了方案设计的核心理念与预期成效,通过构建理论框架与逻辑链条,为后续实验奠定了坚实的理论基础。紧接着,在实践求证环节,本文精心策划了一系列实验,以验证方案的有效性与可靠性。实验过程中,采用了严谨的信息采集与分析策略,确保结果的真实无误。同时,为深入评估方案在不同环境下的适用性,本文还考虑了多种典型应用场景,并据此调整了系统配置。这一过程不仅验证了方案的正确性与可行性,也为后续科研提供了宝贵的参考材料。解放军理工大学张俊豪,杨琳等人将贝叶斯分类应用到雷暴预测当中;南京信息工程大学的智协飞等即应用贝叶斯模式平均法(BMA)将中国气象局(CMA)美国国家环境预报中心(NCEP)和ECMWF三个模式的预报结果进行多模式气温集成。但这些经典时间预测方法,未计及多元气象因子。在此情势发展下兰州大学陈浩然,胡曼丽等提出了多维时间序列数据挖掘模型,将多维序列进行符号化,利用规则提取降雨天气模型;马廷淮,穆强等人分析了提出利用数据挖掘技术。在气象业务中应用的问题,并结合气象应用提出了气象数据挖掘研究的重点,只是对数据挖掘技术的一般应用。段文广,周晓军等提出BP神经网络进行精细化温度预报的方法。该方法基于时序分析技术,通过在历史序列的温度样本进行迭代学习来建立起预测模型。该模型仅使用了简单的三层神经网络,仅使用了温度单一属性对温度进行预测研究,考虑了历史24个小时的数据进行提前24小时的预测,对于历史序列信息利5和非线性自回归(NVR)神经网络技术,来构建气象要素时间序列预测;南京信息工2相关技术于统计经济学技术以及基于机器学习等算技术的出现,无限拓2023)。有很多的预测问题,都包含着时间的分量,鉴于当前环境正因为包括着时间分方法分析气象数据,特别是使用时间序列的分析方法,作为一个专门的研究方向,成时间序列可认为是表征系统在不同时间点动态特征或是由非线性动态方程描述的被控对象在某特定采样间隔的一连串数据。对时间序列的研究,最早可追溯到公元前65000年,成果被广泛应用于工业界、医疗学、气象学、物理学、生物学、经济学、环型,其表现出多方面的特征,一方面是其无序性,而另一方面它却很“有序”,天气的变化呈现出的自相似的分形结构也说明了天气在短期内是具备可预这在理论上保证了从时间序列的角度分析序列平稳性,假设存在着一个平稳时间序列。那么,它将具有以下特征:序列Y的每个取值都是一个概率分布随机序列,并且其满足的均值、方差都是与时间t不相关的固定值,当时间间隔确定后,在这个脉络里进行其协方差也与2021)。举例来说,如图示2.1所示显示了30年间部分温度抽样数据在时间序列上的波2023)。图中气温值随着时间移动而呈现有规律周期性变化,在时间维度上表现出了较然,2022)。7温度预测顾名思义是个预测问题,一想到分类问题,我们首先会想到的是神经网络,神经网络可以解决非线性回归问题,通过监督学习获得的数据和标签之间的映射关系。其中,BP神经网络(由Rumelhart,McCelland等提出,1986)是使用最广泛的一种,它把神经网络分为三层,输入层,隐藏层,还有输出层(吴服,王宛雪,2020)。每一层有很多个神经元构成,每一个神经元由加权求和,偏置向量,在这个脉络范围内还有激活函数三部分构成,激活函数具有连续可微的特性可以提高网络建模能力以解决非线性回归问题的能力。在多层神经网络当中,如果缺少激活函数,即使网络深度增大,也只能解决性通常情况下神经元的输出可以表示为(周佳宁,魏Relu:常作为隐藏层的激活函数Sigmoid:通过用于输出层处理二分类问题(李昊然,高佳琪,2022)Softmax:通过用于输出层处理多分类问题8但在处理连续的温度数据中,神经网络有一种广泛的缺陷,就是他只学习输入数据和输出的目标标签之间的关系,这明显体现了而没有学习时间点前温度和时间点后温度之间的关系,这意味着神经网络无法学习温度变化的的连贯性(王天佑,赵昕婷,2020)。在模型中,没有考虑到温度变化的的连贯性和协调性,在一定程度上,鲁棒性还有准确率的下降。与已有文献结论的一致性,标志着前期研究构思的稳健性得到了实证的支撑。这一结果不仅加深了本文对特定领域内复杂关系的理解,还激发了本文对潜在未知因素的探索兴趣。它提示本文,未来的研究可以更加聚焦于揭示那些尚未被充分理解的机制,以及它们如何与已知因素相互作用,共同塑造出观察到的现象。同时神经网络的可解释2.2.3循环神经网络循环神经网络的鼻祖是RNN网络,RNN网络在某种程度上克服了传统的BP神经网络假设输入向量是互不关联的这一结构缺陷,添加了由时间序列产生的隐藏状态,输出也依赖于这个隐藏状态,图2.3为一个RNN模型展开一个完整的网络,其数学表达如o"o"h⁰whWxo°”U↑vh"UhWWUxxxt是t时刻的输入,h是在t时刻的隐藏层状态,其计算公式如下所示(杨景华,蔡f₁为激活函数函数的种类有在温度预测问题当中我们使用一般Relu作为激活函数。和BP神经网络只能读取一个标量不一样的是RNN神经元可以读取一个向量。9CO+OutputoflastNonlinearities:Scalingof+x+O+bLSTM的输入有输入向量、上一层网络输出的状态值Ct-1,ht-1三个部分。而其输其中W是遗忘门的权重矩阵,bf是遗忘门的偏置项,表示了遗忘门输出的输入门输出的计算,除此以外ht-1,xt还会构成一个新的候选值向量Ct用以生成新的细由上述公式也可以看出LSTM的神经元的隐藏层比RNN更加复杂,其在梯度求解时式子是累加的形式,服了RNN神经元在梯度求解时候由于累乘而导致gradient加注重理论与实践的结合,通过实地调研、案例分析等方式,将研究成果应用于实际问题的解决中。同时也会积极寻求与业界、政府等机构的合作,共同推动研究成果的转化和应用,为社会经济发展贡献力量。在后续的研究中会对已有的研究成果进一步从不同的角度进行优化,会积极寻求与其他学科的交叉融合通过跨学科的研究视角,本文期望能够发现新的研究问题和研究方向,为相关领域的发展注入新的活力。在LSTM结构中,由于其独特的三种门结构和其有存储功能的单元状态的存在,LSTM能够较好地学习长时期的历史数据信息,从而解决长期的数据依赖关系。首先,当前t时刻的单元状态通过遗忘门控制上一时刻t-1的单元状态C-1中有哪些信息需要舍弃,有哪些信息可以继续保留下来(赵宇昊,李佳琳,2021)。其次,在这特定情况下基于单元状态Ct在遗忘门中舍弃了一些信息,所以它需要通过输入门中来学习新的信息。通过一系列计算之后单元状态Ct得到了更新,此时LSTM利用输出门,单元状态C和一个tanh层决定最终的输出值h。对于拿到的粗糙数据集,必须对数据进行筛查、清洗等相关预处理,同时为了提高计算效率,还会进行零均值处理,为了判断序列是否平稳还将使用到白噪声检测(可通零均值处理是对属性中的每个值分别对这一列的平均值求差,转换后的一列数据取值范围变小,但保留了原有变化规律。对于具有季节特征,鉴于当前环境如气温预测在预处理时,需要考虑加入周期性差分操作,减少由于季节因素带来的周期性影响。迭代差分计算,使用平稳性检测方法进行检验,直到得到平稳性序列为止。常用到的平稳性检验有图检验、假设检验,如单位根ADF(Dicky-Fuller-Test)检验法。通过对均值、自相关系数(ACF)以及偏自相关系数(PACF)在序列样本中的不同表现的判断,确立模型各个参数。在这样的情形下但这种观察判别的方式,有时会带来极大的误差,使判别出的模型预测效果并不理想(刘清华,张悦琳,2022)。在定价过程中常常采用AIC或是BIC的方式,本文采用了通过BIC自动定阶算法,算法的思想是通过判断不同的p与q值取值,从而计算出不同的BIC取值,找到使BIC值最小的p和q组合,即为ARMA模型的阶数,核心代码见图2-3,其中函数中的N为达到平稳时所通模型确定后,一般需要再次对确定好的模型阶数,进行效验检查,以达到效验模型所定价数的准确,从而确定最终模型,效验方式与前面类似。可以采用绝对百分比误差MAPE、绝对平均误差MAE或是平方根误差RMSE等一系列回归预测中用到的度量方式。2.4其它时间序列预测模型其它的时间序列预测模型还有(杨怡菲,朱嘉欣,2020):基于灰色理论预测模型、基于混沌预测模型等。其中,灰色预测模型是在灰色系统的基础上提出,灰色系统是介于全部信息未知的黑色系统和全部信息已知的白色系统之间的未知系统,在这个脉络里进行而预测这个系统的模型就是灰色预测模型。灰色预测模型的概念源自于应用数据领域,是一种对未来要素系统进行预测的常见手段。它通过对预测对象时间序列特征进行分析与判别构造成灰色预测模型,从而预测下一个序列时间的值或获悉到达某个设定值时间的方法。灰色预测模型有很多,常用到的有GM(L1),CGM(1,1),SGM(1,2.5深度学习1965年,Ivakhnenko以及V.G.Lapa发表了第一个具有多层次功能的深度学习网络:GMDH,该网络用到的学习算法被称为数据处理组或称GMDH组(张怡然,GMDH具有全自动结构和参数优化的模型,在这特定框架内其网络节点的激活函数是允许加法和乘法的Kolmogorov-Gabor多项式。Ivakhnenko在1971年的文章又描述了具有8层深度前馈多层感知器的学习网络,这比许多以往的网络具备更加深入的层次结构MS。这种监督学习网络逐层递增传播,每层通过回归分析进行训练,使用验证集来检测无用的神经元,并通过正则化修剪,所获到网络的大小和深度取决于问题。这种方法的出该方案相比于其他方案具有更好的性价比,同时它还强调了环境可持续性,通过减少能源消耗和废物排放来支持绿色技术的发展。这一特点对于追求可持续发展目标的企业或组织来说尤为重要。深度学习(Deeplearning)通过较简单直观的表示来表达出复杂的应用和场景,解决了表示学习(RepresentationLearning)中的无法从原始数据中提取高层次、抽象特征等问题相对比于传统的机器学习,在这个脉络范围内深度学习研究的模型涉及更多学到“功能"或学习到“概念规律性"的多层次组合(王志轩,刘雅婷,2020)。深度学习模型的典型例子是前馈深度网络,也被称为多层感知机(Multi-LayerPerceptron,MLP)网络深度学习算法通过对多层结点的设置,从而使得不同类别的问题更加可分,可以学习到更加复杂的事物特征(陈睿,郑玉菲,2022)。深度学习是机器学习体系的一种延伸,这明显体现了由神经网络向深度发展而来,除了可以学习到特征和任务之间的关联,还能自动从简单特征屮提取到更加复杂的特征。深度学习的一般步骤与机器学习和传统学习步骤有很多相似之处,常规的深度学习流程,可分别从定义问题、数据预处理、特征学习、模型确立、组织训练以及对模型评估等几个方向,大体有如图2-5所示几个步骤。(1)问题定义问题定义指要明确深度学习需要探索的问题,充分了解问题背景,需要研究的相关领域的数据收集或业务开展情况,将具体问题解释成能让机器通过学习得到解的问题,(2)数据预处理实际的应用中,由于人为误操作、系统故障、存储丢失等各方面的原因,可能造成的数据的离散、重复冗余等情况,度好的数据来源是模型训练成功与否的关键。因此,必须对数据进行必要的清洗预处理(王彦博,刘紫琪,2023)。同时,这明显体现了为了满足特定模型需要,还要结合实际任务,完成增加对数据集进行数据转换,标准化等处理任务网。(3)特征学习深度学习除了可以学习特征以及任务之间的关联外,还能从简单特征中学习到更加复杂的特征。因此,特征选择步设置对于深度学习过程也至关重要,经常也与数据预处理同步完成。(4)模型选择深度学习工具的选择根据不同的任务要求改变,不同的数据特征使用到的模型也会不同。对于特定的目标需求要确定合适的深度学习模型进行训练,这里还会包括着更加具体的对模型优化以及代价函数、激活函数、输入输出单元等结构的定义与选择。(5)模型训练根据机器学习任务的模型的结构和数据特点等情况,选择合适的学习型算法进行训练,以贴近目标与期望。(6)模型评估模型评估通过相应的类别评价函数对结果效果进行度量。用于衡量模型的好坏。对于一个理想模型的定义,一般要求得到的预测值能较好的拟合训练样本中的真实值,使用某种“接近程度”来衡量预测值与真实值之间的差距,让预测值越接近真实值越好,在本文的研究背景下我们兼顾了这种情况根据两者的接近程度来进一步采用特定策略更新每层的权重大小,从而求解得到模型的估计(杨雯婷,王静怡,2022)。这种应用于表达接近程度的度量函数我们一般定义为损失函数或代价函数,它被用于衡量预测值和目标值的差异性大小,通常采用可用一组特定的方程进行表达。常用的损失函数有均方误差(errorofsquare),一般被以求解气象温度预测使用均方误差为例,(y,y')是参数变量,也就是要迭代求解的值,实验的过程可以简单描述成对值的求解过程。从中可以看出一些端倪其中n是训练集的样本个数,对于时间序列,对于该损失函数的定义会有公式2-9表达式:可见,损失函数(代价函数)的输出值越高则表示预测值与真实值差异性越大,预测效果越不理想(黄浩宇,王思怡,2023)。深度学习的过程实质就是在不断缩小特定模型代价的过程。除此以外,对于损失函数的定义根据任务的不同,还可定义成最大似然误差、最大后验概率等。2.6本章小节本章首先分析了基于时序预测对天气进行提前一步预测的可行性,介绍了基于时间序列的概念以及常用的预测技术,从这些现象中可以得出分别对传统预测模型进行分析,重点对基于python的LSTM算法就行了分析和解释,并对具体预测流程进行了设计。最后,提出深度学习的概念,并分别从深度学习一般流程、损失函数定义等方面进行了简要介绍。3基于LSTM的气象预测模型构建本文的数据来自MaxPlanckInstituteforBiogeochemistry的天气这个数据集合包含14个不同的特征(压强P,温度T,湿度dew,风速wd等)从2003年开始,每10分钟收集一次。为了提高效率,本文仅使用2009年至2016年之间收集的数据如图所示,该气象机构每十分钟记录一次观察到的数据,一个小时内有六个观测值,一天则有144(6×24)个观测值T01234图3.1观测数据其数据要素包括采集数据的区站号、年、月、日、时次、气压、海平面气压、最高气压、最低气压、气温、最高气温、最低气温、相对湿度、水汽压、最小相对湿度、降水量、水平能见度、风力、体感温度,其中后面20个要素的单位分别为:摄氏度(℃)、百帕、百帕、百帕、百帕、米/秒、米/秒、度、度、米/秒、度、摄氏度(℃)、摄氏度(℃)首先我们进行确定所观测到的气温数据是否为时间序列,在这特定情况下使用一个特征 (温度)训练模型,并在使用该模型做预测,如下图3.2。123图3.2数据集中提取温度通过Python画出特征温度随时间变化的波动图像,我们可以从下图3.3从数据集中提取到的温度特征图看出,该温度变化特征符合时间序列图3.3气温数据变化地面观测站的数据往往都是能够真实反应,但由于大部分气象观测台的分布不均匀,因此造成气象数据可能存在时间上的纰漏,在此情势发展下会照成研究地区的气象数据的缺少和遗失,等不足(陈文俊,李欣瑶,2022)。在此之外,气象站所得到的数据并不完全符合情况,即可能存在一些错误值和重复值,所以为了保证数据的准确合理,所以必须对气象站的数据进行相关预处理,主要分为以下两个工作(刘宇飞,张依婷,2021)。此优化方案是基于对当前状况的仔细评估及有效利用现有资源和技术来实现的。对比于传使得操作效率得到提升,错误率降低,从而大幅提高了计划的成功几率。另一方面,从经济效益出发,新的解决办法降低了运行和保养成本,节约了资源,增加了财务效益。此外,还改善了系统整体的协调性和可伸缩性,使其更能适应未来的挑战和需求变化。首先要处理的是数据表中的重复值,其中对气温预测来说没有任何作用的值全部清空,因此删除这一列;其次要处理的是数据表中的缺测值,鉴于当前环境由于本文采用的是Python语言环境,所以使用函数对空余的数据值进行填充,选择中位数代替缺测值;最后将所有的日期时间信息整合成为一个日期时间,并将整合后的日期作为整个气象时间序列数据的索引(李怡然,刘璇婷,2023)。而对气温影响的评估中,在这样的情形下数据集中的气温,大气压力和空气密度对大气温度的影响最为显著,我们得到处理后的数据如下3.4:图3.4重构的数据(2)标准化输入气象要素变量本文将表中的前三个主要的气象要素作为输入变量,由以上对采集的地面观测数据的相关描述可知,这3个气象要素的数量级和单位都各不相同。如果以这些数据作为模型的输入,在这个脉络里进行将会对气温预测的结果产生不利的影响(王沐昕,郑思琪,2020)。对此,本文采用min-max的归一化方式对输入的气象要素数据进行归一化处理,其公式如下所示:其中,max为洗清好的各个气象样本数据的最大值,min为洗清好的每个样本数据的最小值,在这特定框架内经过标准化后,各个输入变量属于同一数量级,这样能加速如下图3.2即为对数据标准化的实现代码:3data_std=dataset[:TRAIN_SPLIT]45dataset=(dataset-da图3.5观测数据经过清洗处理后的数据我们通过Python的绘图工具将其随时间变化的特征表现出来,如下图所示:图3.6三特征随时间的变化(3)对数据集进行划分本文调用tf.data.Dataset.from_tensor_slices函数,改函数的作用是对给定的向量数据进行特征切片,将数据分为了训练集和验证集。在这个脉络范围内训练集用于模型的训练,而验证集用于模型预测效果的验证。1|train_data_multi-tf.data.Dataset.from_tensor_slice1|train_data_multi-tf.data.Dataset.from_tensor_slice2|train_data_multi=train_data_multi.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat()34valdatamulti-tf.data.Dataset.fromtensorslices((xval_multi,y_v图3.4特征数据切片因为后续需要进行单步预测,我们需要为模型提供20个温度观测值来预测下一个时间步长的温度,对数据集进行如下图3.5操作,将样本划分(彭俊杰,范诗琪,2021)。2univariate_future_target35x_train_uni,y_train_uni=univariate_data(un678x_val_uni,y_val_uni=univariate_data(uni_data,TRAIN_SPLIT,None,图3.5样本数据划分这20个温度点的数据如下图3.6所示:4[-2.05439744]5[-2.0312405]6[-2.02660912]7[-2.00113649]8[-1.95134907]9[-1.95134907]图3.6单步预测温度值在继续训练模型之前,先设置一个简单的基准。在给定输入点的情况下,基线方法将查看所有历史记录,这明显体现了并预测下一个点是上述单步预测的20个温度观测寸1寸1defbaseline(history):3show_plot([x_train_uni[0],y_train_uni[0],baseline(x_trai'BaselinePredictionExamp图3.7基准测试代码图3.8基准测试方法用于气温预测的总体结构如图3.9,结构由输入层,隐藏层,输出层,网络训练和LSTM单元,输入的多要素时间序列首先通过LSTM单元,进入后使用Dropout操作防在这个公式中y;为预测的气温值,yi是实际测量的气温值,M是训练集的样本个鉴于当前环境在这个公式中,W为链接LSTX'11-(n-1)X'-(n-2)X'-1LSTMLSTMX'mX(n-1)图3.9气温预测的总体结构总体结构主要分为3个部分,输入层,隐藏层和输出层,其中输入层由于原始的气象数据序列是庞大繁多的需要进行数据清洗,以及划分训练集和测试集,隐藏层我们采用LSTM算法进行学习,其中含有大量的LSTM单元,在这样的情形下输入的三大要素的时间序列首先进入LSTM单元进行学习然后为了正则化能调节神经元的协同适应和高预测能力,采用dropout操作将其传输到全连接层以进行预测,在这个过程中,我们对损失进行计算通过Adam算法进行优化处理(刘星辰,邓思洁,2021)。在这个脉络里进行值得注意的是LSTM(或长期短期记忆网络)负责计算时间序列中各个观测值之间的依赖性,这种机制使最终的隐藏状态变化相对较慢,即使单元格的状态变化很快。因此,单元状态学习短期和长期依赖性,但最终的隐藏状态仅反映短期依赖性和/或长期依赖性(张俊豪,杨琳,2020)。本文基于已有的策略设计出一种计算方式,并对其进行了适当简化以提高其便捷性和实用性。通过对当前方案的细致研究和评判,排除了不必要的复杂环节,优化了工作流设计,创建了一个更高效简洁的计算模型。此过程不仅降低了对资源的需求,还加快了处理速度,确保了本方案在不牺牲效能的情况下易于应用和推广,添加了一系列检验和质量保证措施。当然在进行预测的过程中我们设置了两种LSTM预测模型,第一种是单步预测,仅仅通过一个变量即一个时间序列数据集进行气温的预测其预测结果也是一个数据,第二种是多步预测,在这特定框架内通过多个变量即多个时间序列数据集进行气温的预测得到一系列的数据集合点,这能够直接反应LSTM在处理多数据情况下是否具有优越性,以及更好的预测效果。4.LSTM模型实验结果与分析为了验证上面所提出的基于LSTM的气温预测模型的有效性和优越性,本文采用MaxPlanckInstituteforBiogeochemistry所观测到的气象时间序列数据对未来的气温进行Python解释器顾名思义就像翻译器一样,它可以理解和翻译Python语言,对代码进行解释执行需要进入官网地址下载.本文所使用的是python3.7.2版本,下载完成后安装,注意勾选添加环境变量,如下图4.1所示(陈浩然,胡曼丽,2023):SelectInstallNowtoinCustomizetoenableordisableC:\Users\Zhouyu\AppData\Local\Programs\Pyt☑Installauncherfor图4.1python解释器下载页面安装python后我们需要安装Anaconda,Anaconda是一个科学计算环境,其中有一些常用的库,如numpy,scrip,matplotlib等库。如下图4.1即为Anaconda打开的界面(王珊彤,孙子琪,2022):OANACONDANAVIGATOR其中我们运行Spyder,是一个强大的交互式Python语言开发环境,其最大的优势在于他是一个类Matlab的界面设计对初期开发者来说十分的友好,其次Spyder里除了拥有一般IDE普遍具有的编辑器、调试器、用户图形界面等组件外,还具有对象查看器、变量查看器、交互式命令窗口、历史命令窗口等组件,除此之外还拥有数组编辑以及个性定制等多种软件名称版本内存为了实现对TensorFlow-GPU的支持,实验在Windows+Python环境下,还安装了用于支持神经网络训练,实验中所用显卡为GTX1080,该显卡内建4组显卡处理器集群GPC,每个GPC有5个SM(2x64个CUDA单元),共计2560个CUDA单元。同时,环境中还安装了通用科学计算包,另外还有scikit-learn(0.18.1)、scipy(0.19.0)、sympy(1.0)等通用包。实验使用的到的其它具体环境参数及配置见上表4.1所示。4.2模型效果评估指标当我们把所有模型都训练完成后,我们就可以预测整个的测试集,然后将预测的气温数据逆缩放。为了评估模型的预测性能与情况,本文根据MaxPlanckInstituteforBiogeochemistry所观测到的气温值选用了均方根误差(RMSERootMeanSquaredError)、平均绝对误差(MAE,MeanAbsoluteError)和平均绝对百分比误差(MAPE,MeanA这里我们分别对它们进行介绍,RMSE(RootMeanSquareError)是均方根误差衡量观测值与真实值之间的偏差。常用来作为机器学习模型预测结果衡量的标准,MSE(MeanSquareError)是均方误差通过平方的形式便于求导,所以常被用作线性回归的损失函数MAE(MeanAbsoluteError)是平均绝对误差是绝对误差的平均值。可以更好地反映预测值误差的实际情况。它们的计算公式分别如下所示(高明泽,林玉洁,2022):在上面的公式中y,为LSTM的预测结果,y,是测试集中样本的个数,根据公式我们可知,当RMSE,MAE,MAPE的结果越小时说明预测得到的结果和实际观测到的气温值之间的误差越小,则能够更进一步说明预测模型的性能的卓越性(周嘉懿,魏雯琪,我们搭建的LSTM长短期记忆网络模型,是基于python平台的Anaconda深度学习可以更快地整理出适合分析的数据集,并降低了由于繁琐步骤因为60分钟内不会发生剧烈变化。在这特定情况下因此,120个重采样值表示最近五天的温度状况。对于单步预测模型,数据点的标签是未来12小时的温度(李俊杰,何玉婷2023)。所以,使用之后72(12*6)个观测值作为标签。通过plot绘制损失函数如下图图4.1单步预测损失函数从图中可以看出单步预测模型所拟合出来的损失函数不断波动,并没有趋于平缓,在6次学习后Trainingloss在0.24附近波动,鉴于当前环境而Validationloss的波动还是非常大的。接下来通过输入每小时过去5天采样的三个特征的历史记录(120个数据点)进行测试,因为目标是预测温度,所以该图仅显示过去的温度。在这样的情形下预测是在未来一天进行的如图4.2所示(赵梓琪,邵怡然,2022):图4.2单步预测气温结果都比真实值要小,有以下原因可能导致的预测不准确,在这个脉络里进行第一可能由于训练数据还不够多,不能使LSTM模型更加完整的学习,第二可能由于气温剧烈变化影接下来我们进行多步预测的实验,由于此处的任务比先前的任务复杂一些,因此该模型现在由两个LSTM层组成。最后,在这特定框架内由于需要预测之后12个小时的数据,因此Dense层将输出为72。多步预测就是每一次预测的时候输入窗□预测未来n个值(也叫n步)。只预测未来一次,即只预测一个n输入的n个输出,n是滑动窗口个数,即输入n个滑动窗□,直接输出未来的n个,利用的输入全部是历史数据的2、3、4、5、6…,即输入n个滑动窗口作为一次输入,整体输入是m次这样的窗口,直接输出未来的m×n个,利用的输入第一次是历史数据的真实值,第一次之后包含有下图4.3即为多步预测模型模型进行10次Epoch的训练日志。2|200/200[--------------------------]-735363ms/step-loss:0.5750-val_loss:0.313734200/200[----------]-735367ms/step56200/200[------------------------------]-79s393ms/step-lo78208/200[-=----------------------------]-85s426ms/step-loss:0.3062-val_l9200/200[=---------------------------=-]-985488ms/step-lo200/200------]-103s514ms/step-loss:0.200/200=a-------------=------------]-107s537ms/step-loss:0.2061-val_200/200[=--===========---=======]-108s539ms/step-loss:0.2016-va200/200[=--------------]-925462ms/step-loss:θ.2047200/200[=-aa-aaaa--a--]-985490ms/step图4.3训练日志在这个脉络范围内训练数据包括每小时采样的过去五天的记录。但是,这里的模型需要学习预测接下来12小时的温度。由于每10分钟采样一次数据,因此输出为72个从图4.2中可以看出,LSTM网络训练出来的模型,这明显体现了预测结果基本上与实际温度一致,虽然在开始预测的部分有些剧烈波动,但在后面的预测中甚至在某些时段重合,其中我们可以从第一段预测可以看的尤为明显,在本文的研究背景下我们兼顾了这种情况所以我们提出的LSTM对于气温的预测拟合效果是优越的(李昊然,高佳琪,上图4.3展示了模型训练和测试过程中迭代10次的损失函数变化曲线图,清晰看出,当迭代次数接近6时,从中可以看出一些端倪损失函数基本收敛,而后随着迭代次的增加,损失基本保持不变,并且训练和测试的损失函数曲线基本重叠,说明该模型在测试集上也有很好的效果,表现出了较好的泛化能力。针对环境因素可能对最终成果造成的不确定性影响,本研究在策略制定与执行时采取了一系列步骤以确保输出的精确性及计划的稳固性。首先全面考察了所有可能影响执行成效的外部变量,接着在设计初期应用了环境影响评估技术,通过不同情境的模拟测试它们对结果的作用,并据此优化设计要素,提升方案的灵活性与坚固度,使其能够快速适应外界变动,持续保持其实用价值。混沌时间序列预测,是一种新型的非线性系统预测理论,研究如何由时间序列通过相空间重构,从另一个维度和视角来辨识系统,挖掘系统中蕴藏的规律,并预测系统的未来走势,而忽略因变量背后众多影响因素和复杂的影响机理,省却了大量繁琐的工作,非常适合于那些总体呈现确定性,从这些现象中可以得出但又具有某种程度随机性的复混沌时间序列预测的基本思想:构造一个非线性映射来近似地还原原系统,这一非线性映射即为要建立的预测模型。混沌时间序列预测的优点(张逸轩,陈若琳,2023):(1)不必事先建立一个主观模型,再通过对这个模型的微调来拟合原系统,而是直接根据序列本身的客观规律进行预测,这样可以最大限度地避免人为主观性,提高预测的精度和可信度;(2)混沌方法有更广阔的适用范围,即系统适应性好,而不像传统预测方法仅仅适用于某一类具有特定特征的系统。时间序列预测模型的建立主要基于两类思想:(1)一类思想基于多变量回归,即预测对象的未来行为取决于其他主导对象的当前或过去的行为,也就是说取决于另一个或多个时间序列。在这特定情况下这些起主导作用的时间序列与被预测的时间序列存在共振或同步,同时也要满足领先于被预测的时间序列。(2)另一类思想基于单变量自回归,即预测对象的未来行为主要由其历史行为决定(吴宇昊,丁馨悦受混沌理论启发,对于决定气象系统长期演化的各种属性(如温、压、湿等),均包含了气象动力学系统长期演变的信息。鉴于当前环境通过前面介绍,在混沌理论中对其原动力系统重构,关键在于对空间时间延迟T以及维度求解,因此,可以从气象各个参数属性的一批时间序列气象数据中提出或模拟出系统本来的状态特征,本质上,这也是对于输入变量所进行的特征工程。但在繁琐的求解相空间过程中,我们不一定总能4.5本章小节本章首先提出了利用前馈神经网络改造气象预测模型,分别从网络结构搭建、防优化等方面展开。然后,在这样的情形下考虑到传统神经网络中出现的天气参数常被认为是彼此独立,并且时序关系一般不被考虑的缺点,在深度前馈神经网络气象预测模型的构建中,还加入了滑动时间窗手段,通过对输入数据序列矩阵进行重构,在这个脉络里进行可以让深度前馈神经网络也能学习到较好的时间序列特征(杨景华,蔡婷最后,考虑到循环神经网络(RNN)良好的时间序列信息学习能力,提出使用RNN预测特征,来进行启发式构建气温预测模型并对网络架构、梯度算法选取进行了设计,重点对LSTM预测模型进行了搭建,针对实验调参中出现的问题,还提出了加入L2正5总结与展望气象要素时间序列通常表现出时空多样性,并受物理过程的非线性、时空尺度冲突及众多参数估计等不确定性因素困扰。本文从时间序列的角度,选择了气象气温属性进行提前24小时的精细化预报研究,实验中,采用了最先进的机器学习库TensorFlow来代替传统机器学习算法,通过改进深度前馈神经网络以及循环神经网络,构建起适合可用的气温预测模型,实验除了有深度学习模型间的对比,还加入传统模型比较,以期找到最为理想的精细化气温预测模型。在这个脉络范围内通过对气象气温以基于时间序列的预测研究,探索了局地精细化天气预报方法,解决了深度学习中前沿技术在气象温度预测上的应用问题。本文得出如下结论:深度学习模型均能表现出了良好的预测性能,尤其是LSTM序列模型凭借较强的序列学习与预测能力,可作为精准化温度预测的一种常规手段。二是对于深度前馈神经网络,考虑多元属性特征并加入滑动时间窗手段后,预测效果提升明显。这说明了计及多元属性和时序特征,能直接影响预测的精准度。三是对于在深度学习模型中加入RELU激活函数改进和正则化优化后,实验中收敛效果表现得更好,这预示着对于将来的工作,针对深度学习模型用作气温预测时,可通过不断学习各种优化方式提升实践应用效果。同时,也暴露出一些问题:一是受到获取资料限制,实验数据仅是单站,考虑的属性维度并不高,也并未加入更多地理位置气象数据进行模型的交又验证,这明显体现了局地气温特征差异性会较大,模型带有较强的区域特征,将来的工作除了要考虑更多维度属性外,还要将站点二是神经网络的训练是个不断调参的过程,调参难是训练神经网络最大障碍。实验中选定的参数仅是本文通过多次测试在特定场景得到的较好参数值,但无法确定已是全局最优。下一步,仍需大量实验验证。气象领域与人工智能相结合的研究越来越热,本文在长短期记忆网络的基础上,进行了气温预测和短时降雨预测的研究。尽管本文所提出的预测模型相比于其他模型,准确率都有明显提升,但与我们实际生活中的应用还存在一定的距离,因此,未来的研究可以做以下几点改进:(1)本文所用的算法使用了气压、相对湿度等气象要素与气温的关联程度,其实可以选择尝试其他方法,寻找出与气温最高度相关的气象要素。(2)对于气温预测问题,本文只对少数地区的数据进行了仿真实验,具有一定的片面性。不同地区之间的气象要素关联性可能会有所差异,在以后的研究中,会增加多个地区的数据分别进行分析,研究不同地区气象要素之间的关联性差异,并且对每个地区的数据进一步扩充。(3)本文所提出LSTM模型虽然在气温的的准确率是最高的,但是使用的参数也是最多的,计算量过大,可以尝试改善网络结构,减小该模型的复杂度。(5)气温预测方面本文仅使用了单一的数据源,为了更加全面有效地进行气象预测,可以增加数据源,比如增加用户参与感知的数据,进行数据融合研究。(6)在以后研究中,将使用多种类型的数据对气象问题进行分析和研究,比如地基云图、多光谱卫星云图等。[1]彭鹏飞,邱俊宏.短期天气预报的新方法和问题[M].科学出版社,2022.[3]彭俊杰,范诗琪.中长期天气预报基础[M].气象出版社,2021.[5]李凯文,周子凡.人类对天气和气候的影响P].国外科技新书评介,2008(2):19-20.丁[6]王书恒,陈怡静.现代天气学原理[M].高等教育出版社,199[7]刘星辰,邓思洁.数值天气预报业务模式现状与展望[J].气象学报,2004,62(5):623-633.[9]陈浩然,胡曼丽.浅探现代天气预报技术发展的基础和特点[J].科技资讯,2008(33):217-217.[10]王珊彤,孙子琪.浅谈现代天气预报的主要方法[J].城市建设理论研究:电子版,2011(14).[12]MaqsoodI,KhanMR,AbrahamA.WeatherForecastingModelsUsingEnsemblesofNeuralNetworks[M]//Intelligent陈欣妍,刘梓轩temsDesignandApplications.SpringerBerlinHeidelberg,2007:33-42.[13]BartokJ,HabalaO,BednarP,etal.Dataminingandimeteorologicalphenomena[J].ProcediaComputerScie

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论