




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第PyTorch搭建双向LSTM实现时间序列负荷预测目录I.前言II.原理InputsOutputsbatch_first输出提取III.训练和预测IV.源码及数据
I.前言
前面几篇文章中介绍的都是单向LSTM,这篇文章讲一下双向LSTM。
系列文章:
PyTorch搭建LSTM实现多变量多步长时序负荷预测
PyTorch搭建LSTM实现多变量时序负荷预测
PyTorch深度学习LSTM从input输入到Linear输出
PyTorch搭建LSTM实现时间序列负荷预测
II.原理
关于LSTM的输入输出在深入理解PyTorch中LSTM的输入和输出(从input输入到Linear输出)中已经有过详细叙述。
关于nn.LSTM的参数,官方文档给出的解释为:
总共有七个参数,其中只有前三个是必须的。由于大家普遍使用PyTorch的DataLoader来形成批量数据,因此batch_first也比较重要。LSTM的两个常见的应用场景为文本处理和时序预测,因此下面对每个参数我都会从这两个方面来进行具体解释。
input_size:在文本处理中,由于一个单词没法参与运算,因此我们得通过Word2Vec来对单词进行嵌入表示,将每一个单词表示成一个向量,此时input_size=embedding_size。比如每个句子中有五个单词,每个单词用一个100维向量来表示,那么这里input_size=100;在时间序列预测中,比如需要预测负荷,每一个负荷都是一个单独的值,都可以直接参与运算,因此并不需要将每一个负荷表示成一个向量,此时input_size=1。但如果我们使用多变量进行预测,比如我们利用前24小时每一时刻的[负荷、风速、温度、压强、湿度、天气、节假日信息]来预测下一时刻的负荷,那么此时input_size=7。hidden_size:隐藏层节点个数。可以随意设置。num_layers:层数。nn.LSTMCell与nn.LSTM相比,num_layers默认为1。batch_first:默认为False,意义见后文。
Inputs
关于LSTM的输入,官方文档给出的定义为:
可以看到,输入由两部分组成:input、(初始的隐状态h_0,初始的单元状态c_0)
其中input:
input(seq_len,batch_size,input_size)
seq_len:在文本处理中,如果一个句子有7个单词,则seq_len=7;在时间序列预测中,假设我们用前24个小时的负荷来预测下一时刻负荷,则seq_len=24。batch_size:一次性输入LSTM中的样本个数。在文本处理中,可以一次性输入很多个句子;在时间序列预测中,也可以一次性输入很多条数据。input_size:见前文。
(h_0,c_0):
h_0(num_directions*num_layers,batch_size,hidden_size)
c_0(num_directions*num_layers,batch_size,hidden_size)
h_0和c_0的shape一致。
num_directions:如果是双向LSTM,则num_directions=2;否则num_directions=1。num_layers:见前文。batch_size:见前文。hidden_size:见前文。
Outputs
关于LSTM的输出,官方文档给出的定义为:
可以看到,输出也由两部分组成:otput、(隐状态h_n,单元状态c_n)
其中output的shape为:
output(seq_len,batch_size,num_directions*hidden_size)
h_n和c_n的shape保持不变,参数解释见前文。
batch_first
如果在初始化LSTM时令batch_first=True,那么input和output的shape将由:
input(seq_len,batch_size,input_size)
output(seq_len,batch_size,num_directions*hidden_size)
变为:
input(batch_size,seq_len,input_size)
output(batch_size,seq_len,num_directions*hidden_size)
即batch_size提前。
输出提取
假设最后我们得到了output(batch_size,seq_len,2*hidden_size),我们需要将其输入到线性层,有以下两种方法可以参考:
(1)直接输入
和单向一样,我们可以将output直接输入到Linear。在单向LSTM中:
self.linear=nn.Linear(self.hidden_size,self.output_size)
而在双向LSTM中:
self.linear=nn.Linear(2*self.hidden_size,self.output_size)
模型:
classBiLSTM(nn.Module):
def__init__(self,input_size,hidden_size,num_layers,output_size,batch_size):
super().__init__()
self.input_size=input_size
self.hidden_size=hidden_size
self.num_layers=num_layers
self.output_size=output_size
self.num_directions=2
self.batch_size=batch_size
self.lstm=nn.LSTM(self.input_size,self.hidden_size,self.num_layers,batch_first=True,bidirectional=True)
self.linear=nn.Linear(self.num_directions*self.hidden_size,self.output_size)
defforward(self,input_seq):
h_0=torch.randn(self.num_directions*self.num_layers,self.batch_size,self.hidden_size).to(device)
c_0=torch.randn(self.num_directions*self.num_layers,self.batch_size,self.hidden_size).to(device)
#print(input_seq.size())
seq_len=input_seq.shape[1]
#input(batch_size,seq_len,input_size)
input_seq=input_seq.view(self.batch_size,seq_len,self.input_size)
#output(batch_size,seq_len,num_directions*hidden_size)
output,_=self.lstm(input_seq,(h_0,c_0))
#print(self.batch_size*seq_len,self.hidden_size)
output=output.contiguous().view(self.batch_size*seq_len,self.num_directions*self.hidden_size)#(5*30,64)
pred=self.linear(output)#pred()
pred=pred.view(self.batch_size,seq_len,-1)
pred=pred[:,-1,:]
returnpred
(2)处理后再输入
在LSTM中,经过线性层后的output的shape为(batch_size,seq_len,output_size)。假设我们用前24个小时(1to24)预测后2个小时的负荷(25to26),那么seq_len=24,output_size=2。根据LSTM的原理,最终的输出中包含了所有位置的预测值,也就是((23),(34),(45)(2526))。很显然我们只需要最后一个预测值,即output[:,-1,:]。
而在双向LSTM中,一开始output(batch_size,seq_len,2*hidden_size),这里面包含了所有位置的两个方向的输出。简单来说,output[0]为序列从左往右第一个隐藏层状态输出和序列从右往左最后一个隐藏层状态输出的拼接;output[-1]为序列从左往右最后一个隐藏层状态输出和序列从右往左第一个隐藏层状态输出的拼接。
如果我们想要同时利用前向和后向的输出,我们可以将它们从中间切割,然后求平均。比如output的shape为(30,24,2*64),我们将其变成(30,24,2,64),然后在dim=2上求平均,得到一个shape为(30,24,64)的输出,此时就与单向LSTM的输出一致了。
具体处理方法:
output=output.contiguous().view(self.batch_size,seq_len,self.num_directions,self.hidden_size)
output=torch.mean(output,dim=2)
模型代码:
classBiLSTM(nn.Module):
def__init__(self,input_size,hidden_size,num_layers,output_size,batch_size):
super().__init__()
self.input_size=input_size
self.hidden_size=hidden_size
self.num_layers=num_layers
self.output_size=output_size
self.num_directions=2
self.batch_size=batch_size
self.lstm=nn.LSTM(self.input_size,self.hidden_size,self.num_layers,batch_first=True,bidirectional=True)
self.linear=nn.Linear(self.hidden_size,self.output_size)
defforward(self,input_seq):
h_0=torch.randn(self.num_directions*self.num_layers,self.batch_size,self.hidden_size).to(device)
c_0=torch.randn(self.num_directions*self.num_layers,self.batch_size,self.hidden_size).to(device)
#print(input_seq.size())
seq_len=input_seq.shape[1]
#input(batch_size,seq_len,input_size)
input_seq=input_seq.view(self.batch_size,seq_len,self.input_size)
#output(batch_size,seq_len,num_directions*hidden_size)
output,_=self.lstm(input_seq,(h_0,c_0))
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年微波和高频波解冻设备合作协议书
- 环境绿化与公共设施管理合作协议细节
- 农田灌溉系统安装与维护服务合同
- 网络广告行业精准投放与广告优化策略方案
- 行政管理中的市政学课题研究试题及答案
- 小区智能化设备维护协议
- 2025年照相及电影洗印设备项目建议书
- 酒店租赁运营管理合作协议
- 农业生物技术联合开发协议
- 社交网络行业社交平台建设与运营策略方案
- 旅游景区餐饮服务食品安全培训课件:为游客提供放心饮食
- 《清华大学介绍》课件
- 滨州科技职业学院《遥感原理与应用》2023-2024学年第一学期期末试卷
- 低空经济专业教学资源的建设与优化策略
- 城市老旧小区智能停车场的改造规划
- 《中药调剂技术》课件-发药常规与发药交代
- 急性心肌梗死的急救与护理
- 低年级数学“数学连环画”跨学科主题活动探索
- 《胶体与界面化学》课件
- 池塘淤泥脱水固化施工方案
- 药店转让协议合同
评论
0/150
提交评论