阅读量:0
PyTorch中的LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)是通过torch.nn模块实现的。在PyTorch中,可以使用torch.nn.LSTM和torch.nn.GRU类来创建LSTM和GRU模型。
下面是一个简单的例子,演示如何使用PyTorch中的LSTM和GRU:
import torch import torch.nn as nn # 定义输入数据 input_size = 10 hidden_size = 20 seq_len = 5 batch_size = 3 input_data = torch.randn(seq_len, batch_size, input_size) # 使用LSTM lstm = nn.LSTM(input_size, hidden_size) output, (h_n, c_n) = lstm(input_data) print("LSTM output shape:", output.shape) print("LSTM hidden state shape:", h_n.shape) print("LSTM cell state shape:", c_n.shape) # 使用GRU gru = nn.GRU(input_size, hidden_size) output, h_n = gru(input_data) print("GRU output shape:", output.shape) print("GRU hidden state shape:", h_n.shape)
在上面的例子中,我们首先定义了输入数据的维度,并使用torch.nn.LSTM和torch.nn.GRU类分别创建了一个LSTM和一个GRU模型。然后,我们将输入数据传递给这两个模型,并输出它们的输出和隐藏状态的形状。
值得注意的是,LSTM和GRU模型的输出形状可能会有所不同,具体取决于输入数据的维度和模型的参数设置。通常,输出形状将包含序列长度、批次大小和隐藏单元数量等信息。