【LSTM和GRU极简,和最新的TT也就是状态】机器学习模型来学习状态

avatar
作者
筋斗云
阅读量:2

LSTM(长短期记忆网络)中的关键参数包括输入门、遗忘门、输出门、细胞状态和隐藏状态。以下是如何进行推理计算的示例:

LSTM参数和公式

  1. 输入门(i_t):决定输入的信息量。
    在这里插入图片描述

  2. 遗忘门(f_t):决定遗忘上一个状态的信息量。
    在这里插入图片描述

  3. 细胞状态(C_t):存储长期信息。
    在这里插入图片描述

  4. 输出门(o_t):决定输出的信息量。
    在这里插入图片描述

  5. 隐藏状态(h_t):输出短期记忆。
    [ h_t = o_t * \tanh(C_t) ]

推理计算示例

假设我们有以下输入数据和参数:
在这里插入图片描述

计算步骤

在这里插入图片描述
总结:训练所得四个权重,然后不停的更新状态,遗忘并输出在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

GRU 少了门,更新,重置,状态 3个权重。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!