门控循环单元（GRU）与时间序列预测应用

2026/3/20 1:09:34 来源：https://blog.csdn.net/u010986241/article/details/144007279 浏览: 次关键词：门控循环单元（GRU）与时间序列预测应用

一、GRU简介

门控循环单元（Gated Recurrent Unit，简称GRU）是一种简化版的LSTM（长短期记忆网络），专门用于解决长序列中的梯度消失问题。与LSTM相比，GRU具有更简单的结构和较少的参数，但在许多任务上表现出类似的性能，因此被广泛应用于自然语言处理（NLP）、时间序列预测等领域。

二、GRU的核心概念

GRU通过两个门控机制来控制信息流动：

重置门（Reset Gate）：决定前一时间步的隐藏状态 (h_{t-1}) 中有多少信息需要被遗忘。
更新门（Update Gate）：决定当前时间步的隐藏状态有多少信息需要更新。

三、GRU的数学原理

给定输入 ( x_t ) 和前一隐藏状态 ( h_{t-1} )：

重置门计算：
[
r_t = \sigma(W_r x_t + U_r h_{t-1} + b_r)
]
更新门计算：
[
z_t = \sigma(W_z x_t + U_z h_{t-1} + b_z)
]
候选隐藏状态计算：
[
\tilde{h}t = \tanh(W_h x_t + U_h (r_t \odot h{t-1}) + b_h)
]
当前隐藏状态更新：
[
h_t = (1 - z_t) \odot h_{t-1} + z_t \odot \tilde{h}_t
]

四、使用TensorFlow实现GRU进行时间序列预测

我们将使用GRU预测简单正弦波数据，展示其在时间序列建模中的优势。

1. 导入必要的库

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

2. 生成时间序列数据

def generate_time_series(batch_size, n_steps):freq = np.random.rand(batch_size, 1) * 10 + 10time = np.linspace(0, 1, n_steps)series = 0.5 * np.sin((time - 0.5) * freq) + 0.05 * np.random.randn(batch_size, n_steps)return series[..., np.newaxis].astype(np.float32)# 设置参数
batch_size = 1000
n_steps = 50# 生成训练和验证数据
X_train = generate_time_series(batch_size, n_steps + 1)
X_valid = generate_time_series(200, n_steps + 1)

3. 构建GRU模型

model = tf.keras.models.Sequential([tf.keras.layers.GRU(50, return_sequences=True, input_shape=[None, 1]),tf.keras.layers.GRU(50),tf.keras.layers.Dense(1)
])

4. 编译模型

model.compile(optimizer='adam', loss='mse')

5. 训练模型

history = model.fit(X_train[:, :-1], X_train[:, -1], epochs=20,validation_data=(X_valid[:, :-1], X_valid[:, -1]))

6. 预测与可视化结果

X_new = generate_time_series(1, n_steps + 1)
y_pred = model.predict(X_new[:, :-1])plt.plot(X_new[0, :, 0], label="Actual")
plt.plot(np.arange(n_steps), y_pred[0], label="Predicted", linestyle="--")
plt.legend()
plt.show()