SGM（Score-Based Generative Model）扩散模型简介

2025/7/2 7:30:51 来源：https://blog.csdn.net/jiangnanjunxiu/article/details/141503160 浏览: 次关键词：SGM（Score-Based Generative Model）扩散模型简介

介绍

扩散模型（Diffusion Models）近年来在生成建模中获得了广泛关注。特别是Score-Based Generative Model（SGM），在图像生成等任务上表现出色。本文将介绍SGM的原理，并结合代码示例，帮助您更好地理解这一强大的生成模型。

1. 什么是扩散模型？

扩散模型是一类生成模型，其核心思想是从一个简单的分布（如高斯噪声）逐渐演变成复杂的目标分布。这个过程可以看作是从无序到有序的反向扩散（Reverse Diffusion）。这种模型最早由Sohl-Dickstein等人在2015年提出，并在2020年由Song等人通过结合得分匹配的思想进一步推广。

2. 扩散过程的数学表示

扩散过程可以通过一个正向过程和一个反向过程来描述：

2.1 正向过程

正向过程将数据逐渐加入噪声，最终接近一个简单的高斯分布。这个过程的每一步可以表示为：

$q(\mathbf{x}_t | \mathbf{x}_{t-1}) = \mathcal{N}(\mathbf{x}_t; \sqrt{1-\beta_t} \mathbf{x}_{t-1}, \beta_t \mathbf{I})$

其中， $\beta_t$ 是时间步 $t$ 的噪声增量参数， $\mathbf{x}_t$ 表示在时间 $t$ 的随机变量。

2.2 反向过程

反向过程试图从一个高斯噪声开始，逐步去噪声，恢复原始数据。这个过程的每一步可以表示为：

$p_\theta(\mathbf{x}_{t-1} | \mathbf{x}_t) = \mathcal{N}(\mathbf{x}_{t-1}; \mu_\theta(\mathbf{x}_t, t), \Sigma_\theta(\mathbf{x}_t, t))$

其中， $\mu_\theta$ 和 $\Sigma_\theta$ 是需要学习的参数。

3. 得分匹配与SGM

SGM利用了得分匹配（Score Matching）的方法来训练模型。得分函数是对数密度函数的梯度，即：

$s_\theta(\mathbf{x}, t) = \nabla_{\mathbf{x}} \log p_\theta(\mathbf{x}, t)$

通过训练一个神经网络来逼近得分函数，SGM可以有效地生成高质量的数据样本。

4. SGM的训练过程

SGM的训练过程涉及最小化以下的得分匹配目标函数：

$L(\theta) = \mathbb{E}_{t, \mathbf{x}_t} \left[\lambda(t) \left\| s_\theta(\mathbf{x}_t, t) - \nabla_{\mathbf{x}_t} \log q(\mathbf{x}_t) \right\|^2\right]$

其中， $\lambda(t)$ 是一个权重函数，用于平衡不同时间步的误差。

5. 代码示例

以下是一个简化的SGM训练代码示例，使用PyTorch实现：

import torch
import torch.nn as nn
import torch.optim as optimclass ScoreNet(nn.Module):def __init__(self):super(ScoreNet, self).__init__()self.net = nn.Sequential(nn.Linear(2, 128),nn.ReLU(),nn.Linear(128, 128),nn.ReLU(),nn.Linear(128, 2))def forward(self, x, t):return self.net(torch.cat([x, t], dim=1))def loss_fn(score_net, x, t, noise):predicted_noise = score_net(x, t)return ((predicted_noise - noise) ** 2).mean()# 模拟数据和噪声
x = torch.randn(64, 2)
t = torch.rand(64, 1)
noise = torch.randn(64, 2)# 初始化模型和优化器
score_net = ScoreNet()
optimizer = optim.Adam(score_net.parameters(), lr=1e-3)# 训练步骤
optimizer.zero_grad()
loss = loss_fn(score_net, x, t, noise)
loss.backward()
optimizer.step()print(f"Training loss: {loss.item()}")