AI绘画-Stable Diffusion 原理介绍及使用

2025/4/23 16:12:36 来源：https://blog.csdn.net/talentyiyy/article/details/140013541 浏览: 次关键词：AI绘画-Stable Diffusion 原理介绍及使用

引言

好像很多朋友对AI绘图有兴趣，AI绘画背后，依旧是大模型的训练。但绘图类AI对计算机显卡有较高要求。建议先了解基本原理及如何使用，在看看如何实现自己垂直行业的绘图AI逻辑。或者作为使用者，调用已有的server接口。

首先需要说明的是，AI绘图和AI识图是不一样的两类训练模型。当然从原理上讲，你可以很范的认为他们都是从训练集中训练神经网络，经过正向传播，反向计算，调整参数，降低loss，并不断迭代。在验证集验证模型，并在测试集上测试模型。但实际上在实作的时候，AI绘图对显卡等硬件资源要求相对更高，且模型在前期，中期，后期的处理手法也不一样。今天以 stable diffusion 为例，看看他的基本原理和怎么用。

Stable Diffusion 主要技术

VAE（变分自编码器）

stable diffusion 采用了VAE模型的预加载方式，在训练过程中，通常会采用预训练的通用VAE（变分自编码器）或自己训练的VAE模型。
他使用Encoder部分对原图片进行处理，将输入图片信息降维到latent space（潜在空间）。
在latent space上应用Diffusion Model进行正向采样和逆向预测。

总的来说，有如下步骤：

数据预处理：使用预训练的VAE模型对输入图片进行编码，将其映射到潜在空间。
正向扩散：在潜在空间上，对编码后的数据添加噪声，模拟扩散过程。
逆向预测：训练模型从含噪声的数据中恢复出原始图像，即逆向扩散过程。
参数调整：通过调整学习率、正则化参数等，控制神经网络参数的变化范围，提高模型的稳定性和收敛性。
结合其他技巧：应用批标准化、残差网络等训练技巧，进一步提高模型的稳定性和训练效果。