今年 6 月,Stability AI 隆重发布了 Stable Diffusion 3 系列的首个开源版本 Stable Diffusion 3 Medium,虽然该版本在图像生成方面确实取得了一定的进步,但它在生成人像以及细节方面仍存在不足。
经过数月的精心打磨和优化,Stability AI 推出了全新的模型 Stable Diffusion 3.5 系列,该系列包含 3 个版本:Large (8B)、Large Turbo (8B) 和 Medium (2.6B)。其中,Stable Diffusion 3.5 Large 是该系列中最强大的模型,拥有 80 亿参数,能够生成高达 100 万像素分辨率的图像,并且可以生成风格更为多样化的图像。分析表明,Stable Diffusion 3.5 Large 的提示词遵循能力 (Prompt Adherence) 处于市场领先地位,并且在生成图像质量方面 (Aesthetic Quality) 可与更大型号的模型相媲美。
「一键部署Stable-Diffusion-3.5-Large 图像生成 Demo」已经上线至 OpenBayes 公共教程啦,无需输入任何命令,一键克隆即可快速体验!
封面图各元素均由 Stable Diffusion 3.5 Large 生成
Demo 运行
01 Demo 运行阶段
1. 登录 OpenBayes.com,在「公共教程」页面,选择「Stable-Diffusion-3.5-Large 图像生成 Demo」。
2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
3. 点击右下角「下一步:选择算力」。
4. 页面跳转后,选择「NVIDIA RTX 4090」以及 「PyTorch」镜像,点击「下一步:审核」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!
5. 确认无误后,点击「继续执行」,等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。
02 效果演示
1. 打开 Demo 界面后,输入 Prompt 和 Negative Prompt 后,点击「Run」即可快速生成高质量图像。
* Prompt: A classic Halloween scene of a witch soaring through the night sky on her broomstick, silhouetted against a bright full moon. Style: Photorealistic, cinematic.
* Negative Prompt: disabled, unclear, ugly
2. 尝试一下不同的风格的 Prompt,可以看到它很好地识别并生成了具有相应风格特征的图像。
* Prompt: An elven princess with flowing silver hair and iridescent wings, standing amidst an ancient forest, her eyes filled with wisdom and a deep connection to nature. Style: Fantasy, ethereal.
* Negative Prompt: disabled, unclear, ugly
* 注册福利:点击下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长,永久有效!