⚡[AI里程碑]StableDiffusion3今日开源 | 首个开源超越Midjourney
2024年6月12日,Stable Diffusion 3 Medium的开源代表了生成式 AI 发展的一个重要里程碑。




SD3 Medium 是一个 20 亿参数的 SD3 模型,提供一些显着的功能:

Stable Diffusion 3 (SD3) 是一种文本到图像模型,由 Stability AI 于 2024 年 6 月 12 日发布。他们的模型系列的下一次演变是在去年大约同一时间推出的突破性 SDXL 的基础上进行的。


这些模型可以像 ComfyUI 中的任何常规检查点一样使用。
sd3_medium.safetensors 包括 MMDiT 和 VAE 权重,但不包括任何文本编码器。sd3_medium_incl_clips_t5xxlfp8.safetensors 包含所有必要的权重,包括 T5XXL 文本编码器的 fp8 版本,提供质量和资源要求之间的平衡。sd3_medium_incl_clips.safetensors 包括除 T5XXL 文本编码器之外的所有必需权重。它需要最少的资源,但如果没有 T5XXL 文本编码器,模型的性能将会有所不同。确保将 sd3_medium_incl_clips.safetensors 或 sd3_medium_incl_clips_t5xxlfp8.safetensors 放入 ComfyUI/models/checkpoints 目录中。
SD3 Medium 基本文件不包含文本编码器/CLIP 权重,因此您必须单独加载它们才能使用该文件。
从 Civita 下载文本编码器权重并将其放入您的 ComfyUI/models/clip/ 目录中。 sd3_medium.safetensors 应放在您的 ComfyUI/models/checkpoints/ 目录中。


import torch
from diffusers import StableDiffusion3Pipeline
pipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", torch_dtype=torch.float16)
pipe = pipe.to("cuda")
image = pipe(
"A cat holding a sign that says hello world",
negative_prompt="",
num_inference_steps=28,
guidance_scale=7.0,
).images[0]
image
我们使用合成数据并过滤公开可用的数据来训练我们的模型。
您可以在此处从 Civitai 下载所有 SD3 safetensors、文本编码器和示例 ComfyUI 工作流程。

out-0
本文分享自 iResearch666 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!