ComfyUI/Models 模型目录详解
COMFYUI /models 目录功能图谱 新手模型放置教程 ComfyUI 的 models 文件夹可以理解成一个“模型仓库”。\ 不同模型不能随便乱放,因为每个加载节点只会去对应目录里找文件。 常见根目录结构如下: 新手记住三条规则: 第一,主模型放 checkpoints 或 diffusionmodels。\ \ SD1.5、SDXL 这类整包模型多放 checkpoints;FLUX、…
# COMFYUI /models 目录功能图谱
新手模型放置教程
ComfyUI 的 models 文件夹可以理解成一个“模型仓库”。
不同模型不能随便乱放,因为每个加载节点只会去对应目录里找文件。
常见根目录结构如下:
ComfyUI/
└── models/
├── checkpoints/
├── diffusion_models/
├── text_encoders/
├── vae/
├── loras/
├── controlnet/
├── clip_vision/
├── upscale_models/
└── ...
新手记住三条规则:
第一,主模型放 checkpoints 或 diffusion_models。
SD1.5、SDXL 这类整包模型多放 checkpoints;FLUX、SD3、Wan、部分新架构的分体模型多放 diffusion_models。
第二,辅助模型各回各家。
LoRA 放 loras,VAE 放 vae,ControlNet 放 controlnet,放大模型放 upscale_models。
第三,看工作流需要什么节点,就把模型放到对应目录。
例如工作流里有 Load VAE,就去 models/vae/ 找;有 Load LoRA,就去 models/loras/ 找。
ComfyUI 官方示例里也列出了 checkpoints、text_encoders、clip_vision、configs、controlnet、diffusion_models、embeddings、loras、upscale_models、vae、audio_encoders、model_patches 等常见模型路径;新版里 clip 是 text_encoders 的兼容旧路径,unet 是 diffusion_models 的兼容旧路径。
一、核心生成类
1. audio_encoders
作用:
存放音频编码模型。主要用于音频、语音、视频音频联动、多模态工作流。
常见模型类型:
音频特征提取器、语音编码器、音频理解模型。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/audio_encoders/
├── wav2vec2_audio_encoder.safetensors
├── clap_audio_encoder.bin
└── audio_encoder_fp16.pt
新手理解:
普通文生图、图生图基本用不到。只有当你的工作流涉及“音频转视频”“声音驱动画面”“语音理解”时,才需要这个目录。
2. checkpoints
作用:
存放“整包主模型”。这是新手最常用的文件夹。
适合放:
SD1.5、SDXL、Pony、RealVisXL、JuggernautXL、DreamShaper 等整合模型。
常见后缀:
.safetensors
.ckpt
.pt
示例:
ComfyUI/models/checkpoints/
├── sd_xl_base_1.0.safetensors
├── juggernautXL_v9.safetensors
├── dreamshaper_8.safetensors
└── realisticVisionV60B1_v51.safetensors
对应节点:
Load Checkpoint
CheckpointLoaderSimple
新手理解:
如果你下载的是一个“能直接出图”的大模型,通常先放这里。
例如 Civitai 上常见的 SDXL 大模型,一般就是放 checkpoints。
3. clip
作用:
旧版文本编码器目录。现在很多新工作流更推荐使用 text_encoders。ComfyUI 源码中也把 clip 作为 text_encoders 的 legacy location,也就是兼容旧路径。
适合放:
旧版 CLIP 文本编码器、部分 SDXL / SD3 / FLUX 工作流要求的文本编码模型。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/clip/
├── clip_l.safetensors
├── clip_g.safetensors
└── t5xxl_fp16.safetensors

新手建议:
如果你的教程或工作流写的是 models/clip/,就放这里;如果是新版 FLUX、SD3、Flux.2、Qwen-Image 等,优先看是否要求放 text_encoders。
4. clip_interrogator
作用:
存放“反推提示词”相关模型。它可以根据一张图片分析出可能的标签、风格词或提示词。
适合放:
CLIP Interrogator、BLIP、图像标签识别模型、caption 模型。
常见后缀:
.safetensors
.pt
.bin
.pkl
有些插件也会要求完整 Hugging Face 文件夹结构,例如:
config.json
pytorch_model.bin
preprocessor_config.json
tokenizer.json
示例:
ComfyUI/models/clip_interrogator/
├── blip-image-captioning-base/
│ ├── config.json
│ ├── pytorch_model.bin
│ └── preprocessor_config.json
└── clip_interrogator_model.safetensors
新手理解:
这个文件夹不是出图核心模型,而是“看图说话”的辅助模型。
适合做图片反推 prompt、自动打标签、素材分析。
5. clip_vision
作用:
存放图像编码器。它不是用来理解文字,而是用来理解图片。
适合放:
IP-Adapter、风格参考、人物参考、图像条件控制相关的视觉编码器。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/clip_vision/
├── CLIP-ViT-H-14-laion2B-s32B-b79K.safetensors
├── clip_vision_g.safetensors
└── sigclip_vision_patch14.safetensors
对应节点:
Load CLIP Vision
CLIPVisionLoader
新手理解:
如果你做 IP-Adapter、参考图迁移、风格参考、人脸参考,通常需要 clip_vision。
6. configs
作用:
存放模型配置文件。部分旧模型或特殊模型加载时,需要 .yaml 配置文件。
常见后缀:
.yaml
.yml
示例:
ComfyUI/models/configs/
├── v1-inference.yaml
├── v2-inference.yaml
└── sd_xl_base.yaml
新手理解:
现在很多 .safetensors 模型已经自带必要信息,新手一般很少手动碰 configs。
如果某个旧模型加载报错,教程让你放 .yaml,再放这里。
7. diffusers
作用:
存放 Hugging Face Diffusers 格式的模型目录。
注意:
这里通常不是放单个 .safetensors 文件,而是放一个完整文件夹。
常见结构:
ComfyUI/models/diffusers/
└── some-diffusers-model/
├── model_index.json
├── scheduler/
├── text_encoder/
├── tokenizer/
├── unet/
└── vae/
常见文件:
model_index.json
config.json
diffusion_pytorch_model.safetensors
diffusion_pytorch_model.bin
新手理解:
如果你在 Hugging Face 下载的是一个“整文件夹”,里面有 model_index.json,很可能是 Diffusers 格式,可以考虑放 diffusers。
8. diffusion_models
作用:
存放扩散模型核心权重。新版架构经常使用这个目录,尤其是 FLUX、SD3、Flux.2 Klein 等分体模型。
适合放:
FLUX 主模型、SD3 主模型、Flux.2 Klein 主模型、部分视频模型的扩散主体。
常见后缀:
.safetensors
.ckpt
.pt
.pth
.bin
示例:
ComfyUI/models/diffusion_models/
├── flux1-dev.safetensors
├── flux1-schnell.safetensors
├── flux-2-klein-base-9b-fp8.safetensors
├── flux-2-klein-9b-fp8.safetensors
└── sd3_medium.safetensors
对应节点:
Load Diffusion Model
UNETLoader
新手理解:
如果工作流用的是 Load Diffusion Model,通常模型就放这里。
FLUX、SD3 这种“主模型 + 文本编码器 + VAE”分体结构,不一定放 checkpoints,很多时候放 diffusion_models。
9. text_encoders
作用:
存放文本编码器。它负责把你的提示词转成模型能理解的条件信息。
适合放:
CLIP、T5、Qwen、Gemma、LLaMA 类文本编码器,尤其是 FLUX、SD3、Flux.2、Qwen-Image 等新模型工作流。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/text_encoders/
├── clip_l.safetensors
├── clip_g.safetensors
├── t5xxl_fp16.safetensors
├── t5xxl_fp8_e4m3fn.safetensors
├── qwen_3_4b.safetensors
└── qwen_3_8b_fp8mixed.safetensors
对应节点:
Load Text Encoder
CLIPLoader
DualCLIPLoader
TripleCLIPLoader
新手理解:
文生图不是模型直接读中文或英文,而是先由文本编码器理解 prompt。
FLUX、SD3、Flux.2 这类新模型经常需要你额外下载 text encoder。
10. unet
作用:
旧版或兼容路径,用来放 U-Net / diffusion 主体模型。新版 ComfyUI 中它通常被映射到 diffusion_models。
适合放:
旧教程要求放到 models/unet/ 的 FLUX、SD3、U-Net 权重。
常见后缀:
.safetensors
.pt
.pth
.ckpt
示例:
ComfyUI/models/unet/
├── flux1-dev.safetensors
└── sd3_medium.safetensors
新手建议:
如果你是新装 ComfyUI,优先用:
models/diffusion_models/
如果你下载的旧工作流明确写 models/unet/,再放 unet。
11. vae
作用:
存放 VAE 模型。VAE 负责把 latent 潜空间结果解码成可见图片,也影响色彩、对比度、细节和明暗。
适合放:
SD1.5 VAE、SDXL VAE、FLUX VAE、Flux.2 VAE。
常见后缀:
.safetensors
.pt
.ckpt
示例:
ComfyUI/models/vae/
├── vae-ft-mse-840000-ema-pruned.safetensors
├── sdxl_vae.safetensors
├── ae.safetensors
└── flux2-vae.safetensors
对应节点:
Load VAE
VAELoader
VAE Decode
VAE Encode
新手理解:
如果图片发灰、颜色怪、细节糊,有时不是主模型问题,而是 VAE 不匹配。
SDXL 用 SDXL VAE,FLUX 用 FLUX 对应 VAE。
12. vae_approx
作用:
存放轻量级预览 VAE。它通常用于快速预览 latent,而不是最终高质量解码。
常见后缀:
.safetensors
.pt
.pth
示例:
ComfyUI/models/vae_approx/
├── taesd_decoder.safetensors
├── taesdxl_decoder.safetensors
└── taef1_decoder.safetensors
新手理解:
这个目录更多是为了“预览速度”。
最终出图仍然建议使用正式 VAE。
## 二、控制与风格类
13. controlnet
作用:
存放 ControlNet 模型,用来控制画面的结构。
适合放:
线稿控制、深度控制、姿态控制、边缘控制、分割图控制、Tile 细节控制模型。
常见后缀:
.safetensors
.pth
.pt
.ckpt
示例:
ComfyUI/models/controlnet/
├── control_v11p_sd15_canny.pth
├── control_v11f1p_sd15_depth.pth
├── control_v11p_sd15_openpose.pth
├── controlnet-union-sdxl-1.0.safetensors
└── flux-controlnet-canny.safetensors
对应节点:
Load ControlNet Model
Apply ControlNet
新手理解:
想让人物姿势固定、构图固定、线稿变成图,就会用到 ControlNet。
14. embeddings
作用:
存放 Textual Inversion 词嵌入模型。它通常是一个触发词,对应某种人物、风格、概念或画质倾向。
常见后缀:
.pt
.safetensors
.bin
示例:
ComfyUI/models/embeddings/
├── easynegative.safetensors
├── bad-hands-5.pt
├── negative_hand-neg.pt
└── style-embedding.pt
使用方式:
通常不需要单独加载节点,而是在 prompt 里写触发词。
例子:
positive prompt:
portrait, soft light, cinematic
negative prompt:
easynegative, bad-hands-5
新手理解:
它不是 LoRA,也不是主模型,更像“提示词增强包”。
15. gligen
作用:
存放 GLIGEN 模型,用于区域、框选、布局引导。
常见后缀:
.safetensors
.ckpt
.pt
.pth
示例:
ComfyUI/models/gligen/
└── gligen_sd14_textbox_pruned.safetensors
新手理解:
它可以理解成“指定某个区域生成某个东西”的旧式布局控制方案。
现在很多人会用 ControlNet、区域提示词、Segment Anything 或其他插件替代它。
16. hypernetworks
作用:
存放 Hypernetwork 模型。它是早期 Stable Diffusion 生态里的增强模型,用来影响风格或特征。
常见后缀:
.pt
.safetensors
.ckpt
示例:
ComfyUI/models/hypernetworks/
├── anime_style_hypernetwork.pt
└── detail_enhancer_hypernetwork.safetensors
新手理解:
这是比较旧的技术。现在更常用 LoRA。
如果你是新手,除非工作流明确要求,否则可以先不用管。
17. loras
作用:
存放 LoRA 模型。LoRA 是最常用的风格、人物、服装、材质、动作补充模型。
适合放:
人物 LoRA、画风 LoRA、产品 LoRA、服装 LoRA、姿势 LoRA、材质 LoRA、光影 LoRA。
常见后缀:
.safetensors
.pt
示例:
ComfyUI/models/loras/
├── cinematic_lighting_lora.safetensors
├── anime_style_v2.safetensors
├── product_photo_lora.safetensors
├── chinese_ink_style.safetensors
└── character_xxx_lora.safetensors
对应节点:
Load LoRA
LoraLoader
新手理解:
主模型决定基础能力,LoRA 决定附加风格。
比如你想让 SDXL 画“某种海报风格”,一般就是加载一个 LoRA。
18. style_models
作用:
存放风格模型。它通常用于风格迁移、风格统一、视觉风格参考等工作流。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/style_models/
├── style_model.safetensors
├── ipadapter_style_model.safetensors
└── visual_style_encoder.pt
新手理解:
这个目录和 loras 不一样。LoRA 是直接影响生成模型权重,style model 更多是作为“风格条件”被节点读取。
19. photomaker
作用:
存放 PhotoMaker 相关模型。它常用于人物身份一致性、参考照片生成、写真类工作流。
常见后缀:
.safetensors
.bin
.pt
示例:
ComfyUI/models/photomaker/
├── photomaker-v1.bin
├── photomaker-v2.bin
└── photomaker-v2.safetensors
新手理解:
如果你想用几张人物参考图生成同一个人,PhotoMaker 类工作流可能会用到这个目录。
20. Personalized_Model
作用:
个性化模型目录。这个名字通常来自某些自定义节点或个人工作流,不一定是 ComfyUI 核心默认通用目录。
适合放:
某些插件要求的个性化人物模型、训练后的个人模型、定制风格模型。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/Personalized_Model/
├── my_character_model.safetensors
├── personal_style_v1.pt
└── custom_identity_model.bin
新手注意:
这个目录是否生效,取决于你的自定义节点是否会读取它。ComfyUI 官方也提醒,很多模型能力来自社区自定义节点,不同项目的路径和加载节点可能不同,要以插件 README 为准。
三、放大与修补类
21. latent_upscale_models
作用:
存放 latent 潜空间放大模型。它不是直接把图片像素放大,而是在 latent 阶段放大。
常见后缀:
.safetensors
.pt
.pth
示例:
ComfyUI/models/latent_upscale_models/
├── latent_upscaler_sd15.pt
├── latent_upscaler_xl.safetensors
└── latent_upscale_model.pth

新手理解:
普通新手最常用的是 upscale_models。latent_upscale_models 更偏进阶工作流,比如先在潜空间放大,再继续采样细化。
22. model_patches
作用:
存放模型补丁、增量权重、特殊修补模型。常见于某些高级模型加载方式或插件。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/model_patches/
├── model_patch_fp8.safetensors
├── attention_patch.pt
└── special_adapter_patch.safetensors
新手理解:
这个目录不是日常必用。
只有当某个工作流明确写“把 patch 放到 model_patches”时,你再放。
23. upscale_models
作用:
存放图片超分、放大、修复模型。
适合放:
ESRGAN、RealESRGAN、SwinIR、4x-UltraSharp、AnimeSharp、NMKD 等放大模型。
常见后缀:
.pth
.pt
.safetensors
示例:
ComfyUI/models/upscale_models/
├── 4x-UltraSharp.pth
├── RealESRGAN_x4plus.pth
├── RealESRGAN_x4plus_anime_6B.pth
├── 4x_NMKD-Siax_200k.pth
└── SwinIR_4x.pth
对应节点:
Load Upscale Model
Upscale Image Using Model
新手理解:
如果你想把 1024 图放大到 2048、4096,常用这个目录。
四、识别与分析类
24. ultralytics
作用:
存放 Ultralytics / YOLO 系列检测模型。常用于目标检测、人体识别、分割、自动框选。
常见后缀:
.pt
.onnx
.engine
示例:
ComfyUI/models/ultralytics/
├── yolov8n.pt
├── yolov8s-seg.pt
├── yolov10n.pt
└── custom_detector.onnx
新手理解:
这类模型不是生成图片,而是“识别图片里有什么”。
例如自动识别人脸、人物、手部、商品区域,然后交给后续节点处理。
25. yolo
作用:
也是 YOLO 检测模型目录。某些插件读取 ultralytics,某些插件读取 yolo,所以你的机器里可能两个都有。
常见后缀:
.pt
.onnx
.engine
示例:
ComfyUI/models/yolo/
├── face_yolov8n.pt
├── hand_yolo.pt
├── person_detector.pt
└── object_segment.onnx
新手理解:
如果某个节点报错说找不到 YOLO 模型,先看插件说明到底要求放 models/yolo 还是 models/ultralytics。
五、多模态与扩展类
26. LLM
作用:
存放大语言模型。常用于提示词扩写、文本理解、自动写 prompt、多模态代理工作流。
常见后缀:
.safetensors
.bin
.gguf
示例:
ComfyUI/models/LLM/
├── qwen2.5-7b-instruct.gguf
├── llama-3.1-8b-instruct.gguf
├── text_prompt_expander.safetensors
└── model-00001-of-00004.safetensors
新手注意:
ComfyUI 官方文档说明,ComfyUI 原生并不直接支持 GGUF;如果要使用 GGUF,通常需要安装对应社区自定义节点,例如 GGUF 相关插件。
新手理解:
如果你的工作流只是普通文生图,不需要这个目录。
如果你要让 ComfyUI 自动帮你扩写 prompt、理解图片、写文案,就可能用到 LLM。
27. seedvr2
作用:
通常是 SeedVR2 视频 / 视觉增强相关插件目录。它一般不是 ComfyUI 核心通用目录,而是某些视频增强、自定义节点工作流创建的目录。
常见后缀:
.safetensors
.pt
.pth
.bin
示例:
ComfyUI/models/seedvr2/
├── seedvr2_video_enhance.safetensors
├── seedvr2_sr_model.pth
└── seedvr2_v1.pt
新手理解:
这个目录是否有用,完全取决于你是否安装了 SeedVR2 相关插件。
如果你没有用视频增强工作流,可以先不用管。
新手最常用的 8 个文件夹
如果你刚入门,不需要一下子理解所有目录。先掌握这 8 个就够了:
checkpoints 主模型整包
diffusion_models FLUX / SD3 等分体主模型
text_encoders 文本编码器
vae VAE 解码模型
loras LoRA 风格 / 人物 / 材质
controlnet 结构控制模型
clip_vision 图像参考编码器
upscale_models 图片放大模型
常见模型后缀速查
ComfyUI 核心模型目录里常见权重后缀包括:
.safetensors
.ckpt
.pt
.pt2
.bin
.pth
.pkl
.sft
这些是 ComfyUI 当前源码里列出的常见权重扩展名;configs 主要使用 .yaml,diffusers 则通常读取整个文件夹结构。
新手优先选择:
.safetensors
原因是它更常见、更安全、加载也更规范。
下载模型后怎么放?给你几个典型案例
案例 1:下载了一个 SDXL 大模型
文件名:
juggernautXL_v9.safetensors
放这里:
ComfyUI/models/checkpoints/juggernautXL_v9.safetensors
ComfyUI 节点选择:
Load Checkpoint
案例 2:下载了一个 LoRA
文件名:
cinematic_lighting_lora.safetensors
放这里:
ComfyUI/models/loras/cinematic_lighting_lora.safetensors
ComfyUI 节点选择:
Load LoRA
案例 3:下载了一个 VAE
文件名:
sdxl_vae.safetensors
放这里:
ComfyUI/models/vae/sdxl_vae.safetensors
ComfyUI 节点选择:
Load VAE
案例 4:下载了 FLUX 主模型
文件名:
flux1-dev.safetensors
放这里:
ComfyUI/models/diffusion_models/flux1-dev.safetensors
可能还需要文本编码器:
ComfyUI/models/text_encoders/t5xxl_fp16.safetensors
ComfyUI/models/text_encoders/clip_l.safetensors
还可能需要 VAE:
ComfyUI/models/vae/ae.safetensors
ComfyUI 节点选择:
Load Diffusion Model
Load Text Encoder
Load VAE
案例 5:下载了 Flux.2 Klein 9B
主模型:
flux-2-klein-base-9b-fp8.safetensors
放这里:
ComfyUI/models/diffusion_models/flux-2-klein-base-9b-fp8.safetensors
文本编码器:
qwen_3_8b_fp8mixed.safetensors
放这里:
ComfyUI/models/text_encoders/qwen_3_8b_fp8mixed.safetensors
VAE:
flux2-vae.safetensors
放这里:
ComfyUI/models/vae/flux2-vae.safetensors
案例 6:下载了 ControlNet Canny
文件名:
control_v11p_sd15_canny.pth
放这里:
ComfyUI/models/controlnet/control_v11p_sd15_canny.pth
ComfyUI 节点选择:
Load ControlNet Model
Apply ControlNet
案例 7:下载了 IP-Adapter 相关模型
IP-Adapter 模型通常放:
ComfyUI/models/ipadapter/
但你的图里没有这个目录。很多 IP-Adapter 插件会自己创建对应目录。
CLIP Vision 模型则通常放:
ComfyUI/models/clip_vision/
例如:
ComfyUI/models/clip_vision/CLIP-ViT-H-14-laion2B-s32B-b79K.safetensors
案例 8:下载了 4x-UltraSharp 放大模型
文件名:
4x-UltraSharp.pth
放这里:
ComfyUI/models/upscale_models/4x-UltraSharp.pth
ComfyUI 节点选择:
Load Upscale Model
Upscale Image Using Model
新手排错清单
如果你把模型放进去了,但 ComfyUI 里看不到,按这个顺序检查:
- 文件夹是否放对。
LoRA 不要放checkpoints,VAE 不要放loras。 - 后缀是否支持。
优先用.safetensors、.pt、.pth、.ckpt、.bin。 - ComfyUI 是否刷新或重启。
官方文档建议复制模型后刷新或重启,让模型列表更新。 - 节点是否选对。
Load Checkpoint找checkpoints;Load LoRA找loras;Load VAE找vae。 - 是不是插件目录。
例如LLM、seedvr2、Personalized_Model、ultralytics、yolo这类目录,往往依赖自定义节点。插件没装,目录存在也不一定有用。 - 模型路径是否太深。
一般建议:
ComfyUI/models/loras/xxx.safetensors
不要放成:
ComfyUI/models/loras/xxx/xxx/xxx.safetensors
- 外置硬盘模型路径需要配置。
如果你想把模型放在别的盘,ComfyUI 支持通过extra_model_paths.yaml添加额外模型路径。
给新手的最佳整理方式
建议你把模型按用途再分子文件夹,例如:
ComfyUI/models/checkpoints/
├── SDXL/
├── SD15/
├── Pony/
└── Realistic/
ComfyUI/models/loras/
├── character/
├── style/
├── product/
├── clothing/
└── lighting/
ComfyUI/models/controlnet/
├── sd15/
├── sdxl/
└── flux/
ComfyUI/models/upscale_models/
├── realistic/
├── anime/
└── general/
这样模型多了以后不会乱。
一句话总结
models 文件夹不是随便堆模型的地方,而是 ComfyUI 的“模型分类仓库”:
主模型 → checkpoints / diffusion_models
文本编码器 → text_encoders / clip
VAE → vae
LoRA → loras
ControlNet → controlnet
图像参考编码器 → clip_vision
放大模型 → upscale_models
插件模型 → 看插件要求
新手最稳的做法是:先看工作流里用了什么 Load 节点,再把模型放到对应文件夹。
