惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

WordPress大学
WordPress大学
Microsoft Security Blog
Microsoft Security Blog
Security Archives - TechRepublic
Security Archives - TechRepublic
V
Visual Studio Blog
宝玉的分享
宝玉的分享
IT之家
IT之家
人人都是产品经理
人人都是产品经理
T
The Blog of Author Tim Ferriss
I
InfoQ
B
Blog RSS Feed
T
Threatpost
博客园_首页
M
MIT News - Artificial intelligence
Spread Privacy
Spread Privacy
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Know Your Adversary
Know Your Adversary
U
Unit 42
Engineering at Meta
Engineering at Meta
C
Cyber Attacks, Cyber Crime and Cyber Security
月光博客
月光博客
Scott Helme
Scott Helme
T
Tor Project blog
有赞技术团队
有赞技术团队
AWS News Blog
AWS News Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Last Week in AI
Last Week in AI
S
Schneier on Security
Vercel News
Vercel News
博客园 - Franky
C
Cybersecurity and Infrastructure Security Agency CISA
L
LINUX DO - 热门话题
NISL@THU
NISL@THU
L
LangChain Blog
爱范儿
爱范儿
Google DeepMind News
Google DeepMind News
The GitHub Blog
The GitHub Blog
雷峰网
雷峰网
Latest news
Latest news
C
CXSECURITY Database RSS Feed - CXSecurity.com
Hugging Face - Blog
Hugging Face - Blog
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
S
Security Affairs
A
About on SuperTechFans
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
大猫的无限游戏
大猫的无限游戏
W
WeLiveSecurity
Cisco Talos Blog
Cisco Talos Blog
罗磊的独立博客

StableDiffusion – liseezn'blog

暂无文章

ComfyUI 实战:从安装到生成第一张 AI 绘画 – liseezn'blog
liseeze · 2024-08-09 · via StableDiffusion – liseezn'blog

本文最后更新于37 天前,其中的信息可能已经过时,如有错误请发送邮件到[email protected]

上一篇文章我们搞定了自动化,来玩点视觉上的东西。

2024 年 8 月,Stable Diffusion 的图像生成技术已经非常成熟,而 ComfyUI 作为节点式工作流工具,这个月在 GitHub 上也十分活跃。它把图像生成的每个步骤都变成了可以自由连接的节点,提供了极大的创作自由。

这篇文章带你从安装 ComfyUI 开始,一步步搭建一个「文生图→放大→面部修复」的全流程,完全是零基础友好型教程。

  1. ComfyUI 是什么?

ComfyUI 是一个基于节点的 Stable Diffusion 图形界面。与传统的 WebUI 不同,它用可视化节点和连线来表示整个图像生成流程。

举个例子:你想生成一张图,然后放大它,再修复面部细节。在 ComfyUI 里,你只需要拖三个节点,用线连起来就行了。每一步都看得见,每一步都可以单独调整。

  1. 安装 ComfyUI

Windows 用户

去 ComfyUI 的 GitHub 仓库(https://github.com/comfyanonymous/ComfyUI),点击绿色的 Code 按钮,选择 Download ZIP,解压到一个你喜欢的文件夹。

解压后,文件夹里有 run_cpu.bat(用 CPU 跑)和 run_nvidia_gpu.bat(用显卡跑)。双击对应的 bat 文件,首次运行会自动下载依赖并安装。

macOS / Linux 用户

打开终端,依次执行:

git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
python main.py

安装模型

ComfyUI 只是一个界面,还需要安装图像生成模型才能出图。

去 HuggingFace 或 Civitai 下载你喜欢的 Stable Diffusion 模型(推荐 SD 1.5 或 SDXL),把下载的 .safetensors 文件放到 ComfyUI/models/checkpoints/ 文件夹里。

放好之后,刷新 ComfyUI 页面,模型就会出现在加载列表中了。

  1. ComfyUI 界面速览

打开浏览器访问 http://localhost:8188,你会看到:

· 画布区域(中间大片空白):所有节点在这里拖拽和连线
· 节点菜单(右键点击画布):右键添加各种节点
· 提示词框(如果有默认工作流):输入你想要生成的画面描述
· Queue Prompt 按钮(右上角):点击后开始生成,可以排队多个任务

  1. 搭建第一个工作流:文生图

右键点击画布空白处,选择 Add Node → loaders → Load Checkpoint,添加模型加载节点。在节点中选择你安装的模型。

接着,右键添加 Add Node → sampling → KSampler,这是控制图像生成参数的核心节点。

然后右键添加 Add Node → latent → Empty Latent Image,设置生成的图像分辨率(SD 1.5 推荐 512×768,SDXL 推荐 1024×1024)。

最后,添加两个文本节点:Add Node → conditioning → CLIP Text Encode (Positive) 和 CLIP Text Encode (Negative)。在 Positive 框里输入你想生成的内容描述,Negative 框里输入你不想出现的内容(如”畸形的手指、多余的手指”等)。

现在把它们连接起来:

  1. Load Checkpoint 的 MODEL 输出 → KSampler 的 MODEL 输入
  2. Load Checkpoint 的 CLIP 输出 → Positive 和 Negative 的 CLIP 输入
  3. Positive 的 CONDITIONING 输出 → KSampler 的 positive 输入
  4. Negative 的 CONDITIONING 输出 → KSampler 的 negative 输入
  5. Empty Latent Image 的 LATENT 输出 → KSampler 的 latent_image 输入

最后,添加 Add Node → image → VAE Decode,把 Load Checkpoint 的 VAE 输出连接到 VAE Decode,KSampler 的 LATENT 输出也连接到 VAE Decode。再加一个 Add Node → image → Preview Image,把 VAE Decode 的 IMAGE 输出连接到它,用来显示结果。

点击右上角的 Queue Prompt,等几秒到几分钟(取决于你的硬件),你的第一张 AI 绘画就出现了。

  1. 进阶:加入放大和面部修复

ComfyUI 的强大之处在于你可以轻松扩展工作流。

放大图像

在 KSampler 之后添加 Add Node → latent → Latent Upscale,设置放大倍数为 2。然后添加第二个 KSampler,连接放大后的 latent,进行二次采样。这一步叫做”hires fix”,能大幅提升图像的细节和清晰度。

面部修复

如果你的画面里有人物,面部经常会出现扭曲或不自然。安装 Face Detailer 自定义节点(可以通过 ComfyUI Manager 一键安装),把它连接在 VAE Decode 之后,它会自动检测并修复画面中的面部区域。

  1. 常见问题

· 显存不够/跑不动:试试更小的模型(如 SD 1.5),或使用量化的 FP16 版本。
· 出图效果不好:调整 KSampler 的 steps(步数)到 20-30,cfg(提示词相关度)到 5-8,这两个参数影响最大。
· 模型下载慢:可以使用国内的镜像站下载,或者直接用 HuggingFace 的加速链接。

小结

现在你已经可以在 ComfyUI 里搭建文生图工作流,并加入放大和面部修复了。最重要的是,你理解了节点式工作流的核心思想——就像搭乐高一样,把不同的”功能块”组合起来,创造出自己的专属流程。