文生图基础 #

文生图概述 #

什么是文生图？ #

文生图（Text-to-Image）是指通过文本描述生成图像的技术，是 AI 绘画最基础也是最重要的功能。

text

┌─────────────────────────────────────────────────────────────┐
│                    文生图流程                                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  输入                        处理                      输出  │
│                                                             │
│  ┌──────────┐            ┌──────────┐            ┌──────────┐│
│  │ 文本描述  │ ─────────→ │ AI 模型  │ ─────────→ │ 生成图像  ││
│  │          │            │ 采样生成  │            │          ││
│  └──────────┘            └──────────┘            └──────────┘│
│                                                             │
│  "a beautiful sunset       Stable Diffusion      日落图像    │
│   over the ocean"                                          │
│                                                             │
└─────────────────────────────────────────────────────────────┘

基础工作流 #

标准文生图工作流 #

text

┌─────────────────────────────────────────────────────────────┐
│                    标准文生图工作流                          │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  ┌─────────────┐                                           │
│  │ Load        │                                           │
│  │ Checkpoint  │───────────────────────────────┐           │
│  └─────────────┘                               │           │
│                                                ▼           │
│  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐   │
│  │ CLIP Text   │     │ Empty       │     │             │   │
│  │ Encode      │────→│ Latent      │────→│  KSampler   │   │
│  │ (Positive)  │     │ Image       │     │             │   │
│  └─────────────┘     └─────────────┘     │             │   │
│                                          │             │   │
│  ┌─────────────┐                         │             │   │
│  │ CLIP Text   │                         │             │   │
│  │ Encode      │────────────────────────→│             │   │
│  │ (Negative)  │                         └──────┬──────┘   │
│  └─────────────┘                                │          │
│                                                 ▼          │
│                                          ┌─────────────┐   │
│                                          │ VAE Decode  │   │
│                                          └──────┬──────┘   │
│                                                 │          │
│                                                 ▼          │
│                                          ┌─────────────┐   │
│                                          │ Save Image  │   │
│                                          └─────────────┘   │
│                                                             │
└─────────────────────────────────────────────────────────────┘

节点配置详解 #

text

1. Load Checkpoint
┌─────────────────────────────┐
│ ckpt_name: 选择模型文件      │
│                             │
│ 输出：                      │
│ ├── MODEL → KSampler        │
│ ├── CLIP → CLIP Text Encode │
│ └── VAE → VAE Decode        │
└─────────────────────────────┘

2. CLIP Text Encode (Positive)
┌─────────────────────────────┐
│ clip: 连接 CLIP 输出        │
│ text: 正向提示词            │
│                             │
│ 输出：CONDITIONING          │
│ → KSampler (positive)       │
└─────────────────────────────┘

3. CLIP Text Encode (Negative)
┌─────────────────────────────┐
│ clip: 连接 CLIP 输出        │
│ text: 负面提示词            │
│                             │
│ 输出：CONDITIONING          │
│ → KSampler (negative)       │
└─────────────────────────────┘

4. Empty Latent Image
┌─────────────────────────────┐
│ width: 512                  │
│ height: 512                 │
│ batch_size: 1               │
│                             │
│ 输出：LATENT                │
│ → KSampler (latent_image)   │
└─────────────────────────────┘

5. KSampler
┌─────────────────────────────┐
│ model: MODEL                │
│ seed: 随机种子              │
│ steps: 20-30                │
│ cfg: 7-8                    │
│ sampler_name: euler_a       │
│ scheduler: normal           │
│ positive: 正向条件          │
│ negative: 负向条件          │
│ latent_image: LATENT        │
│ denoise: 1.0                │
│                             │
│ 输出：LATENT                │
└─────────────────────────────┘

6. VAE Decode
┌─────────────────────────────┐
│ samples: LATENT             │
│ vae: VAE                    │
│                             │
│ 输出：IMAGE                 │
└─────────────────────────────┘

7. Save Image
┌─────────────────────────────┐
│ images: IMAGE               │
│ filename_prefix: ComfyUI    │
└─────────────────────────────┘

参数优化 #

分辨率设置 #

text

分辨率选择指南：

SD 1.5 推荐分辨率：
├── 512 x 512 - 标准方形
├── 512 x 768 - 竖向人像
├── 768 x 512 - 横向风景
├── 512 x 640 - 4:5 比例
└── 640 x 512 - 5:4 比例

SDXL 推荐分辨率：
├── 1024 x 1024 - 标准方形
├── 1024 x 1536 - 竖向
├── 1536 x 1024 - 横向
└── 1152 x 896 - 4:3 比例

注意事项：
├── 使用 64 的倍数
├── 避免极端比例
├── 高分辨率需要更多显存
└── 可后期放大处理

采样参数 #

text

采样器选择：

快速预览：
├── sampler: euler_a
├── steps: 15-20
├── scheduler: normal
└── 适用：快速测试

平衡质量：
├── sampler: dpmpp_2m
├── steps: 20-30
├── scheduler: karras
└── 适用：日常使用

高质量：
├── sampler: dpmpp_2m_sde
├── steps: 30-50
├── scheduler: karras
└── 适用：最终输出

CFG 设置：
├── 5-6 - 弱提示词影响
├── 7-8 - 平衡（推荐）
├── 9-12 - 强提示词影响
└── 过高可能导致失真

种子控制 #

text

种子使用策略：

固定种子：
├── 用于复现结果
├── 相同参数 = 相同图像
└── 调试和对比时使用

随机种子：
├── 用于探索变化
├── 每次生成不同结果
└── 批量生成时使用

种子增量：
├── 批量生成时自动递增
├── 产生系列变化
└── 保持相似性

种子范围：
├── 0 - 2147483647
├── 通常使用随机值
└── 可记录优秀种子

工作流变体 #

带 LoRA 的工作流 #

text

┌─────────────────────────────────────────────────────────────┐
│                    LoRA 增强工作流                           │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  ┌─────────────┐                                           │
│  │ Load        │                                           │
│  │ Checkpoint  │───────────────────────────────┐           │
│  └─────────────┘                               │           │
│         │                                      │           │
│         ▼                                      ▼           │
│  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐   │
│  │ LoraLoader  │     │ Empty       │     │             │   │
│  │             │     │ Latent      │────→│  KSampler   │   │
│  └──────┬──────┘     └─────────────┘     │             │   │
│         │                                  │             │   │
│         ▼                                  │             │   │
│  ┌─────────────┐     ┌─────────────┐     │             │   │
│  │ CLIP Text   │     │ CLIP Text   │     │             │   │
│  │ Encode (+)  │────→│ Encode (-)  │────→│             │   │
│  └─────────────┘     └─────────────┘     └─────────────┘   │
│                                                             │
└─────────────────────────────────────────────────────────────┘

LoRA 参数：
├── lora_name: 选择 LoRA 文件
├── strength_model: 模型权重 (0.5-1.0)
└── strength_clip: CLIP 权重 (0.5-1.0)

批量生成工作流 #

text

批量生成设置：

Empty Latent Image:
├── batch_size: 4-8
├── 同时生成多张图像
└── 使用不同种子

或使用循环：
├── 设置循环次数
├── 每次不同种子
└── 保存所有结果

自动队列：
├── Extra options → Auto queue
├── instant: 即时模式
├── change: 参数变化触发
└── 批量生成变体

高清生成工作流 #

text

两阶段高清生成：

阶段 1：低分辨率生成
├── 512 x 512 或 768 x 768
├── 快速生成基础图像
└── 确定构图和风格

阶段 2：高清放大
├── LatentUpscale 或 ImageUpscaleWithModel
├── 放大到目标分辨率
└── 可选：重绘增强细节

工作流：
基础生成 → LatentUpscale → KSampler(denoise:0.5)
        → VAE Decode → ImageUpscaleWithModel → Save

提示词策略 #

提示词模板 #

text

人像模板：
"a portrait of {subject},
{pose}, {expression},
{location}, {lighting},
{style}, {quality_tags}"

示例：
"a portrait of a young woman,
standing elegantly, gentle smile,
in a flower garden, soft sunlight,
portrait photography, 8k, masterpiece"

风景模板：
"{scene}, {time_of_day},
{weather}, {mood},
{style}, {quality_tags}"

示例：
"a mountain landscape, golden hour,
dramatic clouds, peaceful atmosphere,
landscape photography, 8k, highly detailed"

产品模板：
"{product}, {angle},
{background}, {lighting},
{style}, {quality_tags}"

示例：
"a luxury watch, front view,
white background, studio lighting,
product photography, 8k, professional"

提示词优化技巧 #

text

优化步骤：

1. 确定主体
   ├── 清晰描述主要对象
   └── 添加关键特征

2. 添加环境
   ├── 场景描述
   └── 光线条件

3. 定义风格
   ├── 艺术风格
   └── 摄影风格

4. 质量标签
   ├── 分辨率
   └── 质量描述

5. 负面提示词
   ├── 排除问题
   └── 提高质量

常见问题解决 #

图像质量问题 #

text

问题：图像模糊
解决：
├── 增加采样步数 (25-35)
├── 使用更好的采样器 (dpmpp_2m)
├── 检查模型质量
└── 添加质量标签

问题：图像变形
解决：
├── 调整 CFG 值 (7-8)
├── 添加解剖相关负面词
├── 使用合适的模型
└── 调整提示词权重

问题：颜色异常
解决：
├── 尝试不同 VAE
├── 调整提示词
├── 检查模型兼容性
└── 添加颜色相关提示词

性能问题 #

text

问题：生成速度慢
解决：
├── 减少采样步数
├── 使用快速采样器 (euler_a)
├── 降低分辨率
└── 启用 xformers

问题：显存不足
解决：
├── 使用 --lowvram 模式
├── 降低分辨率
├── 减少 batch_size
└── 使用更小的模型

最佳实践 #

工作流程建议 #

text

推荐工作流程：

1. 快速预览
   ├── 低步数 (15-20)
   ├── 快速采样器
   ├── 测试提示词效果

2. 参数调优
   ├── 调整提示词
   ├── 测试不同种子
   ├── 找到最佳配置

3. 高质量生成
   ├── 增加步数 (25-35)
   ├── 使用高质量采样器
   ├── 选择最佳种子

4. 后期处理
   ├── 高清放大
   ├── 细节增强
   └── 保存输出

效率提升 #

text

效率提升技巧：

1. 保存工作流模板
   ├── 常用配置
   ├── 快速加载
   └── 减少重复设置

2. 使用自动队列
   ├── 批量生成
   ├── 参数变化
   └── 自动化流程

3. 合理设置参数
   ├── 预览用低参数
   ├── 最终用高参数
   └── 平衡质量和速度

4. 整理提示词库
   ├── 常用模板
   ├── 效果记录
   └── 快速复用

下一步 #

现在你已经掌握了文生图基础，接下来学习图生图技巧，了解如何基于参考图像生成新图像。