文生图基础 #
文生图概述 #
什么是文生图? #
文生图(Text-to-Image)是指通过文本描述生成图像的技术,是 AI 绘画最基础也是最重要的功能。
text
┌─────────────────────────────────────────────────────────────┐
│ 文生图流程 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 输入 处理 输出 │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐│
│ │ 文本描述 │ ─────────→ │ AI 模型 │ ─────────→ │ 生成图像 ││
│ │ │ │ 采样生成 │ │ ││
│ └──────────┘ └──────────┘ └──────────┘│
│ │
│ "a beautiful sunset Stable Diffusion 日落图像 │
│ over the ocean" │
│ │
└─────────────────────────────────────────────────────────────┘
基础工作流 #
标准文生图工作流 #
text
┌─────────────────────────────────────────────────────────────┐
│ 标准文生图工作流 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ │
│ │ Load │ │
│ │ Checkpoint │───────────────────────────────┐ │
│ └─────────────┘ │ │
│ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ CLIP Text │ │ Empty │ │ │ │
│ │ Encode │────→│ Latent │────→│ KSampler │ │
│ │ (Positive) │ │ Image │ │ │ │
│ └─────────────┘ └─────────────┘ │ │ │
│ │ │ │
│ ┌─────────────┐ │ │ │
│ │ CLIP Text │ │ │ │
│ │ Encode │────────────────────────→│ │ │
│ │ (Negative) │ └──────┬──────┘ │
│ └─────────────┘ │ │
│ ▼ │
│ ┌─────────────┐ │
│ │ VAE Decode │ │
│ └──────┬──────┘ │
│ │ │
│ ▼ │
│ ┌─────────────┐ │
│ │ Save Image │ │
│ └─────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
节点配置详解 #
text
1. Load Checkpoint
┌─────────────────────────────┐
│ ckpt_name: 选择模型文件 │
│ │
│ 输出: │
│ ├── MODEL → KSampler │
│ ├── CLIP → CLIP Text Encode │
│ └── VAE → VAE Decode │
└─────────────────────────────┘
2. CLIP Text Encode (Positive)
┌─────────────────────────────┐
│ clip: 连接 CLIP 输出 │
│ text: 正向提示词 │
│ │
│ 输出:CONDITIONING │
│ → KSampler (positive) │
└─────────────────────────────┘
3. CLIP Text Encode (Negative)
┌─────────────────────────────┐
│ clip: 连接 CLIP 输出 │
│ text: 负面提示词 │
│ │
│ 输出:CONDITIONING │
│ → KSampler (negative) │
└─────────────────────────────┘
4. Empty Latent Image
┌─────────────────────────────┐
│ width: 512 │
│ height: 512 │
│ batch_size: 1 │
│ │
│ 输出:LATENT │
│ → KSampler (latent_image) │
└─────────────────────────────┘
5. KSampler
┌─────────────────────────────┐
│ model: MODEL │
│ seed: 随机种子 │
│ steps: 20-30 │
│ cfg: 7-8 │
│ sampler_name: euler_a │
│ scheduler: normal │
│ positive: 正向条件 │
│ negative: 负向条件 │
│ latent_image: LATENT │
│ denoise: 1.0 │
│ │
│ 输出:LATENT │
└─────────────────────────────┘
6. VAE Decode
┌─────────────────────────────┐
│ samples: LATENT │
│ vae: VAE │
│ │
│ 输出:IMAGE │
└─────────────────────────────┘
7. Save Image
┌─────────────────────────────┐
│ images: IMAGE │
│ filename_prefix: ComfyUI │
└─────────────────────────────┘
参数优化 #
分辨率设置 #
text
分辨率选择指南:
SD 1.5 推荐分辨率:
├── 512 x 512 - 标准方形
├── 512 x 768 - 竖向人像
├── 768 x 512 - 横向风景
├── 512 x 640 - 4:5 比例
└── 640 x 512 - 5:4 比例
SDXL 推荐分辨率:
├── 1024 x 1024 - 标准方形
├── 1024 x 1536 - 竖向
├── 1536 x 1024 - 横向
└── 1152 x 896 - 4:3 比例
注意事项:
├── 使用 64 的倍数
├── 避免极端比例
├── 高分辨率需要更多显存
└── 可后期放大处理
采样参数 #
text
采样器选择:
快速预览:
├── sampler: euler_a
├── steps: 15-20
├── scheduler: normal
└── 适用:快速测试
平衡质量:
├── sampler: dpmpp_2m
├── steps: 20-30
├── scheduler: karras
└── 适用:日常使用
高质量:
├── sampler: dpmpp_2m_sde
├── steps: 30-50
├── scheduler: karras
└── 适用:最终输出
CFG 设置:
├── 5-6 - 弱提示词影响
├── 7-8 - 平衡(推荐)
├── 9-12 - 强提示词影响
└── 过高可能导致失真
种子控制 #
text
种子使用策略:
固定种子:
├── 用于复现结果
├── 相同参数 = 相同图像
└── 调试和对比时使用
随机种子:
├── 用于探索变化
├── 每次生成不同结果
└── 批量生成时使用
种子增量:
├── 批量生成时自动递增
├── 产生系列变化
└── 保持相似性
种子范围:
├── 0 - 2147483647
├── 通常使用随机值
└── 可记录优秀种子
工作流变体 #
带 LoRA 的工作流 #
text
┌─────────────────────────────────────────────────────────────┐
│ LoRA 增强工作流 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ │
│ │ Load │ │
│ │ Checkpoint │───────────────────────────────┐ │
│ └─────────────┘ │ │
│ │ │ │
│ ▼ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ LoraLoader │ │ Empty │ │ │ │
│ │ │ │ Latent │────→│ KSampler │ │
│ └──────┬──────┘ └─────────────┘ │ │ │
│ │ │ │ │
│ ▼ │ │ │
│ ┌─────────────┐ ┌─────────────┐ │ │ │
│ │ CLIP Text │ │ CLIP Text │ │ │ │
│ │ Encode (+) │────→│ Encode (-) │────→│ │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
LoRA 参数:
├── lora_name: 选择 LoRA 文件
├── strength_model: 模型权重 (0.5-1.0)
└── strength_clip: CLIP 权重 (0.5-1.0)
批量生成工作流 #
text
批量生成设置:
Empty Latent Image:
├── batch_size: 4-8
├── 同时生成多张图像
└── 使用不同种子
或使用循环:
├── 设置循环次数
├── 每次不同种子
└── 保存所有结果
自动队列:
├── Extra options → Auto queue
├── instant: 即时模式
├── change: 参数变化触发
└── 批量生成变体
高清生成工作流 #
text
两阶段高清生成:
阶段 1:低分辨率生成
├── 512 x 512 或 768 x 768
├── 快速生成基础图像
└── 确定构图和风格
阶段 2:高清放大
├── LatentUpscale 或 ImageUpscaleWithModel
├── 放大到目标分辨率
└── 可选:重绘增强细节
工作流:
基础生成 → LatentUpscale → KSampler(denoise:0.5)
→ VAE Decode → ImageUpscaleWithModel → Save
提示词策略 #
提示词模板 #
text
人像模板:
"a portrait of {subject},
{pose}, {expression},
{location}, {lighting},
{style}, {quality_tags}"
示例:
"a portrait of a young woman,
standing elegantly, gentle smile,
in a flower garden, soft sunlight,
portrait photography, 8k, masterpiece"
风景模板:
"{scene}, {time_of_day},
{weather}, {mood},
{style}, {quality_tags}"
示例:
"a mountain landscape, golden hour,
dramatic clouds, peaceful atmosphere,
landscape photography, 8k, highly detailed"
产品模板:
"{product}, {angle},
{background}, {lighting},
{style}, {quality_tags}"
示例:
"a luxury watch, front view,
white background, studio lighting,
product photography, 8k, professional"
提示词优化技巧 #
text
优化步骤:
1. 确定主体
├── 清晰描述主要对象
└── 添加关键特征
2. 添加环境
├── 场景描述
└── 光线条件
3. 定义风格
├── 艺术风格
└── 摄影风格
4. 质量标签
├── 分辨率
└── 质量描述
5. 负面提示词
├── 排除问题
└── 提高质量
常见问题解决 #
图像质量问题 #
text
问题:图像模糊
解决:
├── 增加采样步数 (25-35)
├── 使用更好的采样器 (dpmpp_2m)
├── 检查模型质量
└── 添加质量标签
问题:图像变形
解决:
├── 调整 CFG 值 (7-8)
├── 添加解剖相关负面词
├── 使用合适的模型
└── 调整提示词权重
问题:颜色异常
解决:
├── 尝试不同 VAE
├── 调整提示词
├── 检查模型兼容性
└── 添加颜色相关提示词
性能问题 #
text
问题:生成速度慢
解决:
├── 减少采样步数
├── 使用快速采样器 (euler_a)
├── 降低分辨率
└── 启用 xformers
问题:显存不足
解决:
├── 使用 --lowvram 模式
├── 降低分辨率
├── 减少 batch_size
└── 使用更小的模型
最佳实践 #
工作流程建议 #
text
推荐工作流程:
1. 快速预览
├── 低步数 (15-20)
├── 快速采样器
├── 测试提示词效果
2. 参数调优
├── 调整提示词
├── 测试不同种子
├── 找到最佳配置
3. 高质量生成
├── 增加步数 (25-35)
├── 使用高质量采样器
├── 选择最佳种子
4. 后期处理
├── 高清放大
├── 细节增强
└── 保存输出
效率提升 #
text
效率提升技巧:
1. 保存工作流模板
├── 常用配置
├── 快速加载
└── 减少重复设置
2. 使用自动队列
├── 批量生成
├── 参数变化
└── 自动化流程
3. 合理设置参数
├── 预览用低参数
├── 最终用高参数
└── 平衡质量和速度
4. 整理提示词库
├── 常用模板
├── 效果记录
└── 快速复用
下一步 #
现在你已经掌握了文生图基础,接下来学习 图生图技巧,了解如何基于参考图像生成新图像。
最后更新:2026-04-05