参数调优 #

参数概览 #

Stable Diffusion 有多个可调参数，理解它们的作用是获得高质量图像的关键。

text

┌─────────────────────────────────────────────────────────────┐
│                      主要参数概览                            │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  核心参数：                                                  │
│  ├── CFG Scale (提示词相关性)                               │
│  ├── Sampling Steps (采样步数)                              │
│  ├── Resolution (分辨率)                                    │
│  └── Seed (随机种子)                                        │
│                                                             │
│  高级参数：                                                  │
│  ├── Clip Skip (CLIP 跳过层数)                              │
│  ├── ENSD (ETA 噪声种子增量)                                │
│  └── Restore Faces (面部修复)                               │
│                                                             │
│  批量参数：                                                  │
│  ├── Batch Size (批次大小)                                  │
│  └── Batch Count (批次数量)                                 │
│                                                             │
└─────────────────────────────────────────────────────────────┘

CFG Scale（提示词相关性） #

什么是 CFG Scale？ #

CFG Scale（Classifier-Free Guidance Scale）控制生成图像与提示词的匹配程度。

text

┌─────────────────────────────────────────────────────────────┐
│                    CFG Scale 原理                            │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  CFG 公式：                                                  │
│                                                             │
│  ε_pred = ε_uncond + CFG × (ε_cond - ε_uncond)             │
│                                                             │
│  其中：                                                      │
│  ε_uncond: 无条件预测（自由生成方向）                        │
│  ε_cond: 条件预测（遵循提示词方向）                          │
│  CFG: 引导强度                                              │
│                                                             │
│  CFG 越高，越倾向于遵循提示词                                │
│  CFG 越低，模型有更多自由发挥空间                            │
│                                                             │
└─────────────────────────────────────────────────────────────┘

CFG 值的影响 #

text

不同 CFG 值的效果：

CFG = 1-3:
├── 几乎忽略提示词
├── 模型自由发挥
├── 可能偏离预期
└── 创意性强但不可控

CFG = 5-7:
├── 较低的相关性
├── 更多创意空间
├── 可能偏离细节
└── 适合艺术探索

CFG = 7-9:
├── 推荐范围
├── 平衡遵循与创意
├── 质量稳定
└── 适合大多数场景

CFG = 10-15:
├── 较高的相关性
├── 严格遵循提示词
├── 可能颜色过饱和
└── 细节可能过度

CFG = 15-20:
├── 非常高
├── 图像质量下降
├── 颜色失真
├── 不推荐
└── 特殊效果可能用到

CFG > 20:
├── 通常不推荐
├── 严重失真
└── 可能产生奇怪结果

CFG 选择建议 #

text

场景化 CFG 建议：

写实照片：
├── 推荐: 7-8
├── 过高会导致不自然
└── 过低会偏离描述

动漫风格：
├── 推荐: 7-9
├── 动漫模型通常需要稍高 CFG
└── 配合模型特性调整

艺术创作：
├── 推荐: 5-8
├── 给模型更多发挥空间
└── 可能产生意外惊喜

复杂提示词：
├── 推荐: 8-10
├── 确保各元素都被遵循
└── 但注意不要过高

简单提示词：
├── 推荐: 6-8
├── 避免过度解读
└── 保持自然

img2img：
├── 推荐: 5-7
├── 较低 CFG 保持原图特征
└── 配合 denoising strength

分辨率设置 #

基础分辨率 #

text

不同模型的推荐分辨率：

SD 1.5:
├── 默认: 512×512
├── 竖向: 512×768
├── 横向: 768×512
├── 最大建议: 768×768
└── 超过可能导致问题

SD 2.x:
├── 默认: 768×768
├── 竖向: 768×1024
├── 横向: 1024×768
└── 支持更高分辨率

SDXL:
├── 默认: 1024×1024
├── 竖向: 896×1152
├── 横向: 1152×896
├── 支持范围: 1024-2048
└── 最佳质量在 1024 左右

SD 3:
├── 默认: 1024×1024
├── 支持多种比例
└── 更灵活的分辨率支持

分辨率与构图 #

text

分辨率对构图的影响：

正方形 (1:1):
├── 512×512, 1024×1024
├── 适合: 肖像、特写、图标
└── 居中构图

竖向 (3:4 或 2:3):
├── 512×768, 768×1024
├── 适合: 全身人像、建筑
└── 纵深感强

横向 (4:3 或 3:2):
├── 768×512, 1024×768
├── 适合: 风景、场景
└── 宽广视野

宽屏 (16:9):
├── 512×288, 1024×576
├── 适合: 电影感、全景
└── 需要模型支持

超宽 (21:9):
├── 512×220, 1024×440
├── 可能需要特殊处理
└── 容易出现问题

分辨率注意事项 #

text

分辨率设置注意事项：

1. 必须是 64 的倍数
   ├── WebUI 会自动调整
   └── 手动设置时注意

2. 过大分辨率的问题
   ├── 显存不足
   ├── 生成时间变长
   ├── 可能出现重复图案
   └── 质量不一定更好

3. 推荐工作流
   ├── 先用基础分辨率生成
   ├── 选择满意的图像
   └── 使用 Extras 放大

4. 高分辨率技巧
   ├── 使用 High-res fix
   ├── 先生成低分辨率
   └── 再放大并细化

High-res Fix #

text

高分辨率修复功能：

作用：
├── 先用低分辨率生成
├── 再放大并细化
├── 避免高分辨率问题
└── 提高最终质量

设置：
┌─────────────────────────────────────────────────────────────┐
│  High-res fix 设置：                                         │
│                                                             │
│  Upscale by: 放大倍数 (1.5x, 2x, 4x)                        │
│  Denoising strength: 细化强度 (0.3-0.7)                     │
│  Upscaler: 放大算法                                         │
│                                                             │
│  推荐配置：                                                  │
│  ├── 放大倍数: 2x                                           │
│  ├── 细化强度: 0.3-0.5                                      │
│  └── 放大算法: 4x-UltraSharp 或 R-ESRGAN 4x+               │
│                                                             │
└─────────────────────────────────────────────────────────────┘

使用场景：
├── 需要高分辨率输出
├── 显存有限
├── 避免重复图案
└── 提高细节质量

种子（Seed） #

种子的作用 #

text

种子的功能：

作用：
├── 控制随机性
├── 相同种子 + 相同参数 = 相同结果
├── 用于复现和迭代
└── 探索变体

设置：
├── -1: 随机种子
├── 固定值: 可复现
└── 范围: 0 到 2^32-1

种子使用技巧 #

text

种子使用场景：

1. 复现结果
   ├── 找到满意的图像
   ├── 记录种子值
   ├── 相同参数可复现
   └── 方便分享和讨论

2. 微调迭代
   ├── 固定种子
   ├── 调整其他参数
   ├── 观察参数影响
   └── 精细调整

3. 探索变体
   ├── 固定种子
   ├── 小幅调整提示词
   ├── 保持构图相似
   └── 生成系列图像

4. 批量生成
   ├── 不同种子
   ├── 相同提示词
   ├── 选择最佳结果
   └── 探索多样性

种子变体 #

text

种子变体功能：

Extra seed (子种子)：
├── 基于主种子生成变体
├── 保持相似性
├── 产生细微差异
└── 探索相似图像

Variation seed (变体种子)：
├── 混合两个种子
├── Variation strength 控制混合程度
├── 0 = 完全主种子
├── 1 = 完全变体种子
└── 生成过渡效果

使用场景：
├── 生成系列图像
├── 微调已有结果
└── 探索相似变体

批量生成参数 #

Batch Size vs Batch Count #

text

批量生成设置：

Batch Size (批次大小)：
├── 同时生成的图像数量
├── 显存占用增加
├── 速度可能更快
└── 适合显存充足

Batch Count (批次数量)：
├── 生成多少批次
├── 每批一张
├── 显存友好
└── 适合显存有限

对比：
┌─────────────────────────────────────────────────────────────┐
│                                                             │
│  Batch Size = 4, Batch Count = 1                            │
│  → 同时生成 4 张，显存占用高                                 │
│                                                             │
│  Batch Size = 1, Batch Count = 4                            │
│  → 分 4 次生成，显存友好                                     │
│                                                             │
│  结果数量相同，显存占用不同                                   │
│                                                             │
└─────────────────────────────────────────────────────────────┘

批量生成建议 #

text

批量生成策略：

显存充足 (12GB+)：
├── Batch Size: 4-8
├── Batch Count: 1-2
└── 充分利用 GPU

显存一般 (8GB)：
├── Batch Size: 2-4
├── Batch Count: 2-4
└── 平衡效率

显存有限 (6GB)：
├── Batch Size: 1
├── Batch Count: 4-8
└── 避免显存溢出

探索阶段：
├── Batch Size: 4
├── Batch Count: 1
├── 快速生成多张
└── 选择最佳方向

确定方向后：
├── 固定种子
├── 微调参数
└── 精细优化

高级参数 #

Clip Skip #

text

Clip Skip 设置：

作用：
├── 跳过 CLIP 编码器的最后几层
├── 影响文本理解方式
└── 不同模型有不同最佳值

设置建议：
├── SD 1.5: 1 或 2
├── 动漫模型: 通常 2
├── 写实模型: 通常 1
└── SDXL: 通常 1

效果：
├── Clip Skip 1: 使用完整 CLIP
├── Clip Skip 2: 跳过最后一层
└── 更高值可能损失细节

建议：
├── 遵循模型推荐设置
├── 动漫模型通常设为 2
└── 不确定时保持默认

Restore Faces #

text

面部修复功能：

作用：
├── 自动修复面部问题
├── 改善面部细节
└── 使用 CodeFormer 或 GFPGAN

设置：
├── Restore Faces: 开启
├── CodeFormer weight: 0-1
│   ├── 0: 最大修复
│   └── 1: 最小修复
└── 推荐值: 0.5-0.8

适用场景：
├── 人物肖像
├── 面部有问题时
└── 写实风格

注意事项：
├── 可能改变面部特征
├── 动漫风格可能不适用
└── 过度修复可能不自然

Tiling #

text

平铺功能：

作用：
├── 生成可无缝平铺的图像
├── 用于纹理、背景
└── 边缘可无缝连接

使用场景：
├── 游戏纹理
├── 网站背景
├── 图案设计
└── 壁纸

效果：
├── 图像边缘可无缝拼接
├── 适合重复使用
└── 可能影响构图

img2img 参数 #

Denoising Strength #

text

重绘幅度 (Denoising Strength)：

作用：
├── 控制与原图的差异程度
├── 0 = 完全保留原图
├── 1 = 完全重新生成
└── 核心参数

不同值的效果：

0.1-0.3:
├── 轻微变化
├── 保留大部分原图
├── 细节微调
└── 风格化

0.3-0.5:
├── 中等变化
├── 保留构图
├── 改变风格和细节
└── 常用范围

0.5-0.7:
├── 较大变化
├── 保留基本结构
├── 大幅改变内容
└── 风格转换

0.7-0.9:
├── 很大变化
├── 可能丢失原图特征
├── 接近全新生成
└── 保留色彩基调

0.9-1.0:
├── 几乎全新生成
├── 仅参考原图
└── 几乎完全重绘

Resize Mode #

text

调整大小模式：

Just resize:
├── 直接缩放到目标分辨率
├── 可能变形
└── 不推荐

Crop and resize:
├── 裁剪后缩放
├── 保持比例
├── 可能丢失边缘
└── 推荐

Resize and fill:
├── 缩放后填充
├── 保持比例
├── 可能添加内容
└── 推荐

参数组合策略 #

快速预览配置 #

text

快速预览参数：

分辨率: 512×512 或 512×768
采样器: DPM++ 2M Karras
步数: 15-20
CFG: 7
Batch Size: 4

目的：
├── 快速生成
├── 探索方向
└── 选择最佳提示词

高质量配置 #

text

高质量生成参数：

分辨率: 512×768 或更高
采样器: DPM++ 2M Karras 或 DPM++ SDE
步数: 25-35
CFG: 7-8
High-res fix: 开启
├── 放大倍数: 2x
├── 细化强度: 0.4
Restore Faces: 按需

目的：
├── 最终输出
├── 最佳质量
└── 适合保存分享

创意探索配置 #

text

创意探索参数：

分辨率: 512×512
采样器: Euler a 或 DPM++ SDE
步数: 25-40
CFG: 5-7
Batch Size: 4-8

目的：
├── 探索可能性
├── 发现意外效果
└── 艺术创作

下一步 #

掌握参数调优后，继续学习：

LoRA 模型 - 扩展模型风格
ControlNet 控制 - 精确控制生成
图生图技术 - 基于图像生成