参数调优 #
参数概览 #
Stable Diffusion 有多个可调参数,理解它们的作用是获得高质量图像的关键。
text
┌─────────────────────────────────────────────────────────────┐
│ 主要参数概览 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 核心参数: │
│ ├── CFG Scale (提示词相关性) │
│ ├── Sampling Steps (采样步数) │
│ ├── Resolution (分辨率) │
│ └── Seed (随机种子) │
│ │
│ 高级参数: │
│ ├── Clip Skip (CLIP 跳过层数) │
│ ├── ENSD (ETA 噪声种子增量) │
│ └── Restore Faces (面部修复) │
│ │
│ 批量参数: │
│ ├── Batch Size (批次大小) │
│ └── Batch Count (批次数量) │
│ │
└─────────────────────────────────────────────────────────────┘
CFG Scale(提示词相关性) #
什么是 CFG Scale? #
CFG Scale(Classifier-Free Guidance Scale)控制生成图像与提示词的匹配程度。
text
┌─────────────────────────────────────────────────────────────┐
│ CFG Scale 原理 │
├─────────────────────────────────────────────────────────────┤
│ │
│ CFG 公式: │
│ │
│ ε_pred = ε_uncond + CFG × (ε_cond - ε_uncond) │
│ │
│ 其中: │
│ ε_uncond: 无条件预测(自由生成方向) │
│ ε_cond: 条件预测(遵循提示词方向) │
│ CFG: 引导强度 │
│ │
│ CFG 越高,越倾向于遵循提示词 │
│ CFG 越低,模型有更多自由发挥空间 │
│ │
└─────────────────────────────────────────────────────────────┘
CFG 值的影响 #
text
不同 CFG 值的效果:
CFG = 1-3:
├── 几乎忽略提示词
├── 模型自由发挥
├── 可能偏离预期
└── 创意性强但不可控
CFG = 5-7:
├── 较低的相关性
├── 更多创意空间
├── 可能偏离细节
└── 适合艺术探索
CFG = 7-9:
├── 推荐范围
├── 平衡遵循与创意
├── 质量稳定
└── 适合大多数场景
CFG = 10-15:
├── 较高的相关性
├── 严格遵循提示词
├── 可能颜色过饱和
└── 细节可能过度
CFG = 15-20:
├── 非常高
├── 图像质量下降
├── 颜色失真
├── 不推荐
└── 特殊效果可能用到
CFG > 20:
├── 通常不推荐
├── 严重失真
└── 可能产生奇怪结果
CFG 选择建议 #
text
场景化 CFG 建议:
写实照片:
├── 推荐: 7-8
├── 过高会导致不自然
└── 过低会偏离描述
动漫风格:
├── 推荐: 7-9
├── 动漫模型通常需要稍高 CFG
└── 配合模型特性调整
艺术创作:
├── 推荐: 5-8
├── 给模型更多发挥空间
└── 可能产生意外惊喜
复杂提示词:
├── 推荐: 8-10
├── 确保各元素都被遵循
└── 但注意不要过高
简单提示词:
├── 推荐: 6-8
├── 避免过度解读
└── 保持自然
img2img:
├── 推荐: 5-7
├── 较低 CFG 保持原图特征
└── 配合 denoising strength
分辨率设置 #
基础分辨率 #
text
不同模型的推荐分辨率:
SD 1.5:
├── 默认: 512×512
├── 竖向: 512×768
├── 横向: 768×512
├── 最大建议: 768×768
└── 超过可能导致问题
SD 2.x:
├── 默认: 768×768
├── 竖向: 768×1024
├── 横向: 1024×768
└── 支持更高分辨率
SDXL:
├── 默认: 1024×1024
├── 竖向: 896×1152
├── 横向: 1152×896
├── 支持范围: 1024-2048
└── 最佳质量在 1024 左右
SD 3:
├── 默认: 1024×1024
├── 支持多种比例
└── 更灵活的分辨率支持
分辨率与构图 #
text
分辨率对构图的影响:
正方形 (1:1):
├── 512×512, 1024×1024
├── 适合: 肖像、特写、图标
└── 居中构图
竖向 (3:4 或 2:3):
├── 512×768, 768×1024
├── 适合: 全身人像、建筑
└── 纵深感强
横向 (4:3 或 3:2):
├── 768×512, 1024×768
├── 适合: 风景、场景
└── 宽广视野
宽屏 (16:9):
├── 512×288, 1024×576
├── 适合: 电影感、全景
└── 需要模型支持
超宽 (21:9):
├── 512×220, 1024×440
├── 可能需要特殊处理
└── 容易出现问题
分辨率注意事项 #
text
分辨率设置注意事项:
1. 必须是 64 的倍数
├── WebUI 会自动调整
└── 手动设置时注意
2. 过大分辨率的问题
├── 显存不足
├── 生成时间变长
├── 可能出现重复图案
└── 质量不一定更好
3. 推荐工作流
├── 先用基础分辨率生成
├── 选择满意的图像
└── 使用 Extras 放大
4. 高分辨率技巧
├── 使用 High-res fix
├── 先生成低分辨率
└── 再放大并细化
High-res Fix #
text
高分辨率修复功能:
作用:
├── 先用低分辨率生成
├── 再放大并细化
├── 避免高分辨率问题
└── 提高最终质量
设置:
┌─────────────────────────────────────────────────────────────┐
│ High-res fix 设置: │
│ │
│ Upscale by: 放大倍数 (1.5x, 2x, 4x) │
│ Denoising strength: 细化强度 (0.3-0.7) │
│ Upscaler: 放大算法 │
│ │
│ 推荐配置: │
│ ├── 放大倍数: 2x │
│ ├── 细化强度: 0.3-0.5 │
│ └── 放大算法: 4x-UltraSharp 或 R-ESRGAN 4x+ │
│ │
└─────────────────────────────────────────────────────────────┘
使用场景:
├── 需要高分辨率输出
├── 显存有限
├── 避免重复图案
└── 提高细节质量
种子(Seed) #
种子的作用 #
text
种子的功能:
作用:
├── 控制随机性
├── 相同种子 + 相同参数 = 相同结果
├── 用于复现和迭代
└── 探索变体
设置:
├── -1: 随机种子
├── 固定值: 可复现
└── 范围: 0 到 2^32-1
种子使用技巧 #
text
种子使用场景:
1. 复现结果
├── 找到满意的图像
├── 记录种子值
├── 相同参数可复现
└── 方便分享和讨论
2. 微调迭代
├── 固定种子
├── 调整其他参数
├── 观察参数影响
└── 精细调整
3. 探索变体
├── 固定种子
├── 小幅调整提示词
├── 保持构图相似
└── 生成系列图像
4. 批量生成
├── 不同种子
├── 相同提示词
├── 选择最佳结果
└── 探索多样性
种子变体 #
text
种子变体功能:
Extra seed (子种子):
├── 基于主种子生成变体
├── 保持相似性
├── 产生细微差异
└── 探索相似图像
Variation seed (变体种子):
├── 混合两个种子
├── Variation strength 控制混合程度
├── 0 = 完全主种子
├── 1 = 完全变体种子
└── 生成过渡效果
使用场景:
├── 生成系列图像
├── 微调已有结果
└── 探索相似变体
批量生成参数 #
Batch Size vs Batch Count #
text
批量生成设置:
Batch Size (批次大小):
├── 同时生成的图像数量
├── 显存占用增加
├── 速度可能更快
└── 适合显存充足
Batch Count (批次数量):
├── 生成多少批次
├── 每批一张
├── 显存友好
└── 适合显存有限
对比:
┌─────────────────────────────────────────────────────────────┐
│ │
│ Batch Size = 4, Batch Count = 1 │
│ → 同时生成 4 张,显存占用高 │
│ │
│ Batch Size = 1, Batch Count = 4 │
│ → 分 4 次生成,显存友好 │
│ │
│ 结果数量相同,显存占用不同 │
│ │
└─────────────────────────────────────────────────────────────┘
批量生成建议 #
text
批量生成策略:
显存充足 (12GB+):
├── Batch Size: 4-8
├── Batch Count: 1-2
└── 充分利用 GPU
显存一般 (8GB):
├── Batch Size: 2-4
├── Batch Count: 2-4
└── 平衡效率
显存有限 (6GB):
├── Batch Size: 1
├── Batch Count: 4-8
└── 避免显存溢出
探索阶段:
├── Batch Size: 4
├── Batch Count: 1
├── 快速生成多张
└── 选择最佳方向
确定方向后:
├── 固定种子
├── 微调参数
└── 精细优化
高级参数 #
Clip Skip #
text
Clip Skip 设置:
作用:
├── 跳过 CLIP 编码器的最后几层
├── 影响文本理解方式
└── 不同模型有不同最佳值
设置建议:
├── SD 1.5: 1 或 2
├── 动漫模型: 通常 2
├── 写实模型: 通常 1
└── SDXL: 通常 1
效果:
├── Clip Skip 1: 使用完整 CLIP
├── Clip Skip 2: 跳过最后一层
└── 更高值可能损失细节
建议:
├── 遵循模型推荐设置
├── 动漫模型通常设为 2
└── 不确定时保持默认
Restore Faces #
text
面部修复功能:
作用:
├── 自动修复面部问题
├── 改善面部细节
└── 使用 CodeFormer 或 GFPGAN
设置:
├── Restore Faces: 开启
├── CodeFormer weight: 0-1
│ ├── 0: 最大修复
│ └── 1: 最小修复
└── 推荐值: 0.5-0.8
适用场景:
├── 人物肖像
├── 面部有问题时
└── 写实风格
注意事项:
├── 可能改变面部特征
├── 动漫风格可能不适用
└── 过度修复可能不自然
Tiling #
text
平铺功能:
作用:
├── 生成可无缝平铺的图像
├── 用于纹理、背景
└── 边缘可无缝连接
使用场景:
├── 游戏纹理
├── 网站背景
├── 图案设计
└── 壁纸
效果:
├── 图像边缘可无缝拼接
├── 适合重复使用
└── 可能影响构图
img2img 参数 #
Denoising Strength #
text
重绘幅度 (Denoising Strength):
作用:
├── 控制与原图的差异程度
├── 0 = 完全保留原图
├── 1 = 完全重新生成
└── 核心参数
不同值的效果:
0.1-0.3:
├── 轻微变化
├── 保留大部分原图
├── 细节微调
└── 风格化
0.3-0.5:
├── 中等变化
├── 保留构图
├── 改变风格和细节
└── 常用范围
0.5-0.7:
├── 较大变化
├── 保留基本结构
├── 大幅改变内容
└── 风格转换
0.7-0.9:
├── 很大变化
├── 可能丢失原图特征
├── 接近全新生成
└── 保留色彩基调
0.9-1.0:
├── 几乎全新生成
├── 仅参考原图
└── 几乎完全重绘
Resize Mode #
text
调整大小模式:
Just resize:
├── 直接缩放到目标分辨率
├── 可能变形
└── 不推荐
Crop and resize:
├── 裁剪后缩放
├── 保持比例
├── 可能丢失边缘
└── 推荐
Resize and fill:
├── 缩放后填充
├── 保持比例
├── 可能添加内容
└── 推荐
参数组合策略 #
快速预览配置 #
text
快速预览参数:
分辨率: 512×512 或 512×768
采样器: DPM++ 2M Karras
步数: 15-20
CFG: 7
Batch Size: 4
目的:
├── 快速生成
├── 探索方向
└── 选择最佳提示词
高质量配置 #
text
高质量生成参数:
分辨率: 512×768 或更高
采样器: DPM++ 2M Karras 或 DPM++ SDE
步数: 25-35
CFG: 7-8
High-res fix: 开启
├── 放大倍数: 2x
├── 细化强度: 0.4
Restore Faces: 按需
目的:
├── 最终输出
├── 最佳质量
└── 适合保存分享
创意探索配置 #
text
创意探索参数:
分辨率: 512×512
采样器: Euler a 或 DPM++ SDE
步数: 25-40
CFG: 5-7
Batch Size: 4-8
目的:
├── 探索可能性
├── 发现意外效果
└── 艺术创作
下一步 #
掌握参数调优后,继续学习:
- LoRA 模型 - 扩展模型风格
- ControlNet 控制 - 精确控制生成
- 图生图技术 - 基于图像生成
最后更新:2026-04-05