为stable diffusion训练预处理图片

发表于 2023-02-24 更新于 2023-03-24 阅读次数：

在开始训练之前，先要准备数据集。

图片尺寸

目前主流的基模就3个，sd-v1.4, sd-v1.5和sd-v2.1。

其中，sd-v2.1的大小为768x768，其它都是512x512。

~~我们训练的数据集大小要和基模保持一致（吗？不确定）。~~

如果需要训练的数据集是人脸照片，那么可以直接使用stable-diffusion-webui中的自动焦点裁剪（Auto focal point crop）功能。

一键生成，只需检查一下就好。

stable-diffusion-webui可以在裁剪的同时生成提示语，推荐使用deepbooru算法。

如果图片不敏感，可以使用在线的剪裁网站：brime，它也支持自动焦点检测。