玩玩stable diffusion
上一篇文章介绍了如何使用stable-diffusion-webui自建服务,这一篇我们来简单玩玩。
第三方检查点
在上一篇我们使用了CompVis和Stability AI官方的检查点,但其实还有很多第三方的检查点,比如动漫模型DreamShaper和真人模型Chilloutmix,同样可以在HuggingFace上找到。
在文件和版本页面,我们可以看到这些检查点文件的扩展名是.safetensors
,safetensors是HuggingFace发明的一种文件格式,用以安全且快速的存储张量。
检查点除了.ckpt
还支持.safetensors
,以及PyTorch用来保存和加载模型的.pt
和.pth
。
配置字符串
模型提供者同时会提供一些示范提示语以及配置,让你能生成同样的结果。比如在DreamShaper的官方示例:
我们点击右下角的Copy Generation Data
,会得到这么一个字符串:
1 | modelshoot style, (extremely detailed CG unity 8k wallpaper), 1girl, slim girl, open mouth, at a university, best quality, (masterpiece:1.1), watched by the others, long brown hair, sitting, tight crop top, school skirt, sunglasses on head, shy, embarrased |
这个配置字符串包含了所有产生这张图片需要的信息。有Prompt,Negative prompt,和其它所有配置。
我们只要把这个字符串粘贴到webui的Prompt区域,然后点击右边的小箭头Read generation parameters from prompt or last generation if prompt is empty into user interface.
,就会应用所有配置。
LoRA模型
LoRA的全写是Low-Rank Adaptation of Large Language Models,是微软为微调(fine-tuning)大型语言模型引入的一项技术,也可以用来微调Stable Diffusion。
这里需要引入一个新网站:civitai。注意:NSFW。相比更贴近开发者的Hugging Face,它更贴近普通用户。LoRA模型可以在这里下载。
比如经常搭配chilloutmix使用的亚州女性LoRA模型:
Lora模型的使用方法与检查点类似,下载后拷至./models/Lora
目录,然后在提示语中使用即可。用法可以参见civitai的wiki。
比如
1 | best quality, ultra high res, (photorealistic:1.4), 1girl, long sleeve sweater, (full body), (closeup), wide angle, (low angle), (busty), ((huge breasts)), large breasts, (brown long hair:1.3), (looking at viewer), <lora:japaneseDollLikeness_v10:0.66> |
中的<lora:japaneseDollLikeness_v10:0.66>
即表示使用japanese Doll的Lora,系数0.66。
img2img
之前我们一直用的都是文字生成图片,但Stable Diffusion还可以使用图片+文字的形式来生成新的图片。
img2img有很多种用法,比如:
- 当觉得生成的图片方向对了时,可以保持提示语不变,使用img2img将text2img的图片当作新的起点;
- 对整体满意,但需要微调时,可使用inpaint局部重绘;
- 对风格满意,想尝试其它主体时,可使用新的提示语;
CFG Scale
越大,越贴近描述语。
Denoising strength
的值越大,越远离原图。