StableDiffusion_02_Prompt

prompt 基本说明

prompt(描述词),它可以包含

  • 对于期望画面的描述
  • 对于当前配置的描述,

因此一张图需要的大部分设置,可以直接通过拷贝 prompt 语句进行再现

而在描述配置时,不同版本的 prompt 存在差异,主要分为:

  • 基本的 NovelAI prompt
  • 自动的 Automatic prompt

两种语法的区别并不是特别明显,主要在于对配置的描述上,例如:
Novel AI 对于否定词是 Undesired Content - None:
而 Automatic AI 则是 Negative prompt :

基本语法

短句

你可以使用短句,比如教程中的 asuka langley sitting cross legged on a chair
这样的描述词,整个语句会被拆成若干个子标签,并且他们之间的关联性更强

单词

而你也可以使用单语句,每个单词之间用 半角的逗号 , 进行分割
例如,把上面的句子拆成单个词:
asuka langley, sitting, cross legged, on a chair

两种方式存在微妙区别,后者可以对单个词语进行权重调整,就好像你 语气平稳、棒读 说一句话,和 语气有轻重、抑扬顿挫 地说一句话是不同的
但两种方式各有各的优点,并不能一概否定其中一方

强调语法

Attention/emphasis

单词可以通过 () 调整权重,
每个 () 可以将权重增加到 1.1 倍1,多个括号可以叠加

((asuka langley)) sitting cross legged on a chair

(word:number) 可以指定倍率2,例如 (sitting:1.21) 表示希望 sitting 单词的权重是 1.21 倍,这等价于两个括号嵌套((sitting))

也可以指定 0~1 的值以减小权重,例如 (sitting:0.9) ,而你也可以用 [] 来快速降低权重,每个 [] 表示将权重降低为原来的 1/1.1 倍,并且 [] 可以叠加。但和 () 不同的是, [] 并不能指定倍率。

早期的语法中会使用 {}, 但在最新版本中它实际上已经等价于 (){} 是失效过失的语法

在语法中, 是转义字符,如果你需要原文输入() 或者 [] 这些特殊字符,需要进行转义

语法变化

Prompt editing

该语法允许你在采样中途使 prompt 产生变化,

语法为:

[from:to:when]
[原语句:新语句:条件]

变种(实际上就是省略句):

[to:when]  
[from::when]  

其中,when 除了用整数的步数,还可以指定 0~1 的小数,映射一开始和结尾

用法

[fantasy:cyberpunk:16] landscape

假设你总步数是 25步
0~16:fantasy landscape
17~25:cyberpunk landscape

语法矩阵

Prompt matrix

该语法默认是没有开启的,功能位于底部的 Script/Prompt matrix ,需要下拉选择
当指定该功能时:你可以在 prompt 中额外使用 | 来分割语句,这样元语句会被排列组合成若干词汇,其中第一个词总是保留

例如:
A|B|C 会产生四种组合,分别是:

A,
A, B
A, C
A, B, C  

这四种可能均会被算出来,相当于你一次生成了四张图,这也使得处理图片消耗的时间成倍上升

$$图片数量 = 2^{“|”符号的数量}$$

兼容性

格式

如果你选择用单词短句来作为 prompt,尽量不要在一个短句中夹杂太多内容,因为在多个词语的情况下它可能因为权重太低而得不到重视

对于语种的支持

之前听说有些地方支持中文,不过目前用到的 SD 模型似乎主要支持 英文 和 日文,

日文标签可以参考:
キャラ属性王国

词汇推荐

首先要明白一个事情,
神经网络下的探索,目的地是不确定的, 在条件未固定的情况下(尤其是随机种子), 你 和 AI,都不知道出来的图是什么,什么图是最 “完美” 的, 但选择更合适的词语有助于帮我们筛选更优质的结果。

每种模型通过某些技术提炼出大量的词汇,同样的词汇在不同的模型中可能效果不同。但训练程度足够的模型,是不需要过多担心这种问题的,也就是“条条大路通罗马”。

这里给出一些思路来进行词汇的选择

正面词汇

目前大部分人都会加入:masterpiecebest quality, 这里两个单词
前者大概是源自 master-piece,而后者则是对于高质量画作可能拥有的标签

同样的,我们可以加入喜欢的画风、艺术家、团体,甚至是游戏作品的名字,

之后,还可以为 五官细节、表情、衣着(甚至是配饰、印花)、背景、色调、光晕、摄像机角度 进行定制,

每种描述应当清晰、准确,一定要避免不同的标签之间概念模糊,这可能使得判定异常,最后生产出很 诡异 但是又很 “正确” 的图片

可以参考:
anime vector anon’s embeddings

以及一些网友总结出的一些比较好的搭配,其中每一行为一组词汇:

在 SD 下:

fantasy, intricate, detailed, realistic, photo, plush, doll, toy, cute, Japanese, loli

intricate, detailed, realistic, photo, cute, girl, Japanese, nendoroid / anime figure

intricate, detailed, realistic, photo, sexy, fur coat, girl

lovecraft, pixar, realistic, intricate, detailed, scenery, landscape

realistic, intricate, detailed, concept art, fantasy, cat, dog, bunny, rabbit, lizard, snake, giraffe, elephant, bird, crocodile, hippopotamus, gorilla, grizzly bear, magically fused into a chimera3

studio pierrot, intricate, realistic, detailed, digital painting, artstation, concept art, sharp focus, illustration, Victorian, dandy gentleman, wizard, muscular man, art by kentaro miura

fantasy, intricate, cinematic, digital painting, artstation, concept art, sharp focus, illustration, Artgerm, Greg Rutkowski, Alphonse Mucha, mecha panther woman

在 WD 下:

taimanin asagi, ninja, bodysuit, fishnet, artstation female body, highly detailed, art by kentaro yabuki

art by kentaro yabuki, wlop, artstation female body, highly detailed, little girl, skinny, red hair and eyes, midriff, black leather, elbow gloves, thighhighs, choker, black miniskirt

harem, group of girls, trending on artstation, highly detailed, akihiko yoshida, mark arian, sexy, bikini

lalafell, artstation female body, highly detailed, swimsuit, Alphonse Mucha

michael garmash, WLOP, chibi, curvaceous, huge breasts, artstation female body, highly detailed, thick, granblue erune, tera online elin, betty boop

art by ken sugimori, art by yoji shinkawa, artstation female body, highly detailed, furry, minotaur, huge breasts

art by ken sugimori, lois van baarle, ross tran, trending on artstation, highly detailed, girl, furry, anthropomorphic animal girl
loli, midriff, trending on artstation, highly detailed

负面词汇

Negative prompt

最重要的一个负面词汇就是 NSFW
NSFW (Not Safe/Suitable For Work) 是指工作场合不适宜,对于不希望生产出 色情暴力图片的用户来说,这个否定标签几乎是必备的,
另外,这个标签也可以在 设置 中直接过滤

而和正面词汇一样,负面词汇也是从几个方面来着手:

糟糕的,损坏的,残缺的__, 这一类形容词源于社区的负面评价,
而形容的对象包括 四肢、五官、解剖学、画面质量,等等

带有水印、用户名、艺术家署名,这一类主观上不希望有的额外信息,如果让这类画作参与生成,则可能造成生产画面出现水印这种尴尬情况
但理论上可以通过 prompt editing 来避免

这里是一个参考:

nsfw, 
worst quality,low quality,normal quality,lowres,jpeg artifacts,
text,error,extra digit,fewer digits,cropped,signature,watermark,username,blurry,
bad anatomy,bad hands,missing fingers,bad feet,bad eyes, 

  1. 注:早期实现是 1/1.05 具体看官方文档 
  2. 注:在 WebUI 中可以框选这个词按 ↑或者↓键盘快捷执行  

Leave A Reply

Your email address will not be published. Required fields are marked *