Midjourney和NovelAI不完全使用指南

显然,AI绘画已经发展到了一个新的阶段。尽管现在市面上已经有不少AI绘画工具,但要熟练地掌握使用它们也绝非易事。本文从实践出发,为读者讲解如何更好地使用Midjourney和NovelAI这两个时下火热的AI绘画工具,但由于笔者使用时间较短,无法完全驾驭AI绘画工具,因此本文是“不完全指南”。如果本文有任意谬误或缺漏,希望读者能不吝指出。

Midjourney不完全使用指南

太长不看版:使用规范

  1. 首先根据公式 Prompt = 构图说明 + 画面内容 + 美术风格 + 光影设置 + 其他描述 + 参数列表 按照下面的模板写Prompt:
    • 人物特写:a {headshot | closeup} portrait of [content], [art style], [lighting], [other keywords], [MJ parameters]
    • 人物半身照:a {medium shot | over the shoulder shot | head and shoulder shot} portrait of [content], [art style], [lighting], [other keywords], [MJ parameters]
    • 人物全身照:a full body portrait of [content], [art style], [lighting], [other keywords], [MJ parameters]
    • 风景/建筑照:[content], [art style], [lighting], [other keywords], [MJ parameters] 上面用大括号{}括起来且用竖线|分割的内容是多选一,即从所有可选的关键词中选一个即可。用中括号[]括起来的是我们需要根据画面内容填写的。下面介绍中括号填写的基本规范:
    • [content]:是我们要填写的画面内容。如果是人物,主要填下面的内容(不一定都需要,也不一定完整,根据你的需求):
      • 什么人:{boy | girl | woman | old lady | warrior | witch | anthropomorphic white tiger | ...}
      • 脸部特征:{beautiful face | dedicate facial features | colorful tattoos on her face | ...}
      • 表情:{smile | crying | moaning | angry | ...}
      • 眼睛:{beautiful blue eyes | shining diamond eyes | ...}
      • 头发:{long curly black hair | flowing hair | braided hair | ... }
      • 装饰:{exquisite garland | opal decorations | wearing feather headdress | ...}
      • 穿着:{wearing tall black high heel boots | in purple and white kimono | ...}
      • 其他细节:{made of flower | rain on her face | ...} 如果是非人物,则一般不需要写这么细,只要描述大概是什么物体就好了。比如magnificent mountain, interior of a cyber punk city等等。
    • [art style]:指定艺术风格,可以通过三种方式指定:
      • 直接指定主题/绘画风格:比如cyber punk, steam punk, japanese anime, oil painting, realistic painting, ink painting, ukiyo-e, bookstory illustration等等;
      • 直接指定相关风格的艺术家:比如吉卜力风格可以说art by {ghibili | koji hoshino | hayao miyazaki},皮克斯/迪士尼风格可以说art by {pixar | disney},等等;
      • 直接指定作品:比如breath of the wild, dark souls, world of warcraft, lord of the rings等等。 这里推荐使用第二种方式。
    • [lighting]:画面的光影效果,一般来说使用{cinematic lighting | volumetric lighting}比较通用。但对人物,你偶尔还需要用{back lighting | rembrandt lighting | spotlight};对非人物,你可能还要{morning lighting | flare}等等。
    • [other keywords]:其他关键词包括:
      • 材质:{cubic | bronze | wood | liquid | glass | prism | smoke | plume | milky way | ...}
      • 色彩:{dark pink | rainbow | vibrant | warm color | black and white | monochrome | ...}
      • 形状:{star | torus | polygonal | low poly | interior | stellation | stellation | ...}
      • 其他一般默认加上用来叠BUFF的词:{intricate details | 8K | enchanting | masterpiece | octane render | unreal engine 5 | well composed | award winning | high resolution | ...}
    • [MJ parameters]:Midjourney要填写的参数,一般使用下面的参数组合(但也要有意识地灵活运用):
      • 人物特写照:{--ar 1:1 | --ar 3:4} --q 1.5
      • 人物半身照:{--ar 3:4 | --ar 9:16} --q 1.5
      • 人物全身照:{--ar 2:3 | --ar 9:16} --q 1.5
      • 非人物照:根据你的画面内容选择宽高比,如果是横板,则用--ar 16:9 --q 1.5;如果是竖版,则用--ar 9:16 --q 1.5;如果是加长竖版,则用--ar 9:32 --q 1.5
  2. 写好之后,多次出图,你也可以尝试几次参数--test --creative--testp,一般来说效果会更好些,但注意风景图不要用--testp
  3. 从所有的图中找到让你比较满意的图,使用UpscaleVariantRemaster功能对它们增强,反复出图;也可以继续在Prompt中增删细节,直到满意为止。

关键词参考工具
更完整的关键词参考
艺术家参考
风格参考 其他人的作品参考1 其他人的作品参考2

概述

Midjourney是当前最流行的AI绘画工具之一,它部署在Discord上,因此你需要注册一个Discord账号才能使用。

所有的AI绘画工具最重要的就是如何写Prompts,也就是文本描述。在开始之前,你需要知道写Prompts的几个基本准则:

  • 详略得当:描述越详细,图片越有可能接近你想的画面,但是也有更大的概率生成的图片质量更低;描述越简略,图片越多样化,质量也可能更高。但注意不要加太多细节,否则会图片会很低。一般来说,我们只需要写”意象“,而不要写得过于具体。
  • 以短代长:少用超过10个词的句子,而用多个短语,每个短语描述画面的一个细节/部分/风格。即使要用长句,也不要太长,保持在20词以内。
  • 反复润色:不可能第一次生成的图片就完全符合你的想象,需要不断给Prompts润色修改,这不是一个简单的活,因此请保持耐心。
  • 具象描述:尽量用一些具象的名词、形容词,比如river, rockstar, Zeus, landscape, happy, dark等等,不要用一些难以在现实中找到对应实体的词,比如knowledge, notion, type等等。
  • 指定量词:显式指定对象的数量,如果是一个就用a,如果是多个就指定具体数量。
  • 描述风格:在多数情况下都需要增加风格关键词,比如cyberpunk, surreal, abstract, realistic,也可以指定一个或多个艺术家,比如hiroshi yoshida, Max Ernst, MC Escher, Yoji Shinkawa等。此外,你还可以指定具体的绘画形式,比如sketch, woodblock print, oil painting, watercolor painting等等。
  • 描述构图:可以显式指定构图,比如a portrait of, an ultrawide shot of, a headshot of, a closeup of等。

MJ官方文档:https://midjourney.gitbook.io/docs/

注册账号

Midjourney当前作为Discord的内置服务,你可以按照下面的步骤注册账号开始使用:

  1. 登陆官网,点击Join the beta
  2. 进入后输入昵称,加入Discord,如果你没有discord,可能需要根据提示注册一个,之后进入服务器:
  3. 进入一个以#newbies开头的频道,比如#newbies-117:
  4. 在下方的输入框中输入/imagine,此时就能在弹出来的prompt框中输入你想要生成图片的文本描述了,比如我这里输入的是a white flower is crying,稍等片刻,就能在聊天框中看到生成的4张图像了:
  5. 除了生成的4张图像外,下方还有两行按钮,分别是U1/U2/U3/U4和V1/V2/V3/V4,分别表示增大每张图的分辨率,以及为每张图重新随机生成。在点击增大分辨率之后,对应大图会重新发送在频道中,下方也会随之出现几个新按钮,见字如义:
  6. 如果你不想在公共频道,你也可以自己创建一个频道,然后邀请Midjourney Bot到你的频道中。首先在左侧点击添加服务器;然后创建一个私有服务器;最后回到Midjourney的官方服务器,找到Bot,点击后把它添加至服务器即可。

然后你就可以在你自己的服务器里愉快地玩耍了!

使用教学

首先记住下面的公式:

Prompt = 构图说明 + 画面内容 + 美术风格 + 光影设置 + 其他描述 + 参数列表

其中,“构图说明”也可以放在“美术风格”后面,但一般来说直接通过a portrait/closeup/wide angle shot of ...指定了。除了“画面内容”是必须的之外,其他的都可以省略。

建议初学者在这个网站这个网站找对应的关键词,多做尝试。

构图说明

构图说明指定是怎样的构图,比如特写、近景、远景等等。有下面基本的构图: - 特写: closeup, portrait - 全身照:full body, full body portrait - 风景:wide angle, epic composition, low angle, high angle

Prompt一般直接用a [composition] of ...开头,其中[composition]就是你选择的构图,比如你想要一个特写,你就可以说a closeup shot of ...或者a headshot portrait of ...;如果你想要一个全身照,你就可以说a full body portrait of ...

对于风景图,一般不用上述格式,而是直接以内容开头,把构图放在后面,比如vast grassland, wide angle, epic composition,首先说明内容是草原,然后再说用广角镜头和宏大构图。

下图分别是特写/中景/远景的例子,Prompt为a [composition] of an old asian lady --ar 3:4 --q 1.5,其中[composition]分别替换为closeup shot, medium shotfull body portrait,同时把宽高比分别设置为3:4, 2:39:16。最后一张图是风景图,Prompt是vast grassland, wide angle, epic composition --q 1.5 --ar 32:9

你可以看到几种构图之间的差别,至于为什么要更改宽高比,详见下面的参数列表。

画面内容

画面内容指定画面内容。该部分根据需求可详可略,但一般都以多个短语组成,比如下面我想以凤凰为原型设计一个角色,全身照,有红色和黄色的花,穿着彩色华丽的装饰,因此输入的Prompt为a full body portrait of a phonix goddess, red and yellow blossoms, wearing rainbow opal accessories, exquisite decorations --ar 9:16

第一张图加了参数--test,因此细节更加丰富。

对于非人物也是相同的,比如我现在想设计一个亚特兰蒂斯城,它矗立在悬崖边,有着豪华的建筑,我就可以用the city of Atlantis on steep cliff, enormous beautiful palace, exquisit architecture --aspect 9:32 --q 1.5,得到下面的图:

前两张图用了--test

再次强调:描述内容的详略会极大影响生成的结果,越详细,生成的图片会越接近你想象中的画面,但有更大概率质量更低;越简略,越有可能生成非常酷的图片。因此,是否详略取决于你在脑海中是否已经有一个大致的画面,如果你完全没有想法,请尽量保持简略!

比如对我想要的凤凰角色,我不知道她具体是什么样子的,就只需要输入a full body portrait of a phonix goddess --ar 9:16就可以了,然后再不断添加细节(前两张图是原始Prompt,第三、四张图增加了red and yellow blossoms):

美术风格

美术风格指定图片的美术风格是怎样的。美术风格非常重要,它直接决定了图片内容是否与你想象中的相符。我们可以通过三种方法指定美术风格:(1)绘画风格,如realism, realistic, abstraction, impressionism, oil painting, cover art, comic book等等;(2)艺术家名字,如Rolf Armstrong, Lois van Baarle, Aubrey Beardsley等等;(3)与该风格有关的作品/游戏,如breath of the wild, genshin impact

  • 指定绘画风格:比如现在我想对上面的凤凰角色风格化,我可以指定不同的绘画风格,比如下图是依次指定为realism, abstraction, watercolor painting, oil paintingcartoon, anime的结果:

  • 指定艺术家:相比指定风格,一个更好的方法是直接指定艺术家,比如我依次指定了下述艺术家Alphonse Mucha, Alyssa Monks, Andreas Rocha, Miyazaki HayaoEric Lacombe,所生成的图片是:

你也可以指定多个艺术家,但最好它们风格相似。你可以在这个表里找到一些参考艺术家。

  • 指定相关作品:你还可以显式指定作品,下面的图依次显式指定了作品naruto, breath of the wild, dark soul, genshin impactminecraft

一般来说,推荐直接指定艺术家,辅之以绘画风格和相关作品,注意这三者之间的风格要尽量保持一致。当混用的时候,艺术家放在前面。

光影设置

图片的光影也是重要的一部分,我们可以直接指定光影的类型。比如我们以vast grassland with a lake in the center, a giant tree growing by the lake, --ar 16:9 --q 1.5为基础Prompt,分别考虑下述光影moody lighting, morning lighting, cinematic lighting, soft lighting, volumetric lighting, rembrandt lighting, godrayschiaroscuro

除了风景图之外,人物也可以应用不同的光影。下面以a full body portrait of a phoenix goddess, red and yellow blossoms, wearing rainbow opal accessories, exquisite decorations --ar 9:16 --q 1.5为基础Prompt,同样依次加入上面的光影设置:

可以看到,光影能够影响画面的整体风格,因此,根据内容选择一个合适的光影至关重要。

其他描述

除了上面的构成要素外,你也可以增加其他你想要的关键词,大致可分为下面几类。

材质

材质(Material/Texture)也可以用来描述画面的整体风格和细节,比如cubic就可能会使画面出现方块状物体。

下面以a beautiful moon above the desert, the moon is in intricate details, marvel cosmic, Cory Loftis, Conrad Roset, epic composition, low angle, dramatic lighting, spotlight, greyscale, cubic, [material], psychedelic, 8k --ar 2:3 --q 1.5为基础Prompt,分别使用材质cubic, bronze, carbon fiber, foil, glass, wood, liquidsmoke, plume

可以看到,加入不同的材质会整体或局部地影响画面。carbon fiber使画面增加了颗粒感,glass让月亮出现了玻璃状物体,smoke, plume使得画面出现烟雾。当然这里由于Prompt前面的内容足够丰富了,导致部分材质的影响较小,所以区别不是很明显。

如果用简单的描述,再搭配材质关键词,效果会更明显些(Prompt为a tree, [material] --ar 9:16):

颜色

在Prompt增加一些与颜色有关的关键词有助于生成你想象中的画面。最简单的就是直接添加颜色词,比如red, black, blue等等,但这样效果不一定好。一般来说,我们可以增加带有色彩意向的词,比如rainbow, vibrant, warm color, prismatic, black and white, monochrome, high contrast等等。

下面以a medium shot portrait of a beautiful women in dark green kimono, beautiful face, smile, blue eyes, long black hair, painted by Anne Stokes, rembrandt lighting, [color], ultra detailed, plume --ar 2:3 --s 5000为基础Prompt,分别以vibrant color, prismatic, black and white, monochrome, colorful, rainbow为颜色关键词:

形状

你还可以添加形状关键词。这个形状不一定是常见的三角形、正方形,也可以是跟形状有关的物体,比如金字塔pyramid, 星星star,心形heart等等。

比如以a mountain, [shape] --ar 9:16为基础Prompt,考察下述形状star trapezohedron, star prism, torus, polygonal, polyhedron, interior, stellation, square, heart, gear

polygon(多边形)是一种常见的风格,interior则会绘制物体的内部。

其他

一些其他对画面有帮助的词包括: - 细节程度:very detailed, spectacular details, ultra detailed, intricate details - 清晰度:4k, 8k, high definition - 景深:depth of field, Canon 50mm - 情绪:enchanting, impressive - 气氛/环境:vintage, retro, cosmic, celestial, seaside, lucid dream, plume, Gossamer - 绘法:spatter, drips

你也可以增加其他的意象词。

参数列表

你可以在Prompt的最后添加一些参数,用于生成你想要的图片风格和质量。下面列出所有参数,其中加粗的是最常用的。

参数 功能
/imagine 呼出prompt,根据文本描述生成四张图片
/info 查看当前正在运行的任务
/fast(/relax) 切换为使用Fast/Relax GPU时间
/private 切换为private模式,其他人不可见你的图片
/public 切换为public模式,其他人可见你的图片
--hd 使用旧算法,适用于抽象和风景图,图片分辨率更高
--ar 显式指定图片的宽高比,比如 --ar 16:9
--w 显式指定图片的宽度,比如 --w 320
--h 显式指定图片的高度,比如 --h 256
--seed 显式指定种子数
--no 生成的排除该关键词,比如--no plants为去掉文本中的”plants”
--iw 设置prompt中的图片/文本权重比,默认0.25
--s 指定生成图片的风格化程度,值越大,图片越“抽象”,默认为2500
--q 指定图片质量,默认为1,值越大,细节越多,但耗时越长
--chaos 指定图片的随机性,值越大,生成图片越多样,范围[0,100]
--fast 更快地生成图片,但质量会更低,近似于--q 0.5或--q 0.25
--stop 在n%的时候停止终止生成
--uplight 在Upscale的时候用light版本,增加更少的细节,与原图更接近
--testp 生成更接近现实的图片
--test 生成更多样化、风格化的图片

指定宽高比:--ar

--ar指定了生成图片的宽高比,默认为1:1。宽高比会极大影响所生成的图片,比如下面的例子(基础Prompt为Utah teapot, wood --seed 1,从上到下、从左到右分别是宽高比为1:1,2:3,4:9,4:16,3:2,16:9,9:4,16:4):

可以看到,对于同样的内容描述,宽高比直接影响所生成的内容,这是因为AI默认会“填满”整个图,所以在设定宽高比时,要注意你要生成的内容是怎样布局的。

指定风格化程度:--s

-s指定了图片的风格化程度,或者"天马行空度"。默认值为2500;20000会让你的图片看起来比较抽象,但也没有完全偏离你的prompt;但是60000会让图片完全无视prompt自由发挥。

下面举几个例子说明(基础Prompt为Utah teapot, wood --ar 16:9 --seed 1,左边是2500,中间是20000,右边是60000):

可以看到,--s 20000时图片的某些部分已经不符合输入的Prompt里,比如这里丢失了木头材质的信息;--s 60000时就开始放飞自我了。

对于这个参数,一般来说保持默认即可,如果你想要更多样化的结果,可以用5000~10000之间的值。

指定细节度:--q

-q指定了图片的质量,也就是细节的丰富度。默认值为1;2会让图片细节更加丰富,但生成速度也是原来的一半;5会让图片细节爆表,但也有可能导致图片整体效果很差。

下面举几个例子说明(基础Prompt为Utah teapot, wood --ar 16:9 --seed 1,左边是0.25,中间是1,右边是2):

可以看到,图片的细节度是递增的。当然这个例子过于简单了,导致细节度高的茶壶反而有点奇怪。

这个参数我比较喜欢用--q 1.5,谁不喜欢更多细节呢?

生成更逼真/风格化的图片:--testp, --test

--testp让生成的图片更加逼真,而--test会让图片更加风格化。注意这二者都会只输入一张图片而不是通常的四张图。

下面有个例子(基础Prompt为Japanese house with pink roof --ar 16:9 --seed 1,左边为--testp,右边为--test):

左侧的房子很逼真,右侧则不完整。当然这个例子可能不够好,但足以说明这两个参数的区别。

值得注意的是,并不是增加了--testp生成的图片就一定是更现实的,但一般而言是更逼真的。比如你想生成一张二次元萌妹,加了--testp之后反而可能会让萌妹更加仿真,虽然我们都知道她不是现实中存在的。

加入参考图片

除了纯文字内容外,Prompt还支持插入图片,让生成的图片在内容和风格上参考给定的图片。

要插入图片,只需要把图片的链接放在Prompt开头就可以了,比如: https://upload.wikimedia.org/wikipedia/commons/thumb/9/93/Utah_teapot_(solid).stl/1200px-Utah_teapot_(solid).stl.png Utah Teapot --ar 16:9 --seed 1 这个Prompt最开始的链接就是图片地址,然后就是常规的文本内容,把原图和生成的图片做个对比:

再对比一下没有参考图生成的图片Utah Teapot --ar 16:9 --seed 1

显然,有参考图生成的图片在风格和形状上都更接近所提供的图,而没有参考图所生成的图片差异较大。

此外,你还可以通过参数--iw控制参考图的权重,默认是0.25。下面再分别给出权重为0.5和1时所生成的图:

可以看到,AI在很努力地模仿参考图的颜色、形状,但仍然颇有难度。一般来说,用默认的数值就可以了,如果你想要参考图的权重更大些,设置为0.5也足够了。

实战操作

我们把上面说的综合起来使用给几个例子。

吉卜力风格的风景

第一个例子,我想生成一只小船在水村中航行的图,村落有着丰富的细节,吉卜力的风格,同时增加一些晨光。我可以用这个Prompt:A boat ride through a flooded seaside village, beautiful elaborate architecture, painted by Miyazaki, Nausicaa Ghibli, morning lighting, high saturation, spectacular details, epic composition, wide angle, low angle --ar 9:32 --q 1.5,经过几轮比较随意的迭代,我找到下面几张还不错的图:

黑暗系风格的怪物

在第二个例子中,我想设计一个黑暗系风格的怪物。女神似乎在一般的作品中是一个正面的形象,那如果是一个腹黑女神呢?从这个出发,我试着尝试让AI画出一个黑暗系的腹黑女神,有白色裙子、邪恶笑容、黑色翅膀和金色花饰,绘画风格偏现实主义,艺术家选定为Dorothea Tanning。

最后我把Prompt设定为a full body portrait of a wicked goddness, beautiful white dress, evil smile, red eyes, black wings, shining gold flowers on her hair, concept art, photo realistic, painted by Dorothea Tanning, back lighting, dramatic lighting, greyscale, intricate details, bold brushstrokes, mystical --ar 2:3,给出了下面的几张图(最后两张图使用了--testp):

上面的图比较明显的不足是人物脸部,尤其是眼睛都没有得到很好的处理,这是当前MJ画全身照的缺点。当我们画半身照人物特写的时候一般没有这个问题。

蒸汽朋克风格的建筑

第三个例子,我们想画一个蒸汽朋克风格的建筑,细节越多越好。坐落在水边,有丰富的光影,整体基调呈现暖色。

因此,我们选用Prompta beautiful magnificent steampuck building by the seaside, view from the sea, rigorous architecture, ultra realistic, epic composition, wide angle, close up, morning lighting, volumetric lighting, warm colors, intricate details, 8K, hd, unreal engine, enchanting --ar 9:32 --test --creative,生成了下面几幅图:

加入一点艺术家得到下面的图(图一二painted by Earl Norem, Edwin Lord Weeks,图三painted by Elizabeth Shippen Green,图四Ford Madox Brown,图五Farel Dalrymple,图六François Schuiten,图七Franz Marc,图八Georges Rouault):

在实验的过程中发现:不要将--testp用于风景图,否则会有奇怪的东西;相反,在人物图上用--testp效果很好。

使用建议

基于上面的使用方法和我自己的实验,初步建议大家在使用的时候遵循下述规范:

  • 重视参数--ar!很有时候宽高比会严重影响生成的图片,即使输入的其他内容完全一致。比如你想画个人物肖像,如果你的宽度太小无法容纳一张脸,那么AI就完全不会生成正确的肖像画;而如果宽度太大,则可能会出现多个人或者其他不必要的元素。一般来说,宽高比和画面内容的关系如下:
    • 人物特写/Headshot:使用--ar 1:1或者--ar 3:4,并搭配headshot, closeup, portrait等关键词
    • 人物半身照/全身照/角色设计:使用--ar 3:4--ar 9:16,搭配full body, head and shoulder shot, over the shoulder, medium shot等关键词
    • 风景图/远景:使用--ar 16:9,搭配landscape, establishing shot, epic composition等关键词 宽高比的选择完全取决于你想要生成怎样的内容,如果你想生成一个竖版的风景图,也完全可以使用--ar 9:16,总的原则就是!!#e06666 画面内容与宽高比保持一致!!
  • 重视艺术风格!一个合适的艺术风格可以给你的画面带来极大的改变。当你需要偏现实的风格时,可以尝试realistic, photo realistic, ultra realistic等关键词,然后去找合适的现实主义风格的艺术家。当你需要特定的风格时,请精准描述艺术风格,比如浮世绘ukiyo-e,油画oil painting,流行艺术pop art,赛博朋克cyber punk,封面画cover art, 吉卜力Ghibli等等,这需要你对现有的艺术风格有比较丰富的了解!很多时候并不是你画不出来,而是你找不到对应的风格。你可以使用同一风格的多个艺术家作为关键词让画面更加倾向该风格。
  • 重视参数--test--testp!有时候仅用普通的2*2图片不能得到比较好的结果,尤其是Prompt较长的时候。此时,可以多用一下参数--test--testp,也许会带来意想不到的结果。注意,--testp不要用于风景图。
  • 重视参考图!尽管本教程没有过多阐述参考图的效果,但是当你手头有很多参考图时,不妨直接使用它们。记得调整参考图的权重--iw
  • 重视”魔法“关键词!有一些比较通用的关键词,比如intricate details, unreal engine 5, enchanting, ornate, after effect, well composed, elaborate, Sony Alpha等等,可能会提升画面的细节效果,不妨多试试它们。
  • 多尝试,出一张效果好的图需要运气,也需要认真地调试。

最后奉上几张AI绘制的浮世绘风格的图片,希望大家使用愉快 ;p

参考资料

MJ官方文档
关键词参考工具
更完整的关键词参考
艺术家参考
风格参考
其他人的作品参考1
其他人的作品参考2

NovelAI不完全使用指南

太长不看版:使用规范

  1. 首先按照公式 Prompt = 起手叠BUFF + 构图说明 + 画面内容 + 画面风格 + 光影设置 + 颜色设置 + 其他意象 去写Prompt,具体来说:

    • 起手叠BUFF:把下面的内容放到你要写的Prompt最前面,起手BUFF还是比较重要的: {masterpiece}, {best quality}, {ultra-detailed}, illustration, beautiful, 8K, small breasts 最后的small breasts可以换成madium breasts或者其他(你懂的)。
    • 构图说明:人物在画面中的位置、大小、角度等等,常用的有portrait(特写)、medium shot(半身照)、full bodyupper body(全身照)、dutch angle(倾斜镜头)、wide angle(广角镜头)、side view(从侧面看)、back view(从后面看)等等。
    • 画面内容:画面里需要包含的各种内容,可以从人物本身和背景两个角度分别描述。人物内容包括头发、脸部、眼睛、肩膀、耳朵、配饰、手、服装、手套、鞋子等等,但首先需要指定包含几个人,比如1 girl, solo;背景就根据自己的需求增加内容即可,比如dragon background, forest background, beautiful milkyway, burning bettlefield等等。此外,你还可以使用关键词reference sheet生成三视图、设计图。
    • 画面风格:画面的美术风格,常用的包括realistic, outline, sketch, flat color, watercolor (medium), grey scale, ukiyo-e, cover art, poster, comic, art nouveau, cyberpunk, sci-fi, wildstyle, 等等。
    • 光影设置:和MJ一样,设置画面的光影,主要包括:背光backlight, 电影打光cinematic lighting, 圣光holy light, 日光sunlight, 月光moonlight, 波光粼粼glistening light of waves, 金色光golden light等等,你也可以根据需求创造属于你的光影。
    • 颜色设置:使用颜色关键词让画面整体更偏向某种颜色。
    • 其他意象:你可以加入任意多的其他意象词为画面添加细节和内容,比如:阳光sunlight, 河流river, 水晶crystal, 棱镜prism, 冰ice, 浮动floating, 照射shine, 影子shadow, 装饰ornament/decoration/frills, 火焰flames, 火花sparks, 光晕flares, 核爆nuclear explosion, 飞溅的血splashing blood, 飞舞的花瓣flying petals, 等等。
  2. 把下面的内容写到Undesired Content中,然后再加入你想屏蔽的其他关键词: {{{ugly}}},{{{duplicate}}},{{morbid}},{{mutilated}},{{{tranny}}},{breast},mutated hands,{{{poorly drawn hands}}},{{bad anatomy}},{{{bad proportions}}},extra limbs,cloned face,{{{disfigured}}},{{{more than 2 nipples}}},{{{{missing arms}}}},{{{extra legs}}},{{{{{fused fingers}}}}},{{{{{too many fingers}}}}},{{{unclear eyes}}},{{{fused hands}}},{{{fused leg}}},{{{bad feet}}},nsfw,lowers,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,bad

  3. Steps默认28,Scale默认为7,当然你可以根据实际需求调整这两个值。Samping使用默认的k_euler_ancestral即可;

  4. 对你比较满意的图使用VariationEnhance,反复迭代,直到满意为止。

概述

NovelAI是基于Stable Diffusion模型改进的AI绘画工具,它擅长绘制二次元人物图,虽然也可以把它当作综合性的绘画工具,但是生成的图片偏写实,质量不如Midjourney。

写NovelAI Prompt的基本准则是:用关键词(或者称为Tag)描述,而不要用短语甚至句子。关键词包括画面内容(人物头发、眼睛、表情、服饰、姿势、手部、胸部、肩部,等等)、画面风格、构图设置、光影设置、颜色设置、意象词和叠BUFF词等等。

总的来说,写NovelAI Prompt相比MJ更容易些,但要实现精准调教仍然难度很大。下面会详细介绍。

NovelAI官方文档
关键词参考

注册账号(官方)

  1. 登陆官网,注册并登陆账号。

  2. 之后在打开的页面上点击“Generate Images”,或者直接通过网页进入:

  3. 最后输入Prompt并调整右侧参数开始使用:

本地版本

To do

使用教学

NovelAI的Prompt跟MJ差不多,主要遵循下述公式: Prompt = 起手叠BUFF + 构图说明 + 画面内容 + 画面风格 + 光影设置 + 颜色设置 + 其他意象

在介绍每个部分之前,需要先讲解下NovelAI各个参数的作用。

NovelAI的参数

从上到下,从左到右:

  • Prompt:在这个地方输入你的Prompt,使用大括号{}增加一个关键词的权重,使用中括号[]去减少关键词的权重,支持嵌套,比如{{magical}}就表示生成图像的时候会特别关注magical的内容,而[[[green]]]则表示生成时尽量避免生成绿色的内容;
  • 分辨率:在这里设置你图像的分辨率,可以使用预设,也可以手动输入,这个参数非常重要,同MJ,要和你生成的内容相匹配
  • Number of images:生成图像的数量;
  • Undesired Content:输入不想要AI生成的内容的关键词;
  • Add Quality Tags:默认勾上就行;
  • Steps:生成一张图需要的步数,步数越大,生成的时间越长,而且效果也不一定好,一般使用默认值28就好了,除非你已经找到一个很好的Prompt想要增加更多的细节;
  • Scale:控制所生成图像匹配你输入Prompt的程度,值越小,画面越风格化和柔和,值越大,画面越细节和尖锐,但设置过大可能导致效果变差,一般来说使用小于10的值;
  • Sampling:生成时的采样方法,一般而言使用默认的即可。

在生成图像后,会多出来一排选项,其中比较重要的是后面两个:

  • Variations:生成当前图片的变体,在细节上会有不同,但大体都是一样的;
  • Enhance:对当前图像进行增强,会较显著地增加细节。但注意不要把Noise调太高。

起手叠BUFF

NovelAI要把关键信息放在Prompt的前面,因此我们一开始就要叠BUFF,可以先无脑加入下面的BUFF,然后再根据你的需求自行添加: {masterpiece}, {best quality}, {ultra-detailed}, illustration, beautiful, 8K, small breasts

注意上面的最后一个BUFFsmall breasts限制了生成角色胸的大小,对于女性角色必须要有(否则全是涩图)!你如果不喜欢平胸,可以用medium breasts,或者你生成的不是女性,就把这个去掉即可。

构图说明

和MJ一样,可以用portrait表示特写,用medium shot/upper body表示上半身构图,用full body shot表示全身照。

除此之外,还可以用dutch angle表示倾斜镜头,用wide angle表示广角镜头,用low angle表示低角镜头,用depth of field增加景深,用side view表示从侧面看,等等。你可以根据自己想象中的内容选择合适的组合。

!!#3d85c6 这个网站有一些主要的关键词:https://aitag.top/ 。下面的所有内容都可以去参考这个网站,不再赘述。!!

比如下面我用了一些不同的构图关键词去生成a beautiful girl(关键词分别是portrait, medium shot, full body shot, full body shot, dutch angle, portrait, dutch angle, depth of field, portrait, side view, full body shot, back view, full body shot, from above):

画面内容

你首先需要明确图片中包含几个角色,一般来说是一个,那么你只需要加入solo1 girl/1 boy即可。如果是两个,就是two girls,以此类推。

然后,你需要描述这个角色的各种细节,可以从下面角度考虑(不一定都要,看你需求):

  • 头发:disheveled hair, floating hair, azure hair, long hair, short hair, beautiful hair, white hair, curly hair, bob hair, polytails, updo, twintailsside blunt bangs,等等
  • 脸部:tears, cold attitude, smile, sad, annoyed, delicate beautiful face, detailed face,等等
  • 眼睛:Lavender eyes, crystal eyes, bright eyes, beautiful detailed eyes, half closed eyes, hollow eyes, blank stare, rainbow eyes, gradient eyes, sparking eyes,等等
  • 肩膀:bare shoulder, off shoulder
  • 耳朵:pointy ears
  • 手:outstretched arms, arms behind back, hands on hips, hand on own face, hugging own legs, hand in own hair, holding flowers,等等
  • 配饰:gold accessories, white lightsaber, tail, scarf, armor headdress, ribbon, neck ribbon, hair ribbon, halo, necklace, wings, tassel, earrings, wizard hat, headphone, red swordfloral print, 等等
  • 服装:detailed mechanical armor, detailed organdie dress, skyblue dress, princess dress with delicate gold metal decorationswitch dress, white thin detailed cloak, summer long skirt, angel suit, very long dress, translucent fluttering dress with lacekimonotrench coat, cheongsampettiskirt, lolita gothicpleated skirt, 等等
  • 手套/袖子:detailed white gloves, elbow gloves, sleeveless, wide sleeves, large top sleeves, 等等
  • 鞋子:barefoot, thigh boots, getauwabaki, 等等

建议平时可以多看别人的关键词然后记录下来。

使用不同的组合并加入不同的权重可以产生你想要的效果,比如下面的例子:

除了角色本身的细节之外,你还可以指定背景,比如没有背景no background, 以龙为背景dragon background/loong background,以森林为背景forest background,大火为背景fire background/burning background,如下(不同的背景需要不同的权重):

特别说明:如果你想要生成人物设计图(即三视图),你可以用reference sheet,并同时修改分辨率

画面风格

顾名思义,就是需要选择图片的美术风格,下面有一些供参考的风格及其关键词选择:

  • 写实:realistic, photorealistic
  • 素描:sketch, rough sketch, pencil sketch
  • 描边:outline
  • 线稿:lineart
  • 像素:pixel art
  • 平涂:flat color
  • 平面着色:flat shading(注意和平涂不一样,下有例子)
  • 水彩:watercolor (medium), watercolor pencil (medium)
  • 单色:monochrome, spot color, greyscale
  • 浮世绘:ukiyo-e
  • 苏维埃海报:soviet poster
  • 封面:cover art
  • 漫画书:comic book
  • 动漫:comic
  • Q版:chibi
  • 复古艺术:retro artstyle
  • 新艺术派:art nouveau
  • 年代:1970s, 1980s, 1990s
  • 赛博朋克:cyberpunk
  • 狂野风:wildstyle
  • 科幻:sci-fi
  • 奇幻:fantasy
  • 传统日本风格:traditional Japanese art

建议把风格使用至少三个大括号{{{}}}甚至更多包裹起来进行强调,确保可以生成正确的风格图。

你可以选择同一个风格里的多个关键词,或者结合不同的风格。比如你可以融合像素风pixel art和奇幻风fantasy形成像素奇幻风。但最好不要融合超过两种风格,否则生成结果未知。

下面是一些例子(依次是{{{flat color}}}, {{{flat shading}}}, {{{soviet poster}}}, {{{flat color}}}, {{{outline}}}, {{{sketch}}}, {{{{{traditional media}}}}}, {{{ukiyo-e}}}, {{{outline}}}, art nouveau, {{{pixel art}}}, {{fantasy}}, {{{black and white}}}, {outline}, {flat shading}, {flat color}, {concept art}, {lines}, {{{{wildstyle}}}}, {flat color}, {{{{{{{{wildstyle}}}}}}}}, {cyberpunk}, {{{outline}}}, {traditional japanese art}, {anime}, {fantasy}):

除了显式指定美术风格之外,你还可以指定艺术家和作品让画面偏向某种特定的风格。但是和MJ不同的是,NovelAI并不像MJ那样非常依赖艺术家,一般不加,或者最多只加一个艺术家或作品即可。比如下面我分别指定了ghibili, Hayao Miyazaki, breath of the wilddark soul

可以看到,加入艺术家和作品并没有想象中的那样有效,所以推荐不加。

注:当然如果你非常熟悉某个艺术家,那加入艺术家也是可以的,但一般来说需要给艺术家比较强的权重模型才会生成比较相似的风格,而且也不是所有艺术家都支持的,还是建议多做尝试。这个表是已记录的一些艺术家,可以根据风格先在谷歌上搜索,然后自行尝试。

光影设置

这里的光影设置和MJ是一样的,比如下面的光影: 背光backlight, 电影打光cinematic lighting, 柔和光soft lighting, 体积光volumetric lighting, 点光(聚光灯)spotlight, 圣光holy light, 日光sunlight, 月光moonlight, 波光粼粼glistening light of waves, 金色光golden light

颜色设置

颜色没太多好说的,如果你想要画面整体偏某种颜色,直接加入颜色关键词即可。 但更好的方法是直接指定某个物体的颜色,比如red eyes, cyan hair,以实现精准控制。有时候需要加大物体的权重,避免这个颜色控制了其他部件。

其他意象

其他意象词一般用来增加前景和背景的丰富度,以及人物身上的细节,比如下面的一些关键词: 羽毛feather, 自然nature, 叶子leaves, 阳光sunlight, 河流river, 水晶crystal, 棱镜prism, 冰ice, 齿轮gear, 流动flowing, 浮动floating, 照射shine, 影子shadow, 时钟clock, 装饰ornament/decoration/frills, 火焰flames, 火花sparks, 光晕flares, 核爆nuclear explosion, 闪电lightning, 飞溅的血splashing blood, 飞舞的花瓣flying petals, 微风breeze, 风wind, 雨rain, 云clouds, 烟smoke, 雾mist, 纱yarn, 沙sand, 星尘stardust, 银河milkyway, 旋转swirling, 头骨skull, 骨骼skeleton, 几何geometric, 立方体cubic, 多边形polygon

总之你可以添加任何你想要在图片中出现的意象词,但要注意和整体画面内容的搭配。你可以通过调整词的权重控制意象出现的频率。

还是建议找一些相关的参考图和别人给的关键词,多做尝试。

负面关键词

负面关键词是你不想让它出现在图片中的内容,填入Undesired Content中即可。虽然是根据你不想要的内容去选择负面关键词,但是也要一些通用的负面关键词。下面是默认添加的关键词,其他关键词根据需求自行添加: {{{ugly}}},{{{duplicate}}},{{morbid}},{{mutilated}},{{{tranny}}},{breast},mutated hands,{{{poorly drawn hands}}},{{bad anatomy}},{{{bad proportions}}},extra limbs,cloned face,{{{disfigured}}},{{{more than 2 nipples}}},{{{{missing arms}}}},{{{extra legs}}},{{{{{fused fingers}}}}},{{{{{too many fingers}}}}},{{{unclear eyes}}},{{{fused hands}}},{{{fused leg}}},{{{bad feet}}},nsfw,lowers,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,bad

实战操作

下面还是给几个实战操作的例子。

和服风的设计稿

第一个例子,我们想要一个三视图设计稿,主角是一个穿着和服的传统日本女孩,盘发、头上有红色的花、化妆、精致的手镯、漂亮的印花。因为是设计图,所以要调整下分辨率,用默认的Landscape就好了。因此,我用的Prompt是:{{masterpiece}}, {{best quality}}, {{ultra-detailed}}, illustration, beautiful, 8K, small breasts, full body, solo, a japanese girl, {{{{{reference sheet}}}}}, flat color, concept art, brown hair, red flower in hair, {updo}, smile, beautiful face, beautiful makeup, delicate bracelet, {beautiful kimono with intricate floral print}

下面是生成的一些图(尝试了不同的Steps和Scale,Steps大则细节更丰富,Scale越小则多样性越强,但建议Steps<=40, Scale>=6。最后一张图给和服加了blue):

可以看到,人物的手和脚是重灾区,但其他地方还是可以的。另外,活用Enhance能够极大地修复手的问题,关键在于Strength的参数不要太大(0.3左右),Noise设置为0或者非常小。

机甲少女全身照

第二个例子,我想要画一个机甲少女的全身照,有着冷酷的表情、红色的眼睛、脸上有纹身、拿着一把红色的刀,我并不太想指定其他过多的元素,但是想要图片的背景是弥漫着硝烟的战场,空中也飞舞着火星。因此,我使用的Prompt是{{masterpiece}}, {{best quality}}, {{ultra-detailed}}, illustration, beautiful, 8K, small breasts, full body, depth of field, solo, a mechanical girl, detailed mechanical armor, detailed mechanical body} {holding a red sword}, disheveled hair, short hair, cold stares, half-closed eyes, {{dark red eyes}}, gradient eyes, ruined battlefield background, {detailed background}, burning buildings, splashing sparks, flames, holy light

下面是生成的图(使用了不同的Steps和Scale,最后四幅图修改了机甲的颜色):

狂野赛博艺术图

作为我们的第三个例子,我们将探索wildstyle这个风格与其他关键词的组合会得到怎样的效果。wildstyle意味着丰富的色彩,尤其是大面积深色的应用。我们将融入赛博朋克的元素,并搭配不同的关键词看AI会给出我们怎样的结果。我使用的基础Prompt是{{masterpiece}}, {{best quality}}, {{ultra-detailed}}, illustration, {{{{wildstyle}}}}, beautiful, small breasts, solo, {{a girl}}, cyberpunk

下面是生成的图(每张图都调整了wildstyle的权重,附加Prompt依次是, {flat color}, {{flat color}}, {colorful}, {{flat color}}, {{outline}}, sci-fi, {flat color}, beautiful kimono with cherry floral print, {flat color}, watercolor (medium), {{{pixel art}}}):

结果发现,wildstyleflat color, outline等关键词搭配效果很好。

华丽高贵女神范

第四个例子,我想要得到一个华丽高贵的女神,被白色的花簇拥着,穿着华丽的白色礼服,点缀金色丝边,戴着项链、手镯、花环,蓝色的发光的眼睛。分别尝试不同的构图,即特写、半身、全身,和不同的风格,对背景不做要求。采用的Prompt是{{masterpiece}}, {{best quality}}, {{ultra-detailed}}, illustration, beautiful, 8K, very detailed, small breasts, [composition], [style], solo, a royal goddess, disheveled hair, detailed blue eyes, gradient eyes, glowing eyes, vibrant colorful garland, gorgeous princess dress with delicate gold metal decorations, {{white flower decorations}}, {{surrounded by flowers}}, exquisite bracelet, exquisite necklace, bare foot, {{flowing flowers}}, {{liquid}}。其中,[composition]填写构图,[style]填写风格。

下面是生成的一些图片(前两张是portrait, 第三四张是head and shoulder shot, 最后四张是full body;风格第一张是cartoon, anime, 第二张realistic, 第三张cartoon, anime, 第四张fantasy, flat shading, 第五张flat color, geometric, cubic, 第六张cartoon, anime, 第七张flat color, flowing,第八张dark magic, Cthulhu):

使用建议

  • 重视分辨率!道理和MJ一样,即图片的分辨率要和想要生成的内容匹配,不再赘述,详细请看MJ页面。
  • 尝试权重!NovelAI对关键词加权是非常重要的一个操作,有时候你写的关键词没有生效极有可能就是关键词的权重不够导致的,这时候多尝试嵌套几层大括号{{{}}}。一般来说,对
  • 叠通用BUFF!上面给出了最基础的通用BUFF,但是对某些类型的图来说,还有一些额外的BUFF可以叠,建议多看看对不同的美术风格、画面内容,别人怎么叠BUFF的,总结一套属于自己的BUFF表。之后有时间我也会帮大家总结。
  • 加入风格!加入风格(包括与风格有关的关键词)会有助于生成你想要的内容,但注意与MJ不同,NovelAI对艺术家的支持并不好,所以尽量不要用艺术家。加入flat shadingflat color偶尔会有奇效,其他的一些意向词比如flowing, geometric也能创造很好的风格。
  • 多尝试参数!NovelAI的参数虽然没有MJ多,但是调试更加困难。一般来说用Steps=28, Scale=7的默认参数能够得到还不错的效果,如果你发现怎么改关键词都不生效的话,果断尝试修改参数吧(当然也有可能是NovelAI的训练集中没有你输入的内容,弃疗吧)!

参考资料

NovelAI官方文档
NovelAI图像生成注意事项
关键词参考
元素法典——Novel AI 元素魔法全收录(第一卷)