汎用呪文プロンプトの検証をしてみた -PART2 語順編-

AIイラスト

Promptの語順による影響は存在するのか?

あなたは、「Promptの順番を変えるとAIイラストの出来が変わった~!」という声を聞いたことがありませんか?

私はあります。
なので、実際に簡単なサンプルを用いて試してみました。

この後、前置きが続くので本題のみ気になる方は、目次から飛んでいただくとGoodです。

 

本題の前に環境紹介

環境はAnything-v3.0というものです。
NovelAIやStableDiffusionでは少し異なる結果となるかもしれませんが、
こういう傾向があるのかな、くらいには参考になるはずです。

 

ちなみに、記事内で強調表示として(X: 1.5)といった記法を用いますが、
これは「Xを1.5倍強調する」という意味になります。

しかし、NovelAIではこの係数で強調する方法がないため、
{}をひたすら重ねて記入することになります。

NovelAI上では、{}1つで1.05倍強調するという意味です。
なので、{}を何回使う必要があるか数えなくてはなりません!

 

例. 1.2倍強調したいときは、(1.05)n≒1.2となるような自然数nを持ってくればいいわけです。

WHAT????

日本人顔のおじさんが流暢な英語を使ってくれていますが、
つまり、ひたすら電卓で1.05を掛け続けて、1.2に近づくまで何回掛けたかを覚えておきます!
その回数が必要な{}の数となります。

(dog: 1.2) = {{{{dog}}}}

このようになるわけです。
数学できる人は適当にlogで一発です。

 

一応、よく使う係数のおおよその対応表を掲載しておきます。

Anything NovelAI
■1.1倍 ■{{}}
■1.2倍 ■{{{{}}}}
■1.3倍 ■{{{{{{}}}}}}
■1.5倍 ■{{{{{{{{}}}}}}}}
■2.0倍 ■もうこんなの嫌だよ、ママ!!

 

お待たせしました、本題に入りましょう。

 

簡単な例で語順の検討をしよう

犬と猫でやってまうで~

  1. dog, cat の順
  2. cat, dog の順

上記の内容でやってみます。まずは、1から

 

dog, cat の順

猫やんけ!!

 

…取り乱しました。こういうイラストを作為的に持ってきただけです。
あくまでも傾向の考察でしかないということをみなさんに伝えようと思ったからです。

流石に2単語だけだと、語順の効果は薄そうですね。
単語数が増えてくれば影響が大きくなるのかな?

一応、cat, dog の順も検証します。

 

cat, dogの順

私は動物が好きなのでとても癒されますが、検証としてはよく分からない結果となりました。
1つ面白いと思ったのは、語順とイラスト内の動物の位置が対応している点ですね。

これも作為的と捉えられるかもしれませんが、
試してもらえばわかるように、この配置になることが多い気がします。

AIイラストは低Stepsのときに全体を漠然と描き、
Steps数が増えるにつれて詳細を詰めていきます。

配置にまで影響するとは思えませんが、たまたま「そういう」乱数を引いてしまっただけなんでしょうか…

 

ただ、確実に成果として得られたのは、
「dog, catを指定してもcatしか出ないこともある」ことですね。

当たり前だと思われる方がほとんどだと思いますが、
例えば、”dogs and cats”みたいな別の最適な表現がある可能性が高いということですね。
また、このあたりも突き詰めてみたいと思います。

 

Promptのtag数を多くしてみた

さっきの結果がtag数が2つしかなかったからでは?と思ったので
少し長いPromptで試してみようと思います。

いつも使っている汎用呪文の頭と末尾に”dog”と”cat”のtagを付けてみようと思います。
汎用呪文はこちら↓

(1girl: 2.0), (illustrations: 1.3), (best quality: 1.3), (official concept art: 1.2), (outline: 1.2), (dynamic pose and angle: 1.6), (looking at viewer: 1.4), (4k wallpaper: 1.2), (limited tone: 1.8), (cinematic light: 1.2), (CG: 1.1), (all intricate: 1.2), (flat color: 1.7), *//*, (beautiful detailed eyes: 1.5)

汎用呪文の考察はこちらからどうぞ。
かなり詳しく検証しています。

これにdogとcatを付けてみます。

 

dogをつけた場合

つまり、Promptはこうなります。

(dog: 1.5), (1girl: 2.0), (illustrations: 1.3), (best quality: 1.3), (official concept art: 1.2), (outline: 1.2), (dynamic pose and angle: 1.6), (looking at viewer: 1.4), (4k wallpaper: 1.2), (limited tone: 1.8), (cinematic light: 1.2), (CG: 1.1), (all intricate: 1.2), (flat color: 1.7), *//*, (beautiful detailed eyes: 1.5), (cat: 1.5)

 

結果はこんな感じです。

猫女じゃ!!! 

猫、ねこ、ネコ、neko!!!
dogかcatを対象にすると、catの方が女の子と結びつく力が強すぎるんですね

完全に私がサンプルとして持ってきた言葉が間違っていたわけですね…
なので、どちらでも女性を想定できそうなtagを考えました。
(※一応但し書きしておきますが、この文言に一切の他意はございません)

 

“medieval knight” VS “magical alchemist”

正直、この2つのtagを決めるのに非常に時間がかかりました。

理由は簡単、あまりにもバイアスがかかる単語が多い

ただし確実に分かったことはあります。
服装や周囲環境が同時に想像できる単語は、非常に力が強いです。

例えば、はじめに計画していた”Japanese shrine maiden”は強すぎます。
Tier Sです。
語順関係なくすべてこいつに持ってかれます。真理の扉かよ。

 

ぜんぶ巫女になっちゃう。贅沢な悩みです。

 

こうして見出しの単語に決定しました。やるぞ…

あと、べ、別にこれを機に
「偶然良いイラストが生まれないかな~」なんて期待はしてないんだからねっ!!(してる)

 

先攻 “medieval knight”

Promptはこんな感じです。

(medieval knight: 1.5), (1girl: 2.0), (illustrations: 1.3), (best quality: 1.3), (official concept art: 1.2), (outline: 1.2), (dynamic pose and angle: 1.6), (looking at viewer: 1.4), (4k wallpaper: 1.2), (limited tone: 1.8), (cinematic light: 1.2), (CG: 1.1), (all intricate: 1.2), (flat color: 1.7), *//*, (beautiful detailed eyes: 1.5), (magical alchemist: 1.5)

果たして結果は…!?

.

.

.

.

.

.

.

.

 

語順、関係あります。

 

20枚程度作成してみましたが、すべて一部に鎧を着ている姿になりました。
当然、剣などは別途指定が必要そうですが、
「Alchemist感」は感じられないと思います。

やはり、他のPromptによるバイアスがほぼ同条件なら語順は関係あります。

じゃあ”magical alchemist”はどうなったの?と。
どこへ行っちゃったの?まさか無視されてる…!?(急なメンヘラ感)

 

 

 

 

たまにお供がつきます。

あとは”magical”に引っ張られてエフェクトがつきますね。

つまり、”magical alchemist”の要素が失われているのではなく、
しっかりと優先順位が落ちているということです。

 

 

ちなみにこれ立ち位置見てください…

先述した「dog-cat 立ち位置理論」が成立している!!!(いま名付けました)
偶然かもしれませんが、なかなか2人並ぶ絵は生成されないので
判断が難しいところです

 

後攻 “magical alchemist”

最後に入れ替えて評価してみます。

(magical alchemist: 1.5), (1girl: 2.0), (illustrations: 1.3), (best quality: 1.3), (official concept art: 1.2), (outline: 1.2), (dynamic pose and angle: 1.6), (looking at viewer: 1.4), (4k wallpaper: 1.2), (limited tone: 1.8), (cinematic light: 1.2), (CG: 1.1), (all intricate: 1.2), (flat color: 1.7), *//*, (beautiful detailed eyes: 1.5), (medieval knight: 1.5)

 

はい、可愛い。

騎士感はなくなりましたよね。どちらかというと後衛寄りな見た目。
あと、余談ですが錬金術師を指定すると背景に観客がよく映りこみます笑

 

まとめ

以下の条件のときは、語順によってAIイラストに影響を与えることが分かりました。

  • Prompt内のtag数が極端に少なくないこと
  • あまりにも影響力の高いtagを用いないこと (例:猫、巫女など)

 

同時に語順に寄らないことも割とあるなと実感しました。

汎用呪文(クオリティタグ)は、それぞれが強いバイアスを持つ言葉ではないので、
比較的語順の影響を受けやすいのではないかと思いました。

一方で、背景や洋服の指定などはそれらに比べると
語順が割と柔軟なのではないかなと思います。
(全くないとは思いません。)

 

ただ、ここに色の指定が入ってくると話はややこしそうです。
記事内でしようかと思いましたが、この色の内容だけで
1本の記事になりそうなボリュームだったため今回は控えました。

あとは、本記事では分かりやすく1.5倍の強調をしましたが、
係数の大きさでも多少影響度合いが変わるのかなと思います。

 

 

いかがでしたでしょうか?

寄り道しながらの検証にはなりましたが、
個人的にはかなり面白い内容になったと思います。

最後にSSRの「犬っ娘ちゃん」でお別れしましょう
ではまた。

 

コメント

タイトルとURLをコピーしました