Midjourney で「すごい」AIアートを制作する「呪文(プロンプト)」のコツ
本記事は、新しい表現を生み出すクリエイティブツールとしての画像生成AIを紹介する記事の第2弾です。記事を執筆するのは、Midjourneyの最初期ユーザーとなった岩手大学の本村健太教授。前回の記事にて、本村先生は2022年にMidjourneyが登場した経緯と、話題となったAIの著作権問題を振り返っていただきました。本村先生いわく、画像生成AIは制作の手段でしかなく、大事なのはAIに制作の手法を指示する、「アートディレクション」として捉えることです。では、どのようにAIアートを制作するのか。本記事では、AIならではの手法と制作例でその「魔法」の秘密に迫ります。
▼ Midjourneyで生成した画像は5万越え!「すごさ」を解説
https://coosy.co.jp/blog/midjourney-practice/
Midjourneyのような画像生成AIによる制作手法の画期的な特徴は、「テキストからイメージへ」を実現したことです。AIに言葉で指示するだけで具体的にイメージを生成するという、まるで魔法のようなことができるようになりました。この場合、制作者は自分の手で描く必要はなく、頭の中で意図したイメージを示す単語や文章を入力するだけで、AIに画像を描いてもらうことができるのです。
生成AI魔法でアート作品をつくるには
AIに指示するテキストを、専門用語で「prompt」(プロンプト)といいます。画像生成のためのプロンプトは、時に「呪文」とも呼ばれます。AIを用いてアート作品を制作するには、この呪文の工夫が重要な課題の一つになってきました。前回の記事でも述べたように、AI自体に制作する意図はありません。あくまで、人間が明確な意向をAIに伝えるための生成魔法、すなわち呪文によってAIを操っているのです。AIはあくまでも制作のためのツールであり、この画像生成によっていかにクリエイティブな制作ができるかが勝負になります。
それでは、ここでMidjourneyによる生成魔法の操り方について紹介したいと思います。今後Midjourneyを使う予定のない方でも、AIアートの基本的な手法についてご確認いただけると思います。
基本的な手法とは次のような流れです。(「作品への活用」については次の機会に)
- プロンプト(呪文)による指示
- AIによる画像生成
- 生成結果の判断(必要ならフィードバックしてプロンプトの加筆修正、あるいは画像の部分的な描き直し)
- 選択した画像のサイズを拡大
- 作品への活用(必要なら、手作業での加筆修正)
前回記事で、MidjourneyのDiscordサーバーを紹介しましたが、現在、Midjourneyは画像生成も可能なWebサイトも運営しており、登録ユーザーは双方、どちらでも画像生成を行うことができます。ここでは、Midjourneyが生まれ、成長してきた場としてのDiscordのほうでまずは解説を始め、後に少しだけWebサイトでの手法についても触れたいと思います。
ちなみに、私は一般のみなさんにもAIアートを体験する開かれた場を作る活動を行ってきた人間です。たとえば、2022年8月より、Midjourneyに興味のある日本人を主な対象として、無料の試用(現在、無料試用は不可)と継続的な制作活動が可能なDiscord サーバー「MJ JAPAN [AI x HUMAN]」(MJちゃんがマスコット)を設置してAIアートを制作する機会を提供してきました。必要に応じて、日本語の解説もしています。さらに、2023年1月にはMidjourneyのユーザー登録で使用可能なniji・journey 用のDiscordサーバー「MJ JAPAN [niji]」も開設しました。
▼ MJ JAPAN [AI x HUMAN]
https://discord.gg/uZX2mRZ7SU
▼ MJ JAPAN [niji]
https://discord.gg/Fm82HwbaC4
Discordサーバー上のMidjourneyの使い方とは
それでは、これからDiscord サーバーでのMidjourneyの使い方を概説します。まず、Midjourneyの具体的な基本操作ですが、Discordサーバー上のチャンネルと呼ばれるスレッドにおいて「/」(半角スラッシュ)をタイプし、そこに表示される「imagine」(イマジン)のコマンドを選択してから、プロンプトを書き込んで実行します。
例えば、「大根」(japanese radish)の絵を描かせたいならば(あまりこのようなケースはないかもしれませんが)、「/imagine prompt:」の後に「japanese radish」(日本の大根)と書いて実行します。
そうすると、現状では四つの画像が結果として提示されました。Midjourneyが学んだ大根のイメージを用いて、ここに新たに4枚の画像が生成されたのです。
このように、Discordサーバー上では生成された画像4枚がセットになっており、「1:左上、2:右上、3:左下、4:右下」の順になっています(前述のWebサイトのほうで「Create」(生成)すると、これらはこの順に「横並び」になります)。
ここで、気に入ったイメージであればこれらに対応する「U1、U2、U3、U4」の選択ボタンで画像を「アップスケーリング」(拡大化)することができます。また、それぞれの画像に対応する「V1、V2、V3、V4」の選択ボタンでさらに「バリエーション」(多様化)をさらに四つ作ることもできます。
このようなユーザーの作業は人の判断によるものであり、これもAIが学ぶ糧になっているようです。さらに、満足できるイメージができあがった場合には、「Favorite」(お気に入り)としてハートの絵文字をつけ、自分で評価することもできます。Discordサーバー上では、他者によるものでもユーザー間でこのような評価ができるようになっており、これらのユーザーによる作業はすべてAIの学びともなっているのです。このようにユーザーが使えば使うほど、AIは賢くなっていきます。
「日本の大根がステージ上で踊っている」——画像生成AIによる制作例
さらに、プロンプトを加筆修正してみることもできます。キーワード間は「,」(コンマ)を入れておきます。また、Midjourneyではプロンプトの後に「--」(ハイフン二つ)と機能を現す記号、そしてそれに対応するパラメータを記述することで細かな指示ができるようになっています(Midjourneyのバージョン「--v」、様式「--stylize」、カオス「--chaos」など、多様にありますがここでは割愛させていただきます)。例えば、画像のアスペクト比を指定したければ「--ar」を加え、そのパラメータとして例えば、「横:縦」の比率「2:3」を書き加えます。
それでは、「/imagine prompt:」の後に「japanese radish, dancing on stage --ar 2:3」と入力してみましょう。「日本の大根がステージ上で踊っている」という意味で、画像は縦横の比を「3:2」と指定しています。最初の画像のセットに満足がいかなければ、もう一度同様に繰り返します。
このように、同じプロンプトでも結果は微妙に異なっています。これはガチャのようなものですから、気に入った結果がでるまで単純に繰り返すという作業となります。ここでの結果の違いは毎回割り当てられる「Seed(シード)値」によるものです。シード値を確認すると、画像2-02は「seed 444410162」、画像2-03は「seed 1665130011」、画像2-04は「seed 717896370」、となっています。プロンプトとシード値が同じであれば、画像の生成結果も同様のものとなります。
しかし、それでもAIはその都度最初から描画しているため、画像2-05のように画像2-04とは微細な差異が生じます。ぜひ間違い探しのように比べてみてください。満足のいく結果が引き出せそうなシード値は、意図的に設定することもできるのです。
このようにして、作業を続けます。結果を見ながら、プロンプトにはどんどん加筆修正を施していくことになります。その結果がこちらです。どのような呪文でできあがったのかは、ご想像にお任せします。
『ベジタブルバレエ』——生成AIアート作品として出版してみました。
私はこのようにして作ったAIアートを作品集にしています。今回のテーマでは、 『ベジタブルバレエ: The Untold Dance of Naked Vegetables』として電子書籍にしています。「野菜の踊り子たち」のイメージは面白いと思いますので、ぜひご覧ください。
▼ kenta_vision (著)
https://amzn.asia/d/9ASQNe0
▼ 『ベジタブルバレエ: The Untold Dance of Naked Vegetables』 Kindle版
kenta_vision (著)
https://amzn.asia/d/9ASQNe0
それでは、先ほどのプロンプトにあるダンスに関連する文言を「ステージ上のファッションモデル」にしてみるとどうでしょう。プロンプトは、ちょっと工夫するだけで、新たな世界観のイメージを生成することができます。
AI搭載のクリエイティブツールで新たな表現が模索できる
これまで、Discordサーバーのスレッド上でのMidjourneyの使い方を具体的に示してきましたが、このような作業は「アートディレクション」というべき行為だということはお分かりいただけたと思います。それでは最後に、Webサイトのほうでの画像生成方法についても紹介しておきたいと思います。
Discordのほうでは、画像生成の場を他者と共有しており、画像生成AIの新たなコミュニティを形成する目的もありました。しかし、Webサイトのほうは、他者の作品が掲示される「Explore」(探究)の他に、「Create」(生成)や「Organize」(管理)、そして「Edit」(編集)などのページが用意されており、より個人的な作業に専念できる場が提供されています。Discordで生成した画像は「Create」と「Organize」の双方のページに掲載されます。
「Create」のページで生成された画像を選択するとプロンプト情報とともに、「Creation Actions」(生成アクション)のボタンが表示されます。ここには、下記の操作が用意されています。
- Vary(バリエーション)
- Upscale(アップスケール)
- Remix(リミックス)
- Pan(パン)
- Zoom(ズーム)
- Rerun(再実行)
- Editor(編集)
- Use Image(この画像を使用)
- Use Style(このスタイルを使用)
- Use Prompt(このプロンプトを使用)
また、「Edit」のページでは、MidjourneyのWebサイト内で生成している画像だけでなく、URLで画像を読み込むか、画像をアップロードすることによって、その画像の部分的な修正、または形状を保ちつつ、質感や色を変更することが可能です。
これらの機能は、単に画像生成AIにお任せではなく、生成結果に「人為的な操作」を加えることを実現しているのです。詳しい内容については割愛させていただきますが、とくに「Create」ページの「Editor」機能や「Edit」ページでは、気に入らない部分だけを消去して書き直させることができますし、画像の中心軸を移動して空白になった部分を改めて描かせることもできます。以前は、どうしようもなく、PhotoshopやClip Studioなどのレタッチソフトで部分を修正しなければなりませんでしたが、この機能で手作業を限りなく少なくすることができるようになりました。
前回の記事では、誰もが使える画像生成AIの登場、特にMidjourneyによる表現の可能性について言及しました。今回の記事では、より具体的に制作の手段、すなわち表現のツールとして作者の意図をどのように伝えるかというアートディレクションとして捉えることのできる事例を紹介しました。今や画像の部分的な修正も可能となっており、このような作業はもはやAI搭載のクリエイティブツールといってもおかしくない状況が生じているのです。次回は、私自身が行ってきたAIアートの具体例を示していきたいと思います。
この記事を書いた人
本村健太
岩手県で活動しています。近代ドイツの造形芸術学校バウハウスの理論研究で時代精神と実験的精神を学びました。表現の可能性を広げてくれる「クリエイティブテクノロジー」によって「進化する自己表現のかたち」を楽しみながら実践しています。
お問い合わせはこちらから
Web制作デザイン、丸ごとお任せ
お問い合わせする
テキスト:本村 健太教授 デザイン:小林 沙綾