Midjourneyで生成した画像は5万越え!「すごさ」を解説
岩手大学にて教授を務め、アートからデザイン、自己表現から地域貢献まで岩手県にて幅広い活動を行っている本村健太教授。大学の授業では、ヴィジュアルデザイン、視覚文化、映像メディア表現、デザイン論、色彩演習などを担当しています。
2022年にはADAA(アジアデジタルアート大賞展)にてAIアートアワードを受賞するなど、正しくAIアートの最前線を走る本村教授に、MidjourneyによるAIアートの実践について語っていただきました。
2022年の「AIアート元年」、誰でも画像生成AIが使えるようになった
22年(令和4年)の夏、SNS上では「画像生成AI」(AI:Artificial Intelligence、人工知能)による画像の投稿とともに、いわゆる「AIアート」の話題が盛んになっていました。
SNS上では、AIによる画像がいかに「うまく」描かれているか、あるいはいかに「意外で面白い」結果であるかなどが話題となり、その背景にあるAI技術の進化に対する驚きの声とともに盛り上がりを見せました。
Midjourneyが画像生成AIの火付け役
このように話題となっていたMidjourneyは、指示としてテキストを与えるだけで、関連の画像を自動で生成できるという画期的なもので、話題の発端となった「Midjourney(ミッドジャーニー)」をはじめ、その頃に有名だったものには「DALL·E2」(OpenAI)や「Stable Diffusion」(Stability AI)などがあります。
参考
これらのAIは基本的に文章(テキスト)を入力するだけで画像が生成できるため、ユーザーに絵を描く素養や技術がなかったとしても、テキストの意味合いを含んだイメージを描き出すことができます。しかも、生成された画像は、「クリエイティブ・コモンズ・ライセンス」(国際的な著作権ルール)の設定やAI使用の有料契約をすることで自由に発信したり、自分の他の二次的な作品に活用したりすることもできます。
これらのことから、少なくともデジタル・イメージの領域では制作環境に革命的な変化が起き始めたといえます。誰でも画像生成AIが使えるようになった22年は「AIアート元年」といえるでしょう。
当時を振り返ると、まず22年7月頃、Midjourneyによって生成された画像の完成度が日本においても評価され始めたことで、AIアートは盛り上がりを見せるようになります。その後、同年8月にStable Diffusionが公開されると、無料のオープンソースであったことから、会社や個人での取り組みが爆発的に広がっていきました。下記はその一例になります。
▼吉田拓史「突然注目を集めたAI画像生成Midjourneyを運営する社員10人の「零細企業」の裏側」アクシオン、22年8月5日
▼松浦立樹「画像生成AI「Stable Diffusion」がオープンソース化商用利用もOK」ITmedia NEWS、22年8月23日
https://www.itmedia.co.jp/news/articles/2208/23/news160.html
Midjourneyの最初期ユーザーとして使用
実を言うと私は22年3月下旬から、まだ私的なベータ版として運用されていたMidjourneyについて意見や感想をフィードバックする最初期のユーザー(「Wave1」グループ)として無料で使わせてもらっていた時期がありました。その頃から24年5月中旬現在において、私がこれまでにMidjourneyで生成した画像枚数は5万6千枚を超えています。
本記事では、画像生成AIに関する技術の専門的な研究の立場ではなく、それを表現または発想のために活用する立場から、私が「AIアート」の実践で獲得した制作上の新たな手法と、関連する活動について紹介していきます。また、制作者によって重要になる著作権についての基本的な考え方についても触れていこうと思います。
Midjourneyによる画像生成の進化とともにアートディレクション
画像生成AIであるMidjourneyは、当初よりインターネット上のコミュニケーションツール「Discord」の専用サーバーにおいて作業をするのが基本となっていました。Midjourneyのサーバーには日々数多くのユーザーが集まり、チャンネル(チャット)でAIによる画像生成を試みています。24年3月中旬現在、登録ユーザーが1900万人を超え、同時アクセス中のユーザーが日によっては150万人を超えているようです。Midjourneyのチャンネルでは、他者がプロンプトとしてテキストを入力し、まさに今画像生成しているという経過も閲覧することができるため、興味がある人々が集まった、一つの大きな多国籍コミュニティが出来上がっています。
▼Discord上のMidjourneyのサーバー
Midjourneyの著作権はどうなる?
Midjourneyは他の画像生成AIと同様に、Web上で収集できる画像と関連テキストを学習しており、その学習の集積が画像生成の性能に直結しています。これまでに制作されたデジタルのイメージ(アナログ作品についてはデジタル化されたイメージ)とそこに付随するテキストの意味を合わせて学習しているのです。このことは、画家やイラストレーターが自分の作品を描く以前に、展覧会や書籍、あるいはWeb上で参考になる作品を見たり、たくさんの資料を集めたりするのと同様のことだといえます。
そのように、画家やイラストレーターなどの人であれば、他者の著作権である作品を参考資料として使うことは、特に問題視されることもなく、ほぼ日常的に行っていることです。憧れの作家やデザイナーの仕事を模写や模倣することでトレーニングに励むということもあるでしょう。しかし、画像生成AIがそのように著作権のあるものを学習することについては一部の著作権者から異論が出て訴訟も起きています。このような現状ですので、画像生成AIが安全・安心で信頼できるツールになるための法整備と運用についてはもう少し時間がかかるかもしれません。
著名人を取り込んだフェイク画像も
AIの学習過程においては、インターネット上の作家の作品や著名人などの写真も取り入れられています。
一部には、AIを使って意図的に特定のキャラクターや作家の作風に似せたり、著名人を取り込んだりしたフェイク画像を生成する者もすでに初期の頃から散見されました。
いくら反響や話題性があるとしても、著作権や肖像権を侵害するイメージを発信・公開することは、ポルノ・暴力・偏見を含んでいる場合にも同様に本来避けるべきことです。
これらは画像生成AI自体の問題ではなく、それらを描かせるように指示した、あるいは偶然にも生成してしまったユーザー(人間)の側の倫理的な問題であるといえます。
私は、生成された画像が公開できるかどうかの最終判断はユーザー自身がもっと責任を持つべきだと考えています。
Midjourneyでは、意図せず不本意にそのような画像が生成された場合でも、画像をサーバー自体から削除する機能が以前からありました。(当初から生成された画像に「×」をつけることで生成した画像は削除される設定になっていました。AIの学習にも役立つのでしょう。)
私がMidjourneyの最初期に「Wave1」というユーザーグループで使用していた当時、課題となっていたのは、生成された画像の著作権や肖像権の問題、ポルノや暴力そして偏見を含んだイメージの問題でした。
22年春から夏の初期の頃は、一部のユーザーが、ホラー映画のような気持ちの悪いイメージを生成することも横行しました。逆に当時は美しい女性像を求めても顔の細部をうまく描くのが難しいという状況がありました。
▼niji・journeyの公式サイト
まとめ
画像生成AIを用いた制作環境はどんどん進化しています。今や、Adobe PhotoshopでさえもAdobe FireflyによってAI による生成が可能となっています。MidjourneyのV1(バージョン1)から使用してきた私は、そのバージョンが更新されるたびに、それまでできなかった表現が可能になっていることに驚かされ続けました。
ここで私が強調したいのは、画像生成AIは制作の手段、すなわちツールの一つに過ぎないということです。AI自体には制作する欲求も表現したい内容もないのです。生成された画像は、制作者(ユーザー)の意図によるものです。(もちろん、結果として失敗したり、偶然うまくいくこともあるでしょう。)大事なのは、制作の手法として、制作意図をどのように伝えるかということになります。このような作業は「アートディレクション」として捉えるのが適しているといえます。次回はMidjourneyを使った具体的な制作事例などを紹介したいと思います。
Midjourney で「すごい」AIアートを制作する「呪文(プロンプト)」のコツ
この記事を書いた人
本村健太
岩手県で活動しています。近代ドイツの造形芸術学校バウハウスの理論研究で時代精神と実験的精神を学びました。表現の可能性を広げてくれる「クリエイティブテクノロジー」によって「進化する自己表現のかたち」を楽しみながら実践しています。
お問い合わせはこちらから
Web制作デザイン、丸ごとお任せ
お問い合わせする
テキスト:岩手大学 本村 健太教授 デザイン: 大坂間 琴美