目次
とりあえずやってみる
ラボ立ち上げ後にやること、まずは試してみること。1回目の生成会では自由なテーマで試行をしてみました。そして1週間後、ラボスタッフは以下のような画像を生成しました。
イカダは個人的に約1ヶ月前から画像生成AIに触れ始めていたため、はじめて生成した方の作品と比べると多少の違いがあるかもしれません。
これは、画像生成AIに対する理解度(プロンプトの扱いやモデルの利点・欠点の理解)によるものだと思われます。
1ヶ月程度でもかなりの差が出ることから、プロンプトエンジニアの需要が高まっていることがわかります。
画像生成に使用されたアプリケーションはBing Image Creator(以下Bing)が10名、Stable Diffusionが5名。ここまで差が出るとは思わなかったが、現在国内で最も多く使われている画像生成AIはBing Image Creatorかもしれません。
さて、生成した画像を比較すると、ディテールにおいてはStable Diffusionが優れています。BingはDALL・E2エンジンを使用していますが、UIが本家よりも優れており、無料クレジットも早く回復し、非常にとっつきやすいアプリです。 midjouney利用者はいませんでした。discord自体を使っていない人もまだまだ多いため、midjouneyの普及には壁があるかもしれません。
お題に沿って作る
制作者が報酬をもらうには、依頼・要件に沿った制作物を納品することが必要です。
次の週以降は、お題を出してそれに沿って画像を作ります。2回目のお題は「近未来」。
多様な特徴を持った画像が生成されました。単純なガチャではなく、promptに何を書くかを人間が決めるため、差異があるのは当然です。ただ、やはりStable Diffusionの方がディテールの細かさが際立っています。Bingは遠くから見ると良いのですが、よく見ると多くの画像で曖昧さが目立ちます。
なお、今回も生成アプリの使用数はBingが優勢であり、Stable Diffusionはわずかに増えたものの、手軽に生成を試せるBingでどのような結果を期待できるか試行するというのは良いかもしれません。
Stable Diffusionは様々な設定や拡張が可能で素晴らしいですが、専門知識が多少必要であり、ローカルインストールの場合はマシンスペックも要求されます。
一般的に普及するにはまだ少し時間がかかるかもしれません。逆に言えば、この業界はまだまだ成長の余地があるとも言えます。
画像生成AIの得意・不得意
第3回のお題は「アート/抽象画」です。AIにとっては苦手と思われるジャンルで挑戦。
すると、これまでディテールが強みだったStable Diffusion組は苦戦。プロンプトに「画家の人物名」を指定すればその画家の特徴を捉えた画像を生成できるが、これは模倣でありアートや抽象画と言えるかというと難しいところ。
対してBingは「憂鬱」などの抽象的な単語にも反応し、仄暗く塗り潰した絵画を生成。ただし、生成される画像の質にガチャ運が求められるかもしれない。良いものを常に生成するには、反復的な試行によって期待した結果を得るためのノウハウの蓄積が必要となる。
商用利用について
最後に、各生成アプリの商用利用の現状についてまとめます。(2023年7月時点)
DALL・E2:
商用利用可。著作権表示を推奨(AIによる生成であることを明記すると良い) ただし、暴力的なコンテンツ、アダルトコンテンツ、政治的なコンテンツの生成は不可
Bing Image Creator:
商用利用不可。個人利用は可 ソース: **https://www.bing.com/new/termsofuse?FORM=GENTOS**
作成物の使用。お客様は、Microsoftのサービス規約とコンテンツポリシーに従い、オンラインサービス以外の場所で個人的な非営利目的で作成物を使用できます。
Stable Diffusion:
商業利用可。ただし、モデルによっては商業利用不可の場合もあるため、確認が必要。
midjourney:
有料会員の場合は商用利用可(無料会員は不可) ただし、他人が生成したものは著作権がなく、商用利用も不可。(discordで流れてくるものを利用することは禁止)
Adobe Firefly(ベータ版):
現時点では商用利用不可(PhotoshopのジェネレーティブAI塗りつぶしを含む) ただし、ベータ版に限られる可能性。正式版がリリースされれば商用利用可能になると予想されます。
今回の画像生成AIラボのレポートは以上です。 毎月更新する予定ですので、次回もお楽しみに!