AICUでお世話になっております、はねごろう です。 長年、広告映像やバーチャルライブなどのお仕事をしてきた経験を「つくる人をつくる」の時代に活かしていくプロデューサーのしごとをしています。
先日AICU AIDX Labの技術の方々が Stable Diffusion公式APIで1,800枚の画像を生成してくれたのですが、実際にどれぐらい使えそうな絵があるか、選定するテクニックも含めて広告業界のビジュアルとしての使い方を複数回に分けて探っていきたいと思います。
Stable Diffusion – Generate API https://platform.stability.ai/
各モデルの公称特性
Stable Image Ultra 1メガピクセル生成(以下、Ultra) Stable Image Core 1.5メガピクセル生成(以下、Core) Stable Diffusion 3 Large 80億パラメータモデル(以下SD3L) Stable Diffusion 3 Medium 20億パラメータモデル(以下、SD3M)
左上がSD3L、右上がUlta、左下がSD3LとUltraの合成、右下が3Mです。UltraとSD3LはAPIではなく文字プロンプトでスタイルを指定し、共通のシードでは同じような絵が出る傾向があります。 技術チームの印象としては、「cinema, analog filmなどの実写スタイル、SD3LとUltraの間での比較を商業的価値でレビューしてみてほしい」という所見を頂きましたので挑戦していきます。
評価方法
映画やVFXなどの評価と同じく、生成した静止画をつなげた(ラッシュ)を以下のツールを使って再生していきます。
❏動画再生ツール Keyframe MP https://zurbrigg.com/keyframe-mp
1枚づつラッシュを確認し、以下の基準で分類していきます。
❏評価基準は以下の3段階です。 [Bad]画面内で画風の統一がない、不快なアナトミー破綻、中指を突き立てている(商品性・グロ・NSFW) [Good]商品性、キャッチーな構図、明らかなアナトミー破綻がない、検討に値する。 [Best]クライアント直行できるレベル、トップ画像に使える、絵としてほぼ修正が必要ない。
評価対象は多様なスタイルのうち、以下のリアル系スタイルです。

ここでの「スタイル」はAPIでUltraを指定し、プロンプトにスタイルを書くだけ、というとても簡単なものです。 詳しい生成方法は AICU media の過去記事「#10分で学べるAI」をご参照ください。(シリーズの最後にまとめて生成できるスクリプトを紹介します)
Neon-Punk スタイル
Neon-PunkスタイルはBestもBadも豊作。インパクト、ファッショナブル感、個性があるので、まず試してもらいたい。
Best





Bad
Badの理由…Bestになりそうな品質の高い画像があるにも関わらず、惜しいところで商品性、肌の露出、指のアナトミーの不快感のある破綻、特に中指を突き立てているケースなど。
おしい
とても惜しい
構図も演出も表情もよいが、指の破綻。
(中指を突き立てているケースもあるので、その中でも見れる例)
以上、最も個性的でBestもBadも豊作、インパクト、ファッショナブル感、個性があるスタイル「Neon-Punk」を紹介しました。
いろんなプロンプトで、まず試してもらいたいスタイルです。
その他の全画像はこちらのアルバムで確認できます。 Google Photo https://j.aicu.ai/SD3GP
せっかくなので「SD3美女コンテスト」を開催したいと思います。 上記のアルバムの画像において、著作権は主張しませんので、良い画像があったら ハッシュタグ #SD3GP で紹介してください。
AICU AIDX Labにイケてる男子版もつくってもらおうっと!
読者のみなさんもなにかリクエストがございましたら X@AICUai へメンション、DMいただけると幸いです。 Stable Diffusionを使った画像生成やVFX、広告技術についての技術的なお問い合わせについては AICU AIDX Lab – sai@aicu.ai までどうぞ
Comments