top of page

画像生成界の大激震! nano-Bananaの衝撃(1)


ree

Stable Diffusionのオープンリリースからちょうど3年となる2025年8月26日にGoogleから予告されていた新画像生成AI「nano-Banana」が各種生成AIプラットフォームに一斉リリースされました。


AICUでは「nano-Banana/Gemini 2.5 Flash Image」について、既存の画像生成AIのクリエイターがどのように使いこなしていくべきか、またこれから画像生成AI分野に参加する人々がどのように始めるべきか、複数回の連載で紹介したいと思います。


<編集部による作例>サンプル画像1枚とともに"make a 3d figure on a desktop"



ree

Gemini 2.5 Flash Image(nano-Banana)を発表 ― 最先端の画像生成・編集モデル


執筆:Alisa Fortin(プロダクトマネージャー)

Guillaume Vernade(Gemini開発者アドボケート)

Kat Kampf(プロダクトマネージャー)

Ammaar Reshi(プロダクト&デザインリード)


本日、Googleは最新の画像生成および編集モデル Gemini 2.5 Flash Image(コードネーム:nano-Banana) を発表しました。



ree

こちらリンクでGoogle AI Studio内で試すことができます。


このモデルは以下を可能にします。


  • 複数の画像を一つに融合

  • キャラクターの一貫性を保ったストーリーテリング

  • 自然言語によるピンポイントな画像編集

  • Geminiが持つ世界知識を活かした生成と編集



ree

(lmarena の結果は https://lmarena.ai/leaderboard から取得されます)


Gemini 2.5 Flash Imageを使った開発をさらに容易にするため、Google AI Studioの「ビルドモード」に大幅なアップデートを行いました(今後もアップデートを予定しています)。以下の例では、カスタムAI搭載アプリでモデルの機能を素早くテストできるだけでなく、たった1つのプロンプトでアプリをリミックスしたり、アイデアを実現したりすることも可能です。構築したアプリを共有する準備ができたら、Google AI Studioから直接デプロイするか、コードをGitHubに保存できます。



ree

「ユーザーが画像をアップロードしてさまざまなフィルターを適用できる画像編集アプリを作成してください」といったプロンプトを試したり、プリセットテンプレートの 1 つを選択してリミックスしたり、すべて無料で行えます。


<編集部による作例>「このフィギュアをAmazonギフト券の後ろに立たせて」(日本語)



ree

背景と価格

まず今年初めにリリースされた Gemini 2.0 Flash は「高速・低コスト・使いやすさ」が好評を博しましたが、コミュニティからは「より高品質な画像」と「高度な創造的コントロール」が求められていました。Gemini 2.5 Flash Image は現在、以下のプラットフォームで利用可能です:


  • Gemini API(開発者向け)

  • Google AI Studio(無料で試用可能)

  • Vertex AI(企業向け)


価格

100万出力トークンあたり30ドル

1画像あたり約1290トークン(=約0.039ドル/画像)


[訳註] $1=146.95円として

30ドル=約 4,408円

1画像(1290トークン)$0.039 = 約 5.73円となります


主な機能ハイライト


ree

キャラクターの一貫性を維持

同一キャラクターを別の背景に配置したり、ブランド用のビジュアルを統一して作成可能。プロダクトの多角的なビジュアル展開や、シリーズもののビジュアル制作に最適です。




このモデルは、キャラクターの一貫性に加え、ビジュアルテンプレートへの準拠にも優れています。開発者が不動産物件のリスティングカード、従業員の制服バッジ、カタログ全体のダイナミックな製品モックアップなど、すべてを単一のデザインテンプレートから作成する例が既にあります。


プロンプトベースの画像編集

自然言語で「背景をぼかす」「Tシャツの汚れを消す」「ポーズを変更する」「白黒写真に色をつける」といった操作が可能。編集アプリのテンプレートも提供中。


世界知識を活用した生成

Geminiの知識ベースにより、手描き図の読み取りや、教育ツールとしての応用、現実世界に基づいた正確な表現も可能に。


マルチイメージ融合

複数画像を理解し、融合する機能を搭載。たとえば、商品画像を異なる背景に自然に配置したり、部屋の内装を別スタイルに変えるなどが、1つのプロンプトで実現できます。


すぐに使える!テンプレートアプリも充実

Gemini 2.5 Flash Image は Google AI Studio で、下記のようなテンプレートアプリを提供しています:



これらはすべて「プロンプトだけ」で簡単にカスタマイズ可能。生成したアプリは GitHub へ保存、あるいは Studio 上からすぐに公開できます。


パートナーシップと展開

  • OpenRouter.ai:世界中の300万人以上の開発者へ展開。OpenRouter上で初めて画像生成が可能なモデルです。

  • fal.ai:ジェネレーティブメディア開発者向けプラットフォームと連携し、より多くの開発者に提供。

  • SynthID ウォーターマーク:すべての生成・編集画像には見えないデジタルウォーターマークを埋め込み、AI生成であることを識別可能。


Pythonでの利用例

from google import genai

from PIL import Image

from io import BytesIO


client = genai.Client()


prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation"


image = Image.open('/path/to/image.png')


response = client.models.generate_content(

model="gemini-2.5-flash-image-preview",

contents=[prompt, image],

)


for part in response.candidates[0].content.parts:

if part.text is not None:

print(part.text)

elif part.inline_data is not None:

image = Image.open(BytesIO(part.inline_data.data))

image.save("generated_image.png")




今後の展望

Googleは現在、以下の強化に取り組んでいます:


  • 長文プロンプトへの対応精度向上

  • キャラクター一貫性のさらなる精度アップ

  • 細部描写や事実性の信頼性向上


📝 AICU編集部のまとめ

Googleによる「nano-Banana(Gemini 2.5 Flash Image)」の登場は、まさにStable Diffusionリリースから3年目の節目に起きた、画像生成AI界の地殻変動とも言える出来事です。


AICUでは、これまでComfyUIやAUTOMATIC1111など、オープンソースを基盤とする画像生成技術の進化を追ってきましたが、今回のGoogle製生成モデルの登場は「高性能×即応性×低コスト」を併せ持った“次世代の選択肢”として注目すべき存在です。


今後AICUでは、以下のような観点から実践的な連載を展開していきます:


  • ComfyUIとの使い分けや連携は可能か?

  • 商用利用やポートフォリオ制作における最適解とは?

  • AIキャラクターの継続的な活用にどう活かせるか?

  • 新規参入者が「どこから始めるか?」のガイド


生成AIを使った創作は、いまや選択肢の時代に入りました。AICUはこれからも「わかるAI」「つかえるAI」を届けることで、皆さんのクリエイティブの未来を支えていきます。


読者の皆さんからの投稿も歓迎です!

X@AICUai もしくは AICU.jp/c のコミュニティからお伝えください!


Originally published at note.com/aicu on Aug 28, 2025.

コメント


bottom of page