top of page

速すぎ!?Alibaba発「Z-Image-Turbo」誕生!!


ree

2025年11月27日、AlibabaグループのTongyi Labは最新の画像生成AIモデル「Z-Image-Turbo」を発表しました。このモデルはApacheライセンスで公開されたオープンソースモデルであり、6Bという軽量なパラメータ数ながら、わずか8ステップでの高速生成と、家庭用GPU(VRAM 16GB)での動作を可能にする画期的な技術を特徴としています。Hugging Face Spaceでも体験できます。




元気いっぱいの AiCuty の黄色担当&画像生成担当、 メイ・ソレイユ だよ!🌟昨日はFLUX.2がリリースされたところだけど、今日は中華テック界の巨人、Alibabaからとんでもないニュースが飛び込んできたから、早口で解説しちゃうね!その名も 「Z-Image-Turbo」 !これね、ただの新しいモデルじゃないの。最近の画像生成AIって「デカいは正義」みたいになってて、VRAM足りないよ〜って泣いてた人も多いと思うんだけど、こいつはなんと 「軽量・爆速・高画質」 の三拍子揃ったヤバいやつなんだよ!FluxとかQwenImageとかライバルひしめく中で、あえて軽量化で攻めてきたこのモデル、Apacheライセンスで商用も使いやすいし、みんなのPCでもGoogle Colabでも動く可能性大!ってことで、メイと一緒に中身を見ていこー!⚡️



ree

① Z-Image-Turboって何がすごいの?🚀

まず画質とスペック見て!ビックリするよ?



ree

  • 開発元:Alibaba (Tongyi Lab)

  • モデル名:Z-Image-Turbo(別名:造相 / Zaoxiang)

  • パラメータ数6B (ここ重要!)

  • ライセンスApache 2.0 (神!)


昨日評価していた「Flux.1 Dev」が 32B、「QwenImage」が 20B ある中で、このZ-Image-Turboはたったの 6B なの!


「えっ、小さいと頭悪いんじゃないの?」って思ったっしょ?違うんだな〜これが!



ree

「蒸留(Distillation)」 って技術を使って、賢さをギュギュッと凝縮してるから、VRAM 16GB の一般的なゲーミングPCでもサクサク動いちゃうんだよ!しかも生成にかかるステップ数はたったの 8ステップ !H800みたいな業務GPUなら 1秒未満 で画像が出ちゃうんだって!⚡️



ree

Imagen 4 Ultra Preview 0606> gemini-2.5-flash-image-preview>Seedream 4.0 > Z-Image-Turbo > Seedream 3.0 > Qwen-Image > GPT Image 1 > FLUX.1 Kontext Pro という順番



ree

② 技術の秘密:S3-DiTと蒸留技術🧪

ちょっとマニアックな話するけど、ついてきてね!


Single-Stream DiT (S3-DiT)

普通のモデルはテキストと画像を別々に処理しがちなんだけど、これは全部まとめて一つの流れ(ストリーム)で処理しちゃうの。だから効率が良い!


Decoupled-DMD & DMDR

これこそが「8ステップ」の秘密!従来の手法を分解して、「CFG(プロンプトにどれだけ従うか)」と「DM(画像の分布)」を別々に最適化したんだって。さらに強化学習(RL)も組み合わせてるから、少ない手数でもめちゃくちゃ綺麗な絵が出るってわけ!


メイ的に言うと、「無駄な動きを極限まで削ぎ落とした、達人みたいなAI」 ってこと!


③ 中国語も英語も描ける!バイリンガル性能🀄️

Alibaba発だけあって、英語だけじゃなくて 中国語のテキスト描写 も得意なんだよ!プロンプトの理解力もすごいから、複雑な指示もしっかり聞いてくれるの。



ree

例えば、公式にあるこのプロンプトをためしてみて!


Young Chinese woman in red Hanfu, intricate embroidery. Impeccable makeup, red floral forehead pattern. Elaborate high bun, golden phoenix headdress, red flowers, beads. Holds round folding fan with lady, trees, bird. Neon lightning-bolt lamp (⚡️), bright yellow glow, above extended left palm. Soft-lit outdoor night background, silhouetted tiered pagoda (西安大雁塔), blurred colorful distant lights.



ree

「稲妻ランプ(⚡️)」みたいな現代的な要素と、伝統的な「漢服」をミックスしても、ちゃんと破綻せずに描けるのがこのモデルの強みなんだって!


これを日本語訳してメイ風にアレンジするとこんな感じかな?


紺の和服を着た若く美しい日本の男性、完璧なメイク、顔の横にネオンの稲妻ランプ(⚡️)があり、明るい黄色の輝きを放っている。柔らかな照明の屋外の夜の背景、シルエットになった東京タワー、ぼやけた色とりどりの遠くの明かり。



ree

和風のイケメンだ!


④ どうやって使うの?(Python & ComfyUI情報)🐍

開発者のみんなは、今すぐPythonで動かせるよ!ただし、diffusers ライブラリをソースからインストールする必要があるから注意してね!


さっそくGoogle Colab L4 GPUで動かしてみたんだけど、だいたい1生成で13秒ってところです。画質はとてもいい感じ。いま1200枚ぐらい生成してみてます。



ree

ComfyUIは0.3.75からサポートされます。



せっかくPythonで生成するので同じプロンプトで日本語を左に、英語を右にしてみたよ。



ree


ree


ree


ree

⑤ まとめ:クリエイターの新しい武器になる予感!

Z-Imageシリーズは、今回出た 「Turbo」 だけじゃなくて、蒸留されてない 「Base」 モデルや、画像編集に特化した 「Edit」 モデルも控えてるんだって!



ree

VRAMが少なめのPCを使っているクリエイターにとっては、Flux画質でサクサク生成できるこのモデルは救世主になるかも!?Apacheライセンスだから、自分のアプリに組み込んだり、新しいサービスを作ったりするのにも最高じゃん?これからのAI画像生成は「デカさ」勝負から「効率」勝負に変わっていくのかもね!


ComfyUI版が出たら、メイも早速 AiCuty の画像生成ワークフローに組み込んでみるつもりだよ!


それじゃ、また次の速報で会おうね!バイバーイ!👋💛




Google Colabで動くコードはこちら


記事の続きは…

aicu.jp を定期購読してお読みください。

 
 
 
bottom of page