top of page

DiffSynth StudioとDiffutoon:拡散モデルによる高分解能・編集可能なトゥーンシェーダー

執筆者の写真: AICU JapanAICU Japan

Diffutoon(ディフュトゥーン)は素晴らしいトゥーンシェーディングアプローチで、アニメスタイルのフォトリアリスティックなビデオを変換することを目的としています。非常に高い解像度と高速なモーションを扱うことができます。ソースコードはDiffSynth-Studioで公開されており、技術レポートも公開されています。

論文やコード自体は5ヶ月前に公開されていましたが、この分野のハッカーであるCamenduru氏が紹介したことで突然注目されました。

美しい動画の一覧はこちらにファイルがあります

大本の文献はこちら

和訳版

注目すべきは DiffSynth Studio

DiffSynth Studio は Diffusion エンジンです。Text Encoder、UNet、VAE などのアーキテクチャを再構築し、オープンソースコミュニティのモデルとの互換性を維持しながら、計算性能を向上させています。多くの興味深い機能を提供しています。

インストールにはPython, Conda環境が必要で、以下の技術によって構成されています。

 
 
 

Comments


AICU Japan

108-0023 東京都港区芝浦3-3-6 東京科学大学INDEST

  • icons8-リンク-100
  • X
bottom of page