Qwen3-TTS+ComfyUIで声劇を作る!AiCutyの5人でおしゃべりするよ
- AICU Japan

- 20 時間前
- 読了時間: 3分

2026年1月22日、オープンリリースされた音声合成AI「Qwen3-TTS」、その後さらにComfyUIのカスタムノードとして複数登場しました。これにより、テキストから音声を生成するTTS(Text- to- Speech)がComfyUI環境で手軽に利用可能になりました。多人数での会話生成機能は、キャラクター同士の自然な対話シナリオの作成に新たな可能性をもたらします。
みんな、元気にしてる〜?メイだよっ!💛 今日はね、もうめちゃくちゃビッグニュースをみんなに届けにきたよ!なんと、あのQwen3-TTSがComfyUIで使えるようになったんだって!しかも、AICUコラボクリエイターのTORAKOさんが可愛くて楽しいチュートリアル動画を作ってくれたの!!これって、つまり、テキストから自然な声劇ドラマが作れちゃうってこと!?
Qwen3-TTSってなぁに?ComfyUIでどう動かすの?
Qwen3-TTSっていうのはね、Text-to- Speech、つまりテキスト(文章)を読み込ませると、まるで人間が話してるみたいに自然な音声に変換してくれるすごいAIモデルのことだよ!これまでもいろんなTTSモデルがあったけど、Qwen3-TTSは特に表現力が豊かで、いろんな声や話し方に対応できるのが特徴なの!
それがね、まさかあのComfyUI で動かせるようになるなんて、メイ、びっくりしちゃったよ!ComfyUIって言ったら、画像生成AIのStable Diffusionをノードで繋げて、自分だけのワークフローを作れるめちゃくちゃ楽しいツールじゃん?そこに音声生成AIも組み込めちゃうなんて、もう無限の可能性を感じるっ!✨
こんにちは!TORAKOです!
Qwen3-TTSってComfyUIで動かせないの?と思って調べたら カスタムノードたくさんありました!というわけで… 今回は、flybirdxxさん作成のカスタムノードを触ってみました!
どんな感じなのか記事にしようと思ったのですが、めんどくさ… 文字にするのは大変な感じだったので全部動画にしました!
(1)「exampleワークフローを触ってみよう」の巻
(2)「Custom Save Voiceワークフローを触ってみよう」の巻
(3)「Multi-character dialogueワークフローで会話劇を作ってみよう」の巻
今回は音声生成のワークフローだけ触れましたが、モデルをチューニングするワークフローも追加されていました。
これはちょっと私の知識では使い方がわからないので、ご紹介のみです! (Lora学習の様に音声データセットでモデルに組み込める感じなのかな?)
もっとシンプルに音声の生成を楽しみたいよ~という方は こちらのカスタムノードもオススメです!
最後に、動画内で作っていたAiCuty5人の会話をもうちょっと自然な感じになるようにこだわってみました! ※5人の音声はAiCuty公式の決定音声ではありませんが
セリフの書き方や各種設定でまだまだ改善の余地はありそうですね! (つまりは…これも沼です!時間がとける~~\(^o^)/)
以上、AICU コラボクリエイターのTORAKOがお送りしました。 次のコンテストにも使えるね〜!動画への感想も歓迎です!
このカスタムノード、本当に使いやすいからみんなもチェックしてみてね!
TORAKOさんも常連参加!次回の AICU Lab+勉強会 は2/14予定です
ぜひ参加してね!
この記事に「いいね!」と思ったら、いいねとフォロー、おすすめをお願いします!
Originally published at note.com/aicu on Feb 5, 2026.

![まさかの秒速生成&編集!FLUX.2 [klein]でAIアートが秒速進化!](https://static.wixstatic.com/media/3801de_d6664017237441878130e4a98ac6f3ee~mv2.webp/v1/fill/w_980,h_513,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/3801de_d6664017237441878130e4a98ac6f3ee~mv2.webp)
![[LTX-2] ComfyUI標準対応!映像と音の同時生成が可能にする動画生成の異次元(後編)](https://static.wixstatic.com/media/3801de_e2ff75ff274449899a18d23fb40d9cb3~mv2.png/v1/fill/w_980,h_547,al_c,q_90,usm_0.66_1.00_0.01,enc_avif,quality_auto/3801de_e2ff75ff274449899a18d23fb40d9cb3~mv2.png)
![[LTX-2] ComfyUI標準対応!映像と音の同時生成が可能にする動画生成の異次元(前編)](https://static.wixstatic.com/media/3801de_aa92ac55324542c098f67137f2b04b40~mv2.png/v1/fill/w_980,h_513,al_c,q_90,usm_0.66_1.00_0.01,enc_avif,quality_auto/3801de_aa92ac55324542c098f67137f2b04b40~mv2.png)
コメント