· TongFlow Team · Announcements  · 5 min read

TongFlow v0.1.0 をオープンソース化しました

AGPL-3.0 のマルチモーダル AIGC スタジオ。テキスト・画像・動画・音声・3D を 1 枚のキャンバスで。Docker コマンド 1 つで起動できます。

TongFlow v0.1.0 が GitHub tong-io/tongflow で公開されました。ライセンスは AGPL-3.0。Docker コマンド 1 つ、あなた自身のマシン、すべてのモダリティを 1 枚のキャンバスで。

何か

TongFlow はマルチモーダル AIGC スタジオで、すべての AI モデルはモダリティ変換であるという 1 つのアイデアを中心に設計されています。テキスト→画像モデルは text → image、音声認識は audio → text、3D 生成は image → 3D。それぞれを型付き入出力を持つノードとしてラップし、無限キャンバスに置く ——目に見えて、編集でき、共有できるクリエイティブパイプラインが手に入ります。

UI は 3 つの動詞で構成されています:

  • Add(追加)— 素材をキャンバスに置く:テキスト、画像、写真、スケッチ、音声、動画、ドキュメント、URL、3D モデル
  • Transform(変換)— モダリティ間で変換:テキスト→画像、画像→動画、音声→テキスト、画像→3D など
  • Combine(組み合わせ)— 結果を組み合わせる:画像融合、リップシンク、ボイスクローン、キャラクター入れ替え、モーション転写

複雑なパラメータパネルもなし、手動配線も不要。素材をキャンバスに置いて、Smart Island から次のステップを選ぶ ——接続は自動で形成されます。

何が作れるか

v0.1.0 のノードグラフですでにエンドツーエンドで動くパターンの例:

  • トーキングヘッド動画 — スクリプト → 音声 → 画像 → リップシンク動画。すべて 1 枚のキャンバスで
  • 段落から短編動画 — テキスト → シーン画像 → 画像→動画 → カットを連結
  • EC 用ビジュアルの量産 — 商品写真 + リファレンスを与え、画像融合でバッチ処理。きれいなバリエーションが揃います
  • テキストから音楽 — ACE-Step が文章から完成されたトラックを生成
  • AI コミック / ショート — 物語プロンプト → コマ画像 → 配置 → 任意でナレーション
  • キャラクターを動かす — 静止キャラクターをモーション転写・キャラクター入れ替えノードでアニメーションに

v0.1.0 の内容

  • 7 種類の入力タイプ:テキスト、画像、音声、動画、ドキュメント、URL、3D モデル
  • 画像変換:生成、編集、認識(キャプション / Q&A)、アップスケール、画像→3D
  • 動画変換:テキスト→動画、画像→動画、最初/最後フレーム補間、動画認識、アップスケール、フレーム抽出、字幕除去、ウォーターマーク除去
  • 音声変換:音楽生成、音声合成(プリセット / ボイスクローン / 指示)、音声認識、ノイズ除去、話者分離、声の置換
  • 組み合わせノード:画像融合、リップシンク(音声+画像→動画、音声+動画→動画、音声+テキスト→動画)、ボイスクローン、キャラクター入れ替え、モーション転写、テキスト結合
  • バックエンドモデル、すべて明記:Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
  • 拡張性は設計に組み込み済み:新しい変換は ABI(config/tongflow.abi.json)とプラグインスキャナで追加。自分のモデル、自分のスロット、自分のワークフローを差し込めます
  • Docker コマンド 1 つで自前ホストgit clone + docker compose up

設計レベルで守られるプライバシー

アカウント不要、中央 CDN なし、テレメトリ送信なし。ワークフローもアップロードファイルもローカル SQLite データベースとローカルディスクに保存 ——コントロールはあなたに、データはあなたのマシンに留まります。外部通信は 2 つだけ:Modal(GPU ワーカー)と、あなたが選ぶ LLM プロバイダ 1 社(OpenRouter / Gemini / OpenAI / DeepSeek)。API キーはあなたの手元に、何 1 つ私たちを経由しません。

試す

git clone https://github.com/tong-io/tongflow
cd tongflow
docker compose up

必要なもの:

  • Docker(Compose v2)
  • Modal アカウントとトークン — 無料枠(月 USD 30 クレジット)で日常作業の GPU 時間は十分まかなえます
  • LLM API キーを 1 つ:OpenRouter / Gemini / OpenAI / DeepSeek のいずれか

.env.example を参考に環境変数を設定して http://localhost:3000 にアクセス。最初のワークフローの作り方は Getting Started に書いてあります。

インストールが面倒ならホスト版 https://app.tongflow.com もどうぞ ——同じキャンバス、同じノード、ブラウザですぐ使えます。

コミュニティへ

  • GitHub Issues:機能リクエスト、アイデア、バグレポートを github.com/tong-io/tongflow/issues でお待ちしています
  • PR を歓迎しますCONTRIBUTING.md を参照。プラグインスキャナと ABI のおかげで、新しい変換ノードの追加はスコープが収まる変更になります
  • Discord:リアルタイムの会話は discord.gg/K7V8az94Zf

TongFlow で何か作ったらぜひ見せてください。プロジェクトがお役に立てば、リポジトリへのスター が何よりの応援になります。

Related Posts

View All Posts »

TongFlow v0.1.0 is open source

An open-source multi-modal AIGC studio with text, image, video, audio, and 3D on one infinite canvas. AGPL-3.0, runs anywhere Docker runs.

TongFlow v0.1.0 开源了

一个 AGPL-3.0 开源的多模态 AIGC 工作室——文本、图像、视频、音频、3D 全部在一张无限画布上。Docker 一行起跑。