· TongFlow Team · Announcements · 5 min read
TongFlow v0.1.0 をオープンソース化しました
AGPL-3.0 のマルチモーダル AIGC スタジオ。テキスト・画像・動画・音声・3D を 1 枚のキャンバスで。Docker コマンド 1 つで起動できます。
TongFlow v0.1.0 が GitHub tong-io/tongflow で公開されました。ライセンスは AGPL-3.0。Docker コマンド 1 つ、あなた自身のマシン、すべてのモダリティを 1 枚のキャンバスで。
何か
TongFlow はマルチモーダル AIGC スタジオで、すべての AI モデルはモダリティ変換であるという 1 つのアイデアを中心に設計されています。テキスト→画像モデルは text → image、音声認識は audio → text、3D 生成は image → 3D。それぞれを型付き入出力を持つノードとしてラップし、無限キャンバスに置く ——目に見えて、編集でき、共有できるクリエイティブパイプラインが手に入ります。
UI は 3 つの動詞で構成されています:
- Add(追加)— 素材をキャンバスに置く:テキスト、画像、写真、スケッチ、音声、動画、ドキュメント、URL、3D モデル
- Transform(変換)— モダリティ間で変換:テキスト→画像、画像→動画、音声→テキスト、画像→3D など
- Combine(組み合わせ)— 結果を組み合わせる:画像融合、リップシンク、ボイスクローン、キャラクター入れ替え、モーション転写
複雑なパラメータパネルもなし、手動配線も不要。素材をキャンバスに置いて、Smart Island から次のステップを選ぶ ——接続は自動で形成されます。
何が作れるか
v0.1.0 のノードグラフですでにエンドツーエンドで動くパターンの例:
- トーキングヘッド動画 — スクリプト → 音声 → 画像 → リップシンク動画。すべて 1 枚のキャンバスで
- 段落から短編動画 — テキスト → シーン画像 → 画像→動画 → カットを連結
- EC 用ビジュアルの量産 — 商品写真 + リファレンスを与え、画像融合でバッチ処理。きれいなバリエーションが揃います
- テキストから音楽 — ACE-Step が文章から完成されたトラックを生成
- AI コミック / ショート — 物語プロンプト → コマ画像 → 配置 → 任意でナレーション
- キャラクターを動かす — 静止キャラクターをモーション転写・キャラクター入れ替えノードでアニメーションに
v0.1.0 の内容
- 7 種類の入力タイプ:テキスト、画像、音声、動画、ドキュメント、URL、3D モデル
- 画像変換:生成、編集、認識(キャプション / Q&A)、アップスケール、画像→3D
- 動画変換:テキスト→動画、画像→動画、最初/最後フレーム補間、動画認識、アップスケール、フレーム抽出、字幕除去、ウォーターマーク除去
- 音声変換:音楽生成、音声合成(プリセット / ボイスクローン / 指示)、音声認識、ノイズ除去、話者分離、声の置換
- 組み合わせノード:画像融合、リップシンク(音声+画像→動画、音声+動画→動画、音声+テキスト→動画)、ボイスクローン、キャラクター入れ替え、モーション転写、テキスト結合
- バックエンドモデル、すべて明記:Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
- 拡張性は設計に組み込み済み:新しい変換は ABI(
config/tongflow.abi.json)とプラグインスキャナで追加。自分のモデル、自分のスロット、自分のワークフローを差し込めます - Docker コマンド 1 つで自前ホスト:
git clone+docker compose up
設計レベルで守られるプライバシー
アカウント不要、中央 CDN なし、テレメトリ送信なし。ワークフローもアップロードファイルもローカル SQLite データベースとローカルディスクに保存 ——コントロールはあなたに、データはあなたのマシンに留まります。外部通信は 2 つだけ:Modal(GPU ワーカー)と、あなたが選ぶ LLM プロバイダ 1 社(OpenRouter / Gemini / OpenAI / DeepSeek)。API キーはあなたの手元に、何 1 つ私たちを経由しません。
試す
git clone https://github.com/tong-io/tongflow
cd tongflow
docker compose up必要なもの:
- Docker(Compose v2)
- Modal アカウントとトークン — 無料枠(月 USD 30 クレジット)で日常作業の GPU 時間は十分まかなえます
- LLM API キーを 1 つ:OpenRouter / Gemini / OpenAI / DeepSeek のいずれか
.env.example を参考に環境変数を設定して http://localhost:3000 にアクセス。最初のワークフローの作り方は Getting Started に書いてあります。
インストールが面倒ならホスト版 https://app.tongflow.com もどうぞ ——同じキャンバス、同じノード、ブラウザですぐ使えます。
コミュニティへ
- GitHub Issues:機能リクエスト、アイデア、バグレポートを github.com/tong-io/tongflow/issues でお待ちしています
- PR を歓迎します:
CONTRIBUTING.mdを参照。プラグインスキャナと ABI のおかげで、新しい変換ノードの追加はスコープが収まる変更になります - Discord:リアルタイムの会話は discord.gg/K7V8az94Zf へ
TongFlow で何か作ったらぜひ見せてください。プロジェクトがお役に立てば、リポジトリへのスター が何よりの応援になります。
