TongFlow について

TongFlow について

TongFlow は、自分のマシン上で動かすマルチモーダル AIGC スタジオです。無限キャンバスに素材を置き、モダリティ（テキスト・画像・動画・音声・3D）の間で変換し、結果を組み合わせる。この流れでクリエイティブなワークフローを組み立てていきます。

プロジェクト全体を GitHub の tong-io/tongflow で AGPL-3.0 のもと公開しています。まだ初期段階で機能の範囲は小さく、商売上の駆け引きもありません。

基本的な考え方

モデルはすべてモダリティ変換です。 テキストから画像を作るモデルは text → image、音声認識は audio → text、3D 生成は image → 3D。TongFlow はあらゆるモデルを、型付きの入出力を持つキャンバス上のノードとして扱います。
どのモダリティも対等です。 テキスト、画像、音声、動画、ドキュメント、URL、3D モデルが同じキャンバスに並びます。
操作は 3 つの動詞だけ。 素材を追加し（Add）、モダリティを変換し（Transform）、結果を組み合わせる（Combine）。複雑なパラメータパネルはありません。

ローカルファーストが基本

ワークフローとアップロードした素材は、ローカルの SQLite ファイル（data/tongflow.db）とローカルディスク（data/uploads/）に保存されます。
TongFlow のアカウント登録は不要で、中央 CDN もテレメトリもありません。
AI 推論には、自分で設定する 2 つの外部サービスを使います。
- Modal — GPU/CPU ワーカー用。無料枠（月 30 ドル）だけでも H100 をそれなりに回せます。
- LLM プロバイダ — OpenRouter、Gemini、OpenAI、DeepSeek から 1 つ選びます。

API キーは自分で用意して自分で管理します。私たちがキーを目にすることはありません。

現在できること

キャンバスへの 7 種類の素材追加（テキスト・画像・音声・動画・ドキュメント・URL・3D モデル）
5 つのモダリティをまたぐ変換ノード
組み合わせノード（画像融合、リップシンク、ボイスクローン、キャラクター差し替え、モーション転写）
使用モデルはすべて明記：Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
コマンド 1 つでセルフホスト

何が動いて何がまだ未対応かの正確な一覧は README を参照してください。常に README が正です。

TongFlow でないもの

SLA や同時実行数のプランを備えたエンタープライズ SaaS ではありません。ホスト版スタジオ app.tongflow.com（月額 $2.99、無料トライアルあり）は、同じオープンソースのキャンバスを運用込みで提供するものです。
ノーコードのブラックボックスでもありません。ノードを並べるのは自分自身で、各ノードが何をするかを把握したまま使えます。
「どんなモデルでもいつでも」でもありません。同梱するモデルは名前を明記し、依存するプロバイダにはリンクを張ります。

次のステップ

クイックスタート — コマンド 1 つでインストールし、環境変数を設定して最初のワークフローを動かします。
インターフェース概要 — キャンバス、Smart Island、左サイドバー、モード切替。
ノードタイプ — Add / Transform / Combine / ヘルパーの実際のカタログ。

独自のモデルや新しいノードタイプで TongFlow を拡張したい場合は、リポジトリ内の docs/feature-registry.md と docs/plugins.md を参照してください。