TongFlow について
TongFlow はあなた自身のマシンで動くマルチモーダル AIGC スタジオです。無限キャンバスの上でクリエイティブなワークフローを組み立てます—— 素材を置き、モダリティ間(テキスト・画像・動画・音声・3D)で変換し、結果を組み合わせます。
プロジェクト全体は GitHub tong-io/tongflow で AGPL-3.0 として公開されています。v0.1.0 ——初期段階で、機能は限られていて、商業的な誇張はありません。
コアアイデア
- すべてのモデルはモダリティ変換である。 テキストから画像へのモデルは
text → image、音声認識はaudio → text、3D 生成はimage → 3D。TongFlow はすべてのモデルを、型付き入出力を持つキャンバス上のノードとしてラップします。 - すべてのモダリティが一級市民。 テキスト、画像、音声、動画、ドキュメント、URL、3D モデル ——すべてが同じキャンバスに並びます。
- インターフェースは 3 つの動詞だけ。 素材を Add、モダリティを Transform、結果を Combine。複雑なパラメータパネルはありません。
デフォルトでローカルファースト
- ワークフローとアップロード素材はローカル SQLite ファイル(
data/tongflow.db)とローカルディスク(data/uploads/)に保存されます - TongFlow アカウント不要、中央 CDN なし、テレメトリ送信なし
- AI 推論は、あなた自身で構成する 2 つの外部サービスを使います:
- Modal — GPU/CPU ワーカー(無料枠 月 USD 30 で意味のある H100 時間が含まれます)
- LLM プロバイダ 1 社:OpenRouter / Gemini / OpenAI / DeepSeek から選択
API キーはあなたが保管します。私たちには見えません。
今あるもの
- キャンバスに 7 種類の追加タイプ(テキスト・画像・音声・動画・ドキュメント・URL・3D モデル)
- 5 つのモダリティ間を行き来する変換ノード
- 組み合わせノード(画像融合、リップシンク、ボイスクローン、キャラクター入れ替え、モーション転写)
- 明記されたバックエンドモデル:Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
- 自前ホスト用 Docker コマンド 1 つ
実装の進捗(およびまだ未対応の項目)の正確なリストは、事実源である README を参照してください。
これは何ではないか
- SLA や同時実行ティアを持つホスト型 SaaS ではありません(まだ)。
app.tongflow.comはプレビュー的な存在として提供しています - ノーコードのブラックボックスではありません。ノードを並べるのはあなたで、各ノードが何をしているかを把握できます
- 「どんなモデルでも、いつでも」ではありません。使うモデルを明記し、依存しているプロバイダをリンクします
次に読む
- Getting started — Docker コマンド 1 つでインストール、環境変数設定、最初のワークフロー
- インターフェース概要 — キャンバス、Smart Island、左サイドバー、モード切替
- ノードタイプ — Add / Transform / Combine / Helper のカタログ
自分のモデルや新しいノードタイプで TongFlow を拡張したい場合は、リポジトリの docs/feature-registry.md と docs/plugins.md を参照してください。
