TongFlow について

TongFlow はあなた自身のマシンで動くマルチモーダル AIGC スタジオです。無限キャンバスの上でクリエイティブなワークフローを組み立てます—— 素材を置き、モダリティ間(テキスト・画像・動画・音声・3D)で変換し、結果を組み合わせます。

プロジェクト全体は GitHub tong-io/tongflow で AGPL-3.0 として公開されています。v0.1.0 ——初期段階で、機能は限られていて、商業的な誇張はありません。

コアアイデア

  • すべてのモデルはモダリティ変換である。 テキストから画像へのモデルは text → image、音声認識は audio → text、3D 生成は image → 3D。TongFlow はすべてのモデルを、型付き入出力を持つキャンバス上のノードとしてラップします。
  • すべてのモダリティが一級市民。 テキスト、画像、音声、動画、ドキュメント、URL、3D モデル ——すべてが同じキャンバスに並びます。
  • インターフェースは 3 つの動詞だけ。 素材を Add、モダリティを Transform、結果を Combine。複雑なパラメータパネルはありません。

デフォルトでローカルファースト

  • ワークフローとアップロード素材はローカル SQLite ファイル(data/tongflow.db)とローカルディスク(data/uploads/)に保存されます
  • TongFlow アカウント不要、中央 CDN なし、テレメトリ送信なし
  • AI 推論は、あなた自身で構成する 2 つの外部サービスを使います:
    • Modal — GPU/CPU ワーカー(無料枠 月 USD 30 で意味のある H100 時間が含まれます)
    • LLM プロバイダ 1 社:OpenRouter / Gemini / OpenAI / DeepSeek から選択

API キーはあなたが保管します。私たちには見えません。

今あるもの

  • キャンバスに 7 種類の追加タイプ(テキスト・画像・音声・動画・ドキュメント・URL・3D モデル)
  • 5 つのモダリティ間を行き来する変換ノード
  • 組み合わせノード(画像融合、リップシンク、ボイスクローン、キャラクター入れ替え、モーション転写)
  • 明記されたバックエンドモデル:Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
  • 自前ホスト用 Docker コマンド 1 つ

実装の進捗(およびまだ未対応の項目)の正確なリストは、事実源である README を参照してください。

これは何ではないか

  • SLA や同時実行ティアを持つホスト型 SaaS ではありません(まだ)。app.tongflow.com はプレビュー的な存在として提供しています
  • ノーコードのブラックボックスではありません。ノードを並べるのはあなたで、各ノードが何をしているかを把握できます
  • 「どんなモデルでも、いつでも」ではありません。使うモデルを明記し、依存しているプロバイダをリンクします

次に読む

自分のモデルや新しいノードタイプで TongFlow を拡張したい場合は、リポジトリの docs/feature-registry.mddocs/plugins.md を参照してください。