简介

TongFlow 是一个跑在你自己机器上的多模态 AIGC 工作室。你在一张无限画布上搭创作工作流：把素材放上去，在文本、图像、视频、音频、3D 之间来回转换，再把结果组合起来。

整个项目以 AGPL-3.0 协议开源在 GitHub tong-io/tongflow。项目还在早期，功能面不大，也没有任何商业套路。

核心理念

所有模型都是模态转换。 文生图模型是 text → image，语音识别是 audio → text，3D 生成是 image → 3D。TongFlow 把每个模型封装成画布上的一个节点，输入输出都有明确的类型。
所有模态都是一等公民。 文本、图像、音频、视频、文档、URL、3D 模型，全在同一张画布上。
界面只有三个动作。 Add（添加素材）、Transform（模态转换）、Combine（组合结果）。没有复杂的参数面板。

默认本地优先

工作流和上传素材都存在本地：SQLite 文件（data/tongflow.db）加本地磁盘（data/uploads/）。
不需要 TongFlow 账号，没有中央 CDN，没有任何遥测。
AI 推理靠两个你自己配置的外部服务：
- Modal 提供 GPU/CPU Worker（每月 30 美元免费额度，包含相当可观的 H100 时间）
- 一个 LLM 服务商，四选一：OpenRouter、Gemini、OpenAI、DeepSeek

API Key 由你自己保管，我们碰不到。

当前能用的

画布上 7 种添加类型（文本、图像、音频、视频、文档、URL、3D 模型）
覆盖五大模态互转的转换节点
组合节点（图像融合、口型同步、声音克隆、角色替换、动作迁移）
明确点名的后端模型：Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
一行命令自托管

哪些功能已经可用、哪些还标着 ⬜，以 README 为准——它是唯一的事实源。

这不是什么

不是带 SLA 和并发分级的企业级 SaaS。托管版 app.tongflow.com（$2.99/月，可免费试用）就是同一套开源画布，只是由我们替你运维。
不是无代码黑盒。节点由你排布，每个节点在干什么你都清楚。
不是”任意模型、随时可用”。我们明说用的是哪几个模型、依赖哪几家供应商。

下一步

快速开始 —— 一行命令安装、配环境变量、跑通第一个工作流
界面总览 —— 画布、智能岛（Smart Island）、左侧栏、模式切换
节点类型 —— Add / Transform / Combine / Helper 全部节点清单

想接入自己的模型或新增节点类型，参考仓库里的 docs/feature-registry.md 和 docs/plugins.md。