简介
TongFlow 是一个跑在你自己机器上的多模态 AIGC 工作室。你在一张无限画布上搭建创作工作流——把素材放上画布,在不同模态之间转换(文本、图像、视频、音频、3D),把结果组合起来。
整个项目以 AGPL-3.0 协议开源在 GitHub tong-io/tongflow。这是 v0.1.0——早期阶段、面小、不耍商业花招。
核心理念
- 所有模型都是模态转换。 文生图模型是
text → image。语音识别是audio → text。3D 生成是image → 3D。TongFlow 把每个模型封装成画布上一个有强类型输入输出的节点。 - 所有模态都是一等公民。 文本、图像、音频、视频、文档、URL、3D 模型——都在同一张画布上。
- 界面只有三个动作。 Add(添加素材)、Transform(模态转换)、Combine(组合结果)。没有复杂的参数面板。
默认本地优先
- 工作流和上传素材保存在本地 SQLite 文件(
data/tongflow.db)和本地磁盘(data/uploads/)。 - 无需 TongFlow 账号、无中央 CDN、无任何遥测。
- AI 推理用两个你自己配置的外部服务:
- Modal 提供 GPU/CPU Worker(每月 30 美元免费额度包含相当多的 H100 时间)
- 一个LLM 服务商任选:OpenRouter、Gemini、OpenAI、DeepSeek
API Key 由你保管,我们看不到。
当前能用的
- 画布上 7 种添加类型(文本、图像、音频、视频、文档、URL、3D 模型)
- 五大模态间互转的转换节点
- 组合节点(图像融合、口型同步、声音克隆、角色替换、动作迁移)
- 具名后端模型:Z-Image、FLUX.2 Klein 9B、LTX-2、SeedVR2、Gemma 4、Qwen3、ACE-Step
- 一行 Docker 命令自托管
精确的功能清单(以及哪些还在 ⬜ 标注中),请看 README——它是事实源。
这不是什么
- 不是带 SLA 和并发分级的托管 SaaS(暂时)。
app.tongflow.com仅作为预览便利存在。 - 不是无代码黑盒。你排列节点;你理解每个节点在做什么。
- 不是”任意模型、任意时刻”。我们明示用的是哪几个模型、依赖哪几家供应商。
下一步
- 快速开始 —— 一行 Docker 安装、环境变量配置、跑通第一个工作流
- 界面总览 —— 画布、智能岛(Smart Island)、左侧栏、模式切换
- 节点类型 —— Add / Transform / Combine / Helper 全部节点清单
想用自己的模型扩展 TongFlow,请参考仓库里的 docs/feature-registry.md 和 docs/plugins.md。
