节点类型

TongFlow 的节点分六组。AddModality 节点持有画布上的素材;其余节点对它们做操作。

权威清单是 tongflow 仓库里的 config/tongflow.abi.json——本页反映的是 v0.1.0 状态。

Add 节点(7 个)

Add 节点在画布上落一个新素材。在 Create Mode 下从智能岛 Add 工具栏选:

节点图标用途
addTextNodeType直接在节点内输入文本
addImageNodeImage选本地文件、摄像头拍照、或画板手绘——输出一张图
addAudioNodeMusic选音频文件或麦克风录音
addVideoNodeVideo选视频文件或摄像头录制
addFileNodeFileText上传文档(PDF / DOCX / TXT / MD)
addLinkNodeLink粘贴一个 URL——抓取页面内容为文本
addModelNodeBox上传 3D 模型文件(GLB / GLTF)

总共 7 种 Add 类型,不是 11 种。 老文档把”上传图片”和”摄像头拍照”算作两个独立节点,实际上它们是同一个 addImageNode 内部的不同模式。

Transform 转换

每个转换接受一种模态作为输入,产出另一种。背后接的是后端模型或外部 LLM。

文本转换

节点 slot描述后端
gen-text根据提示生成或改写文本OpenRouter / Gemini / OpenAI / DeepSeek(可配置)
combine-text合并多个文本输入本地
split-text将长文本拆分成块本地

图像转换

节点 slot描述后端模型
image-gen-text文 → 图Z-Image
image-gen图 → 图(整帧编辑)Z-Image
image-gen-model模型条件下的图像生成可配置
image-edit局部修复 / 指令编辑FLUX.2 Klein 9B
image-fusion多图融合FLUX.2 Klein 9B
image-describe图 → 文(字幕 / 视觉问答)Gemma 4(多模态)
image-upscale图像放大SeedVR2

视频转换

节点 slot描述后端
gen-videotext-gen-video文 → 视频LTX-2
image-gen-video图 → 视频LTX-2
image-image-gen-video首尾帧 → 视频(插值)LTX-2
video-image-gen-video-mixwan-animate-mix图 + 视频 → 视频(角色替换 / 场景混合)WAN Animate
video-image-gen-video-movevideo-image-move-animal动作迁移(主体取自一个,动作取自另一个)WAN Animate(move 变体)
audio-image-gen-video音频 + 图 → 视频(数字人 / 说话头像)LTX-2 / WAN
video-describevideo-gen-text视频 → 文Gemma 4
video-upscale视频放大SeedVR2
get-first-frameget-last-frame抽帧本地(FFmpeg)
subtitle_remove去字幕后端
remove_watermark去水印后端

音频转换

节点 slot描述后端
gen-music文 → 音乐ACE-Step
text-gen-speech-preset预设音色 TTSQwen3
text-gen-speech-clone参考音色克隆 TTSQwen3
text-gen-speech-instruct指令驱动 TTSQwen3
text-audio-gen-speech文本 + 参考音频 TTSQwen3
transcribetranscribe-timestamp音/视频 → 文本(可选时间戳)Qwen3
denoise_audio降噪后端
separate_speaker说话人分离后端
separate_audio_trackseparate-video-audio视频解复用音频本地(FFmpeg)
convert_voice声音 / 音色替换Qwen3

跨模态桥接

节点 slot描述
parse-document文档 → 文本
linkURL → 文本
图 → 3D(在管线中)图像 → 3D 模型

Combine 组合

Combine 节点把多个输入合成一个输出。

节点 slot输入输出
image-fusionN 张图一张融合图
speech-video-gen-video、口型同步系列音频+视频 / 音频+图 / 音频+文本 / 音频+图+视频口型同步视频
speech-image-video-gen-video语音 + 图 + 视频合成视频
speech-text-gen-video语音 + 文本视频
convert_voice(组合形式)文本 + 参考音频 → 语音克隆声音
combine-textN 个文本节点 → 一个

Helpers 辅助节点

节点 slot描述
concat-videos多个片段拼接
merge-video-audio音视频合成
split-video按镜头分割(场景检测)
separate-video-audio解复用为独立轨道
extract-audio提取音频轨道
split-text长文本切分成块
combine-text文本段合并
drop-video按规则丢弃片段
arrange-group文本/片段批次分组排列

类型校验

连线校验由 ABI 驱动。从输出 handle 拖到输入 handle 时,系统检查模态和形状是否匹配——如果你试图把一个视频喂给只接受文本的输入,连线不会形成。src/generated/abi/index.ts 里生成的 TypeScript 类型在编译期保证画布和工作流导出器一致。

添加自己的节点

如果你需要的转换不在清单上,你可以接进来。参考 tongflow 仓库的 docs/feature-registry.mddocs/plugins.md。流程:

  1. config/tongflow.abi.json 添加 slot 定义
  2. 重生类型:pnpm gen:abi
  3. plugins/ 下实现插件,用 @node_slot 装饰器配 Pydantic 模型
  4. Bump Python SDK 版本、发布、重新部署 Modal

相关