节点类型

TongFlow 的节点分六组。Add 和 Modality 节点承载画布上的素材，其余节点对素材做操作。

权威清单在 tongflow 仓库的 config/tongflow.abi.json 里，本页反映当前状态。

Add 节点（7 个）

Add 节点往画布上落一个新素材。在 Create Mode 下从智能岛的 Add 工具栏选取：

Add 类型一共 7 种，不是 11 种。 老文档把”上传图片”和”摄像头拍照”算成两个节点，其实它们是同一个 addImageNode 里的不同模式。

每个转换吃一种模态、产出另一种，背后接后端模型或外部 LLM。

节点 slot	描述	后端
`gen-text`	根据提示词生成或改写文本	OpenRouter / Gemini / OpenAI / DeepSeek（可配置）
`combine-text`	合并多个文本输入	本地
`split-text`	长文本拆分成块	本地

节点 slot	描述	后端
`gen-video`、`text-gen-video`	文 → 视频	LTX-2
`image-gen-video`	图 → 视频	LTX-2
`image-image-gen-video`	首尾帧 → 视频（插值）	LTX-2
`video-image-gen-video-mix`、`wan-animate-mix`	图 + 视频 → 视频（角色替换 / 场景混合）	WAN Animate
`video-image-gen-video-move`、`video-image-move-animal`	动作迁移（主体取自一方，动作取自另一方）	WAN Animate（move 变体）
`audio-image-gen-video`	音频 + 图 → 视频（数字人 / 说话头像）	LTX-2 / WAN
`video-describe`、`video-gen-text`	视频 → 文	Gemma 4
`video-upscale`	视频放大	SeedVR2
`get-first-frame`、`get-last-frame`	抽帧	本地（FFmpeg）
`subtitle_remove`	去字幕	后端
`remove_watermark`	去水印	后端

节点 slot	描述	后端
`gen-music`	文 → 音乐	ACE-Step
`text-gen-speech-preset`	预设音色 TTS	Qwen3
`text-gen-speech-clone`	参考音色克隆 TTS	Qwen3
`text-gen-speech-instruct`	指令驱动 TTS	Qwen3
`text-audio-gen-speech`	文本 + 参考音频 TTS	Qwen3
`transcribe`、`transcribe-timestamp`	音/视频 → 文本（可带时间戳）	Qwen3
`denoise_audio`	降噪	后端
`separate_speaker`	说话人分离	后端
`separate_audio_track`、`separate-video-audio`	从视频解出音频	本地（FFmpeg）
`convert_voice`	声音 / 音色替换	Qwen3

Combine 节点吃多个输入、产出一个结果。

连线校验由 ABI 驱动。从输出 handle 拖到输入 handle 时，系统检查模态和形状是否匹配——把视频往只收文本的输入上拖，线是连不上的。src/generated/abi/index.ts 里生成的 TypeScript 类型在编译期保证画布和工作流导出器口径一致。

清单里没有你要的转换？可以自己接一个。参考 tongflow 仓库的 docs/feature-registry.md 和 docs/plugins.md。流程：