ノードタイプ
TongFlow のノードは 6 つのグループに分かれます。Add と Modality ノードはキャンバス上の素材を保持し、それ以外のノードがそれを操作します。
権威あるリストは tongflow リポジトリ の config/tongflow.abi.json にあります ——このページは v0.1.0 の状態を反映しています。
Add ノード(7 個)
Add ノードは新しい素材をキャンバスに置きます。Create モードで Smart Island の Add ツールバーから選択:
| ノード | アイコン | 機能 |
|---|---|---|
addTextNode | Type | ノード本体に直接テキスト入力 |
addImageNode | Image | ファイル選択、カメラ撮影、スケッチ ——画像を 1 枚出力 |
addAudioNode | Music | 音声ファイル選択またはマイク録音 |
addVideoNode | Video | 動画ファイル選択またはカメラ録画 |
addFileNode | FileText | ドキュメントをアップロード(PDF / DOCX / TXT / MD) |
addLinkNode | Link | URL を貼る ——ページ内容を取得してテキストへ |
addModelNode | Box | 3D モデルファイルをアップロード(GLB / GLTF) |
Add タイプは 7 種類で、11 種類ではありません。 古いドキュメントは「画像追加」と「カメラ撮影」を独立した 2 ノードとして数えていましたが、実際は同じ addImageNode 内のモードです。
Transform 変換
各変換は 1 つの入力モダリティを受け、別のモダリティを出力します。バックエンドモデルまたは外部 LLM に接続されています。
テキスト変換
| ノードスロット | 説明 | バックエンド |
|---|---|---|
gen-text | プロンプトからテキストを生成・書き換え | OpenRouter / Gemini / OpenAI / DeepSeek(設定可能) |
combine-text | 複数のテキスト入力をマージ | ローカル |
split-text | 長いテキストをチャンクに分割 | ローカル |
画像変換
| ノードスロット | 説明 | バックエンドモデル |
|---|---|---|
image-gen-text | テキスト → 画像 | Z-Image |
image-gen | 画像 → 編集済み画像(フル画面) | Z-Image |
image-gen-model | モデル条件付き画像生成 | 設定可能 |
image-edit | インペイント / 指示駆動編集 | FLUX.2 Klein 9B |
image-fusion | マルチリファレンス融合 | FLUX.2 Klein 9B |
image-describe | 画像 → テキスト(キャプション / Q&A) | Gemma 4(マルチモーダル) |
image-upscale | 画像アップスケール | SeedVR2 |
動画変換
| ノードスロット | 説明 | バックエンド |
|---|---|---|
gen-video、text-gen-video | テキスト → 動画 | LTX-2 |
image-gen-video | 画像 → 動画 | LTX-2 |
image-image-gen-video | 最初 + 最後フレーム → 動画(補間) | LTX-2 |
video-image-gen-video-mix、wan-animate-mix | 画像 + 動画 → 動画(キャラクター入れ替え / シーン混合) | WAN Animate |
video-image-gen-video-move、video-image-move-animal | モーション転写(被写体と動きを別ソースから) | WAN Animate(move バリアント) |
audio-image-gen-video | 音声 + 画像 → 動画(トーキングヘッド / アニメーションポートレート) | LTX-2 / WAN |
video-describe、video-gen-text | 動画 → テキスト | Gemma 4 |
video-upscale | 動画アップスケール | SeedVR2 |
get-first-frame、get-last-frame | フレーム抽出 | ローカル(FFmpeg) |
subtitle_remove | 字幕除去 | バックエンド |
remove_watermark | ウォーターマーク除去 | バックエンド |
音声変換
| ノードスロット | 説明 | バックエンド |
|---|---|---|
gen-music | テキスト → 音楽 | ACE-Step |
text-gen-speech-preset | プリセット音声で TTS | Qwen3 |
text-gen-speech-clone | リファレンス音声でクローン TTS | Qwen3 |
text-gen-speech-instruct | 指示駆動 TTS | Qwen3 |
text-audio-gen-speech | テキスト + リファレンス音声で TTS | Qwen3 |
transcribe、transcribe-timestamp | 音声 / 動画 → テキスト(タイムスタンプ任意) | Qwen3 |
denoise_audio | ノイズ除去 | バックエンド |
separate_speaker | 話者分離 | バックエンド |
separate_audio_track、separate-video-audio | 動画から音声を分離 | ローカル(FFmpeg) |
convert_voice | 声 / 音色の置換 | Qwen3 |
クロスモーダルブリッジ
| ノードスロット | 説明 |
|---|---|
parse-document | ドキュメント → テキスト |
link | URL → テキスト |
| 画像 → 3D(パイプライン内) | 画像 → 3D モデル |
Combine 組み合わせ
Combine ノードは複数の入力を 1 つの出力にまとめます。
| ノードスロット | 入力 | 出力 |
|---|---|---|
image-fusion | N 枚の画像 | 1 枚の融合画像 |
speech-video-gen-video、リップシンク系 | 音声+動画 / 音声+画像 / 音声+テキスト / 音声+画像+動画 | リップシンク動画 |
speech-image-video-gen-video | 音声 + 画像 + 動画 | 合成動画 |
speech-text-gen-video | 音声 + テキスト | 動画 |
convert_voice(組み合わせ形式) | テキスト + リファレンス音声 → 音声 | クローン音声 |
combine-text | N 個のテキストノード → 1 つ |
Helpers ヘルパー
| ノードスロット | 説明 |
|---|---|
concat-videos | 複数クリップを連結 |
merge-video-audio | 音声と動画をマージ |
split-video | シーン境界で分割(シーン検出) |
separate-video-audio | 別々のトラックに分離 |
extract-audio | 動画から音声トラックを抽出 |
split-text | 長いテキストをチャンクに |
combine-text | テキストセグメントをマージ |
drop-video | ルールでクリップを除外 |
arrange-group | テキスト/クリップのバッチをグループ化・整列 |
型チェック
接続検証は ABI で駆動されます。出力ハンドルを入力ハンドルにドラッグするとき、システムはモダリティと形状が一致するかチェックします ——動画をテキスト入力に渡そうとしても、エッジは形成されません。src/generated/abi/index.ts で生成された TypeScript 型がキャンバスとワークフローエクスポーターをコンパイル時に整合させます。
自分のノードを追加
必要な変換がリストにない場合、プラグインで接続できます。tongflow リポジトリの docs/feature-registry.md と docs/plugins.md を参照してください。フロー:
config/tongflow.abi.jsonにスロット定義を追加- 型を再生成:
pnpm gen:abi plugins/配下に@node_slotデコレータと一致する Pydantic モデルでプラグインを実装- Python SDK のバージョンを上げ、公開、Modal に再デプロイ
関連
- Smart Island — ドックからこれらのノードを呼び出す方法
- ワークフロースタジオ — ノードを接続して実行
- AI 機能 — 明記されたバックエンドモデル
