認識節點

節點是 vpick 畫布上的基本元件,每個節點負責一件事。

節點類型一覽

節點 做什麼
文字 儲存一段文字
AI 助手 呼叫 AI 產生文案
圖片生成 用 AI 生成圖片
影片生成 用 AI 生成短影片
語音生成 用 AI 生成語音(Voice Over)
音樂生成 用 AI 生成音樂(BGM)
口型同步 讓照片中的人跟著語音說話
合併 將多段影片合併為一段
清單 儲存多筆資料,用於批次處理
上傳 上傳自己的圖片或檔案
人聲分離 將音訊分離為人聲、伴奏、原始音訊
變聲器 用 ElevenLabs 轉換語音風格
音訊混合 將多段音訊混合為一段
群組 將多個節點視覺分組

AI 助手

輸入提示詞,AI 會幫你生成文字內容。

常見用法:

可以開啟「匯出為清單」,把 AI 回覆自動拆成多個項目,方便餵給圖片生成器做批次處理。

圖片生成

支援多種模型(Nano Banana 2、Grok Imagine、Seedream 等),根據文字描述生成圖片。

影片生成

支援多種模型(Veo 3.1、Kling 3.0、Grok Video、Runway 等),根據文字描述生成短影片。

語音生成(Voice Over)

使用 ElevenLabs V3 模型,將文字轉為語音。

音樂生成

使用 Suno V4.5 模型,用文字描述生成完整音樂。

口型同步(Lipsync)

使用 Kling Avatar 模型,將靜態人像照片變成說話影片。

合併(Combine)

將多段影片按順序合併為一段完整影片。

清單

批次生成的關鍵節點。把多筆資料存在清單裡,接到圖片或影片生成器,就會自動為每一筆資料各生成一個作品。

例如清單有 5 個項目,接到圖片生成器,就會產出 5 張圖。

上傳

把自己電腦裡的圖片上傳到畫布。常見用途:

人聲分離(Vocal Separator)

使用 Demucs 模型,將音訊分離為三個獨立的音軌。

變聲器(Voice Changer)

使用 ElevenLabs Speech-to-Speech 模型,將語音轉換為另一種聲音風格。

音訊混合(Audio Combine)

將多段音訊混合為一段。

群組

將多個節點視覺分組,方便管理。

連線

節點之間用線連接,資料會沿著線流動:

[AI 助手] → [清單] → [圖片生成]

這樣 AI 產生的文字會進入清單,清單的每個項目再分別生成一張圖。

進階範例:口型同步影片

[上傳(人物照片)] → image-in → [口型同步]
[語音生成] → audio-in → [口型同步]
[口型同步] → videos-in → [合併]
[音樂生成] → audio-in → [合併]

這個流程會:

  1. 語音生成節點產生語音
  2. 口型同步節點讓照片中的人說話
  3. 音樂生成節點產生背景音樂
  4. 合併節點將口型同步影片 + 背景音樂混合成最終影片