vpick 使用手冊 開啟 vpick

短劇 Agent(一分鐘短片完整方案)

如果你想要的不是「生幾張圖、幾段影片」,而是完整的一分鐘短劇——從劇本拆解、角色設計、分鏡表、到逐段 Seedance 影片生成、最後合併輸出——這份 Short Video Agent 比這份手冊前面的基礎章節完整很多

它是把整個拍片流程包成一個 5-stage agent,貼一段故事腳本進去,15–20 分鐘後拿到完整短劇 + 13 個檔案清單(角色 reference 圖、環境平面圖、分鏡表、各段影片、合併成品)。

GitHub:snoopyrain/vpick-short-video-agent


為什麼需要它

vpick 本身是節點式畫布 + MCP 工具集。要做出一支完整短劇,需要正確的順序:

  1. 先定風格(寫實 / 動畫 / 卡通)、長寬比、有幾個角色
  2. 把腳本拆成 4–6 個 Parts,每個 Part 對應一段 6–10 秒影片
  3. 為每個角色先生「四面向 reference 圖」,確保跨鏡頭角色長相一致
  4. 為每個場景生「環境平面圖」+ 道具圖
  5. 寫繁中分鏡表(每個 Part 一張表,含鏡頭運動 / 對白 / 動作)
  6. 用 Seedance 2 生影片(每個 Part 一段,帶起始幀 + 對白)
  7. 合併輸出

少一步影片就會:角色長相跑掉、鏡頭風格不一致、對白和畫面對不上、最後拼不起來。

Short Video Agent 就是把上面這 7 步包成 5 個 stage,每個 stage 結束會等你「全部確認」才進下一階段,避免歪掉繼續燒錢。


兩種使用方式

兩邊內容完全等價,只是封裝方式不同。

模式 適合誰 安裝
網頁版 Claude.ai Project 在 claude.ai 用 Project Files 上傳 7 個檔到 Project,Instructions 貼 00-INSTRUCTIONS.md
Claude Code skill 用終端機的 Claude Code CLI 複製整個 VPick-Short-Video-Skill/~/.claude/skills/vpick-storyboard/

詳細安裝步驟在 GitHub repo 各自資料夾的 README。

共同必要前置

VPick MCP connector 必須先連線到 Claude。整個 agent 的圖 / 影片節點都靠 mcp__vpick__* 工具執行,沒有 MCP connector 就跑不動。

連線方式請看 連接 MCP


5 階段流程

Stage 動作 並行 確認門檻
1 確認影片基本設定(風格、長寬比、角色數、是否用 reference 圖 / 聲音) 1 個 JSON
2 拆解腳本 → JSON + 繁中表格 1 個 JSON
3 create_project → 角色四面向總圖 + 環境平面圖 + 道具圖 全部圖確認
4 各 Part 繁中表格 Storyboard 全部圖確認
5 Seedance 2 影片(含對白)→ 合併 → 列檔 「開始生成」+ 最終檔案清單

每階段結束會**等你「全部確認」**才進下一階段。Stage 5 run_video_generator 必須等你明確說「開始生成」才呼叫——避免 agent 自己跑 5 分鐘後你才發現分鏡錯了。


快速試一下

  1. 上面兩種模式挑一種裝好

  2. 直接貼一段故事腳本到對話框,例如:

    下雨的夜晚,Anna 撐著紅色雨傘走在巷弄裡, 突然 Bryan 從陰影中出現,說:「我等妳很久了。」 她退後半步,握緊了傘柄……

  3. Claude 自動進入 Stage 1 確認設定,一路按指示確認下去

  4. 15–20 分鐘後拿到完整短劇 + 所有素材


客製角色與聲音

repo 內建一組 Andy 男主角範例(頭像 + 聲音),讓你不必準備素材就能跑完整流程看效果。

⚠️ 這只是範例。做你自己的短劇時請換成自己的人物頭像 / 語音。

換成自己的有 3 條路:

路線 1:Stage 1 直接告訴 Claude

character_b 的 reference_image_url 換成 https://你的圖.com/me.png
character_b 的 voice_reference_url 換成 https://你的mp3.com/me.mp3

路線 2:Stage 2 確認 JSON 時直接改

{
  "id": "character_b",
  "reference_image_url": "https://你的圖片網址.com/me.png",
  "voice_reference_url": "https://你的音檔網址.com/me.mp3"
}

路線 3:全部不要參照、純文字生成

把對應 URL 欄位填 null,Stage 3 純文字生成角色,Stage 5 Seedance 自動配音。

素材建議規格

類型 建議
頭像圖 png / jpg,≥ 512×512,最佳是 4 面向(正面 / 側面 / 背面 / 大頭)
語音 mp3 10–30 秒乾淨人聲,單一說話者,無背景音樂,中性語氣

URL 可以放:Google Drive 公開分享、GCS / S3 / Dropbox 公開連結、自己的網站圖床、任何 png / jpg / mp3 直連。


跟基礎章節的差異

項目 基礎章節 Short Video Agent
適用場景 單張圖 / 單段影片 / 簡單批次 完整一分鐘短劇
流程結構 自由組節點 5 個固定 stage,逐步確認
角色一致性 自己手動拉 reference 內建角色總圖機制
分鏡表 自己寫 prompt 繁中表格 storyboard 自動產出
影片合併 自己用 Combine 節點 流程最後自動合併
預期完成時間 幾分鐘 15–20 分鐘

簡單需求用前面章節,真的要做一分鐘短劇就直接上 agent