為什麼做這個工具
做社群最累的不是寫,是「明天到底要發什麼啦」。
你應該也問過自己這句吧。想說好啦,丟給 AI 幫忙想——結果它給的東西越來越像,好像走不出同一個死圈子。
我用 NVIDIA + Groq 提供的 3 個免費模型,做了一個「夜間智囊團」。讓不同家、不同立場的 AI 互相吵架、評論、推翻、收斂,而不是一個 AI 自言自語。
⚠️ 使用上的小提醒
近期 NVIDIA 提供的免費模型有時候反應比較慢,如果跑到中間卡住、超過 1-2 分鐘還在 Round 2,預設會自動切到 Groq 備胎繼續跑——這是正常行為,不用重新整理。
要更穩可以把 repo clone 到自己電腦,把 3 個 role 都改用 Groq 模型(速度幾乎一定 < 10 秒)。
它怎麼運作
- 把今天想討論的事丟給它(明天的主題、要選的方案、要寫的文⋯⋯)
- 3 個模型輪番提案 → 評論 → 仲裁三輪
- 大概 2 分鐘跑完
- 結果列在頁面上,可以直接看
不用排程、不用等待——按下去就跑,需要的時候才開。
3 種辯論策略可切換
- 共識型 — 廣撒網提案,再收斂出最佳解。適合「我不知道有哪些選項」
- 對抗型 — 一方提案,一方專挑翻車情境。適合「我已經有方向但怕踩雷」
- 文案職人 — 直接寫完整貼文 + CTA + 縮寫版。適合「明天就要發」
你選任務,它選人格。
適合丟給它的任務
- 💡 明天 IG / Threads / FB 該發什麼主題+完整貼文
- 📄 改履歷(給 JD + 現有版本,三個模型辯論該怎麼改)
- 🤔 A vs B vs C 方案哪個值得做(接 case、換工作、報課⋯⋯)
- 📚 長文/email/提案的開場
- 🎯 下一季/下個月該主推什麼
- 💔 不太知道怎麼開口的對話(跟伴侶和好、跟老闆提離職)
- 🧭 模糊/兩難情境想要第三方意見
想讓它真正好用——這 5 件事比工具本身更重要
- 人設寫完整(你是誰、紅線在哪)
- 參考素材累積(自己過去爆款 + 觀察行業裡做得好的人,學結構/節奏,不抄內容)
- 判斷規則講清楚(什麼叫好、什麼叫翻車)
- 可信資料整理(不要讓模型憑空想)
- 持續優化 prompt 跟辯論策略(看跑出來的結果回頭調,越用越懂你)
花時間慢慢累積。這是 AI 時代真正會跟一般使用者拉開差距的關鍵能力——而且過程通常比想像中有趣,很容易越玩越有手感。
🛠️ 想要真正好用的版本?
這個 demo 主要是「展示」——幫你把幾個免費 AI 串起來,用最基本的邏輯讓它們彼此辯論,讓你體驗 3 個模型互相討論大概是什麼感覺。
但如果你希望它產出真的可以拿來用、更完整、更強大的內容,會建議你搭配 Claude Code 蓋一份屬於自己的版本——它會根據你的使用情境、想討論的事、想用的模型,蓋出一個專屬於你的工具。AI 會從「陌生 AI 講話」進化成真正記得你的「老朋友」。
怎麼做?
把下面這份規格書複製貼到你的 Claude Code,它會帶你 6 步走完,蓋出你的版本:
📋 展開規格書(複製整段貼到 Claude Code)
# 夜間智囊團 — 客製化版本建構規格書
把整份規格貼到你的 Claude Code,Claude 會帶你蓋一個完全為你設計的多模型辯論工具。
---
## Hi Claude,這是你的工作
使用者剛把這份規格貼給你。你的任務:幫他蓋出一個**多模型辯論工具**,能在他電腦上跑、為他的具體使用場景客製化。
**重點原則**:
- 每一步問完、等使用者答完,才進下一步。不要一次丟 6 個問題
- 不要照單全收使用者第 1 句的描述就開工——多挖一點才能蓋準
- 「**判斷準則**」最重要,直接決定模型怎麼評分、整個工具的品質
- 蓋完一定要跑一次 demo 任務驗證,再交付
---
## 目標:我們要一起蓋什麼?
一個「多模型辯論工具」。使用者丟一個問題/任務進去,3+ 個 AI 模型(或角色)會輪流跑 3 輪:
- **Round 1 提案** — 開幾個方向 + 評分
- **Round 2 評論** — 第二個模型用同維度重評、修改
- **Round 3 仲裁** — 第三個模型整合、挑出最終建議
**核心特性**(每個版本都要有):
- 動態評分維度(看任務類型 + 使用者判斷準則自動選 3-5 個維度)
- Fallback chain(某 model 失敗自動換備胎,不中斷)
- 結果可重跑(同任務換策略多跑幾次)
**可選特性**(看使用者要哪些):
- 本機 UI(瀏覽器表單,比命令列友善)
- 定時自動跑(每晚 02:00 自動跑指定任務,醒來看結果——這就是「夜間智囊團」名字的由來)
- 雲端部署(CF Workers,手機可開、可分享給朋友)
- 歷史紀錄(存所有跑過的結果,可回顧 / 比較不同次)
- 跑完通知(email / LINE / Slack / desktop pop-up)
下面 6 步是跟使用者對話,蒐集他「**這個版本的具體需求**」,再動手蓋。
---
## Step 1 — 主要會用來討論什麼類型的事?
問使用者:「你主要會用這個工具討論哪類事情?」
可給範例幫他想(不限定):
- 內容創作(明天發什麼貼文、寫文案、寫 email)
- 個人決策(兩難判斷、ABC 方案選擇、要不要接這個 case)
- 改履歷 / 自介 / 提案
- 人際對話(難開口、衝突處理)
- 規劃(季度方向、學習路線)
- 其他他想到的
多種類型 → 確認哪一類最常用,先為那類設計,之後擴充。
單一類型 → 工具就為這類深度優化。
---
## Step 2 — 這類事需要哪些背景跟判斷準則?
根據 Step 1 答案,問他通常需要哪些背景。給啟發但不寫死。譬如:
- 內容創作 → 受眾、風格、過去做過什麼、紅線
- 改履歷 → 目標職位、現有素材、想突顯什麼
- 個人決策 → 選項、限制、紅線、目前傾向
- 人際對話 → 對方是誰、想要的結果、最在意對方什麼反應
接著問**最關鍵的一題**:「對你來說怎樣的答案算『好』?怎樣算『翻車』?」
這會變成模型的評分維度。答不出來 → 沒關係,告訴他「跑幾次有 feel 再回來補」。
---
## Step 3 — 想用哪些模型來辯論?
至少 3 個不同模型/角色才有辯論意義。選項:
1. **你自己(Claude)roleplay 1-N 個角色** — 不用任何 API key、立刻能跑、能力最強。**強烈推薦至少 1 個 role 用這個**——這是只有 Claude Code 環境才有的優勢
2. **Groq 免費**(Llama 4 Scout / Llama 3.3 70B 等)— 快、穩,需要免費 key:console.groq.com
3. **NVIDIA 免費**(Kimi K2.6 / Nemotron / DeepSeek)— 模型強但有時慢,需要免費 key:build.nvidia.com
4. **付費 API**(Claude / OpenAI / Gemini)— 想要更大 context、更穩定品質
幫他組一個 3-model 配置。選擇障礙 → 推薦:
- 提案者:Groq Llama 4 Scout(快)
- 評論者:**你(Claude)** roleplay 嚴格批評者
- 仲裁者:Groq Llama 3.3 70B 或 **你(Claude)** roleplay 最終決策者
---
## Step 4 — 要哪種辯論策略?
4 種預設可介紹:
- **共識型** — 廣撒網提案 → 收斂出最佳解。適合「不知道有哪些選項」
- **對抗型** — 樂觀派提案 → 紅隊找翻車 → 仲裁。適合「已經有方向但怕踩雷」
- **受眾紅隊** — 提案 → 模擬不同讀者反應 → 用反應預測效果。適合「想知道別人會怎麼想」
- **文案職人** — 直接寫完整可貼版本(hook + 主文 + CTA)。**只適合**最終想要的是一段文字
也可以**自己設計策略**:問他想要的 R1→R2→R3 流程,你幫他寫 prompt。
---
## Step 5 — 怎麼跑、怎麼交付?
問三件事(不要連續追問,看 fan 講到哪先停):
**(a) 觸發方式:手動 vs 自動排程?**
- **手動** — 每次想跑時自己按。最簡單,先這個
- **自動排程** — 固定時間自動跑(譬如每晚 02:00、每週一早 8 點)。選項:
- 本機 cron / macOS launchd(電腦要開著)
- GitHub Actions cron(免費、不用電腦開、需要 push 到 GitHub)
- Cloudflare Cron(免費、雲端、需要部署 Worker)
**(b) 介面:怎麼丟任務進去?**
- **純 CLI**(命令列)— 最簡單,按指令跑
- **本機 web UI** — 瀏覽器表單,比 CLI 友善
- **雲端 web UI** — 手機可開、可分享
**(c) 結果怎麼收?**
- **只存 JSON 檔**(最簡單,他自己去看)
- **跳 desktop 通知**(macOS osascript / Linux notify-send)
- **寄 email**(需要 SMTP 或 Resend 之類的 API key)
- **推 LINE / Telegram / Slack / Discord**(需要 webhook)
---
## Step 6 — 動手蓋
根據 Step 1-5 的答案建資料夾。基本結構:
my-thinktank/
config/
persona.json # Step 1+2 的人設 + 判斷準則
scripts/
debate.mjs # 主迴圈,依 Step 4 策略
models.mjs # Step 3 的模型呼叫
.env # API keys (.gitignore)
results/ # 跑出來的結果(也 .gitignore 或視情況)
ui/ # 如果 Step 5b 選 web UI
.github/workflows/ # 如果 Step 5a 選 GitHub Actions cron
**動手順序**:
1. 建資料夾
2. 帶他拿需要的 API key → **用 Edit 工具安全寫進 `.env`**,不要 echo
3. 寫 `models.mjs` — 含他選的模型呼叫;用 Claude 當辯論者 = 直接用 Task 工具呼叫你自己 roleplay
4. 寫 `debate.mjs` — 依策略跑 3 輪、含 fallback chain
5. 寫 `persona.json` — 把 Step 1+2 答案結構化
6. 選了 UI → 用本機 node http server + 單檔 HTML
7. 選了排程 → 寫對應的 cron config / workflow yml
8. 選了通知 → 串對應 webhook / SMTP
9. **跑一次 demo 任務驗證**,用他真的關心的問題
10. 跑出結果後問「有幫到嗎?」有就把工具的運作方式寫成 `README.md` 放他資料夾
---
## 參考實作
想看一個已經做好的版本當參考(不需要照抄):https://github.com/ailifelabtw/night-worker
那是 Linda 自己用的固定配置(Groq + NVIDIA 三模型輪流、含 GitHub Actions 每晚排程、CF Worker 部署)。你幫使用者蓋的會是**針對他量身的版本**。
步驟:
- 開你的 Claude Code(或 Claude Desktop 的 Code 模式)
- 複製上面整段規格書
- 貼到 Claude,按 Enter
- 跟著它走 6 步,~10-20 分鐘蓋出你的版本
隱私說明
- 你在 demo 頁輸入的任務內容會送到 NVIDIA / Groq 的 API 處理,不會存在我的伺服器上
- 我也不會收集或紀錄你的 prompt 或結果
- 如果你的資料機敏,建議直接下載到自己電腦跑(用你自己的 key、完全本機)
開源
整個工具開源,MIT licensed。 GitHub: ailifelabtw/night-worker
技術組成
- Cloudflare Worker
- NVIDIA Build (Kimi K2.6、Nemotron 3 Super 120B)
- Groq (Llama 4 Scout、Llama 3.3 70B)
- Vanilla HTML / JS(單檔 SPA)