內容創作 / 決策

夜間智囊團

3 個 AI 模型整夜互相辯論,幫你想明天該發什麼、該怎麼選、該怎麼寫——不再被單一 AI 困在同一個死圈子。

打開工具 →

為什麼做這個工具

做社群最累的不是寫,是「明天到底要發什麼啦」。

你應該也問過自己這句吧。想說好啦,丟給 AI 幫忙想——結果它給的東西越來越像,好像走不出同一個死圈子。

我用 NVIDIA + Groq 提供的 3 個免費模型,做了一個「夜間智囊團」。讓不同家、不同立場的 AI 互相吵架、評論、推翻、收斂,而不是一個 AI 自言自語。

⚠️ 使用上的小提醒

近期 NVIDIA 提供的免費模型有時候反應比較慢,如果跑到中間卡住、超過 1-2 分鐘還在 Round 2,預設會自動切到 Groq 備胎繼續跑——這是正常行為,不用重新整理。

要更穩可以把 repo clone 到自己電腦,把 3 個 role 都改用 Groq 模型(速度幾乎一定 < 10 秒)。

它怎麼運作

  1. 把今天想討論的事丟給它(明天的主題、要選的方案、要寫的文⋯⋯)
  2. 3 個模型輪番提案 → 評論 → 仲裁三輪
  3. 大概 2 分鐘跑完
  4. 結果列在頁面上,可以直接看

不用排程、不用等待——按下去就跑,需要的時候才開。

3 種辯論策略可切換

  • 共識型 — 廣撒網提案,再收斂出最佳解。適合「我不知道有哪些選項」
  • 對抗型 — 一方提案,一方專挑翻車情境。適合「我已經有方向但怕踩雷」
  • 文案職人 — 直接寫完整貼文 + CTA + 縮寫版。適合「明天就要發」

你選任務,它選人格。

適合丟給它的任務

  • 💡 明天 IG / Threads / FB 該發什麼主題+完整貼文
  • 📄 改履歷(給 JD + 現有版本,三個模型辯論該怎麼改)
  • 🤔 A vs B vs C 方案哪個值得做(接 case、換工作、報課⋯⋯)
  • 📚 長文/email/提案的開場
  • 🎯 下一季/下個月該主推什麼
  • 💔 不太知道怎麼開口的對話(跟伴侶和好、跟老闆提離職)
  • 🧭 模糊/兩難情境想要第三方意見

想讓它真正好用——這 5 件事比工具本身更重要

  1. 人設寫完整(你是誰、紅線在哪)
  2. 參考素材累積(自己過去爆款 + 觀察行業裡做得好的人,學結構/節奏,不抄內容)
  3. 判斷規則講清楚(什麼叫好、什麼叫翻車)
  4. 可信資料整理(不要讓模型憑空想)
  5. 持續優化 prompt 跟辯論策略(看跑出來的結果回頭調,越用越懂你)

花時間慢慢累積。這是 AI 時代真正會跟一般使用者拉開差距的關鍵能力——而且過程通常比想像中有趣,很容易越玩越有手感。

🛠️ 想要真正好用的版本?

這個 demo 主要是「展示」——幫你把幾個免費 AI 串起來,用最基本的邏輯讓它們彼此辯論,讓你體驗 3 個模型互相討論大概是什麼感覺。

但如果你希望它產出真的可以拿來用、更完整、更強大的內容,會建議你搭配 Claude Code 蓋一份屬於自己的版本——它會根據你的使用情境、想討論的事、想用的模型,蓋出一個專屬於你的工具。AI 會從「陌生 AI 講話」進化成真正記得你的「老朋友」。

怎麼做?

把下面這份規格書複製貼到你的 Claude Code,它會帶你 6 步走完,蓋出你的版本:

📋 展開規格書(複製整段貼到 Claude Code)
# 夜間智囊團 — 客製化版本建構規格書

把整份規格貼到你的 Claude Code,Claude 會帶你蓋一個完全為你設計的多模型辯論工具。

---

## Hi Claude,這是你的工作

使用者剛把這份規格貼給你。你的任務:幫他蓋出一個**多模型辯論工具**,能在他電腦上跑、為他的具體使用場景客製化。

**重點原則**:
- 每一步問完、等使用者答完,才進下一步。不要一次丟 6 個問題
- 不要照單全收使用者第 1 句的描述就開工——多挖一點才能蓋準
- 「**判斷準則**」最重要,直接決定模型怎麼評分、整個工具的品質
- 蓋完一定要跑一次 demo 任務驗證,再交付

---

## 目標:我們要一起蓋什麼?

一個「多模型辯論工具」。使用者丟一個問題/任務進去,3+ 個 AI 模型(或角色)會輪流跑 3 輪:

- **Round 1 提案** — 開幾個方向 + 評分
- **Round 2 評論** — 第二個模型用同維度重評、修改
- **Round 3 仲裁** — 第三個模型整合、挑出最終建議

**核心特性**(每個版本都要有):
- 動態評分維度(看任務類型 + 使用者判斷準則自動選 3-5 個維度)
- Fallback chain(某 model 失敗自動換備胎,不中斷)
- 結果可重跑(同任務換策略多跑幾次)

**可選特性**(看使用者要哪些):
- 本機 UI(瀏覽器表單,比命令列友善)
- 定時自動跑(每晚 02:00 自動跑指定任務,醒來看結果——這就是「夜間智囊團」名字的由來)
- 雲端部署(CF Workers,手機可開、可分享給朋友)
- 歷史紀錄(存所有跑過的結果,可回顧 / 比較不同次)
- 跑完通知(email / LINE / Slack / desktop pop-up)

下面 6 步是跟使用者對話,蒐集他「**這個版本的具體需求**」,再動手蓋。

---

## Step 1 — 主要會用來討論什麼類型的事?

問使用者:「你主要會用這個工具討論哪類事情?」

可給範例幫他想(不限定):
- 內容創作(明天發什麼貼文、寫文案、寫 email)
- 個人決策(兩難判斷、ABC 方案選擇、要不要接這個 case)
- 改履歷 / 自介 / 提案
- 人際對話(難開口、衝突處理)
- 規劃(季度方向、學習路線)
- 其他他想到的

多種類型 → 確認哪一類最常用,先為那類設計,之後擴充。
單一類型 → 工具就為這類深度優化。

---

## Step 2 — 這類事需要哪些背景跟判斷準則?

根據 Step 1 答案,問他通常需要哪些背景。給啟發但不寫死。譬如:

- 內容創作 → 受眾、風格、過去做過什麼、紅線
- 改履歷 → 目標職位、現有素材、想突顯什麼
- 個人決策 → 選項、限制、紅線、目前傾向
- 人際對話 → 對方是誰、想要的結果、最在意對方什麼反應

接著問**最關鍵的一題**:「對你來說怎樣的答案算『好』?怎樣算『翻車』?」

這會變成模型的評分維度。答不出來 → 沒關係,告訴他「跑幾次有 feel 再回來補」。

---

## Step 3 — 想用哪些模型來辯論?

至少 3 個不同模型/角色才有辯論意義。選項:

1. **你自己(Claude)roleplay 1-N 個角色** — 不用任何 API key、立刻能跑、能力最強。**強烈推薦至少 1 個 role 用這個**——這是只有 Claude Code 環境才有的優勢
2. **Groq 免費**(Llama 4 Scout / Llama 3.3 70B 等)— 快、穩,需要免費 key:console.groq.com
3. **NVIDIA 免費**(Kimi K2.6 / Nemotron / DeepSeek)— 模型強但有時慢,需要免費 key:build.nvidia.com
4. **付費 API**(Claude / OpenAI / Gemini)— 想要更大 context、更穩定品質

幫他組一個 3-model 配置。選擇障礙 → 推薦:
- 提案者:Groq Llama 4 Scout(快)
- 評論者:**你(Claude)** roleplay 嚴格批評者
- 仲裁者:Groq Llama 3.3 70B 或 **你(Claude)** roleplay 最終決策者

---

## Step 4 — 要哪種辯論策略?

4 種預設可介紹:

- **共識型** — 廣撒網提案 → 收斂出最佳解。適合「不知道有哪些選項」
- **對抗型** — 樂觀派提案 → 紅隊找翻車 → 仲裁。適合「已經有方向但怕踩雷」
- **受眾紅隊** — 提案 → 模擬不同讀者反應 → 用反應預測效果。適合「想知道別人會怎麼想」
- **文案職人** — 直接寫完整可貼版本(hook + 主文 + CTA)。**只適合**最終想要的是一段文字

也可以**自己設計策略**:問他想要的 R1→R2→R3 流程,你幫他寫 prompt。

---

## Step 5 — 怎麼跑、怎麼交付?

問三件事(不要連續追問,看 fan 講到哪先停):

**(a) 觸發方式:手動 vs 自動排程?**
- **手動** — 每次想跑時自己按。最簡單,先這個
- **自動排程** — 固定時間自動跑(譬如每晚 02:00、每週一早 8 點)。選項:
  - 本機 cron / macOS launchd(電腦要開著)
  - GitHub Actions cron(免費、不用電腦開、需要 push 到 GitHub)
  - Cloudflare Cron(免費、雲端、需要部署 Worker)

**(b) 介面:怎麼丟任務進去?**
- **純 CLI**(命令列)— 最簡單,按指令跑
- **本機 web UI** — 瀏覽器表單,比 CLI 友善
- **雲端 web UI** — 手機可開、可分享

**(c) 結果怎麼收?**
- **只存 JSON 檔**(最簡單,他自己去看)
- **跳 desktop 通知**(macOS osascript / Linux notify-send)
- **寄 email**(需要 SMTP 或 Resend 之類的 API key)
- **推 LINE / Telegram / Slack / Discord**(需要 webhook)

---

## Step 6 — 動手蓋

根據 Step 1-5 的答案建資料夾。基本結構:

my-thinktank/
  config/
    persona.json     # Step 1+2 的人設 + 判斷準則
  scripts/
    debate.mjs       # 主迴圈,依 Step 4 策略
    models.mjs       # Step 3 的模型呼叫
  .env               # API keys (.gitignore)
  results/           # 跑出來的結果(也 .gitignore 或視情況)
  ui/                # 如果 Step 5b 選 web UI
  .github/workflows/ # 如果 Step 5a 選 GitHub Actions cron

**動手順序**:
1. 建資料夾
2. 帶他拿需要的 API key → **用 Edit 工具安全寫進 `.env`**,不要 echo
3. 寫 `models.mjs` — 含他選的模型呼叫;用 Claude 當辯論者 = 直接用 Task 工具呼叫你自己 roleplay
4. 寫 `debate.mjs` — 依策略跑 3 輪、含 fallback chain
5. 寫 `persona.json` — 把 Step 1+2 答案結構化
6. 選了 UI → 用本機 node http server + 單檔 HTML
7. 選了排程 → 寫對應的 cron config / workflow yml
8. 選了通知 → 串對應 webhook / SMTP
9. **跑一次 demo 任務驗證**,用他真的關心的問題
10. 跑出結果後問「有幫到嗎?」有就把工具的運作方式寫成 `README.md` 放他資料夾

---

## 參考實作

想看一個已經做好的版本當參考(不需要照抄):https://github.com/ailifelabtw/night-worker

那是 Linda 自己用的固定配置(Groq + NVIDIA 三模型輪流、含 GitHub Actions 每晚排程、CF Worker 部署)。你幫使用者蓋的會是**針對他量身的版本**。

步驟

  1. 開你的 Claude Code(或 Claude Desktop 的 Code 模式)
  2. 複製上面整段規格書
  3. 貼到 Claude,按 Enter
  4. 跟著它走 6 步,~10-20 分鐘蓋出你的版本

隱私說明

  • 你在 demo 頁輸入的任務內容會送到 NVIDIA / Groq 的 API 處理,不會存在我的伺服器上
  • 我也不會收集或紀錄你的 prompt 或結果
  • 如果你的資料機敏,建議直接下載到自己電腦跑(用你自己的 key、完全本機)

開源

整個工具開源,MIT licensed。 GitHub: ailifelabtw/night-worker

技術組成

  • Cloudflare Worker
  • NVIDIA Build (Kimi K2.6、Nemotron 3 Super 120B)
  • Groq (Llama 4 Scout、Llama 3.3 70B)
  • Vanilla HTML / JS(單檔 SPA)

準備好試試看?

打開工具 →