Name: 夜間智囊團
Author: 林鴻仁

為什麼做這個工具

做社群最累的不是寫，是「明天到底要發什麼啦」。

你應該也問過自己這句吧。想說好啦，丟給 AI 幫忙想——結果它給的東西越來越像，好像走不出同一個死圈子。

我用 NVIDIA + Groq 提供的 3 個免費模型，做了一個「夜間智囊團」。讓不同家、不同立場的 AI 互相吵架、評論、推翻、收斂，而不是一個 AI 自言自語。

⚠️ 使用上的小提醒

近期 NVIDIA 提供的免費模型有時候反應比較慢，如果跑到中間卡住、超過 1-2 分鐘還在 Round 2，預設會自動切到 Groq 備胎繼續跑——這是正常行為，不用重新整理。

要更穩可以把 repo clone 到自己電腦，把 3 個 role 都改用 Groq 模型（速度幾乎一定 < 10 秒）。

它怎麼運作

把今天想討論的事丟給它（明天的主題、要選的方案、要寫的文⋯⋯）
3 個模型輪番提案 → 評論 → 仲裁三輪
大概 2 分鐘跑完
結果列在頁面上，可以直接看

不用排程、不用等待——按下去就跑，需要的時候才開。

3 種辯論策略可切換

共識型 — 廣撒網提案，再收斂出最佳解。適合「我不知道有哪些選項」
對抗型 — 一方提案，一方專挑翻車情境。適合「我已經有方向但怕踩雷」
文案職人 — 直接寫完整貼文 + CTA + 縮寫版。適合「明天就要發」

你選任務，它選人格。

適合丟給它的任務

💡 明天 IG / Threads / FB 該發什麼主題＋完整貼文
📄 改履歷（給 JD + 現有版本，三個模型辯論該怎麼改）
🤔 A vs B vs C 方案哪個值得做（接 case、換工作、報課⋯⋯）
📚 長文／email／提案的開場
🎯 下一季／下個月該主推什麼
💔 不太知道怎麼開口的對話（跟伴侶和好、跟老闆提離職）
🧭 模糊／兩難情境想要第三方意見

想讓它真正好用——這 5 件事比工具本身更重要

人設寫完整（你是誰、紅線在哪）
參考素材累積（自己過去爆款 + 觀察行業裡做得好的人，學結構/節奏，不抄內容）
判斷規則講清楚（什麼叫好、什麼叫翻車）
可信資料整理（不要讓模型憑空想）
持續優化 prompt 跟辯論策略（看跑出來的結果回頭調，越用越懂你）

花時間慢慢累積。這是 AI 時代真正會跟一般使用者拉開差距的關鍵能力——而且過程通常比想像中有趣，很容易越玩越有手感。

🛠️ 想要真正好用的版本？

這個 demo 主要是「展示」——幫你把幾個免費 AI 串起來，用最基本的邏輯讓它們彼此辯論，讓你體驗 3 個模型互相討論大概是什麼感覺。

但如果你希望它產出真的可以拿來用、更完整、更強大的內容，會建議你搭配 Claude Code 蓋一份屬於自己的版本——它會根據你的使用情境、想討論的事、想用的模型，蓋出一個專屬於你的工具。AI 會從「陌生 AI 講話」進化成真正記得你的「老朋友」。

怎麼做？

把下面這份規格書複製貼到你的 Claude Code，它會帶你 6 步走完，蓋出你的版本：

📋 展開規格書（複製整段貼到 Claude Code）

# 夜間智囊團 — 客製化版本建構規格書

把整份規格貼到你的 Claude Code，Claude 會帶你蓋一個完全為你設計的多模型辯論工具。

---

## Hi Claude，這是你的工作

使用者剛把這份規格貼給你。你的任務：幫他蓋出一個**多模型辯論工具**，能在他電腦上跑、為他的具體使用場景客製化。

**重點原則**：
- 每一步問完、等使用者答完，才進下一步。不要一次丟 6 個問題
- 不要照單全收使用者第 1 句的描述就開工——多挖一點才能蓋準
- 「**判斷準則**」最重要，直接決定模型怎麼評分、整個工具的品質
- 蓋完一定要跑一次 demo 任務驗證，再交付

---

## 目標：我們要一起蓋什麼？

一個「多模型辯論工具」。使用者丟一個問題／任務進去，3+ 個 AI 模型（或角色）會輪流跑 3 輪：

- **Round 1 提案** — 開幾個方向 + 評分
- **Round 2 評論** — 第二個模型用同維度重評、修改
- **Round 3 仲裁** — 第三個模型整合、挑出最終建議

**核心特性**（每個版本都要有）：
- 動態評分維度（看任務類型 + 使用者判斷準則自動選 3-5 個維度）
- Fallback chain（某 model 失敗自動換備胎，不中斷）
- 結果可重跑（同任務換策略多跑幾次）

**可選特性**（看使用者要哪些）：
- 本機 UI（瀏覽器表單，比命令列友善）
- 定時自動跑（每晚 02:00 自動跑指定任務，醒來看結果——這就是「夜間智囊團」名字的由來）
- 雲端部署（CF Workers，手機可開、可分享給朋友）
- 歷史紀錄（存所有跑過的結果，可回顧 / 比較不同次）
- 跑完通知（email / LINE / Slack / desktop pop-up）

下面 6 步是跟使用者對話，蒐集他「**這個版本的具體需求**」，再動手蓋。

---

## Step 1 — 主要會用來討論什麼類型的事？

問使用者：「你主要會用這個工具討論哪類事情？」

可給範例幫他想（不限定）：
- 內容創作（明天發什麼貼文、寫文案、寫 email）
- 個人決策（兩難判斷、ABC 方案選擇、要不要接這個 case）
- 改履歷 / 自介 / 提案
- 人際對話（難開口、衝突處理）
- 規劃（季度方向、學習路線）
- 其他他想到的

多種類型 → 確認哪一類最常用，先為那類設計，之後擴充。
單一類型 → 工具就為這類深度優化。

---

## Step 2 — 這類事需要哪些背景跟判斷準則？

根據 Step 1 答案，問他通常需要哪些背景。給啟發但不寫死。譬如：

- 內容創作 → 受眾、風格、過去做過什麼、紅線
- 改履歷 → 目標職位、現有素材、想突顯什麼
- 個人決策 → 選項、限制、紅線、目前傾向
- 人際對話 → 對方是誰、想要的結果、最在意對方什麼反應

接著問**最關鍵的一題**：「對你來說怎樣的答案算『好』？怎樣算『翻車』？」

這會變成模型的評分維度。答不出來 → 沒關係，告訴他「跑幾次有 feel 再回來補」。

---

## Step 3 — 想用哪些模型來辯論？

至少 3 個不同模型／角色才有辯論意義。選項：

1. **你自己（Claude）roleplay 1-N 個角色** — 不用任何 API key、立刻能跑、能力最強。**強烈推薦至少 1 個 role 用這個**——這是只有 Claude Code 環境才有的優勢
2. **Groq 免費**（Llama 4 Scout / Llama 3.3 70B 等）— 快、穩，需要免費 key：console.groq.com
3. **NVIDIA 免費**（Kimi K2.6 / Nemotron / DeepSeek）— 模型強但有時慢，需要免費 key：build.nvidia.com
4. **付費 API**（Claude / OpenAI / Gemini）— 想要更大 context、更穩定品質

幫他組一個 3-model 配置。選擇障礙 → 推薦：
- 提案者：Groq Llama 4 Scout（快）
- 評論者：**你（Claude）** roleplay 嚴格批評者
- 仲裁者：Groq Llama 3.3 70B 或 **你（Claude）** roleplay 最終決策者

---

## Step 4 — 要哪種辯論策略？

4 種預設可介紹：

- **共識型** — 廣撒網提案 → 收斂出最佳解。適合「不知道有哪些選項」
- **對抗型** — 樂觀派提案 → 紅隊找翻車 → 仲裁。適合「已經有方向但怕踩雷」
- **受眾紅隊** — 提案 → 模擬不同讀者反應 → 用反應預測效果。適合「想知道別人會怎麼想」
- **文案職人** — 直接寫完整可貼版本（hook + 主文 + CTA）。**只適合**最終想要的是一段文字

也可以**自己設計策略**：問他想要的 R1→R2→R3 流程，你幫他寫 prompt。

---

## Step 5 — 怎麼跑、怎麼交付？

問三件事（不要連續追問，看 fan 講到哪先停）：

**(a) 觸發方式：手動 vs 自動排程？**
- **手動** — 每次想跑時自己按。最簡單，先這個
- **自動排程** — 固定時間自動跑（譬如每晚 02:00、每週一早 8 點）。選項：
  - 本機 cron / macOS launchd（電腦要開著）
  - GitHub Actions cron（免費、不用電腦開、需要 push 到 GitHub）
  - Cloudflare Cron（免費、雲端、需要部署 Worker）

**(b) 介面：怎麼丟任務進去？**
- **純 CLI**（命令列）— 最簡單，按指令跑
- **本機 web UI** — 瀏覽器表單，比 CLI 友善
- **雲端 web UI** — 手機可開、可分享

**(c) 結果怎麼收？**
- **只存 JSON 檔**（最簡單，他自己去看）
- **跳 desktop 通知**（macOS osascript / Linux notify-send）
- **寄 email**（需要 SMTP 或 Resend 之類的 API key）
- **推 LINE / Telegram / Slack / Discord**（需要 webhook）

---

## Step 6 — 動手蓋

根據 Step 1-5 的答案建資料夾。基本結構：

my-thinktank/
  config/
    persona.json     # Step 1+2 的人設 + 判斷準則
  scripts/
    debate.mjs       # 主迴圈，依 Step 4 策略
    models.mjs       # Step 3 的模型呼叫
  .env               # API keys (.gitignore)
  results/           # 跑出來的結果（也 .gitignore 或視情況）
  ui/                # 如果 Step 5b 選 web UI
  .github/workflows/ # 如果 Step 5a 選 GitHub Actions cron

**動手順序**：
1. 建資料夾
2. 帶他拿需要的 API key → **用 Edit 工具安全寫進 `.env`**，不要 echo
3. 寫 `models.mjs` — 含他選的模型呼叫；用 Claude 當辯論者 = 直接用 Task 工具呼叫你自己 roleplay
4. 寫 `debate.mjs` — 依策略跑 3 輪、含 fallback chain
5. 寫 `persona.json` — 把 Step 1+2 答案結構化
6. 選了 UI → 用本機 node http server + 單檔 HTML
7. 選了排程 → 寫對應的 cron config / workflow yml
8. 選了通知 → 串對應 webhook / SMTP
9. **跑一次 demo 任務驗證**，用他真的關心的問題
10. 跑出結果後問「有幫到嗎？」有就把工具的運作方式寫成 `README.md` 放他資料夾

---

## 參考實作

想看一個已經做好的版本當參考（不需要照抄）：https://github.com/ailifelabtw/night-worker

那是 Linda 自己用的固定配置（Groq + NVIDIA 三模型輪流、含 GitHub Actions 每晚排程、CF Worker 部署）。你幫使用者蓋的會是**針對他量身的版本**。

步驟：

開你的 Claude Code（或 Claude Desktop 的 Code 模式）
複製上面整段規格書
貼到 Claude，按 Enter
跟著它走 6 步，~10-20 分鐘蓋出你的版本

隱私說明

你在 demo 頁輸入的任務內容會送到 NVIDIA / Groq 的 API 處理，不會存在我的伺服器上
我也不會收集或紀錄你的 prompt 或結果
如果你的資料機敏，建議直接下載到自己電腦跑（用你自己的 key、完全本機）

開源

整個工具開源，MIT licensed。 GitHub: ailifelabtw/night-worker

夜間智囊團