NVIDIA 免費 AI 模型｜感謝黃仁勳開了 157 個，5 個現在就能用

感謝黃仁勳。

NVIDIA Build 平台 build.nvidia.com 默默開放了 157 個超強 AI 模型免費讓你用——不用信用卡、不用升級方案，註冊一個 NVIDIA Developer 帳號就好。

其實裡面有很多我早就可以用，但我不知道，結果多花了好幾千塊訂閱費，哈哈。

如果你也有過：

用 AI 寫東西，token 一直不夠
大量照片或文件想讓 AI 幫你看
逐字稿整理整到崩潰
需要產出大量圖片素材
想用好幾個超強 AI，但訂閱費飛了

這篇是給你的入門清單。

5 個最值得現在開始用的

我自己有在用、實測過的：

DeepSeek V4 ＋ Kimi K2.6——兩個 1T 等級的開源王者，程式能力已經跟 Claude Opus 4.6 平手（SWE-Bench Verified 80.2% vs 80.8%），Kimi 還能自己拆 300 個 sub-agent 跑 4000 步任務
FLUX.2（klein-4B）——Black Forest Labs 最新一代開源生圖模型，1 句話 1 秒出圖，比上一代 FLUX.1 更快、品質更好
Cosmos Nemotron VLM（前身就是 NVIDIA VILA）——看圖直接回答你的問題，發票、手寫筆記、產品照都能讀
Parakeet zh-TW——NVIDIA 偷偷給台灣人做的中文語音辨識模型，連中英夾雜「OK 那個 deadline 可以 push 一下嗎」都直接認得
TRELLIS（Microsoft 開源）——一張 2D 圖或一句 prompt 直接生成 3D 模型，含 PBR 材質、可旋轉

每個模型都是 rate limit 制（每分鐘約 40 個請求／每個模型），不是 token credit。

ℹ️ 適合誰用：個人測試、做小工具自己玩、少量開發 prototype——這個免費額度完全夠。 不適合：企業要做給很多人用的服務、大量批次處理資料、商用 API。這種規模請走 NVIDIA 的付費企業方案（或自架）。

怎麼開始用（5 分鐘）

1. 到 build.nvidia.com 免費註冊 用 Google / Email 登入 NVIDIA Developer 帳號，不用信用卡。

2. 挑模型 → 點「Try it」 進 API Catalog 從 157 個裡選。任何一個模型都能直接在網頁 Playground 玩——填 prompt、看結果,零技術門檻。

3.（給開發者）拿一個 API key 想串進 Claude Code、Cursor、自己的腳本？右上角頭像 → 「Generate Key」 → 拿到 nvapi-xxx。NVIDIA API 跟 OpenAI 相容，一行 env var 就能串。

💡 白話說：步驟 1+2 就是大部分人的用法（純網頁玩）。步驟 3 是給開發者用的——而且你不用自己寫程式，直接請 Claude 幫你開好 env 跟設定就好。

直接讓 Claude 幫你評估

下面這段 prompt 你可以直接複製貼到 Claude，把方框裡的內容換成你的情況，它會告訴你哪些模型最適合你、從哪個開始、給你第一個可以試的指令。

我想試試看 NVIDIA Build 平台上免費的這些 AI 模型：
DeepSeek V4、Kimi K2.6（推理／agentic）
FLUX.2（文字生圖）
Cosmos Nemotron VLM（看圖回答）
Parakeet zh-TW（台灣中文語音辨識）
TRELLIS（圖／文字 → 3D 模型）

回答之前請先：
- 如果你能上網搜尋，請查一下這些模型「最近一個月」的更新
  （NVIDIA Build 一直在加新模型——DeepSeek V4 才剛上、
  Kimi 持續迭代、FLUX 出到 2 代、Edify 3D 已下架改 TRELLIS。
  我不希望你給我過時的資訊）
- 如果某個模型的某個功能你不確定還在不在 build.nvidia.com 上,
  請直接說「不確定，建議自己去網站確認」，不要硬掰

我的情況是這樣：
- 我的工作／身份是：[ 例如：自由接案的設計師／行銷企劃／podcaster／高中老師 ]
- 我每週花最多時間的事情：[ 例如：寫 IG 貼文、做簡報、整理會議紀錄 ]
- 我覺得最煩的瑣事：[ 例如：手動打逐字稿、找配圖、做產品 3D 圖 ]
- 我有沒有 Claude Code 或寫程式經驗：[ 完全沒有／有一點／熟 ]

請依照我的情況：

1. 從這 5 組模型裡挑 2-3 個對我「最有感」的，說明為什麼
2. 排出試的順序——先玩哪個、再玩哪個、為什麼
3. 每一個都給我一個「打開 Playground 後可以馬上試」的第一個 prompt
4. 點出我這個情況下，**最相關的「貼心提醒」**：
   - rate limit：每分鐘約 40 個請求／每個模型，不是 token 計費。
     個人測試、少量開發完全夠；要做給很多人用的服務或大量批次
     就不夠了，要走 NVIDIA 付費企業方案
   - API key 安全：拿到的 nvapi-xxx 不要貼進公開的 git repo，
     用 .env 存就好
   - Parakeet zh-TW 是專門給台灣國語訓的——錄音是其他華語腔
     會比較不準（中國 zh-CN 可以用 parakeet-ctc-0.6b-zh-cn）
   - FLUX.2 dev 版只能非商用（schnell 版 Apache 2.0 商用沒問題）
   - 如果我想串 Claude Code 或自己工具：你直接幫我開 env、
     寫好設定就好，不要叫我自己寫
   - 想接到 OpenWebUI 之類的自架 chat：你也可以幫我想架設 plan

只挑跟我情況最有關的講就好，不要全部背一遍。
回答用比較生活的語氣，不要太教科書。

把它丟給 Claude，看它怎麼回。如果它的建議讓你覺得「這真的是我」，照它說的順序試看看；覺得不太對，回它一句「我比較想用 OO」，它會重新評估。

這個 prompt 最大的好處是：你不用自己去判斷哪個模型最適合自己——這件事 Claude 比你還會。

為什麼這些模型可以當主力，不只玩玩

DeepSeek V4 跟 Kimi K2.6 都是 1T 等級的開源王者，程式跟推理能力已經跟 Claude Opus 4.6 平手（SWE-Bench Verified 80.2% vs 80.8%）。換句話說，現在能免費跑的開源模型，跟你正在付月費用的封閉模型同一個段位。

更重要的是——這些模型直接跑在 NVIDIA 自家伺服器上。

跟「拿開源 weights 自己找隨便雲端跑」比，NVIDIA Build 是上市美企的基礎設施，信任等級跟 OpenAI / Anthropic 同級——你 prompt 還是會經過 NVIDIA，但你既然已經願意把同樣的東西丟給 ChatGPT / Claude 了，就不會更糟。

⚠️ 但高度敏感的東西不要丟：醫療、法律、公司未公開機密——任何雲端 AI 都不該丟，NVIDIA 也一樣。要做這種事請看「自架方案」。

DeepSeek ＋ Kimi 的 3 個最值得用法

基於「能力跟 Opus 4.6 同級 + 信任等級跟 OpenAI 同級 + 完全免費」這 3 個前提，這兩個推理模型最值得的 3 種用法是：

當 Claude / ChatGPT 的主力備品——你的訂閱額度用完了？把同一題搬到 DeepSeek V4 / Kimi K2.6 繼續，能力同級、不另外收錢。寫程式、長文分析、複雜推理都跑得動。
當第三方意見的 AI——同一題餵 Claude / ChatGPT / Kimi K2.6 三家對照，找出最準的答案。特別是做重要決策的時候——例如選技術方案、改履歷、評估合約條款——多一個獨立判斷視角很值得。
接 OpenWebUI 自己當老闆——5 分鐘自架一個自己的 chat 介面，把 NVIDIA endpoint 接進去（DeepSeek V4 / Kimi K2.6 都能直接掛上去）。不付任何訂閱費就有自己私人 AI，全家人共用也行。

（FLUX.2、Cosmos Nemotron、Parakeet、TRELLIS 是另外的場景——生圖、看圖、語音、3D，照各自的 Playground 直接玩就好。）

常被問

Q：「這些模型不是本來就開源嗎？NVIDIA 哪有送什麼？」

模型 weights 確實開源——但跑得動才算數。Kimi K2.6 是 1T 參數的 MoE 模型，至少要 8 張 H100 GPU 起跳（硬體成本約 $200k 美金），雲端租同等級算力每小時 $20–30 美金。普通人筆電根本跑不動。

NVIDIA 送的不是模型，是免費的 GPU 推論服務。同樣「open-weight hosted inference」，Together.ai、Groq、Replicate 都是按 token 收錢，重度使用者一個月輕鬆累積 $50–200 美金。NVIDIA 把這個有 rate limit 但免費送你。

類比：「Linux 是開源的」是真的，但 AWS 給你免費 EC2 instance 跑 Linux 也是真的免費。你不會說「AWS 沒在送，Linux 本來就開源」吧？模型 = Linux，算力 = 機房——這次 NVIDIA 給的是後者。

Q：「Kimi K2.6 / DeepSeek V4 真的跟 Opus 4.6 同級嗎？聽起來太誇張」

比分就是這樣——這些不是我自己編的，是模型開發者跟 Anthropic 雙方官方公告的數字：

Benchmark	Kimi K2.6	Opus 4.6	DeepSeek V4-Pro
SWE-Bench Verified（程式能力標竿）	80.2%	80.8%	80.6%
SWE-Bench Pro（更難版）	58.6% ✅	53.4%	—
SWE-Bench Multilingual	76.7%	77.8% ✅	—

→ Verified 三家差 0.6 趴以內，統計上等於打平。Pro 反而是 Kimi 贏 Opus 4.6 5 趴。Multilingual Opus 4.6 略勝 1 趴。三項加起來大致伯仲之間。

注意：是 Opus 4.6，不是 Opus 4.7。4.7 在 4.6 出來 4 天後上線，Verified 衝到 87.6%–93.9%，確實領先 Kimi 約 7 趴。我講的是「免費跑跟 Opus 4.6 同級的開源模型」——這個是事實。

來源：

Moonshot AI Kimi K2.6 官方 tech blog（Kimi 跟 Opus 4.6 對照表是他們自己列的）
Anthropic Claude Opus 4.6 公告
Vellum Opus 4.6 benchmark 整理
SWE-Bench Verified Leaderboard

免費資源歡迎試用

不需要每個都試、不需要懂技術。先打開 build.nvidia.com 註冊一個帳號，挑你最有感的那一個玩玩看——5 分鐘就有體驗。

如果你卡在哪個模型怎麼用、或想接到自己工具但卡住了，留言或私訊我都可以。

想用 AI 工具讓生活變得更輕省，追蹤 AI 生活實驗室 @life.coach.mtcity，我們一起玩 AI！