NVIDIA 免費 AI 模型|感謝黃仁勳開了 157 個,5 個現在就能用
感謝黃仁勳。
NVIDIA Build 平台 build.nvidia.com 默默開放了 157 個超強 AI 模型免費讓你用——不用信用卡、不用升級方案,註冊一個 NVIDIA Developer 帳號就好。
其實裡面有很多我早就可以用,但我不知道,結果多花了好幾千塊訂閱費,哈哈。
如果你也有過:
- 用 AI 寫東西,token 一直不夠
- 大量照片或文件想讓 AI 幫你看
- 逐字稿整理整到崩潰
- 需要產出大量圖片素材
- 想用好幾個超強 AI,但訂閱費飛了
這篇是給你的入門清單。
5 個最值得現在開始用的
我自己有在用、實測過的:
- DeepSeek V4 + Kimi K2.6——兩個 1T 等級的開源王者,程式能力已經跟 Claude Opus 4.6 平手(SWE-Bench Verified 80.2% vs 80.8%),Kimi 還能自己拆 300 個 sub-agent 跑 4000 步任務
- FLUX.2(klein-4B)——Black Forest Labs 最新一代開源生圖模型,1 句話 1 秒出圖,比上一代 FLUX.1 更快、品質更好
- Cosmos Nemotron VLM(前身就是 NVIDIA VILA)——看圖直接回答你的問題,發票、手寫筆記、產品照都能讀
- Parakeet zh-TW——NVIDIA 偷偷給台灣人做的中文語音辨識模型,連中英夾雜「OK 那個 deadline 可以 push 一下嗎」都直接認得
- TRELLIS(Microsoft 開源)——一張 2D 圖或一句 prompt 直接生成 3D 模型,含 PBR 材質、可旋轉
每個模型都是 rate limit 制(每分鐘約 40 個請求/每個模型),不是 token credit。
ℹ️ 適合誰用:個人測試、做小工具自己玩、少量開發 prototype——這個免費額度完全夠。 不適合:企業要做給很多人用的服務、大量批次處理資料、商用 API。這種規模請走 NVIDIA 的付費企業方案(或自架)。
怎麼開始用(5 分鐘)
1. 到 build.nvidia.com 免費註冊 用 Google / Email 登入 NVIDIA Developer 帳號,不用信用卡。
2. 挑模型 → 點「Try it」 進 API Catalog 從 157 個裡選。任何一個模型都能直接在網頁 Playground 玩——填 prompt、看結果,零技術門檻。
3.(給開發者)拿一個 API key
想串進 Claude Code、Cursor、自己的腳本?右上角頭像 → 「Generate Key」 → 拿到 nvapi-xxx。NVIDIA API 跟 OpenAI 相容,一行 env var 就能串。
💡 白話說:步驟 1+2 就是大部分人的用法(純網頁玩)。步驟 3 是給開發者用的——而且你不用自己寫程式,直接請 Claude 幫你開好 env 跟設定就好。
直接讓 Claude 幫你評估
下面這段 prompt 你可以直接複製貼到 Claude,把方框裡的內容換成你的情況,它會告訴你哪些模型最適合你、從哪個開始、給你第一個可以試的指令。
我想試試看 NVIDIA Build 平台上免費的這些 AI 模型:
DeepSeek V4、Kimi K2.6(推理/agentic)
FLUX.2(文字生圖)
Cosmos Nemotron VLM(看圖回答)
Parakeet zh-TW(台灣中文語音辨識)
TRELLIS(圖/文字 → 3D 模型)
回答之前請先:
- 如果你能上網搜尋,請查一下這些模型「最近一個月」的更新
(NVIDIA Build 一直在加新模型——DeepSeek V4 才剛上、
Kimi 持續迭代、FLUX 出到 2 代、Edify 3D 已下架改 TRELLIS。
我不希望你給我過時的資訊)
- 如果某個模型的某個功能你不確定還在不在 build.nvidia.com 上,
請直接說「不確定,建議自己去網站確認」,不要硬掰
我的情況是這樣:
- 我的工作/身份是:[ 例如:自由接案的設計師/行銷企劃/podcaster/高中老師 ]
- 我每週花最多時間的事情:[ 例如:寫 IG 貼文、做簡報、整理會議紀錄 ]
- 我覺得最煩的瑣事:[ 例如:手動打逐字稿、找配圖、做產品 3D 圖 ]
- 我有沒有 Claude Code 或寫程式經驗:[ 完全沒有/有一點/熟 ]
請依照我的情況:
1. 從這 5 組模型裡挑 2-3 個對我「最有感」的,說明為什麼
2. 排出試的順序——先玩哪個、再玩哪個、為什麼
3. 每一個都給我一個「打開 Playground 後可以馬上試」的第一個 prompt
4. 點出我這個情況下,**最相關的「貼心提醒」**:
- rate limit:每分鐘約 40 個請求/每個模型,不是 token 計費。
個人測試、少量開發完全夠;要做給很多人用的服務或大量批次
就不夠了,要走 NVIDIA 付費企業方案
- API key 安全:拿到的 nvapi-xxx 不要貼進公開的 git repo,
用 .env 存就好
- Parakeet zh-TW 是專門給台灣國語訓的——錄音是其他華語腔
會比較不準(中國 zh-CN 可以用 parakeet-ctc-0.6b-zh-cn)
- FLUX.2 dev 版只能非商用(schnell 版 Apache 2.0 商用沒問題)
- 如果我想串 Claude Code 或自己工具:你直接幫我開 env、
寫好設定就好,不要叫我自己寫
- 想接到 OpenWebUI 之類的自架 chat:你也可以幫我想架設 plan
只挑跟我情況最有關的講就好,不要全部背一遍。
回答用比較生活的語氣,不要太教科書。
把它丟給 Claude,看它怎麼回。如果它的建議讓你覺得「這真的是我」,照它說的順序試看看;覺得不太對,回它一句「我比較想用 OO」,它會重新評估。
這個 prompt 最大的好處是:你不用自己去判斷哪個模型最適合自己——這件事 Claude 比你還會。
為什麼這些模型可以當主力,不只玩玩
DeepSeek V4 跟 Kimi K2.6 都是 1T 等級的開源王者,程式跟推理能力已經跟 Claude Opus 4.6 平手(SWE-Bench Verified 80.2% vs 80.8%)。換句話說,現在能免費跑的開源模型,跟你正在付月費用的封閉模型同一個段位。
更重要的是——這些模型直接跑在 NVIDIA 自家伺服器上。
跟「拿開源 weights 自己找隨便雲端跑」比,NVIDIA Build 是上市美企的基礎設施,信任等級跟 OpenAI / Anthropic 同級——你 prompt 還是會經過 NVIDIA,但你既然已經願意把同樣的東西丟給 ChatGPT / Claude 了,就不會更糟。
⚠️ 但高度敏感的東西不要丟:醫療、法律、公司未公開機密——任何雲端 AI 都不該丟,NVIDIA 也一樣。要做這種事請看「自架方案」。
DeepSeek + Kimi 的 3 個最值得用法
基於「能力跟 Opus 4.6 同級 + 信任等級跟 OpenAI 同級 + 完全免費」這 3 個前提,這兩個推理模型最值得的 3 種用法是:
- 當 Claude / ChatGPT 的主力備品——你的訂閱額度用完了?把同一題搬到 DeepSeek V4 / Kimi K2.6 繼續,能力同級、不另外收錢。寫程式、長文分析、複雜推理都跑得動。
- 當第三方意見的 AI——同一題餵 Claude / ChatGPT / Kimi K2.6 三家對照,找出最準的答案。特別是做重要決策的時候——例如選技術方案、改履歷、評估合約條款——多一個獨立判斷視角很值得。
- 接 OpenWebUI 自己當老闆——5 分鐘自架一個自己的 chat 介面,把 NVIDIA endpoint 接進去(DeepSeek V4 / Kimi K2.6 都能直接掛上去)。不付任何訂閱費就有自己私人 AI,全家人共用也行。
(FLUX.2、Cosmos Nemotron、Parakeet、TRELLIS 是另外的場景——生圖、看圖、語音、3D,照各自的 Playground 直接玩就好。)
常被問
Q:「這些模型不是本來就開源嗎?NVIDIA 哪有送什麼?」
模型 weights 確實開源——但跑得動才算數。Kimi K2.6 是 1T 參數的 MoE 模型,至少要 8 張 H100 GPU 起跳(硬體成本約 $200k 美金),雲端租同等級算力每小時 $20–30 美金。普通人筆電根本跑不動。
NVIDIA 送的不是模型,是免費的 GPU 推論服務。同樣「open-weight hosted inference」,Together.ai、Groq、Replicate 都是按 token 收錢,重度使用者一個月輕鬆累積 $50–200 美金。NVIDIA 把這個有 rate limit 但免費送你。
類比:「Linux 是開源的」是真的,但 AWS 給你免費 EC2 instance 跑 Linux 也是真的免費。你不會說「AWS 沒在送,Linux 本來就開源」吧?模型 = Linux,算力 = 機房——這次 NVIDIA 給的是後者。
Q:「Kimi K2.6 / DeepSeek V4 真的跟 Opus 4.6 同級嗎?聽起來太誇張」
比分就是這樣——這些不是我自己編的,是模型開發者跟 Anthropic 雙方官方公告的數字:
| Benchmark | Kimi K2.6 | Opus 4.6 | DeepSeek V4-Pro |
|---|---|---|---|
| SWE-Bench Verified(程式能力標竿) | 80.2% | 80.8% | 80.6% |
| SWE-Bench Pro(更難版) | 58.6% ✅ | 53.4% | — |
| SWE-Bench Multilingual | 76.7% | 77.8% ✅ | — |
→ Verified 三家差 0.6 趴以內,統計上等於打平。Pro 反而是 Kimi 贏 Opus 4.6 5 趴。Multilingual Opus 4.6 略勝 1 趴。三項加起來大致伯仲之間。
注意:是 Opus 4.6,不是 Opus 4.7。4.7 在 4.6 出來 4 天後上線,Verified 衝到 87.6%–93.9%,確實領先 Kimi 約 7 趴。我講的是「免費跑跟 Opus 4.6 同級的開源模型」——這個是事實。
來源:
- Moonshot AI Kimi K2.6 官方 tech blog(Kimi 跟 Opus 4.6 對照表是他們自己列的)
- Anthropic Claude Opus 4.6 公告
- Vellum Opus 4.6 benchmark 整理
- SWE-Bench Verified Leaderboard
免費資源歡迎試用
不需要每個都試、不需要懂技術。先打開 build.nvidia.com 註冊一個帳號,挑你最有感的那一個玩玩看——5 分鐘就有體驗。
如果你卡在哪個模型怎麼用、或想接到自己工具但卡住了,留言或私訊我都可以。
想用 AI 工具讓生活變得更輕省,追蹤 AI 生活實驗室 @life.coach.mtcity,我們一起玩 AI!