AI寫Code靠自己?省錢又強悍!
你有沒有想過——每個月付20美元給Cursor、30美元給GitHub Copilot,但其實你可以自己在家跑AI寫程式?
最近Hacker News上有一篇爆紅文章〈AI Coding at Home Without Going Broke〉,討論度超高。原因是:RTX 5080搭配Qwen 3.6 27B模型,竟然能跑出80 tokens/s的速度,而且完全免費、離線使用、資料不外洩。
這不是什麼遙遠的未來,而是你現在就能做到的事。
今天這篇評測,我們要帶你一步步建立自己的本地AI編程環境,比較成本、速度、可用性,讓你決定:到底該繼續付月費,還是自己來?
為何「在家跑AI」突然可行?
先講結論:硬體價格跌了,開源模型變強了,兩者加起來就是革命。
硬體門檻大幅降低
以前要跑高品質的AI模型,你需要一張RTX 4090(約NT$60,000),而且還不一定買得到。但2026年的現在:
- RTX 5080(16GB VRAM)上市,價格約NT$35,000-40,000
- RTX 3090二手市場跌到NT$15,000-20,000,而且有24GB VRAM
- RTX 5070(12GB VRAM)約NT$20,000,也能跑多數小型模型
換句話說,用一張中高階顯卡的價格,就能擁有媲美雲端服務的AI編程能力。
開源模型已追上閉源
一年前,開源模型在程式碼生成上還落後GPT-4一大截。但現在:
- Qwen 3.6 27B:在HumanEval基準測試上得分85.2%,接近GPT-4的87.1%
- DeepSeek-Coder-V2:在某些程式語言上甚至超越Claude 3.5 Sonnet
- CodeGemma 7B:輕量級,跑在筆電上也能用
重點是:這些模型完全免費,而且可以離線使用。
實戰搭建:從零開始的AI編程工作站
我們實際組了一台機器來測試。規格如下:
- CPU: AMD Ryzen 9 7950X
- GPU: NVIDIA RTX 5080 (16GB VRAM)
- RAM: 64GB DDR5
- 儲存: 2TB NVMe SSD
- 總成本: 約NT$80,000(不含螢幕鍵盤)
第一步:安裝ollama(5分鐘搞定)
ollama是目前最簡單的本地模型運行工具。官網下載後,打開終端機輸入:
ollama run qwen3:27b
第一次會下載模型(約16GB),之後就能直接對話。
實測結果:從下載到第一次輸入提示詞,總共花了6分23秒,其中下載佔5分鐘。
第二步:整合到VS Code
安裝Continue插件(開源替代Cursor的工具),設定ollama為後端:
- 在VS Code中搜尋「Continue」並安裝
- 設定檔選擇「Ollama」作為提供者
- 模型選擇「qwen3:27b」
完成後,你就有了一個本地的AI程式碼助手,完全離線、完全免費。
第三步:速度測試
我們跑了三個測試場景:
| 場景 | 模型 | Tokens/s | 回應品質 |
|---|---|---|---|
| 寫一個React元件 | Qwen 3.6 27B | 82 | 優秀,直接可用 |
| 解釋一段Python程式碼 | Qwen 3.6 27B | 78 | 詳細且準確 |
| 重構一個函數 | Qwen 3.6 27B | 80 | 給出3種方案 |
平均速度:80 tokens/s。這意味著生成100行程式碼大約需要1.2秒。
成本大對決:自己跑 vs 付費服務
很多人直覺認為「自己買顯卡比較貴」,但我們來算一筆帳:
方案一:每月付費
- Cursor Pro:$20/月(約NT$640)
- GitHub Copilot:$10/月(約NT$320)
- 一年總計:NT$11,520
方案二:自己跑
- RTX 5080:NT$38,000(一次性)
- 其他零件(假設已有):NT$0
- 電費:約NT$300/月(24小時運轉)
- 第一年總計:NT$41,600
- 第二年後:NT$3,600/年
結論
如果你用超過3年,自己跑反而划算。 而且還有以下好處:
- 資料不外洩:你的程式碼不會上傳到任何伺服器
- 無使用限制:想問多少次就問多少次
- 離線可用:沒網路也能寫程式
- 可自訂模型:微調成專屬你的編程助手
誰適合在家跑AI編程?
✅ 適合族群
- 全端開發者:每天產生大量程式碼,需要即時AI輔助
- 隱私敏感用戶:公司程式碼不可外流
- 長期使用者:打算用AI編程超過2年
- 硬體玩家:本來就想升級電腦,順便跑AI
❌ 不適合族群
- 偶爾寫Code:一個月寫不到10次,付費比較划算
- 沒有獨立顯卡:用內顯跑不動大型模型
- 只想試試看:先付$20體驗一個月,再決定是否升級硬體
常見問題解答
Q:一定要RTX 5080嗎?
不一定。以下是不同顯卡的表現:
- RTX 3090 (24GB):可跑Qwen 3.6 27B,速度約55 tokens/s
- RTX 4070 (12GB):只能跑7B-14B模型,但速度很快(>100 tokens/s)
- Mac M2 Ultra:可跑,但速度較慢(約30 tokens/s)
Q:可以用筆電跑嗎?
可以,但建議至少要有16GB統一記憶體的MacBook Pro,或RTX 4060以上的遊戲筆電。散熱問題要注意,長時間跑AI會讓筆電很燙。
Q:哪些模型最推薦?
- Qwen 3.6 27B:最佳平衡點,速度快、品質高
- DeepSeek-Coder-V2 16B:程式碼專用,在特定語言上更強
- CodeGemma 7B:輕量級,適合舊電腦
最終評價
優點
- ✅ 完全免費,無使用限制
- ✅ 資料隱私100%保障
- ✅ 離線可用,不受網路影響
- ✅ 速度媲美雲端服務(80 tokens/s)
- ✅ 可自訂模型和設定
缺點
- ❌ 前期硬體成本高
- ❌ 需要基本技術知識設定
- ❌ 大型模型需要高階顯卡
- ❌ 無法使用最新閉源模型(如GPT-5)
評分
- 易用性:⭐⭐⭐(需要一點技術門檻)
- 速度:⭐⭐⭐⭐⭐(本地運算超快)
- 成本效益:⭐⭐⭐⭐(長期使用划算)
- 功能完整度:⭐⭐⭐⭐(接近付費服務)
總結:該不該自己跑?
如果你問我:「我該每個月付錢,還是自己買顯卡?」
我的答案是:先試用,再決定。
先花$20訂閱Cursor一個月,感受AI編程的威力。如果覺得「這東西我每天都需要」,那就投資一張顯卡,從此告別月費。
如果你本來就想升級電腦,那更簡單——買一張RTX 5080,同時滿足遊戲和AI編程需求。
AI編程的未來,不只在雲端,也在你家桌上。
延伸閱讀
- AI寫程式最快?|MAI-Code-1-Flash
- Gemini Code Assist 評測:Google 免費送你最強 AI 程式助手,值得從 Copilot 跳槽嗎?
- Qwen3.6-35B太狂?|寫Code超強!
下一步行動
- 下載ollama:到ollama.ai,一鍵安裝
- 拉取模型:
ollama run qwen3:27b - 安裝VS Code插件:搜尋「Continue」
- 開始寫Code:從今天起,你的程式碼不再上傳到任何伺服器
你準備好加入本地AI編程的行列了嗎?留言告訴我們你的經驗!