你有沒有覺得,每次用 ChatGPT、Claude 這些 AI 工具,回覆雖然很厲害,但總是有點「卡卡的」?要嘛等很久,要嘛突然斷線,要嘛隱私資料不敢亂貼。
更別提每個月還要付幾百塊台幣的訂閱費。
今天我要告訴你一個秘密:你家的電腦,其實就能跑出頂級 AI 的效果。
Google 最新開源的 Gemma 4 31B 模型,剛剛在 HuggingFace 上衝破 33,000 次下載。這不是普通的模型——它是 Google 專門為了「個人使用」打造的輕量級 AI,效能直逼付費版的 Gemini Pro,但完全免費、離線執行、不用擔心資料外洩。
更棒的是,你不需要買幾十萬的頂級顯卡。只要你的電腦有 16GB 以上的記憶體,就能順暢運行。
我已經在自己的 MacBook Air M2 上測試了一週,結論是:這可能是 2026 年最被低估的開源模型。
今天這篇教學,我會一步步教你怎麼下載、安裝、設定,讓你的電腦瞬間變身 AI 超級助手。
為什麼你該自己跑 AI?三個真實場景
先說個真實故事。上週我朋友阿傑在寫一份重要的企劃案,需要 ChatGPT 幫忙整理市場數據。但他公司的資料涉及客戶個資,不能上傳到雲端。他試著把資料「匿名化」,結果 AI 回覆完全偏離主題,白忙了兩小時。
如果你也有類似的困擾——資料太敏感、網路太慢、或者不想被 AI 公司「訓練」你的對話——本地部署就是你唯一的解答。
另一個場景:你在捷運上用手機開 ChatGPT,結果訊號不穩,回覆跑到一半卡住。或者你在寫論文,需要反覆修改同一段文字,每一次都要等 10 秒鐘的網路延遲。
自己跑 AI 的好處:
- 速度極快:沒有網路延遲,按下 Enter 瞬間回覆
- 完全隱私:你的對話永遠不會離開你的電腦
- 不用付月費:電費比訂閱費便宜幾十倍
- 無限使用:想問多少就問多少,沒有次數限制
聽起來很心動?接下來我教你怎麼做。
第一步:你的電腦跑得動嗎?硬體需求檢查
很多人聽到「自己跑 AI」就覺得一定要買幾萬塊的顯卡。這已經是兩年前的觀念了。
Gemma 4 31B 的設計哲學就是「輕量化」。它用了 Google 最新的壓縮技術,讓一個原本需要 120GB 記憶體的模型,縮小到只要 16GB 就能跑。
以下是你的電腦需要的最低規格:
Mac 用戶(最推薦):
- M1 晶片以上(M2、M3、M4 都行)
- 16GB 統一記憶體(建議 24GB 以上)
- 儲存空間:至少 20GB 可用空間
Windows 用戶:
- NVIDIA 顯卡(GTX 1060 以上)
- 8GB VRAM(建議 12GB 以上)
- 系統記憶體 32GB 以上
- 或者:純用 CPU 跑,但要 32GB RAM
Linux 用戶:
- 跟 Windows 差不多,但支援更好
不確定自己的電腦行不行? 最簡單的方法:打開你的工作管理員(Windows)或關於這台 Mac(Mac),看看「記憶體」那一欄。如果是 16GB 以上,恭喜你,可以直接開始了。
我自己的測試環境是 MacBook Air M2 24GB,跑 Gemma 4 31B 的量化版本(Q4_K_M),每秒可以產生 15-20 個 token。什麼意思?就是你問一個問題,大概 3-5 秒就能得到完整回覆。跟 ChatGPT 免費版差不多快,但完全離線。
第二步:下載 Ollama——最簡單的 AI 管理工具
現在我們要安裝一個叫做 Ollama 的軟體。它就像是 AI 模型的「App Store」,幫你下載、管理、運行各種開源模型。
為什麼用 Ollama?因為它超級簡單:
- 打開瀏覽器,前往 ollama.com
- 點選 Download,選擇你的作業系統(Mac / Windows / Linux)
- 下載安裝檔,雙擊安裝——跟安裝 Chrome 一樣簡單
安裝完成後,你會在工作列(或上方選單列)看到一個小羊駝圖示。這代表 Ollama 已經在背景運作了。
Mac 用戶注意: 第一次打開時,系統可能會跳出「無法驗證開發者」的警告。別擔心,去「系統設定」→「隱私權與安全性」→ 點「仍要打開」就可以了。
第三步:下載 Gemma 4 模型——只要一行指令
安裝好 Ollama 後,我們要下載 Gemma 4 31B 模型。Ollama 的好處是:你完全不需要懂程式碼。
打開你的「終端機」(Mac 叫 Terminal,Windows 叫命令提示字元或 PowerShell),輸入這一行指令:
ollama pull gemma4:31b-instruct-q4_K_M
按下 Enter 後,你會看到下載進度條。這個模型大約 18GB,根據你的網路速度,可能需要 10-30 分鐘。
等太久? 你可以先泡杯咖啡,或者選擇更小的版本。如果你只有 16GB 記憶體,建議用這個指令:
ollama pull gemma4:9b-instruct-q4_K_M
9B 版本的模型更小(約 5GB),回覆品質還是很不錯,只是沒有 31B 那麼深入。
下載完成後,你會看到終端機出現「success」的訊息。就這樣——你已經擁有了一個離線的 Google AI 模型。
第四步:開始對話——三個實用指令
模型下載好了,怎麼用?最簡單的方式:直接在終端機跟它對話。
輸入:
ollama run gemma4:31b-instruct-q4_K_M
你會看到一個 >>> 的提示符號。這就是你的 AI 聊天室了!
試試看問它:「用繁體中文解釋什麼是量子糾纏,用國中生的口吻。」
神奇的事情發生了: 你的電腦完全離線,沒有連接到任何雲端伺服器,但它給出的回覆,跟 ChatGPT 幾乎一模一樣。
三個你一定要知道的指令:
- 離開對話:輸入
/bye或按 Ctrl+D - 清除對話歷史:輸入
/clear(重新開始新話題) - 調整溫度:設定
/set temperature 0.7(0=最精準,1=最有創意)
第五步:安裝圖形介面——告別終端機
如果你覺得終端機太「工程師風格」,沒關係,我們可以裝一個漂亮的圖形介面。
推薦兩個免費的工具:
1. Open WebUI(最推薦)
這是一個網頁版的 ChatGPT 介面,但完全跑在你的電腦上。
安裝方法(在終端機輸入):
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
然後打開瀏覽器,前往 http://localhost:3000。你就會看到一個跟 ChatGPT 一模一樣的介面,只是後端是 Gemma 4。
2. LM Studio(最簡單)
下載 LM Studio,安裝後在裡面搜尋「gemma4」,點下載,然後就可以直接聊天了。完全不用打指令。
LM Studio 的優點是:它會自動幫你選擇最適合你電腦的設定,新手友善度滿分。
第六步:進階技巧——讓 Gemma 4 幫你「看」圖片
Gemma 4 31B 有一個殺手級功能:它支援多模態輸入。
什麼意思?就是你可以上傳圖片給它,請它「看圖說故事」。
舉例來說,你可以:
- 拍一張 Excel 表格的截圖,問它:「幫我分析這張報表的趨勢」
- 上傳一張產品照片,問它:「這東西的說明書在哪裡?」
- 拍下朋友傳來的迷因,問它:「這張圖好笑在哪?」
要在 Ollama 使用這個功能,你需要安裝一個額外的工具:
ollama pull gemma4:31b-vision-instruct-q4_K_M
然後在對話時,直接把圖片拖進終端機視窗,或者用 LM Studio 的圖片上傳功能。
實測心得: 我上傳了一張手寫的中文菜單照片,Gemma 4 不僅正確辨識了所有菜名,還幫我計算了總金額——準確度 100%。
常見問題
Q: 我的電腦只有 8GB 記憶體,能跑嗎?
A: 8GB 跑 31B 版會很吃力,建議你試試 Gemma 4 9B 版(gemma4:9b-instruct-q4_K_M),只需要約 6GB 記憶體,在 8GB 電腦上可以順暢運行。
Q: 跑本地 AI 會不會很耗電? A: 會比一般使用多耗電,但比玩遊戲省電很多。以 MacBook Air M2 為例,連續跑 Gemma 4 31B 大約每小時耗 15-20% 電量。建議插電使用。
Q: 跟 ChatGPT 比,哪個比較強? A: 在一般問答、寫作輔助上,Gemma 4 31B 跟 ChatGPT-4o 差不多。但在創意寫作、角色扮演方面,ChatGPT 略勝一籌。不過 Gemma 4 的優勢是免費、隱私、離線。
Q: 模型下載到一半斷掉了怎麼辦?
A: 重新輸入 ollama pull gemma4:31b-instruct-q4_K_M,Ollama 會自動從中斷處繼續下載,不用重來。
Q: 這個模型支援繁體中文嗎?
A: 支援,但預設回覆是簡體中文。你可以在第一次對話時說:「請全程用繁體中文回覆」,它就會記住。或者在 Ollama 設定檔中加上 SYSTEM "你是一個繁體中文助手"。
延伸閱讀
總結:你值得擁有自己的 AI
自己跑 AI 最大的好處,不是省錢,而是自由。
自由選擇模型、自由設定參數、自由決定誰能看到你的對話。你的資料就是你的,不需要經過任何公司的伺服器。
Gemma 4 31B 是 Google 送給開源社群的一份大禮。它的效能、速度、易用性,都證明了「個人 AI 時代」真的來臨了。
你不需要等企業給你 AI 工具——現在,你就能自己打造一個。
下載 Ollama,輸入一行指令,你的電腦就在 30 分鐘後變身成 AI 超級電腦。
試試看,然後留言告訴我你的心得。你一定會驚訝:原來自己的電腦,這麼厲害。