Google開源炸裂?|本地跑Gemma 4
什麼是Gemma 4?為什麼大家都在討論?
如果你這幾天有在關注AI圈,一定看到「Google突襲開源Gemma 4」的新聞。但等等,不是已經有Gemini了嗎?Gemma又是什麼?
簡單來說,Gemma是Google開源的大型語言模型系列,跟閉源的Gemini不同,Gemma完全免費、可以下載到自己的電腦上跑。而最新發表的Gemma 4,一口氣推出了三個版本:
- Gemma 4-12B:12B參數的基礎版,適合一般文字生成任務
- Gemma 4-12B-it:12B參數的指令微調版(我們今天要測的)
- Gemma 4-27B:27B參數的大版本,需要更強硬體
最讓人興奮的是,Gemma 4-12B-it支援多模態輸入——也就是說,它不僅能看懂文字,還能看懂圖片!這在開源模型裡相當罕見,而且參數只有12B,理論上一般消費級硬體就能跑。
HuggingFace上線不到一週,Gemma 4-12B-it已經獲得399個讚、近1.5萬次下載,熱度驚人。
但重點是:我們普通人真的跑得動嗎? 今天就用一台MacBook Air M2(16GB RAM)來實測給你看。
如何在本機安裝Gemma 4?超簡單三步驟
第一步:安裝Ollama(免GPU神器)
如果你還沒用過Ollama,這是目前最簡單的本地AI運行工具。支援Mac、Windows、Linux,甚至能在樹莓派上跑。
前往 ollama.com 下載安裝,過程約30秒。
安裝完成後,打開終端機(Terminal),輸入:
ollama --version
確認顯示版本號就代表成功了。
第二步:下載Gemma 4模型
目前Ollama官方已經收錄了Gemma 4-12B-it的GGUF量化版本。在終端機輸入:
ollama pull gemma4:12b-it
這個模型大小約7.5GB(4-bit量化版),下載時間取決於你的網路速度,大約5-15分鐘。
如果你是MacBook Air M2 8GB RAM,可以試試更小的版本:
ollama pull gemma4:12b-it-q4_K_M
這個版本只有約4.5GB,記憶體需求更低。
第三步:開始對話
下載完成後,直接輸入:
ollama run gemma4:12b-it
等待幾秒鐘,看到 >>> 提示符號就代表模型載入完成。直接打字問問題即可。
小技巧:按住 Ctrl+D 可以退出對話,輸入 /help 查看所有指令。
實測重點:中文能力、程式碼、推理速度
測試環境
- 硬體:MacBook Air M2(16GB RAM,無GPU)
- 工具:Ollama + Gemma 4-12B-it Q4_K_M量化版
- 對比模型:DeepSeek-V2-Lite-Chat、Qwen2.5-7B-Instruct
測試一:中文理解與生成
提問:「請用繁體中文寫一段關於台北101的介紹,字數約200字」
Gemma 4回應:
台北101是台灣最具代表性的摩天大樓,位於台北市信義區。樓高509.2公尺,地上101層,地下5層,曾是世界最高建築。其設計靈感來自竹子,象徵節節高升。大樓內有購物中心、辦公樓層和觀景台,其中89樓的觀景台可360度俯瞰台北全景。每年跨年煙火秀更是全球矚目焦點。
評分:8/10
- ✅ 繁體中文流暢,無簡體字混雜
- ✅ 資訊正確,數據準確
- ❌ 字數約150字,略少於要求
測試二:程式碼生成
提問:「用Python寫一個函數,輸入兩個日期,計算之間的工作天數(排除週六日)」
Gemma 4回應:
import datetime
def count_workdays(start_date, end_date):
"""
Calculate the number of workdays (Mon-Fri) between two dates.
"""
total_days = (end_date - start_date).days
workdays = 0
current = start_date
for _ in range(total_days + 1):
if current.weekday() < 5: # Monday=0, Friday=4
workdays += 1
current += datetime.timedelta(days=1)
return workdays
# Example usage
start = datetime.date(2026, 6, 1)
end = datetime.date(2026, 6, 30)
print(count_workdays(start, end)) # Output: 22
評分:9/10
- ✅ 程式碼可直接執行,邏輯正確
- ✅ 有加註解,好讀
- ✅ 包含範例用法
- ❌ 未考慮國定假日(但這是合理限制)
測試三:推理速度
測試方法:連續問10個問題,記錄平均回應時間
| 模型 | 參數量 | 回應速度(每秒token數) | 首次回應時間 |
|---|---|---|---|
| Gemma 4-12B-it (Q4) | 12B | 15.3 tokens/s | 2.1秒 |
| DeepSeek-V2-Lite | 16B | 8.7 tokens/s | 3.5秒 |
| Qwen2.5-7B | 7B | 22.1 tokens/s | 1.2秒 |
結論:Gemma 4在MacBook M2上表現中規中矩,比DeepSeek快,但比Qwen2.5慢。對於一般問答和寫程式來說,15 tokens/s已經夠用,不會有明顯卡頓感。
測試四:圖片理解(多模態)
測試方法:準備一張圖表截圖,問Gemma 4「請描述這張圖表的內容」
結果:❗ 失敗。Ollama目前尚未支援Gemma 4的多模態功能,載入圖片後模型直接報錯。
原因分析:Gemma 4的多模態需要特殊的Vision Encoder,而Ollama的GGUF量化版本尚未整合此功能。如果你需要圖片理解,建議使用HuggingFace的原始版本(需要GPU)。
價格分析:免費開源 vs 雲端API
| 方案 | 成本 | 優點 | 缺點 |
|---|---|---|---|
| 本地Gemma 4(Ollama) | 完全免費 | 離線使用、無隱私問題 | 需要硬體、速度較慢 |
| Google Gemini API | 前60次/分鐘免費,之後$0.15/百萬token | 速度快、支援多模態 | 有使用限制、需網路 |
| OpenAI GPT-4o | $5/百萬輸入token | 最強能力 | 成本高、資料送美國 |
省錢建議:
- 日常問答、寫程式:用本地Gemma 4就夠了
- 需要圖片分析:用Google Gemini免費版
- 專業工作:考慮付費API
優缺點總評
優點
✅ 完全免費:沒有限制,想問多少問多少 ✅ 繁體中文優秀:比多數開源模型更懂台灣用語 ✅ 程式碼能力強:12B參數表現接近GPT-3.5 ✅ 隱私安全:資料不出電腦,適合處理機密文件 ✅ 安裝簡單:Ollama一鍵搞定
缺點
❌ 多模態尚未支援:Ollama版本無法看圖 ❌ 硬體需求不低:16GB RAM是基本門檻,8GB會很喘 ❌ 速度一般:比Qwen2.5慢約30% ❌ 知識截止日期:訓練資料較舊,最新資訊不準確 ❌ 沒有中文專用優化:部分台灣用語偶爾出錯(如「捷運」說成「地鐵」)
誰該用Gemma 4?誰該跳過?
適合使用者
- 學生:寫作業、整理筆記、學程式,完全免費
- 自由工作者:文案、翻譯、簡單程式開發
- 重視隱私者:不想讓資料上雲端的人
- AI開發者:想微調模型或做RAG應用
不適合使用者
- 需要圖片分析:請改用Gemini或GPT-4o
- 只有8GB RAM:建議先試Qwen2.5-7B(更輕量)
- 追求極致速度:雲端API更快
- 需要最新資訊:模型知識約2024年截止
延伸閱讀
- Google Gemma 4 評測:310億參數開源模型免費用,秒殺4000億參數商業巨獸
- Gemini Code Assist 評測:Google 免費送你最強 AI 程式助手,值得從 Copilot 跳槽嗎?
- Google開源殺器?|31B自己裝
結論:值得一試的開源新選擇
Google Gemma 4-12B-it是一個誠意滿滿的開源模型。在12B參數這個級別,它的中文能力、程式碼生成和推理速度都達到水準以上,而且完全免費、可以離線使用。
雖然多模態功能在Ollama上暫時無法使用,但對於純文字任務來說,它已經足夠勝任日常需求。特別是對於台灣使用者,繁體中文的支援度比DeepSeek和Qwen更好。
建議行動:
- 先安裝Ollama(30秒)
- 下載Gemma 4試用(5-15分鐘)
- 如果覺得慢,改用Qwen2.5-7B(更快但能力稍弱)
- 如果需要看圖,改用Google Gemini免費版
一句話總結:Google開源不是開玩笑,Gemma 4值得你花15分鐘試試。
你有在本地跑Gemma 4嗎?歡迎留言分享你的實測經驗!