Mellum2免費?|JetBrains開源了

JetBrains 開源了! 就在上週,JetBrains 在 HuggingFace 上架了他們最新的程式碼模型 Mellum2-12B-A2.5B-Thinking,短短 7 天就衝上 249 個讚、近 17,000 次下載。這不是普通的模型,它是 專門為開發者打造的對話式程式碼助手,更狂的是——完全開源、可商用

對比那些動輒數百億參數、跑不動的巨無霸,Mellum2 只有 12B 參數(激活僅 2.5B),採用 MoE(混合專家)架構,讓你能在一般消費級 GPU 上跑。這意味著:你不用再依賴雲端 API,本地就能擁有 JetBrains 等級的 AI 程式碼助手

這篇文章會帶你實測 Mellum2 的程式碼生成、推理、除錯能力,並對比 DeepSeek-Coder-V2Qwen2.5-CoderGPT-4o,幫你判斷:這款模型真的值得下載嗎?還是只是 JetBrains 的公關操作?


Mellum2 是什麼?|為什麼值得關注

Mellum2 是 JetBrains 基於 Qwen2.5 架構 進行的微調版本,採用 MoE(Mixture of Experts)設計:12B 總參數中,每次推理只激活 2.5B 參數。這代表它在保持性能的同時,記憶體和計算需求大幅降低

核心亮點:

  • 開源且可商用:Apache 2.0 授權,企業也能放心用
  • 專注程式碼對話:不是通用模型,而是針對開發者需求設計
  • 支援長上下文:32K token 上下文長度,能處理大型專案
  • Thinking 模式:名稱中的「Thinking」代表它會展示推理過程
  • GGUF 格式支援:可搭配 Ollama、llama.cpp 在本地跑

為什麼它值得關注? 目前開源程式碼模型市場,DeepSeek-Coder-V2Qwen2.5-Coder 幾乎壟斷了話題。但 JetBrains 的加入,代表 IDE 巨頭親自下場做 AI 模型,這對開發者生態的影響可能比想像中大。

實測 Mellum2|程式碼生成、推理、除錯

為了測試 Mellum2 的真實實力,我準備了 三個場景程式碼生成、邏輯推理、除錯建議。硬體環境是 NVIDIA RTX 4090 24GB,使用 Ollama 載入 GGUF 量化版本。

場景一:程式碼生成

提示詞: 「用 Python 寫一個函數,輸入一個整數列表,回傳所有子陣列的最大和(Kadane’s Algorithm)」

Mellum2 輸出:

def max_subarray_sum(nums):
    if not nums:
        return 0
    max_current = max_global = nums[0]
    for i in range(1, len(nums)):
        max_current = max(nums[i], max_current + nums[i])
        if max_current > max_global:
            max_global = max_current
    return max_global
  • 程式碼品質:✅ 正確實現 Kadane’s Algorithm,變數命名清晰,有邊界條件檢查
  • 解釋:附帶了演算法時間複雜度 O(n) 和空間複雜度 O(1) 的說明
  • 對比 DeepSeek-Coder-V2:兩者輸出幾乎一致,但 Mellum2 的註解更詳細

場景二:邏輯推理

提示詞: 「有一個 4 公升和 3 公升的水壺,如何量出剛好 2 公升的水?」

Mellum2 輸出:

  1. 裝滿 4 公升水壺(4, 0)
  2. 將 4 公升倒入 3 公升(1, 3)
  3. 倒空 3 公升(1, 0)
  4. 將 4 公升中的 1 公升倒入 3 公升(0, 1)
  5. 裝滿 4 公升(4, 1)
  6. 將 4 公升倒入 3 公升(2, 3)→ 4 公升壺中剩下 2 公升

正確! 推理步驟清晰,而且用了 Thinking 模式展示中間過程。這對 Debug 時理解模型邏輯很有幫助。

場景三:除錯建議

提示詞: 「這段程式碼有什麼問題? def add(a, b): return a + b 然後呼叫 add(1, '2')

Mellum2 輸出:

  • 問題:類型不匹配,intstr 不能直接相加
  • 建議:加入類型檢查或使用 isinstance() 處理不同類型
  • 提供改寫範例

實用性:✅ 能正確識別類型錯誤,並給出具體解決方案,對新手友善。

與競品對比|Mellum2 vs DeepSeek-Coder vs GPT-4o

項目Mellum2-12B-A2.5BDeepSeek-Coder-V2GPT-4o
參數規模12B(激活 2.5B)236B(激活 21B)未公開
開源授權Apache 2.0 ✅Apache 2.0 ✅❌ 閉源
本地可跑✅ 消費級 GPU⚠️ 需高階 GPU❌ 僅雲端
程式碼生成⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
推理能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
中文支援⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
速度(推理)快(低激活參數)快(雲端)

結論:

  • Mellum2 的優勢:本地可跑、速度快、專注程式碼
  • 劣勢:中文能力較弱、大型專案理解不如 DeepSeek-Coder
  • 適合場景:日常開發輔助、小型專案、注重隱私的開發者

如何安裝 Mellum2|Ollama 與 GGUF 教學

方法一:使用 Ollama(最簡單)

# 安裝 Ollama(如果尚未安裝)
curl -fsSL https://ollama.com/install.sh | sh

# 下載 Mellum2 的 GGUF 版本
ollama pull hf.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF:Q4_K_M

# 啟動對話
ollama run hf.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF:Q4_K_M

方法二:使用 llama.cpp(進階用戶)

# 下載 GGUF 檔案
wget https://huggingface.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF/resolve/main/Mellum2-12B-A2.5B-Thinking-Q4_K_M.gguf

# 使用 llama.cpp 執行
./main -m Mellum2-12B-A2.5B-Thinking-Q4_K_M.gguf -p "寫一個 Python 快速排序" -n 512

硬體需求:

  • Q4_K_M 量化版:約 8GB VRAM(RTX 3070 以上即可)
  • Q8_0 量化版:約 14GB VRAM(RTX 4090 或以上)
  • FP16 原始版:約 24GB VRAM(需要專業 GPU)

定價與授權|完全免費

Mellum2 採用 Apache 2.0 授權,這代表:

  • 商用免費:企業可以整合到產品中
  • 修改與再發布:可以微調後重新發布
  • 無需付費:不像 GPT-4o 需要訂閱
  • ⚠️ 無技術支援:社群驅動,無官方支援

對比其他模型:

  • GPT-4o:每月 20 美元(ChatGPT Plus)或 API 按量計費
  • DeepSeek-Coder-V2:API 免費(有限制),本地部署需高階硬體
  • Qwen2.5-Coder:開源免費,但中文優化較好

一句話:如果你有 GPU,Mellum2 是零成本的程式碼助手。

延伸閱讀

誰該用 Mellum2?|優缺點總結

適合的使用者

  1. 本地開發者:不想把程式碼上傳到雲端,注重隱私
  2. 預算有限:不想付 ChatGPT Plus 或 API 費用
  3. 硬體普通:只有消費級 GPU(RTX 3070/4070)
  4. JetBrains 生態用戶:未來可能整合到 IntelliJ IDEA

不適合的使用者

  1. 需要中文支援:Mellum2 的中文能力明顯弱於 Qwen2.5
  2. 大型專案分析:32K 上下文對大型程式碼庫稍嫌不足
  3. 追求頂尖生成:對比 GPT-4o 仍有差距

最終評價

項目評分(滿分 5)
程式碼生成品質⭐⭐⭐⭐
推理與除錯⭐⭐⭐⭐
本地部署難度⭐⭐⭐⭐⭐
中文支援⭐⭐⭐
開源生態⭐⭐⭐⭐⭐
整體推薦⭐⭐⭐⭐

Mellum2 不是要取代 GPT-4o,而是提供一個「夠用且免費」的本地替代方案。 對於日常的程式碼生成、除錯、解釋,它表現得相當出色。特別是在隱私敏感的專案中,Mellum2 的價值無可比擬。

一句話總結:如果你有 GPU,Mellum2 值得一試;如果你沒有,用 Ollama 跑也只要幾分鐘。開源模型的下載按鈕就在那裡,點下去就對了。