DeepSeek V4 Pro 這幾天在 HuggingFace 上狂掃 35 萬次下載,社群討論度破表。但你還在用網頁版慢慢等回應嗎?每次問問題都要排隊,還擔心對話記錄被拿去訓練?今天這篇教學,就是要教你一個 90% 的使用者都不知道的密技:把 DeepSeek V4 Pro 直接裝在你的電腦上,離線執行、速度飛快、完全免費,而且你的資料 100% 留在自己手裡。
你不必是工程師,也不用懂程式碼。只要照著步驟走,20 分鐘內就能讓這顆強大的 AI 模型在你的筆電上跑起來。準備好了嗎?我們開始吧!
為什麼要把模型裝在本地?三大你無法拒絕的理由
你可能會想:「我都用 ChatGPT 或 DeepSeek 網頁版用得好好的,為什麼要搞這麼麻煩?」
讓我用一個真實場景來說明。假設你是一位在台灣的金融分析師,每天要處理大量客戶數據和機密報告。用雲端 AI 時,你永遠不知道你的對話記錄去了哪裡——OpenAI 曾被爆出員工可以查看用戶對話,DeepSeek 的伺服器在中國,資料隱私問題更讓人擔心。
本地部署的第一個理由:隱私無價。 當模型跑在你的電腦上,所有資料都在本地處理,連網路都不需要。你的財務報表、醫療記錄、商業機密,完全不會離開你的硬碟。
第二個理由:省錢。 DeepSeek V4 Pro 的 API 收費雖然不算貴,但如果你是重度使用者——每天問上百個問題、處理大量文件——一個月下來輕鬆破千元台幣。本地部署只需一次性的電費和硬體成本,長期下來省超多。
第三個理由:速度。 網頁版受限於伺服器負載,尖峰時段可能要等 10-20 秒才有回應。本地模型只要你的電腦夠力,回應速度穩定在每秒 30-50 個 token,比雲端還快!
第一步:你的電腦跑得動嗎?硬體需求與檢查
在開始之前,我們先確認你的電腦是否夠格。DeepSeek V4 Pro 有不同尺寸的版本,你可以根據自己的硬體選擇:
最低配置(跑 7B 模型):
- RAM:8GB(建議 16GB)
- 顯示卡:不需要,純 CPU 也能跑,但速度較慢
- 儲存空間:至少 10GB 可用空間
推薦配置(跑 14B 或 27B 模型):
- RAM:16GB 以上
- 顯示卡:NVIDIA GTX 1060 6GB 以上(或 AMD 同等級)
- 儲存空間:20-50GB
頂配(跑 72B 或完整版):
- RAM:32GB 以上
- 顯示卡:NVIDIA RTX 3090/4090 24GB VRAM
- 儲存空間:100GB 以上
不確定自己的規格?Windows 用戶請按 Ctrl + Shift + Esc 開啟工作管理員,點擊「效能」分頁;Mac 用戶點擊左上角蘋果圖示 →「關於這台 Mac」。看到「記憶體」那欄,就是你的 RAM 大小。
如果你是 Mac 用戶,特別是 M1/M2/M3 晶片的 Mac,有個好消息:這些晶片的統一記憶體架構讓你可以用更少的 VRAM 跑更大的模型。例如 M2 Max 64GB 的 MacBook Pro,甚至可以順跑 27B 模型!
第二步:選擇你的武器——Ollama vs LM Studio
市面上有兩種主流工具可以幫你輕鬆安裝和運行模型。我兩個都試過,以下是真實心得:
Ollama:最簡單、最輕量
Ollama 是一個命令列工具,但別被「命令列」三個字嚇到——它其實超簡單。安裝後,你只需要打開終端機(Mac 的「終端機」或 Windows 的「命令提示字元」),輸入一行指令就能下載並執行模型。
優點:
- 檔案小、安裝快
- 支援 GPU 加速自動偵測
- 社群模型超多,幾乎所有 HuggingFace 上的模型都有人打包好
缺點:
- 沒有圖形介面,對新手不太友善
- 要自己裝第三方 UI 才能有聊天室體驗
LM Studio:有圖形介面、新手友善
LM Studio 是一款桌面應用程式,安裝後直接有漂亮的聊天介面,像 ChatGPT 一樣。你可以在軟體內搜尋並下載模型,然後直接在視窗中對話。
優點:
- 視覺化操作,不用打指令
- 內建模型瀏覽器,一鍵下載
- 支援本地 API,可以讓其他程式呼叫
缺點:
- 佔用較多系統資源
- 模型選擇比 Ollama 少一些
我的建議: 如果你是第一次嘗試本地模型,從 LM Studio 開始。等熟悉了再試 Ollama。今天我們就以 LM Studio 為主要教學工具。
第三步:實戰安裝——20 分鐘搞定
下載 LM Studio
前往 lmstudio.ai 下載對應你作業系統的版本。Windows 選 .exe,Mac 選 .dmg。安裝過程就跟一般軟體一樣,下一步下一步就好。
選擇並下載 DeepSeek V4 Pro 模型
打開 LM Studio 後,你會看到一個搜尋欄。輸入「DeepSeek V4 Pro」,會出現好幾個版本。這裡要注意:GGUF 格式的檔案是專門為本地執行最佳化的,請找檔名包含「GGUF」的選項。
如果你是新手,建議先下載 DeepSeek-V4-Pro-7B-Q4_K_M.gguf,這個版本大小約 4GB,品質與速度的平衡最好。點擊下載後,程式會自動開始抓檔案,進度條會顯示在左下角。
下載時間取決於你的網路速度。一般來說,4GB 的檔案在中華電信 300M 光纖下約 2-3 分鐘。泡杯咖啡回來就好了。
載入模型並開始對話
下載完成後,回到 LM Studio 主畫面,你會看到左側出現剛剛下載的模型。點擊它,然後按下「Load Model」按鈕。等待幾秒鐘,當按鈕變成綠色且顯示「Loaded」時,就代表模型成功載入!
現在,你可以在右側的聊天視窗中輸入問題了。試試看:「請用繁體中文介紹 DeepSeek V4 Pro 的主要特色。」模型應該會在幾秒內開始回應。恭喜!你已經成功在本地運行 AI 模型了!
第四步:進階調校——讓你的模型跑更快、回答更好
載入模型只是第一步。以下是幾個讓體驗更流暢的密技:
調整 Context Length(上下文長度)
在載入模型前,你可以點擊模型旁邊的齒輪圖示,調整「Context Length」。這個參數決定模型能「記住」多少對話歷史。預設是 4096,但如果你要處理長文件,可以調到 8192 或 16384。注意:數值越大,吃的 RAM 越多。
開啟 GPU Offloading(GPU 卸載)
如果你的電腦有獨立顯卡,一定要開啟這個功能!在設定中找到「GPU Offload」,選擇你的顯卡型號。這可以讓模型的一部分運算交給顯卡處理,速度提升 3-5 倍。Mac 用戶則會自動啟用 Metal(蘋果的 GPU 加速技術)。
使用 System Prompt 設定角色
LM Studio 支援 System Prompt,讓你可以設定 AI 的角色和行為。例如,你可以輸入:「你是一位專業的繁體中文編輯,擅長校對和潤飾文章。請用正式但友善的語氣回應。」這樣模型就會依照你的設定來回答。
安裝 Open WebUI 獲得 ChatGPT 等級體驗
如果你覺得 LM Studio 的介面太簡陋,可以安裝 Open WebUI——這是一個開源的網頁介面,長得跟 ChatGPT 一模一樣!安裝方式:在終端機輸入 docker run -d -p 3000:8080 ghcr.io/open-webui/open-webui:main,然後打開瀏覽器輸入 http://localhost:3000。設定 LM Studio 的 API 端點(通常是 http://localhost:1234),就能擁有類似 ChatGPT 的體驗,但背後跑的是你自己的 DeepSeek V4 Pro!
常見問題
Q: 我的電腦只有 8GB RAM,跑得動嗎? A: 可以,但建議下載 7B 模型的 Q4_K_M 量化版本(約 4GB)。關閉其他程式,只跑 LM Studio,應該可以順暢運行。如果還是卡頓,可以試試更小的 3B 模型。
Q: 模型回答的繁體中文品質如何? A: DeepSeek V4 Pro 對繁體中文的支援相當好,但偶爾會出現簡體字或大陸用語。建議在 System Prompt 中明確指定「請使用台灣繁體中文」,並在對話中即時糾正,模型會慢慢適應你的用語習慣。
Q: 下載模型會不會有版權問題? A: DeepSeek V4 Pro 採用 MIT 授權,可以自由使用、修改、商用。但要注意,模型是基於大量網路資料訓練的,輸出內容的版權歸屬於你。放心使用吧!
Q: 為什麼我的模型回應速度很慢? A: 最常見原因是沒有開啟 GPU Offloading。請確認設定中已選取你的顯卡。如果還是慢,試著降低 Context Length 或改用更小的量化版本(如 Q4_K_M 比 Q8_0 快很多)。
Q: 可以同時載入多個模型嗎? A: LM Studio 一次只能載入一個模型。但你可以下載多個模型,需要時切換。如果需要同時使用多個模型,可以考慮使用 Ollama 搭配 Open WebUI。
延伸閱讀
總結:你的 AI 助手,由你掌控
今天我們學到了三件事:第一,本地部署 AI 模型並不難,LM Studio 讓整個過程像安裝一般軟體一樣簡單;第二,本地運行的好處是隱私、省錢、速度快,特別適合需要處理敏感資料的專業人士;第三,透過調整 GPU Offloading、Context Length 和 System Prompt,你可以讓模型表現得更好。
現在輪到你了!打開你的電腦,按照步驟試試看。剛開始可能會遇到一些小問題,例如模型下載失敗或速度不如預期——別灰心,這些都是正常的。可以到 DeepSeek 的 Discord 社群或繁體中文 AI 討論區尋求幫助,社群裡有很多熱心的高手。
你已經掌握了 90% 使用者不知道的技巧。從今天起,你的 AI 助手不再受制於雲端,而是完全由你掌控。快去試試吧!