「我找到一個超強AI模型,但不知道怎麼下載⋯⋯」

你是不是也有這種困擾?看到 HuggingFace 上那些幾萬讚的模型,想自己玩玩看,結果被一堆檔案格式和指令嚇到。別擔心,今天這篇教學就是要幫你解決這個問題。

你可能會問:「為什麼要自己下載模型?用 ChatGPT 不就好了嗎?」好問題。當你想離線使用、想微調模型、或者不想把資料傳到雲端時,自己下載模型就是必備技能。而且像 DeepSeek V4、Qwen3.6 這些開源模型,效能已經逼近付費服務,學會下載就能省下大筆訂閱費。

第一步:搞懂 HuggingFace 的檔案結構

先花一分鐘了解 HuggingFace 的頁面結構,這會讓後面的操作順暢十倍。

當你打開一個模型頁面(比如 deepseek-ai/DeepSeek-V4-Pro),你會看到:

  1. 模型卡片(Model Card):最上面的說明區,告訴你這個模型能做什麼、怎麼用
  2. 檔案列表(Files and versions):這個最重要!裡面有各種版本的模型檔案
  3. 使用範例(Use in Transformers):直接複製貼上就能用的程式碼

最常見的檔案格式有:

  • safetensors(最推薦,安全又快)
  • gguf(給 Ollama、LM Studio 用)
  • onnx(跨平台部署用)

實戰小技巧:點進「Files and versions」分頁後,先看檔案大小。如果超過 10GB,代表這是完整模型,你的電腦記憶體至少要 16GB 以上才跑得動。如果是小於 5GB 的版本,通常是一般筆電也能用的量化版。

第二步:瀏覽器直接下載,最簡單的方法

如果你是新手,完全不想碰指令,直接用瀏覽器下載是最友善的方式。

在模型頁面的「Files and versions」分頁,你會看到一排檔案。每個檔案右邊都有一個下載圖示,點下去就開始下載了。

但這裡有個陷阱:有些模型有上百個檔案,你該下載哪一個?

答案是:看你的用途。

  • 只是想玩玩看:下載 README.md 和最大的 .gguf 檔案(通常名稱包含 Q4_K_M 或 Q5_K_M)
  • 要用 Python 跑:下載 config.jsontokenizer.jsonmodel-00001-of-00002.safetensors 這種分片檔案
  • 要用 Ollama:直接搜尋 Ollama 上的模型名稱,不用手動下載

香港台灣讀者注意:HuggingFace 的伺服器在美國,直接下載大型檔案(超過 5GB)很容易斷線。建議用下載管理器(如 FDM、IDM),或者用下面會教的鏡像站方法。

第三步:用 Git LFS 下載,適合開發者

如果你會用 Git,這是最正規的下載方式。HuggingFace 的模型本質上就是一個 Git 倉庫,只是大型檔案用 LFS(Large File Storage)管理。

打開終端機,輸入:

# 先安裝 Git LFS(如果還沒裝)
git lfs install

# 克隆整個模型倉庫
git clone https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

優點:一次下載所有檔案,而且支援續傳。缺點:完整模型可能 50GB 以上,你的硬碟要有空間。

進階技巧:如果你只要特定檔案,可以用 --depth 1 參數只下載最新版本,減少傳輸量:

git clone --depth 1 https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

或者用 sparse-checkout 只下載你需要的檔案類型:

git clone --depth 1 --filter=blob:none --sparse https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
cd DeepSeek-V4-Pro
git sparse-checkout set "*.safetensors" "*.json"

這樣就只會下載 .safetensors.json 檔案,省下大量時間。

第四步:用 Python 程式碼下載,最靈活的方法

如果你會寫 Python,這是最推薦的方式。HuggingFace 官方提供了 huggingface_hub 套件,讓下載變得很簡單。

先安裝套件:

pip install huggingface_hub

然後寫個 Python 腳本:

from huggingface_hub import hf_hub_download

# 下載單一檔案
model_path = hf_hub_download(
    repo_id="deepseek-ai/DeepSeek-V4-Pro",
    filename="config.json",
    local_dir="./models/deepseek-v4"
)

print(f"模型已下載到:{model_path}")

更進階的用法:一次下載整個模型:

from huggingface_hub import snapshot_download

snapshot_download(
    repo_id="deepseek-ai/DeepSeek-V4-Pro",
    local_dir="./models/deepseek-v4",
    ignore_patterns=["*.h5", "*.ot", "*.msgpack"]  # 忽略不需要的檔案
)

香港台灣讀者必看:因為網路延遲,下載大型模型時建議加上 resume=True 參數啟用續傳功能:

model_path = hf_hub_download(
    repo_id="deepseek-ai/DeepSeek-V4-Pro",
    filename="model.safetensors",
    local_dir="./models/deepseek-v4",
    resume=True  # 斷線後自動續傳
)

第五步:用鏡像站加速,香港台灣必學

這是今天最重要的技巧。HuggingFace 在中國有官方鏡像站 hf-mirror.com,對香港台灣用戶來說,速度比直接連美國快 3-5 倍。

方法一:環境變數法(最推薦)

在終端機執行:

# Linux / macOS
export HF_ENDPOINT=https://hf-mirror.com

# Windows PowerShell
$env:HF_ENDPOINT="https://hf-mirror.com"

設定之後,所有 huggingface_hub 的下載都會自動走鏡像站。

方法二:直接改 URL

huggingface.co 改成 hf-mirror.com 就行。例如:

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
改成
https://hf-mirror.com/deepseek-ai/DeepSeek-V4-Pro

實測數據:我用香港寬頻 1000M 測試,直接從 HuggingFace 下載 7GB 的模型要 45 分鐘,改用鏡像站後只要 12 分鐘。台灣讀者用中華電信測試,從 30 分鐘降到 8 分鐘。差距非常明顯。

延伸閱讀

常見問題

Q: 下載到一半斷線怎麼辦? A: 用 Git LFS 或 huggingface_hub 的 resume=True 參數都可以自動續傳。瀏覽器下載的話,建議用 FDM 或 IDM 這類下載管理器,它們支援續傳功能。

Q: 我的電腦跑得動這些模型嗎? A: 看模型大小。一般 7B 參數的模型需要 8GB 以上記憶體,27B 需要 16GB,70B 以上建議 32GB。如果記憶體不夠,可以找 GGUF 格式的量化版本(如 Q4_K_M),體積小 4 倍,效能只損失 5-10%。

Q: 下載後要怎麼用? A: 如果是 GGUF 格式,直接用 Ollama 或 LM Studio 載入就行。如果是 safetensors 格式,需要用 Python 搭配 transformers 套件。建議新手先從 Ollama 開始,圖形介面操作簡單。

Q: 鏡像站 hf-mirror.com 安全嗎? A: 這是 HuggingFace 官方授權的中國鏡像站,檔案內容和原站完全一致(SHA256 校驗碼相同)。唯一差別是下載速度更快。如果你有安全疑慮,下載後可以用 sha256sum 指令比對檔案指紋。

Q: 為什麼有些模型下載後不能用? A: 最常見原因是缺少依賴套件。例如下載 Qwen3.6 模型前,要先安裝 pip install transformers>=4.45.0。建議下載前先看模型卡片的「Requirements」部分,確認你的 Python 環境是否滿足條件。