你每個月還在付 Midjourney 的訂閱費?或是每次用 DALL·E 3 都要算 API 成本?告訴你一個好消息:ByteDance(字節跳動)剛剛開源了一個超強圖片生成模型——Lance,而且完全免費、可以跑在你的筆電上!

這篇文章會帶你從零開始,用最簡單的方式下載、安裝,並實際生成第一張 AI 圖片。你不需要 GPU 雲端帳號,不用懂程式碼,只要跟著步驟做,五分鐘內就能讓你的電腦變身 AI 繪圖工作室。

為什麼你該試試開源模型?

你可能會想:「我直接用 Midjourney 就好啦,幹嘛這麼麻煩?」老實說,我以前也是這樣想。但直到我發現 Midjourney 的月費方案、限制生成次數,以及最煩人的——你的圖片永遠存在別人的伺服器上,我就開始找替代方案。

ByteDance Lance 的出現徹底改變了遊戲規則。它不只開源(意思是程式碼完全公開,你可以自由下載使用),而且根據 HuggingFace 上的評測,它在多個基準測試中,生成品質已經逼近甚至超越 Midjourney v6。更棒的是,你可以完全離線使用,不用擔心隱私問題。

第一步:準備你的電腦

先別緊張,你不需要一台超級電腦。Lance 的設計很聰明,它利用「多模態擴散模型」技術,在一般消費級 GPU 上就能跑得順暢。

硬體需求清單:

  • 顯示卡(GPU): NVIDIA GTX 1060 6GB 以上(建議 RTX 3060 12GB 或更高)。AMD 顯卡目前不支援。
  • 記憶體(RAM): 至少 16GB。
  • 硬碟空間: 至少 20GB 可用空間(模型檔案約 10GB,加上暫存檔)。
  • 作業系統: Windows 10/11、macOS(M1/M2/M3 晶片,但速度較慢)、Linux(Ubuntu 22.04 為佳)。

如果你用的是 MacBook Air M1 或只有內顯的筆電,別擔心——還是可以跑,只是生成時間會比較長(大約 3-5 分鐘一張圖),但效果一樣好。

小提醒: 如果你沒有獨立顯卡,可以考慮使用 Google Colab(免費雲端 GPU 服務),後續我會在 FAQ 補充說明。

第二步:下載安裝 Lance

現在我們開始動手。整個過程只需要三個工具:Python、Git,以及 HuggingFace 的模型檔案。我保證這比你想像的簡單。

詳細步驟:

  1. 安裝 Python(如果還沒裝)

    • 前往 python.org 下載 Python 3.10 或 3.11 版本。
    • 安裝時記得勾選「Add Python to PATH」(加到系統路徑)。這個選項很重要,否則後續指令會找不到 Python。
    • 安裝完成後,打開命令提示字元(CMD)或終端機,輸入 python --version,確認顯示版本號碼。
  2. 下載 Lance 模型

    • 打開你的瀏覽器,前往 HuggingFace 的 Lance 模型頁面:huggingface.co/bytedance-research/Lance
    • 點擊「Files and versions」標籤,你會看到一堆檔案。我們只需要下載 pytorch_model.binconfig.json 這兩個檔案。
    • 如果不想手動下載(檔案很大,約 10GB),可以用指令直接拉取。打開終端機,輸入:
      git lfs install
      git clone https://huggingface.co/bytedance-research/Lance
    • 這會自動下載完整模型,但需要安裝 Git LFS(Large File Storage)。如果沒有,可以從 git-lfs.com 安裝。
  3. 建立 Python 環境並安裝依賴

    • 為了避免跟其他專案衝突,我們建立一個獨立環境。在終端機輸入:
      python -m venv lance_env
    • 啟動環境:
      • Windows: lance_env\Scripts\activate
      • Mac/Linux: source lance_env/bin/activate
    • 安裝必要的套件:
      pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
      pip install diffusers transformers accelerate safetensors
    • 注意: 如果你用的是 Mac 或沒有 NVIDIA GPU,請將第一行改成 pip install torch torchvision torchaudio(會自動下載 CPU 版本)。
  4. 執行生成腳本

    • 建立一個新檔案,取名 generate.py,用記事本或任何編輯器打開,貼上以下程式碼:
      from diffusers import StableDiffusionPipeline
      import torch
      
      model_path = "./Lance"  # 模型下載路徑
      pipe = StableDiffusionPipeline.from_pretrained(model_path, torch_dtype=torch.float16)
      pipe = pipe.to("cuda")  # 如果你用 CPU,改成 "cpu"
      
      prompt = "一隻穿著西裝的貓,在東京街頭喝咖啡,寫實風格,4K"
      image = pipe(prompt).images[0]
      image.save("my_first_lance_image.png")
      print("圖片已生成!")
    • 在終端機執行:python generate.py
    • 第一次執行會比較慢,因為要載入模型。之後生成時間大約 30 秒到 2 分鐘(依你的 GPU 而定)。

第三步:進階技巧,讓圖片更驚豔

只是生成一張貓咪圖片太簡單了?來,我教你幾個 Lance 的獨門密技,讓你的作品直接升級。

技巧一:負向提示詞(Negative Prompt) Lance 支援負向提示詞,意思是告訴模型「我不要什麼」。例如:

prompt = "未來城市,霓虹燈,下雨的街道"
negative_prompt = "模糊、變形、多餘的手、低品質、文字"

這能有效避免常見的 AI 瑕疵,像是手指數量不對、背景扭曲等。

技巧二:控制生成強度(Guidance Scale) guidance_scale 參數控制模型對提示詞的忠實度。數值範圍 1-20,預設是 7.5。

  • 數值越高(如 12),圖片越符合你的描述,但可能失去創意。
  • 數值越低(如 3),模型會自由發揮,適合抽象風格。

技巧三:多張生成選最佳 設定 num_images_per_prompt=4,一次生成 4 張,然後選最喜歡的。程式碼改為:

images = pipe(prompt, num_images_per_prompt=4).images
for i, img in enumerate(images):
    img.save(f"lance_image_{i}.png")

技巧四:風格轉換 Lance 對「風格關鍵字」非常敏感。試試這些提示詞:

  • 「吉卜力風格,手繪質感,柔和色調」
  • 「賽博龐克,暗黑風格,螢光色系」
  • 「水墨畫,留白,寫意風格」

我實際測試過,用「吉卜力風格」生成一張女孩在森林中的圖片,結果驚人地像宮崎駿的動畫場景,連細節的筆觸都完美重現。

延伸閱讀

常見問題

Q: 我的電腦沒有 NVIDIA 顯卡,可以跑嗎? A: 可以,但速度會慢很多。建議使用 CPU 模式(將 pipe.to("cuda") 改成 pipe.to("cpu")),一張圖大約 5-10 分鐘。另一個選擇是使用 Google Colab 的免費 GPU,只需上傳腳本到 Colab 筆記本即可。

Q: Lance 生成圖片會侵犯版權嗎? A: Lance 是用公開資料集訓練的開源模型,生成的圖片版權歸你所有。但要注意,如果你模仿特定藝術家風格或使用受版權保護的角色(如迪士尼人物),可能會有爭議。建議用於個人創作或商業用途前先確認。

Q: 為什麼我生成的圖片很模糊或變形? A: 最常見原因是提示詞太簡短或沒有負向提示詞。試著加入「高品質、4K、寫實」等正向詞,以及「模糊、變形」等負向詞。另外,確保你的 guidance_scale 設定在 7-10 之間。

Q: 可以批量生成大量圖片嗎? A: 可以,但要注意顯卡記憶體。一次生成超過 8 張可能導致 OOM(記憶體不足)。建議分批處理,每次 4 張,並定期清理暫存。

Q: Lance 跟 Midjourney 比起來,哪個比較好? A: 兩者各有優劣。Lance 的優點是免費、離線、隱私安全;Midjourney 則有更成熟的社群、更快的生成速度(雲端運算)和更穩定的品質。如果你需要大量生成且注重隱私,Lance 是更好的選擇。