你用手機拍了幾百張照片,卻從來沒想過能把它們變成一支電影級短片?或是你一直想學AI影片生成,但看到那些要排隊、要付費、還要等好幾小時的平台就放棄了?

今天我要分享一個超實用的技巧:用完全免費的LTX2.3-10Eros模型,自己動手生成高品質影片。這不是那種需要頂級顯卡、複雜程式碼的駭客玩法,而是連電腦新手都能在10分鐘內上手的真實教學。

我們會從安裝工具開始,一步步教你把自己的照片變成動態影片,或是直接從文字描述生成你想要的畫面。不管你是想幫社群媒體做短片、製作產品展示影片,還是單純想玩玩AI創意,這篇教學都能幫你省下大把時間和金錢。

準備好了嗎?我們開始吧!

為什麼你該試試免費AI影片生成?

市面上多數AI影片工具,要嘛收費昂貴(像Runway每月要上千元台幣),要嘛限制多多(像Pika要排隊等好久)。更別提那些中國的AI影片平台,常常有敏感詞審查,你輸入「夕陽下的沙灘」可能都會被擋。

LTX2.3-10Eros 是個完全不同的選擇。它基於開源的Diffusers架構,由社群開發者「TenStrip」改良而成。你可以在自己的電腦上執行,不需要連網,也不用擔心審查問題。最重要的是,它完全免費

這個模型特別擅長產生流暢的動態畫面,尤其適合:

  • 風景場景:海浪、雲朵、日落
  • 人物動作:走路、跳舞、揮手
  • 產品展示:旋轉、放大、移動
  • 動畫風格:卡通、水墨、像素風

第一步:安裝必備工具(5分鐘搞定)

別被「安裝」兩個字嚇到,其實比安裝手機App還簡單。你只需要三個東西:

1. 下載 ComfyUI

這是最友善的AI繪圖/影片介面。到官網下載一鍵安裝包:

  • Windows用戶:下載「ComfyUI_windows_portable_nvidia.7z」
  • Mac用戶:下載「ComfyUI_mac_portable.zip」

解壓縮後,點擊 run_nvidia_gpu.bat(Windows)或 run.sh(Mac)就能啟動。

2. 下載模型檔案

到 HuggingFace 搜尋「TenStrip/LTX2.3-10Eros」,找到模型下載連結。你會看到幾個檔案:

  • ltx2.3-10eros.safetensors(主模型,約2.1GB)
  • ltx2.3-10eros-fp16.safetensors(精簡版,約1.1GB,建議初學者用這個)

把下載的檔案放到 ComfyUI 資料夾下的 models/checkpoints/ 目錄。

3. 安裝必要節點

在 ComfyUI 中,點擊「Manager」→「Install Custom Nodes」,搜尋並安裝:

  • ComfyUI-VideoHelperSuite(影片處理工具)
  • ComfyUI-Frame-Interpolation(補幀工具,讓影片更流暢)

完成!現在重啟 ComfyUI,你就準備好生成影片了。

第二步:從靜態照片變成動態影片

這是最實用的功能:把你手機裡的照片變成會動的短片。想像一下,你有一張海邊日落的照片,透過AI,能讓海浪輕輕拍打、雲朵緩緩飄動。

操作步驟:

  1. 載入工作流:下載我準備好的「photo-to-video.json」工作流(或自己建立)
  2. 上傳照片:在「Load Image」節點中,點擊「Choose Image to Upload」,選擇你的照片
  3. 設定參數
    • width:保持原圖寬度(建議512或768)
    • height:保持原圖高度(建議512或768)
    • frames:設定輸出幀數(16幀約1秒,32幀約2秒)
    • strength:動作強度(0.3-0.7之間,數值越大動作越明顯)
  4. 點擊「Queue Prompt」:等待約30秒到2分鐘(取決於你的顯卡)

實際案例:

我用一張台灣墾丁的沙灘照片測試:

  • 原始照片:靜態的藍天白雲、平靜海面
  • 輸出影片:雲朵緩慢移動、海浪輕輕拍打沙灘、光影微微變化
  • 參數設定:strength=0.5frames=32,耗時約45秒(RTX 3060顯卡)

第三步:從文字直接生成影片(進階技巧)

如果你沒有合適的照片,或想要完全原創的內容,可以直接用文字描述來生成。

操作步驟:

  1. 載入文字生成工作流:使用「text-to-video.json」
  2. 輸入提示詞:在「CLIP Text Encode (Positive)」節點中輸入描述
  3. 設定參數
    • steps:採樣步數(20-30之間,越高品質越好但越慢)
    • cfg:提示詞強度(7-12之間,建議8)
    • seed:隨機種子(設為-1讓系統隨機產生,或固定數字重現結果)
  4. 點擊「Queue Prompt」:等待1-5分鐘

提示詞範例(中英文皆可):

  • 「A serene Japanese garden with cherry blossoms falling, soft sunlight filtering through trees, cinematic quality」
  • 「A futuristic city at night with neon lights reflecting on wet streets, flying cars in the distance」
  • 「A cute cartoon cat dancing in a meadow of flowers, vibrant colors, smooth animation」

小技巧:

  • 描述動作:加上「flowing」、「moving」、「dancing」、「swaying」等動詞
  • 指定風格:加上「cinematic」、「anime」、「watercolor」、「3D render」等關鍵字
  • 控制光線:加上「golden hour」、「soft lighting」、「dramatic shadows」

第四步:輸出與後製(讓影片更專業)

生成完的影片可能只有1-2秒,別擔心,我們可以讓它變得更長、更流暢。

延長影片長度:

  1. 在 ComfyUI 中加入「Video Combine」節點
  2. 設定 frame_rate 為 24 或 30(標準影片幀率)
  3. 使用「Frame Interpolation」節點進行補幀,讓動作更平滑

輸出格式選擇:

  • MP4:最通用,適合社群媒體
  • GIF:適合簡單動圖
  • PNG序列:適合後製編輯

實用技巧:

  • 如果你覺得動作太快,降低 strength 或增加 frames
  • 如果畫面模糊,增加 steps 或降低 cfg
  • 如果出現鬼影(重疊影像),降低 strength 到 0.3-0.4

常見限制與解決方法

當然,LTX2.3-10Eros 不是萬能的。這裡整理你可能遇到的問題:

問題:我的顯卡跑不動怎麼辦?

  • 解決:使用 fp16 精簡版模型,並將解析度降到 384x384,幀數降到 8幀

問題:生成的影片一直閃爍

  • 解決:降低 strength 到 0.3,或增加 steps 到 30

問題:人物臉部變形

  • 解決:目前模型對人臉處理較弱,建議先從風景或物體開始練習

問題:輸出檔案太大

  • 解決:降低幀率到 12fps,或減少幀數到 16幀

真實應用場景:你可以怎麼用?

  • 社群媒體:把旅行照片變成短影片,發到IG或TikTok
  • 產品展示:把商品照片轉成動態展示影片
  • 教學素材:製作簡單的動畫解說
  • 個人創作:用文字描述生成藝術短片

我認識的一位台灣插畫家,就用這個工具把她的水墨畫作變成動態影片,在IG上獲得了超過5萬次觀看。她說:「以前要花好幾千請人做動畫,現在自己10分鐘就搞定。」

延伸閱讀

常見問題

Q: 我的顯卡只有4GB VRAM,跑得動嗎? A: 可以!使用 fp16 精簡版模型,將解析度設為 384x384,幀數設為 8-16幀,就能順利運行。如果還是太慢,可以考慮使用線上服務如 Google Colab。

Q: 生成的影片有浮水印嗎? A: 完全沒有!LTX2.3-10Eros 是開源模型,沒有任何浮水印或使用限制。你可以自由用於商業或個人用途。

Q: 可以用中文提示詞嗎? A: 可以,但效果較差。建議使用英文提示詞,因為模型主要訓練資料是英文。你可以先用 Google 翻譯把中文轉成英文。

Q: 為什麼生成的影片只有1-2秒? A: 這是因為模型設計的限制。你可以透過「Video Combine」節點將多段影片拼接,或使用補幀工具延長時間。目前最長可生成約4秒的流暢影片。

Q: 這個模型會取代專業影片製作嗎? A: 不會完全取代,但能大幅降低入門門檻。對於需要快速產出短影片的創作者來說,是非常實用的輔助工具。專業影片仍需要後製和編輯。