你用手機拍了幾百張照片,卻從來沒想過能把它們變成一支電影級短片?或是你一直想學AI影片生成,但看到那些要排隊、要付費、還要等好幾小時的平台就放棄了?
今天我要分享一個超實用的技巧:用完全免費的LTX2.3-10Eros模型,自己動手生成高品質影片。這不是那種需要頂級顯卡、複雜程式碼的駭客玩法,而是連電腦新手都能在10分鐘內上手的真實教學。
我們會從安裝工具開始,一步步教你把自己的照片變成動態影片,或是直接從文字描述生成你想要的畫面。不管你是想幫社群媒體做短片、製作產品展示影片,還是單純想玩玩AI創意,這篇教學都能幫你省下大把時間和金錢。
準備好了嗎?我們開始吧!
為什麼你該試試免費AI影片生成?
市面上多數AI影片工具,要嘛收費昂貴(像Runway每月要上千元台幣),要嘛限制多多(像Pika要排隊等好久)。更別提那些中國的AI影片平台,常常有敏感詞審查,你輸入「夕陽下的沙灘」可能都會被擋。
LTX2.3-10Eros 是個完全不同的選擇。它基於開源的Diffusers架構,由社群開發者「TenStrip」改良而成。你可以在自己的電腦上執行,不需要連網,也不用擔心審查問題。最重要的是,它完全免費!
這個模型特別擅長產生流暢的動態畫面,尤其適合:
- 風景場景:海浪、雲朵、日落
- 人物動作:走路、跳舞、揮手
- 產品展示:旋轉、放大、移動
- 動畫風格:卡通、水墨、像素風
第一步:安裝必備工具(5分鐘搞定)
別被「安裝」兩個字嚇到,其實比安裝手機App還簡單。你只需要三個東西:
1. 下載 ComfyUI
這是最友善的AI繪圖/影片介面。到官網下載一鍵安裝包:
- Windows用戶:下載「ComfyUI_windows_portable_nvidia.7z」
- Mac用戶:下載「ComfyUI_mac_portable.zip」
解壓縮後,點擊 run_nvidia_gpu.bat(Windows)或 run.sh(Mac)就能啟動。
2. 下載模型檔案
到 HuggingFace 搜尋「TenStrip/LTX2.3-10Eros」,找到模型下載連結。你會看到幾個檔案:
ltx2.3-10eros.safetensors(主模型,約2.1GB)ltx2.3-10eros-fp16.safetensors(精簡版,約1.1GB,建議初學者用這個)
把下載的檔案放到 ComfyUI 資料夾下的 models/checkpoints/ 目錄。
3. 安裝必要節點
在 ComfyUI 中,點擊「Manager」→「Install Custom Nodes」,搜尋並安裝:
ComfyUI-VideoHelperSuite(影片處理工具)ComfyUI-Frame-Interpolation(補幀工具,讓影片更流暢)
完成!現在重啟 ComfyUI,你就準備好生成影片了。
第二步:從靜態照片變成動態影片
這是最實用的功能:把你手機裡的照片變成會動的短片。想像一下,你有一張海邊日落的照片,透過AI,能讓海浪輕輕拍打、雲朵緩緩飄動。
操作步驟:
- 載入工作流:下載我準備好的「photo-to-video.json」工作流(或自己建立)
- 上傳照片:在「Load Image」節點中,點擊「Choose Image to Upload」,選擇你的照片
- 設定參數:
width:保持原圖寬度(建議512或768)height:保持原圖高度(建議512或768)frames:設定輸出幀數(16幀約1秒,32幀約2秒)strength:動作強度(0.3-0.7之間,數值越大動作越明顯)
- 點擊「Queue Prompt」:等待約30秒到2分鐘(取決於你的顯卡)
實際案例:
我用一張台灣墾丁的沙灘照片測試:
- 原始照片:靜態的藍天白雲、平靜海面
- 輸出影片:雲朵緩慢移動、海浪輕輕拍打沙灘、光影微微變化
- 參數設定:
strength=0.5,frames=32,耗時約45秒(RTX 3060顯卡)
第三步:從文字直接生成影片(進階技巧)
如果你沒有合適的照片,或想要完全原創的內容,可以直接用文字描述來生成。
操作步驟:
- 載入文字生成工作流:使用「text-to-video.json」
- 輸入提示詞:在「CLIP Text Encode (Positive)」節點中輸入描述
- 設定參數:
steps:採樣步數(20-30之間,越高品質越好但越慢)cfg:提示詞強度(7-12之間,建議8)seed:隨機種子(設為-1讓系統隨機產生,或固定數字重現結果)
- 點擊「Queue Prompt」:等待1-5分鐘
提示詞範例(中英文皆可):
- 「A serene Japanese garden with cherry blossoms falling, soft sunlight filtering through trees, cinematic quality」
- 「A futuristic city at night with neon lights reflecting on wet streets, flying cars in the distance」
- 「A cute cartoon cat dancing in a meadow of flowers, vibrant colors, smooth animation」
小技巧:
- 描述動作:加上「flowing」、「moving」、「dancing」、「swaying」等動詞
- 指定風格:加上「cinematic」、「anime」、「watercolor」、「3D render」等關鍵字
- 控制光線:加上「golden hour」、「soft lighting」、「dramatic shadows」
第四步:輸出與後製(讓影片更專業)
生成完的影片可能只有1-2秒,別擔心,我們可以讓它變得更長、更流暢。
延長影片長度:
- 在 ComfyUI 中加入「Video Combine」節點
- 設定
frame_rate為 24 或 30(標準影片幀率) - 使用「Frame Interpolation」節點進行補幀,讓動作更平滑
輸出格式選擇:
- MP4:最通用,適合社群媒體
- GIF:適合簡單動圖
- PNG序列:適合後製編輯
實用技巧:
- 如果你覺得動作太快,降低
strength或增加frames - 如果畫面模糊,增加
steps或降低cfg - 如果出現鬼影(重疊影像),降低
strength到 0.3-0.4
常見限制與解決方法
當然,LTX2.3-10Eros 不是萬能的。這裡整理你可能遇到的問題:
問題:我的顯卡跑不動怎麼辦?
- 解決:使用
fp16精簡版模型,並將解析度降到 384x384,幀數降到 8幀
問題:生成的影片一直閃爍
- 解決:降低
strength到 0.3,或增加steps到 30
問題:人物臉部變形
- 解決:目前模型對人臉處理較弱,建議先從風景或物體開始練習
問題:輸出檔案太大
- 解決:降低幀率到 12fps,或減少幀數到 16幀
真實應用場景:你可以怎麼用?
- 社群媒體:把旅行照片變成短影片,發到IG或TikTok
- 產品展示:把商品照片轉成動態展示影片
- 教學素材:製作簡單的動畫解說
- 個人創作:用文字描述生成藝術短片
我認識的一位台灣插畫家,就用這個工具把她的水墨畫作變成動態影片,在IG上獲得了超過5萬次觀看。她說:「以前要花好幾千請人做動畫,現在自己10分鐘就搞定。」
延伸閱讀
常見問題
Q: 我的顯卡只有4GB VRAM,跑得動嗎? A: 可以!使用 fp16 精簡版模型,將解析度設為 384x384,幀數設為 8-16幀,就能順利運行。如果還是太慢,可以考慮使用線上服務如 Google Colab。
Q: 生成的影片有浮水印嗎? A: 完全沒有!LTX2.3-10Eros 是開源模型,沒有任何浮水印或使用限制。你可以自由用於商業或個人用途。
Q: 可以用中文提示詞嗎? A: 可以,但效果較差。建議使用英文提示詞,因為模型主要訓練資料是英文。你可以先用 Google 翻譯把中文轉成英文。
Q: 為什麼生成的影片只有1-2秒? A: 這是因為模型設計的限制。你可以透過「Video Combine」節點將多段影片拼接,或使用補幀工具延長時間。目前最長可生成約4秒的流暢影片。
Q: 這個模型會取代專業影片製作嗎? A: 不會完全取代,但能大幅降低入門門檻。對於需要快速產出短影片的創作者來說,是非常實用的輔助工具。專業影片仍需要後製和編輯。