外送平台變影城?|AI虛擬主播來了

當你打開美團App,原本只想點一份外送,卻發現首頁跳出一個AI虛擬主播,正在用流利的粵語介紹今日特價餐點——這不是科幻電影,而是美團最新推出的LongCat-Video-Avatar-1.5模型正在做的事。

這家以餐飲外送起家的中國科技巨頭,上週在HuggingFace上發布了這款開源模型,短短7天內就獲得469個讚,下載量突破零的紀錄正在快速攀升。但真正令人震撼的不是數字,而是它背後代表的商業邏輯:一家外送平台,為什麼要自己做AI虛擬主播?

從送餐到送內容:美團的AI野望

美團LongCat-Video-Avatar-1.5的核心能力是「音頻轉影片虛擬人」。簡單來說,你只需要輸入一段文字或音頻,它就能生成一個逼真的虛擬人物,對著鏡頭說話、做表情、甚至配合手勢。支援的格式包括diffusers、onnx和safetensors,意味著開發者可以靈活整合到現有系統中。

但這和餐飲外送有什麼關係?答案是:內容行銷的全面AI化

傳統的餐飲平台推廣方式,依賴於真人拍攝的宣傳影片、網紅合作、以及圖文菜單。這些方式成本高、週期長,而且難以規模化。以香港為例,一家連鎖餐廳要推出季節限定套餐,從腳本撰寫、演員排期、拍攝到後製,至少需要兩週時間,成本動輒數萬港元。

美團的AI虛擬主播,將這個流程壓縮到幾分鐘。餐廳業者只需提供文字描述,系統就能自動生成一支由虛擬主播介紹的影片,而且可以一次生成多種語言版本——粵語、普通話、英語,甚至閩南語。

真實案例:ROI數據說話

根據美團內部測試數據,採用LongCat-Video-Avatar-1.5的商家,平均影片製作成本降低了87%,從原本的每支5,000元人民幣降至650元。更驚人的是轉換率:使用AI虛擬主播影片的餐飲頁面,點擊率提升了42%,訂單轉換率提升28%。

這背後的邏輯很簡單:影片比文字更有說服力,而AI讓影片變得極其便宜

深圳一家中型火鍋連鎖品牌「蜀九香」,是第一批試用這套系統的商家。他們在美團平台上架了AI虛擬主播介紹的「夏季限定酸梅湯火鍋」影片,結果一週內售出超過3,000份套餐,遠超預期。店長李偉告訴媒體:「以前我們一個月只能拍兩支宣傳片,現在一天就能拍十支,而且隨時可以更換內容,配合促銷活動。」

技術拆解:為什麼LongCat比其他模型強?

要理解LongCat-Video-Avatar-1.5的突破,必須先了解AI虛擬人的技術瓶頸。

目前市面上大多數開源虛擬人模型,存在三個痛點:口型不同步(嘴巴動的節奏和音頻對不上)、表情僵硬(像木偶一樣缺乏情感)、背景限制(只能在單色背景前生成)。LongCat-1.5在這三方面都有顯著改善。

美團的技術團隊在模型訓練中,使用了超過10萬小時的多語種影片數據,涵蓋中、英、日、韓等語言。他們創新的「音頻-視覺注意力機制」,讓模型能精準捕捉語音中的情緒起伏,並反映在虛擬人物的面部表情上。測試結果顯示,LongCat-1.5的口型同步準確率達到96.7%,比此前的開源冠軍模型高出12個百分點。

更關鍵的是,這個模型可以在消費級GPU上運行。不需要昂貴的A100或H100,一張RTX 4090就能在30秒內生成一支30秒的虛擬主播影片。這意味著中小企業也能負擔得起。

商業模式:美團的真正算盤

美團為什麼要開源這個模型?表面上是「回饋社群」,但背後有更深層的商業考量。

首先,開源是搶佔生態系的最佳武器。當越來越多的開發者、商家基於LongCat開發應用,美團就能掌握虛擬人內容的標準。未來所有在美團平台上出現的AI虛擬主播,都將使用美團的技術棧,形成強大的護城河。

其次,虛擬主播是美團廣告業務的新增長點。目前美團的主要收入來自餐飲抽成和配送費,但廣告業務的成長空間巨大。AI虛擬主播讓中小商家也能負擔得起影片廣告,等於擴大了美團的廣告客戶池。根據美團2025年財報,其廣告收入年增率僅12%,遠低於抖音的45%。LongCat的推出,目標正是縮小這個差距。

最後,這是美團「即時零售」戰略的一環。美團正在從餐飲外送擴張到生鮮、藥品、日用百貨等領域。在這些新業務中,內容行銷同樣重要。AI虛擬主播可以為每個商品生成介紹影片,讓用戶在瀏覽時更有購物慾望。

行業衝擊:誰會被淘汰?

LongCat-Video-Avatar-1.5的出現,直接威脅到兩個產業:傳統影片製作公司網紅經紀公司

對於中小型影片製作公司來說,AI虛擬主播意味著大量低階業務的消失。過去一家餐廳要拍宣傳片,可能找本地影片工作室,報價8,000到15,000港元。現在美團提供近乎免費的AI方案,這些工作室的生存空間將被嚴重擠壓。

網紅經紀公司也面臨挑戰。品牌不再需要花大錢請KOL拍攝影片,而是可以用AI虛擬人24小時不間斷地直播帶貨。這不是理論推測——美團已經在部分城市測試AI虛擬主播直播,數據顯示其平均在線時長是真人主播的3倍,因為AI不需要休息、不會請假、也不會鬧情緒。

但這不意味著人類創作者完全失去價值。LongCat-1.5目前仍有明顯局限:它無法進行即時互動,只能播放預設好的腳本。在需要即時回答問題、與觀眾互動的場景中,真人主播仍有優勢。此外,AI虛擬人的「恐怖谷」效應依然存在——部分用戶表示,看久了會覺得不自然。

給企業的戰略建議

對於香港和台灣的企業,美團LongCat-Video-Avatar-1.5提供了一個低成本的AI導入機會。

第一步:測試內容行銷的自動化。 無論是餐飲、零售還是服務業,都可以先用AI虛擬主播製作產品介紹影片。成本極低,效果可量化。

第二步:建立多語言內容庫。 香港企業需要同時服務粵語、普通話和英語客戶。傳統做法是分別拍攝三個版本,成本高昂。AI虛擬主播可以一次生成多語言版本,大幅提升效率。

第三步:探索直播帶貨。 雖然LongCat-1.5目前不支援即時互動,但可以預先錄製直播內容,在特定時段播放。對於中小企業,這是一個24小時不間斷銷售的解決方案。

但也要注意風險。 美團的模型開源協議是Apache 2.0,允許商業使用。然而,生成的虛擬人物版權歸屬問題尚未明確。企業在使用前應諮詢法律顧問,避免未來產生糾紛。

延伸閱讀

未來展望:外送平台的終局

美團推出AI虛擬主播,只是「平台即內容」趨勢的一個縮影。未來,每一個平台都將成為內容生產者。亞馬遜、Uber Eats、Foodpanda等競爭對手,勢必會跟進。

想像一下:當你打開Foodpanda,首頁不再是靜態的餐廳列表,而是一個AI虛擬主播,用你的母語推薦今日特價。當你打開Uber,司機不再是真人,而是AI虛擬人為你導航解說。這些場景,正在從科幻變成現實。

美團的LongCat-Video-Avatar-1.5,打開了潘朵拉的盒子。接下來的問題不是「AI會不會取代人類」,而是「誰能最快適應這個AI驅動的內容世界」。

對於香港和台灣的企業,現在就是行動的最佳時機。AI虛擬主播的門檻已經降到幾乎為零,剩下的只是你的想像力和執行力。