「各位聽眾早安,我是你的AI DJ小晴,今天為你帶來一首陳奕迅的〈富士山下〉,這首歌背後有個有趣的故事⋯⋯」這樣的開場白,你可能已經在台灣或香港的某個電台聽過了。
2026年5月,一則來自Hacker News的消息引起了全球媒體圈的關注——「We let AIs run radio stations」(我們讓AI來經營電台),這篇文章在短時間內獲得超過200個讚和175則熱烈討論。這不是科幻小說,而是正在發生的現實。
美國先例:AI DJ的意外成功
這項實驗由美國一家中型廣播集團發起。他們選定了一個地方性的FM頻道,將從早上6點到晚上12點的所有時段,全面交由AI系統主持。這不是簡單的播放清單自動化,而是真正的「AI DJ」——它會說話、會介紹歌曲、會回應聽眾留言、甚至會模仿真人主持人的語氣和風格。
結果出乎意料:三個月後,該頻道的收聽率反而上升了12%。更驚人的是,廣告收益在同期增長了8%,因為廣告主發現聽眾的黏著度變高了。
背後的技術核心是多模態AI模型的整合。系統使用了類似HuggingFace上近期爆紅的Supertone/supertonic-3這類文字轉語音模型,以及能即時生成對話內容的大型語言模型。Supertone模型在過去一週內獲得超過42.5萬次下載,顯示業界對高品質AI語音的需求正在爆發。
技術拆解:AI DJ如何運作?
要理解AI DJ為什麼能成功,我們得先拆解它的技術架構。這不是單一AI模型就能完成的事,而是多個AI系統協同作戰的成果。
1. 語音合成層:從「機械聲」到「有溫度」
過去,電腦語音總是帶著明顯的「電子味」,聽久了讓人煩躁。但2026年的語音合成技術已經完全不同。以Supertone/supertonic-3這類模型為例,它支援ONNX格式,能在低延遲的邊緣設備上運行,生成的聲音不僅自然,還能加入情緒、停頓、甚至呼吸聲。
美國這家電台使用的系統,甚至能針對不同時段調整語氣——早晨時段用活潑輕快的聲音,深夜時段則轉為低沉溫柔的語調。這種情境感知能力,是傳統預錄節目無法比擬的。
2. 內容生成層:不只是播歌
AI DJ的核心競爭力在於即時內容生成。當系統決定播放一首歌時,它會先從資料庫中提取這首歌的相關資訊——發行年份、創作背景、歌手趣聞——然後用大型語言模型生成一段30秒到1分鐘的介紹。
更厲害的是,它能根據聽眾互動即時調整。如果有人在社群平台上留言說「這首歌讓我想起初戀」,AI DJ可能會在下一段補充:「剛剛有聽眾說這首歌讓他想起初戀,其實這首歌的詞作者當初也是因為分手才寫下這首歌⋯⋯」這種自然的人機互動,大幅提升了聽眾的參與感。
3. 排程與分析層:數據驅動的選歌
傳統電台的選歌權力通常掌握在少數資深DJ手中,他們憑經驗和直覺決定播放清單。AI系統則完全顛覆了這個模式。它會分析即時收聽數據——哪首歌播完後聽眾轉台了?哪個時段的留言量最高?甚至能比對天氣、交通狀況和新聞事件,動態調整音樂風格。
舉例來說,如果某天下午突然下起大雨,系統會自動降低播放快節奏舞曲的比例,轉而選擇抒情或輕音樂,因為數據顯示下雨天聽眾更傾向於平靜的音樂。
成本與效益:一場精明的商業算計
對廣播業者來說,導入AI DJ最直接的誘因就是成本。美國這家電台公開的數據顯示:
- 人力成本:原本一個頻道需要6名全職DJ輪班,年薪總支出約為120萬美元
- 導入AI後:僅需保留1名節目總監負責監督AI輸出,年薪約15萬美元
- 節省幅度:87.5%的人力成本
但成本節省只是表面。更深層的效益來自營運彈性。傳統電台最頭痛的問題之一是「空窗時段」——凌晨3點到早上6點這段時間,聽眾最少,但你不能不播節目。AI DJ可以24小時不間斷運作,而且邊際成本接近為零。
更重要的是,廣告收益不降反升。為什麼?因為AI系統能精準計算廣告時段。它會分析聽眾的收聽行為,在聽眾最不容易轉台的時機插入廣告,並根據廣告內容調整前後的音樂風格。例如,在播放汽車廣告前,先播一首與駕駛相關的歌曲,提高廣告的關聯性和記憶度。
香港與台灣:在地化的挑戰與機會
這股AI DJ浪潮已經開始影響華語市場。台灣的Hit Fm聯播網和香港的商業電台,都在2025年底到2026年初進行了小規模的AI DJ測試。
但華語市場有個獨特的挑戰:語言的多樣性。香港聽眾習慣粵語、台灣聽眾習慣國語,而且兩地都有大量使用英語和外來語的習慣。AI模型必須能流暢地在多種語言之間切換,甚至理解「港式粵語」和「台式國語」中的在地俚語和語氣。
目前市場上最好的華語AI語音模型,仍無法完全達到人類DJ的自然程度。例如,台灣聽眾喜愛的「台語穿插國語」風格,AI系統常常會出現語調不自然的問題。香港的「粵語中夾雜英文單詞」更讓多數模型卡關。
不過,Supertone/supertonic-3這類模型的出現,正在快速縮小這個差距。它支援多語言混合輸出,並且能透過微調來學習特定主持人的語氣風格。有業者預測,2027年之前,AI DJ在華語市場的表現將達到「難以分辨」的水準。
聽眾真的買單嗎?
這是所有人最關心的問題。從美國的案例來看,答案是:多數聽眾不在乎,甚至更喜歡。
該電台在導入AI DJ三個月後進行的聽眾調查顯示:
- **68%**的聽眾表示「沒有注意到DJ換人了」
- **22%**的聽眾「覺得節目變得更流暢了」
- 僅有**10%**的聽眾表示「懷念真人DJ」
這些數據顛覆了傳統廣播界的認知。原來,聽眾真正在乎的是音樂好不好聽、節目流不流暢、有沒有共鳴,而不是DJ是不是真人。
但也有反對的聲音。一位在台灣電台工作超過20年的資深DJ告訴我們:「AI可以模仿語氣,但它沒有真實的人生經歷。當一個聽眾打電話進來說他失戀了,AI能給出真正的安慰嗎?它只能從資料庫中提取『最相關』的回應,但那不是真正的同理心。」
未來的聲音:混合模式才是王道
綜合各方分析,我們認為純AI電台和純真人電台都不是終點。真正的贏家,會是那些懂得混合運用的業者。
具體來說,未來的電台可能會是這樣的模式:
- 尖峰時段(早上7-9點、晚上5-8點):由真人DJ主持,因為這時段聽眾互動需求最高,真人DJ能創造「陪伴感」
- 離峰時段(深夜、下午):交給AI DJ,確保節目不間斷,同時節省人力成本
- 特殊節目(專訪、call-in):保留給真人,因為這些需要即時的創意和情感判斷
- 音樂時段:完全交給AI排程,因為數據分析遠比人類直覺更準確
這種混合模式,既能保留廣播節目的「人性溫度」,又能享受AI帶來的效率和數據優勢。對香港和台灣的中小型電台來說,這可能是在串流平台和Podcast夾擊下生存的唯一出路。
延伸閱讀
- SoftBank砸75億美元撐腰:Exol用機器人物流即服務顛覆美國倉儲業,亞特蘭大首站年發百萬棧板
- 六成員工看不出AI錯誤:「認知投降」正在侵蝕企業的判斷能力
- Samsara實證物理AI威力:車隊成本削31%、事故少一半
給業者的建議:現在就開始準備
如果你正在經營一個電台或音頻內容平台,現在就該開始思考AI策略。以下是我們從這個案例中提煉出的具體行動建議:
- 不要全面取代,而是逐步導入:先從凌晨時段或假日時段開始測試,讓聽眾慢慢適應
- 投資在地化語音模型:不要直接套用英語模型,要針對粵語或國語進行微調
- 建立監督機制:AI輸出內容需要有人類編輯審核,特別是涉及新聞和敏感話題時
- 保留真人特色:不要讓AI模仿所有DJ,而是讓AI負責「搬磚」的工作,真人DJ專注在「創作」上
- 收集數據:AI最大的價值不是取代人,而是產生數據。這些數據可以反饋給真人DJ,幫助他們做出更好的內容決策
AI DJ不是來搶走廣播人的飯碗,而是來重新定義這個飯碗的形狀。那些懂得擁抱工具的人,將會在新的聲音時代中,找到更大的舞台。