今日,一個名為 Libretto 的開源專案在技術社群 Hacker News 上迅速竄升,獲得超過 60 個點讚與 21 則深度討論。它直指當前 AI 應用的一個核心痛點:基於大型語言模型(LLM)的瀏覽器自動化工具,其行為往往不可預測、充滿隨機性。Libretto 宣稱能為 AI 自動化腳本帶來「確定性」(Deterministic)執行,確保每次運行結果一致。這不僅是開發者社群的技術討論,更可能掀起企業流程自動化(RPA)與數據獲取領域的一場寧靜革命。
從「概率執行」到「確定性執行」:AI 自動化的關鍵進化
當前,許多先進的瀏覽器自動化工具(如 Playwright、Cypress 結合 AI 代理)依賴 LLM 來理解網頁結構並執行操作。然而,LLM 的本質是生成式、概率性的。這導致了令人沮喪的現實:同一個自動化任務,今天可能完美運行,明天卻因 AI 對按鈕標籤的細微理解差異而失敗;或是點擊了相似但錯誤的元素。這種不穩定性,讓企業在部署關鍵業務流程自動化時心存疑慮,也讓數據爬取專案的維護成本高昂。
Libretto 的核心創新,在於它試圖將 LLM 的「智能」與傳統自動化工具的「精確」相結合。根據其專案描述與社群討論,Libretto 可能透過以下方式實現確定性:
- 結構化網頁理解:不僅依賴 LLM 的自然語言理解,更深度解析網頁的 DOM 結構與可訪問性樹,為每個互動元素生成唯一、穩定的識別符號。
- 意圖與執行的分離:由 LLM 負責高階的「任務意圖」解析(例如:「將商品加入購物車」),但將具體的「執行路徑」(例如:點擊哪個確切的按鈕)交由確定性引擎,根據預先定義的穩定規則來映射。
- 狀態追蹤與回滾:在自動化流程中持續監控網頁狀態,一旦偵測到偏離預期路徑,能自動回滾到上一個穩定狀態並重試確定性操作,而非任由 AI 自由發揮。
這項技術若趨於成熟,意味著企業可以編寫一次 AI 自動化腳本,就能在數月甚至數年內穩定運行,無需因網頁的輕微改版而頻繁調整。對於電商價格監控、金融數據抓取、跨系統數據填報等應用,其可靠性將大幅提升。
對港台企業的實戰啟示:RPA 成本下降與合規數據獲取
對於香港與台灣的企業,尤其是金融科技、電商、跨境貿易與中小型製造業,Libretto 所代表的技術方向具有明確的實用價值。
首先,是降低企業流程自動化(RPA)的門檻與總持有成本。 目前,導入傳統 RPA 方案(如 UiPath、Blue Prism)成本高昂,且對非結構化網頁介面的處理仍顯笨拙。而基於 AI 的輕量級自動化工具雖靈活,卻有上述的不可靠問題。Libretto 若能解決確定性問題,將使企業內部 IT 團隊或甚至業務部門,能以更低成本開發出穩定可靠的自動化流程,用於客戶資料更新、報表生成、內部系統整合等場景。
其次,是合規且高效的數據獲取(Web Scraping)。 港台許多企業需要監測競爭對手價格、追蹤市場趨勢、或聚合公開的財經資訊。傳統爬蟲易因網站反爬機制或版面更新而失效,而手動收集則效率低下。一個具有確定性行為的 AI 自動化工具,可以在遵守 robots.txt 等規範的前提下,更優雅、更擬人且更穩定地獲取公開數據,減少法律風險與維護負擔。
案例思考:一家台灣本土電商,需要每日監測三大國際平台(如 Amazon、eBay)上特定商品的價格與促銷資訊。使用現有工具,可能需要專人處理頻繁的腳本錯誤。若採用具確定性的 AI 自動化方案,可設定排程後即穩定運行,將人力轉向更具策略性的價格分析與市場反應。
開源浪潮下的機會與觀測點
Libretto 以開源專案之姿出現,符合當前 AI 基礎設施工具開源化的趨勢。這為港台的技術團隊與新創公司帶來了兩層機會:一是直接採用與貢獻,將其整合到自身的產品或解決方案中,快速增強自動化能力;二是洞察其背後的技術原理,思考如何應用於垂直領域,例如開發針對金融業合規報表抓取、或製造業供應商門戶數據同步的專用工具。
然而,這項技術仍處於早期階段。Hacker News 上的評論也提出關鍵質疑:在面對極度動態、大量使用 JavaScript 框架(如 React, Vue)構建的單頁應用程式(SPA)時,Libretto 的「確定性」承諾能否依然兌現?其性能與擴展性如何?這些都是需要持續觀測的技術節點。
對於企業決策者與技術負責人而言,下一步的行動不是立即遷移,而是開始關注:
- 概念驗證(PoC):可以嘗試用 Libretto 這類工具,針對一個非關鍵但重複性高的內部流程進行小規模測試,評估其穩定性和開發效率。
- 技能儲備:讓團隊開始熟悉「AI 驅動的自動化」這一融合領域,理解其潛力與限制。
- 供應商動向:關注主流 RPA 廠商與雲端平台(如 Microsoft Power Automate、Google Cloud)如何回應此一開源創新,是否會快速整合類似技術。
Libretto 的崛起,象徵著 AI 應用正從「展示驚艷能力」的階段,邁向「提供穩定、可信賴服務」的深水區。當 AI 自動化變得可預測,它才能真正融入企業的核心運營,釋放出生產力變革的巨大量能。這場始於開發者社群的討論,終將影響每一家追求效率的現代企業。