人工智慧安全公司Anthropic本週陷入一場始料未及的風波——一個未加密的公開資料庫意外曝光了近三千份未發布文件,其中包含該公司正在秘密測試的全新AI模型「Claude Mythos」的詳細資料。這款代號同時被稱為「Capybara」的模型,被Anthropic內部文件描述為一次「階段性飛躍」(step change),其能力遠超目前最強的Claude Opus 4.6,引發了業界和資安社群的高度關注。

這次洩露事件由LayerX Security的安全研究員Roy Paz與劍橋大學的Alexandre Pauwels各自獨立發現。兩人在Anthropic的內容管理系統中找到了一個可公開搜索的資料存儲區,其中包含一篇尚未發布的部落格草稿,明確提到Claude Mythos在軟體程式碼編寫、學術推理和網路安全等領域的測試成績「大幅領先」所有前代模型。Anthropic發言人隨後證實,Mythos確實是該公司「迄今為止打造的最強模型」,目前已進入早期客戶試用階段。

然而,真正令業界震動的是洩露文件中關於網路安全風險的警告。Anthropic的內部評估指出,Mythos「目前在網路攻擊能力方面遠遠領先於任何其他AI模型」,能夠快速發現並利用軟體漏洞,其速度可能遠超防禦者的修補能力。文件更警告,這款模型「預示著一波能以遠超防禦者速度利用漏洞的模型浪潮即將到來」。這一發現讓長期關注AI安全的專家們深感憂慮,擔心攻防平衡可能因此被徹底打破。

從市場定位來看,Mythos代表的「Capybara」層級將超越現有的Opus產品線,成為Anthropic旗下最高階的AI模型。這意味著AI模型的能力天花板正在被進一步推高,也讓圍繞AI治理和監管的討論更加迫切。消息傳出後,比特幣價格隨軟體類科技股同步下挫,市場顯然對這種「不受控的能力躍升」充滿不安。

Anthropic在得知洩露後迅速關閉了公開存取權限,並將曝光的文件定性為「曾考慮發布的早期草稿」。但對於一家以AI安全為核心使命的公司而言,這次由配置錯誤導致的資料外洩無疑是一個諷刺性的教訓。接下來,外界將密切關注Mythos的正式發布時間表、Anthropic將採取何種安全護欄措施,以及各國監管機構是否會因此加速推進AI能力上限的立法討論。