Anthropic意外洩露「Claude Mythos」模型：號稱AI能力「階段性飛躍」，網路安全風險引發全球關注

人工智慧安全公司Anthropic本週陷入一場始料未及的風波——一個未加密的公開資料庫意外曝光了近三千份未發布文件，其中包含該公司正在秘密測試的全新AI模型「Claude Mythos」的詳細資料。這款代號同時被稱為「Capybara」的模型，被Anthropic內部文件描述為一次「階段性飛躍」（step change），其能力遠超目前最強的Claude Opus 4.6，引發了業界和資安社群的高度關注。

這次洩露事件由LayerX Security的安全研究員Roy Paz與劍橋大學的Alexandre Pauwels各自獨立發現。兩人在Anthropic的內容管理系統中找到了一個可公開搜索的資料存儲區，其中包含一篇尚未發布的部落格草稿，明確提到Claude Mythos在軟體程式碼編寫、學術推理和網路安全等領域的測試成績「大幅領先」所有前代模型。Anthropic發言人隨後證實，Mythos確實是該公司「迄今為止打造的最強模型」，目前已進入早期客戶試用階段。

然而，真正令業界震動的是洩露文件中關於網路安全風險的警告。Anthropic的內部評估指出，Mythos「目前在網路攻擊能力方面遠遠領先於任何其他AI模型」，能夠快速發現並利用軟體漏洞，其速度可能遠超防禦者的修補能力。文件更警告，這款模型「預示著一波能以遠超防禦者速度利用漏洞的模型浪潮即將到來」。這一發現讓長期關注AI安全的專家們深感憂慮，擔心攻防平衡可能因此被徹底打破。

從市場定位來看，Mythos代表的「Capybara」層級將超越現有的Opus產品線，成為Anthropic旗下最高階的AI模型。這意味著AI模型的能力天花板正在被進一步推高，也讓圍繞AI治理和監管的討論更加迫切。消息傳出後，比特幣價格隨軟體類科技股同步下挫，市場顯然對這種「不受控的能力躍升」充滿不安。

Anthropic在得知洩露後迅速關閉了公開存取權限，並將曝光的文件定性為「曾考慮發布的早期草稿」。但對於一家以AI安全為核心使命的公司而言，這次由配置錯誤導致的資料外洩無疑是一個諷刺性的教訓。接下來，外界將密切關注Mythos的正式發布時間表、Anthropic將採取何種安全護欄措施，以及各國監管機構是否會因此加速推進AI能力上限的立法討論。

🔍 搜尋文章

📬 每週 AI 精選

Anthropic意外洩露「Claude Mythos」模型：號稱AI能力「階段性飛躍」，網路安全風險引發全球關注

相關文章

Oracle裁員三萬人換押AI：清晨六點一封信，矽谷巨頭的豪賭與代價

Perplexity AI遭集體訴訟：被控暗中將用戶對話數據分享給Meta與Google

SpaceX 秘密申請 IPO：合併 xAI 後估值飆至 1.75 兆美元，改寫史上最大上市紀錄