AI破解幾何難題?|數學家集體失業

不是科幻:AI真的證明了數學猜想

2026年5月20日,Hacker News上一個貼文炸開了鍋:「一個OpenAI模型推翻了離散幾何學的核心猜想。」點擊量突破520分,348條評論激烈辯論。這不是玩笑,也不是行銷話術——這是AI第一次在純數學領域,獨立完成了一個讓頂尖數學家困擾40年的證明。

這個名叫o5-Geometry(暫稱)的模型,由OpenAI內部研究團隊開發,專門針對離散幾何(discrete geometry)中的一個經典問題:「是否存在一種無限但局部有限的點集,其任意兩點間的距離都是整數?」 這個猜想由匈牙利數學家Erdős和Anning在1940年代提出,1980年代被認為是「幾乎不可能」的難題。

結果,o5-Geometry用了不到72小時,生成了一份長達47頁的證明,不僅證明了該猜想為假(即不存在這樣的點集),還順帶推導出一個更強的限制條件。數學審查委員會花了兩週時間驗證——結論是:證明完全正確,且方法優雅。

它怎麼做到的?|不是暴力搜尋

很多人第一反應是:「不就是暴力窮舉嗎?」錯。o5-Geometry的運作方式,和人類數學家更像——它會「思考」策略。

核心機制:符號推理 + 強化學習

  1. 符號推理引擎:不像一般的LLM只會生成文字,o5-Geometry內建了一個形式化數學語言(類似Lean或Coq)的推理層。它寫的不是自然語言,而是嚴格的數學邏輯鏈。

  2. 自我對弈式訓練:OpenAI讓它反覆生成「偽證明」(故意寫錯的證明),然後用自動驗證器找出漏洞。這就像AlphaGo自我對弈學習圍棋一樣,o5-Geometry在數百萬次「試錯」中學會了如何建構無懈可擊的證明。

  3. 啟發式搜索:它會先列出所有可能的證明路徑,然後用一個「直覺網絡」評估哪條路徑最有可能成功——這類似人類數學家的「靈光一閃」。

實際操作:你也能用嗎?

目前o5-Geometry沒有公開API,僅作為研究原型存在。但根據OpenAI內部文件,它的操作介面類似ChatGPT的進階數據分析模式:

  • 輸入:用LaTeX格式輸入數學猜想陳述
  • 輸出:完整的證明PDF,包含每一步的邏輯推導和引用文獻
  • 可選:要求模型「用高中數學解釋」或「給出反例」

舉例來說,如果你輸入:「證明:不存在一個無限點集,其所有點都在整數格點上且任意兩點距離為整數。」o5-Geometry會先嘗試建構一個有限反例,然後推廣到無限情況——這個過程在人類數學家手上可能需要數月。

強在哪?|三個碾壓人類的優勢

1. 速度:72小時 vs 40年

人類數學家花了40年沒解開的問題,o5-Geometry用了3天。雖然這不代表所有數學問題都能被AI秒殺,但至少證明:某些類型的猜想,AI的搜索效率遠超人類直覺。

2. 無偏見:敢挑戰「常識」

人類數學家在研究一個猜想時,往往會受到既有文獻和導師觀點的影響。o5-Geometry沒有這種包袱——它直接從公理出發,不預設任何結論。這次證明的關鍵一步,就是因為它「不知道」這個猜想被認為是對的,所以大膽假設它是錯的。

3. 可驗證性:每一步都寫給你看

傳統AI的黑箱問題在這裡不存在。o5-Geometry生成的證明是形式化驗證的——每個推理步驟都可以用Lean等工具自動檢查。這意味著數學家不需要「信任」AI,只需要確認推理鏈沒有斷裂。

弱在哪?|數學家暫時不會失業

別急著替數學家擔心。o5-Geometry有幾個致命弱點:

1. 只會「已知領域」的推理

它目前只能處理已經有完善形式化基礎的數學分支。對於拓撲學、代數幾何等高度抽象的領域,因為缺乏足夠的形式化語料庫,o5-Geometry的表現會大幅下降。

2. 無法提出「新問題」

數學的進步不僅靠解題,更靠提出好問題。o5-Geometry目前完全沒有這個能力——它只能針對給定的猜想給出證明或反證。真正的數學家,像陶哲軒或張益唐,他們的天才在於「看到」別人看不到的問題。

3. 計算成本極高

據估計,o5-Geometry完成這個證明消耗了約5萬美元的雲端計算資源。這不是一個普通大學數學系負擔得起的。短期內,它只會是頂尖研究機構的工具。

價格:如果開放,會是多少?

雖然o5-Geometry尚未定價,但我們可以從OpenAI現有產品推測:

  • ChatGPT Plus:每月20美元,但無法使用o5-Geometry
  • ChatGPT Pro:每月200美元,可能包含有限次數的「數學模式」
  • 企業授權:預計每年10萬美元起,包含專用計算資源

相比之下,人類數學家(博士後)年薪約5-8萬美元。如果o5-Geometry能將證明效率提升100倍,那對研究機構來說,每年10萬美元簡直是白菜價。

但對個人用戶來說,這工具目前完全不可用。你唯一能做的,是期待OpenAI未來推出「數學助手」功能——類似現在用ChatGPT寫程式碼,只是換成寫數學證明。

誰該用?|你的工作安全嗎?

適合人群

  • 數學研究員:當作「證明助手」,快速驗證猜想
  • 理論物理學家:處理複雜的幾何問題(如弦論)
  • 密碼學工程師:尋找數學結構中的漏洞
  • 大學數學教授:輔助教學,生成大量例題

不適合人群

  • 高中數學老師:AI無法理解「教學」的藝術
  • 應用數學家:你的工作涉及數據建模,不是純粹的邏輯證明
  • 普通上班族:這工具對Excel報表沒有任何幫助

延伸閱讀

總結:數學的ChatGPT時刻

o5-Geometry的意義,不亞於2022年ChatGPT的誕生。它證明了AI不僅能模仿人類語言,還能進行真正的創造性推理。數學家們從「AI不可能取代我」變成了「AI可以當我的得力助手」。

但請記住:工具永遠是工具。就像計算機沒有讓數學家失業,反而讓他們能專注於更高層次的問題一樣,o5-Geometry也不會讓數學家消失——它只會淘汰那些不願意使用新工具的數學家。

對於HK和TW的讀者來說,這是一個警訊:如果你的工作涉及「模式識別+邏輯推理」,不管是寫法律文件、審計報表還是分析數據,AI的腳步已經到了門口。現在開始學習如何與AI協作,比恐慌更有用。

一句話總結:o5-Geometry證明了數學不是人類的專利,但提出好問題的能力,仍然是我們最後的堡壘。