一位 23 歲的業餘玩家,用一個 ChatGPT 提示詞,破解了世界級數學家努力數十年未能解決的數學猜想。

Liam Price 沒有高階數學訓練背景,沒有博士學位,甚至沒有正式的大學數學教育。他有的是每個月 200 美元的 ChatGPT Pro 訂閱,以及一個閒來無事的週一下午。

結果呢?他讓整個數學界重新思考——AI 到底能在深層推理中扮演什麼角色。

這不只是另一個「AI 突破」的故事。這是人類集體思維盲區被一台語言模型照亮的故事。

60 年無人解開的謎題

故事要從一位傳奇數學家說起。

Paul Erdős 是 20 世紀最 prolific 的數學家之一,足跡遍佈全球,與數百位學者合作,留下了超過 1,500 篇論文。他生前提出了大量猜想——後人稱之為「Erdős 問題」——這些問題從基礎到深奧,涵蓋數論、組合學、機率論等多個領域。

其中一個特別的問題,圍繞著他所謂的「原始集」(primitive sets)。

原始集的定義看似簡單:一個整數集合,其中沒有任何一個數可以整除另一個數。舉例來說,{2, 3, 5} 就是一個原始集,因為 2、3、5 彼此不能整除對方。任何質數集合自動就是原始集——這是質數的天然屬性。

Erdős 提出了一個叫做「Erdős 和」的評分方式,用來量化一個原始集的「大小」。他證明了任何原始集的最大分數大約是 1.6。但真正困擾數學界的,是他關於最小分數的猜想:當集合中的所有數都趨近於無限大時,這個分數的下限應該是 1。

這個問題被標記為 Erdos 問題 #1196。

六十年來,一些頂尖數學家嘗試過。他們從某個共同的起點開始推理——建立一個標準的證明框架。但所有人都卡在同一個地方。他們集體「在第一步就拐錯了彎」,UCLA 數學家陶哲軒(Terence Tao)後來如此形容。

2022 年,史丹佛大學數學家 Jared Lichtman 在他博士論文的第一部分成功證明了 Erdős 關於最大分數的猜想。但他也嘗試了第二部分——最小分數的下限問題——卻像所有前輩一樣碰了壁。

這個問題就這樣懸而未決,直到一個 23 歲的年輕人打開了 ChatGPT。

一個提示詞,一條新思路

「我當時不知道那是什麼問題,」Price 回憶。「我只是像平常一樣,把 Erdős 問題丟給 AI,看它能生出什麼東西來。」

這不是 Price 第一次這麼做。他和劍橋大學數學系二年級本科生 Kevin Barreto 在去年底就開始了一種他們稱之為「vibe mathing」(氛圍式數學)的實驗:把隨機選取的 Erdős 公開問題貼給免費版 ChatGPT,看看結果。這個舉動意外引發了一波「AI 解數學難題」的熱潮。

一位 AI 研究員看到他們的實驗後,贊助了兩人各一份 ChatGPT Pro 訂閱,鼓勵他們繼續玩下去。

於是,在 2026 年 4 月中旬的某個週一下午,Price 把問題 #1196 輸入進了 GPT-5.4 Pro 的對話框。他給的提示詞只有一個——就是問題本身的描述。幾分鐘後,ChatGPT 吐出了一個看起來可行的解答。

「看起來像是正確的解法,」Price 說。但他自己無法完全確認——畢竟他不是專業數學家。他把結果傳給了 Barreto。

Barreto 看完之後察覺到不對勁:「這東西……是認真的嗎?」

他立刻聯繫了 Lichtman 和陶哲軒等專業人士。專家們審視後的反應是一致的震驚:ChatGPT 用了一條所有人從未想過的路徑。

「每個研究過這個問題的人,都會從一個標準的推導序列開始,」陶哲軒解釋。「但這個 LLM 走了完全不同的路線——它用了一個在數學其他領域廣為人知的公式,但從來沒有人想過可以應用在這裡。」

根據 Scientific American 的報導,Lichtman 回憶他收到解答時的感受:「ChatGPT 原始輸出的證明品質其實很差。需要一個專家來篩選、理解它真正想表達的意思。」但正是這個「不太完美的原始輸出」中,藏著關鍵的洞察——一個人類集體忽略的捷徑。

人類的盲區,AI 的突破

為什麼六十年的頂尖數學家都沒有想到這個方法?

陶哲軒的分析一針見血:「這個問題可能比大家想的要簡單,關鍵在於存在某種集體的心理障礙。」

這種現象在數學史上並不罕見。一個經典的例子是高斯解決正十七邊形尺規作圖的故事——當時人們認為這是不可能的,直到高斯換了一個角度看問題。人類的大腦容易陷入「專業慣性」:越是熟悉某個領域,越容易用固定的思維模式來解題。

ChatGPT 沒有這種慣性。它不會「知道」這個問題很難,不會受之前失敗嘗試的影響,不會受到學術權威暗示的約束。它只是從海量的訓練資料中檢索出相關公式,然後按邏輯推演。

「我們發現了一種思考大數字及其結構的全新方式,」陶哲軒說。他和 Lichtman 後續將 ChatGPT 的原始證明壓縮精煉成更簡潔的形式,最重要的是保留了 LLM 的關鍵洞察——那個所有人都錯過的切入點。

Lichtman 則從另一個角度感到振奮:「我從研究所時期就有一種直覺——這些問題在某種程度上是彼此關聯的,存在某種統一的脈絡。這個新方法真的印證了那種直覺。」

AI 解數學題,有什麼不一樣?

你可能會問:AI 解決數學難題有什麼了不起?不是已經有很多新聞了嗎?

確實,過去一年裡媒體報導了不少「AI 破解數學難題」的消息。但學術界對這些成果的評價向來謹慎。原因有三:

第一,難度差異巨大。 所謂的 Erdos 問題涵蓋了從中學代數到博士級研究的廣泛難度範圍。有些問題只需要基本的數學直覺就能解決,有些則需要極深的專業知識。媒體報導時常常混為一談。

第二,原創性存疑。 早期許多所謂的「AI 解決方案」事後被發現只是重現了已知的證明方法,或者是在訓練資料中已經存在的解答。用陶哲軒的話來說:「它們看起來很新,但其實只是把已有的知識重新組合。」

第三,缺乏可推廣性。 即使 AI 成功解決了某個特定的數學問題,它的方法往往無法應用到其他領域。這與人類數學家的發現不一樣——人類的一個突破性思路常常能解開一大類問題。

這次不一樣的地方,在於 ChatGPT 使用了一個完全原創的數學連接——把一個在其他領域廣為人知的公式,應用到了一個從未被考慮過的場景。這不是死記硬背,而是真正的跨域類比推理。

「它提出了人類從未想到的連接方式,」陶哲軒謹慎但樂觀地評價。「這是一個不錯的成就。至於長期的意義,現在還言之過早。」

質疑與警惕:AI 的數學能力到底到哪了?

當然,科學界對這個突破也抱持著審慎態度。

Lichtman 反覆強調 ChatGPT 原始輸出的不完美:「如果沒有專家的介入,那些證明草稿很可能被當成垃圾丟掉。」換句話說,AI 提出了正確的方向,但人類數學家才是完成最後一哩路的人。

這和 AI 在其他領域的表現驚人地相似——AI 擅長「發現」,但尚不擅長「證明」。 在程式設計中,AI 能快速產生可運行的程式碼,但需要人類工程師來確保安全性、可維護性和正確性。在醫療診斷中,AI 能給出可能的疾病判斷,但最終的診斷仍然需要醫生確認。

更進一步地說,陶哲軒指出目前 AI 解決的 Erdos 問題仍然屬於「有限範圍」的挑戰。真正的數學創造力——比如建立全新的理論體系、發明前所未有的數學工具——還遠遠超出當前模型的能力。

Price 本人對此也有清醒的認識:「我只是個業餘玩家。真正的價值在於,專業數學家可以從 AI 的輸出中獲得靈感,看到他們自己看不到的可能性。」

把 AI 定位成「靈感生成器」而非「解決方案生成器」,或許是更現實的期待。

對台灣數學教育與 AI 發展的啟示

這個故事對台灣的影響,不只在於數學領域。

對教育體系來說,Price 的案例挑戰了「數學能力 = 正式訓練程度」的傳統認知。一名 23 歲、沒有高等數學教育的年輕人,靠著對問題的好奇心和一台 AI 工具,做到了世界級數學家沒做到的事。這意味著,未來數學研究和發現的門檻正在大幅降低——不是不需要專業知識,而是專業知識的獲取和應用方式正在改變。

台灣的數學教育長期以考試導向為主,強調解題技巧和公式記憶。但如果 AI 能夠承擔大量的機械化計算和理論推導,學生的價值應該轉向哪裡?問題意識、跨域連結、創新思考——這些才是人類相對於 AI 的競爭優勢。

對 AI 產業發展來說,這次事件提供了一個很好的思考案例:AI 的能力邊界在哪裡?ChatGPT 能做到的,不是取代數學家,而是提供一個「沒有偏見」的思維夥伴。它不受人類慣性、權威壓力和失敗經驗的影響,因此能看到人類集體忽略的可能性。

台灣的 AI 新創和學術單位,可以從中得到一個重要的產品方向:不是追求「AI 取代專家」,而是開發「AI 啟發專家」的工具。 這種協作模式——AI 負責提出假設和方向,人類負責驗證和深化——可能是未來知識工作最有效率的協作方式。

數學家們的下一步

Lichtman 現在正和陶哲軒合作,探索 ChatGPT 這個新方法能否應用到其他未解決的 Erdos 問題上。他們已經找到了幾個可能的候選問題——那些長期被困在相同思維框架中的經典難題。

「我有一種直覺,這些問題是彼此關聯的,」Lichtman 說。「如果這個方法是對的,它應該能解開更多東西。」

對陶哲軒來說,這件事更重要的意義在於它改變了他看待 AI 的方式:「之前我認為 AI 在數學上的貢獻主要集中於計算和搜尋——找反例、驗證假設。但這個案例告訴我,AI 也能在概念層面提出新東西。」

他並不急於宣稱 AI 已經掌握了數學創造力。但他確實認為,AI 開始展現出一種有用的能力:幫助人類打破集體思維的框架。

「長期來看,真正的問題不是 AI 能不能做數學,而是我們人類願不願意接受『AI 可以啟發我們』這件事,」他說。

也許到頭來,ChatGPT 在這次事件中做的最重要的事,不是解決了一個 60 年難題——而是向我們展示,很多時候我們之所以解不開問題,是因為我們從未想過可以那樣思考。

那是一種不帶偏見、不受慣性束縛、不怕犯錯的思考方式。而這,恰好是人類最能從 AI 身上學到的東西。