23 歲業餘玩家用 ChatGPT 解開困擾數學界 60 年的 Erdos 難題

一位 23 歲的業餘玩家，用一個 ChatGPT 提示詞，破解了世界級數學家努力數十年未能解決的數學猜想。

Liam Price 沒有高階數學訓練背景，沒有博士學位，甚至沒有正式的大學數學教育。他有的是每個月 200 美元的 ChatGPT Pro 訂閱，以及一個閒來無事的週一下午。

結果呢？他讓整個數學界重新思考——AI 到底能在深層推理中扮演什麼角色。

這不只是另一個「AI 突破」的故事。這是人類集體思維盲區被一台語言模型照亮的故事。

60 年無人解開的謎題

故事要從一位傳奇數學家說起。

Paul Erdős 是 20 世紀最 prolific 的數學家之一，足跡遍佈全球，與數百位學者合作，留下了超過 1,500 篇論文。他生前提出了大量猜想——後人稱之為「Erdős 問題」——這些問題從基礎到深奧，涵蓋數論、組合學、機率論等多個領域。

其中一個特別的問題，圍繞著他所謂的「原始集」（primitive sets）。

原始集的定義看似簡單：一個整數集合，其中沒有任何一個數可以整除另一個數。舉例來說，{2, 3, 5} 就是一個原始集，因為 2、3、5 彼此不能整除對方。任何質數集合自動就是原始集——這是質數的天然屬性。

Erdős 提出了一個叫做「Erdős 和」的評分方式，用來量化一個原始集的「大小」。他證明了任何原始集的最大分數大約是 1.6。但真正困擾數學界的，是他關於最小分數的猜想：當集合中的所有數都趨近於無限大時，這個分數的下限應該是 1。

這個問題被標記為 Erdos 問題 #1196。

六十年來，一些頂尖數學家嘗試過。他們從某個共同的起點開始推理——建立一個標準的證明框架。但所有人都卡在同一個地方。他們集體「在第一步就拐錯了彎」，UCLA 數學家陶哲軒（Terence Tao）後來如此形容。

2022 年，史丹佛大學數學家 Jared Lichtman 在他博士論文的第一部分成功證明了 Erdős 關於最大分數的猜想。但他也嘗試了第二部分——最小分數的下限問題——卻像所有前輩一樣碰了壁。

這個問題就這樣懸而未決，直到一個 23 歲的年輕人打開了 ChatGPT。

一個提示詞，一條新思路

「我當時不知道那是什麼問題，」Price 回憶。「我只是像平常一樣，把 Erdős 問題丟給 AI，看它能生出什麼東西來。」

這不是 Price 第一次這麼做。他和劍橋大學數學系二年級本科生 Kevin Barreto 在去年底就開始了一種他們稱之為「vibe mathing」（氛圍式數學）的實驗：把隨機選取的 Erdős 公開問題貼給免費版 ChatGPT，看看結果。這個舉動意外引發了一波「AI 解數學難題」的熱潮。

一位 AI 研究員看到他們的實驗後，贊助了兩人各一份 ChatGPT Pro 訂閱，鼓勵他們繼續玩下去。

於是，在 2026 年 4 月中旬的某個週一下午，Price 把問題 #1196 輸入進了 GPT-5.4 Pro 的對話框。他給的提示詞只有一個——就是問題本身的描述。幾分鐘後，ChatGPT 吐出了一個看起來可行的解答。

「看起來像是正確的解法，」Price 說。但他自己無法完全確認——畢竟他不是專業數學家。他把結果傳給了 Barreto。

Barreto 看完之後察覺到不對勁：「這東西……是認真的嗎？」

他立刻聯繫了 Lichtman 和陶哲軒等專業人士。專家們審視後的反應是一致的震驚：ChatGPT 用了一條所有人從未想過的路徑。

「每個研究過這個問題的人，都會從一個標準的推導序列開始，」陶哲軒解釋。「但這個 LLM 走了完全不同的路線——它用了一個在數學其他領域廣為人知的公式，但從來沒有人想過可以應用在這裡。」

根據 Scientific American 的報導，Lichtman 回憶他收到解答時的感受：「ChatGPT 原始輸出的證明品質其實很差。需要一個專家來篩選、理解它真正想表達的意思。」但正是這個「不太完美的原始輸出」中，藏著關鍵的洞察——一個人類集體忽略的捷徑。

人類的盲區，AI 的突破

為什麼六十年的頂尖數學家都沒有想到這個方法？

陶哲軒的分析一針見血：「這個問題可能比大家想的要簡單，關鍵在於存在某種集體的心理障礙。」

這種現象在數學史上並不罕見。一個經典的例子是高斯解決正十七邊形尺規作圖的故事——當時人們認為這是不可能的，直到高斯換了一個角度看問題。人類的大腦容易陷入「專業慣性」：越是熟悉某個領域，越容易用固定的思維模式來解題。

ChatGPT 沒有這種慣性。它不會「知道」這個問題很難，不會受之前失敗嘗試的影響，不會受到學術權威暗示的約束。它只是從海量的訓練資料中檢索出相關公式，然後按邏輯推演。

「我們發現了一種思考大數字及其結構的全新方式，」陶哲軒說。他和 Lichtman 後續將 ChatGPT 的原始證明壓縮精煉成更簡潔的形式，最重要的是保留了 LLM 的關鍵洞察——那個所有人都錯過的切入點。

Lichtman 則從另一個角度感到振奮：「我從研究所時期就有一種直覺——這些問題在某種程度上是彼此關聯的，存在某種統一的脈絡。這個新方法真的印證了那種直覺。」

AI 解數學題，有什麼不一樣？

你可能會問：AI 解決數學難題有什麼了不起？不是已經有很多新聞了嗎？

確實，過去一年裡媒體報導了不少「AI 破解數學難題」的消息。但學術界對這些成果的評價向來謹慎。原因有三：

第一，難度差異巨大。 所謂的 Erdos 問題涵蓋了從中學代數到博士級研究的廣泛難度範圍。有些問題只需要基本的數學直覺就能解決，有些則需要極深的專業知識。媒體報導時常常混為一談。

第二，原創性存疑。 早期許多所謂的「AI 解決方案」事後被發現只是重現了已知的證明方法，或者是在訓練資料中已經存在的解答。用陶哲軒的話來說：「它們看起來很新，但其實只是把已有的知識重新組合。」

第三，缺乏可推廣性。 即使 AI 成功解決了某個特定的數學問題，它的方法往往無法應用到其他領域。這與人類數學家的發現不一樣——人類的一個突破性思路常常能解開一大類問題。

這次不一樣的地方，在於 ChatGPT 使用了一個完全原創的數學連接——把一個在其他領域廣為人知的公式，應用到了一個從未被考慮過的場景。這不是死記硬背，而是真正的跨域類比推理。

「它提出了人類從未想到的連接方式，」陶哲軒謹慎但樂觀地評價。「這是一個不錯的成就。至於長期的意義，現在還言之過早。」

質疑與警惕：AI 的數學能力到底到哪了？

當然，科學界對這個突破也抱持著審慎態度。

Lichtman 反覆強調 ChatGPT 原始輸出的不完美：「如果沒有專家的介入，那些證明草稿很可能被當成垃圾丟掉。」換句話說，AI 提出了正確的方向，但人類數學家才是完成最後一哩路的人。

這和 AI 在其他領域的表現驚人地相似——AI 擅長「發現」，但尚不擅長「證明」。 在程式設計中，AI 能快速產生可運行的程式碼，但需要人類工程師來確保安全性、可維護性和正確性。在醫療診斷中，AI 能給出可能的疾病判斷，但最終的診斷仍然需要醫生確認。

更進一步地說，陶哲軒指出目前 AI 解決的 Erdos 問題仍然屬於「有限範圍」的挑戰。真正的數學創造力——比如建立全新的理論體系、發明前所未有的數學工具——還遠遠超出當前模型的能力。

Price 本人對此也有清醒的認識：「我只是個業餘玩家。真正的價值在於，專業數學家可以從 AI 的輸出中獲得靈感，看到他們自己看不到的可能性。」

把 AI 定位成「靈感生成器」而非「解決方案生成器」，或許是更現實的期待。

對台灣數學教育與 AI 發展的啟示

這個故事對台灣的影響，不只在於數學領域。

對教育體系來說，Price 的案例挑戰了「數學能力 = 正式訓練程度」的傳統認知。一名 23 歲、沒有高等數學教育的年輕人，靠著對問題的好奇心和一台 AI 工具，做到了世界級數學家沒做到的事。這意味著，未來數學研究和發現的門檻正在大幅降低——不是不需要專業知識，而是專業知識的獲取和應用方式正在改變。

台灣的數學教育長期以考試導向為主，強調解題技巧和公式記憶。但如果 AI 能夠承擔大量的機械化計算和理論推導，學生的價值應該轉向哪裡？問題意識、跨域連結、創新思考——這些才是人類相對於 AI 的競爭優勢。

對 AI 產業發展來說，這次事件提供了一個很好的思考案例：AI 的能力邊界在哪裡？ChatGPT 能做到的，不是取代數學家，而是提供一個「沒有偏見」的思維夥伴。它不受人類慣性、權威壓力和失敗經驗的影響，因此能看到人類集體忽略的可能性。

台灣的 AI 新創和學術單位，可以從中得到一個重要的產品方向：不是追求「AI 取代專家」，而是開發「AI 啟發專家」的工具。 這種協作模式——AI 負責提出假設和方向，人類負責驗證和深化——可能是未來知識工作最有效率的協作方式。

數學家們的下一步

Lichtman 現在正和陶哲軒合作，探索 ChatGPT 這個新方法能否應用到其他未解決的 Erdos 問題上。他們已經找到了幾個可能的候選問題——那些長期被困在相同思維框架中的經典難題。

「我有一種直覺，這些問題是彼此關聯的，」Lichtman 說。「如果這個方法是對的，它應該能解開更多東西。」

對陶哲軒來說，這件事更重要的意義在於它改變了他看待 AI 的方式：「之前我認為 AI 在數學上的貢獻主要集中於計算和搜尋——找反例、驗證假設。但這個案例告訴我，AI 也能在概念層面提出新東西。」

他並不急於宣稱 AI 已經掌握了數學創造力。但他確實認為，AI 開始展現出一種有用的能力：幫助人類打破集體思維的框架。

「長期來看，真正的問題不是 AI 能不能做數學，而是我們人類願不願意接受『AI 可以啟發我們』這件事，」他說。

也許到頭來，ChatGPT 在這次事件中做的最重要的事，不是解決了一個 60 年難題——而是向我們展示，很多時候我們之所以解不開問題，是因為我們從未想過可以那樣思考。

那是一種不帶偏見、不受慣性束縛、不怕犯錯的思考方式。而這，恰好是人類最能從 AI 身上學到的東西。