2025 年 10 月,一家名為 Axiom Math 的新創公司從隱匿模式中走出,帶著 6,400 萬美元(約 NTD 2,048,000,000)的種子輪融資與 3 億美元的估值。到了 2026 年 2 月,Menlo Ventures 領投的新一輪融資超過 1 億美元,估值飆升至 15 億美元。這家公司的目標聽起來近乎狂妄:建造一個能自我改進的超級智能推理引擎,從 AI 數學家開始。
但 Axiom 已經交出了初步成績單。它的核心產品 AxiomProver 在 2025 年 Putnam 數學競賽中拿下 12 題滿分,成績超越約 4,000 名人類參賽者。2026 年初,AxiomProver 獨立解決了四個長年未解的數學問題,其中包括 Fel's Conjecture 的完整形式化證明,全程無需人類介入。
創辦人背景:從 IMO 到 Stanford 休學
Axiom 的創辦人兼執行長 Carina Hong 24 歲。她在廣州長大,中學時期就在數學競賽中嶄露頭角。進入 MIT 後,三年內取得數學與物理雙學位,期間發表了九篇同儕審查論文,涵蓋數論、組合學、理論電腦科學與概率論。2023 年,她獲得 Frank and Brennie Morgan Prize——全美大學數學研究最高榮譽。
Hong 後來以羅德學者身份前往牛津攻讀神經科學碩士,再回到 Stanford 攻讀法律博士與數學博士的聯合學位。但她沒有完成 Stanford 的學程。2025 年初,她選擇休學創辦 Axiom Math。
這個決定背後有一個具體的催化事件。2025 年春季,Hong 受邀參加 UC Berkeley 一場僅有 30 人的閉門研討會,與會者測試了一個 AI 推理系統在研究級數學問題上的表現。那次會議讓她確認:形式化證明與大型語言模型的結合,已經走到了可行的臨界點。
技術架構:三根支柱的混合路線
Axiom 的技術路線與 DeepMind 的 AlphaProof(純形式化系統)和 OpenAI(純大型語言模型)都不同。Hong 將其描述為「取兩個世界的長處」——結合 LLM 的非形式推理能力與 Lean 證明語言的形式驗證能力。
具體來說,Axiom 的系統包含四個核心模組:
| 模組 | 功能 |
|---|---|
| Auto-formalizer | 將自然語言數學問題轉換為 Lean 的形式化結構 |
| Conjecturer | 識別需要的中間步驟,提出候選引理 |
| Prover | 組裝證明步驟,每一步都經 Lean 編譯器級驗證器即時檢查 |
| Auto-informalizer | 將驗證通過的 Lean 腳本轉回自然語言或 LaTeX 格式 |
這套系統的關鍵差異在於自我驗證迴圈。與一般 LLM 產出「看起來合理」的推理不同,AxiomProver 的每一個邏輯步驟都必須通過 Lean 的驗證。如果某個步驟被拒絕,系統會回溯、從失敗中學習,再重新嘗試。
Hong 在接受 Turing Post 的訪問時指出,形式化數學面臨的最大瓶頸是資料稀缺:Python 程式碼有超過一兆個 tokens 的訓練資料,Lean 程式碼只有約一千萬個 tokens。這是十萬倍的落差。Axiom 的策略之一是自動化形式化(auto-formalization)——自動將人類的非形式數學證明轉換為 Lean 程式碼——但這本身就是個雞生蛋的問題,因為模型還沒看過足夠多的 Lean 範例。
四個未解問題的突破與爭議
2026 年 2 月,AxiomProver 宣布解決了四個先前未解的數學問題,引起廣泛關注。
其中最具代表性的案例涉及數學家 Dawei Chen 和 Quentin Gendron 在代數幾何中提出的一個猜想。五年前,兩人在研究複雜曲面上的微分時遇到一個關鍵的數論公式無法證明,只能將其作為猜想發表。Chen 曾嘗試用 ChatGPT 解決,但失敗了。在一場華盛頓特區的數學研討會上,Chen 遇到了已加入 Axiom 的知名數學家 Ken Ono(維吉尼亞大學教授、前美國數學學會副會長)。隔天早上,Ono 就帶回了 AxiomProver 產生的完整證明。
Ono 表示,AI 發現了一個連結到十九世紀數值現象的關聯,而這是所有人類數學家都遺漏的。另一個案例是 Fel's Conjecture——涉及代數中 syzygies 與 Srinivasa Ramanujan 百年前筆記中公式的問題。這個證明由 AxiomProver 從頭到尾獨立完成。Harvard Business School 教授 Scott Kominers 評價道,AxiomProver 產出的證明不僅正確,而且數學上優雅。
但爭議也隨之而來。《Scientific American》在 2026 年 2 月的報導中指出,Axiom Math 最近的證明中有一個案例被發現是「被誤導呈現的文獻搜索結果」,而非原創證明。Yale 大學教授 Daniel Spielman 也對此類由 AI 公司自行發表的研究結果提出質疑,認為這更像是廣告而非獨立評估。
為此,由 11 位頂級數學家(包含一位 Fields Medal 得主)組成的團隊在 2026 年 2 月推出了「First Proof」計畫——一套專門為 AI 設計的數學考試,使用從未公開的研究級問題,旨在提供不受資料污染影響的客觀測試。
團隊組成與投資人
Axiom 在短時間內組建了一支高密度的專家團隊:
| 成員 | 背景 |
|---|---|
| Carina Hong(CEO) | MIT 數學物理雙學位、Oxford 碩士、Morgan Prize 得主 |
| Shubho Sengupta(CTO) | Meta FAIR 八年資歷,領導 OpenGo 與 CrypTen 開發 |
| François Charton | 2019 年率先將 Transformer 應用於數學問題,推翻了一個 30 年的猜想 |
| Ken Ono | 維吉尼亞大學教授、美國數學學會前副會長 |
| Hugh Leather | 深度學習應用於程式碼生成的早期先驅 |
| Aram Markosyan | 曾領導 Meta FAIR 的安全與公平性研究 |
投資方包括 B Capital(領投種子輪)、Menlo Ventures(領投 2026 年輪)、Greycroft 和 Madrona Venture Group。Madrona 在其投資說明中特別強調,Axiom 代表了他們所謂的「推理革命」——從執行任務的 AI 轉向能與人類協作進行規劃與決策的推理機器。
商業應用與市場定位
Axiom 目前尚未產生營收,但其商業模式瞄準的是需要數學嚴謹性的高價值場景。
量化金融是最直接的應用市場。交易策略的 alpha 發現需要可證明正確的數學推導。Hong 在訪談中提到,量化交易公司夢想擁有「AI 版的 Terence Tao」來產生交易信號。
軟體與硬體驗證是另一個重要方向。形式化驗證過去因成本過高,只在最關鍵的系統(如航太與核能控制)中使用。如果 Axiom 能降低形式化證明的成本,大規模的程式碼驗證與晶片設計驗證將成為可能。
Axiom 提供兩種使用介面:一個聊天式的 playground,讓數學家輸入問題並即時看到 Lean 腳本與驗證狀態;以及程式化 API,讓量化研究人員透過 REST 或 gRPC 發送問題,接收包含形式化證明、自然語言解釋與信心分數的結構化回應。
Reddit 社群怎麼看?
Axiom Math 在 Reddit 上的討論目前分散在 r/MachineLearning、r/math 和 r/artificial 等子版塊中,尚未形成獨立的熱門討論串。社群反應大致可歸納為幾個方向。
在正面評價方面,多數評論者對 Axiom 的技術路線表示認可。形式化驗證(Lean/Coq)作為 AI 推理的「裁判員」這個概念,在 r/MachineLearning 中獲得較多技術導向的討論。部分用戶指出,相較於 GPT 或 Gemini 的「黑箱推理」,Axiom 的每一步都可驗證,這在高風險應用中價值顯著。Carina Hong 的學術背景也讓社群對團隊能力給予較高信心。
持保留態度的意見主要聚焦兩點。第一是估值合理性:一家零營收的新創在五個月內從 3 億美元估值跳升到 15 億美元,讓部分 Reddit 用戶質疑是否存在 AI 投資泡沫的成分。第二是技術宣稱的可信度:《Scientific American》報導的「文獻搜索結果被呈現為原創證明」事件,在技術社群中引發了對 AI 公司自我宣傳可信度的討論。
r/math 版上的專業數學家傾向更謹慎的評價。MIT 教授 Andrew Sutherland 的觀點——AI 今年對數學的最大影響不在於解決大問題,而在於滲透到工作數學家的日常生活中——反映了多數學術社群成員的立場。他們認為 AxiomProver 解決的是「引理」級別的問題,距離真正突破性的數學發現還有距離。
整體而言,Reddit 社群將 Axiom 視為 AI 新創浪潮中一個值得追蹤但仍需更多獨立驗證的案例。
競爭格局:專精 vs. 通用
| 類型 | 代表 | 路線差異 |
|---|---|---|
| 大型 AI 實驗室 | DeepMind(AlphaProof)、OpenAI | 擁有更大算力,但數學非核心業務 |
| 專精科學 AI | Axiom、Periodic Labs | 針對特定科學領域深耕形式化推理 |
| 傳統數學軟體 | Wolfram Alpha、MATLAB | 有既有客戶基礎,但缺乏自然語言介面與自動證明生成 |
Hong 認為,在需要可證明正確性的場景中,專精系統具有結構性優勢。形式化驗證產生的不是「可能正確」的答案,而是「數學保證正確」的答案。這在量化交易、航太工程、密碼學等領域中有本質差異。
延伸思考
Axiom 的故事折射出 AI 發展的一個重要轉向。過去兩年的主要敘事是模型規模的擴張——更多參數、更多訓練資料、更大的算力。Axiom 代表的是另一種路徑:用更少的資料但更高品質的訓練信號(可驗證的數學證明),達到在特定領域超越通用模型的能力。
這個路徑是否能成為可持續的商業模式,取決於兩個條件。第一,形式化證明的成本能否降低到足以讓量化金融和軟體驗證等行業大規模採用。第二,Axiom 的知識圖譜——由已驗證的數學事實組成的持續擴張資料庫——能否形成真正的網路效應與競爭壁壘。
對於關注加速計算與 AI 半導體發展的讀者來說,Axiom 的潛在影響值得注意:如果形式化驗證能被 AI 自動化,晶片設計流程中最耗時的驗證階段可能被根本性地改變。
引用來源
- B Capital, "Toward Mathematical Superintelligence: Why We Invested in Axiom" (September 2025)
- Scientific American, "Mathematicians Launch First Proof, a First-of-Its-Kind Math Exam for AI" (February 2026)
- Communications of the ACM, "Formal Reasoning Meets LLMs" (February 2026)
- Madrona Ventures, "Why We Invested in Axiom" (September 2025)
- Stanford University, Institute for Human-Centered Artificial Intelligence (HAI)
本文由 tenten.co 團隊撰寫。作為長期關注 AI 技術與新創投資的數位策略顧問,我們認為 Axiom 的混合路線——將 LLM 的直覺能力與形式化證明的嚴謹性結合——可能代表 AI 發展下一階段的重要範式轉移。值得觀察的是,這種「可證明正確」的 AI 能否從學術數學擴展到更廣泛的商業場景。
若您的企業正在評估如何將 AI 推理能力整合到技術或業務流程中,歡迎與 Tenten 團隊預約諮詢,討論適合您場景的策略與實施方案。
