OpenAI 新模型 O3、O4 Mini 及 O4 Mini High 的問世,重新定義了「思考」。這不只是一次升級,而是一場革命。

你有沒有發現 ChatGPT 最近好像偷偷變聰明了?沒錯!因為 OpenAI 丟出了三顆震撼彈,就是最新的 O3、O4 Mini 跟 O4 Mini High 模型啦!而且它們現在已經可以直接在 ChatGPT 裡頭玩到了喔。這些傢伙有個很酷的稱號,叫做「思考型模型」或是「推理型模型」,聽起來是不是就很不一樣?

那到底什麼是「思考型」啊?簡單來說,就是這些模型不像以前那樣,你問什麼它就馬上給你答案。它們會先在「後台」,嗯… 想像一下,就像在自己的小腦袋裡先轉一轉、想一想,把你的問題好好拆解、分析一下,甚至可能在心裡默默盤算幾種不同的回答方式,然後才挑一個它們覺得最棒、最周全的回應給你。是不是有點像我們人類,遇到比較複雜的事情時,總要先「等等,讓我想一下…」的那種感覺?這就是它們特別的地方啦!

新模型替代計劃及性能比較

O3模型將取代原有的O1模型。如果您擁有每月200美元的Pro計劃,請注意O1 Pro模式也將成為傳統推理模型,並最終被淘汰,由O3取代。

從性能基準測試來看,各個OpenAI思考型模型的能力有明顯差異:

模型名稱 性能排名 特點
O4 Mini High 最佳 編程能力最強,視覺推理出色
O4 Mini 次佳 在編程基準測試中得分2719,位列全球頂尖200名程序員水平
O3 良好 在多模態推理方面有時優於O4 Mini
O1 Pro 即將淘汰 推理速度較慢

值得注意的是,在多模態推理方面,O3模型得分82%,略高於O4 Mini的81%,這意味著根據具體任務,O3有時可能比O4 Mini更適合某些應用場景。

o3 與 o4-mini benchmark

在專家評估中,o4-mini 在非 STEM 任務以及資料科學等領域的表現也優於前身 o3-mini。由於其效率,o4-mini 支援的使用限制明顯高於 o3,使其成為受益於推理的問題的強大的高容量、高吞吐量選項。外部專家評估人員認為 ,由於智慧程度的提高和網路資源的納入, 這兩種模型都表現出比前代模型更好的指令遵循能力和更有用、可驗證的反應。 與我們先前的推理模型相比,這兩個模型也應該感覺更自然、更具對話性,特別是當它們參考記憶和過去的對話以使反應更加個性化和相關時。

OpenAI o3 和 o4-mini 是 OpenAI 發布的最聰明的模型,而且它們通常比其前身 OpenAI o1 和 o3-mini 更有效率。例如,在 2025 年 AIME 數學競賽中,o3 的性價比前沿比 o1 有嚴格的改進,同樣,o4-mini 的前沿也比 o3-mini 有嚴格的改進。更普遍地說,我們預計,對於大多數實際使用情況,o3 和 o4-mini 也將分別比 o1 和 o3-mini 更聰明、更便宜。

所有模型均在高「推理努力」設定下進行評估——類似於 ChatGPT 中的「o4-mini-high」等變體。
在專家評估中,o4-mini 在非 STEM 任務以及資料科學等領域的表現也優於前身 o3-mini。
O4-mini 與 o3 的編碼效能比較
對於大多數實際使用情況,o3 和 o4-mini 也將分別比 o1 和 o3-mini 更聰明、更便宜。

o3 和 o4-mini 有多好?

OpenAI o3 和 o4-mini 是推理模型,這意味著它們被設計為在回答提示之前進行“思考”,使它們適合數學和編碼等任務(以及任何需要邏輯推理和規劃的任務)。

o3 的主要優點在於它能夠使用工具,包括執行程式碼、檢索檔案和使用網路搜尋。工具使用是現代應用程式(尤其是 Agent系統)的關鍵部分。應用工具使用的一種方法是讓外部過程(例如,另一個模型或基於規則的系統)確定何時以及如何使用資訊檢索等工具。相較之下,o3 等現代推理模型已經過訓練,可以原生支援工具的使用。

這意味著在推理過程中,模型會有機地確定何時需要使用工具(例如,運行網路搜尋或運行其生成的程式碼)並產生封閉應用程式啟動該工具所需的令牌。這使得這些模型能夠執行更複雜的任務,例如在逐步解決問題和收集新資訊時執行多個搜尋查詢。

目前可以透過 OpenAI API 的 ChatGPT 存取 o3 和 o4-mini。測試過的用戶普遍給出了非常積極的回饋。有人將其描述為天才等級的人工智慧。

在我自己的實驗中,我發現 o3 的推理能力非常好,大約相當於 Gemini 2.5 Pro 的程度。它在影像分析上顯示出令人印象深刻的結果。它在 SVG 挑戰 中表現得非常出色(我給它一篇技術文章並要求它創建一個描述文章中描述的技術的 SVG)。雖然第一次嘗試時沒有獲得最佳結果,但它在執行後續指令和對影像進行修正方面表現非常好。


OpenAI思考型模型的獨特功能

視覺推理能力

O4 Mini High在視覺推理方面表現出色。例如,當上傳一張海港照片並詢問「能否找出照片中最大船隻的名稱及其下一個停靠港口?」時,模型能夠識別出照片中的貨船,並通過網絡搜索功能確定該船下一個停靠港是美國長灘。

自動搜索功能

這些OpenAI思考型模型能夠自動使用ChatGPT的所有工具,包括自主進行網絡搜索,無需用戶額外開啟搜索選項或提供特殊指令。例如,當被問及「根據你對我的了解,分享今天的新聞中我會感興趣的內容」時,模型會結合記憶功能和搜索功能,推理出用戶可能感興趣的內容。

預測分析能力

當被要求預測「2025年6月美中關稅水平」時,O4 Mini和O4 Mini High都能通過搜索多個信息源(分別為11個和14個)進行推理,並得出類似的結論。

編程能力增強

這些OpenAI思考型模型在編程方面表現優異。例如,當被要求用Python創建一個Galaga風格的遊戲時,模型能夠生成一個完整、流暢的遊戲代碼。

數學推理能力

在解決數學問題時,新模型比舊模型更高效。例如,對於「一匹馬售價50元,一隻雞20元,一隻山羊40元,總共花費140元購買了4隻動物,分別買了哪些動物?」這樣的問題,O4 Mini能夠更快地得出正確答案。

估算能力

OpenAI思考型模型在估算問題上表現出色。例如,當被問及「紐約市有多少鋼琴調音師?」時,模型能夠基於人口數據和合理假設進行推理,給出大約150名全職鋼琴調音師的估計。

圖像生成整合

與以前的推理模型不同,新的OpenAI思考型模型可以使用ChatGPT內的所有工具,包括GPT-4.0圖像生成器。這意味著用戶可以要求模型根據對話內容生成相關圖像。

OpenAI思考型模型的可用性和適用計劃

這三款新的OpenAI思考型模型目前已在Pro計劃(每月200美元)、Teams計劃和Plus計劃(每月20-30美元)中提供。這是一個重大變化,因為過去只有Pro計劃用戶才能使用O1 Pro等推理模型。

ChatGPT模型選擇菜單更新

ChatGPT的模型選擇菜單再次發生了變化。以下是更新後的模型情況:

模型類別 模型名稱 適用場景
標準模型 GPT-4.0 日常使用的主要模型
特殊功能 提醒模型 發送提醒和安排任務
寫作模型 4.5 適合寫作但速度較慢
開發者模型 4.1 僅對開發者開放,優於4.5
思考型模型 O3 通用推理任務
思考型模型 O4 Mini 快速高級推理
思考型模型 O4 Mini High 最佳模型,適合編程和圖像分析
傳統模型 O1 Pro模式 傳統推理模型,即將淘汰
免費版模型 GPT-3.5 免費ChatGPT帳戶使用
舊版模型 ChatGPT 4(2023) 本月即將停用
O4-mini 的 API 費用
o3 的 API 費用

使用建議

對於一般用戶,如果不需要推理功能,建議使用標準的GPT-4.0模型,因為OpenAI思考型模型的工作方式完全不同,應以不同的方式進行提示。

當需要推理功能時,可以根據具體需求選擇:

  • 對於視覺分析和編程任務,優先選擇O4 Mini High
  • 對於需要快速回應的複雜推理任務,選擇O4 Mini
  • 對於多模態推理任務,可以考慮使用O3

Whats next?

從今天開始,ChatGPT Plus、Pro 和 Team 用戶將在模型選擇器中看到 o3、o4-mini 和 o4-mini-high,取代 o1、o3‑mini 和 o3‑mini‑high。 ChatGPT Enterprise 和 Edu 用戶將在一周內獲得存取權限。免費用戶可以在提交查詢之前,透過在編寫器中選擇「思考」來嘗試 o4-mini。所有計劃的速率限制與先前的模型相比保持不變。

OpenAI 預計將在幾週內發布具有完整工具支援的 OpenAI o3‑pro。目前,Pro 用戶仍可存取 o1-pro。

o3 和 o4-mini 也都可以透過 Chat Completions API 和 Responses API 供開發人員使用(有些開發人員需要驗證他們的組織才能存取這些模型)。 Responses API 支援推理摘要,能夠在函數呼叫周圍保留推理標記以獲得更好的效能,並且很快就會在模型推理中支援內建工具,例如網路搜尋、檔案搜尋和程式碼解釋器。

結語

OpenAI思考型模型的推出標誌著人工智能技術的重大進步。這些模型不僅能夠在後台進行思考,還能自動使用網絡搜索、圖像分析和生成等多種工具,大大提升了ChatGPT的功能範圍和實用性。無論是專業開發者還是普通用戶,都可以從這些新模型中獲益。隨著技術的不斷發展,我們可以期待OpenAI思考型模型在未來帶來更多令人驚喜的功能和應用。


Tenten AI Contact US

OpenAI 的最新「思考型模型」正在重新定義人工智慧的使用方式,特別是在編程、自動化推理以及視覺分析方面提供巨大優勢。如果您的業務致力於探索人工智慧的應用,Tenten AI 是您最佳的合作夥伴。我們專注於提供尖端 AI 解決方案,助您推動業務增長。立即預約免費會議,讓我們一起探討如何利用 AI 技術提升您的業務價值!

03, 04-mini - FAQ

  1. 什麼是 OpenAI 思考型模型? OpenAI 思考型模型(如 O3、O4 Mini 和 O4 Mini High)是一種新型人工智慧模型,具備多模態推理、視覺分析、預測分析等高級功能,能在回答問題前進行深入分析。
  2. O3、O4 Mini 和 O4 Mini High 模型有什麼主要差異? O3專注於多模態推理,O4 Mini 提供快速高級推理,O4 Mini High 則在編程能力和視覺推理方面表現最佳。
  3. 如何選擇最適合我的 ChatGPT 模型? 使用 O4 Mini High 可滿足視覺分析及編程需求;O4 Mini 適合快速複雜推理;O3 適用於多模態推理。
  4. O4 Mini High 在哪些方面表現最佳? O4 Mini High 在編程能力、圖像分析及實現自動網絡搜索功能上領先其他模型。
  5. OpenAI 思考型模型在哪些計劃中可用? O3、O4 Mini 和 O4 Mini High 模型目前可用於 Pro 計劃、Teams 計劃和 Plus 計劃。
Share this post
Maria Ning

With a sharp eye for data-driven narratives, Maria architects full-funnel content that moves technical buyers to action, Interests: RevOps, martech hacks, Sichuan cooking

Loading...