OpenAI 計劃收購 Windsurf,展現其在 AI 領域的擴張決心。最新 o3 及 4o-mini 模型實測超越 Claude,證明技術實力持續領先。

OpenAI 又出手了!正當社群還在消化 o3, o4-mini的威力與全新開源 CLI 工具的消息時,又爆出他們正洽談以 30 億美元收購 AI 開發平台 Windsurf。這筆潛在併購案,不僅震撼整個開發者圈,更可能是 OpenAI 針對 CursorGitHub Copilot 的最強反擊。


模型更新一次三款:o3 完整版、o4-mini、o4-mini-high 全面登場

OpenAI 近期可說是火力全開,本次同時推出三款全新思考型模型:

模型名稱 重點特性 適用場景
o3 完整版 領先數學、科學、視覺、程式等多領域 benchmark 高精度研究、專業應用
o4-mini 快速、成本效益高的推理模型 工具助手、日常問答
o4-mini-high 較強推理能力的小型模型,表現幾乎等同 o3 實時互動、多執行緒開發場景

在 ChatGPT 中直接使用這些模型,體驗過程流暢,尤其是 o3 的圖像分析能力令人驚艷。


影像理解與多步推理示範:從一張海報開始的深度解讀

使用 o3 處理 Proton Isovector Scalar Charge 的研究海報,只需一張截圖,模型便開始:

  1. OCR辨識圖中文字
  2. 裁切重點區域、放大圖表
  3. 比對最新研究資料,並提出結論

整個過程模型自動執行多輪推理與圖像處理,精準擷取資訊點,不只是回答問題,而是完整進行了「類研究流程」。


程式能力全面進化:Bouncing Ball 實測穩定表現

以經典的 Bouncing Ball 在 hexagon 中彈跳為例,從 o3 到 o4-mini-high,再到 3.7 Sonnet,全部 一輪生成成功執行、物理模擬穩定,可見這類 benchmark 已逐漸無法區分模型的實力差異。


Codex CLI:OpenAI 自家推出的開源終端機工具

新的開源工具 Codex CLI 已在 GitHub 上釋出,支援 o3 和 0.4-mini 模型,使用方式簡單:

npm install -g codex
codex

功能亮點:

  • 建構於終端機的 AI coding agent
  • 能即時解釋大型 React 程式碼架構
  • 自動讀取目錄、執行 lscat 指令取得程式上下文
  • 支援 patch、diff 與 prompt 儲存

在實測中,它能根據指令加上遊戲開場 popup、倒數計時與 AI 勝利嘲諷訊息,並成功套用、顯示在瀏覽器中。


benchmark 成績全揭露:OpenAI 模型全面壓制競爭對手

Benchmark o3 o4-mini Gemini 2.5 Pro 3.7 Sonnet
SWE Bench Verified 69.1% 68.1% 62.3%
Adapolygot (Hull) 81.3% 68.9% 74%
Adapolygot (Diff) 79.6% 68.2% 68.6%
AIME (數學) 98.4% 近100% 92%
Humanity's Last Exam 24.9% (with tools) 18.8%

這樣的數據說明一切:o3 正是目前最強程式與推理模型


價格揭曉:相較以往,這次親民許多

模型版本 Input Token 單價 (百萬) Output Token 單價 (百萬)
01 Pro $150 $600
03 $10 $40
04 mini $1.10 $4.40

0.4-mini 僅需一杯咖啡價格,就能使用 GPT 級推理能力。


結語:AI 開發進入多工具、多模型的黃金時代

OpenAI 透過全新模型與工具,已不再只是一個聊天機器人,而是 全能研發平台,具備:

  • 高精度模型(o3)
  • 成本效益模型(o4-mini)
  • 強大終端機工具(Codex CLI)
  • 圖像、OCR、搜尋、程式整合工具鏈

如果 Windsurf 併購成功,OpenAI 將真正踏上 整合研發環境與編輯器的 AI 大一統之路,全面挑戰 Copilot、Claude Code 等現行系統。


想要在數位轉型、AI 自動化、AI coding 工具導入上搶得先機?
Tenten 協助你從戰略到落地全面部署。

👉 立即預約免費顧問會議

Share this post
Annie Yeh

AI & Data Science Decoded: Join my journey of AI/ LLM. Let's grow our tech skills together! #AILearners #FashionAI

Loading...