OpenAI 計劃收購 Windsurf,展現其在 AI 領域的擴張決心。最新 o3 及 4o-mini 模型實測超越 Claude,證明技術實力持續領先。
OpenAI 又出手了!正當社群還在消化 o3, o4-mini的威力與全新開源 CLI 工具的消息時,又爆出他們正洽談以 30 億美元收購 AI 開發平台 Windsurf。這筆潛在併購案,不僅震撼整個開發者圈,更可能是 OpenAI 針對 Cursor 和 GitHub Copilot 的最強反擊。
模型更新一次三款:o3 完整版、o4-mini、o4-mini-high 全面登場
OpenAI 近期可說是火力全開,本次同時推出三款全新思考型模型:
| 模型名稱 | 重點特性 | 適用場景 |
|---|---|---|
| o3 完整版 | 領先數學、科學、視覺、程式等多領域 benchmark | 高精度研究、專業應用 |
| o4-mini | 快速、成本效益高的推理模型 | 工具助手、日常問答 |
| o4-mini-high | 較強推理能力的小型模型,表現幾乎等同 o3 | 實時互動、多執行緒開發場景 |
在 ChatGPT 中直接使用這些模型,體驗過程流暢,尤其是 o3 的圖像分析能力令人驚艷。
影像理解與多步推理示範:從一張海報開始的深度解讀
使用 o3 處理 Proton Isovector Scalar Charge 的研究海報,只需一張截圖,模型便開始:
- OCR辨識圖中文字
- 裁切重點區域、放大圖表
- 比對最新研究資料,並提出結論
整個過程模型自動執行多輪推理與圖像處理,精準擷取資訊點,不只是回答問題,而是完整進行了「類研究流程」。
程式能力全面進化:Bouncing Ball 實測穩定表現
以經典的 Bouncing Ball 在 hexagon 中彈跳為例,從 o3 到 o4-mini-high,再到 3.7 Sonnet,全部 一輪生成成功執行、物理模擬穩定,可見這類 benchmark 已逐漸無法區分模型的實力差異。
Codex CLI:OpenAI 自家推出的開源終端機工具
新的開源工具 Codex CLI 已在 GitHub 上釋出,支援 o3 和 0.4-mini 模型,使用方式簡單:
npm install -g codex
codex
功能亮點:
- 建構於終端機的 AI coding agent
- 能即時解釋大型 React 程式碼架構
- 自動讀取目錄、執行
ls或cat指令取得程式上下文 - 支援 patch、diff 與 prompt 儲存
在實測中,它能根據指令加上遊戲開場 popup、倒數計時與 AI 勝利嘲諷訊息,並成功套用、顯示在瀏覽器中。
benchmark 成績全揭露:OpenAI 模型全面壓制競爭對手
| Benchmark | o3 | o4-mini | Gemini 2.5 Pro | 3.7 Sonnet |
|---|---|---|---|---|
| SWE Bench Verified | 69.1% | 68.1% | — | 62.3% |
| Adapolygot (Hull) | 81.3% | 68.9% | 74% | — |
| Adapolygot (Diff) | 79.6% | 68.2% | 68.6% | — |
| AIME (數學) | 98.4% | 近100% | 92% | — |
| Humanity's Last Exam | 24.9% (with tools) | — | 18.8% | — |
這樣的數據說明一切:o3 正是目前最強程式與推理模型。
價格揭曉:相較以往,這次親民許多
| 模型版本 | Input Token 單價 (百萬) | Output Token 單價 (百萬) |
|---|---|---|
| 01 Pro | $150 | $600 |
| 03 | $10 | $40 |
| 04 mini | $1.10 | $4.40 |
0.4-mini 僅需一杯咖啡價格,就能使用 GPT 級推理能力。
結語:AI 開發進入多工具、多模型的黃金時代
OpenAI 透過全新模型與工具,已不再只是一個聊天機器人,而是 全能研發平台,具備:
- 高精度模型(o3)
- 成本效益模型(o4-mini)
- 強大終端機工具(Codex CLI)
- 圖像、OCR、搜尋、程式整合工具鏈
如果 Windsurf 併購成功,OpenAI 將真正踏上 整合研發環境與編輯器的 AI 大一統之路,全面挑戰 Copilot、Claude Code 等現行系統。
想要在數位轉型、AI 自動化、AI coding 工具導入上搶得先機?
讓 Tenten 協助你從戰略到落地全面部署。
