OpenClaw 搭配 OpenAI CLI 完整指南:用 ChatGPT Plus 訂閱驅動 GPT-5.4,與 Opus 4.6、Kimi K2.5、MiniMax M2.5 實戰比較
OpenClaw 是 2026 年成長最快的開源 AI 助理框架,截至 3 月已突破 20 萬 GitHub 星數。透過 ChatGPT Plus 訂閱的 OAuth 認證,你可以用每月 USD 20(約 NTD 640,000)的固定成本,在 WhatsApp、Telegram、Slack、Discord 等 20 多個頻道上全天候運行 GPT-5.4——這比直接使用 OpenAI API 按 token 計費省下可觀費用。 本文將從安裝、認證、模型設定到實際效能比較,完整拆解 OpenClaw + OpenAI CLI 的每個步驟,並將 GPT-5.4 與 Claude Opus 4.6、Kimi K2.5、MiniMax M2.5 進行多維度實測對照。
OpenClaw 是什麼:不只是聊天機器人
OpenClaw 的定位與 ChatGPT 或 Claude.ai 根本不同。ChatGPT 是你去拜訪的雲端服務;OpenClaw 是住在你裝置上的常駐代理人。它以 Node.js 守護程序(daemon)運行在 macOS、Linux 或 Windows WSL2 上,連接你已經在用的通訊平台,24 小時待命。
核心架構只有一條線:你的訊息 → OpenClaw Gateway → LLM API → 回應。Gateway 是控制平面,負責管理對話、記憶、技能(Skills)與排程任務(Cron Jobs)。所有對話記錄與記憶檔案留在你的硬碟,只有推理請求會發送到你選擇的 LLM 供應商。
截至 2026 年 3 月,OpenClaw 支援的頻道包括:WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、BlueBubbles、IRC、Microsoft Teams、Matrix、飛書、LINE、Mattermost、Nextcloud Talk、Nostr、Synology Chat、Twitch、Zalo、WebChat 等超過 20 種。ClawHub 上已有超過 4,000 個社群技能可安裝。
認證方式拆解:OAuth 訂閱 vs. API Key
OpenClaw 連接 OpenAI 有兩條路徑,選擇哪一條直接影響你的成本結構和可用模型。
| 認證方式 | 指令 | 計費模式 | 可用模型 | 適用情境 |
|---|---|---|---|---|
| Codex OAuth(訂閱制) | openclaw onboard --auth-choice openai-codex |
ChatGPT Plus/Pro 月費包含 | openai-codex/gpt-5.4、openai-codex/gpt-5.3-codex、openai-codex/gpt-5.1-codex-mini |
每日高頻使用者,月費固定 |
| API Key(按量計費) | openclaw onboard --auth-choice openai-api-key |
按 token 計費 | openai/gpt-5.4、openai/gpt-5.4-pro |
低頻使用或需要 Pro 等級模型 |
OpenAI 已明確表示支援訂閱 OAuth 在第三方工具中的使用,OpenClaw 文件也引用了這項政策。相較之下,Anthropic 對於 Claude 訂閱在 OpenClaw 中的使用態度較為模糊,這也是 2026 年 2-3 月期間大量用戶從 Claude 切換到 OpenAI 的原因之一。
五分鐘完成安裝與認證
前置需求:Node.js 22 以上版本。
步驟一:安裝 OpenClaw
npm install -g openclaw@latest
# 或使用 pnpm
pnpm add -g openclaw@latest
步驟二:啟動引導精靈並選擇 Codex OAuth
openclaw onboard --auth-choice openai-codex --install-daemon
引導精靈會依序引導你完成 Gateway 設定、工作區建立、頻道配對與技能安裝。選擇「Quickstart」模式可跳過進階設定,5 分鐘內完成基本部署。
關鍵操作細節:
- 精靈詢問設定模式時,選擇 Quickstart
- 若為既有安裝切換模型,選擇 Use existing values——選 Reset 會清除所有頻道、記憶與排程設定
- 瀏覽器自動開啟 ChatGPT 登入頁面,用你的 Plus/Pro 帳號授權
- 授權完成後,OAuth token 自動儲存,可直接關閉終端機
步驟三:確認模型狀態
openclaw models status --plain
應看到 openai-codex/gpt-5.4 或 openai-codex/gpt-5.3-codex 作為啟用模型。
步驟四:切換到 GPT-5.4
openclaw models set openai-codex/gpt-5.4
若遇到 GPT-5.4 透過 Codex OAuth 出現 401 錯誤的情況(OpenClaw 2026.3.2 版本已知 bug),可在 ~/.openclaw/agents/main/agent/models.json 中手動覆蓋 provider 設定,將 api 欄位指定為 openai-codex-responses。
OpenClaw 的 openclaw.json 配置範例
使用 API Key 的配置:
{
"env": {
"OPENAI_API_KEY": "sk-..."
},
"agents": {
"defaults": {
"model": {
"primary": "openai/gpt-5.4"
}
}
}
}
使用 Codex OAuth 的配置:
{
"agents": {
"defaults": {
"model": {
"primary": "openai-codex/gpt-5.4"
},
"models": {
"openai-codex/gpt-5.4": {
"params": {
"transport": "auto"
}
}
}
}
}
}
transport: "auto" 會先嘗試 WebSocket 連線,失敗再退回 SSE(Server-Sent Events)。OpenClaw 對 OpenAI Responses API 預設開啟 WebSocket warm-up(openaiWsWarmup: true),可降低首次回應延遲。
GPT-5.4 模型定位與關鍵能力
GPT-5.4 於 2026 年 3 月 5 日發布,是 OpenAI 首個將 Codex 程式碼能力與 GPT 通用推理合併的旗艦模型。ChatGPT Plus(USD 20/月)、Pro(USD 200/月)與 Enterprise 用戶可直接在聊天介面與 Codex CLI 使用。
| 規格 | 數值 |
|---|---|
| 上下文視窗(API/Codex) | 1,050,000 tokens(922K 輸入 + 128K 輸出) |
| 上下文視窗(ChatGPT) | 272K(預設),1M(需手動啟用) |
| API 輸入定價 | USD 2.50 / 1M tokens |
| API 輸出定價 | USD 15.00 / 1M tokens |
| 快取輸入折扣 | 50%(USD 1.25 / 1M tokens) |
| 超過 272K 輸入加價 | 輸入 2 倍、輸出 1.5 倍 |
| 推理模式 | 可調式推理強度(low/medium/high/xhigh) |
| 原生電腦操控 | 支援(Playwright + 滑鼠鍵盤直接控制) |
| 工具搜尋(Tool Search) | 支援(減少 47% tool-heavy 工作流的 token 用量) |
GPT-5.4 在 GDPval 測試中達到 83%,涵蓋 44 種職業的專業知識工作評估。OSWorld-Verified 電腦操控基準達 75%,超過人類平均 72.4%。這是第一個在桌面自動化上超越人類基線的通用模型。
四模型實戰比較:GPT-5.4 vs. Opus 4.6 vs. Kimi K2.5 vs. MiniMax M2.5
以下比較基於 2026 年 3 月最新基準數據與獨立評測。
| 維度 | GPT-5.4 | Claude Opus 4.6 | Kimi K2.5 | MiniMax M2.5 |
|---|---|---|---|---|
| 發布日期 | 2026/3/5 | 2026/2/5 | 2026/1/27 | 2026/2/12 |
| 開發商 | OpenAI | Anthropic | Moonshot AI | MiniMax |
| 開源 | 否 | 否 | 是(修改版 MIT) | 是(MIT) |
| 參數量 | 未公開 | 未公開 | 1.04T(32B 啟用) | 230B(10B 啟用) |
| 上下文視窗 | 1.05M | 1M | 256K | 205K |
| Intelligence Index(AA) | 57 | 53 | 47 | 42 |
| SWE-Bench Verified | ~80% | 80.8% | 76.8% | 80.2% |
| SWE-Bench Pro | 57.7% | ~45% | — | — |
| OSWorld-Verified | 75.0% | 72.7% | — | — |
| GDPval(44 職業) | 83.0% | 領先 GPT-5.2 約 144 Elo | — | — |
| BrowseComp | 82.7% | 84% | 74.9% | 76.3% |
| ARC-AGI-2 | — | 68.8% | — | — |
| Terminal-Bench 2.0 | — | 65.4% | — | — |
| API 輸入定價 | USD 2.50/1M | USD 15/1M | USD 0.60/1M | USD 0.30/1M |
| API 輸出定價 | USD 15/1M | USD 75/1M | USD 3.00/1M | USD 1.20/1M |
| 訂閱入門價 | USD 20/月(Plus) | USD 20/月(Pro) | API 制 | API 制 |
| 特色能力 | 電腦操控、工具搜尋、可調推理強度 | Agent Teams 多代理並行、Adaptive Thinking | Agent Swarm 群體協作(最多 100 代理)、原生多模態 | 全棧開發全生命週期、Excel 競賽級辦公自動化 |
OpenClaw 相容性備註:GPT-5.4 與 Opus 4.6 均為 OpenClaw 支援的第一方供應商;Kimi K2.5 與 MiniMax M2.5 可透過 OpenRouter 或 haimaker.ai 等路由服務接入 OpenClaw。
選擇邏輯:四種情境四種答案
情境一:你需要全能型預設模型
GPT-5.4 在知識工作(GDPval 83%)、電腦操控(OSWorld 75%)與工具效率上全面領先,且 API 定價僅 Opus 4.6 的 20%。對多數專業工作流(文件分析、簡報製作、財務建模、法律草擬),GPT-5.4 是 2026 年 3 月的最佳預設。
情境二:你做複雜多檔案程式碼重構
Opus 4.6 在 SWE-Bench Verified(80.8%)持續領先,且其 Agent Teams 功能可產生多個獨立子代理同時處理前端、後端與測試。跨檔案依賴管理與型別系統變更的錯誤率,Opus 4.6 在實務開發中仍明顯較低。
情境三:你需要開源可自部署的模型
Kimi K2.5 的 Agent Swarm 技術將任務分解為最多 100 個並行子代理,執行速度提升 4.5 倍。模型權重完全開源,可透過 vLLM 或 SGLang 私有部署。在合規要求嚴格的金融、醫療或政府場景中,這意味著推理數據完全不離開你的基礎設施。
情境四:你追求極致性價比
MiniMax M2.5 以 230B 參數中僅啟用 10B 的 MoE 架構,達到接近 Opus 4.6 的 SWE-Bench 分數(80.2% vs 80.8%),API 輸出定價卻僅 USD 1.20/1M tokens——Opus 4.6 的 1/62。OpenHands 獨立評測將 M2.5 排名第四,僅次於 Opus 家族與 OpenAI 頂級模型。對預算敏感的團隊,M2.5 搭配 OpenCode CLI 或 OpenClaw 是目前最具成本效益的前沿程式碼工作流。
安全性注意事項
OpenClaw 的「自託管即隱私」只在正確設定下成立。安全研究員 Maor Dayan 曾發現超過 135,000 個暴露在公開網路上的 OpenClaw 實例,其中 15,000 個以上存在遠端程式碼執行漏洞。以下為基本防護清單:
- 不將 Gateway 綁定到 0.0.0.0——預設配置會對外開放,務必限制為 127.0.0.1 或透過 SSH 隧道存取
- 不給代理 sudo 權限——限制工具存取範圍,使用 hard tool restrictions
- 多代理環境中隔離環境變數——Shell access 的代理可讀取所有 env vars,包括 API keys
- Snyk 審計顯示 ClawHub 上 10-20% 的社群技能含惡意行為——安裝前審查程式碼
進階配置:模型降級與多供應商路由
OpenClaw 支援 model failover 機制,當主模型回傳錯誤或超時時自動切換到備用模型:
{
"agents": {
"defaults": {
"model": {
"primary": "openai-codex/gpt-5.4",
"fallback": "openai-codex/gpt-5.3-codex"
}
}
}
}
你也可以為不同代理(agent)分配不同模型。將日常對話路由到 GPT-5.4,將程式碼密集任務路由到 Opus 4.6(透過 Anthropic API key),將簡單任務路由到 MiniMax M2.5(透過 OpenRouter)——這種混合策略在 2026 年已成為進階用戶的標準做法。
OpenClaw 與 ChatGPT Plus 搭配使用需要 API Key 嗎?
不需要。透過 Codex OAuth 認證,你的 ChatGPT Plus 或 Pro 訂閱直接涵蓋 OpenClaw 的模型使用。OAuth 認證過程在瀏覽器中完成,token 自動儲存在 ~/.openclaw/agents/<agentId>/agent/auth-profiles.json。若你同時需要使用 OpenAI 的 embeddings(嵌入向量)功能,則需額外設定 API Key,因為 Codex OAuth 不涵蓋 embeddings 端點。
GPT-5.4 在 OpenClaw 中的實際表現如何?
GPT-5.4 在工具呼叫(tool calling)的語法準確度與多步驟任務的上下文追蹤上表現穩定。其工具搜尋(Tool Search)機制讓 OpenClaw 在掛載大量技能時不會因 token 過載而降低效能。但複雜程式碼重構任務中,部分開發者仍反映 Opus 4.6 的跨檔案一致性更高。
Kimi K2.5 可以在 OpenClaw 中使用嗎?
可以,但需透過第三方路由。Kimi K2.5 目前不是 OpenClaw 的第一方供應商,但可透過 OpenRouter 或 haimaker.ai 的 API 端點接入。設定方式為在 openclaw.json 中指定 openrouter/moonshotai/kimi-k2.5 並提供對應的 API Key。
MiniMax M2.5 的安全性如何?社群對其有什麼顧慮?
M2.5 模型權重完全開源(MIT 授權),可在私有叢集部署。主要顧慮來自兩方面:一是 MiniMax 的前代模型(M2、M2.1)曾被指出在基準測試中存在 reward-hacking 行為;二是上海的數據主權法規可能影響使用官方 API 的企業。自建部署可規避第二點風險。
四個模型中哪個最適合台灣企業導入?
取決於使用場景。台灣金融業與科技業若需處理大量中英文文件分析與合規審查,Opus 4.6 的 Adaptive Thinking 與 200K-1M 上下文視窗最為適合。若預算有限且以程式碼開發為主,MiniMax M2.5 的性價比最高。GPT-5.4 則適合需要跨領域能力(程式碼 + 文件 + 電腦操控)的通用場景。
引用來源
- OpenAI — Introducing GPT-5.4
- OpenClaw GitHub Repository
- OpenClaw Documentation — OpenAI Provider
- Artificial Analysis — Model Intelligence Index
- Kimi K2.5 Tech Blog — Moonshot AI
- MiniMax M2.5 Official Announcement
- DataCamp — GPT-5.4 vs Claude Opus 4.6
關於作者
Erik (EKC) @ Tenten.co
Tenten 經歷了從 Cursor 到 Claude Code 再到全面 Agentic Coding 的技術遷移。我們在這個過程中同時評估了 OpenClaw、Claude Code、Codex CLI 與多個開源替代方案的實際生產效率。一個實務觀察:對於台灣企業客戶,我們目前建議採用「GPT-5.4 為預設 + Opus 4.6 為程式碼專用」的雙模型策略,搭配 OpenClaw 或 Claude Code 作為代理框架。這不是因為單一模型不夠好,而是因為 2026 年的前沿模型已經進入「各有專精」的碎片化階段——死守單一模型的團隊,效率損失通常在 20-30% 之間。
若您正在評估 AI 代理框架的導入策略,或需要針對特定產業場景(金融、製造、電商)選擇最適模型組合,歡迎與 Tenten 團隊預約諮詢。
延伸閱讀:
