Agentic AI 本週重大進展：從企業代理平台到多模型共識機制，10 項關鍵更新一次掌握

2026 年 2 月第一週，Agentic AI 領域密集釋出多項產品更新。從 OpenAI 正式進軍企業級代理管理，到 Perplexity 將多模型推理帶入日常研究流程，再到 Claude Code 開始「反思」開發者的工作模式，這些動態共同指向一個趨勢：AI 代理正從概念驗證階段，快速過渡到生產環境的實際部署。

以下逐一拆解這 10 項更新的技術意涵與產業影響。

一、OpenAI 發布 Frontier：企業級 AI 代理平台

OpenAI 於 2 月 5 日正式推出 Frontier，定位為企業建置、部署與管理 AI 代理的一站式平台。Frontier 的核心設計理念，是將 AI 代理視為「AI 同事」（AI coworkers），每位代理擁有獨立身份、權限邊界與可稽核的操作紀錄。

Frontier 整合了企業內部分散的資料倉儲、CRM 系統、票務工具與內部應用程式，建立統一的語意層（semantic layer），讓 AI 代理能存取與人類員工相同的業務脈絡。根據 OpenAI 公布的早期案例，一家全球投資公司在銷售流程中部署代理後，業務人員可用於客戶互動的時間增加超過 90%；一家能源企業則透過 Frontier 提升產出約 5%，對應超過 10 億美元的額外營收。

目前 Frontier 採限量開放，HP、Oracle、State Farm、Uber 等企業已加入早期使用者行列。值得留意的是，該平台採開放架構，可管理 OpenAI 自建的代理、企業自行開發的代理，甚至來自 Anthropic 等第三方的代理。這意味著 OpenAI 的策略並非鎖定生態系，而是爭當企業 AI 代理的「作業系統」。

在產業競爭層面，Frontier 的推出緊接在 Anthropic 發布 Cowork 之後。Anthropic 目前在企業市場握有約 32% 的佔有率，OpenAI 需要證明 Frontier 能在整合深度和部署效率上帶來差異化價值。

二、Perplexity 推出 Model Council：多模型共識研究機制

Perplexity 於 2 月 5 日發布 Model Council，這是一個多模型研究功能，允許使用者將單一查詢同時發送至三個前沿模型（如 Claude Opus 4.6、GPT-5.2、Gemini 3 Pro），由「主席模型」（chair model）綜合各家輸出，標示共識區域、歧見點與各模型的獨特貢獻。

Model Council 的設計邏輯源自一個實際觀察：不同模型在不同任務上的表現差異日益擴大。同一問題交給模型 A 可能得到最佳解答，換成模型 B 就可能遺漏關鍵面向。Perplexity 的產品回應方式，是將這種差異性轉化為品質訊號，而非試圖隱藏它。

目前 Model Council 僅對 Perplexity Max 和 Enterprise Max 訂閱用戶開放，且暫時只支援網頁版。其推薦使用場景包括投資研究（降低單一模型偏誤的財務風險）、複雜決策（如職涯轉換或重大採購）、以及需要快速交叉驗證事實的場景。

從更宏觀的角度看，Model Council 代表了 AI 搜尋工具的一次方法論轉變：從「信任單一權威 AI 聲音」轉向「透過比較與綜合建立可信度」。

三、Claude Code 新增 /insights 指令：AI 編碼助手開始「自我反思」

Anthropic 於 2 月 4 日為 Claude Code 加入 /insights 指令。執行後，Claude Code 會讀取過去 30 天的使用歷史，生成一份互動式 HTML 報告，內容涵蓋專案摘要、工具使用模式、摩擦點分析與個人化的工作流程改善建議。

技術實作上，/insights 是一個多階段流程：首先收集 ~/.claude/projects/ 下的所有對話紀錄，過濾掉子代理對話與內部操作；接著提取結構化元資料（token 用量、工具調用次數、對話時長等）；再透過 LLM 分析提取定性「面向」（facets），最終渲染成互動報告。超過 30,000 字元的對話紀錄會先分段摘要再進行面向提取。

早期使用者的回饋顯示幾個有趣發現：有開發者在一個月內累積了 2,200 小時、3,625 個 Claude Code 對話；也有人被報告「溫柔地批評」了過多的對話中途放棄行為。一位開發者形容這像是「收到一位消息靈通的 AI 主管的績效評估」。

這項更新的意義在於，AI 編碼工具正從「被動回應指令」進化為「主動分析開發者行為模式」。當 AI 代理開始理解人類的工作習慣，未來的人機協作效率可能出現質的提升。

四、Cloudflare Agents SDK v0.3.7：即時代理與持久工作流的統一

Cloudflare 於 2 月 3 日發布 Agents SDK v0.3.7，正式將即時代理（Agents）與持久工作流（Workflows）整合為統一架構。在此之前，開發者面臨一個實際挑戰：處理 WebSocket 即時連線的代理系統，與處理長時間運行任務的工作流系統，屬於兩套獨立的技術堆疊。

新版 SDK 引入 AgentWorkflow 類別，讓工作流可透過多種機制與代理溝通：RPC 呼叫（直接調用代理方法並具備完整型別安全）、進度回報（觸發代理的回呼函式）、狀態更新（透過 step.updateAgentState() 修改代理狀態並自動廣播給所有已連線客戶端）、以及客戶端廣播（向所有 WebSocket 連線發送訊息）。

這次更新同時帶來同步狀態管理（setState() 搭配驗證掛鉤）和固定間隔排程（scheduleEvery()）。從架構層面看，Cloudflare 填補了反應式代理系統與持久化任務系統之間的關鍵缺口，讓開發者能在同一平台上建置既能即時互動、又能處理長時間任務（包括人機協作審批流程）的 AI 代理。

五、Firecrawl v2.8.0：平行代理與 Spark 模型家族

Firecrawl 發布 v2.8.0，主打平行代理（Parallel Agents）功能，支援同時執行數千個 /agent 查詢，搭配自動故障處理與智慧瀑布式執行。系統會先以 Spark 1 Fast 嘗試即時擷取，對複雜查詢自動升級至 Spark 1 Mini 進行深度研究。

本次更新同步推出 Spark 模型家族三款模型：Spark 1 Fast（即時擷取，目前僅 Playground 可用）、Spark 1 Mini（預設模型，成本較 Pro 低約 60%）、Spark 1 Pro（複雜多領域研究場景，召回率約 50%）。Firecrawl 還新增了 CLI 工具、Firecrawl Skill（讓 Claude Code、Codex 等 AI 代理自主使用 Firecrawl），以及 MCP Server 的 agent 工具。

對於建置 AI 應用的開發者而言，這意味著網頁資料擷取終於能以生產級規模運行。過去需要人工處理數小時的批量研究任務，現在可透過 API 在數分鐘內完成結構化提取。

六、Perplexity Deep Research 升級：採用 Opus 4.5 並推出 DRACO 基準

Perplexity 同步升級了 Deep Research 功能，底層模型更換為 Opus 4.5（Max 和 Pro 用戶適用），並在外部基準測試（包括 Google DeepMind Deep Search QA 和 Scale AI Research Rubric）中達到最先進的準確度表現。

Perplexity 同時推出開源基準 DRACO，涵蓋 10 個領域，用於評估研究型代理的表現。這是 AI 研究工具領域較少見的開放評估框架，有助於建立跨平台的比較標準。

Comet 瀏覽器代理也同步升級，預設由 Opus 4.5 驅動（Max 用戶可選用 Opus 4.6），在處理複雜任務如分析儀表板數據、追蹤 GitHub 提交歷史等場景上，推理能力大幅提升。

七、ElevenLabs 發布 AI 編碼助手技能包

ElevenLabs 推出新的技能包（Skills），改善 AI 編碼助手整合語音和音訊 API 的方式。這項更新降低了建置語音優先代理工作流的門檻。

語音介面在代理系統中的角色日益重要。當 AI 代理需要與終端用戶進行自然對話互動時，語音合成與辨識能力成為基礎設施層的關鍵元件。ElevenLabs 此舉讓開發者能更便捷地將高品質語音能力嵌入 AI 代理應用中。

八、Vercel Agent-Browser 新增 iOS 支援

Vercel 的 agent-browser 現已支援在 iOS 裝置上執行瀏覽器自動化。此前，代理驅動的瀏覽器自動化主要限於桌面環境。

行動端的支援擴展意味著 AI 代理的「操作範圍」不再受限於傳統運算環境。隨著行動商務和行動辦公場景持續擴大，代理能在 iOS 裝置上執行自動化操作，將打開一系列新的應用可能性。

九、Microsoft 展示自訂 Copilot 代理建置流程

Microsoft 釋出關於擴展和自訂 Copilot 代理的官方指引，降低了非技術人員建立 AI 代理的門檻。

這項更新的背景是 Microsoft 近幾個月加速推動 Agent 365 策略，試圖將代理能力深度整合到企業既有的 Office 和 Azure 生態系中。與 OpenAI Frontier 主打的「代理作業系統」定位不同，Microsoft 的路線更偏向「在既有企業工具中嵌入代理能力」，兩種策略各有其目標客群。

十、Helius 實現 AI 代理的自動 API 金鑰生成

Helius 讓 AI 代理能自動生成錢包、為帳戶注入資金並取得 API 金鑰，全程無需人工設定。這項功能實現了鏈上代理（on-chain agents）的真正自主入駐。

在 Web3 領域，代理的自主操作一直受限於帳戶開通和金鑰管理的人工環節。Helius 的解決方案移除了這個瓶頸，讓 AI 代理能在 Solana 生態系中自主完成從帳戶設定到執行操作的完整流程。對於去中心化金融（DeFi）和自動化交易場景，這代表了代理自主性的一次實質突破。

本週觀察：三大趨勢浮現

趨勢	代表事件	意涵
企業代理管理平台化	OpenAI Frontier、Microsoft Copilot 代理	AI 代理正式進入企業 IT 管理範疇，需要身份、權限、稽核等治理機制
多模型協作與評估	Perplexity Model Council、DRACO 基準	業界正在承認單一模型的局限性，轉向多模型共識作為品質保證手段
基礎設施層完善	Cloudflare Agents + Workflows、Firecrawl 平行代理、Helius 自動入駐	代理部署所需的底層基礎設施正快速成熟，降低生產化門檻

這些更新共同傳遞的訊號是：2026 年的 Agentic AI 競爭已經從「模型能力」轉向「部署與管理基礎設施」。誰能讓企業最順暢地將 AI 代理整合到既有業務流程中，誰就能在下一階段的市場競爭中佔據優勢。

引用來源

關於作者

Tenten Research Team

Tenten 研究團隊長期追蹤 AI 基礎設施與企業應用的前沿動態，專注於協助企業理解技術趨勢並制定落地策略。我們認為，2026 年企業導入 AI 代理的成敗關鍵已經從「選擇哪個模型」轉向「如何在既有系統中安全、可控地部署和管理代理」。這需要的不只是技術能力，更需要組織層面的準備——包括治理框架、權限架構與成效評估機制。

若您的企業正在評估 AI 代理的導入策略，或需要協助建置代理管理架構，歡迎與 Tenten 團隊預約諮詢，我們將根據您的業務場景提供具體的技術方案建議。

The primary liaison for our key clients, ensuring their goals are met and expectations are exceeded.