Kimi K2 Thinking:460萬美元訓練出的AI模型,如何在全球最難測試中擊敗OpenAI?
Kimi K2 Thinking 在評估推理、編碼和代理能力的基準測試中創下了新紀錄。K2 Thinking 在使用工具的 HLE 上達到 44.9%,在 BrowseComp 上達到 60.2%,在 SWE-Bench Verified 上達到 71.3%,展現了作為最先進的思考代理模型的強大泛化能力
With over 20 years of experience in technology, and the startup industry, I am passionate about AI and driving innovation. Keeping the engine running
Kimi K2 Thinking 在評估推理、編碼和代理能力的基準測試中創下了新紀錄。K2 Thinking 在使用工具的 HLE 上達到 44.9%,在 BrowseComp 上達到 60.2%,在 SWE-Bench Verified 上達到 71.3%,展現了作為最先進的思考代理模型的強大泛化能力
一個人的薪水比好幾個國家的 GDP 還高?伊隆·馬斯克這波操作到底是在賭什麼?5 分鐘帶你搞懂整件事的來龍去脈!#ElonMusk
Google 宣布將在 AI 搜尋結果中導入廣告,這將顛覆傳統 SEO 與 SEM。本篇深入解析 SGE 廣告的運作模式,以及行銷人該如何調整策略,搶佔先機
伊隆·馬斯克表示「未來將不再有手機」。他預測我們將使用他的腦晶片,而不是 iPhone 或 Android 手機來保持聯繫
OpenAI 啟動 IPO 程序,劍指 1 兆美元估值。本文將詳細剖析其技術護城河、財務狀況與 Sam Altman 的長期戰略,評估這家 AI 領導者進入公開市場所面臨的機遇與挑戰
Agent 3 可以在平台內使用,以構建原型、擴展專案或創建自定義自動化代理。