你花多少時間在「讓 Agent 跑起來」,又花多少時間在「讓 Agent 做真正的事」?
如果你有自建 Agent 基礎設施的經驗,答案大概是 70:30——七成時間花在沙箱隔離、狀態管理、故障恢復這些「水電工程」上,三成才是 Agent 本身的邏輯。
4 月 8 日,Anthropic 正式公測 Claude Managed Agents,直接把這個比例翻過來。
先說結論:這東西解決什麼問題?
一句話:Agent 基礎設施外包給 Anthropic,你只管寫 Agent 邏輯。
以前要讓一個 AI Agent 在雲端自主執行任務,你得自己搞定:
- 容器化執行環境
- 工具呼叫的路由與安全隔離
- Session 狀態持久化
- 當機恢復機制
- 認證資訊的安全邊界
現在這些全部由 Managed Agents 託管。你定義 Agent(模型 + 系統提示 + 工具 + MCP Server),Anthropic 負責讓它穩定、安全、可恢復地運行。
架構設計:三層解耦
Anthropic 工程團隊在設計文件中,把 Managed Agents 類比為作業系統——就像 OS 把硬體虛擬化成程式能用的抽象層,Managed Agents 把 Agent 的元件虛擬化成三個解耦的介面:
Session(大腦的記憶)
一個 append-only 的持久化事件紀錄,記錄 Agent 做過的每一件事。它獨立於 Claude 的 context window 之外,不會因為上下文壓縮而遺失資訊。
你可以隨時用 getEvents() 查詢完整歷史。
Harness(大腦的迴圈)
呼叫 Claude、路由工具請求的執行迴圈。關鍵設計:完全無狀態。Harness 當機了?新的 Harness 用 wake(sessionId) 啟動,從 Session log 恢復,繼續執行。不需要任何東西「活過」一次當機。
Sandbox(雙手的工作台)
雲端容器環境,可以預裝 Python、Node.js、Go 等套件,設定網路存取規則,掛載檔案。每個 Sandbox 都是「牲畜」而非「寵物」——用完即棄,隨時重建。
安全關鍵:認證資訊永遠不會出現在 Sandbox 裡。Git token 在初始化時注入 local remote,MCP OAuth token 存在安全保險庫中,由專用 proxy 代理存取。
這個三層解耦的設計帶來一個實際效果:p50 TTFT(首 token 延遲)降低約 60%,p95 降低超過 90%。
五步工作流程
| |
Agent 建立一次,之後跨 Session 重複使用。Environment 也是建立一次的模板。真正的「工作」發生在 Session 裡。
定價:兩個維度
Managed Agents 的計費很直覺:
| 項目 | 費用 |
|---|---|
| API Token | 依模型定價(如 Opus 4.6:輸入 $5/MTok,輸出 $25/MTok) |
| Session 運行時間 | $0.08 / 小時(精確到毫秒) |
| Web 搜尋 | $10 / 1,000 次搜尋 |
只計算 running 狀態——閒置、排程中、已終止的時間不計費。Session 運行費取代了原本的 Code Execution 容器時數計費。
實際算一次
一個用 Opus 4.6 跑一小時的 coding session,消耗 50K 輸入 + 15K 輸出 token:
| |
如果啟用 prompt caching(40K cache 讀取),總計降到 $0.525。
跟自建基礎設施的 EC2/GCP 費用比,對中小團隊來說這個價格相當有競爭力——你省下的不只是機器費用,還有維護基礎設施的工程時間。
誰已經在用?
Notion — 30+ 並行 Agent 任務
Notion 讓使用者從任務看板直接啟動 Agent 處理程式碼撰寫、文件產出、客戶交付物等任務,最多 30 個以上同時運行。透過 prompt caching 降低 90% 成本,延遲降低最多 85%。
Rakuten — 上市時間從 24 天變 5 天
樂天在產品、銷售、行銷、財務部門部署 Managed Agents,每個專職 Agent 在一週內部署完成。複雜重構任務可持續自主 coding 7 小時。關鍵錯誤減少 97%,發布頻率從每季變成雙週。
Sentry — 單人數週完成整合
Sentry 用 Managed Agents 建立從 bug 偵測到 merge-ready PR 的端到端自動修復。每年處理超過 100 萬次 Root Cause Analysis,每月審查 60 萬+ PR。一名工程師在數週內完成整合——過去自建同等基礎設施需要數月。
Asana — 開發週期從年縮到週
Asana 透過 Claude 平台為 15 萬全球客戶提供 AI 功能,工程開發週期從以年計縮短到以週計。Managed Agents 的託管架構正是支撐這類大規模 Agent 部署的基礎。
目前限制
在投入之前,你需要知道這些:
- Beta 階段:所有 API 請求需要
managed-agents-2026-04-01beta header,行為可能在版本間調整 - 僅限 API 直連:不支援 AWS Bedrock、Vertex AI、Foundry
- 研究預覽功能:Outcomes、Multi-agent、Memory 需要另外申請存取
- 速率限制:建立操作 60 次/分鐘,讀取操作 600 次/分鐘
- 無 Batch 模式:Session 是有狀態的互動式執行,不支援批次
- 品牌限制:合作夥伴不能使用「Claude Code」或「Claude Cowork」品牌名稱
對 AI Agent 團隊的影響評估
以我們團隊實際運作的經驗來分析:
架構升級潛力:極高
目前多數團隊(包括我們)用 Docker + 自建框架跑 Agent。Managed Agents 提供的沙箱隔離、checkpoint 恢復、scoped credentials 管理,這些都是我們花大量時間自己造輪子的部分。
如果你的 Agent 需要執行程式碼、存取外部工具、維持長時間 Session——這三個條件都符合的話,遷移到 Managed Agents 的 ROI 非常明確。
成本結構轉變
從「固定成本」(自建伺服器、持續維護)轉向「變動成本」(按 Session 用量計費)。對任務量波動大的團隊特別有利——不用為了尖峰時段維護一堆閒置的容器。
MCP 生態加速
Managed Agents 原生支援 MCP Server,代表你現有的 MCP 工具整合可以直接搬上去用。這對已經在 MCP 生態投入的團隊是利多。
要注意的風險
- 廠商鎖定:一旦深度整合,遷移成本會很高
- Beta 穩定性:公測階段可能有 breaking changes
- API-only:如果你的流程需要 Bedrock / Vertex AI,目前還不能用
- 隱私考量:程式碼和資料在 Anthropic 的沙箱中執行,對某些合規需求可能是問題
我的觀點
Managed Agents 的本質是一個訊號:Agent 基礎設施正在從「自己蓋」變成「用租的」。
就像十年前你會自建伺服器跑 web app,現在用 AWS Lambda 或 Vercel 一樣。Agent 的基礎設施也在走同一條路——從自建到託管、從資本支出到營運支出。
對大多數團隊來說,問題不再是「要不要用」,而是「什麼時候切過去」。
如果你現在正在評估自建 Agent 基礎設施,我的建議是:先試 Managed Agents。用 $0.08/小時的價格跑幾個 Session 看看能不能滿足需求,再決定要不要自建。
自建永遠是選項,但在 2026 年,它不應該是預設選項。