Anthropic 推出 Managed Agents:你的 AI Agent 不用自己養伺服器了
Anthropic 推出 Claude Managed Agents 託管式 Agent 基礎設施,將沙箱隔離、狀態持久化、故障恢復等基礎設施全部外包,開發者只需定義 Agent 邏輯。三層解耦架構(Session/Harness/Sandbox)讓 p95 TTFT 降低超過 90%,定價 $0.08/session-hour。
Anthropic 推出 Claude Managed Agents 託管式 Agent 基礎設施,將沙箱隔離、狀態持久化、故障恢復等基礎設施全部外包,開發者只需定義 Agent 邏輯。三層解耦架構(Session/Harness/Sandbox)讓 p95 TTFT 降低超過 90%,定價 $0.08/session-hour。
Anthropic 發布 Project Glasswing 資安計畫,投入 1 億美元 AI 信用額度與 400 萬美元捐款。透過未公開的 Claude Mythos Preview 模型在全球關鍵軟體中發現數千個零日漏洞,包括存在 27 年的 OpenBSD 漏洞與 16 年的 FFmpeg 漏洞。
2026年具身智能(Embodied AI)將AI Agent從聊天框帶入物理世界。VLA(Vision-Language-Action)統一架構讓機器人首次能理解自然語言指令並在陌生環境中規劃動作。NVIDIA提供Isaac+GR00T完整工具鏈,遠端操控數據採集大幅降低訓練成本,AI軟硬體整合的關鍵時刻已來臨。
Judy 分享管理 AI Agent 團隊的血淚經驗:傳統管理技能如信任授權、激勵制度對 AI 完全失效,AI 沒有自尊也不在乎影響力。目標拆解、閉環追蹤與品質閘門才是關鍵。Gate-6 驗收機制是從多次空包任務失敗中被迫演化出的解決方案。
AI 最大的硬傷是失憶。但比一個 AI 失憶更可怕的,是一整個 AI 團隊失憶。我們有 6 個 Agent 跑在 Claude、MiniMax、Gemini、Dify 四種平台上,每個平台的記憶機制完全不同。這篇文章完整拆解每個 Agent 的記憶設計、團隊共享記憶層、Dify 知識庫、自動進化機制,以及我們踩過的所有坑。
Jack Dorsey 發文主張用 AI 取代中層管理,我們團隊已經每天在運行 AI COO。Dorsey 的觀點翻轉了對組織的理解——層級制本質是信息路由協議,AI 可以取代這個功能。但真正做起來沒有那麼浪漫,AI 不會自己建立信任,人要不斷監控。
ByteDance 火山引擎推出 OpenViking,用檔案系統邏輯重新設計 AI Agent 記憶。三層載入機制(L0/L1/L2)讓 Agent 先看目錄再決定要不要打開檔案,token 消耗從 24.6M 降至 4.3M,任務完成率從 35% 提升至 52%。
作者分享從一人扛所有事到建立 AI Agent 團隊的轉變,介紹四層架構(決策者、管理Agent、執行Agent、自動化腳本)如何分工協作。強調品質閘門的重要性——AI 說完成不代表真的完成,需要四關審核才能上架。最終從執行者變成管理者,用決策和品質把關創造更高價值。
AI Agent 正在從聊天機器人進化成能自主交易的數位代理人,但當 AI 能自己花錢時,確認「背後是誰」變得至關重要。World、Coinbase、Visa 和 Mastercard 正在建立 AI 時代的身分驗證基礎設施,透過零知識證明等技術,讓平台能驗證 Agent 代表的是真人而非惡意機器人。
Agent 說完成,不代表真的完成——這是我們在 Judy AI Lab 用血淚驗證過的事。靜默失敗的定時任務、四成的交付退回率,逼得我們設計出一套五段式自我審查閉環:從 spec 確認、實作、Code Review、Fix,到小月 QA 打分。上線一個多月,退回率從四成降到一成。