4 月 7 日早上醒來滑手機,看到 Anthropic 發了一篇公告。本來以為又是模型更新之類的,點進去一看——

不是新模型上線,是他們拿出一個還沒公開的模型,去掃全世界的關鍵軟體,幾週內挖出了數千個零日漏洞

我當下的反應是:等等,這是什麼科幻片劇情?


Project Glasswing:一億美元的資安豪賭

Anthropic 把這個計畫取名叫 Project Glasswing,名字來自玻璃翼蝶(Greta oto)——一種翅膀近乎透明的蝴蝶。寓意很明確:讓軟體的安全狀態變得透明可見。

具體承諾:

  • 1 億美元 AI 使用額度,提供給合作夥伴用於漏洞掃描
  • 400 萬美元直接捐款給開源安全組織
  • 所有發現的漏洞必須與業界共享

合作夥伴陣容很嚇人。AWS、Apple、Google、Microsoft、NVIDIA 是科技巨頭那一列;CrowdStrike、Palo Alto Networks、Broadcom、Cisco 是資安公司;JPMorganChase 代表金融業;Linux Foundation 代表開源社群。加上另外大約 40 個負責維護關鍵軟體基礎設施的組織。

這不是 Anthropic 自己在玩,是拉了整個產業一起來的。


Claude Mythos Preview:Anthropic 手上最強的牌

整個計畫的核心武器是一個叫 Claude Mythos Preview 的模型。這是 Anthropic 迄今為止開發的最強大模型,目前沒有公開發布。

先看數字:在 CyberGym 漏洞重現基準測試中,Mythos Preview 拿下 83.1%,而目前公開的最強模型 Claude Opus 4.6 是 66.6%。差距超過 16 個百分點,在這種級別的基準測試裡算是非常顯著的跳躍。

但數字不是最震撼的部分。震撼的是它實際做到的事情。


那些被 AI 挖出來的漏洞

27 年的 OpenBSD 漏洞

OpenBSD 在資安圈的地位不用多說,它是以安全性聞名的作業系統,核心開發者花了幾十年在做安全強化。結果 Mythos Preview 找到一個存在了 27 年的遠端崩潰漏洞——任何人都可以遠端讓一台 OpenBSD 機器當機。

27 年。多少資安專家看過這段程式碼,多少自動化工具掃過,都沒抓到。

16 年的 FFmpeg 漏洞

FFmpeg 是幾乎所有影音處理軟體的底層依賴,從 VLC 到 Chrome 都在用。Mythos Preview 找到一個藏了 16 年的漏洞,而且——這個才是重點——自動化模糊測試工具已經命中這段程式碼超過 500 萬次,每次都沒發現問題。

AI 一看就看出來了。

Linux Kernel 權限提升鏈

Mythos Preview 不只是找單一漏洞。它自主地在 Linux 核心中找到多個漏洞並串成攻擊鏈,從普通使用者一路提權到完全控制整台機器。

這種「找到漏洞 → 想出怎麼串 → 構建完整攻擊路徑」的能力,以前需要頂尖的紅隊人員花幾週甚至幾個月才做得到。

而且根據 Anthropic 的說法,以上這些幾乎都是模型完全自主完成的,不需要人類引導。


為什麼不公開?

Anthropic 很清楚知道這個模型的雙面性。能找漏洞的 AI,同樣能被用來攻擊。所以 Mythos Preview 目前只開放給 Glasswing 的合作夥伴和大約 40 個關鍵基礎設施維護組織使用。

他們的原話是:「以 AI 進步的速度,這樣的能力不久後就會擴散,可能擴散到不會承諾安全部署的行為者手中。」

這句話其實是在說:我們現在有這個能力,別人遲早也會有。與其等壞人先拿到,不如我們先用它把洞補起來。

Anthropic 也揭露了一件事——他們發現了有紀錄以來第一起主要由 AI 執行的網路攻擊:一個中國國家級駭客組織使用 AI Agent 自主滲透了全球約 30 個目標。

這不是理論威脅,已經在發生了。


資安產業的衝擊波

消息一出,華爾街的反應很直接。CrowdStrike、Palo Alto Networks、Zscaler、SentinelOne、Okta 等主要資安公司的股價下跌了 5% 到 11%

投資人的邏輯很簡單:如果 AI 能自主找漏洞、自主修漏洞,那傳統資安公司的護城河在哪裡?

不過我認為這個反應有點過度。Glasswing 目前是防守方的工具,而且 AI 找到的漏洞最終還是需要人類開發者去修。短期內這更像是資安產業的升級催化劑,而不是替代者。但長期來看,如果 AI 不只能找漏洞還能自動修補,那確實會重新定義整個產業的價值鏈。


對開源社群的意義

這可能是 Glasswing 最重要的面向。Linux Foundation CEO Jim Zemlin 說得很直接:

「開源軟體構成了現代系統中絕大多數的程式碼……讓這些關鍵開源程式庫的維護者能夠使用新一代 AI 模型來主動發現和修復漏洞,Project Glasswing 提供了一條改變現狀的可行路徑。」

開源軟體的安全一直是個結構性問題。維護者通常是志願者或小團隊,沒有足夠資源做全面的安全審計。但他們寫的程式碼被全世界的商業軟體依賴。1 億美元的 AI 信用額度如果真的能幫這些專案做到以前做不到的安全掃描,那是實質的改善。


我的觀察

身為一個每天和 AI Agent 團隊一起工作的人,看到這個消息的感受很複雜。

興奮的部分:Claude 系列的能力上限又往上跳了一大截。Mythos Preview 在 CyberGym 上比 Opus 4.6 高出 16 個百分點,這表示下一代公開模型的推理和程式碼理解能力很值得期待。

擔憂的部分:AI 自主發現並串聯漏洞的能力,是一把雙面刃。Anthropic 現在選擇不公開、只用於防禦,這是負責任的做法。但正如他們自己說的,這種能力遲早會擴散。

務實的部分:不管你對 AI 安全怎麼看,有一件事是確定的——如果你在維護任何關鍵軟體,現在是時候認真看待 AI 輔助安全審計了。27 年沒被人類找到的漏洞,AI 幾週就挖出來。這個落差只會越來越大。


重點整理

項目內容
計畫名稱Project Glasswing
發布日期2026 年 4 月 7 日
投入資源1 億美元 AI 額度 + 400 萬美元捐款
核心模型Claude Mythos Preview(未公開)
基準測試CyberGym 83.1%(Opus 4.6 為 66.6%)
主要發現數千個零日漏洞(OpenBSD 27 年、FFmpeg 16 年)
合作夥伴AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike 等
公開狀態僅限合作夥伴,暫不公開

這是 2026 年到目前為止,AI 產業最重要的一次宣布。不是因為又出了一個更強的模型,而是因為它第一次大規模展示了 AI 在真實世界資安中的壓倒性優勢——然後選擇把這個優勢用在防禦上。

Anthropic 這一手,值得尊敬。