📰 重點摘要
Anthropic 宣布將重新開放旗下最強大的兩款 AI 模型 Claude Fable 5 與 Mythos 5 的公開存取權限。這兩款模型自 6 月 12 日起遭美國政府以出口管制為由強制下架,起因是亞馬遜研究人員發現可繞過 Fable 5 安全護欄的方法,使模型得以識別多個軟體漏洞並生成利用程式碼。美國政府已於週三正式解除限制。
Anthropic 表示,復上線版本將搭載一套全新分類器(classifier),專門針對更廣泛的網路安全相關指令進行識別與封鎖。商務部長霍華德·盧特尼克確認,政府已完成對 Fable 5 的審核與核准程序,並強調此舉旨在「鞏固美國在 AI 領域的領導地位」。
此次事件同時推動 Anthropic 在「Project Glasswing」框架下,加速與 Amazon、Microsoft、Google 等夥伴共同研擬評估 AI 越獄嚴重程度的共識標準,並建立預發布模型測試機制、越獄資訊共享管道及聯合研究資源。值得關注的是,已有知名 AI 研究人員公開宣稱在 Fable 5 上線後 48 小時內即完成越獄,顯示護欄強化仍面臨持續挑戰。
💬 JudyAI Lab 觀點
Anthropic旗下Fable 5與Mythos 5兩款頂尖模型,因安全護欄遭研究人員繞過,被美國政府強制下架三週後本週復上線。模型安全漏洞直接觸發政策管制,是近年罕見的案例。
這個事件說明,AI安全護欄是持續的攻防,不是部署時一次性的設定。即便資源最充足的公司,仍在模型上線後48小時內面臨被越獄的現實。Anthropic此次搭載新分類器,針對網路安全相關指令進行更細緻識別,但社群研究人員已表示能否持久有疑慮。更值得關注的是「Project Glasswing」推動的跨企業協作——制定越獄嚴重程度的共識標準、建立預發布測試與資訊共享機制,代表業界嘗試把各自為政的安全評估轉向集體防禦。
這個案例提醒我們,在應用層構建產品時,不能把安全責任全部外包給底層模型。審視自己的輸入過濾與輸出審核機制,是現在就能做的一步。
📅 原文資訊
- 發布時間:2026-07-01T06:14
- 來源原文:https://cointelegraph.com/news/anthropic-reactivates-newest-ai-models-after-us-govt-lifts-restrictions?utm_source=rss_feed&utm_medium=rss_tag_ai&utm_campaign=rss_partner_inbound