Claude Mythos AI 实现 73% 网安难题突破

  • Claude Mythos Preview 完成首个企业网络攻击模拟
  • DeepSeek AI 攻克 73% 高难度黑客挑战
  • Anthropic 推出 Claude Mythos 测试版

根據英國人工智慧安全研究所(AISI)的新評估,Anthropic 的 Claude Mythos 預覽成為首個完成完整模擬企業網路攻擊的 AI 模型。

這些發現於模型於4月7日公布數日後公布,顯示人工智慧網路能力已達到全球資安團隊必須立即關注的水準。

什麼是克勞德神話?

Anthropic 於 4 月 7 日發表了 Claude Mythos 預覽版,並未廣泛公開發售。團隊反而給予資 安研究公司有限度的存取 權限,以評估並準備其先進能力。

「這款機型在各方面表現優異,但在電腦安全任務上更是表現突出。為此,我們啟動了 Project Glasswing,旨在利用 Mythos Preview 來協助保護全球最關鍵的軟體安全,並為產業準備我們必須採取的做法,以領先於網路攻擊者, 」公告中 寫道。

追蹤我們的X ,隨時掌握最新消息

這項發展已開始引起科技界甚至政策界的關注。 根據 路透社引述知情人士的報導,美國財政部長斯科特·貝森特與聯準會主席鮑威爾召開了與主要銀行執行長的緊急會議,警告此模式可能帶來的 網路 風險。

克勞德神話預覽的表現

英國政府科學、創新與技術部轄下的人工智慧安全研究所(AISI)對 Anthropic 的 Claude Mythos 預覽進行網路評估, 以檢視其網路安全 能力。

首先是奪旗(CTF)評估,系統必須識別並利用漏洞來取回隱藏的「旗幟」。Mythos 在專家級任務中達成了 73% 的成功率。此問題在2025年4月之前,任何模型都未曾解決。

Claude Mythos Cyber Attack Capabilities
Claude Mythos 網路攻擊能力。資料來源: AISI

此外,AISI 還建立了一套名為「The Last Ones」(TLO)的 32 步驟企業網路攻擊模擬。人類安全專業人員大約需要20小時才能完成。

Mythos Preview 在 10 次嘗試中完成了整個模擬。平均而言,它完成了32個攻擊步驟中的22個。克勞德作品4.6,第二佳作,平均僅有16步。

「Mythos Preview 在一個網路範圍的成功顯示,它至少能自主攻擊那些小型、防禦薄弱且脆弱的企業系統,只要能取得網路存取權。不過,我們的射程與現實環境有重要差異,使它們成為更容易成為目標,」團隊補充。

Anthropic 自己的紅隊測試發現,Claude Mythos Preview 在用戶明確指示下,能偵測並利用所有主要作業系統及主流瀏覽器的零時差漏洞。

「我們這裡能報告的資料有限。我們發現的漏洞中超過99%尚未修補,因此公開細節將是不負責任的,」團隊表示。

AISI 指出,組織應優先推動基礎的網路安全措施。這些措施包括定期修補、嚴格的存取控制、強化安全設定,以及全面記錄。

訂閱我們的 YouTube 頻道,觀看領袖與記者提供專家見解

要阅读来自BeInCrypto的最新加密货币市场分析,点击此处

文章免责声明

根據信託計畫(Trust Project) 條款,本篇文章僅供參考,不應視為金融或投資的具體建議。BeInCrypto 致力於提供準確、公正的報告,但市場情況可能會有所變化,恕不另行通知。在做出任何財務決定之前,請務必自行研究並諮詢專業人士。請注意,我們的《服務條款與細則》、《隱私政策》 以及 《免責聲明》 已更新。