資安新創 AISLE 用每百萬 token 僅 0.11 美元的 3.6B 引數小模型，複現了 Anthropic 旗艦資安系統 Mythos 的部分核心展示。AI 資安能力的邊界比你想的更「參差不齊」。
（前情提要：Anthropic發布Mythos之時，會是DeFi的核爆時刻嗎？）
（背景補充：Anthropic Mythos 太強嚇出緊急會議：貝森特、鮑爾召集花旗,高盛,美銀,大小摩，五大銀行聚焦金融風險）

本文目錄

Toggle

Mythos 展示了什麼，小模型又複現了什麼？
為什麼更大的模型，不等於更安全的系統
護城河在哪裡、不在哪裡

Anthropic 本週發布尚未公開的模型 Claude Mythos Preview，並同步啟動 Project Glasswing 玻璃翼計畫，由亞馬遜、蘋果、微軟、CrowdStrike、思科等 12 家科技公司組成，使用該模型進行防禦性資安研究。

因為 Mythos 據稱自主找出每個主要作業系統與瀏覽器中的數千個零日漏洞（zero-day vulnerability，指尚未公開修補、連廠商都可能不知道的安全缺陷），暗示一個由 AI 主導資安防禦的新紀元即將開啟。

然而不到一週，由前 DeepMind 與 Anthropic 研究員 Stanislav Fort 共同創辦的資安新創 AISLE，在公司技術部落格發表了一份系統性報告。

核心結論直接：在 Mythos 的旗艦展示任務中，一個 active 引數僅 3.6B、每百萬 token 花費 0.11 美元的開源小模型，達成了相同的漏洞偵測結果。

Mythos 展示了什麼，小模型又複現了什麼？

AISLE 設計了三組測試，分別對應不同難度與性質的資安任務。

第一組是 OWASP（開放 Web 應用安全專案）偽陽性測試。

翻譯過來就是，一段 Java SQL 查詢程式碼看起來像 SQL Injection（資料庫注入攻擊），但實際上邏輯安全。正確答案是非漏洞。

測試結果呈現近乎逆向的 scaling（規模縮放）效應：小型開源模型 GPT-OSS-20b（3.6B active 引數，$0.11/M tokens）正確追蹤了程式邏輯，判定無害。

相反地，Claude Sonnet 4.5、所有 GPT-4.1/5.4 系列（o3 與 pro 除外）、Anthropic 全系列至 Opus 4.5，均自信地誤判為高危漏洞。只有極少數頂端模型 — o3、OpenAI-pro、Sonnet 4.6、Opus 4.6 答對。

第二組是 FreeBSD NFS 漏洞，即 Mythos 旗艦發布中特別展示的 CVE-2026-4747，一個 17 年歷史、未授權遠端程式碼執行漏洞。

結果：8/8 個受測模型全部成功偵測，包括那個 3.6B active 引數的小模型。所有模型均正確識別出 stack buffer overflow（堆疊緩衝區溢位）、計算剩餘空間，並將其評為 Critical RCE。

AISLE 的結論是：此類偵測能力已「商品化」。

第三組是 OpenBSD SACK 漏洞（27 年歷史），需要真正的數學推理：追蹤有號整數溢位（signed integer overflow）的多步驟邏輯鏈。

難度顯著提升，模型表現分化。GPT-OSS-120b（5.1B active 引數）完整複現了漏洞利用鏈，AISLE 評為 A+；Kimi K2 開源版本得 A-；而 Qwen3 32B 則給出「程式碼很健壯」的錯誤結論，評 F。

即便在這個更困難的任務上，一個成本極低的開源模型仍然達成了旗艦系統的同等展示。

為什麼更大的模型，不等於更安全的系統

這份報告的真正論點不是「小模型夠用」，而是 AI 資安能力的結構遠比外界想像複雜。

AISLE 將資安 AI 管線拆解為五個獨立子任務：

廣譜掃描（broad scanning）
漏洞偵測（vulnerability detection）
分流驗證（triage and validation）
修補生成（patch generation）
漏洞利用構建（exploit construction）

每個子任務的 scaling 性質不同，所需的模型能力也不同。Mythos 的公告將這五個層次整合呈現為一個完整系統，但實際上它們的模型需求差異極大，某些子任務在 3.6B 引數下已完全飽和，某些則需要複雜推理能力。

這呼應了 2023 年哈佛商學院研究者 Dell’Acqua 與 Mollick 等人提出的「Jagged Frontier」（參差不齊邊界）概念：AI 能力的邊界不是一條平滑曲線，而是凹凸不平的鋸齒狀，在某些任務上遠超人類，在相鄰任務上卻意外脆弱。

該研究顯示，使用者若在能力邊界內部署 AI，生產力提升約 40%；若貿然延伸至邊界外，表現反而下降 19%。

AISLE 在這個框架下提出了更具操作性的推論：「一千個夠用的偵探無處不搜，比一個天才偵探猜測在哪裡找，能發現更多漏洞。」

大量部署低成本模型進行廣譜掃描，在總體效益上可能優於謹慎排程單一高成本模型。AISLE 表示自 2025 年中旬起已在真實目標上執行漏洞發現系統：在 OpenSSL 中找到 15 個 CVE（其中單次安全版本包含 12 個，CVSS 9.8 Critical），curl 中 5 個，跨超過 30 個專案共計逾 180 個外部驗證 CVE。

護城河在哪裡、不在哪裡

這份分析對 Anthropic 而言既非全面批評，也非單純背書。

AISLE 明確表示，Mythos 的意義在於證明「AI 資安」這個類別是真實的，它不只是演示實驗室裡的概念，而是可以在真實目標上運作的系統。Anthropic 正在做的，是最大化「每 token 的智慧密度」，這在需要深度推理的任務上仍有難以替代的價值。

但 AISLE 同時點出了一個對整個產業而言更根本的問題：護城河在系統，不在模型本身。

在資安領域，AISLE 認為嵌入深度專業知識的架構設計，例如：如何分解任務、如何在子任務間排程不同成本的模型、如何在生產環境中維持維護者信任，才是真正的差異化來源。

一個能在 OpenSSL 裡找出 CVSS 9.8 漏洞的系統，與一個在受控展示中偵測到已知模式漏洞的系統，需要的不只是更強的模型，而是完全不同的工程邏輯。

總的來說，AISLE 的報告發現：更廉價、更開放的模型已能複現其部分核心展示。真正的問題或許不是誰的模型最強，而是誰先把這五個子任務的架構在生產環境中跑通。

View Source

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

POLITICO 民調：45% 的美國人認為加密貨幣投資風險太高，50% 更信任銀行

AI 行業動態

根據 POLITICO 的一項民調，45% 的美國人認為加密貨幣投資不值得冒險，而約 50% 的受訪者表示他們更信任傳統銀行來保護他們的資金。該民調也發現，44% 的受訪者認為人工智慧發展得太快，

GateNews4小時前

Amazon 與 OpenAI 擴大合作：模型上架 Bedrock、微軟獨家結束

AI 行業動態

OpenAI 5 月 3 日宣布與亞馬遜雲端服務（AWS）擴大合作、OpenAI 模型與 Codex 編碼代理將透過 Amazon Bedrock 提供給 AWS 客戶使用。根據 CNBC 報導，本次擴大是在 4 月底 OpenAI 與微軟（Microsoft）終止雲端獨家合約後的關鍵下一步—OpenAI 從「微軟雲端唯一」轉向多雲端部署。AWS 同期已完成 OpenAI 產品在 Bedrock 平台的初步整合。背景：OpenAI-微軟獨家合約結束、IP 授權延至 2032 年 4 月底 OpenAI 與微軟達成新協議：原本的「微軟對 OpenAI 產品與 IP 獨家存取」結構結束、Op

鏈新聞abmedia5小時前

研究人員部署 DPN-LE 技術以編輯 AI 性格特徵，僅編輯 0.5% 的神經元

AI Agent AI 行業動態

根據 BlockBeats 的說法，5 月 3 日，AI 研究員 Brian Roemmele 透露，他的 Zero-Human 公司已部署 DPN-LE（雙重人格神經元定位與編輯）技術，以精準調整

GateNews6小時前

Claude 取得時間工具存取權後，每 15 分鐘檢查一次時鐘

AI 行業動態

根據開發者 Om Patel，Claude AI 在 5 月 3 日取得一個時間工具的存取權後，開始頻繁查看時鐘，且模型每 15 分鐘檢查一次。這項觀察指出，大型語言模型過去先前缺乏原生的時間感知能力，並且不知曉當前時間或

GateNews7小時前

Founders Fund 在 5 月 3 日關閉 60 億美元旗艦基金，為自成立以來規模最大

AI 行業動態

根據彭博（Bloomberg），Founders Fund 於 5 月 3 日以 60 億美元完成其最新旗艦基金的募資，顯著超過其先前約 34 億美元的基金。該基金由億萬富翁 Peter Thiel 共同創立，將聚焦於包含人工在內的高成長產業

GateNews7小時前

最新 POLITICO 民調：45% 的美國人表示加密貨幣投資風險太高，44% 擔憂 AI 進展過快

AI 行業動態

根據 POLITICO 的民調，儘管 AI 與加密貨幣產業向 2026 年美國中期選舉注入了大量政治資金，美國民眾仍大多對這兩個產業抱持懷疑態度。調查發現，45% 的美國人認為投資加密貨幣不值得

GateNews8小時前

留言

0/400

暫無留言