首页/Blog/Claude Mythos 深度解读:Anthropic 发布史上最强模型,为何选择不公开?
行业洞察#Claude Mythos#Anthropic#AI 安全#网络安全#前沿模型
Claude Mythos 深度解读:Anthropic 发布史上最强模型,为何选择不公开?

Claude Mythos 深度解读:Anthropic 发布史上最强模型,为何选择不公开?

2026年4月11日TokenStar AI 前沿研究组

2026 年 4 月,Anthropic 推出 Claude Mythos Preview——一个在 SWE-Bench、USAMO 和网络安全领域全面刷新纪录的前沿模型。但这一次,它不会对外公开。我们从能力跃升、Project Glasswing 防御联盟与行业影响三个维度,系统拆解 Mythos 的技术突破及其对 AI 安全治理的深远启示。

2026 年 4 月 7 日,Anthropic 正式发布了其最新一代前沿大语言模型——Claude Mythos Preview。这不仅是一次数据指标上的飞跃,更是人工智能行业首次因单一模型的能力而选择"不发布"。Mythos 在代码工程、数学推理和网络安全渗透测试中创下的成绩,让 Anthropic 做出了一个前所未有的决定:仅对经过审查的合作伙伴开放,用于防御而非进攻。

在这篇深度解读中,我们将从能力跃升Project Glasswing 防御生态以及对企业和行业的影响三大维度,全面拆解 Mythos 背后的技术故事与治理逻辑。

Claude Mythos 与 Project Glasswing
图 1:Claude Mythos Preview 以其突破性的网络安全能力,开启了"负责任发布"的新范式。

一、基准跃升:不是量变,而是质变

Mythos 并非在既有模型基础上的微调升级——它在几乎每一项核心基准上都实现了两位数的跨代飞跃。以下是关键数据的对比:

基准Claude MythosOpus 4.6(上代)GPT-5.xGemini 3.1 Pro
SWE-Bench Verified93.9%80.8%85.0%74.4%
SWE-Bench Pro77.8%53.4%57.7%54.2%
USAMO 202697.6%42.3%95.2%74.4%
CyberGym83.1%66.6%N/AN/A
2026 前沿模型核心基准对比
图 2:Mythos 在四大关键基准上全面领先,SWE-Bench Pro 较上代提升 24+ 个百分点,USAMO 更是跃升了 55 个百分点。

SWE-Bench:现实世界软件工程的黄金标准

SWE-Bench 要求模型理解真实 GitHub Issues,在大规模开源代码库中定位问题并提交可通过单元测试的修复补丁。Mythos 在 Verified 集上达到 93.9%,意味着它能够独立解决绝大多数真实世界的软件缺陷——这已经超过了许多中级工程师的平均表现。

更具含金量的 SWE-Bench Pro 则纳入了更复杂的架构重构和跨模块改动任务,Mythos 拿到 77.8%,相较 Opus 4.6 的 53.4% 提升了近 46%。

USAMO:从"会做题"到"能证明"

Mythos 在 USAMO 2026 上取得 97.6% 的成绩,不仅超越了 Anthropic 上代模型(42.3%),甚至略微领先 GPT-5.4(95.2%)。Anthropic 的安全评估团队指出,Mythos 能够生成形式化证明结构,其推理链条在 Olympiad 评委看来"与顶尖人类选手无异"。

CyberGym:网络安全的新纪元

CyberGym 是由 Anthropic 与 DARPA 联合设计的网络安全基准,模拟真实渗透测试环境。Mythos 达到 83.1%,较 Opus 4.6 的 66.6% 提升了近 25%——而其他主流模型在此基准上尚无公开评分。

二、网络安全突破:发现数千个零日漏洞的 AI

让 Anthropic 做出"不公开发布"决定的核心原因,是 Mythos 在网络安全领域展现出的颠覆性能力。

关键发现

Claude Mythos 在评估期间自主发现了数千个高危零日漏洞,涵盖所有主流操作系统(Linux、Windows、FreeBSD、OpenBSD)、主流浏览器及关键开源软件。其中部分漏洞已存在超过 25 年,从未被人类安全研究者发现。

自主漏洞发现与利用链构建

与传统漏洞扫描工具不同,Mythos 不依赖已知签名或模式匹配。它通过深层代码理解和逻辑推理,自主识别潜在的内存安全问题、逻辑缺陷和权限绕过路径。更令人震惊的是,它能够:

  • 构建多步利用链:将多个独立漏洞串联成完整的攻击路径,例如从 NFS 远程代码执行到浏览器沙箱逃逸。
  • 绕过安全沙箱:在评估中成功演示了浏览器沙箱逃逸和操作系统层面的隔离突破。
  • 生成 PoC 利用代码:不仅发现漏洞,还能自动编写可工作的概念验证攻击代码。
  • 超越人类效率:在模拟企业网络渗透测试中,Mythos 在几分钟内完成了人类专家需要 10 小时以上才能完成的复杂任务。

历史级漏洞的"考古"发现

最引人注目的是 Mythos 发现的若干"古老"漏洞:

  • OpenBSD 内核中存在 27 年之久的远程代码执行漏洞,此前从未被任何自动化工具或人工审计发现。
  • FFmpeg 多媒体框架中的深层内存安全问题,影响数十亿终端设备。
  • Linux 内核中的多个权限提升路径,部分漏洞已存在超过 15 年。

这些发现意味着,AI 驱动的代码审计正在开启一个新时代——无论代码库多庞大、历史多悠久,AI 都能以前所未有的深度和效率进行系统性安全审查。

Anthropic 的安全评估结论

"Mythos 的网络安全能力不是我们刻意训练出来的——它们作为编码、推理和自主性全面提升的涌现能力(Emergent Capability)自然产生。这让我们意识到,下一代前沿模型将天然具备潜在的攻击性网络能力,行业必须为此做好准备。"

三、Project Glasswing:有史以来最大规模的 AI 防御联盟

面对 Mythos 的双刃剑特性,Anthropic 没有选择传统的"发布即遗忘"模式,而是启动了 Project Glasswing——一个联合全球顶尖科技公司与开源社区的防御性安全计划。

Project Glasswing 防御生态架构
图 3:Project Glasswing 以 Mythos 为核心引擎,联合 40+ 家合作伙伴构建了"发现→修复→加固"的防御闭环。

合作伙伴阵容

Glasswing 首批合作伙伴几乎覆盖了全球科技产业的核心版图:

  • 云计算与基础设施:Amazon Web Services、Microsoft、Google
  • 终端与生态:Apple、NVIDIA
  • 网络安全:CrowdStrike、Palo Alto Networks、Cisco、Broadcom
  • 金融:JPMorgan Chase
  • 开源生态:Linux 基金会、Apache 软件基金会

这是 AI 安全领域首次出现如此广泛的跨行业联盟,参与方总数已超过 40 家组织。

运作机制

  1. 受控访问:Mythos 不通过公共 API 或 Claude.ai 提供服务。合作伙伴通过专用环境接入,所有调用受到严格审计。
  2. 防御优先:合作伙伴使用 Mythos 对自身产品和所维护的开源项目进行漏洞扫描、代码审计和安全加固。
  3. 90 天承诺:参与组织承诺在 90 天内公布发现的漏洞及修复指引,确保安全社区受益。
  4. 逐步扩展:Anthropic 将根据前 90 天的成果评估是否扩大合作范围或考虑更广泛的公开释放。

开源投资

Anthropic 承诺向开源安全领域投入总计超过 1.04 亿美元的资源:

  • $1 亿计算用量信用额度,供合作伙伴运行 Mythos 进行安全审计。
  • $400 万直接捐赠,分配给 Linux 基金会和 Apache 软件基金会,用于关键开源项目的安全加固。

这是 AI 公司有史以来对开源安全最大规模的单笔投资之一。

四、架构创新:递归自纠错与长程推理

除网络安全外,Mythos 在架构层面引入了多项关键创新,使其在复杂任务上的表现远超上一代模型。

递归自纠错(Recursive Self-Correction)

传统大模型在生成错误答案后,通常需要外部反馈才能修正。Mythos 引入了多层级的自我审查机制:模型在输出每个关键推理步骤后,会自动触发内部验证流程,检查逻辑一致性、事实准确性和代码正确性。如果检测到问题,模型会自动回溯并重新推理——整个过程无需人类介入。

在 SWE-Bench Pro 评估中,约 30% 的成功案例经历了至少一次自纠错循环,这解释了 Mythos 在复杂工程任务上远超竞品的原因。

长程推理(Long-Horizon Reasoning)

Mythos 能够维持跨越数十个推理步骤的逻辑链条,在规划、策略制定和复杂问题分解方面表现出色。这项能力直接支撑了它在 USAMO 数学证明和多步漏洞利用链构建中的突破性表现。

百万行级代码库处理

Mythos 可以在单次会话中处理和理解百万行级别的代码库,进行架构分析、跨模块重构和全局性调试。这意味着它在实际生产环境中的应用潜力远超传统代码助手——从"帮写一个函数"到"帮重构一个系统"。

五、定价与访问:前沿模型的"分级开放"新范式

Mythos 是首个不设公共访问的 Anthropic 模型。其定价策略也反映了这一点:

维度详情
公共 API❌ 不开放
Claude.ai / Amazon Bedrock❌ 不开放
合作伙伴定价$25 / 百万输入 token,$125 / 百万输出 token
对比 Opus 4.6约 5× 价格
Project Glasswing 信用额度最高 $1 亿

这种"分级开放"模式在 AI 行业尚属首次。它向市场传递了一个明确信号:当模型能力超越安全可控范围时,负责任的选择不是快速商业化,而是先确保全球基础设施的安全

六、对企业与行业的深远影响

1. 安全范式的转变

Mythos 的出现标志着网络安全从"人驱动、工具辅助"向"AI 驱动、人类监督"的范式转变。企业需要重新审视:

  • 现有安全审计流程是否能应对 AI 级别的攻击速度与深度。
  • 安全团队的角色是否需要从"执行审计"转向"管理 AI 审计员"。
  • 是否需要将 AI 安全审计纳入 CI/CD 流水线的标准环节。

2. AI 治理的新标杆

Anthropic 的"选择性不发布"为行业树立了一个重要先例。这可能影响:

  • 监管框架:各国政府可能加速推出针对前沿模型能力评估和分级发布的法规。
  • 竞争策略:其他 AI 公司可能需要在"快速发布"和"负责任部署"之间重新校准战略。
  • 企业采购:CTO/CISO 在评估 AI 供应商时,"安全治理能力"将成为与"模型能力"并列的核心考量。

3. 对 TokenStar 客户的启示

对于正在使用或评估 AI Agent 方案的企业客户,Mythos 的出现带来了以下值得关注的趋势:

  1. 安全优先的 AI 部署:在引入 AI Agent 时,需要同步建立 AI 安全审计能力,确保代理行为可监控、可审计、可回溯。
  2. 多模型策略:不要将所有能力押注在单一模型上。Mythos 的非公开状态意味着企业需要在多个供应商之间保持灵活性。
  3. 安全团队技能升级:安全团队需要理解 AI 的能力边界,掌握 AI 辅助安全审计的方法论。
  4. 关注 Project Glasswing 成果:90 天后的漏洞报告和修复指引将是企业加固自身系统的重要参考。

结语:当 AI 开始保护 AI 时代

Claude Mythos 的故事不仅仅关于一个模型有多强——它关于当模型足够强时,行业应该如何应对。Anthropic 选择了一条前所未有的路径:不急于变现,而是先用最强的 AI 修补人类二十年来遗漏的安全缺口。

这是一个转折点。从此以后,前沿 AI 模型的发布将不再只是一场能力竞赛,更是一场责任竞赛。而对于每一个正在拥抱 AI 的企业来说,理解这一转变,可能比追逐最新的基准分数更重要。

TokenStar 观点

我们认为,Mythos 和 Project Glasswing 代表了 AI 行业成熟化的一个重要里程碑。TokenStar 将持续跟踪 Glasswing 的进展和漏洞修复报告,并将其中的安全最佳实践整合到我们的 AI Agent 部署方案中,帮助企业客户在享受 AI 能力的同时,建立起与之匹配的安全防线。