
就在今天凌晨,Anthropic 毫无预警地投下一枚重磅炸弹—Claude Fable 5 和Claude Mythos 5 同时上线。

这不是一次普通的模型迭代。这是 AI 行业第一次出现「同一模型,两种安全策略」的双轨发布。Fable 5 面向所有用户,Mythos 5 专供网络安全防御者。它们共享同一个底层模型,但走着截然不同的路。
Fable(寓言)和 Mythos(神话)—Anthropic 这次用文学概念来命名模型,背后是一个精心设计的安全分层策略:
🟡 Claude Fable 5:面向大众,带有保守的安全护栏。遇到网络安全、生物化学等敏感话题时,自动降级到 Opus 4.8 来回答。触发率不到 5% 的会话。
🔴 Claude Mythos 5:同样的模型,放宽了部分安全限制。通过 Project Glasswing 项目,与美国政府合作,专门提供给网络防御和关键基础设施安全团队。
一句话总结:能力一样,权限不同。Anthropic 用技术手段实现了「既安全又强大」的平衡。
Stripe 的实测数据可能是最直观的:
在 5000 万行的 Ruby 代码库中,Fable 5 用一天时间完成了原本需要整个团队两个多月才能做完的全量代码迁移。
在 Cognition 的 FrontierCode 评测中,Fable 5 在前沿模型中得分最高—而且是在中等 effort 级别就达到了。这意味着它不仅强,还更省 token。

Cursor 的评价:Fable 5 在 CursorBench 上是 SOTA,打开了一类以前完全够不到的长周期问题。
GitHub 则说:它让我们看到了一个未来—开发者可以把越来越有挑战性的工作交给 Agent,并信任结果。
之前的 Claude 模型玩宝可梦 FireRed,即使给了额外的导航辅助工具也打不通。Fable 5 呢?仅靠原始游戏截图,没有任何辅助,从头打到通关。
这听起来像个游戏挑战,但背后的意义远不止于此—它意味着 Fable 5 能从纯视觉输入中理解复杂的环境状态、做出长程规划和决策。从截图重建 Web 应用源代码?也能做到。

这是最让我震撼的部分。
药物设计:内部测试中,Mythos 5 将药物设计流程加速了约 10 倍。14 个蛋白靶点中,有 9 个产出了强候选药物。它能自主完成从选择结合位点、运行设计工具到故障恢复的全流程——没有人类协助。
原创假说:在盲法对比中,科学家们 80% 的情况下更偏好 Mythos 5 的分子生物学假说。更有说服力的是,其中一个关于大肠杆菌蛋白质的新假说,被一个独立实验室的研究结果所验证。
基因组学研究:Mythos 5 用一周多的时间,自主完成了跨 138 个物种、数百万细胞的单细胞数据分析,训练出的模型比 Science 期刊发表的模型性能更好,但体积只有 1/100。

Fable 5 和 Mythos 5 统一定价:
📌 输入:$10 / 百万 token
📌 输出:$50 / 百万 token
比之前的 Claude Mythos Preview 便宜一半以上。Anthropic 在用规模效应拉低前沿模型的价格。
Anthropic 坦言,这些安全护栏目前是保守的——有时会误伤无害的请求。他们也承诺会持续优化,减少误触发。
在自动对齐评估中,Mythos 5 的不对齐行为水平与 Opus 4.8 相当,保持在较低水平。
Anthropic 在公告最后说了一句话,值得注意:「更强大的模型将在未来几个月到来。」
写在最后:Fable 5 / Mythos 5 的双轨发布,可能是 AI 安全史上最有创意的一次尝试。它用工程手段回答了一个哲学问题:能不能既把最强大的能力释放给大众,又守住安全底线?Anthropic 给出了他们的答案——可以,但需要分层。这个思路,很可能会被整个行业跟进。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。