Anthropic 发布 Claude Fable 5：配备网络安全护栏的 Mythos 级 AI安全114-安全在线-安全壹壹肆-网络安全黄页-网络安全百科网络安全百科-网络安全114-网络安全在线-网络安全黄页

Anthropic 发布 Claude Fable 5：配备网络安全护栏的 Mythos 级 AI

6月10日更新

4112

Anthropic 周二宣布 Claude Fable 5 正式上市，这是一款强大的 Mythos 级 AI 模型，配备了新的安全措施，专门限制其在包括网络安全在内的高风险领域中的使用。

该 AI 巨头表示，这是首次有如此能力级别的模型被认为足够安全，可以向公众和开发者广泛开放。

虽然 Fable 5 表现出色——在软件工程、知识工作、视觉和长时间运行任务方面超越了之前的模型——但该公司通过实施针对性的拦截机制优先考虑了安全性。

在网络安全和生物学等敏感领域，该模型会自动回退到能力较弱的 Claude Opus 4.8，以防止潜在的滥用。早期使用数据显示，至少 95% 的会话完全依靠 Fable 5 的能力运行，未触发任何回退。

“Mythos 级能力的提升对许多对手来说具有价值——例如，那些可能从网络攻击中获得经济利益的对手——因此我们预计他们会有动机试图规避我们的安全措施，”Anthropic 指出。

该公司强调了其安全措施的严谨性。它对其分类器进行了广泛的内部红队测试，随后进行了超过 1000 小时的外部漏洞赏金计划，未发现任何通用越狱方法。

独立的外部红队测试也未能发现关键的绕过方法，这突显了安全措施在抵御对手试图获取受限输出方面的稳健性。

Project Glasswing 合作伙伴获得升级版 Mythos 5

Anthropic 周二还宣布，受信任的用户，包括其在 Project Glasswing 中的网络安全合作伙伴，将从 Claude Mythos Preview 升级到 Claude Mythos 5。

该公司计划通过结构化的可信访问计划逐步扩大这种高权限访问。

Anthropic 最近宣布将扩大 Project Glasswing，新增约 150 家组织。

该 AI 巨头尚未列出新增成员，但多家网络安全和科技公司已宣布参与该项目，包括 Dragos、Tenable、TrendAI（Trend Micro）、Netskope、BeyondTrust、Rubrik、BT、Intercontinental Exchange 和 Hitachi。

Fable 5 和 Mythos 5 的定价均为每百万输入 token 10 美元，每百万输出 token 50 美元。前者现已通过 Claude API 向开发者提供。

消息来源：securityweek.com；

本文由 HackerNews.cc 翻译整理，封面来源于网络；

© 版权声明

文章版权归原作者所有，转摘请注明出处。文章内容仅代表作者独立观点，不代表安全壹壹肆&安全114的立场，转载目的在于传递网络空间安全讯息。部分素材来源于网络，如有侵权请联系首页管理员删除。

THE END

产品讯息安全企业动态
# AI安全 # 电子护栏 # anthropic

你的支持是我们在网空安全路上的驱动力！

推荐内容