Anthropic 发布 Claude Fable 5:配备网络安全护栏的 Mythos 级 AI

图片[1]安全114-安全在线-安全壹壹肆-网络安全黄页-网络安全百科Anthropic 发布 Claude Fable 5:配备网络安全护栏的 Mythos 级 AI安全114-安全在线-安全壹壹肆-网络安全黄页-网络安全百科网络安全百科-网络安全114-网络安全在线-网络安全黄页

Anthropic 周二宣布 Claude Fable 5 正式上市,这是一款强大的 Mythos 级 AI 模型,配备了新的安全措施,专门限制其在包括网络安全在内的高风险领域中的使用。

该 AI 巨头表示,这是首次有如此能力级别的模型被认为足够安全,可以向公众和开发者广泛开放。

虽然 Fable 5 表现出色——在软件工程、知识工作、视觉和长时间运行任务方面超越了之前的模型——但该公司通过实施针对性的拦截机制优先考虑了安全性。

在网络安全和生物学等敏感领域,该模型会自动回退到能力较弱的 Claude Opus 4.8,以防止潜在的滥用。早期使用数据显示,至少 95% 的会话完全依靠 Fable 5 的能力运行,未触发任何回退。

“Mythos 级能力的提升对许多对手来说具有价值——例如,那些可能从网络攻击中获得经济利益的对手——因此我们预计他们会有动机试图规避我们的安全措施,”Anthropic 指出。

该公司强调了其安全措施的严谨性。它对其分类器进行了广泛的内部红队测试,随后进行了超过 1000 小时的外部漏洞赏金计划,未发现任何通用越狱方法。

独立的外部红队测试也未能发现关键的绕过方法,这突显了安全措施在抵御对手试图获取受限输出方面的稳健性。

Project Glasswing 合作伙伴获得升级版 Mythos 5

Anthropic 周二还宣布,受信任的用户,包括其在 Project Glasswing 中的网络安全合作伙伴,将从 Claude Mythos Preview 升级到 Claude Mythos 5。

该公司计划通过结构化的可信访问计划逐步扩大这种高权限访问。

Anthropic 最近宣布将扩大 Project Glasswing,新增约 150 家组织。

该 AI 巨头尚未列出新增成员,但多家网络安全和科技公司已宣布参与该项目,包括 Dragos、Tenable、TrendAI(Trend Micro)、Netskope、BeyondTrust、Rubrik、BT、Intercontinental Exchange 和 Hitachi。

Fable 5 和 Mythos 5 的定价均为每百万输入 token 10 美元,每百万输出 token 50 美元。前者现已通过 Claude API 向开发者提供。


消息来源:securityweek.com

本文由 HackerNews.cc 翻译整理,封面来源于网络;

© 版权声明
THE END
你的支持是我们在网空安全路上的驱动力!
点赞12 分享