IPO前“秀肌肉”:Anthropic推出最强公开模型Fable 5,戴安全枷锁解封Mythos级能力

华尔街见闻
Jun 10

Anthropic称,Fable 5在几乎所有测试基准上都达到业内领先,任务越长、越复杂,相对其他模型的优势越明显,其防护机制经受超1000小时内部“越狱测试”考验。采用相同底层模型的Mythos 5取消部分安全限制,拥有“全球最强网络安全能力”,目前仅向少数受信任机构开放。两模型定价不到Mythos预览版的一半。

冲刺IPO之际,Anthropic抛出重磅产品。

美东时间9日周二,Anthropic正式发布Claude Fable 5,并同步推出Claude Mythos 5。两者基于同一底层模型架构,其中Fable 5是首个面向公众开放的Mythos级模型,而Mythos 5则保留更完整能力,目前仅向少数受信任机构开放。

Anthropic称,Fable 5已成为该司迄今公开发布的能力最强模型,在软件工程、科研、金融分析、视觉理解等多个领域达到业内领先水平。这意味着,曾因具备强大网络攻防能力而被Anthropic限制访问的Mythos技术路线,终于开始走向大众市场。

不过,Anthropic仍对Fable 5进行了严格的“降权限”处理:涉及网络安全、生物学和化学等敏感领域的问题,将自动切换至能力较弱的Claude Opus 4.8处理,以降低滥用风险。

Fable 5 和 Mythos 5的定价为10美元/百万输入Token和50美元/百万输出Token。Anthropic指出,这一定价不到Claude Mythos预览版的一半,并表示,新模型发布标志着公司向既定目标又迈进了一步,这个目标是,以尽可能快且安全的方式,将先进的AI能力带给尽可能多的用户。

对于正处于IPO筹备阶段的Anthropic而言,这不仅是一次模型升级,更是向资本市场“秀肌肉”,展示其既能打造最前沿AI,又能控制风险的关键证明。

Anthropic“最先进通用模型”Fable 5到底有多强?

按照Anthropic的定义,Fable 5是首个“可安全公开部署”的Mythos级模型。

Anthropic表示,Fable 5在几乎所有测试基准上都达到业内领先水平,尤其擅长长周期、多步骤、高复杂度任务。Anthropic强调:“任务越长、越复杂,Fable 5相对于其他模型的优势越明显。”

软件开发是其最突出的能力之一。

支付巨头Stripe在早期测试中发现,Fable 5在一个包含5000万行Ruby代码的大型代码库中,仅用一天时间便完成了一项原本需要一个团队两个月才能完成的代码迁移工作。

在金融与知识工作领域,Anthropic援引第三方评测称,Fable 5在高级金融推理、文档分析、表格与图表理解等任务中获得业内最高分。交易机构IMC则表示,该模型在事实检索、根因分析、概念推理以及预期收益分析等测试中表现突出。

视觉能力同样大幅提升。

Anthropic称,Fable 5能够从复杂科研图表中提取精确数据,甚至仅凭截图重建网页应用源码。在一项内部测试中,模型仅依靠视觉输入便完成了《Pokémon FireRed》通关,而此前版本Claude需要额外辅助工具才能做到这一点。

此外,Fable 5在长上下文和持续记忆方面也进一步增强。Anthropic表示,该模型能够在数百万Token的长期任务中保持专注,并利用自身笔记持续优化输出结果。

Mythos 5更强,但公众仍无法直接使用

与Fable 5同时亮相的,还有备受关注的Mythos 5。

Anthropic透露,两款产品实际上采用相同底层模型,但Mythos 5取消了部分安全限制,因此保留了更完整的网络安全和科研能力。

Anthropic计划,Mythos 5仅通过名为Project Glasswing的专项倡议,向少数经过严格审核的机构开放,包括美国政府部门、关键基础设施运营商以及网络安全防御组织。

Anthropic表示,该模型拥有“全球最强网络安全能力”,未来将逐步通过“可信访问计划”(Trusted Access Program)扩大开放范围。

在生命科学领域,Anthropic还披露了一些引人注目的实验结果。

Anthropic称,Mythos 5已能够独立完成蛋白质设计流程,在部分药物研发任务中达到甚至超过专业研究人员水平。Anthropic研究团队还表示,模型提出的一项关于大肠杆菌蛋白的新机制假说,后来获得独立实验室研究结果验证。

从因太危险而不能公开到正式商用,Mythos经历了什么?

此次发布最引人关注的地方,在于Anthropic终于解决了此前阻碍Mythos公开部署的核心问题。

今年早些时候,Anthropic首次展示Mythos Preview时曾引发业内震动。公司罕见地公开警告称,该模型能够在主要操作系统和浏览器中发现并利用软件漏洞,在网络攻防领域展现出前所未有的能力,因此决定暂不向公众开放。

这一决定在AI行业极为罕见。

通常AI公司倾向于尽快扩大模型覆盖面,Anthropic却选择主动限制访问权限,仅允许少量合作伙伴参与测试。此前Project Glasswing覆盖约50家机构,近期又新增150家组织,总数接近200家。

为了推动公开发布,Anthropic为Fable 5增加了多层安全机制。

当系统识别出网络安全、生物学、化学以及模型蒸馏等敏感请求时,用户实际上获得的是Claude Opus 4.8的回答,而非Fable 5本体。公司称,这些限制触发率不足5%。

Anthropic还进行了超过1000小时的内部“越狱测试”(Jailbreak Testing),试图寻找绕过安全限制的方法。公司表示,测试人员未能发现能够普遍绕过防护机制的通用破解方案。

IPO前关键一战:Anthropic试图证明能力与安全可兼得

从商业角度看,Fable 5和Mythos 5的发布正值Anthropic最关键的发展阶段。

5月底Anthropic刚完成65亿美元融资,投后估值达到965亿美元,超过OpenAI成为全球估值最高的AI创业公司之一。随后又于6月初秘密提交IPO申请文件,为最快今秋上市铺路。

市场一直关注一个问题:Anthropic能否将其领先的研究能力真正转化为可规模化商业产品。

Mythos此前虽然被认为是全球最先进的网络安全AI之一,但由于安全风险而无法大规模部署,其商业价值始终受到限制。如今Fable 5的推出,相当于Anthropic找到了一个折中方案——在保留绝大部分先进能力的同时,通过动态路由和权限控制满足安全要求。

对于潜在投资者而言,这种模式具有重要意义。

一方面,Anthropic向市场证明其技术能力仍处于行业最前沿;另一方面,也展示出其在模型治理和风险控制上的差异化优势,这正是监管机构和资本市场越来越关注的能力。

与此同时,公司还提高了高端模型定价。Fable 5和Mythos 5的价格为10美元/百万输入Token、50美元/百万输出Token,约为Opus 4.8的两倍,但Anthropic认为更高效率能够抵消部分成本。

随着IPO临近,Anthropic正在向资本市场讲述一个新的故事:不仅拥有最强大的AI模型之一,而且能够在安全、监管与商业化之间找到平衡点。而Fable 5,正是这一叙事的最新核心产品。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10