财联社4月17日讯(编辑 史正丞)AI产业明星公司Anthropic周四推出旗舰人工智能模型Claude Opus的4.7版本,侧重于软件工程领域的提升,同时在金融分析、视觉能力和创作“品味”方面均实现了长足的进步。

(来源:公司官网)
公司也表示,Claude Opus 4.7与强悍到无法公开发布的Mythos“神话”模型存在全方位的能力差距。但后者目前仅供一小撮顶级机构先行试用,寻找应对“AI网络浩劫”的破解之道,短期内恐无缘公开面世。
Anthropic公布的基准测试结果也印证了这种说法。在大多数AI模型“跑分”中,Opus 4.7较两个月前发布的Opus 4.6,以及竞品GPT-5.4都要高出一头,但和Mythos明显不在一个档次上。

当然,即便能力比不上Mythos,Claude Opus 4.7依然是地球打工人眼下能用到的最顶级大模型。
Anthropic介绍称,Claude Opus 4.7在遵循指令方面出现显著提升。过往的模型可能会宽松地“糊弄”指令或完全跳过部分指示,但Opus 4.7会严格按字面执行指令。
因此,Opus 4.7在高级软件工程领域较4.6有显著提升,特别是在“最困难的任务”上。Opus 4.7能以严谨和一致的方式处理复杂、长期运行的任务,精确遵循指令,并在反馈结果前想出验证自身输出的方法。
除了软件工程师外,Opus 4.7对金融分析师和更广泛的办公室白领也能提供更强大的赋能。
Opus 4.7在“金融分析代理”测试中,取得了全球AI大模型最高的得分。相较4.6版本,能够生成严谨的分析与建模、更专业的报告展示,并在各项任务间实现更紧密的整合。在衡量AI在金融、法律和其他知识性工作的GDPval AA测试中,Opus 4.7也拿到行业领先的成绩。

Opus 4.7的多模态能力也迎来关键更新,现在能够识别边长最长达2576像素的图像,是之前的三倍多。Anthropic表示,在完成专业任务时,Opus 4.7能表现得更有“品味”且更具创造力,能够生成质量更高的界面、演示文稿和文档。
此外,Opus 4.7在使用基于文件系统的记忆方面更为出色。它能在长时间、多会话的工作中记住重要笔记,并将其用于开展新的任务,因此新任务需要更少的前置上下文。
定价方面,Opus 4.7与4.6一致,每百万输入词元5美元,每百万输出词元25美元。
Anthropic也提醒称,Opus 4.7使用了一套更新的分词器,提升了模型处理文本的方式。这导致相同输入内容可能会被映射为更多的词元,大约在1-1.35倍之间。
同时在高计算强度下,尤其是在智能体多轮交互场景的后续轮次中,Opus 4.7会进行更多“思考”。这提高了模型处理复杂问题的可靠性,但也会产生更多输出词元。所以用户需要在模型能力和钱包深度之间进行取舍。整体而言,消耗同等词元,模型产出的结果能够出现正向提升。

(各努力等级下模型随词元使用量变化的得分)

