Claude 4.1 发布：更强的Agent、代码和推理

今天凌晨，Claude Opus 4.1 模型发布

Pro/Max/Team 用户可在网页端使用，API 已开放

Claude.ai 已可使用性能更强，价格不变

按 Anthropic 的官方说法，Claude Opus 4.1 是 Opus 4 的直接替代品，在编程、写作、工具调用以及Agent 方面，都得到了全面提升

• Agent 能力：能准确处理长时程任务，以及复杂企业工作流程，在TAU-bench表现优异；

• 高级编程：能完成上千步骤的长程编程任务，支持单次 32k 下文输出；

• 更强的搜索：能独立进行数小时研究任务，更为有效的进行内外信息搜索；

• 更强的写作：写的更像人

根据公开基准测试数据，Claude Opus4.1 在各个榜单上，都完成了对老版本的超越，详细如下图。

编程相关跑分

这里专门说一下 SWE-bench 榜单，这是一个编程榜单。

榜单中，Opus 4.1 得分为 74.5% 为最高，紧随其后的是 Claude Sonnet 4，下图是更为具体的数据

SWE-bench

附录

附1：Claude Opus 4.1 信息卡/技术报告

https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf附2：相关链接

Claude Webapp

www.claude.ai

Claude Opus 官方信息

https://www.anthropic.com/claude/opus

Published by