级任务 – 冯金伟博客园

编程测试碾压人类！Claude Opus 4.5深夜突袭，AI编程进入超人时代

最近这段时间，大模型发布就跟下饺子似的，一个接一个往外冒。前脚 Gemini 3 Pro 刚抢了两周风头，后脚 Claude Opus 4.5 刚刚就正式发布，还是主打编程，还是那个熟悉的味道。 A … 继续阅读编程测试碾压人类！Claude Opus 4.5深夜突袭，AI编程进入超人时代

AI打工人报告：完成专家级任务，速度快100倍，成本仅1%

IT之家 9 月 27 日消息，科技媒体 ZDNet 昨日（9 月 26 日）发布博文，报道称 OpenAI 推出名为 GDPval 的全新 AI 评估基准，旨在衡量前沿模型在真实经济价值任务中的表现 … 继续阅读 AI打工人报告：完成专家级任务，速度快100倍，成本仅1%