编程 – 第 7 页 – 冯金伟博客园

GPT-5编程成绩有猫腻！自删23道测试题，关键基准还是自己提的

别急着用GPT-5编程了，可能它能力没有你想象中那么强。有人发现，官方测试编程能力用的SWE-bench Verified，但货不对板，只用了477个问题。什么意思呢？我们知道，SWE-bench … Continue reading GPT-5编程成绩有猫腻！自删23道测试题，关键基准还是自己提的

刚刚，OpenAI研究员Sheryl Hsu官宣：其内部研发的AI推理系统，在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛（IOI）中，取得了金牌这是AI首次在该领域达到金牌水平，并且在所有 … Continue reading OpenAI杀疯了！内部神秘模型首次斩获信息学奥赛IOI 2025金牌，碾压98%人类选手

廉价版 MacBook 售价或低于 5000 元小米汽车公布碰撞检测方法专利智谱开源全新多模态模型：全球新标杆马斯克透露 Grok V7 模型已完成预训练反超 OpenAI，百川开源大模型医疗 … Continue reading 早报｜廉价版 MacBook 或低于 5000 元/雷军发起小米 YU7 版本改名投票/码农正在成为现失业率最高的专业

上周，我们用六个国产AI大模型研究了财报。本周，我们来测试一个更加酷炫且硬核的话题：AI写代码。人们总是说，AI一出来，程序员都要失业了，这说法是真是假？为了搞清楚这个问题，这次我们设计了一场“ … Continue reading 从混元到智谱，六大国产大模型，编程“手艺”到底怎么样？

💻 廉价版 MacBook 售价或低于 5000 元 💥 小米汽车公布碰撞检测方法专利 🔬 智谱开源全新多模态模型：全球新标杆 😯 马斯 … Continue reading 廉价版MacBook或低于5000元/雷军发起小米YU7版本改名投票/码农正在成为现失业率最高的专业

编译 | 陈骏达编辑 | 云鹏智东西8月11日报道，近日，智谱发布了其最新一代旗舰模型GLM-4.5的完整技术报告。GLM-4.5融合了推理、编程和智能体能力，并在上述场景的12项基准测试中，综合 … Continue reading 智谱GLM-4.5完整技术报告：提出三个通用模型关键能力，公开12项测试成绩

不会使用AI的工程师就会落后。一位工程师小哥科尔顿·沃奇，说看到这类观点引发了自己巨大的精神焦虑。幸好他是一个持怀疑态度的人，测试完一堆AI开发工具后，发现也就那么回事。他的文章在 … Continue reading 别焦虑！不会用AI也不会被淘汰，工程师老哥实测各类工具：10倍生产力神话太夸张了

新智元报道编辑：KingHZ 桃子【新智元导读】GPT-5智商测试，仅拿下了70分？全网狂吐槽「降智」背后的真相，竟是「路由」决定了模型的智能。想要解锁神级GPT-5，秘诀在于prompt。这不， … Continue reading OpenAI惊人自曝：GPT-5真“降智”了！但重现“神之一手”，剑指代码王座

人工智能巨头 OpenAI 最近终于推出了万众期待的新一代旗舰模型 GPT-5。在发布会上，CEO 山姆·奥特曼用一个颇具戏剧性的比喻来形容它的跃升：“GPT-3 像高中生，偶尔有灵光 … Continue reading GPT-5来了！马斯克：我不服

IT之家 8 月 9 日消息，阿里云通义千问官方宣布，AI 编程智能体 Qwen Code 用户每天可免费获得 2000 次（请求）运行权限，且没有 Token 限制。不过，通义团队没有在 X 上细 … Continue reading 阿里云通义千问Qwen Code宣布每日可免费运行2000次