GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?我们知道,SWE-bench … Continue reading GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌,碾压98%人类选手

刚刚,OpenAI研究员Sheryl Hsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌 这是AI首次在该领域达到金牌水平,并且在所有 … Continue reading OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌,碾压98%人类选手

早报|廉价版 MacBook 或低于 5000 元/雷军发起小米 YU7 版本改名投票/码农正在成为现失业率最高的专业

廉价版 MacBook 售价或低于 5000 元 小米汽车公布碰撞检测方法专利 智谱开源全新多模态模型:全球新标杆 马斯克透露 Grok V7 模型已完成预训练 反超 OpenAI,百川开源大模型医疗 … Continue reading 早报|廉价版 MacBook 或低于 5000 元/雷军发起小米 YU7 版本改名投票/码农正在成为现失业率最高的专业

从混元到智谱,六大国产大模型,编程“手艺”到底怎么样?

上周,我们用六个国产AI大模型研究了财报。 本周,我们来测试一个更加酷炫且硬核的话题:AI写代码。 人们总是说,AI一出来,程序员都要失业了,这说法是真是假? 为了搞清楚这个问题,这次我们设计了一场“ … Continue reading 从混元到智谱,六大国产大模型,编程“手艺”到底怎么样?

廉价版MacBook或低于5000元/雷军发起小米YU7版本改名投票/码农正在成为现失业率最高的专业

💻 廉价版 MacBook 售价或低于 5000 元 💥 小米汽车公布碰撞检测方法专利 🔬 智谱开源全新多模态模型:全球新标杆 😯 马斯 … Continue reading 廉价版MacBook或低于5000元/雷军发起小米YU7版本改名投票/码农正在成为现失业率最高的专业

智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩

编译 | 陈骏达 编辑 | 云鹏 智东西8月11日报道,近日,智谱发布了其最新一代旗舰模型GLM-4.5的完整技术报告。GLM-4.5融合了推理、编程和智能体能力,并在上述场景的12项基准测试中,综合 … Continue reading 智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩

别焦虑!不会用AI也不会被淘汰,工程师老哥实测各类工具:10倍生产力神话太夸张了

不会使用AI的工程师就会落后。 一位工程师小哥科尔顿·沃奇,说看到这类观点引发了自己巨大的精神焦虑。 幸好他是一个持怀疑态度的人,测试完一堆AI开发工具后,发现也就那么回事。 他的文章在 … Continue reading 别焦虑!不会用AI也不会被淘汰,工程师老哥实测各类工具:10倍生产力神话太夸张了

OpenAI惊人自曝:GPT-5真“降智”了!但重现“神之一手”,剑指代码王座

新智元报道 编辑:KingHZ 桃子 【新智元导读】GPT-5智商测试,仅拿下了70分?全网狂吐槽「降智」背后的真相,竟是「路由」决定了模型的智能。想要解锁神级GPT-5,秘诀在于prompt。这不, … Continue reading OpenAI惊人自曝:GPT-5真“降智”了!但重现“神之一手”,剑指代码王座

阿里云通义千问Qwen Code宣布每日可免费运行2000次

IT之家 8 月 9 日消息,阿里云通义千问官方宣布,AI 编程智能体 Qwen Code 用户每天可免费获得 2000 次(请求)运行权限,且没有 Token 限制。 不过,通义团队没有在 X 上细 … Continue reading 阿里云通义千问Qwen Code宣布每日可免费运行2000次