OpenAI杀疯了！内部神秘模型首次斩获信息学奥赛IOI 2025金牌，碾压98%人类选手

刚刚，OpenAI研究员Sheryl Hsu官宣：其内部研发的AI推理系统，在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛（IOI）中，取得了金牌

这是AI首次在该领域达到金牌水平，并且在所有AI参赛者中排名第一

在与全球330名顶尖人类选手的同场竞技中，这套AI系统的成绩超越了其中98%的选手，仅有5位人类天才的得分比它更高

纯靠推理：无网络、无RAG，与人类公平对决

Sheryl Hsu在推文中特别强调，OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的：

完全断网： 无法访问互联网，杜绝了一切开卷考试的可能性

无RAG（检索增强生成）： 无法调用外部知识库，所有解题逻辑必须由模型内生生成

同等限制： 和人类选手一样，只有5小时的比赛时间和50次代码提交机会

基础工具： 只能使用一个基础的终端工具

这样保证了AI不靠海量信息检索作弊，而是像一个真正的人类选手一样，在封闭、高压的环境下，纯粹依靠自身的逻辑推理和问题解决能力来编写代码、解决复杂算法问题

通用模型，而非特长生

OpenAI透露，他们使用的是一个通用推理模型的集成系统（ensemble），并没有针对IOI竞赛进行任何专门的训练或微调

团队唯一的人工干预仅仅在于：

1. 从模型生成的多个解法中，选择最优的那个进行提交

2. 将模型与IOI的提交API进行连接

除此以外，所有的解题过程全部由AI自主完成

一年从差点青铜到稳拿金牌

Sheryl Hsu提到，去年的IOI竞赛，OpenAI也曾尝试过，但结果并不理想，最终与一枚铜牌擦肩而过，仅排在49%分位。并且，去年的方案还动用了大量手工定制的测试时策略

而仅仅一年之后，OpenAI就实现了从49%分位到98%分位的大逆转，从差点青铜一跃成为金牌王者

GPT-5塌房，下一代模型什么时候发布？

最近几周，OpenAI这个神秘的内部推理系统模型可谓是捷报频传，在多个世界顶级智力竞赛中展现了强大实力：

AtCoder世界总决赛：取得第二名

IMO2025（国际数学奥林匹克）：宣称取得金牌

IOI2025（国际信息学奥林匹克）：斩获金牌

那么这个内部推理系统是什么？下半年OpenAI还有真正的大招？

Published by