OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌,碾压98%人类选手

刚刚,OpenAI研究员Sheryl Hsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌

这是AI首次在该领域达到金牌水平,并且在所有AI参赛者中排名第一

在与全球330名顶尖人类选手的同场竞技中,这套AI系统成绩超越了其中98%的选手,仅有5位人类天才的得分比它更高

纯靠推理:无网络、无RAG,与人类公平对决

Sheryl Hsu在推文中特别强调,OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的:

完全断网 无法访问互联网杜绝了一切开卷考试可能性

无RAG(检索增强生成): 无法调用外部知识库,所有解题逻辑必须由模型内生生成

同等限制: 和人类选手一样,只有5小时的比赛时间和50次代码提交机会

基础工具 只能使用一个基础的终端工具

这样保证了AI不靠海量信息检索作弊,而是像一个真正的人类选手一样,在封闭、高压环境下,纯粹依靠自身的逻辑推理问题解决能力来编写代码、解决复杂算法问题

通用模型,而非特长生

OpenAI透露,他们使用的是一个通用推理模型的集成系统(ensemble),并没有针对IOI竞赛进行任何专门的训练或微调

团队唯一的人工干预仅仅在于:

1. 从模型生成的多个解法中,选择最优的那个进行提交

2. 将模型与IOI的提交API进行连接

除此以外,所有的解题过程全部由AI自主完成

一年从差点青铜到稳拿金牌

Sheryl Hsu提到,去年的IOI竞赛,OpenAI也曾尝试过,但结果并不理想,最终与一枚铜牌擦肩而过,仅排在49%分位。并且,去年的方案动用大量手工定制的测试时策略

而仅仅一年之后,OpenAI就实现了从49%分位到98%分位的大逆转,从差点青铜一跃成为金牌王者

GPT-5塌房,下一代模型什么时候发布?

最近几周,OpenAI这个神秘的内部推理系统模型可谓是捷报频传,在多个世界顶级智力竞赛中展现了强大实力

AtCoder世界总决赛: 取得第二名

IMO2025(国际数学奥林匹克):宣称取得金牌

IOI2025(国际信息学奥林匹克): 斩获金牌

那么这个内部推理系统是什么?下半年OpenAI还有真正的大招?

Published by

风君子

独自遨游何稽首 揭天掀地慰生平