离开Meta的大佬们,留下作品还在陆续发表,今天轮到田渊栋。 这次他带领团队把目光投向了大模型强化学习训练中一个令人困惑的现象:为什么RL训练明明带来巨大性能提升,却只改变了极少数参数。 论文剖析了可 … Continue reading 这些大神在Meta的论文看一篇少一篇了
标签: 先验
开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
世界模型,正在迎来一次技术大突破。 本月初,Google DeepMind 发布的 Genie 3,因为效果惊艳,关注度直接超越了 OpenAI 同日发布的 GPT-5。 Genie 3 实现了实时互 … Continue reading 开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品

