3月10日,腾讯混元3D团队开源首个面向世界模型的强化学习后训练框架WorldCompass。据介绍,这是一个专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么Wo … 继续阅读 腾讯混元开源首个面向世界模型的强化学习后训练框架
3月10日,腾讯混元3D团队开源首个面向世界模型的强化学习后训练框架WorldCompass。据介绍,这是一个专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么Wo … 继续阅读 腾讯混元开源首个面向世界模型的强化学习后训练框架