压分 – 冯金伟博客园

坦白从宽：OpenAI开发新系统教导模型诚实承认自身“不良行为”

IT之家 12 月 4 日消息，当地时间 12 月 3 日，OpenAI 宣布，正在开发一种新的训练框架，让 AI 在出现不当行为时能够主动“承认”。据IT之家了解，团队把这种机制称为“忏悔（con … 继续阅读坦白从宽：OpenAI开发新系统教导模型诚实承认自身“不良行为”