坦白从宽:OpenAI开发新系统教导模型诚实承认自身“不良行为”

IT之家 12 月 4 日消息,当地时间 12 月 3 日,OpenAI 宣布,正在开发一种新的训练框架,让 AI 在出现不当行为时能够主动“承认”。 据IT之家了解,团队把这种机制称为“忏悔(con … Continue reading 坦白从宽:OpenAI开发新系统教导模型诚实承认自身“不良行为”