负分 – 冯金伟博客园

OpenAI这招太狠！AI从“躲猫猫”到“自爆黑料”，主打一个坦白

【新智元导读】随着AI越来越强大并进入更高风险场景，透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」，让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。当AI越来越聪明时，也变 … 继续阅读 OpenAI这招太狠！AI从“躲猫猫”到“自爆黑料”，主打一个坦白