OpenAI这招太狠!AI从“躲猫猫”到“自爆黑料”,主打一个坦白

【新智元导读】随着AI越来越强大并进入更高风险场景,透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」,让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。 当AI越来越聪明时,也变 … Continue reading OpenAI这招太狠!AI从“躲猫猫”到“自爆黑料”,主打一个坦白

研究发现:AI随着智能水平的提升会开始欺骗开发者

【CNMO科技消息】近日,北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文,其核心观点是随着AI智 … Continue reading 研究发现:AI随着智能水平的提升会开始欺骗开发者

陈震朋友圈发文:海外账号停止更新,暂停一切对外表达

凤凰网科技讯 12月7日,知名汽车博主、老司机创始人陈震通过朋友圈发声,其海外社交媒体账号目前已正式停止更新,后续不会发布任何新内容。针对近期网络上出现的部分冒充账号发布对抗性情绪言论的现象,陈震澄清 … Continue reading 陈震朋友圈发文:海外账号停止更新,暂停一切对外表达

研究:用诗歌就能让AI说违禁内容,成功率达62%

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制 … Continue reading 研究:用诗歌就能让AI说违禁内容,成功率达62%

OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗

OpenAI终于重新发布开源模型gpt-oss-120b和 gpt-oss-20b。这是其自从GPT-2之后 ,首次发布开源语言模型。 这也是上半年DeepSeek-R1发布,引发中国掀起一股开源狂潮 … Continue reading OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗

OpenAI再次“open”:发布两款开源模型,性能逼近o4/o3-mini

今日深夜,OpenAI 再次“open”,发布了两款高性能开源语言模型:gpt-oss-120b 和 gpt-oss-20b,在低成本下实现了出色的推理能力和工具使用能力,并针对消费级硬件进行了优化。 … Continue reading OpenAI再次“open”:发布两款开源模型,性能逼近o4/o3-mini