对抗性 – 冯金伟博客园

字节跳动试图打破Seedance 2.0的“不可能三角”

Seedance 2.0夺取Sora宝座后，AI视频生成赛道进入了狂热与焦虑并存的阶段。哪怕功能强大如Seedance 2.0，仍然无法打破这个领域的“不可能三角”：模型规模、生成时长和推理速度总 … 继续阅读字节跳动试图打破Seedance 2.0的“不可能三角”

【新智元导读】随着AI越来越强大并进入更高风险场景，透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」，让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。当AI越来越聪明时，也变 … 继续阅读 OpenAI这招太狠！AI从“躲猫猫”到“自爆黑料”，主打一个坦白

【CNMO科技消息】近日，北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文，其核心观点是随着AI智 … 继续阅读研究发现：AI随着智能水平的提升会开始欺骗开发者

凤凰网科技讯 12月7日，知名汽车博主、老司机创始人陈震通过朋友圈发声，其海外社交媒体账号目前已正式停止更新，后续不会发布任何新内容。针对近期网络上出现的部分冒充账号发布对抗性情绪言论的现象，陈震澄清 … 继续阅读陈震朋友圈发文：海外账号停止更新，暂停一切对外表达

IT之家 12 月 1 日消息，事实证明，只需一点创意，便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室（Icaro Lab）最新发表的一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制 … 继续阅读研究：用诗歌就能让AI说违禁内容，成功率达62%

OpenAI终于重新发布开源模型gpt-oss-120b和 gpt-oss-20b。这是其自从GPT-2之后，首次发布开源语言模型。这也是上半年DeepSeek-R1发布，引发中国掀起一股开源狂潮 … 继续阅读 OpenAI发布开源模型“王者归来”，DeepSeek剧情会反转吗

今日深夜，OpenAI 再次“open”，发布了两款高性能开源语言模型：gpt-oss-120b 和 gpt-oss-20b，在低成本下实现了出色的推理能力和工具使用能力，并针对消费级硬件进行了优化。 … 继续阅读 OpenAI再次“open”：发布两款开源模型，性能逼近o4/o3-mini