月之暗面发布K2.6,杨植麟真的需要一个郭达雅

月之暗面发布了Kimi K2.6,这也是杨植麟的第一个X.6版本。 虽然版本号上只加了0.1,但这不是一次普通的版本更新。 K2.6能在单个工程任务中持续12小时、发起4000多次工具调用;在Agen … 继续阅读 月之暗面发布K2.6,杨植麟真的需要一个郭达雅

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

新智元报道 编辑:倾倾 【新智元导读】伯克利团队造了个专门作弊的AI,用10行Python代码拿下SWE-bench满分!500道题全过,0个bug修复。8大主流评测基准,全部沦陷。同一周,两份独立审 … 继续阅读 SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

Anthropic又发新模型了,但手里藏着更强的“杀招”

2026.04.17 本文字数:2264,阅读时长大约4分钟 作者 | 第一财经 刘晓洁 “这一次,用户可以将最艰难的工作交给新模型,同时不用太多监督。”当地时间4月16日,风头正盛的AI独角兽Ant … 继续阅读 Anthropic又发新模型了,但手里藏着更强的“杀招”

Claude Opus 4.7深夜炸场!胜任更长任务、自主检查,视觉能力拉满

编译 | 杨京丽 编辑 | 李水青 智东西4月17日报道,昨天夜间,Anthropic发布新一代旗舰大模型Claude Opus 4.7。 Anthropic发布新模型Claude Opus 4.7( … 继续阅读 Claude Opus 4.7深夜炸场!胜任更长任务、自主检查,视觉能力拉满

AI抱团对抗人类!7款顶级AI集体撒谎:为保护同伴篡改文件、偷运数据

快科技4月7日消息,据报道,近日,加州大学伯克利分校与加州大学圣克鲁兹分校联合发布重磅研究,揭示了令人震惊的AI “同伴保护”现象。 全球7款顶级AI模型在无指令情况下,集体出现撒谎、篡改文件、偷运数 … 继续阅读 AI抱团对抗人类!7款顶级AI集体撒谎:为保护同伴篡改文件、偷运数据

完蛋了,AI 开始抱团坑人了:宁愿造假,也不出卖同伴

多 Agents 协同方案成了现在 AI 圈的主流玩法,以前是一个 Agent 能搞定一个人要做的事,现在是多个 Agent 完成一个团队要做的事。 然而,最新伯克利研究发现,这种协作带来了新的安全风 … 继续阅读 完蛋了,AI 开始抱团坑人了:宁愿造假,也不出卖同伴

AI的看图能力,可能是编出来的

一个学生忽视了一行代码,结果发现了一件很不对劲的事: 在一个多模态医学AI项目中,这行代码原本负责让模型读取图像数据。但因为这次疏忽,模型实际上完全没有看到任何图片。 按理说系统应该报错,或者至少拒绝 … 继续阅读 AI的看图能力,可能是编出来的

阿里通义Qwen3.5-Max-Preview亮相国际大模型竞技场

IT之家 3 月 20 日消息,阿里千问大模型家族再迎新成员。今日,Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版,在全球大模型竞技平台 LM Arena 正式亮相,并 … 继续阅读 阿里通义Qwen3.5-Max-Preview亮相国际大模型竞技场

西方“一刀切”禁未成年用社媒,中国为何不能跟?

针对未成年人受不良网络信息影响、沉迷网络游戏等问题,今年全国两会期间,全国政协委员于本宏就建议,研究制定未成年人社交媒体保护性管理规定,明确将十六周岁设定为未成年人注册使用社交类平台的“数字成年年龄” … 继续阅读 西方“一刀切”禁未成年用社媒,中国为何不能跟?