分数 – 冯金伟博客园

月之暗面发布K2.6，杨植麟真的需要一个郭达雅

月之暗面发布了Kimi K2.6，这也是杨植麟的第一个X.6版本。虽然版本号上只加了0.1，但这不是一次普通的版本更新。 K2.6能在单个工程任务中持续12小时、发起4000多次工具调用；在Agen … 继续阅读月之暗面发布K2.6，杨植麟真的需要一个郭达雅

新智元报道编辑：倾倾【新智元导读】伯克利团队造了个专门作弊的AI，用10行Python代码拿下SWE-bench满分！500道题全过，0个bug修复。8大主流评测基准，全部沦陷。同一周，两份独立审 … 继续阅读 SWE-bench满分，0个bug修复：伯克利造了个专门作弊的AI

2026.04.17 本文字数：2264，阅读时长大约4分钟作者 | 第一财经刘晓洁 “这一次，用户可以将最艰难的工作交给新模型，同时不用太多监督。”当地时间4月16日，风头正盛的AI独角兽Ant … 继续阅读 Anthropic又发新模型了，但手里藏着更强的“杀招”

编译 | 杨京丽编辑 | 李水青智东西4月17日报道，昨天夜间，Anthropic发布新一代旗舰大模型Claude Opus 4.7。 Anthropic发布新模型Claude Opus 4.7（ … 继续阅读 Claude Opus 4.7深夜炸场！胜任更长任务、自主检查，视觉能力拉满

什么叫MBTI？，它的全称是迈尔斯-布里格斯类型指标（Myers-Briggs Type Indicator），由美国的凯瑟琳·库克·布里格斯与女儿伊莎贝尔· … 继续阅读 AI写了不到2000行代码，SBTI制造了2026年第一场刷屏

快科技4月7日消息，据报道，近日，加州大学伯克利分校与加州大学圣克鲁兹分校联合发布重磅研究，揭示了令人震惊的AI “同伴保护”现象。全球7款顶级AI模型在无指令情况下，集体出现撒谎、篡改文件、偷运数 … 继续阅读 AI抱团对抗人类！7款顶级AI集体撒谎：为保护同伴篡改文件、偷运数据

多 Agents 协同方案成了现在 AI 圈的主流玩法，以前是一个 Agent 能搞定一个人要做的事，现在是多个 Agent 完成一个团队要做的事。然而，最新伯克利研究发现，这种协作带来了新的安全风 … 继续阅读完蛋了，AI 开始抱团坑人了：宁愿造假，也不出卖同伴

一个学生忽视了一行代码，结果发现了一件很不对劲的事：在一个多模态医学AI项目中，这行代码原本负责让模型读取图像数据。但因为这次疏忽，模型实际上完全没有看到任何图片。按理说系统应该报错，或者至少拒绝 … 继续阅读 AI的看图能力，可能是编出来的

IT之家 3 月 20 日消息，阿里千问大模型家族再迎新成员。今日，Qwen3.5-Max-Preview 作为千问 3.5 系列的旗舰模型预览版，在全球大模型竞技平台 LM Arena 正式亮相，并 … 继续阅读阿里通义Qwen3.5-Max-Preview亮相国际大模型竞技场

针对未成年人受不良网络信息影响、沉迷网络游戏等问题，今年全国两会期间，全国政协委员于本宏就建议，研究制定未成年人社交媒体保护性管理规定，明确将十六周岁设定为未成年人注册使用社交类平台的“数字成年年龄” … 继续阅读西方“一刀切”禁未成年用社媒，中国为何不能跟？