谁敢想? 视觉推理这一块,大模型现在还嫩得像个3岁小孩。 来自UniPat AI、xbench、阿里、月之暗面、阶跃星辰等多家研究机构的最新研究显示: 在BabyVision视觉推理benchmark … 继续阅读 最强大模型的视觉能力不如6岁小孩
标签: 流形
DeepSeek梁文峰发表新论文
2026 年刚开年,DeepSeek就放出了一项重要技术进展。 1月1日,DeepSeek发表论文《Manifold-Constrained Hyper-Connections》,提出一种全新的模型连 … 继续阅读 DeepSeek梁文峰发表新论文
DeepSeek开年发布新论文:提出全新mHC架构,梁文锋现身作者名单
IT之家 1 月 1 日消息,北京时间今天下午,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同 … 继续阅读 DeepSeek开年发布新论文:提出全新mHC架构,梁文锋现身作者名单
DeepSeek开年炸场!梁文锋又发论文了,一如既往地强
智东西 作者 | 江宇 王涵 编辑 | 心缘 智东西1月1日报道,昨日晚间,DeepSeek团队送出一份新年“贺礼”,正式发布新论文《Manifold-Constrained Hyper-Connec … 继续阅读 DeepSeek开年炸场!梁文锋又发论文了,一如既往地强
估值840亿AI实验室再放大招,他们要给大模型戴上“紧箍咒”
新智元报道 编辑:元宇 【新智元导读】在大模型训练时,如何管理权重、避免数值爆炸与丢失?Thinking Machines Lab 的新研究「模块流形」提出了一种新范式,它将传统「救火式」的数值修正, … 继续阅读 估值840亿AI实验室再放大招,他们要给大模型戴上“紧箍咒”

