小模型层数好玄学:12/32/64层效果好,16/24/48/层效果糟

一水 发自 凹非寺 量子位 | 公众号 QbitAI 小模型身上的“秘密”这下算是被扒光了! 知名开源项目OpenEvolve作者,刚刚用一篇长文揭示了70M小模型的几个重要发现: 其一,架构的重要性 … 继续阅读 小模型层数好玄学:12/32/64层效果好,16/24/48/层效果糟

摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达

凤凰网科技讯 12月21日,摩尔线程于12月20日在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU架构“花港”,并展示了其万卡规模AI训练集群及多项技术进展。 此次发布的核心内 … 继续阅读 摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达

摩尔线程张建中:智算集群将做到50万卡、100万卡规模

科创板上市后,“国产GPU第一股”摩尔线程(688795.SH)12月20日召开了首届MUSA开发者大会,公布了新的GPU架构和基于该架构的三款芯片。 摩尔线程被认为是国内GPU公司中最像英伟达的一家 … 继续阅读 摩尔线程张建中:智算集群将做到50万卡、100万卡规模

英伟达开源3款新推理模型,收购1家AI公司

智东西 作者 | ZeR0 编辑 | 漠影 智东西12月16日报道,今日,英伟达推出了NVIDIA Nemotron 3系列开放模型、数据和库,并公布Nemotron 3 Nano模型的技术报告。 N … 继续阅读 英伟达开源3款新推理模型,收购1家AI公司

火星“断网”危机:美国宇航局和 MAVEN 轨道探测器失联

IT之家 12 月 11 日消息,科技媒体 Ars Technica 今天(12 月 11 日)发布博文,报道称美国宇航局和一颗火星轨道飞行器失去联系,恐影响火星和地球的未来通信。 IT之家援引博文介 … 继续阅读 火星“断网”危机:美国宇航局和 MAVEN 轨道探测器失联

存储站上关键路口,中国以标准引领产业新生态

2025年11月19日,广州召开的2025数据存储产业大会标志着中国存储产业步入一个关键转折点。 会上,中科曙光正式出任中电标协数据存储专委会当值会长单位,宣布专委会将发起编写AI存储标准,并联合牵头 … 继续阅读 存储站上关键路口,中国以标准引领产业新生态

黄仁勋勾勒AI宏伟蓝图:6G、量子计算、机器人、自动驾驶全都有份

财联社10月29日讯(编辑 史正丞)北京时间周三凌晨,全球市值最高上市公司英伟达在美国首都举办GTC大会,公司CEO黄仁勋登台畅谈AI产业的前沿展望。 与以往有明确重点的发布会不同,黄仁勋今天的演讲涉 … 继续阅读 黄仁勋勾勒AI宏伟蓝图:6G、量子计算、机器人、自动驾驶全都有份

Wi-Fi 8首次实验成功!三个“提升25%” 再也不怕堵车

快科技10月13日消息,Wi-Fi 7还没普及,Wi-Fi 8就要来了! 普联(TP-Link)宣布,已经成功完成了第一次Wi-Fi 8硬件测试实验,使用的是一款原型设备。 此次测试验证了Wi-Fi … 继续阅读 Wi-Fi 8首次实验成功!三个“提升25%” 再也不怕堵车

三步走冲顶亚10nm!俄罗斯公布EUV光刻机路线图

俄罗斯科学院微结构物理研究所(通过德米特里・库兹涅佐夫)制定了一套国产极紫外(EUV)光刻设备的长期路线图,该设备工作波长为 11.2 纳米,扩展了该机构去年 12 月披露的信息。新项目从 2026 … 继续阅读 三步走冲顶亚10nm!俄罗斯公布EUV光刻机路线图