在算力被普遍视为AI(人工智能)竞赛“硬通货”的今天,月之暗面却给出了一个截然不同的竞争叙事。
北京时间1月21日晚,在瑞士达沃斯举行的世界经济论坛2026年年会上,月之暗面Kimi总裁张予彤分享了一个极具冲击力的数据:Kimi仅使用美国顶尖实验室约1%的资源,就开发出开源模型Kimi K2、Kimi K2 Thinking。

图片来源:企业供图
去年7月,月之暗面宣布正式发布Kimi K2模型,并同步开源;四个月后,Kimi K2 Thinking正式发布,被定义为“Kimi迄今能力最强的开源思考模型”。官方公布的实测显示,该模型在“人类最后的考试”、自主网络浏览能力、复杂信息收集推理等多项前沿基准测试中,达到了SOTA(当前最优)水平。
在全球AI赛道中,这一系列动作为世界提供了一种来自中国、以效率为核心的发展范本。在Kimi持续突破技术边界的同时,国内AI独角兽们猛踩油门,大厂的重资押注也使战况不断升级。在效率与场景化的驱动下,智能技术正加速迈向平权与普适的新阶段。
1%资源背后的效率革命
去年K2 Thinking上线时,外界对其性能表现高度关注,而同步成为焦点的还有其背后的成本效率。去年11月,月之暗面创始人Kimi杨植麟曾在一场线上问答中透露,外界广为流传的K2模型训练成本“460万美元”并非官方数字,他强调真正的训练成本很难准确量化。
这场问答中,联合创始人吴育昕还透露,K2 Thinking是在配备了InfiniBand的H800 GPU集群上完成训练的,尽管算力规模不占优势,但团队“把每张显卡的性能都压榨到了极致”。
“从创业第一天起我们就清醒地意识到,中国初创公司没有随意堆砌算力的条件。”张予彤在本次论坛上坦言。正是这种资源约束,迫使团队转向通过大量的基础研究创新来换取极致效率。
她透露,Kimi投入大量精力将工程化思维引入研究环节,以确保算法创新能稳定应用于生产系统。例如,Kimi是全球首个在大型语言模型训练中跑通Muon优化器的公司,其自研的线性注意力机制(Kimi Linear)也在处理速度上显著超越了传统系统。
这种效率优势正在转化为社会层面的生产力平权。“AI让专业技能平权化,释放了每个人的个体创造力。”张予彤称。
此外,张予彤还进一步总结了中国AI产业实现这种效率超越的三大底层驱动力。首先是规模化市场的赋能,中国庞大的制造业与零售业提供了海量数据与复杂业务逻辑结合的独特场景,使技术能在真实生产环节中高效迭代;其次是中国社会对新技术的包容与开放态度,从新能源汽车到自动驾驶的发展历程表明,用户与企业对提升生产力的工具抱有极高的接纳意愿;最后,中国“基建先行”的思维模式以及在电力、数据中心等方面的持续投入,有效降低了能源获取成本,为技术创新提供了稳固支撑。
随着AI推理成本在过去一年中急剧下降,张予彤判断“智能”正成为新的通用语言,软件将走向“无形化”。
她表示,未来人类无需通过复杂界面操作,只需以自然语言经由Agent(智能体)调用功能即可。“软件不会消失,但它将变得随手可得且‘可丢弃’。”她预测,未来的代码将通过“氛围编程”(vibe coding),只要意图清晰,AI就能即时编写出个性化工具交付结果。
大模型行业加速竞跑
随着AI的成本降低和技术的不断演进,过去一年来,中国大模型行业竞争正在加速。
2026年1月初,AI大模型企业智谱(HK.02513)与MiniMax(HK.00100)先后在香港联合交易所上市,分别被称为“全球大模型第一股”和“最快上市AI公司”。
而月之暗面也在2025年末由创始人杨植麟通过内部信确认,公司完成了5亿美元C轮融资且大幅超募,当前现金持有量超过100亿元。尽管行业上市潮涌动,月之暗面表示短期不着急上市,也不以上市为目的。杨植麟明确,C轮融资资金将用于“更加激进地扩增显卡”,加速K3模型的训练和研发。另外,部分资金也将用于2026年的激励计划和期权回购计划。
值得注意的是,据《科创板日报》日前报道,月之暗面正推进新一轮融资,其投前估值已升至约48亿美元(约合人民币335亿元)。若此轮融资顺利完成,公司估值将再度刷新国内大模型初创企业的融资纪录。报道还引用一名知情人士消息称,月之暗面已向部分潜在投资者表示,公司目标是在2026年下半年启动IPO进程。
对此,《每日经济新闻》记者向月之暗面方面求证,但截至发稿其未对上述消息做出回应。
而对于Kimi下一代模型,张予彤在论坛问答环节被问及今年是否会出现新的“中国AI时刻”时,她笑着回应:“我们很快就会发布一个新模型。”据杨植麟此前透露,下一代K3模型可能会使用其最新的实验性架构KDA(Kimi Delta Attention,一种线性注意力模块)的相关思路。当时杨植麟强调,“我们希望在K3中实现重大的架构革新,并开拓出全新的能力。”

