华为芯片老兵入局LPU 两家产业链上市公司出手押注

《科创板日报》4月20日讯(记者 敖瑾)在推理拐点叙事持续强化的背景下,围绕推理效率的算力架构出现分化,一批尝试重构算力架构的初创公司也随之开始浮出水面。

近日,LPU初创企业元川微宣布完成数亿元天使轮系列融资,参与投资方包括元禾原点、峰瑞资本、中芯聚源、深创投、东方嘉富、浙江省科创母基金以及上市公司星宸科技、智微智能等多元投资平台。公司方面表示,本轮融资资金将主要用于第一代LPU+架构AI推理芯片的研发与量产。

LPU架构进入主流视野,很大程度上源于Groq的快速崛起。作为专注推理算力的代表性公司,Groq在低时延、高吞吐及能效上的表现,引发市场对通用算力路径之外技术路线的重新审视。

2025年下半年,英伟达豪掷200亿美元,实质性整合了Groq的推理技术资产。到了今年3月,黄仁勋在GTC大会上展示了这项交易的最新成果:Groq的LPU架构已被深度集成到英伟达的Vera Rubin平台中,提供面向Agent的实时推理算力。

在产业龙头的领衔押注下,围绕推理场景的算力架构重构,正在从边缘探索走向产业前台。

华为芯片老兵押注LPU架构

元川微成立于2025年9月,创始人杨滨此前任职于华为,曾在2008年赴美组建华为处理器团队,2012年回国后主导华为无线基带算法与芯片部门。

杨滨在一档播客中曾表示,他早前已看好LPU这一架构路径,但直到2025年初DeepSeek-R1技术报告发布,才真正坚定了下场创业的决心。“论文给我触动极大,大模型终于不是泡沫了,可用了。 模型能力很强,成本降到了大家可以使用的阶段。那天晚上我把论文看完,觉得终于可以下场了。”

LPU通常指面向大模型推理场景设计的专用架构,其核心在于通过优化数据流、存储与调度方式,让数据在芯片内部“少绕路”,同时减少运行过程中的动态调度,从而提升响应速度并降低能耗。

落地到产品侧,元川微目前的规划是,拟面向不同推理场景进行分层布局,包括面向数据中心和高端边缘节点的推理芯片,强调高性能、复杂场景;以及面向大端侧和边缘侧的推理方案,更侧重连接能力以及面向行业场景的功能适配

这一规划来自于团队对推理需求本身变化的判断。“短期内推理需求仍将主要集中在数据中心及部分边缘节点,但随着Agent、具身智能等应用逐步落地,推理负载将持续向终端侧延伸,边端有望成为下一阶段的重要增长点。”杨滨对《科创板日报》记者表示。

据公司方面介绍,元川微目前仍处于研发阶段,已完成系统仿真、原型验证及FPGA验证,下一步将推进产品定义、客户对接以及软件生态与工具链建设,并计划于明年上半年完成投片。

值得一提的是,在仍处于研发阶段的情况下,元川微即获得了多方资本加持。其近期官宣的天使轮系列融资,就集结了头部财务投资机构、政府投资平台以及上市公司等的参与,包括中芯聚源、深创投、东方嘉富、元禾原点、峰瑞资本、浙江省科创母基金、杭州润苗基金以及星宸科技、智微智能等。

对于产业方在公司早期阶段的押注,杨滨对《科创板日报》记者表示,两家上市公司股东一定程度上分别代表了不同的市场切入方向,一个深耕算力中心,一个布局大端侧与边缘侧,与元川微的产品分层逻辑契合,因此它们兼具了股东和客户的身份,“产业方目前在产品定义、供应链和早期市场上都给了元川微实际的支持。”杨滨进一步表示,产业方更看重的是系统方案落地后,能否真正改善每瓦特性能与每token成本,“账能算回来,他们才会投。”

算力变局下的产业机遇

在杨滨看来,LPU架构的兴起,更本质的原因在于算力需求结构的变化。

他认为,当前算力消费的主体已经发生变化,“简单的碳基消费者,变成了碳基和硅基混合的消费模式。”也就是说,算力的调用方已经不只是人,还有Agent。

而这一变化带来的不只是量的压力。人与AI对话每秒不过几十个token,但Agent之间协同时交互量可能是这个数字的十倍乃至百倍,因此,现在阶段的推理基础设施,在每用户每秒的token提供能力、每token的成本、每token的能耗上,都和满足实际需求存在巨大差距。”杨滨据此判断,推理算力的基础设施,正处于一个重构的转折点。

值得一提的是,黄仁勋也在近期的公开表态中,持续强调推理拐点来临后,算力评价体系的重构,推理算力逐渐从附属环节走向核心环节。标志性的体现就是,成立了9年的Groq,因为英伟达一笔高达200亿美元的整合性收购,骤然站在了AI行业的聚光灯下。

不过,仅从国内来看,真正意义上以LPU为核心路线的企业仍属少数。

目前,多数AI芯片公司仍沿GPU或通用算力路径推进,通过兼顾训练与推理提升性能;包括元川微、迈特芯、深明奥思等少数几家企业,正在尝试以推理为中心重新设计架构,属于尚未形成共识的探索方向。

这一格局的形成,与技术路径选择及产业阶段密切相关。一方面,相较在既有架构上进行优化,从推理场景出发重新设计芯片架构,对系统设计能力与工程积累提出更高要求;另一方面,推理需求虽在快速增长,但其具体应用形态仍在演进之中,产业侧对新架构的接受度仍有待进一步验证。杨滨亦在采访中对《科创板日报》记者坦言,工艺制程与先进IP的制约是绕不开的门槛,而在产业共识尚未形成的早期,愿意理解这条路线的人本就不多。

不过他也表示,推理场景相较训练,对现有软件生态的依赖要低得多,这种相对宽松的生态约束,对国内推理芯片的创业者而言事实上是一个窗口机遇。

值得一提的是,从更广泛的行业视角来看,推理算力的兴起,已经为更多产业链环节带来了结构性机会。

随着token消耗提升,对算力密度、带宽及能效的要求同步上升,除了芯片架构层面,这一趋势的影响也在向上游硬件体系传导,带动包括服务器互联、PCB及高速材料等环节的需求提升。可以看到,相关上市公司在过去一段时间股价已经经历了一轮陡峭上升,资金对这一方向的关注度持续提升。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平