《科创板日报》1月22日讯(记者 黄心怡)今日,《科创板日报》从AI推理GPU芯片公司曦望方面获悉,一年内已完成近30亿元融资。
其投资方阵容汇聚了三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,还获得诚通混改基金等国资背景资本加持。资金将用于下一代推理GPU研发、规模化量产及生态共建。
当前,AI芯片产业从“训练红利”向“推理红利”切换。当模型训练进入深水区,推理环节的效率、成本与稳定性,已成为决定AI商业化落地成败的关键。为此,曦望方面表示,将押注All-in推理。
曦望成立于2020年,前身为商汤科技大芯片部门。在团队成员方面,联席CEO王勇是前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,2020年加入商汤后,带领百人团队成功主导了曦望两代芯片的研发和量产。
另一位联席CEO王湛则是百度创始团队成员、原集团副总裁,曾带领百度搜索8000人团队,2025年初加入曦望,负责公司产品化和商业化。
目前,曦望团队规模约300人,主要来自于NVIDIA、AMD、昆仑芯、商汤等企业。
与多数国产芯片厂商不同,曦望摒弃了传统训推一体GPU为训练优化的设计思路,聚焦推理场景进行原生架构重构——在调度、缓存、片上SRAM、互联及编译器路径上做深度优化,结合LPDDR内存技术,从根源降低单位Token推理成本。
公开信息显示,曦望历经数年投入20亿元研发,目前已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求。其中,2020年量产的S1芯片,作为国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户;2024年量产的S2芯片,对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型;2026年即将推出的S3芯片,堪称“推理性价比之王”,在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准。
“如果能让推理成本下降90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国AI产业的损益表’。”王湛如此概括公司的定位,“我们的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力。”
除了一级市场融资外,不少国产GPU公司已走向二级市场,行业整体进入资本化加速阶段。
沐曦股份和摩尔线程在去年12月登陆科创板。上市首日,两家公司股价分别大涨692.95%、425.46%。壁仞科技、天数智芯则今年1月相继在港股上市。此外,燧原科技科创板IPO今日获受理,瀚博半导体完成科创板上市辅导。而百度昆仑芯也计划赴港上市。

