梁文锋内部透露：DeepSeek V4将于4月下旬发布

作者 | 张弛

编辑 | 虞尘

在历经数次"跳票"传闻后，备受关注的DeepSeek V4即将登场。

据《创智记》从多位知情人士处获悉，DeepSeek创始人梁文锋近日在内部沟通中透露，DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。

此前有相关消息显示，DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口，更首次实现与华为昇腾等国产芯片的深度适配，标志着中国AI产业在"去CUDA化"道路上迈出关键一步。

值得关注的是，3月29日晚，DeepSeek经历了整整13小时服务中断。当时官方仅称"服务器故障"，但多位开发者在恢复后发现，模型输出逻辑发生显著变化：编码结构更清晰，逻辑严谨度飞跃式提升，SVG图形生成能力明显增强。

业内普遍猜测，这次"停摆"实为V4的灰度测试或全量部署。

据悉，V4将以Apache 2.0协议开源，企业可自主部署。据最新外媒报道，为迎接V4发布，阿里巴巴、字节跳动、腾讯等国内科技巨头已预订数十万片新一代AI算力芯片，计划通过云服务提供DeepSeek新模型，并将其集成到自身AI产品中。受此影响，新AI芯片产品近期价格已上涨约 20%。

此前，DeepSeek发布时间已多次延期。原计划于 2 月中旬春节前后推出大参数版本，后因国产算力深度适配、架构重构与稳定性打磨等原因推迟。

从量化投资跨界AI的梁文锋，正在经历属于他的"蜕变"。

《晚点》报道，过去一年，DeepSeek团队虽有核心骨干离职（包括R1核心作者郭达雅等），但"有人离开，更多人留下"，团队并未成建制流失。

2025年下半年以来，梁文锋开始更多提及产品化和商业化，组建产品团队，招聘Agent方向"模型策略产品经理"，并从纯模型研发向应用层延伸。同时，他正在为公司进行估值，以明确员工期权价值，给予团队更确定的预期。

面对豆包、千问、智谱、Kimi、MiniMax等对手的强力竞争，迟到数月的V4承载着巨大的期待压力——梁文锋能否再次打造全世界最出色的开源大模型？

据了解，V4最大的技术亮点在于LTM（Long Term Memory，长期记忆）能力的突破。

但多位和DeepSeek深入接触合作的AI创业者告诉《创智记》，业界不应抱太高期待，V4很难再复制去年DeepSeek-V3的影响力。

除了DeepSeek V4，混元 3.0 大模型也将于4月正式发布。这是腾讯自 2025 年下半年完成团队架构重组、姚顺雨出任首席 AI 科学家后，推出的首个重磅大模型产品。

Published by