
作者 | 张弛
编辑 | 虞尘
在历经数次"跳票"传闻后,备受关注的DeepSeek V4即将登场。
据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。
此前有相关消息显示,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在"去CUDA化"道路上迈出关键一步。
值得关注的是,3月29日晚,DeepSeek经历了整整13小时服务中断。当时官方仅称"服务器故障",但多位开发者在恢复后发现,模型输出逻辑发生显著变化:编码结构更清晰,逻辑严谨度飞跃式提升,SVG图形生成能力明显增强。
业内普遍猜测,这次"停摆"实为V4的灰度测试或全量部署。
据悉,V4将以Apache 2.0协议开源,企业可自主部署。据最新外媒报道,为迎接V4发布,阿里巴巴、字节跳动、腾讯等国内科技巨头已预订数十万片新一代AI算力芯片,计划通过云服务提供DeepSeek新模型,并将其集成到自身AI产品中。受此影响,新AI芯片产品近期价格已上涨约 20%。
此前,DeepSeek发布时间已多次延期。原计划于 2 月中旬春节前后推出大参数版本,后因国产算力深度适配、架构重构与稳定性打磨等原因推迟。
从量化投资跨界AI的梁文锋,正在经历属于他的"蜕变"。
《晚点》报道,过去一年,DeepSeek团队虽有核心骨干离职(包括R1核心作者郭达雅等),但"有人离开,更多人留下",团队并未成建制流失。
2025年下半年以来,梁文锋开始更多提及产品化和商业化,组建产品团队,招聘Agent方向"模型策略产品经理",并从纯模型研发向应用层延伸。同时,他正在为公司进行估值,以明确员工期权价值,给予团队更确定的预期。
面对豆包、千问、智谱、Kimi、MiniMax等对手的强力竞争,迟到数月的V4承载着巨大的期待压力——梁文锋能否再次打造全世界最出色的开源大模型?
据了解,V4最大的技术亮点在于LTM(Long Term Memory,长期记忆)能力的突破。
但多位和DeepSeek深入接触合作的AI创业者告诉《创智记》,业界不应抱太高期待,V4很难再复制去年DeepSeek-V3的影响力。
除了DeepSeek V4,混元 3.0 大模型也将于4月正式发布。这是腾讯自 2025 年下半年完成团队架构重组、姚顺雨出任首席 AI 科学家后,推出的首个重磅大模型产品。

