梁文锋有了“隆中对”

这几天,DeepSeek700亿元融资的热度还没散去,另一条线索已经浮出水面:它正把重心压向AI Coding。

近日,DeepSeek方面连续发布了两个新岗位:Agent Harness产品经理和Agent Harness研发工程师。

按照招聘信息的说法,DeepSeek正在把前沿模型能力转化为Agent产品,模型之外的工作,都被归入Harness范畴。入职者将加入Harness团队,参与DeepSeek桌面端Agent产品的研发全过程。

这几句话,基本划出了DeepSeek新业务的边界。

DeepSeek资深研究员陈德里在社交平台招人时,标题直接写到“来DeepSeek从零做Code Harness”,并提到“对标Claude Code,做DeepSeek Code Harness”。

据了解,DeepSeek正在北京组建新的Harness团队,目标是从零做自己的代码Agent,内部工作名指向“DeepSeek Code”。

这个方向正踩在大模型商业化最热的战场上。

Claude Code已经把AICoding做成了项目级开发工具。Anthropic在2026年2月融资公告中披露,Claude Code年化收入超过25亿美元,较2026年初翻倍;Claude Code周活用户数也较今年年初翻倍。

另一边,OpenAI在今年2月推出Codex桌面App,把Coding Agent从命令行带到多任务桌面环境。OpenAI企业副总裁Ashley Kramer近期称,Codex周活用户在15天内从300万增至400万。

Google方面也在I/O 2026后把Antigravity升级为2.0,外媒称其从IDE转向独立桌面应用,并加入CLI和SDK,直接瞄准Claude Code和Codex。

在组建Agent团队之余,DeepSeek也在模型侧开始加速占领市场。其官方价格页显示,V4-Pro将在5月31日结束2.5折优惠后,正式维持该优惠价格。在此前的行业视角中,普遍认为V4的长上下文、高性价比特性更适合Agent应用。

700亿融资口径传出后,DeepSeek像是刘皇叔有了“隆中对”。它一边招兵买马、广纳英才,一边把战线推向Code Harness。

围绕Code Harness,DeepSeek首先在人才方面补强。

几天前,一些知名外媒陆续披露,DeepSeek招募了前Jane Street工程师崔添翼,而这一人才招募的目的,是“为了追赶AIAgent和商业化竞争”。

公开信息显示,崔添翼加入的是DeepSeek新设的AIHarness团队。同时还在招聘更多岗位,支持新的旗舰桌面端Agent产品。

翻开崔添翼的履历,会发现他有不同于传统AI研究员招聘的意味。

崔添翼毕业于浙江大学计算机系,在校期间多次参加ACM-ICPC区域赛并获得金牌;毕业后,他在Jane Street香港和纽约办公室工作9年;2022年,他联合创立TSY Capital。

Jane Street是一家全球量化交易公司。崔添翼曾在其香港和纽约办公室工作近9年,职位是软件开发者和研究员,覆盖股票和固收业务。显然,他的这段经历覆盖了交易系统和工程研发,而非传统的学术派AI研究员。

崔添翼后来联合创立TSY Capital。这家公司成立于2022年,总部在香港,做的是全球股票市场的程序化交易。

它用机器学习模型生成交易信号,再用Rust自研低延迟交易系统完成执行。

换句话说,这是一位“量化交易老兵”,一方面让人联想到DeepSeek母公司幻方的主营业务领域,同时也表明,他和DeepSeek以及诸多AI公司传统模型研究员的路径不一样。

DeepSeek过去靠基座模型开路出圈,而崔添翼进入Harness Team,说明DeepSeek Code背后需要另一类人:他们不一定是大模型论文作者,但做过真实系统,知道模型输出落到执行层会出什么问题。

从陈德里的发言中,也能看到DeepSeek这一次招聘思路的转变。

近日,他在社交平台确认,公司正在组建新的Harness团队,方向是“对标Claude Code,做DeepSeek Code Harness”。这次招的也不是单纯模型研究员,而是产品经理和研发工程师。

岗位描述显示:Code Harness团队成员要参与DeepSeek桌面端Agent产品研发,还要和模型研究团队协作,把真实任务里的反馈带回模型训练。

顺便再多提一下陈德里,这位DeepSeek研究员不仅仅是R1的核心论文作者之一,也是DeepSeek为数不多经常公开露面的内部人士。

去年11月乌镇世界互联网大会上,他代表DeepSeek参加“六小龙乌镇对话”。陈德里谈AI短板时说,AI还不具备像人类一样稳定的智能,模型训练完后参数固定,无法像人一样在真实世界中自我迭代。

而在一连串招聘信息热度中,另一条线索是徐名宇。

最近一段时间,前DeepSeek资深研究员郭达雅的跳槽,揭开了AI行业人才争夺战的一角。

相关报道显示,字节Seed团队过去一年被挖走近70人,其中就包括Seed Edge长期研究计划成员徐名宇,目前,他已加入DeepSeek模型结构组,从事模型结构相关研发。

在字节时期,徐名宇曾是论文DeltaFormer的第一作者,论文讨论标准Transformer在状态跟踪任务上的表达限制,正文点名Python代码执行、实体跟踪、棋类等任务,并尝试用DeltaNet增强Transformer处理状态空间问题的能力。

徐名宇的加入,补的是DeepSeek Code背后的模型结构能力。崔添翼对应产品和系统工程,徐名宇对应更底层的连续任务能力,两条线共同指向DeepSeek正在做的Code Agent。

Code Agent进入真实仓库后,最容易暴露的问题也常常不是写不出一个函数,而是十几轮修改后忘记最初目标,跨文件改动后逻辑不一致,测试失败后不能沿着旧状态继续修,这些考验的都是模型在连续步骤中保存和更新状态的能力。

另一边,DeepSeek的Harness招聘,已经把对标对象写得明明白白。官方披露的招聘信息称,Agent Harness岗位要求候选人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等产品。

显然,DeepSeek Code的成长路上需要两类经验:一类来自真实系统,处理模型输出后的执行后果;一类来自模型结构,处理多轮任务里的状态保持。持续的人才补强,也揭开了这一轮AI人才攻防战的新一回合。

几周前,DeepSeek核心人物郭达雅转投字节,被外界视为DeepSeek的一次重要损失。

他的履历与DeepSeek基座模型的几块基石有着紧密联系。公开报道显示,郭达雅专注代码智能和大语言模型推理,参与过DeepSeek-Coder、DeepSeekMath、DeepSeek-Prover、V3、R1等项目。而在DeepSeek-Coder论文里,他排在第一作者位置。

今年3月前后,郭达雅被曝从DeepSeek离职,随后加入字节Seed。一些公开报道显示,他看好Agent方向,而DeepSeek内部当时Agent优先级并不高;加入字节后,Seed内部正启动围绕Agent和Coding的组织整合。

回到几周后的今天,手握数百亿融资的DeepSeek,一边开始奋起直追补课Harness Agent,一边开始试图引入更多“郭达雅”充实人才库。

当然,这场人才攻防战在郭达雅离职前就早已打响,而DeepSeek从未停止过在Coding等模型垂直方向的人才引入。

近期披露的2026字节跳动奖学金名单中,就有一个值得关注的名字。

据字节方面披露,字节跳动奖学金至今支持了67位青年研究者;2023年得主路橙、朱琪豪分别是OpenAI Sora2和DeepSeek GRPO的重要研究贡献者。

其中,朱琪豪是北京大学计算机学院2024届博士毕业生,专注深度代码学习。他在DeepSeek团队中基于博士论文工作,主导开发了DeepSeek-Coder-V1;此后又出现在DeepSeek-Coder-V2和DeepSeekMath/GRPO相关论文中,是DeepSeek代码模型和强化学习路线里的早期参与者。

值得关注的是,在DeepSeek-Coder的迭代历程中,朱琪豪的位置有一个清晰变化。

DeepSeek-Coder V1的作者列表里,郭达雅排在朱琪豪之前;到了DeepSeek-Coder V2,朱琪豪的名字已在郭达雅之前。

作者顺序当然不能直接等同于内部贡献大小,但对一条连续迭代的技术线来说,毫无疑问传递出的信号是,朱琪豪是DeepSeek系列模型Coding能力的绝对核心人物。

另一条不能忽略的是多模态。

在Chatbot形态里,DeepSeek的多模态短板还不明显。用户主要用文字提问,模型只要在推理、写作、代码和长上下文上表现足够强,就能支撑大部分使用场景。DeepSeek过去一年最强的公众认知,也确实来自R1、V3、V4,以及低成本API。

但桌面端Agent会改变这个前提。代码Agent如果进入开发者电脑,就不只是在聊天框里回答问题,还要理解IDE界面、终端报错、浏览器文档和截图反馈。换句话说,读屏能力会从“加分项”变成基础能力。

潘梓正,是DeepSeek多模态业务中被公开披露较多的名字。

去年2月,多家媒体转述了英伟达高级研究科学家禹之鼎的社媒内容。禹之鼎回忆,潘梓正2023年夏天曾在NVIDIA实习,当时NVIDIA考虑给他全职机会,但潘梓正“毫不犹豫”选择回国加入DeepSeek;那时DeepSeek多模态团队只有几个人。

禹之鼎还提到,潘梓正在DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多个项目中发挥了“关键作用”。他写道,潘梓正的案例是近年来他看到的典型例子:很多最优秀的人才来自中国,这些人才不一定只能在美国公司取得成功,美国研究者也能从他们身上学到很多。

DeepSeek-VL2的能力方向,和Code Harness并不远。VL2覆盖视觉问答、OCR、文档、表格、图表理解和视觉定位;这些能力放到桌面端Agent里,正好对应读屏、读报错、读网页文档和理解界面元素。

但DeepSeek多模态近期缺少一个真正站到台前的突破。Janus-Pro在2025年1月发布,DeepSeek称其图像生成能力超过DALL-E 3和Stable Diffusion;VL2则停留在2024年12月的视觉语言模型更新。

这意味着,DeepSeek已有读屏和视觉理解的技术底子,但还没把多模态打成和R1推理、V4长上下文一样清晰的品牌标签。如果DeepSeek Code真要做桌面端Agent,多模态大概率仍是后续补人的方向。

回到陈德里在去年乌镇世界互联网大会上的讲话,他在谈AI稳定性时说,模型训练完后参数固定,不能像人一样在真实世界中自我迭代。他提到的方向,是让AI具备稳定学习算法,并通过多模态等方式与真实世界建立更多链接。

面对着大模型发展行业的卡点,DeepSeek内部有着清晰的认知。但回过头看过去一年的更新缓慢和人才流失,显然大模型竞争是一个考验资本厚度和耐力的长期作战,需要更多“弹药”供给,700亿融资到位后,不只是Code Harness,也许DeepSeek也将进入多线叙事的快速铺开产品的逻辑。

只看基座模型,DeepSeek已经站进第一梯队,但也并非领跑位置。

新一代DeepSeek-V4-Pro在代码基准和Agentic任务上缩小了与领先闭源模型的差距。DeepSeek V4-Pro在SWE-bench Verified上达到80.6%,接近Claude Opus 4.6。

此外,DeepSeek V4在Vibe Code Bench中成为开源权重模型第一,得分49.9%,也是唯一超过40%的开源权重模型。

但是,强模型和强产品,本质上还是两件事。Claude Code的商业化数据,是DeepSeek无法绕开的参照。

Anthropic披露Claude Code年化收入超过25亿美元后,外界对AICoding的估值逻辑已经变了。它不再只是模型公司展示能力的Demo,而是可以直接贡献收入的产品线。

Claude Code的形态也已经超出聊天框。

它能在开发者代码库中工作,通过终端、IDE、桌面端、Slack和网页使用;在本地终端运行时,会在改文件或运行命令前请求授权。这个设计让AICoding进化成了项目级的助手。

和Claude Code齐头并进的,还有OpenAI的Codex、Google Antigravity 2.0,大厂正在把AICoding从编辑器插件推向独立开发环境。

与此同时,这也是国产模型竞争最激烈的领域之一。

Kimi和智谱近期在Coding领域的跑分,先后进入了第一梯队。SWE-Bench Pro成绩显示,Kimi K2.6为58.6%,GLM-5.1为58.4%,DeepSeek V4 Pro-Max为55.4%。

SWE-Bench Pro测的是工程修复能力。它选取真实GitHub项目中的Issue和测试用例,让模型提交补丁,再看测试是否通过。在这组更难的任务里,Kimi和GLM都跑在DeepSeek前面。

DeepSeek也不是没有强项。有评测显示,V4 Pro在SWE-Bench Verified上达到80.6%。Verified版经过人工筛选,常用来观察模型处理真实代码问题的稳定性。

具体打法上,智谱通过GLM Coding Plan进入Claude Code、Cline、OpenCode等已有开发者工具,Kimi也有kimi-cli、Kimi Code等终端和代码工具入口,同时还通过Cursor Composer等第三方产品进入开发者工作流。

而随着DeepSeek Code Harness浮出水面,DeepSeek将与这两位国产同行一同竞争AICoding的用户心智。

尤其是当这一轮融资被推到700亿元时,DeepSeek正好站在Code Harness这个岔口。

此前,DeepSeek管理层向潜在投资者表示,融资落地后,会优先推进突破性AI研究,而不是短期商业化。

对DeepSeek来说,融资首先意味着算力池可以继续做大。DeepSeek官网介绍中提到,其依托自研训练框架、自建智算集群和万卡算力资源;GitHub上,DeepSeek还开源了面向AI训练和推理负载的3FS分布式文件系统。

3FS可以理解成DeepSeek给大模型集群配的一套高速共享硬盘系统。训练和推理时,GPU需要持续读取数据、保存模型状态,3FS负责把分散在多台机器上的SSD整合起来,通过RDMA网络高速传输数据。

DeepSeek称,这套系统在180节点集群里跑到过6.6TiB/s的聚合读取吞吐。

而更大的背景,是国产算力替代正在被V4推到前台。最新发布的DeepSeek V4已适配华为昇腾AI芯片,华为昇腾950超节点将完整支持V4。有行业分析指出,DeepSeek曾与华为、寒武纪合作改写部分模型代码,以适配国产硬件。

因此,DeepSeek Code Agent不只是一个Agent产品,它很有可能是DeepSeek把模型能力、国产算力和用户场景连起来的前沿入口:一端承接V4在国产硬件上的落地,一端进入开发者的生产流程。

2025年初,DeepSeek靠R1证明,一家中国模型公司可以突然改写全球大模型叙事。

现在轮到Code Harness回答另一个问题:全球最成功的大模型公司之一,能不能在Agent领域再现一次DeepSeek神话。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平