梁文锋有了“隆中对”

这几天，DeepSeek700亿元融资的热度还没散去，另一条线索已经浮出水面：它正把重心压向AI Coding。

近日，DeepSeek方面连续发布了两个新岗位：Agent Harness产品经理和Agent Harness研发工程师。

按照招聘信息的说法，DeepSeek正在把前沿模型能力转化为Agent产品，模型之外的工作，都被归入Harness范畴。入职者将加入Harness团队，参与DeepSeek桌面端Agent产品的研发全过程。

这几句话，基本划出了DeepSeek新业务的边界。

DeepSeek资深研究员陈德里在社交平台招人时，标题直接写到“来DeepSeek从零做Code Harness”，并提到“对标Claude Code，做DeepSeek Code Harness”。

据了解，DeepSeek正在北京组建新的Harness团队，目标是从零做自己的代码Agent，内部工作名指向“DeepSeek Code”。

这个方向正踩在大模型商业化最热的战场上。

Claude Code已经把AICoding做成了项目级开发工具。Anthropic在2026年2月融资公告中披露，Claude Code年化收入超过25亿美元，较2026年初翻倍；Claude Code周活用户数也较今年年初翻倍。

另一边，OpenAI在今年2月推出Codex桌面App，把Coding Agent从命令行带到多任务桌面环境。OpenAI企业副总裁Ashley Kramer近期称，Codex周活用户在15天内从300万增至400万。

Google方面也在I/O 2026后把Antigravity升级为2.0，外媒称其从IDE转向独立桌面应用，并加入CLI和SDK，直接瞄准Claude Code和Codex。

在组建Agent团队之余，DeepSeek也在模型侧开始加速占领市场。其官方价格页显示，V4-Pro将在5月31日结束2.5折优惠后，正式维持该优惠价格。在此前的行业视角中，普遍认为V4的长上下文、高性价比特性更适合Agent应用。

700亿融资口径传出后，DeepSeek像是刘皇叔有了“隆中对”。它一边招兵买马、广纳英才，一边把战线推向Code Harness。

围绕Code Harness，DeepSeek首先在人才方面补强。

几天前，一些知名外媒陆续披露，DeepSeek招募了前Jane Street工程师崔添翼，而这一人才招募的目的，是“为了追赶AIAgent和商业化竞争”。

公开信息显示，崔添翼加入的是DeepSeek新设的AIHarness团队。同时还在招聘更多岗位，支持新的旗舰桌面端Agent产品。

翻开崔添翼的履历，会发现他有不同于传统AI研究员招聘的意味。

崔添翼毕业于浙江大学计算机系，在校期间多次参加ACM-ICPC区域赛并获得金牌；毕业后，他在Jane Street香港和纽约办公室工作9年；2022年，他联合创立TSY Capital。

Jane Street是一家全球量化交易公司。崔添翼曾在其香港和纽约办公室工作近9年，职位是软件开发者和研究员，覆盖股票和固收业务。显然，他的这段经历覆盖了交易系统和工程研发，而非传统的学术派AI研究员。

崔添翼后来联合创立TSY Capital。这家公司成立于2022年，总部在香港，做的是全球股票市场的程序化交易。

它用机器学习模型生成交易信号，再用Rust自研低延迟交易系统完成执行。

换句话说，这是一位“量化交易老兵”，一方面让人联想到DeepSeek母公司幻方的主营业务领域，同时也表明，他和DeepSeek以及诸多AI公司传统模型研究员的路径不一样。

DeepSeek过去靠基座模型开路出圈，而崔添翼进入Harness Team，说明DeepSeek Code背后需要另一类人：他们不一定是大模型论文作者，但做过真实系统，知道模型输出落到执行层会出什么问题。

从陈德里的发言中，也能看到DeepSeek这一次招聘思路的转变。

近日，他在社交平台确认，公司正在组建新的Harness团队，方向是“对标Claude Code，做DeepSeek Code Harness”。这次招的也不是单纯模型研究员，而是产品经理和研发工程师。

岗位描述显示：Code Harness团队成员要参与DeepSeek桌面端Agent产品研发，还要和模型研究团队协作，把真实任务里的反馈带回模型训练。

顺便再多提一下陈德里，这位DeepSeek研究员不仅仅是R1的核心论文作者之一，也是DeepSeek为数不多经常公开露面的内部人士。

去年11月乌镇世界互联网大会上，他代表DeepSeek参加“六小龙乌镇对话”。陈德里谈AI短板时说，AI还不具备像人类一样稳定的智能，模型训练完后参数固定，无法像人一样在真实世界中自我迭代。

而在一连串招聘信息热度中，另一条线索是徐名宇。

最近一段时间，前DeepSeek资深研究员郭达雅的跳槽，揭开了AI行业人才争夺战的一角。

相关报道显示，字节Seed团队过去一年被挖走近70人，其中就包括Seed Edge长期研究计划成员徐名宇，目前，他已加入DeepSeek模型结构组，从事模型结构相关研发。

在字节时期，徐名宇曾是论文DeltaFormer的第一作者，论文讨论标准Transformer在状态跟踪任务上的表达限制，正文点名Python代码执行、实体跟踪、棋类等任务，并尝试用DeltaNet增强Transformer处理状态空间问题的能力。

徐名宇的加入，补的是DeepSeek Code背后的模型结构能力。崔添翼对应产品和系统工程，徐名宇对应更底层的连续任务能力，两条线共同指向DeepSeek正在做的Code Agent。

Code Agent进入真实仓库后，最容易暴露的问题也常常不是写不出一个函数，而是十几轮修改后忘记最初目标，跨文件改动后逻辑不一致，测试失败后不能沿着旧状态继续修，这些考验的都是模型在连续步骤中保存和更新状态的能力。

另一边，DeepSeek的Harness招聘，已经把对标对象写得明明白白。官方披露的招聘信息称，Agent Harness岗位要求候选人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等产品。

显然，DeepSeek Code的成长路上需要两类经验：一类来自真实系统，处理模型输出后的执行后果；一类来自模型结构，处理多轮任务里的状态保持。持续的人才补强，也揭开了这一轮AI人才攻防战的新一回合。

几周前，DeepSeek核心人物郭达雅转投字节，被外界视为DeepSeek的一次重要损失。

他的履历与DeepSeek基座模型的几块基石有着紧密联系。公开报道显示，郭达雅专注代码智能和大语言模型推理，参与过DeepSeek-Coder、DeepSeekMath、DeepSeek-Prover、V3、R1等项目。而在DeepSeek-Coder论文里，他排在第一作者位置。

今年3月前后，郭达雅被曝从DeepSeek离职，随后加入字节Seed。一些公开报道显示，他看好Agent方向，而DeepSeek内部当时Agent优先级并不高；加入字节后，Seed内部正启动围绕Agent和Coding的组织整合。

回到几周后的今天，手握数百亿融资的DeepSeek，一边开始奋起直追补课Harness Agent，一边开始试图引入更多“郭达雅”充实人才库。

当然，这场人才攻防战在郭达雅离职前就早已打响，而DeepSeek从未停止过在Coding等模型垂直方向的人才引入。

近期披露的2026字节跳动奖学金名单中，就有一个值得关注的名字。

据字节方面披露，字节跳动奖学金至今支持了67位青年研究者；2023年得主路橙、朱琪豪分别是OpenAI Sora2和DeepSeek GRPO的重要研究贡献者。

其中，朱琪豪是北京大学计算机学院2024届博士毕业生，专注深度代码学习。他在DeepSeek团队中基于博士论文工作，主导开发了DeepSeek-Coder-V1；此后又出现在DeepSeek-Coder-V2和DeepSeekMath/GRPO相关论文中，是DeepSeek代码模型和强化学习路线里的早期参与者。

值得关注的是，在DeepSeek-Coder的迭代历程中，朱琪豪的位置有一个清晰变化。

DeepSeek-Coder V1的作者列表里，郭达雅排在朱琪豪之前；到了DeepSeek-Coder V2，朱琪豪的名字已在郭达雅之前。

作者顺序当然不能直接等同于内部贡献大小，但对一条连续迭代的技术线来说，毫无疑问传递出的信号是，朱琪豪是DeepSeek系列模型Coding能力的绝对核心人物。

另一条不能忽略的是多模态。

在Chatbot形态里，DeepSeek的多模态短板还不明显。用户主要用文字提问，模型只要在推理、写作、代码和长上下文上表现足够强，就能支撑大部分使用场景。DeepSeek过去一年最强的公众认知，也确实来自R1、V3、V4，以及低成本API。

但桌面端Agent会改变这个前提。代码Agent如果进入开发者电脑，就不只是在聊天框里回答问题，还要理解IDE界面、终端报错、浏览器文档和截图反馈。换句话说，读屏能力会从“加分项”变成基础能力。

潘梓正，是DeepSeek多模态业务中被公开披露较多的名字。

去年2月，多家媒体转述了英伟达高级研究科学家禹之鼎的社媒内容。禹之鼎回忆，潘梓正2023年夏天曾在NVIDIA实习，当时NVIDIA考虑给他全职机会，但潘梓正“毫不犹豫”选择回国加入DeepSeek；那时DeepSeek多模态团队只有几个人。

禹之鼎还提到，潘梓正在DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多个项目中发挥了“关键作用”。他写道，潘梓正的案例是近年来他看到的典型例子：很多最优秀的人才来自中国，这些人才不一定只能在美国公司取得成功，美国研究者也能从他们身上学到很多。

DeepSeek-VL2的能力方向，和Code Harness并不远。VL2覆盖视觉问答、OCR、文档、表格、图表理解和视觉定位；这些能力放到桌面端Agent里，正好对应读屏、读报错、读网页文档和理解界面元素。

但DeepSeek多模态近期缺少一个真正站到台前的突破。Janus-Pro在2025年1月发布，DeepSeek称其图像生成能力超过DALL-E 3和Stable Diffusion；VL2则停留在2024年12月的视觉语言模型更新。

这意味着，DeepSeek已有读屏和视觉理解的技术底子，但还没把多模态打成和R1推理、V4长上下文一样清晰的品牌标签。如果DeepSeek Code真要做桌面端Agent，多模态大概率仍是后续补人的方向。

回到陈德里在去年乌镇世界互联网大会上的讲话，他在谈AI稳定性时说，模型训练完后参数固定，不能像人一样在真实世界中自我迭代。他提到的方向，是让AI具备稳定学习算法，并通过多模态等方式与真实世界建立更多链接。

面对着大模型发展行业的卡点，DeepSeek内部有着清晰的认知。但回过头看过去一年的更新缓慢和人才流失，显然大模型竞争是一个考验资本厚度和耐力的长期作战，需要更多“弹药”供给，700亿融资到位后，不只是Code Harness，也许DeepSeek也将进入多线叙事的快速铺开产品的逻辑。

只看基座模型，DeepSeek已经站进第一梯队，但也并非领跑位置。

新一代DeepSeek-V4-Pro在代码基准和Agentic任务上缩小了与领先闭源模型的差距。DeepSeek V4-Pro在SWE-bench Verified上达到80.6%，接近Claude Opus 4.6。

此外，DeepSeek V4在Vibe Code Bench中成为开源权重模型第一，得分49.9%，也是唯一超过40%的开源权重模型。

但是，强模型和强产品，本质上还是两件事。Claude Code的商业化数据，是DeepSeek无法绕开的参照。

Anthropic披露Claude Code年化收入超过25亿美元后，外界对AICoding的估值逻辑已经变了。它不再只是模型公司展示能力的Demo，而是可以直接贡献收入的产品线。

Claude Code的形态也已经超出聊天框。

它能在开发者代码库中工作，通过终端、IDE、桌面端、Slack和网页使用；在本地终端运行时，会在改文件或运行命令前请求授权。这个设计让AICoding进化成了项目级的助手。

和Claude Code齐头并进的，还有OpenAI的Codex、Google Antigravity 2.0，大厂正在把AICoding从编辑器插件推向独立开发环境。

与此同时，这也是国产模型竞争最激烈的领域之一。

Kimi和智谱近期在Coding领域的跑分，先后进入了第一梯队。SWE-Bench Pro成绩显示，Kimi K2.6为58.6%，GLM-5.1为58.4%，DeepSeek V4 Pro-Max为55.4%。

SWE-Bench Pro测的是工程修复能力。它选取真实GitHub项目中的Issue和测试用例，让模型提交补丁，再看测试是否通过。在这组更难的任务里，Kimi和GLM都跑在DeepSeek前面。

DeepSeek也不是没有强项。有评测显示，V4 Pro在SWE-Bench Verified上达到80.6%。Verified版经过人工筛选，常用来观察模型处理真实代码问题的稳定性。

具体打法上，智谱通过GLM Coding Plan进入Claude Code、Cline、OpenCode等已有开发者工具，Kimi也有kimi-cli、Kimi Code等终端和代码工具入口，同时还通过Cursor Composer等第三方产品进入开发者工作流。

而随着DeepSeek Code Harness浮出水面，DeepSeek将与这两位国产同行一同竞争AICoding的用户心智。

尤其是当这一轮融资被推到700亿元时，DeepSeek正好站在Code Harness这个岔口。

此前，DeepSeek管理层向潜在投资者表示，融资落地后，会优先推进突破性AI研究，而不是短期商业化。

对DeepSeek来说，融资首先意味着算力池可以继续做大。DeepSeek官网介绍中提到，其依托自研训练框架、自建智算集群和万卡算力资源；GitHub上，DeepSeek还开源了面向AI训练和推理负载的3FS分布式文件系统。

3FS可以理解成DeepSeek给大模型集群配的一套高速共享硬盘系统。训练和推理时，GPU需要持续读取数据、保存模型状态，3FS负责把分散在多台机器上的SSD整合起来，通过RDMA网络高速传输数据。

DeepSeek称，这套系统在180节点集群里跑到过6.6TiB/s的聚合读取吞吐。

而更大的背景，是国产算力替代正在被V4推到前台。最新发布的DeepSeek V4已适配华为昇腾AI芯片，华为昇腾950超节点将完整支持V4。有行业分析指出，DeepSeek曾与华为、寒武纪合作改写部分模型代码，以适配国产硬件。

因此，DeepSeek Code Agent不只是一个Agent产品，它很有可能是DeepSeek把模型能力、国产算力和用户场景连起来的前沿入口：一端承接V4在国产硬件上的落地，一端进入开发者的生产流程。

2025年初，DeepSeek靠R1证明，一家中国模型公司可以突然改写全球大模型叙事。

现在轮到Code Harness回答另一个问题：全球最成功的大模型公司之一，能不能在Agent领域再现一次DeepSeek神话。

Published by

风君子

最新文章

标签

书签