吴永辉接管字节Seed这一年

创新需要适当的灰度和混乱,但应对竞争需要秩序纪律

文丨陈佳惠 贺乾明

制图丨黄帧昕

编辑丨贺乾明

上千人的研究团队、投入上百亿元追赶两年,终于研发出能排在中国第一梯队的基础模型,迅速被只有上百人的团队用更少资源研发的模型超过,部门负责人承认失误,公司 CEO 在全员会上点名,本可以做得更好。

这是吴永辉 2025 年初接管字节跳动大模型研究部门 Seed 时的情况。多位 Seed 人士说,他背负着 “把模型能力做到国内第一,与国际领先模型公司竞争” 的期待。

“沉稳” 是他们对吴永辉的直观感受。我们了解到,接管 Seed 后,吴永辉密集与 100 多位核心研究员 1on1,随后提拔了数位模型架构方向研究员

接管 Seed 一年间,吴永辉聚焦两件事:一是提升基础模型能力,提高研究效率保证交付;二是营造研究导向的氛围,“做第一流的研究,打造第一流的 AI 研究团队”。

“有务实又有浪漫。” 一位接近吴永辉人士说,他像是在字节体系内成长起来的,而不是出自 Google。

吴永辉 2008 年博士毕业后加入 Google,前 7 年作为软件工程师参与最核心的搜索排名工程;随后转岗到 Google Brain 从事 AI 应用研究,推动深度学习改变翻译领域、用到搜索排名算法中;2023 年成为大模型研发部门 Google DeepMind 研究副总裁,参与 Gemini 大模型研发和早期追赶历程。

另一位接近吴永辉的人士说,“他对技术了解很深,能迅速判断什么方向可以出成果。” 过去一年,Seed 的文生图、文生视频模型在一些基准测试榜单上排在全球前列,豆包手机助手模型成为行业关注焦点。

在竞争最激烈、最重要的基础模型方向,Seed 迭代 4 版(算上即将发布的豆包 2.0),与此前模型能力有较大提升,持续追赶海外领先模型。“但还需要补课,填上过去几年留下来的 ‘技术债’。” 一位 Seed 人士说。

追求 “一流研究团队” 这个长期目标的同时,吴永辉还要不断和短期目标做平衡。

调整:组建三个虚拟团队,打通数据代码提高效率

2025 年 1 月,Seed 组建 “Seed Edge” 虚拟团队,设置 3 年期限的考核机制,鼓励骨干研究更基础、更长期的 AGI 课题。我们了解到,吴永辉参与了该团队的组建。

随后他又抽调研究人员组建 Focus 团队,打破部门边界和既有分工,负责基础模型的攻坚,研发下一版模型需要提升的部分。剩下基础模型的团队划分成 Base,包括工程、数据、测评等,研发当前一代基础模型。

这年 3 月,时任 LLM 团队负责人乔木被举报暂停工作后,LLM 下属的 Pre-train(预训练)、Post-train(后训练) 和 Horizon 等直接向吴永辉汇报

两位 Seed 人士说,在吴永辉的规划中,可以同时推进三代模型研发,人员、课题都可以相互轮换,同时盘活内部的资源,“Edge 有了成果可以直接下放;Focus 发现长期课题可以转入 Edge,有了成果可以用于改进当前一代模型。”

为了提高效率,吴永辉还推动内部数据、代码库透明,对外保密。他在内部说,这是 “改进内部反映的一些问题”。

在字节跳动,Seed 脱离各营收部门单独设立,团队直接向集团管理层汇报,更容易摆脱部门政治。但在 Seed 中,总是多个团队研发方向接近,团队之间沟通相对困难。

两位曾在 Seed 工作的研究员说,之前他们像是一群研究小组的集合,而不是整体的研究部门,比如小组 A 的研究者想看小组 B 的文档,要先经过文档所有者、所有者的领导同意,“有时候部门负责人出面调解都看不了全部信息。”

更透明的信息共享提高了沟通效率,也带来了一些麻烦。我们了解到,2025 年下半年,Seed 至少发生两起实习生泄密事件。之后他们不再要求内部文档公开授权。

基础语言模型研究方向之外,Seed 依旧保持原有的组织架构。上一任 Seed 负责人朱文佳与吴永辉同时负责 Seed 部门数月后,转向吴永辉汇报,负责大模型应用。

模态交互和世界模型团队由 2024 年从阿里加入字节的周畅负责,代表成果是豆包手机助手模型。过去一年,随着视觉模态生成负责人杨建朝休假、视觉基础模型研究负责人冯佳时离职等变动,周畅的管理范围持续扩大,新增文生图 Seedream、文生视频 Seedance 模型等。

Infra(基础设施)团队由项亮负责。字节跳动的 AI Lab 带着剩下的三个研究方向——AI for Science、Robotics、Reponsible AI 并入 Seed,负责人李航向吴永辉汇报。

过去一年,Seed 整体规模维持在 1500 人左右,扩张速度比前两年放缓,几乎不再从外部招聘中高层技术管理者。他们更加重视招聘应届毕业生、提拔年轻人。我们了解到,一位 2024 年从清华大学毕业的博士生,现在同时向周畅和吴永辉汇报。

成果:边开车边修轮子,训出万亿参数豆包 2.0

即将发布的豆包 2.0 模型是吴永辉接管 Seed 一年最核心的产出。它是一款类似 Gemini 的多模态模型,10000 亿参数,是 Seed 成立以来训练的最大模型。

吴永辉到来后,多位 Seed 研究员明显感受到开会的频率提升,原本 3 个月开一次会的研究团队现在每月就要沟通一次,核心团队基本每两周一次。有字节人士提到,在食堂吃饭时,经常能看到吴永辉端着餐盘坐到研究员对面,边吃边聊进展。

每次研究团队汇报完毕后,吴永辉通常会提几个简短的问题——通常是 3 个。“他不会直接给出具体的解决方案,而是引导大家思考更本质的问题。” 一位 Seed 研究员说。

多位 Seed 人士告诉我们,这款模型训练期间遇到基础设施层面的挑战。他们分析,过去两年 Seed 持续追赶期间,相对忽视了基础能力建设,所以训练豆包 2.0 期间扩大参数规模时不稳定,一度难以推进。

“就像盖房子,如果地基不稳,往上加砖头的确容易出问题。” 一位 Seed 研究员说。

OpenAI 的 RL Infra 负责人翁家翌在一档播客节目中说,每个模型团队的 Infra 都有 bug,模型公司本质上拼的是 Infra 修 bug 的速度,它决定了单位时间内验证想法的数量,而想法只要提高人才密度就能解决。OpenAI 去年开始重构使用三年的 Infra 体系,解决越积越多的 “技术债”。

过去一年,阿里、腾讯的大模型团队都提高了对 Infra 的重视程度。Qwen 模型团队去年中开始在内部组建 Infra 团队,这部分工作原来主要靠阿里云的人工智能平台 PAI。腾讯去年底宣布成立 AI Infra 部及数据计算平台部,由大模型负责人姚顺雨直接负责。

而对于 Seed 团队,想要重整 Infra 系统难度更大。我们了解到,Seed 的 Infra 团队有数百人,同时支撑 Seed 内部数十款模型的研发和尝试,高层认为水平国内第一。“想要重整,需要投入大量人力物力,还要承担不小的信任成本。” 一位 Seed 人士说,只能 “边开车边修轮子”。

我们了解到,训练豆包 2.0 遇到问题后,最终多个团队配合,花了 3 个月时间,主要从模型架构、训练数据等方面入手解决问题,确保模型赶在春节前上线。

难题:既要做一流研究组织,又要有短期产出

“我们致力于打造一种独特的文化融合体:既有初创企业的专注与活力,又兼具学术界天马行空思维。”Google DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)曾说。

多位 Seed 人士说这也是吴永辉的目标,“他想把 Seed 做成一流的研究品牌。”

字节跳动给他提供了环境。过去两年,字节在 Seed 聚集了一批研究人才,就算没有合适的位置,也倾向于 “先把人招进来”。

字节给 Seed 部门设置更宽松的考核机制,大部分取消 OKR。2025 年中,字节发放独立于公司期权之外的 “豆包虚拟股” 激励员工,并多次提高薪酬。

他们也在 Seed 营造一种宽松的工作氛围,实习生能直接与最高层交流。一位 TopSeed 实习生曾在社交媒体上分享,他在开发某个项目的近两个月里,大部分时间睡在公司,经常凌晨两点带着新想法兴奋惊醒,写两小时代码再睡,“感觉每一刻都在不断的发现新现象”。

去年 3 月,吴永辉在部门全员会上说,Seed 做了很多不错的工作,但外界不太了解,鼓励研究者以论文博客的形式发表成果。“他还建议大家 ‘装修’ 下个人主页。” 一位曾在 Seed 的人说。根据我们初步统计,吴永辉加入 Seed 之后的三个月,该团队发布的论文数量就超过 2024 年全年。

能够对外界充分展示研究成果,进一步激发了 Seed 研究者的自驱力。“筛选出来了一批非常勤奋专注,或者说热衷于钻研年轻人。” 一位去年离开 Seed 的核心研究者说,他们多数人每天两点一线,为了省事,吃饭只在公司食堂,“生活的主要乐趣就在于工作带来的 feedback”。

我们了解到,Seed 会出现一种情况:几个研究员决定自发研究一个方向,如果上级不同意、不分配资源,他们可以上升汇报,得到认可后,就可以从上到下推进。

“他们从前是自己领域内的 ‘小霸王’,带着 ego 来到 Seed,每个人都想成就一番事业。” 上述人士预估,可能只有 20% 的资源是用在短期有用的课题上,“浪费有可能是对的,字节不缺资源。”

但 Seed 并不是一个脱离竞争存在的研究组织,他们需要给字节跳动提供 “弹药”,应对腾讯、阿里等公司的竞争。团队资源不可避免会向短期有成果的团队倾斜。多位 Seed 人士说,去年下半年开始,有研究者做一些单点研究,“感觉不符合 Seed 的主流方向,就很少有人在意这份成果”。

我们了解到,从去年三季度开始,字节管理层对 Seed 团队发论文有了新要求,包括 “高质量”“内容与正迭代的核心技术无关” 等,之后每月发布的论文有所减少。

“永辉想要营造研究氛围,但很难避免 DDL 导向。” 一位 Seed 研究员说,他们团队本来要花更多资源和时间,自研算法解决某个技术问题,但为了尽快上线,项目启动后不久就被要求调整思路,在开源项目基础上改进,“哪怕性能损失”。

今年 1 月,字节跳动 CEO 梁汝波在全员会上说,字节今年关键词是 “勇攀高峰”,短期内高峰是 “豆包 /Dola(豆包海外版)助手应用”,重点是 “AI 模型能力要做到行业前列,通过助手整合好已有业务”。一年前的全员会上,梁汝波说 AI 研究团队要 “探索智能上限”。

创新需要适当的灰度和混乱,而应对竞争需要秩序纪律。怎么平衡好这两个目标,是吴永辉在 Seed 持续要解的管理难题。

题图来源:《盗梦空间 Inception》

Published by

风君子

独自遨游何稽首 揭天掀地慰生平