
Vibe Working火了,Codex和Kimi Work都盯上10亿白领。
文 | 佘宗明
Vibe Working时代来了,不是轰的一响,而是哇的一声。
听到这,知道的人会说「1024(一级棒)」,不知道的人可能会一脸懵:什么是Vibe Working?
但如果将这里面的「Working」替换成「Coding」,很多人就悟了。
原因无他,过去一年多来,全球技术圈最火的词非Vibe Coding(氛围编程)莫属。
自从解锁了Vibe Coding后,许多程序员内心的os是:别再叫我「码农」了,请叫我「灵魂架构师」。
Vibe Coding的出现,部分革了「古法编程」的命,将原本复杂的逐行手敲代码变成了意图驱动式开发,让很多程序员就此告别逐行语法束缚。
可若「人描述意图+AI执行复杂工作流」只是程序员专属,那这场生产力革命辐射面终究有限:全世界程序员加起来是数千万,看起来是不少,可非程序员人群仍占据了职场打工人的绝大多数,其中白领人数就达到约十亿。
AI欲承「新工业革命」之重,从圈层化涟漪变成全民级浪潮是前提。
God说要有光,于是就有了光。白领们说「要让人负责Vibe(氛围),AI负责Working(干活)」,于是就有了头部AI企业揭开「Vibe Working」盖头的画面。
6月份以来,已有多家头部玩家在「Vibe Working」棋盘上落子:前有OpenAI官宣将Codex的核心能力直接并入ChatGPT,带动Codex周活用户突破500万,增量主要来自于知识工作者;后有Kimi近期推出桌面Agent产品Kimi Work Beta版,为知识工作者带来了「人动嘴皮子,AI干辛苦活」的程序员待遇同款体验卡。

▲OpenAI方面官宣,将Codex装进ChatGPT。
▲Kimi 推出了面向知识工作者的通用型本地Agent——Kimi Work。
可以预见,当Vibe Working能像Vibe Coding解放开发者指尖那样,让千行百业的知识工作者(泛白领人群)从无尽的表格整理、资料搜集、文档撰写、网页扒取等琐碎事情里抽身,「未来已来」四个字必然会变得愈发可感。
而现在,这一幕,已不远。
01
勇敢的人先享受世界,离AI近的人先享受AI世界的红利——最先感受到「AI真能干活」的群体,便是程序员。
2025年初,原OpenAI联合创始人Andrej Karpathy首次提出Vibe Coding,尔后该概念快速火爆出圈,究其原因就在于,Coding Agent重塑了编程工作形态。
「程序员,困在重复编码劳动里」,是程序员群体此前处境的真实写照。因为其工作的打开方式就是:梳理需求+架构设计+逐行编码+单元测试+BUG修复……循环往复。
但在Claude Code、Codex们出现后,事情起了变化:开发者们不用再什么都自己动手,只用讲清产品目标,剩下从代码撰写到环境部署交给Coding Agent就行。
这就好比,以往开发者得「自己做饭」,而今可以用语音「点外卖」,买菜、洗菜、炒菜、摆盘跟送餐,全都包在AI身上。
想想跟Code Agent说声「帮我搭个带鉴权的REST API(也就是带登录验证的后端接口)」,AI就能自动把文件建好、测试跑通、README写好,很多开发者能体会到钢铁侠拥有贾维斯的快乐。
程序员独乐乐,不如更多人众乐乐。Kimi Work就将Coding Agent的能力从代码世界平移到了通用办公场景中,让那些科研工作者、金融分析师、咨询顾问、企业文员们也能通过自然语言下达指令,让AI自动完成从获取原始资料到完整交付的全链路——即便他们是不懂Python爬虫、RPA配置的技术小白。
问题来了:为什么Coding Agent的能力能从代码圈外溢到泛知识工作领域?
第一性原理会告诉我们答案:Coding Agent干的,与其说是写代码,不如说是执行需要多步骤、多工具、多文件协作的复杂工作流,其核心就是理解意图、拆解任务、调用工具(API、终端)、读写文件、调试错误等。写代码只是种输出形式而已。
知识工作者的日常其实跟程序员高度相似:你写金融研报,要查数据、拉表格、建模型、写memo;你做竞品调研,要搜竞品、整资料、做分析、出报告;你做学术研究,要下文献、跑数据、画图表、写综述……拆解开来,其底层结构如出一辙:都是信息输入→多工具处理→结构化输出。

▲做产品调研报告跟写代码看似是两回事,实则同构。
换个视角看,这些工作未尝不是另一种「业务代码」,只不过,输入的是财报和文献而不是GitHub仓库,输出的是Excel和PPT等而非Python文件。
Kimi Work就打破了那层壁垒,把Coding Agent在沙盒里跑代码的能力,泛化成了在电脑桌面上跑工作流的能力——它将Kimi Code在代码领域拉练出的任务拆解引擎、工具调用框架、异常处理逻辑等能力,经过场景适配后复用到了更多领域。
因而,可以将Vibe Coding与Vibe Working视作是同一套生产力逻辑的两次落地:前者是用自然语言驱动AI编码,后者将其适用面外扩,是用自然语言指挥AI处理各种知识型工作。
这就像,电力起初只是用来驱动工厂里的纺织机,后来却走进千家万户点亮无数灯泡。
02
Vibe Working之于白领,正如Vibe Coding之于程序员,作用直观体现在改变工作方式上。
一直以来,人类习惯于串行做事,做完这一件,再做下一件,没法同时「既做又做还做」,否则容易手忙脚乱、顾此失彼。拿我自己来说,每次事务扎堆时,我都十分头大,毕竟分身乏术。尤其是面对那些大体量、长流程任务时,只能靠熬夜爆肝换进度。
没办法,「单核处理器」是人出厂设置自带的bug,而这也框定了我们的效率天花板。
但这难不倒天生适配分布式、并行化协作的AI Agent集群。
如今,OpenAI的Codex、Anthropic的Cowork都采用了子智能体(Sub-Agent)架构,Kimi Work更是将Sub-Agent的支持数量上限提升到了300多个。
支持最多300个Agent同时干活,是什么概念?
前两天,我打开 Kimi Work后,勾选 K2.6 Agent集群按钮,接着说「帮我分析下AI Agent赛道的创业机会,包括竞品分析、市场规模、技术趋势、商业模型,做一份能直接给投资人看的PPT」。
随后我看到,Kimi Work会像项目管理软件那样,自动把我的目标拆解成深度研究、报告撰写、PPT制作等若干个Satge(步骤),然后调度不同专长的子Agent分工协作:探索Agent会去拉数据,数据分析Agent会跑Excel模型,产品Agent会梳理逻辑线,美术Agent会操控浏览器找配图……它们并行推进、交叉验证、相互配合。
自动播放
▲Kimi Work的执行全过程录屏。
我理解,知识工作就像盖房子,用Agent就是摇人,以往单一Agent是单个装修工,他今天刷墙,明天铺地板,后天装灯具,工期长、效率低;Kimi Agent集群则是直接派装修公司——设计师、水电工、泥瓦匠、油漆工同时进场,他们齐头并进打配合,让效率倍增。
也许有人会说:说来说去,不就是所谓的「多线程作业」吗?
并不是。传统的多线程操作仅能同步执行任务,最终信息整合还得我们自己来。Kimi Work 的Agent集群则是有组织的并行协作,各个Agent同步运转、互通进度,相当于「蜂群智能」。如此一来,我们管理的不再是数百个孤立工具,而是一支高效协作的AI军团。
03
Vibe Working落地,离不开通用Agent。而在通用Agent方面跑在最前面的,仍是一方模型公司。
在当下,做Agent的产品基本可以分为两类:一类是第三方插件型(常被视作「缝合怪」),一类是一方模型原生型(即自研基模厂商的)。从Claude Cowork、Kimi Work纷纷发力Vibe Working看,一方模型公司更有机会做好通用办公Agent。
究其缘由,通用办公Agent 的生死线,就是交付的稳定性:你聊天框说错几句话,顶多是被人吐槽两下;Agent执行则是低容错性,错了一步,如在浏览器里点错按钮、在财务表格里算错公式,后果可能就很严重。
而通用Agent要想稳定交付,得解决复杂任务拆解可靠性、工具调用稳定性、长上下文+长输出能力、迭代速度等问题。
说到这,很多第三方插件型Agent产品会低下头——调用崩坏、数据断层、任务中断,是它们干活时的常见情形。未必是「给它们机会,它们不中用」,而是它们受制于上游模型能力和API配额。
一方模型公司下场,则像「亲妈带孩子」,对模型的能力边界、代码执行、工具调用理解得更透,非但能避免出现「套几层壳导致误差层层放大」的问题,还能模型和Agent一体化打磨,让Agent行为与基座模型共进化。
像Claude Cowork,就是脱胎于Claude Code,所以底层的指令跟随、长程规划、代码执行特别丝滑——还是「原厂调优」大法好。
Kimi Work内核也是根植于Kimi Code,因而生来就具备多重优势,如超长文本处理(一次性写几万字报告都不带喘气的)、专业数据源直接接入(天眼查、iFinD、Yahoo Finance、World Bank、arXiv等都不用用户手动配置)、浏览器操作深度整合(能登录、能点击、能下载、能截图而非简单网页抓取)……

▲Kimi Work直接接入了大量专业数据源。
打个形象的比方,第三方插件型Agent就像是在模拟器里跑游戏,跑是能跑,但经常掉帧、卡顿、闪退;而一方模型公司做的 Agent,则好比原厂真机直玩,运行流畅,帧率稳定。
(Ps:这下很多人该懂车企自研发动机跟购买零件组装的差别了吧。)
04
刘易斯·芒福德在《技术与文明》中说:技术的真正意义,不在于其孤立的机械成就,而在于它如何被整合进生活的整体,并在此过程中扩散至整个社会肌体。
Kimi Work就在将原本专属于程序员的魔法棒递给更多知识工作者,他们随手一挥,Vibe Working的图景就陈于眼前。
每次技术变革,都会伴生着某些焦虑。Vibe Working的新工作方式出现,也难免会引得某些人焦虑:AI这么能干,还要人干嘛?
但Vibe Working替代的不是「人」,而是以往压在人身上的那些重复性、流程化执行动作。
以往作为手搓派的我们,可能80%的时间在拉数据、清表格、调格式,只有20%的时间在思考。但以后我们可以把脏活累活交给Agent,把认知带宽释放出来做更有价值的事情——如投资决策里的风险嗅觉、整体判断,学术研究中的创新假设、实验设计……

▲如果让人来写这份报告,可能3天都完不成,但Kimi Work只用了不到30分钟。
需要看到的是,当前Kimi Work仍处于Beta阶段,产品仍处在迭代周期,面对那些小众细分行业、强主观决策类工作,表现还有提升空间。
但其价值会与其说是让AI完美落地执行,不如说是完整展示了Vibe Working的落地可行性:它证明了Coding Agent能力可以外溢普惠至更多行业,证明了Agent集群能落地重型知识工作,更证明了「人类提目标,AI做执行」的人机共生模式是大势所趋。
在此过程中,AI把「执行层」的门槛踏平的同时,也会将人类「决策层」价值放大。随之而来的,是职场里的「再分化」:分水岭不只是会不会用AI,更是能不能管理AI团队……
未来职场竞争力的核心,不再局限于专业技能,还有任务拆解能力、AI 调度能力、结果验收能力。
那些AI使用阶段止步于L1层次(主要跟ChatBot闲聊)的、停留在L2层次(会让AI帮着动脑想方案)的、达到了L3层次(能让AI动手做执行)的,分别隔着10倍的效能差。
说到底,Vibe Working时代已来,方向盘仍在我们手里,但引擎已经换成了V8。关键是,你能否及时上车掌好舵。

