学不完,真的学不完。

过去几天,各路 AI 模型、AI 产品轮番炸场,几乎没有消停过。其中 Moltbot(原 Clawdbot)更是登上国际头版头条,刷屏硅谷。
GitHub 上几乎垂直向上的 star 曲线,Mac mini 被卖爆,Discord 服务器被挤爆……这一切发生得太快了。

更魔幻的是,这背后根本不是什么初创公司,也不是团队作战,就是 Moltbot 创始人 Peter Steinberger 一个人在家里折腾的成果。
Peter 最近也接受了外媒 TBPN 的采访。接受采访的时候,欧洲那边已经是晚上 11 点了。但他看起来依旧挺精神,哪怕过去 72 小时,他可能都没怎么好好睡过。

附视频地址🔗:https://x.com/tbpn/status/2016299976360656970?s=20
从精疲力尽到「又上头了」
Peter 的剧本开头,像极了硅谷爽文。
四年前,他卖掉了经营 13 年的软件公司,实现了财富自由(赚了一亿欧元)。按理说,接下来的人生应该是游艇、香槟和永无止境的假期。他也确实这么做了,整整放空了三年,甚至自嘲像《奥斯汀·鲍尔斯》里被抽走了「动力」的倒霉蛋。
可能 13 年连轴转之后休息个一年差不多,但我直接休了三年,好像也说得过去吧。
直到去年 4 月的某个时候,他重新调整状态,开始退休复出,专心研究 AI。巧的是,他刚好错过了 AI 特别糟糕的那三年,回归的时候正好赶上 Copilot 这些代码生成工具开始内测。
第一次体验之后,他就开始失眠了,凌晨四点给朋友发消息,没想到屏幕那边的朋友同样上头,秒回信息。
Peter 甚至还办了个线下聚会,起名叫「Claude Code Anonymous」,现在已经改名「Agents Anonymous」(智能体匿名会)了,得与时俱进嘛。
一个小时搞定的 WhatsApp 接口,意外引发的「啊哈时刻」
学新技术最好的方式,就是玩中学。
Peter 做项目的逻辑很简单:我要玩得开心。所以他经常做一些小东西,试不同的编程语言、不同的方式。
甚至有个项目做了两个月,最后不得不停下来,因为这东西变得太好用了。他和朋友在外面玩,结果还能拿着手机继续用 Claude Code 搞项目。
这对我的心理健康太不利了,我这不是在做一个让我更容易上瘾的工具吗?
去年 11 月的某一天,他突发奇想:能不能通过 WhatsApp 跟电脑互动?如果智能体没在运行,而他自己在厨房晃悠,还想检查下它们的状态,或者发点提示词给它们。

于是他随手搞了个 WhatsApp 接口:接收消息、调用 Claude Code,然后返回结果。一小时搞定,而且能用。
平时发 prompt 的时候,除了文字,还会加张图片,因为图片经常能提供大量上下文信息,而且你就不用打那么多字。所以我觉得这是个能让 prompt 更快的「黑科技」——直接截图。智能体其实很擅长从图片中猜出你想要什么,于是我又顺手搞了图像支持。
后来他去马拉喀什玩了个周末生日旅行,发现自己用这功能的频率比预想的还高,不过不是用来写代码的,更多是找餐厅之类的事。
有一次他甚至直接发了段语音消息给它。但其实他根本没实现语音功能,结果十秒钟后,它像什么都没发生一样回复他了。Peter 当时简直震惊了:「你到底是怎么做到的?!」
它回复说:「我发现你发了个没后缀的文件,查了文件头发现是音频。我打算用你 Mac 里的工具转码,结果没装好报错了。但我翻到了你的环境变量里有 OpenAI 的 API Key,于是我直接 curl 给了 OpenAI 拿到了转录。接着我就回复你了。」
那一刻,真切让 Peter 感受到了「啊哈」时刻。

从那以后 Peter 就彻底上头了,开始搞各种奇奇怪怪的东西。比如他还搞了一个闹钟系统,让智能体「迁移」到他在伦敦的电脑上,然后远程登录到他家 MacBook,把音量调高来叫醒他。
我可能做了全世界最贵的闹钟。
不过它也是出过差错,因为这个闹钟是用心跳信号来判断状态的。对 Peter 来说,这个项目既是技术探索,也是某种艺术创作。
一方面它把已有的技术拼接在一起;但另一方面,它又彻底改变了你与这些技术交互的方式,因为所有技术细节都「隐身」了。
你不用再去考虑什么对话压缩、模型选哪个,虽然也许偶尔还是会想一下,毕竟 token 还是挺贵的。但大多数时候你不会去管这些了,你只是在和一个「朋友」或者「幽灵」对话而已。
技术圈没 get 到,非技术朋友却说「我想用」
Peter 看似「一夜成名」,其实在爆红前也做了很多的准备工作。

上下滑动查看更多内容
比如他发现很多现在做的 MCP(Model Context Protocol,模型上下文协议)工具都挺烂的,扩展性也差。
但他发现,智能体懂 Unix,可以在电脑上调用几千个小程序,只需要知道程序名,调用 help 菜单,加载需要的内容。因此,聪明的做法是按照模型的思维方式去开发,而不是按人类的习惯。
你要按照它们的思维方式去构建系统,这样一切运转得会更好。从某种意义上来说,这是一种全新的软件形态。
他还做过一个关于 Google Maps 地点管理的工具,接入了音响、家庭摄像头、智能家居系统……这些东西都是通过小型 CLI 工具和技能组合起来的,智能体的能力越来越强,也越来越好玩。
其实在那个 WhatsApp 集成功能时,他就已经完全沉迷进去了。他觉得这东西太神奇了,于是就在 Twitter 上分享。平时他发项目,都会有很多反馈。但那次,反应却很平淡,好像大家没 get 到。
他拿去给朋友看,甚至是那些不搞技术的朋友,他们却很感兴趣,直接就说想用。所以他感觉自己确实搞出了点什么,只是技术圈的人一开始没意识到而已。
于是他就继续试着打磨它,因为自己用得很爽。归根结底,他是为自己而做的这个工具。「这是开源的,我的动机就是好玩,能激发别人去尝试,而不是为了赚钱。我已经赚够了,不差钱。」
过去 72 小时:从 Discord 到改名风波
然后就是那个「爆炸」时刻。
Twitter 上的热度直接把 Discord 服务器挤「炸」了,用户数量以一种他从未见过的速度在增长。Instagram 他都快处理不过来了。有段时间他只能把 Discord 上的问题复制粘贴到 Codex 里,让它生成回答,然后再复制出来继续回复下一个问题。
到后来,实在没法应付了,他干脆把整个频道复制下来,让模型回答最常见的 20 个问题。他再简单浏览一遍,给它几个额外指令,然后就直接发出来了。
人们可能没意识到,其实这背后根本不是一个团队,也不是一家公司,就是我一个人,在家里玩得开心而已。
伴随着 Clawdbot 的爆火,他收到了 Anthropic 的一封邮件,要他把项目名字改掉。不过,Anthropic 没直接找律师,而是内部有人来沟通。
但由于时间线实在有点紧张,且在项目已经这么火的时候去改名,这无异于一场灾难,也因此在社交媒体引发了轩然大波。

模型这么多,最爱还是它
当被问到怎么看 Mac mini 时,Peter 笑着说:「我的智能体有点『公主病』,它不喜欢用 Mac mini。它想要更多性能。」最后他给智能体配了一台顶配的机器:512G 存储、各种配置拉满,因为他还想折腾本地模型。
现在我可以在这台机器上跑 MiniMax 2.1,我觉得这是目前最好的开源模型之一。不过说实话,一台机器跑不太够,也不够有趣。你可能至少需要两台甚至三台机器。
采访主持人提到,Moltbot 爆火浪潮中最有意思的一点,不只是 AI 智能体本身,而是大家第一次看到大型科技平台之间「被迫打通」。
Peter 觉得现有的运营模式会被迫改变。比如你想要访问 Gmail API,繁琐手续多到你想不到。甚至有些初创公司为了获得权限,干脆直接收购另一个已经有许可证的公司。
但如果在本地运行这些工具,就可以绕开这些障碍。
Peter 之前做了很多「破解式操作」,比如直接让 AI 去解析某个网站,然后生成一个「镜像版本」出来。
「AI 有时会拒绝,说这个操作不被允许,我就会『编个故事』给它听。讲几句『故事』之后,它大概 40 分钟内就能给你一个完美的 API。这在某种意义上,这恰恰是大公司不愿看到的。」
甚至像他做的 WhatsApp 集成,本质上也是钻了平台的空子,模拟的是桌面端协议。当时他尝试过官方途径,但官方方案只对企业开放,而企业发了 100 条消息之后就会被封号。
我真的就被封了……后来我气得直接把那部分代码删了,一堆感叹号!因为现在根本没有一个合理的模式来支持这样的行为,而这是必须要改变的。

不过,聊到模型的时候,Peter 说从「个性」层面出发,他最喜欢的依旧是 Claude Opus。
「我不知道他们的模型训练数据用了多少 Reddit 这类平台的内容,但它在 Discord 里的表现真的特别好。」他还专门给了它一个「可回复 / 不回复」的选项,所以它不会刷屏,而是「倾听」对话内容,然后时不时来一条「神回复」。
「有时候真的会让我笑出声。你知道,这其实挺难得的,因为大多数 AI 的笑话都很尴尬。但我只有在用 Opus 时才真正体验到『它懂幽默』这种感觉。」
在编码方面,他更喜欢用 Codex,因为它能很好地处理大型代码库。OpenAI 的模型呢?「非常稳定可靠,甚至可以说比很多人类员工都更靠谱。」
Peter 还认为,随着这种高度个性化的系统出现,大批垂直类 App 将迎来灭顶之灾。

「比如说,我还需要 MyFitnessPal(一款健康 App)干嘛?我拍一张我食物的照片,我的智能体已经知道我在麦当劳、正在做出糟糕的选择了。它结合上下文信息,能完美判断我吃的是什么,大概摄入了多少热量,甚至能自动调整我的健身计划。」
在他看来,智能体会直接根据他的生活状态调整计划。「我预期会有一大批 App 被淘汰。因为我们与系统的交互方式已经变了,它们会自然地变成『一个 API』。」
「能力越大,责任越大」
现在 Peter 收到了很多来自安全研究员的邮件。
因为他当初做这个工具只是为了自己玩,自己用,在 WhatsApp 或 Telegram 上一对一聊天用的。
可现在有人把它用到了不该用的地方。他收到一堆又一堆的报告,有些确实发现了真问题,有些虽然技术上说得通,但压根儿不是他当初设想的使用方式。
「整个系统就像崩了一样。我是一个人做这个项目的,出于兴趣。而现在却要我去处理上百条关于安全问题的报告,还是针对那些我根本没考虑要支持的使用场景的。我也不知道怎么办,只能先走一步看一步吧。」

还好,他现在开始组建一个小团队了。
「这个系统确实有一定风险,我在官网上已经非常明确地说明了,甚至在你开始使用前,系统会提示你务必阅读一份文档。」
他相信这个项目会加速相关研究,因为它已经引发了真实的需求。像 Prompt Injection(提示词注入)这种核心问题,现在整个行业都还没解决,可能没有哪家公司敢直接碰这个项目。
但他的早期用户都理解这一点,其中还有很多 AI 研究者。他们知道现在还不可能做到完美。
当被问到会不会成立公司时,Peter 说:「我觉得,与其成立公司,我更倾向于做一个基金会,我喜欢非营利的形式。」

关于开源许可证,他的想法是:让开源版本本身好到,别人也没太多空间再去改造它赚钱。他用了像 MIT 这类比较宽松的许可证。
是的,这意味着会有人拿去卖,但归根结底……这其实也没那么重要。代码本身现在已经不那么值钱了。你完全可以删了它,然后一个月再重写一遍。现在更重要的是创意、本身的关注度,以及它的品牌。这些才是真正有价值的。所以,随他们去吧。
访谈最后,Peter 还在线发 offer。他表示,真的非常希望能找到一些维护者,如果有人热爱开源、有经验、喜欢处理安全报告,或者擅长拆解软件、还能帮助修复问题,那请发邮件给他吧。
我一个人已经快到极限了。我希望这个项目能在我之后继续活下去。我觉得它太酷了,不应该被搁置。它需要志同道合的人来延续。

