OpenAI的第一款AI浏览器,好像也就那样吧

在2025年10月21日,OpenAI的新品发布会中,奥特曼正式发布了首款AI浏览器——Atlas。

奥特曼是这么介绍这个新玩意的,“我们认为,人工智能代表了一个罕见的、十年一次的机会,可以重新思考浏览器是什么,以及如何最高效、愉快地使用网络。”

奥特曼补充道,“将世界上最好的人工智能助手置于浏览体验的核心,将改变我们在线完成工作的方式。”

可以肯定的是,浏览器作为用户接入互联网的主要入口,通过推出AI浏览器,OpenAI试图重新定义用户与网络交互的方式,从被动的信息获取转向主动的任务执行。与其说Atlas是一个浏览器,不如说它是OpenAI的预告。OpenAI正在转变身份,不再拘泥于提供基座大模型的AI工具提供商。

然而在惊喜过后我发现,Atlas并你们没有和市面上那些成熟的MCP浏览器,比如Comet和Neon并没有多大差别,甚至在某些地方还有不足之处,OpenAI更像是“蹭了一下AI浏览器”的热度。

01

从技术实现的角度来看,当前AI浏览器主要采用两种技术路径。视觉识别路径通过截图分析网页元素,延迟高、成本昂贵(约200美元/月),错误率相对较高。

DOM解析路径将网页元素转化为AI可读的结构化格式,任务成功率达89.1%,成本降低90%,能够解决动态网页适配问题。Atlas更倾向于采用后者,而实际上绝大多数AI浏览器都是DOM。

但是在设计上,Atlas与现有MCP浏览器高度相似,几乎没有突破性创新。侧边栏AI助手设计方面,Atlas的“Ask ChatGPT”侧边栏与Comet的“Comet Assistant”、Opera Neon的“Neon Chat”在交互逻辑上如出一辙,都是在浏览器右侧提供一个常驻的AI对话窗口。

网页内容总结功能方面,Atlas能总结网页内容,但Comet、Opera Neon、甚至Brave的Summarizer都有相同功能,且在准确性和速度上并无明显差距。

分屏浏览模式也不是什么新鲜事。Atlas宣传的"无缝分屏体验",实际上Comet在2024年7月推出时就已经实现。当用户点击搜索结果时,Comet会自动在左侧显示网页,右侧保持AI对话窗口。更进一步的是,Comet还支持多标签页同时分析,用户可以让AI同时处理多个网页的信息并进行交叉对比,这一点Atlas并未做到。

最重要的是agent方面,Atlas的agent需要用户授权后才能执行操作,执行过程中会显示进度,用户可以随时暂停。这与Opera Neon的“Neon Do”功能完全一致,甚至Opera Neon还允许用户创建可重复使用的"Cards"来保存常用操作流程,这一点Atlas反而没有。

安全限制的相同性方面,在涉及敏感操作时,Atlas与其他MCP浏览器面临完全相同的困境。无论是输入密码、确认支付、还是授权敏感权限,所有MCP浏览器都必须切换回手动模式。

技术架构的趋同方面,Atlas基于Chromium内核,Comet、Opera Neon同样基于Chromium。在DOM解析、网页元素识别等底层技术上,各家浏览器采用的方案大同小异,并无革命性突破。

Atlas在某些方面甚至落后于竞品。Comet已经实现了完全免费(免费用户有使用频率的限制),而Atlas的核心功能agent模式仅对付费用户开放(Plus、Pro用户)。

Opera Neon提供了工具,可以帮助用户创建网站、游戏、视频等内容,Atlas并无此类创作功能。Comet的“Background Assistant”可以在后台同时处理多个任务,而Atlas的agent一次只能执行一个任务流程。在跨平台支持上,Atlas目前仅支持macOS,而Comet早已支持Windows、macOS和Linux,移动端也在开发中。

虽然基于Chromium内核,但Atlas并不支持所有Chrome插件,这可能源于macOS系统限制。此外,部分网站如纽约时报阻止Atlas总结内容,而CNN等其他媒体网站运行正常。

02

浏览器是入口,它能将AI无缝集成到用户日常工作流,减少用户在不同应用间的切换,提高AI服务的使用频率和粘性。

诚然,比起网页,浏览器作为工具,更能建立直接的用户付费关系。但Atlas最先解决的应该是安全问题,在开启agent模式后会有一句话提示,存在风险,Atlas的操作可能会导致用户丢失财产。

这个问题不仅是Atlas独有的,而是整个MCP浏览器生态都尚未解决的核心挑战。

Atlas要解决的问题还有很多。当用户尝试让Atlas帮助在电商网站下单时,它能够帮助浏览商品、添加购物车,但到了输入支付密码的环节,系统会强制切换回手动模式,并弹出安全警告。

这与之前的MCP浏览器一样看起来很智能,但在关键时刻还是要靠人工。

而且Atlas还有一些BUG需要解决,比如在访问网页的过程中,时不时就会出现Atlas阻挡了访问。但是当你要求Atlas重复该次操作的时候,网页就又能访问了。

OpenAI表示这是一个技术上的失误,后续版本对这个情况进行了修正,但是截止目前为止,依然能碰上这样的问题。

除了这些技术上的漏洞之外,Atlas还有很多问题要处理。比如让它画个爱心,结果它却画了个歪曲的形状。

OpenAI的短期目标包括扩展到Windows、iOS、Android平台、建立开发者生态支持第三方AI应用集成,以及最重要的,完善Agent模式功能提高任务执行成功率。

因为Atlas在奥特曼眼中,是AGI的主要界面。奥特曼多次在公开场合表达对浏览器领域的重视,甚至也调侃过,如果谷歌愿意出售Chrome浏览器,那他会毫不犹豫地买下来。

在奥特曼的设想中,未来的浏览器不再仅仅是网页展示工具,而将成为智能代理的载体,帮助用户完成越来越复杂的数字化任务。

随着互联网用户越来越依赖AI,入口之争愈发激烈。

对OpenAI而言,成为用户通向互联网的主要入口,可能让该公司吸引更多流量。

这里面有着一套很清晰的商业逻辑。OpenAI目前的主要收入来源是ChatGPT订阅服务和API调用费用。而ChatGPT目前拥有超过8亿用户,但其中付费用户占比不到5%,大部分用户仍在使用免费版本。这意味着OpenAI需要找到新的变现途径。

浏览器可以为OpenAI提供多种商业可能性,比如广告。

当然,一旦谈到广告和搜索,OpenAI就必须面对谷歌,要知道,Chrome目前在全球拥有约30亿用户,并已整合谷歌自家的AI大模型Gemini。

AI浏览器的竞争不仅仅是技术层面的,更是生态系统的竞争。谁能建立起更完善的开发者生态,谁能吸引更多第三方工具接入,谁就能在竞争中占据优势。

MCP协议的开放性为这种生态竞争提供了基础,但最终胜出的,将是那些能够提供最佳用户体验、最强AI能力、最完善隐私保护的产品。

03

Anthropic于2024年11月推出MCP(Model Context Protocol,模型上下文协议)作为一种以Agent 和大模型为中心的开放标准通信协议,旨在简化与外部系统的集成架构和优化上下文传输的处理逻辑。

也正是因为MCP的问世,才有了如今这些名字不同,但本质上都大差不差的AI浏览器。

在MCP出现之前,AI模型想要调用外部工具需要开发者为每个模型和工具单独编写交互逻辑,导致集成成本高,难以通用。MCP最大的意义,就是通过标准化的系统架构,提供了统一的接口和协议,使得AI模型能够访问各种数据源和工具。

正是因为统一了不同大模型调用外部工具的标准,这才能让用户可以直接跟大模型对话,浏览器就会自动使用各种工具完成用户想要的操作。

MCP生态也在快速扩张。截至2025年10月,已经有超过200个第三方开发者为MCP贡献了各类Server,涵盖数据分析、文档处理、代码生成、图像编辑等多个领域。这种开放的生态模式让AI浏览器的功能扩展变得极为便捷,就像Chrome插件商店一样,但MCP的标准化程度更高,兼容性更好。

OpenAI用的也是这个协议来开发AI浏览器。

但在这之上,OpenAI做了对一个苹果智能(Apple Intelligence)的特殊支持。

Atlas里专门有个打开苹果智能的选项,打开后就可以通过本地的处理器来总结网页,而不是通过ChatGPT的服务器,同时还支持Siri唤醒。

用户可以获得无缝的跨应用体验,比如在浏览器中处理的信息可以自动同步到其他苹果应用中,或者利用Siri的语音交互能力来控制浏览器功能。

虽然更早的M系列处理器也可以使用Atlas,但是Atlas仍然像是一个苹果M5的广告,而新版的Mac Pro使用的就是M5。

苹果M5芯片于2025年10月15日正式发布,这款基于第三代3纳米制程打造的处理器在AI运算、图形性能及能效方面均实现重大提升。

M5芯片采用新一代10核GPU架构,每核均配备Neural Accelerator神经加速器,使得基于GPU的AI工作负载处理速度大幅提升,峰值GPU计算性能达M4芯片的四倍有余。该GPU同时提供更强的图形处理能力及第三代光线追踪技术,综合图形性能较M4提升达45%。

在Atlas发布的当日,作为竞争对手的谷歌股价大跌。盘中跌幅一度扩大至近5%,最低触及245美元,最终收跌2.21%。

不过实际上这和Atlas并没有太大的关联,相反这是由于谷歌自身的问题。

此前,谷歌AI Studio负责人Logan Kilpatrick在X(原名推特)上宣布于10月20日发推预告,AI Studio将迎来重大更新。

而就在此前,谷歌的下一代基座大模型Gemini 3在KingBench上刷榜。所以大家就觉得,谷歌会像Gemini 2.5预览版那样的策略一样,将Gemini 3性能最低的版本以预览版的形式发布在AI Studio上。

但结果就是,AI Studio只是对开发流程进行了优化更新,让市场上所有期待全都落了空。

截止至发稿,谷歌并没有对Atlas进行回应。但是谷歌可能也无需太担心,因为在Atlas面前出现的AI浏览器有很多,但是依然阻碍不了Chrome占据全球约3分之2的市场。

更关键的是,Chrome背后是谷歌庞大的服务生态。Gmail、Google Drive、Google Docs、YouTube等服务与Chrome的无缝集成。当用户在Chrome中登录谷歌账号后,所有服务数据都能实现跨设备同步,这种便利性是Atlas目前无法提供的。

从开发者生态来看,Chrome Web Store拥有超过10万个扩展程序,涵盖了从广告拦截、密码管理到开发工具、生产力增强等各个领域。这些扩展程序经过多年的迭代优化,已经成为许多用户日常工作不可或缺的一部分。

Atlas虽然基于Chromium内核,但并不完全兼容Chrome插件,这意味着用户如果切换到Atlas,将失去大量已经习惯使用的工具。对于那些依赖特定插件完成工作的用户来说,这是一个难以接受的代价。

性能和稳定性也是Chrome的重要优势。虽然Chrome因为占用内存较多而被用户调侃为“内存杀手”,但是它的稳定性和兼容性是市面上最好的。

Atlas作为一款刚刚发布的产品,在技术成熟度上与Chrome还有相当大的差距,前面提到的访问阻挡问题、操作失误等BUG,都说明Atlas还需要大量时间来打磨产品。

Reddit网友也普遍认为,Atlas无法撼动Chrome的地位。

不过话又说回来了,Atlas也会给谷歌一个新的思路,比如也给Gemini做一个AI浏览器。

从技术发展趋势来看,AI浏览器代表了下一代互联网交互方式的发展方向。传统的搜索引擎模式正在被AI问答模式逐步取代,用户不再满足于获得一堆搜索结果,而是希望直接得到答案和解决方案。在这种趋势下,能够理解用户意图、主动完成任务的AI浏览器将具有明显的竞争优势。

对于普通用户而言,AI浏览器也是一种全新的上网体验,只要你敢于承担AI浏览器带来的风险,比如浏览器误操作,导致资产和信息泄露等等。

从更长远的视角来看,AI浏览器可能只是一个过渡形态。奥特曼设想的AGI界面,最终可能不是传统意义上的浏览器,而是一个能够理解用户意图、主动完成任务、无缝连接各种服务的智能代理系统。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平