体验 OpenAI 首款浏览器:重新定义上网,只是 ChatGPT OS 的第一步

GPT味

浏览器

今天凌晨,OpenAI 正式发布了首个浏览器 ChatGPT Atlas。

过去十来年,Chrome 基本上是大家上网的标配入口。但如果现在有一款 AI 浏览器直接内置了 ChatGPT,还自带记忆和 Agent 能力,你是否会愿意尝试一下?

这就是今天发布的 Atlas 要做的事。

OpenAI 表示,Atlas 是围绕 ChatGPT 构建的浏览器,而不是简单地把 ChatGPT 塞进去,其核心理念是全方位整合:

随时唤出侧边栏:点击「Ask ChatGPT」按钮,就能在任意页面右侧打开 ChatGPT 侧边栏。始终带着上下文理解的 ChatGPT 能读取你所在页面的详细内容,能帮你总结内容、解释信息,或者直接在当前窗口里处理任务。

AI 协助功能:在任何打开的文本输入框中输入内容时,ChatGPT 能提供实时修改建议和智能补全,帮你更高效地码字

Agent(代理)模式:能让 ChatGPT 在浏览器中自主完成多步骤任务

从今天开始,macOS 用户就能用上了,ChatGPT 免费、Plus、Pro 和 Go 版用户都可以下载体验,而 Windows、iOS、Android 版本即将推出。不过,根据我们的发现,搭载 Intel 处理器的 Mac 无法安装 ChatGPT Atlas。

附下载地址:chatgpt.com/atlas

不过,Agent 模式目前只对 Plus、Pro 和 Business 用户开放,而且仍处于早期阶段,在处理复杂任务时可能会出错。另外,如果设置 Atlas 为首选浏览器,你也可以获得七天的会员体验,享有更高的使用额度。

Atlas 浏览器的记忆功能比较有意思,它能让 ChatGPT 记住你访问过网站的上下文,并在你需要时调用这些信息。

比如你可以问它:「把我上周看过的所有职位发布找出来,并总结一下行业趋势,好让我准备面试。」

这或许就是「AI 个人助理」愿景的完整体现:它记得你是谁、你做过什么,还能代你完成任务。

当然,在隐私问题上,你可以完全控制 ChatGPT 在你浏览时能看到和记住的内容。你可以选择清除特定页面的记录,清空整个浏览历史,或者打开「隐身窗口」,在不登录 ChatGPT 的情况下临时浏览。

OpenAI 宣称,默认情况下不会将你浏览的网页内容用于模型训练。

此外,Atlas 同样支持家长控制功能。如果家长为 ChatGPT 设置了家长控制,这些设置也会自动延续到 Atlas 中。OpenAI 还新增了专门为 Atlas 设计的家长控制选项,比如家长可以关闭浏览器记忆或关闭 Agent 模式。

Atlas=Google+ChatGPT?

打开 Atlas 的主页,还是一副还是与 ChatGPT 长得差不多的面孔。

输入问题后, Atlas 会弹出一个候选窗口,提供 Google 和 Chat 两个选项以及更一些具体的链接。

顾名思义,前者 Google 选项直接跳转到常规搜索引擎页面,后者则类似常见的 AI 聊天助手,调用 ChatGPT 模型直接给出答案,而且你在 Atlas 上的每个提问都会保留在你的 ChatGPT 账号历史聊天记录里。

除了对话框里的答案,你还能切换标签页,翻翻搜索链接、图片、视频和新闻,同时大多都保留了跳转到 Google 搜索引擎的选项。

提问时,不同模型的表现还是有差距的。

举个例子,我问「现在的宠物能坐高铁了吗」,明明点开搜索源就能看到官网写着允许的链接,但 GPT-5 Instant 愣是没整合出正确答案。

反观切到 GPT-5 Thinking,它倒是给了个正确且严谨的回复。

Atlas 的交互设计算是个加分项。

传统 AI 插件主要以侧边栏、悬浮窗的形式呈现,涵盖 AI 聊天、翻译、网页总结等。

同理,Atlas 搜索结果页面默认与 ChatGPT 分屏显示,点击右上角的 Ask ChatGPT 就如同引入了一个 AI 插件,左侧显示原始网页,右边可与 ChatGPT 进行多轮对话,而不是传统的单次搜索跳转。

比如划个词,网页右侧就能直接查找或解释,或者让它给文章来个摘要。

在今天凌晨的直播环节,OpenAI 员工就搜索电影并查看了 Roger Ebert 等网站的影评,然后让 ChatGPT 用五个词以内总结影评内容,这种基本操作还是难度不大。

甚至它还能优化网页文字、优化标题等,整体操作还是比较流畅顺滑。

而同样是在今天的演示中,OpenAI 内部员工在撰写给团队设计师的邮件时,直接选中一段文字,点击 ChatGPT 按钮并输入「优化语言」指令。

ChatGPT 在原地优化了文字表达,用户可以继续迭代修改,最后点击「更新」按钮将新文字替换原内容。这个功能彻底简化了以往需要在文档和 ChatGPT 之间反复复制粘贴的繁琐流程。

实测下来,总结视频内容也没问题。

另外,Atlas 还支持截图,点右侧的 + 号,选「随附屏幕截图」就能上传,我找了张马斯克的照片,照着这么操作一遍,它也能准确认出是马斯克。

搭配侧边栏的 Agent 模式,玩法也能很有趣。网友 @mteamisloading 让 Agent 在绘画网站里画了朵花,全程只花了 4 分钟。

值得一提的是,Atlas 同样支持通过 @ 调用网页标签。不过 Dia 可以同时调用好几个网页标签,Atlas 只能一次调用一个已经打开的网页,有点鸡肋,估计后续会更新。

Agent 模式则是 Atlas 浏览器的重头戏。

在今天的演示里,OpenAI 员工打算给 8 人聚餐做菜,打开了个菜谱网页。他问 ChatGPT 需要准备哪些食材,ChatGPT 自动分析了网页内容并算好了份量,还根据用户之前提到的偏好把购物清单按超市货架分类。

当用户确认后,Agent 自动打开了 Instacart 购物网站,搜索并把所需商品加进购物车,整个过程只用了两分钟。虽然最后没自动下单,但准备好的购物车已经省了不少时间,用户可以自己审核后决定要不要买。

再比如,在工作场景中,你可以让 ChatGPT 打开并阅读过往团队文档, 进行新的竞品调研,并整理成一份团队简报。

就实际体验而言,比如我提个需求「帮我在苹果官网买部 iPhone 17 Pro Max」,它在 Agent 模式下执行任务时会显示「接管控制」按钮和红色的「停止」按钮,可随时接管。

运行速度和之前 ChatGPT 里的 Agent 模式没太大区别,我们自己下单可能几分钟搞定,但交给 Agent 操作后却要 19 分钟,这个速度显然是不太令人满意的。

简言之,Altas 的 Agent 模式其实更像是把 ChatGPT 里的 Agent 功能单独拆分出来,与此同时,你在 Atlas 的历史聊天记录也会保留在 ChatGPT 里。

至于整体体验 Altas 下来,我的评价是,有惊喜,但不多。

Atlas 给我的感觉就是 Google 搜索和 ChatGPT 对话的合体,只不过,Atlas 也保留了富有 ChatGPT 特色的 Agent 模式,用 ChatGPT 能力把浏览器这个场景重新整合了一遍。搜索、理解、执行任务都在一个闭环里完成了。

值得一提的是,负责 Atlas 项目的工程师 Ben Goodger 本身就与 Chrome 有着紧密的联系。

他从 2005 年就进入 Google 参与 Chrome 的研发工作,是整个团队中对 Chrome 贡献最突出的核心成员之一,并在 2024 年加盟 OpenAI,成为 ChatGPT Atlas 浏览器的技术研发总负责人。

而在过去很长一段时间,各家都陆续推出了自己的 AI 浏览器。

在这场浏览器大战里,Perplexity Comet 更适合极客或高级用户,基于 Chromium 引擎的 Atlas 体验门槛更低,也更对标 Dia。

有意思的是,Dia 此前刚被企业软件巨头 Atlassian 以 6.1 亿美元收购……所以现在是 Atlas 对战 Atlassian,名字还挺巧。

重新回看 OpenAI 的产品思路,以往 OpenAI 的策略是选择搞一个超级应用,把各种功能都装进去,但无论是前阵子 Sora APP 的独立推出,还是这次 Atlas 应用的推出,OpenAI 正在不断从 ChatGPT 拆分功能出来。

这也符合奥特曼之前在采访中的产品思路,不同产品在用户心中有不同的「心理定位」,强行混合会破坏体验。

说白了,OpenAI 现在的策略很明确:让 ChatGPT 扮演超级操作系统的角色,而让不同产品各司其职,针对不同场景优化体验。从「超级 App」向「产品矩阵」,OpenAI 这条转型之路是铁了心要走到底了。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平