一文看懂2026年谷歌I/O大会：Gemini 3.5 Flash、视频模型Omni与AI助手Spark齐发，谷歌把AI智能体塞进搜索、浏览器、手机和眼镜

北京时间5月20日凌晨1点，谷歌I/O 2026开发者大会在美国加州山景城开幕。

与往年相比，今年这场发布会的重点，不是某一个模型或功能，而是一次系统性转向——谷歌正把AI智能体全面“塞进”所有核心入口。

从搜索框到Chrome浏览器，从Android手机到智能眼镜，Gemini不再只是一个对话助手，而是一个可以持续运行、跨应用执行任务的AI代理：它能替用户追踪信息、生成内容、调用工具，甚至直接完成下单和操作流程。

在开场演讲中，谷歌CEO桑达尔·皮查伊（Sundar Pichai）表示，过去12个月是谷歌“飞速发展”的一年。谷歌每月处理的Token数量达到3.2千万亿个，同比增长7倍；Gemini应用月活跃用户数达9亿。

截至美股5月19日收盘，谷歌A跌2.34%。

谷歌每月Token处理量图片来源：直播视频截图

Gemini月活跃用户数图片来源：直播视频截图

Ask YouTube：AI视频搜索进入“对话+跳转片段”时代

在大会开场后的产品展示中，谷歌首先介绍了YouTube和办公场景中的AI功能。

谷歌推出“Ask YouTube”功能。该功能将在YouTube网站中加入聊天机器人式交互界面，用户可以通过自然语言引导系统找到更符合搜索意图的视频片段，并直接跳转至视频中的相关部分。谷歌表示，该功能目前正在测试，并计划于今年夏季在美国更广泛推出。

随后，谷歌展示了Docs Live。不同于传统文档编辑工具，Docs Live允许用户直接通过语音与Google Docs对话，而不必输入具体提示词。现场演示中，一名用户需要为高中职业日准备校友演讲，Gemini自动提取演讲要点，从Google Drive中获取简历信息，并从Gmail中调取活动详情，随后帮助用户创建和编辑文档。

图片来源：视频截图

从TPU 8到Gemini 3.5 Flash：谷歌全面升级AI底层与生成能力

在介绍应用层功能后，皮查伊转向AI基础设施。皮查伊表示，谷歌AI基础设施支出正在大幅增长，预计今年的支出将达到1800亿美元~1900亿美元。

谷歌资本支出图片来源：直播视频截图

谷歌还重点介绍了自研AI硬件TPU（张量处理单元）。谷歌称，最新一代TPU 8将分为两类：一类面向大规模AI训练，另一类用于模型实际服务用户时的快速响应。

谷歌最新训练用TPU 8t 图片来源：直播视频截图

随后，DeepMind首席执行官德米斯·哈萨比斯（Demis Hassabis）登台介绍“世界模型”相关进展，并发布Gemini Omni。这是一款基于谷歌在世界模型方面积累的新型视频生成模型。按照谷歌的介绍，Gemini Omni可以基于多种输入生成视频，并支持对话式编辑。用户可以通过自然语言修改角色、背景和场景，也可以上传自拍并将其转换成其他风格或内容。哈萨比斯称，未来Omni将能够根据任何输入生成任何输出，首款模型Gemini Omni Flash将于今年夏季推出。

Gemini Omni 图片来源：直播视频截图

围绕AI生成内容识别，谷歌还扩展了SynthID验证功能。用户可以询问一张图片是否由AI生成。皮查伊现场以一张他和另外几个科技巨头CEO的梗图为例，展示该AI检测能力。

皮查伊测试SynthID能力图片来源：直播视频截图

皮查伊随后发布Gemini 3.5 Flash。他表示，该模型比此前Gemini 3.1速度更快，专为更复杂的智能体任务、更长工作流和现实世界开发者使用场景构建。谷歌称，Gemini 3.5 Flash生成输出Token的速度大约是其他前沿模型的4倍，因此尤其适合AI Agent和编码工具。

Gemini 3.5 Flash生成速度为其他模型的四倍图片来源：直播视频截图

Antigravity与Gemini Spark：智能体从编程走向个人助理

模型发布之后，谷歌的软件开发平台Antigravity负责人瓦伦・莫汉（Varun Mohan）登台介绍智能体编程平台Antigravity 2.0。

该平台被谷歌定位为面向AI Agent时代的编程工具，直接对标Anthropic的Claude Code和OpenAI的Codex。瓦伦・莫汉称，谷歌通过Antigravity 2.0及其代理系统从零开始构建一个操作系统，整个过程所消耗的Token成本不到1000美元。他还表示，Antigravity 2.0“毫不掩饰地以智能体为先”。

谷歌Antigravity 图片来源：直播视频截图

紧接着，皮查伊发布Gemini Spark。谷歌将其定义为一款全天候运行的个人AI助手，基于Gemini 3.5，并运行在Google Cloud虚拟机上。用户可以通过Gemini应用访问Spark。按照谷歌的说法，即便用户合上笔记本电脑，Spark也可以继续工作，同时也能在智能手机上运行。

谷歌表示，Gemini Spark未来将与第三方工具集成，相关工具将陆续公布。该功能本周将面向受信任测试人员推出，下周面向美国Google AI Ultra订阅用户开放。为了降低成本，谷歌还推出价格更低的Ultra套餐，起始价为100美元/月。今年夏天，Spark也将在Chrome浏览器中运行。

Gemini Spark 图片来源：直播视频截图

谷歌还展示了如何通过Gemini Spark 来策划街区派对。

在演示中，Spark 汇总了所有回复，追踪了每位参与者携带的物品，自动向尚未回复的邻居发送了后续邮件，并在 Google Sheets 中创建了一个实时回复追踪器。它还生成了一份 Google Slides 派对宣传册，其中包含了充气城堡和社区规则等详细信息，这些信息都来自 Google Drive 中的文件。

Gemini Spark演示图片来源：直播视频截图

谷歌还计划发布Android Halo，用于承载其在安卓手机平台上的AI智能体。按照谷歌的设想，Android Halo将成为手机上AI智能体运行状态和任务进展的可视化入口。

Android Halo 图片来源：直播视频截图

AI Mode和AI Overview：谷歌用智能体重构搜索

随后，谷歌搜索副总裁伊丽莎白•里德（Liz Reid）登台，介绍AI Mode和AI Overview相关进展。

谷歌推出全新的搜索框。新搜索框不仅具备传统自动补全能力，还能提供AI生成的搜索建议，并支持多模态搜索，允许用户在搜索请求中上传照片和视频。

谷歌搜索新搜索框图片来源：直播视频截图

更大的变化是AI智能体进入搜索。谷歌介绍，全新推出的信息智能体可以全天候在后台运行，用于回答“极其复杂”的问题，例如追踪特定行业的市场动态。用户无需反复手动搜索，智能体可以持续监控网络，并在相关信息发生变化时更新结果。谷歌计划在今年夏季推出这类智能体，并在之后增加更多专业化代理。

信息智能体图片来源：直播视频截图

谷歌搜索产品副总裁罗比·斯坦（Robbie Stein）介绍，AI Mode还将接入Antigravity的编码能力。谷歌称，搜索未来可以在交互界面中生成可交互画面，并帮助用户创建“迷你应用”。例如，当用户想寻找周末适合全家参与的娱乐活动时，搜索可以从零开始生成一个周末活动计划表。

AI Mode演示图片来源：直播视频截图

Universal Cart：AI智能体升级购物体验，能追踪优惠、监控价格

在搜索之后，谷歌广告和商务副总裁Vidhya Srinivasan登台展示同样具有智能体元素的购物相关功能。

图片来源：直播视频截图

谷歌宣布了一系列全球合作关系。相关合作将使用开源的通用商业协议，服务也将扩展到美国以外的新地区。

图片来源：直播视频截图

谷歌还发布了Universal Cart。这是一款由AI智能体驱动的通用购物车，可在Google服务中使用，包括搜索和Gemini应用，后续还将支持YouTube和Gmail。用户在搜索、与Gemini聊天、观看YouTube或阅读Gmail时，都可以把商品加入同一个购物车。

谷歌称，Universal Cart可以追踪优惠、监控价格变动、显示价格历史、在商品重新上架时提醒用户，甚至还能识别兼容性问题。例如，用户组装一台定制电脑时，如果某个部件不兼容，购物车可以进行提示。

Universal Cart演示图片来源：直播视频截图

随后，谷歌介绍Gemini应用的重大更新。Gemini应用将采用新的Neural Expressive设计语言，带来包括交互式图像反馈、生成视频时间线在内的全新体验。Gemini Omni也将接入该应用，支持用户创建和编辑视频。

智能体也将加入Gemini应用。第一个名为“每日简报”，可以利用用户的Google服务信息，概览当天行程。高级用户还可以构建自己的智能体工作流。

每日简报图片来源：谷歌

Android XR智能眼镜：从导航到下单，无需掏手机

硬件方面，谷歌预告了由Gentle Monster、Warby Parker与三星合作推出的Android XR智能眼镜。这款智能眼镜将有两种形态：一种是可以与用户对话的语音眼镜，另一种是可以将信息投射到用户面前的显示眼镜。Gentle Monster和Warby Parker联名款属于语音眼镜，计划于今年秋季上市，并可与iOS和Android设备配对使用。

Android XR智能眼镜图片来源：直播视频截图

现场演示中，谷歌人工智能与眼镜产品负责人Nishtha Bhatia使用智能眼镜点了一杯咖啡。Gemini为她导航到一家咖啡馆，打开手机中的DoorDash外卖平台，并准备好她常点的氮气冷萃咖啡订单。用户仍需最终批准下单，但Gemini已完成打开应用、找到饮品和准备订单等步骤，而手机始终放在口袋里。

智能眼镜演示图片来源：直播视频截图

一文看懂2026年谷歌I/O大会：Gemini 3.5 Flash、视频模型Omni与AI助手Spark齐发，谷歌把AI智能体塞进搜索、浏览器、手机和眼镜

Published by

风君子

最新文章

标签

书签