谷歌2026 I/O大会完整回顾:模型依然重要,但智能体正在接管一切

作者|林易

编辑|重点君

5月20日凌晨,谷歌举办了2026年I/O发布会。CEO Sundar Pichai在会上透露,目前谷歌各项服务每月处理的Token数量已达3.2千万亿个,相比上一年增长了七倍。

这一次,谷歌从芯片、模型到应用的全栈技术和产品完整更新:

芯片层:推出针对预训练优化的TPU 8t 与针对推理优化的TPU 8i,通过升级全球算力集群,解决行业高昂的算力成本痛点。

模型层:发布具备物理一致性的Gemini Omni 世界模型,让AI跨越纯文本与像素生成的限制,真正理解三维空间智能。同时,推出主打高性价比、低延迟的 Gemini 3.5 Flash,能力在编码能力、Agent能力、工具调用能力都比上一代的3.1 Pro要强不少。至于Gemini 3.5 Pro,则要下个月才能见到了。

应用层:发布最新Antigravity 2.0平台,该平台的多智能体协同能在12小时内自主编写出完整的操作系统。此外,推出可在云端虚拟机全天候自主运行的个人智能体Gemini Spark,加速软件工程自动化的落地。

行业标准:联合亚马逊、微软、Meta 等巨头推出UCP与AP2智能体电商协议,抢先确立智能体时代的商业交互规范。

终端硬件:发布首款基于Android XR平台的内置Gemini音频智能眼镜。

一句话总结,整场发布会看下来:谷歌凭借全栈AI技术优势,在搜索、办公、购物和硬件全线筑起了“Agent优先”的超级生态壁垒,AI从工具变成了全天候在线、能自主拆解并执行复杂任务的生产力,智能体正在接管一切。

我们整理了本次发布会的关键信息,以下是重点内容:

1.算力底座:第八代TPU并大幅追加资本支出

谷歌发布了针对预训练优化的TPU 8t和专为推理设计的TPU 8i。同时,Sundar Pichai披露,谷歌今年的年度资本支出预计将达到约1800亿至1900亿美元,是2022年的近六倍。

2.模型更新:Gemini Omni世界模型与Gemini 3.5 Flash

Gemini Omni具备跨越式的物理概念理解能力,突破了此前AI系统在模拟动能和重力等物理属性上的局限,不仅能根据文本提示生成具有准确物理特性的视频,还支持用户通过对话直接对视频元素进行二次编辑。

Gemini 3.5 Flash主打极高的响应速度与成本效益。据官方数据,3.5 Flash在每秒输出Token数上是其他前沿模型的四倍。

3.软件工程:Antigravity 2.0全自动代码生成平台

Antigravity 2.0平台极大提高了软件开发效率。在一个测试项目中,由93个子智能体组成的团队并行工作12小时,处理了26亿个Token,从零开始编写并测试了一个包含调度程序、内存管理和文件系统的完整操作系统。在Gemini 3.5 Flash的成本优势支撑下,这一复杂软件工程的端到端API调用成本被压缩到了1000美元以内。

4.智能体:全天候运行的Gemini Spark

Gemini Spark运行在Google Cloud的专用虚拟机上,保持24/7全天候在线,即使终端设备处于关闭状态,Gemini Spark依然可以在后台自主跨越Docs、Gmail、Calendar等多款应用程序,替用户执行复杂任务。

5.搜索架构:信息智能体与动态交互UI

谷歌搜索全面升级至Gemini 3.5,用户现在可以设定多个智能体在后台持续监控网络信息,在金融市场剧烈波动、特定商品上架等关键节点,推送高度相关的定制化方案。

此外,搜索结果页还引入了由Antigravity平台支持的动态交互式UI,能够根据用户的具体提问,实时生成可直接操作的数据可视化图表。

6.商业基础设施:智能体电商标准化协议

UCP(通用商业协议)为各家AI智能体提供了一种通用的数据交互方式,涵盖产品搜索、结账到物流查询的全流程。目前Amazon、Meta、Microsoft、Salesforce和Stripe等企业已加入支持该标准。

AP2(智能体支付协议)用于设定AI购物的资金边界并确保权责明晰。它在用户、商家和支付机构之间建立了基于隐私保护技术的验证链接,确保退货和账单记录的一致性。

基于上述协议,通用智能购物车(Universal Cart)实现了跨商家和跨服务功能,能够在后台自动比价、监控库存,并提供购买建议。

7.智能硬件:基于Android XR平台的音频智能眼镜

谷歌联合三星、Gentle Monster和Warby Parker,推出了首款基于Android XR平台、内置Gemini的音频智能眼镜。该设备专注于免提交互体验,用户无需掏出手机,可完全通过语音指令让Gemini执行任务,例如结合实时地图数据进行路线导航,调用本地生活应用,以及完成商品的订购与支付验证。

8.行业信任:SynthID数字水印技术的跨平台普及

面对社会对生成式AI内容失控的担忧,谷歌宣布将SynthID数字水印技术全面扩展至搜索和Chrome浏览器中,目前该技术已累计为全球超过1000亿张图片和视频添加了底层来源标记。OpenAI、NVIDIA、Kakao和ElevenLabs等行业头部机构已正式宣布采用这一标准,共同确立AI内容来源的识别规范。

以下是2026谷歌I/O大会演讲实录:

1.效率与协作工具革新:Ask Maps、Ask YouTube 与 Docs Live

SUNDAR PICHAI:现场观众大家好,以及全球各地正在观看直播的朋友们,你们好。很高兴能回到今年的I/O大会。过去的一年意义非凡,持续不断的产品发布以及技术的飞速进步,让我们处于一个超速发展的时期。我确实深有感触,这是极其充实的一年。这里带大家回顾一下我最近都在忙些什么。

刚才视频中我正在插上TPU的画面其实挺准确的,但我希望今年不仅忙于这些。在它进入太空之前,还有很多工作要做,我们正在为此努力。说认真的,这确实是一个非凡的时刻。自公司转型为AI优先以来,已经过去了10年。我们深知AI在推进公司使命、大规模改善人们生活方面,将产生多么深远的影响。这就是为什么我们正在采取一种差异化的全栈AI创新方法:从定制芯片和安全基础,到世界级的科学研究和模型,再到触达数十亿用户的产品和平台。这种方法使我们能够更快速地迭代和创新,并正在全方位赋能我们这家公司。

真正令人惊叹的是人们使用我们AI的方式。学生们通过Gemini应用备考期末考试;音乐家和艺术家将Lyria和Veo等生成式AI模块融入他们的创作流程;开发者们编写代码,将他们的创意变为现实。我自己在生活中也以各种方式使用Gemini。最近,我一直在用Gemini来读懂我父母的就诊报告,相信你们中的许多人也做过类似的事情。这些关于人们如何使用AI的故事,是衡量AI价值和进展的最佳标准。

SUNDAR PICHAI:为了更直观地展示人们使用AI的规模,还有一个很好的指标:Token。Token是模型处理数据的基本单位,每一个Token都代表着一个正在被解决的问题。两年前,我们各项服务每月处理9.7万亿个Token,这已经是个庞大的数字。在去年的I/O大会上,这个数字增长到了约480万亿。而到今天,这个数字已经翻了七倍,达到每月3.2千万亿个Token。

在I/O主旨演讲中提到“千万亿”这个量级确实罕见,但我们确实做到了。有些人可能会觉得这只是在“刷榜”,确实有一定道理,但我认为它深刻反映了我们的产品以及开发者在这些模型基础上构建生态的火热现状。目前每月有850万用户使用我们的模型构建新的应用和体验。我们的模型API现在每分钟处理约190亿个Token。在过去的12个月里,有超过375家客户各自处理了超过1万亿个Token,这代表了整个行业对AI的强劲需求。

当然,我们各款产品的需求也极其旺盛。我们现在拥有13款用户数超过10亿的产品,其中有5款产品的用户数更是超过了30亿。我们的Gemini模型正在吸引更多人使用我们的产品,并提升他们的使用频率。

这一切都始于Search,它比世界上任何其他产品都更早让大众享受到生成式AI的益处。AI Overviews现在的月活跃用户已超过25亿。这是一项突破性的功能,也是我们对搜索进行的史上最大升级。人们非常喜欢它,在短短一年内,其月活跃用户数就突破了10亿。当人们在Search中使用AI驱动的功能时,他们使用搜索的频率明显变高了。我非常喜欢现在的Search,它不再仅仅局限于单个查询,而更像是一场持续的对话,不仅能为您提供更深刻的见解,还能将您与广阔的网络世界无缝连接。

另一个我们在快速创新的领域是Gemini应用。在去年的I/O大会上,Gemini应用的月活跃用户数为4亿。今天,这个数字已经突破了9亿,在一年内翻了一倍多。与此同时,每日请求量增长了七倍以上。这是令人惊叹的增长。我们一直在添加许多独特的功能,例如Personal Intelligence,它能让AI的响应更加定制化、更有帮助。目前,已经有超过500亿张图像是由我们的Nano Banana模型生成的。它在过去的一年里大放异彩,我知道大家玩得都很开心。除了Gemini应用之外,我们还在许多产品内部直接引入了Gemini,让对话变得更加自然。

最近,Maps迎来了十年来最大的升级,推出了名为Ask Maps的新功能。人们正在用它来询问更复杂、更长的问题。这里有一个家长的真实查询:“我的孩子刚掉进了鸭子池塘,而婚礼30分钟后就要开始了。我可以在附近步行能到的地方买到一件新裙子吗?”我很想知道她最后顺利买到没有。

我们还将把这种对话式AI引入另外两款产品。首先是Ask YouTube。人们每天都会来YouTube提出很多问题,这里有海量的优秀视频,但有时很难知道该从哪里看起。Ask YouTube完全重塑了这种体验。假设你想教3岁的孩子骑脚踏自行车,而他之前只学会了骑平衡车。你只需询问YouTube,就能看到完全不同的搜索结果:信息变得易于理解且方便浏览,你不仅能获得概览和实用技巧,还能看到最符合你需求的视频。如果你想尝试某种特定的教学方法,还可以点击进行深入了解。最棒的是,它能直接跳转到视频中最相关的片段,这让我想起了当年教孩子们骑车的场景。它能记住上下文,因此你可以进行追问,比如:“我应该买带手刹的还是脚刹的?”这使它成为一种连续的对话体验。它甚至能以表格形式呈现信息,方便你进行对比。我们现在正开始测试Ask YouTube,它将于今年夏天在美国正式推出。

到目前为止,我们展示的都是对话式文本查询。但很多时候,我希望能以说话的速度来完成任务。得益于我们在音频技术方面的飞跃,这在今天已经成为现实。一项名为Docs Live的新功能将这种体验提升到了全新高度。以前使用Gemini创建文档时,你必须输入非常精确的提示词。而有了Docs Live,你只需口头倾诉脑海中的任何想法,剩下的交给Gemini即可。让我们通过产品团队的演示来看看它的实际效果。需要说明的是,这些都是实时演示,没有经过任何加速处理。

好的,让我们来试一下。我刚才突然想起,明天我要回母校的高中职业日做一个校友演讲,需要准备一些演讲要点,向学生们解释我的职业——一名软件工程师具体是做什么的。虽然我自己就是工程师,但我不太确定该从哪里开始。你能从我的Drive里提取我的简历吗?直接看简历可能有点无聊,也许你能想出一些有趣的类比,让这场演讲对学生们来说更引人入胜?另外,学校之前给过我一封主题大概是“职业日后勤”的电子邮件。你可以从那封邮件里获取具体细节,把它们放在文档的最顶端,这样我就能清楚知道该去哪里以及什么时候到。让我们更新这些需求,并直接生成一份草稿。

【生成结果】这很酷,但内容有点太密集了。也许可以把这些类比用表格的形式展现,这样更方便我扫视。然后再帮我加一条笔记,讲讲我哥哥是如何激励我成为一名软件工程师的故事。把它放在文档顶部附近并加粗,这样我就不会漏掉。好的,看起来棒极了。

在未来,你将能够创建新的Docs并直接进行编辑,全程只需使用语音。Docs Live将于今年夏天向Pro和Ultra订阅用户推出,同样强大的语音功能也将应用于Gmail和Google Keep。看到各项产品展现出的创新速度令人赞叹。

2.AI基础设施升级:第八代定制芯片TPU 8t与8i

SUNDAR PICHAI:为了向广大用户提供大规模支持,同时服务全球企业和开发者,我们需要在基础设施领域进行巨大投入,且一直在为现在和未来投资。2022年我们的年度资本支出为310亿美元。今年预计这一数字将增长约六倍,达到约1800亿至1900亿美元。这项投资的关键部分是我们的定制芯片

十年前,我们在这个I/O舞台上发布了第一款TPU。从那时起,我们改变了行业构建AI的方式。最近在Cloud Next大会上,我们发布了第八代TPU。这是我们首次采用双芯片策略,针对训练和推理设计了专门的架构:TPU 8t和8i。虽然它们看起来相似,但实际上大不相同。

8t针对大规模预训练进行了优化,原始算力几乎是上一代产品的三倍。我们对训练基础设施采取了根本性的不同方法。通过JAX和Pathways,训练不再受限于单个庞大数据中心。相反,现在可以无缝将训练分布到多个站点,实现在全球超过100万个TPU上扩展运行。这使我们有能力创建全球最大的训练集群。对模型构建者而言,这意味着可以在数周而非数月内训练出规模更大、能力更强的模型。TPU 8i专为推理设计。我们大幅提升了每一步的速度,因为在从事搜索业务的27年里,我们深知延迟至关重要。

为了让你直观感受这种速度,这里有一个即将在Flash模型上运行的提示词,假设它运行在8i上。我将创建一个Chrome Dino游戏并点击提交,响应是实时生成的。在观看的同时,请留意右上角的每秒token数。速度非常惊人,接近每秒1500个token。写请求的时间几乎比生成时间还长,而且游戏也非常有趣。除了速度,我们也在思考如何实现可持续扩展。这两款芯片都具有更高的能效,每瓦性能提升高达两倍。TPU一直在为今年的I/O大会进行紧张训练。据我所知,这里有一段幕后花絮。

短片角色:嘿,周末过得好吗?挺好的,刚刚折叠了稀有肿瘤数据集中的蛋白质。你呢?我模拟了未来50年的气候数据。我画了一张哈巴狗的照片,你见过穿得像会计师一样的哈巴狗吗?没见过,想看吗?好了,TPU们听好了,I/O马上就要开始了,我们有活儿要干了。事实上,我们有数万亿项任务要处理,所以清理一下缓存。Timmy!擦干你的风扇,让我们火力全开。嘿,你在干什么呢?我在剪辑蒙太奇呢。行了,你能不能别弄你那蒙太奇了,赶紧下来帮帮忙?什么?就现在吗?好吧,这就来。

SUNDAR PICHAI:我敢打赌在I/O大会结束后,像Timmy这样的TPU已经准备好直接躺平休息了。我们的算力创新推动了自身的进步。

今天我想在模型、编程和智能体(Agents)这三个领域进行深入探讨,向大家展示各方面的进展。让我们从世界模型(World Models)取得的令人兴奋的进展开始。通过世界模型,AI正在从预测文本转向模拟现实。Demis和Google DeepMind团队一直在致力于突破这些模型的能力边界。让我邀请Demis出来分享更多内容。

3.世界模型突破:Gemini Omni与Omni Flash

DEMIS HASSABIS:大家好,很高兴来到这里。过去一年里,AI能力实现了飞跃式提升。我们现在有了能够为我们制定计划并采取行动的智能体。距离实现通用人工智能(AGI)也只有几年时间了。今天,我很高兴能分享我们在构建通用人工智能方面取得的进展。

去年我阐述了扩展Gemini多模态能力的愿景,使其成为一个能够理解并模拟世界的AI世界模型。这是实现AGI的关键,也将对从构建AI助手到训练机器人等所有领域产生深远影响。现在我们迈出了下一步,我很高兴宣布Gemini Omni

这款新模型能够根据任何输入生成任何内容。它将Gemini的智能与我们最优秀的生成式媒体模型相结合,实现了全新的世界理解、多模态和编辑能力。Veo、Nano Banana和Genie等模型已经能够创建极其逼真的视频、图像和交互式模拟。虽然尚不完美,但它们展示了令人印象深刻的直观物理概念理解。借助Omni,我们现在取得了更大进展,在模拟动能和重力等方面实现了跨越式的突破,而以前的系统很难处理这些概念。Gemini的世界知识和推理能力在Omni中表现得淋漓尽致,它可以将复杂的想法转化为高度准确的视频。例如,你可以给它一个简单的提示词,比如“制作一个关于蛋白质折叠的定格动画解说视频”,大家可以看看效果。

视频旁白:蛋白质最初是氨基酸链。它们折叠成特定的模式,比如alpha螺旋和被称为beta折叠的平坦部分,从而形成完美的蛋白质三维结构。

DEMIS HASSABIS:但初始生成仅仅是开始。创作过程很少一步到位,通常是不断迭代的。就像Nano Banana重新定义了图像编辑一样,Omni为你提供了一种更自然的方式,允许通过对话式语言来编辑视频。真正酷的是你可以提供自己的视频(例如一段自拍),然后以一种非常有趣的方式改变现实。你可以轻松调整细节和风格,甚至添加新元素,整个场景都会随之演变,从而体现你的新创意。

比如一个简单的圆圈可以变成黑洞,或者让一段黄昏下的漫步焕发生机。任何事物都能成为创造全新现实的画布。让我们通过一段短片来看看Omni能做些什么。我们目前从视频生成开始,但随着时间推移,Omni将能够从任何输入生成任何输出。这始终是我们的目标,也是我们从一开始就将Gemini构建为原生多模态模型的原因。虽然这是一条更艰难的道路,但坚实的基础架构现在正发挥巨大作用。

今天我们将发布Omni系列的首个模型Gemini Omni Flash。它现已贯穿我们的各项产品中,稍后您将听到更多相关信息。我对目前的进展感到非常兴奋,很快也会分享更多关于Omni Pro的消息。迫不及待想看到你们的绝妙创作,现在把舞台交还给Sundar。

4.AI内容透明度:SynthID 跨平台扩展

SUNDAR PICHAI:谢谢Demis,这确实是巨大的进步。随着生成式AI不断完善,对更高透明度的需求也随之增加。研究表明人们能够正确识别高质量深度伪造(Deepfake)视频的概率仅为四分之一左右。

三年前我们推出了SynthID,这是一种肉眼无法察觉的水印技术。自发布以来,SynthID已为1000亿张图片和视频,以及长达6万年的音频资产添加了水印。数百万人正在使用Gemini应用中的SynthID Detector来验证AI生成的内容。

而现在我们正更进一步,增加跨产品的Content Credentials(内容凭证)验证功能。这将向你展示内容的来源是AI还是相机,以及它是否曾使用生成式AI工具进行过编辑。在这个示例中,Gemini可以识别出这张照片是用Pixel相机拍摄的,然后使用Google Photos进行了编辑。我们希望让更多人能轻松使用这些工具。

因此,我们正将SynthID和Content Credentials验证功能扩展到Search和Chrome中。你只需通过即圈即搜(Circle to Search)或在Chrome中右键点击并询问“这是由AI生成的吗?”,就能获得清晰的回答及其他有用的上下文。例如,这张图片去年在社交媒体上广为流传,但这显然是假的,因为我根本不吃汉堡。对于其他人来说这可能并不明显,这就是这些工具真正能派上用场的地方。当然,只有当更多合作伙伴决定为其AI生成的内容添加水印时,这一切才能实现规模化效应。NVIDIA去年已签约加入SynthID阵营,今天我非常激动地宣布OpenAI、Kakao和ElevenLabs也正在采用SynthID。很高兴看到这种跨行业的合作,我们期待将合作扩展到更多伙伴,并为AI时代的透明度设定新标准。

以上就是我们在世界模型(World Models)方面取得的进展。现在来谈谈Gemini 3系列的下一步计划。

5.大模型系列重大升级:Gemini 3.5 Flash与3.5 Pro

SUNDAR PICHAI:几个月前发布的Gemini 3拥有完整的模型系列,也是我们迄今为止被采用最广泛的系列。我们非常高兴看到开发者将Flash作为日常主力模型,并利用Pro的深度推理能力构建出令人惊叹的多模态体验。我们一直致力于改进这些模型,特别专注于智能体编程、长周期任务以及真实世界的流程。

今天,我很高兴能介绍Gemini 3.5 Flash,这是我们首个将前沿智能与行动能力相结合的模型系列。有两点我想强调:

首先,与3.1 Pro相比,Flash在几乎所有基准测试中都表现得更好。它在编程方面取得了巨大进步,在涵盖许多具有实际经济价值任务的GDP val基准测试中实现了惊人跨越。

其次,3.5 Flash是一款功能强大的行业前沿模型,足以媲美顶尖模型但速度要快得多。这就是为什么在观察智能程度与输出速度的关系图表时,它能在右上象限中独占鳌头。在每秒输出Token数方面,它的速度是其他前沿模型的四倍,使用体验令人惊叹。

这款新模型对Google内部而言具有变革性意义。我们一直将3.5 Flash应用于重新构想的Agent优先开发平台Antigravity,它极大地加速了我们的构建过程。三月份,我们每天为内部开发者处理5000亿个token,这个数字每隔几周就会翻倍,而现在我们每天处理超过3万亿个token。这种规模创造了一个强大的反馈循环,正帮助我们不断改进3.5。今天我们也将把它带给Antigravity的开发者们,下面让Varun来分享更多信息。

6.智能体开发平台:Antigravity 2.0桌面应用

VARUN MOHAN:这确实是一个成为构建者的绝佳时代。我们已经超越了辅助编写代码的AI工具,进化到了能够协助执行任务的智能体(Agents)。这些智能体极大地降低了开发门槛,让任何人都能成为构建者,甚至是忙碌的CEO。事实上,Sundar上周还使用Google Antigravity修复了Google代码库中的一个Bug。当我们在11月推出Antigravity IDE时,我们确保核心的智能体驱动型IDE体验达到极致,并添加了一个实验性的首创智能体用于Surface,以此展示未来的发展方向。数以百万计的用户已经在使用Antigravity,因此我们今天很高兴能带来更多内容。我们观察了任务和偏好的多样性,听取了坦率的产品反馈并吸取了经验。

现在,Antigravity正在大规模扩展其智能体能力、界面、集成和产品系列功能

首先,我们将推出完整的CLI体验:Antigravity SDK、支持Gemini音频模型的原生语音支持,以及与Android、Firebase和Google AI Studio等多个界面和平台的集成。所有这些今天就已准备就绪供大家试用。

最重要的是,其核心是Antigravity 2.0,这是一款全新的独立桌面应用程序,完全实现了最初对真正Agent优化体验的愿景。全新的Antigravity毫不掩饰地坚持Agent优先,专注于核心智能体对话、智能体生成的制品以及多智能体编排。

正如Sundar提到的,这正是Google内部团队一直以来用于创造巨大价值的体验。Antigravity Agent Harness是Gemini执行现实世界任务的隐形框架,随着子智能体(Subagents)、钩子(Hooks)和异步任务管理等新核心原语的加入,功能变得更加强大。

支撑这一切的基础是Gemini模型,其中Gemini 3.5 Flash已经与Antigravity Harness进行了深度协同优化。作为工程师我们很好奇,这些智能体和模型究竟能将可能性的边界推向何处。

因此,利用全新的Antigravity和Gemini 3.5 Flash,我们要求智能体去承担一项被认为高度复杂且令人印象深刻的任务:从头开始构建一个运行中的操作系统。我们对结果感到非常惊讶。Antigravity以异步方式将挑战分解为一个连贯的计划,通过并行子智能体处理任务,并对其进行生成、执行和迭代。在内部测试中,93个子智能体并行工作超过12小时,发起了超过15000次模型请求,处理了26亿个token,将一个最初为空的项目开发成了一个功能完备的操作系统核心。这在Gemini 3.1 Pro上是不可能实现的,但得益于Gemini 3.5 Flash的性能和成本效益,构建这样一个功能完备的操作系统消耗了不到1000美元的API额度。

Antigravity智能体编写了从调度程序到内存和文件系统管理的每一行代码,全部由一个自主智能体团队生成、审计和测试。需要说明的是,从零开始开发操作系统出了名的残酷,可能需要耗费数月时间。我们不仅仅是在构建一个应用程序,而是一个应用程序可以运行其上的功能完备的操作系统。

让我们进行现场演示,实际展示该操作系统的运行情况。

现在我正处于Antigravity构建的操作系统终端窗口中。演示运行中的操作系统并不容易,所以让我们找点乐子看看好不好使。我们可以安装一个有趣的实用程序SL,这是LS命令的一个常见拼写错误。先不剧透,直接看效果。成功了,你可以看到一辆印着Antigravity标志的酷炫机车穿过屏幕。

但显然,除非能玩《毁灭战士》(Doom),否则它就不是一个真正的操作系统。我现在尝试运行Doom,但它无法工作,结果发现这里缺少一些必要的视频和键盘驱动程序。所以让我们尝试在新的Antigravity中修复它。我准备了一个提示词正准备粘贴进去,在它运行的同时,我们先来参观一下Antigravity 2.0。

如你所见,Antigravity 2.0完全采用了智能体优先(Agent First)的设计,所有的智能体对话和项目都显示在侧边栏。让我们快速查看一下我之前进行过的一段对话。对于这次演示,我很好奇关于Doom的一些趣闻轶事,所以我让智能体做了一些调研。它在面板右侧生成了图表,最后还为我生成了一个很酷的制品(Artifact)。它甚至使用Nano Banana Pro生成了一张信息图,利用它刚刚编写的代码生成图表,随后又生成了一些很酷的表格。正如你所见,Antigravity 2.0是毫不掩饰的智能体优先产品,并且已优化为你与智能体交互的最佳界面。

让我们回顾之前的对话看看进展如何。Antigravity最终进行了大量研究,编写了超过100行代码,修复并构建了操作系统。让我们瞧瞧Doom是否能运行,真相大白的时刻到了。完美运行,太棒了!这游戏永远不会过时。虽然在Antigravity构建的操作系统上玩Doom既有趣又令人印象深刻,但进步并未止步于此。我们已经要求智能体构建了一套照片编辑套件、一个实时消息应用以及一个多用户协作平台,所有这些都取得了相同的高质量结果。得益于全新的子智能体(Subagent)团队协作能力,长达数天的工程工作正在缩减至数小时甚至数分钟。

我们很高兴能以早期研究预览版的形式,在Antigravity中为您呈现这一强大功能。最后但同样重要的一点是,3.5 Flash的速度快得惊人。正如Sundar所说,它比其他前沿模型快四倍。但众所周知智能体编程极度消耗Token,因此我们在Antigravity中将其性能提升到了新高度。我们对Flash进行了专属优化,使其在Antigravity中的速度不仅快了4倍,而是快了惊人的12倍。

我们非常激动能从今天开始让大家体验到这一切。我们今天展示的不仅仅是一个愿景,更是我们如何将Antigravity打造成为面向所有人的最完备智能体开发平台。我们正通过Google生态系统来实现这一目标,无论是集成你已在使用的技术栈和工具,还是利用Antigravity的Agent Harness为Google各项产品中下一批智能体体验提供动力。今天,Antigravity 2.0已面向全球所有人开放。请加入我们的开发者主题演讲,我们将演示所有新功能。回到你那里,Sundar。

SUNDAR PICHAI:谢谢Varun。令人难以置信的是,Varun演示的整个操作系统是由一个子智能体团队在短短12小时内以如此低的成本构建完成的。Flash的惊人之处在于,它能以不到同类前沿模型一半的价格,提供前沿级别的能力。

我们听说许多公司才到五月份就已经耗尽了全年的Token预算。如果公司混合使用Flash和其他前沿模型,他们可以节省大量资金。为了更直观地说明这一点,Google Cloud的顶尖客户每天处理约1万亿个token。如果他们将80%的工作负载从其他前沿模型转移到3.5 Flash,每年将节省超过10亿美元。这些实实在在节省下来的资金,可以重新投入到公司的发展中。

Gemini 3.5 Flash即日起面向所有人开放,涵盖我们的各项产品和API。我们对3.5 Pro也感到非常兴奋,我们正在内部使用它,它展现出了巨大的进步。我知道你们等不及想亲手体验它了,请再给我们一个月的时间将其交付给你们。

7.个人专属AI智能体:Gemini Spark

SUNDAR PICHAI:Gemini 3.5和Antigravity正在开启一个关于智能体及智能体能力的新世界。我们一直致力于为开发者和企业提供智能体。而现在,我们正全力专注于安全、可靠地将这种力量带给消费者,让它们为每个人服务。

今天你将在我们的许多产品中看到丰富的智能体体验。我对我们直接引入Gemini App的新功能感到无比兴奋,隆重推出Gemini Spark。它是你的个人AI智能体,可以帮助你处理数字生活,在你的指导下代表你执行操作。它运行在Google Cloud的专用虚拟机上,并且24/7全天候在线。没错,你可以安心合上笔记本电脑。它由Gemini 3.5和Google Antigravity Harness提供动力,这使得它能够轻松在后台执行长时间运行的任务。Spark与各种工具无缝集成,首先从我们自己的工具开始,并在接下来的几周内通过MCP与第三方工具集成。你可以采用最方便的方式与Spark协作,无论是在Gemini应用中,还是很快将支持的电子邮件和聊天交互。让我们请Josh上台分享更多内容。

JOSH WOODWARD:谢谢Sundar。很高兴见到大家。让我通过一些个人生活中的例子向大家展示Spark是如何工作的。现在我们打开了经过彻底重新设计的全新Gemini,稍后会在节目中详细讨论这一点。

我想带大家看看这里的Spark,你可以直接看到一个包含我在后台运行的所有任务的仪表板。它允许你查看这些任务,我马上就粘贴进一个任务。这是一个非常直接但很实用的例子。帮我给团队起草一封邮件,汇总关于我们最近Gemini Live发布的所有内容以及上周取得的成果。使用斜杠命令调用ghost writer,这样就有几件事正在处理。它会跨越Docs、电子邮件和聊天记录编译所有内容,并抓取本次更新所需的最重要信息。它还会使用上周所有调用了slash ghost writer的内容。这是我编写的一项个人技能,所以电子邮件听起来很像我的语气。最棒的是通过Spark你可以上传在网上找到的最喜欢的技能。所以我们要让它在后台运行。你可以看到它已经开始执行各种工具调用。

现在我要切换到另一个个人生活中的例子。我们正在筹划一场大型街区派对。这是一个相当复杂的提示词,我们希望它能协助收集所有的RSVP回复确认,记录谁带了什么东西,并记得给那些还没注册的邻居发邮件。

这里最令人惊叹的是Spark将逐步执行所有步骤,并在跨越各种技能和应用进行协作时为你节省大量时间。它会把任务分解并为你生成文件。第一个是一个实时RSVP追踪器,直接在Google Sheets中运行。它显示了谁已确认谁还没有。它实际上会自动更新,因为它与Gmail相连。当L. Thompson回复了8份RSVP时它会自动更新,这非常了不起。

另一件事是它会跟踪所有不同的嘉宾并向尚未报名的人发送后续提醒,这同样会自动发生。它会创建草稿并在我的控制下由我发送。最后提示词还生成了一份用于街区派对的预热演示文稿,直接在Google Slides中生成并完美集成。它甚至加入了像我们将放在尽头路口的巨大充气城堡之类的内容。所有这一切都发生在后台并受我控制。Gemini甚至可以更进一步提取出诸如你所在社区的业主协会不允许你在6月5日周五下午之前进行搭建之类的信息,这是从我Google Drive中的一个文件里提取出来的。因此它在整合所有内容方面表现得非常出色。

这展示了Spark在笔记本电脑上的运行情况,它在移动端同样表现惊人,同时支持Android和iPhone。在我的手机上打开进入Spark,你可以看到我们之前的两项任务刚刚同步完成。它们会在你的所有设备上保持同步,这非常有帮助。

Spark在记录脑海中的灵感碎片方面表现惊人。如果你超级忙碌,你可以随手把任务抛给它,Spark就会接住它们并开始处理。请看这个指令:帮我开启几个线程。第一个找到所有即将举行的与Sundar的会议并将它们全部标记为亮粉色以免错过。第二个给昨晚写下的新邻居John和他的家人写一张便条,邀请他们参加我们的街区派对,因为他们不在我们最初的列表上。第三个创建一个文档,列出在学年结束前我和妻子需要为孩子们做的最重要的事情,按截止日期和优先级进行分类并使其易于理解,我不想错过任何事情。发送该请求后,它能以我说话的速度捕捉所有上下文并处理任务。它以单线程开始,而在后台实际上会去处理并将这些内容分解为单个任务。现在我可以直接收起手机继续我一天的生活,Spark会在后台为我工作。这是我们第一次能够把手机放下让它在I/O舞台上持续工作,这太棒了。

出于安全考虑,我们本周将向受信任的测试人员谨慎发布Spark,并于下周作为测试版面向美国的Google AI Ultra订阅用户推出。我们希望这种新型帮助能让尽可能多的人使用,因此我们将推出每月100美元的全新Ultra方案。对于那些需要最高限制的用户,我们将把顶级Ultra方案的价格从每月250美元降至每月200美元

还有更多精彩内容即将推出,今年夏天晚些时候Gemini Spark将直接在Chrome中运行,作为你在整个网络上的代理浏览器,它可以在您的指导下执行操作完成任务。我们还在为您的智能体在手机上构建一个专属的大本营Android Halo,它将于今年晚些时候推出。正如Sundar所说,我们已经进入了整个Google的全新智能体时代,我们迫不及待地想看到你们将用它构建出什么样的成果。回到你这里Sundar。

SUNDAR PICHAI:谢谢Josh。很高兴看到Gemini Spark能够代表你处理事务。我尝试过各种各样的智能体,你能真切地看到其中的潜力。在让智能体变得易于使用、极度安全且真正提供帮助方面目前仍处于早期阶段。这就是为什么我对Gemini Spark感到非常兴奋。我们正在奠定基础以安全可靠的方式将这一切带给各地的消费者,期待着让大家都能尝试。

我们正坚定地处于智能体化的Gemini时代。Gemini Spark是你们所见到的第一个体验,由3.5模型和Antigravity共同实现。这种结合为我们提供了履行使命的新方式,并使我们的产品能够发生根本性的变革从而提供更强大的帮助。我迫不及待地想看到它将如何改变Search这项我们最终的登月计划。过去的一年已经证明了创新的力量有多么强大,这正是我们信息使命的核心所在。随着我们进入智能体时代,Search将比以往任何时候都更加实用和强大。现在我把麦克风交给Liz,让她来分享接下来的内容。

8.搜索引擎重构:AI Search与Search智能体

LIZ REID:人们每天都会向Search提出数十亿个问题。有时全世界都在搜索同一件事,但更多时候你的问题就像你本人一样独一无二。这就是为什么我们致力于让人们能够随心所欲地提问。为了实现这一点,我们一直致力于将搜索引擎的最佳体验与AI的优势相结合。

我们从AI Overview开始了这一转型。就在去年的这个舞台上我们推出了AI Mode。这是我们最强大的AI Search,引入了最先进的Gemini模型。从今天起我们将它升级至Gemini 3.5

正如Sundar所提到的,AI Mode的月活跃用户数已突破10亿大关,并且我们正见证着惊人的增长。自发布以来AI Mode的查询量每季度都在翻倍。随着搜索功能的不断增强,用户开始提出更多问题,以至于上个季度搜索查询量达到了历史新高。

更令人瞩目的是你们正在以极其具体详尽的方式提出真实的问题,因为你们知道Search确实可以解决这些问题。你正在与Search进行真正的来回对话互动并不断深入。你不仅仅是在询问附近的徒步路线,你还会要求制定一个附近徒步的一日游行程,要求有壮丽的景色、宠物友好型路线以及一个停车方便的午餐地点。

现在我们正进入Google Search的新篇章,令人惊叹的AI功能不仅存在于Search之中,Google Search本身就是彻头彻尾的AI Search。现在它是一款集成了我们最先进的Gemini模型、最新的智能体能力以及全球最广泛信息的AI Search。

我们在每分钟更新一次超过10亿条事实,每天索引数十亿个新网页,并连接到无限广泛的人类视角。所以无论你想到什么都可以来到Google询问任何事情。首先我很兴奋地宣布我们将推出全新的智能搜索框。以前搜索框是一个受限的空间,但现在它通过AI进行了彻底重构,会随着你的好奇心而扩展。

当你提问时,搜索会通过AI驱动的建议帮助你构思问题。这超越了自动补全,它提供了你可能从未想过的细微差别,帮助你将脑海中确切的问题轻松表达出来。这个全新的搜索框将我们最强大的AI工具置于你的指尖。你可以通过文本、图像、文件和视频进行跨模态提问,并跨越所有这些维度进行搜索。这是自25年前问世以来我们标志性搜索框所经历的最大一次升级,它从今天开始正式推出。

接下来我们将引入AI Overviews和AI Mode整合为一种无缝的AI Search体验,让与搜索进行对话变得更加容易。你可以毫不费力地从问题跳转到主搜索结果页上的回答,再到AI Mode中的后续追问。你的上下文会一直保留,对话也会随之深入。你的链接和来源会变得与你的需求更加相关,让你能持续获得最优质的AI和Web体验。这种全新的无缝AI搜索体验已于今日在全球范围内的桌面端和移动端上线。

刚才你们听到了Sundar和Josh分享了关于智能体及其所能开启潜力的思路。现在我们正朝着这一愿景迈出令人兴奋的一步,届时你将能够直接在Search中创建并管理多个AI智能体来处理各项任务。

我们正进入Search智能体时代。你可以让信息智能体在后台全天候为你服务。它们能准确找到你所需的内容,并在关键时刻协助你采取行动。你可以在Search中同时启动多个智能体以便获取最新动态,并在所有对你重要的事情上取得进展。这些智能体将配合Gemini Spark帮助你完成更多工作。让我们看一些实际应用,假设你对金融非常感兴趣,想在关键时刻了解市盈率低于15、现金流为正且负债率低的生物技术大盘股。

你只需提出要求你的智能体就会立即开始工作。它接收你极其复杂的问题并制定出一套方案,判断紧急程度,理解你需要即时情报并设置触发器留意不断变化的信息,同时挑选该任务所需的工具和数据钩子。它直接连接到我们的实时金融数据,让你获得秒级的最新更新,涵盖股票价格和市场洞察,在市场波动的瞬间即刻掌握。当市场发生变化时,智能体会向你发送一份智能综合更新。它能帮助你理解当前局势去伪存真,从杂乱的信息中提取核心信号。它还会为你指向高度相关的众包研究平台、新闻网站和社交媒体内容。这有助于网站和创作者在人们最关心的时刻让那些真正感兴趣的人发现新鲜内容。

假设你正在找公寓,你可以把脑海中关于目标的各种想法包括地理位置、自然采光和可用性等标准告诉它,然后你的智能体会持续扫描整个网络涵盖各大网站、社交媒体和论坛。或者如果你是个球鞋迷,你只需要求在任何你喜爱的运动员发布运动鞋联名或发售信息时通知你即可。它会监控从博客到我们Shopping Graph的所有内容,让你不会错过任何消息。今年夏天你将能够让信息智能体为你工作,只需让Search随时为你更新你想了解的信息。

信息智能体是我们在搜索中推出的首批智能体之一,旨在为您提供更多帮助。所以无论你是想查找、核实、预订、购买还是进行其他操作,搜索都能帮您搞定。我们还将智能体编程引入搜索,使其能够为您的问题定制专属体验。为了向大家展示具体运作机制有请Robby。

ROBBY STEIN:我们相信Search的最佳版本是专为您创建的版本,能以最有助于回答您提问的格式呈现信息。我们已经花费多年时间来完善这一点。如果你在购物我们会为你提供产品,询问数据你会看到图表,寻找灵感你会获得精美的视觉效果。

现在我们正将其带入一个全新水平,将Antigravity以及Gemini 3.5 Flash的智能体编程能力直接引入Search。因此Search可以针对您的问题即时完全定制并构建出理想的格式,包括动态布局、交互式组件甚至是整个为你量身定制的体验。这就是在Search规模上实现的智能体编程。

让我举个例子。假设我是一名试图理解天体物理学的大学生,我可以直接去Search搜索黑洞是如何影响时空的。在AI概览中我直接得到了一个交互式可视化图表。搜索意识到对于如此复杂的概念我需要通过交互来真正理解它。这只是入门,所以我要追问向我展示像联星黑洞这样两个相互绕转的天体是如何产生引力波的。搜索功能实时动态构建了一个全新的交互式视觉效果,完全为我的特定问题定制。我可以调整轨道间距和质量比等参数,看到波形模式的变化,观察较小的黑洞绕着较大的黑洞螺旋运行。既然掌握了基础知识我就可以深入研究LIGO Discovery Papers等资源了解更多信息。

你可能想知道Search究竟是如何为数十亿个独特问题构建这样的自定义UI的。借助Gemini 3.5 Flash,Search可以从零开始规划理想的回复,负责设计布局、决定构建哪些自定义组件、展开调研并最终部署代码。为了在回复中构建自定义组件,这项搜索功能调用了由Antigravity提供支持的智能体编码框架,因此它可以在安全的容器化环境中读取、写入文件并执行代码。这就是Varun用来构建整个操作系统的技术,我们正将这种强大的能力直接引入Search。搭载Antigravity的生成式UI将于今年夏季向所有人免费推出。因此无论你想了解什么,无论是想知道手表究竟是如何运作的还是在分析通勤的新成本,你都将获得与问题一样独特的回答。

让我们再进一步。有些项目并非一次性问题而是持续性的任务。现在Search能够帮助你构建完整的自定义有状态体验,包括工具、追踪器和仪表板。我将这些视为在Search中构建我自己的小程序,它们在处理筹备婚礼或管理搬家等需要持续跟进的长期任务时表现尤为出色。

我们要不要一起构建一个?我一直在想周末该和家人做些什么,这是我刚刚搜索的活动内容。除了来自AI Mode的出色回复外,Search还主动提出为我制定一个周末计划。就像刚才看到Search从零开始创建生成式UI和交互式视觉效果一样,Search现在就可以编写代码了。为了让大家了解幕后运作机制,在构建过程中你会看到实时思考步骤和代码生成的流动过程。Search正在思考合适的组件不仅是获取信息,还要以最佳方式呈现。我选择安全地连接Gmail、Photos和Calendar,因此它利用个人智能参考收据和日历等内容使建议更加实用。它生成了一个精美的计划,已经考虑到了行车时间和天气。

Search知道我有两个孩子,喜欢动物,还知道老大正在学习国际象棋,所以第二个选项对老大很棒。但为了让两个孩子都开心,我打算选定Happy Hollow公园和动物园。因为它与我的日历同步,它已经占用了我下午的时间去见个朋友看比赛。下方所有超酷的餐厅预订信息都精美地展示在Maps上。既然看过了这些智能体,我想让总统夫人的优先级更高一些,而且我太太和我尽量安排在周五晚上约会。所以我打算继续自定义添加每周五晚上的约会并移至顶部。就像之前一样它思考调整计划所需的操作、查询实时信息甚至再次检查我的偏好设置,速度非常快。它利用Google的各种信息实时构建内容,现在可以在最上方看到地图和周五约会之夜标签页。向下滚动能看到等保姆到了以后的很棒的餐厅。选好后我们就准备好出发了。

一个周末计划如果没有得到我妻子Danielle的认可就不算完整,所以我把这个应用分享给她。当她收到时这正是她在手机上看到的画面。Danielle进来了,可能等我回家后她有些反馈要给我,不过我们待会儿再处理。我只需要把它添加到我的日历中,Search会将其添加到我们所有的家庭日历中然后就准备就绪了。下周末我也能像这样为家人规划一个全新的周末。

我们将把Antigravity引入Search,生成式UI将于今年夏天从订阅用户开始推出。在接下来的几个月里您将能够像这样自定义构建体验。从Search智能体到智能体编程,这是一款能为您做更多事情的AI Search。无论提出什么问题,智能体能力将改变你使用Search的所有方式包括购物方式。为了向大家介绍更多信息,有请Vidhya。

9.智能体电商:Universal Cart与UCP/AP2协议

VIDHYA SRINIVASAN:随着AI技术的惊人进步,我们正在进入一个全新的时代。我们一直在为智能体电商(agentic commerce)奠定基础,而现在,我们正将这一未来带到您的面前。人们每天在Google上的购物次数超过十亿次。

多年来,我们一直致力于将您与品牌和零售商联系起来,帮助您准确找到所需之物。这一切始于我们的Shopping Graph,它是全球最全面的产品目录,现在拥有超过600亿条商品列表并且在不断更新。将Shopping Graph的规模与我们最先进的Gemini模型相结合,您就能获得全新的购物方式,它更强大、更智能也更有趣。

谈到智能体商业,我们正致力于提供三个关键的构建模块,以将这一愿景变为现实。

首先是通用商业协议(Universal Commerce Protocol),简称UCP。UCP之于智能体商业,正如HTTP之于万维网,它为代理和系统提供了一种通用语言。这是一个开源标准,允许所有关键参与者在整个购物流程中协同工作。这意味着它使从产品搜索、结账到物流查询的每一个环节都变得完全无缝。我们非常高兴地看到整个行业都对其鼎力支持。我们与一群出色的创始合作伙伴共同开发并推出了UCP,最近还迎来了Amazon、Meta、Microsoft、Salesforce和Stripe的加入,他们将继续帮助主导这一开放标准。这可能是我们科技巨头之间第一次达成共识!现在,我们正将UCP引入更多垂直领域,例如酒店、本地外卖供应商以及YouTube和更多产品。在接下来的几个月里,我们还将在Google产品上扩展基于UCP的体验,推广到加拿大、澳大利亚和英国等更多地区。

这引出了我们的第二个构建模块:智能体支付协议(Agent Payments Protocol),简称AP2。谈到智能体支付时,我们听到的首要问题是:“我如何确保它不会直接跑掉并买一些我不想要的东西?”有人想买摩托车吗?这是一个合理的问题,这也是我们创建AP2的原因。它的设计初衷是让您的AI代理能够代表您安全地进行支付,但始终处于您的控制之下。

对我们来说,这归结为两点:设定边界和确保问责制。首先谈谈边界,现在设置严格的护栏变得非常简单。只需告诉你的智能体你想要的特定品牌、产品以及预算,如果符合标准,它就会自动完成购买。但只有在问责制存在的情况下,边界才会生效。AP2在您、商家和支付处理器之间建立了一个透明且可验证的链接。它使用隐私保护技术来确保您的数据安全,并配合防篡改的数字授权,确保代理始终代表您的利益行事,为您提供永久的数字凭证轨迹。因此,如果您需要退货,您和商家查看的是同一条记录。您的支付信息将保持屏蔽状态,数据将保持私密,购买也将保持安全。我们将在接下来的几个月内开始将AP2引入Google产品,首先从Gemini Spark开始。

现在这些协议正为新时代奠定基础,这也带我们进入了智能体电商的最后一个基石。我很高兴宣布Universal Cart,一个真正的智能购物车。它支持跨商家和跨服务使用。您将能够在浏览Search、与Gemini聊天、观看YouTube甚至阅读Gmail时将商品添加到购物车。在您添加产品的瞬间,您的购物车就会在后台为您工作。它会寻找优惠和降价信息,为您提供价格历史洞察,并在商品补货时提醒您。这一切都运行在我们的Gemini模型上,因此随着模型的改进,您的购物车会变得更加智能。只需将其视为拥有超能力的购物体验。

另一个改变游戏规则的功能是它如何应用智能推理。假设您正在组装第一台定制PC。您看到一款评价极高的主板并将其加入购物车,之前您已经选好了一款处理器,但没有意识到该处理器需要具有不同插槽类型的主板。您的购物车为您发现了这一点并建议了一个替代方案,预防了一个您完全没预料到的问题!

接下来我最喜欢的功能是购物车实际上可以为您发现隐藏的优惠。如果您像我一样,拥有多张带有不同权益的支付卡且很难一一记住,现在您不需要这么做了。购物车可以为您代劳,因为它基于Google Wallet构建。

这里有一个例子,有一份来自Target的优惠针对的是本周早些时候添加到购物车中的一些商品。我看到了,所以想现在就购买。UCP让从购物车结账的过程变得非常顺畅。只需点击几下,您就可以直接在Google上使用Google Pay支付,或者也可以将商品直接传输到零售商的网站并在那里购买。

我很高兴地宣布,我们将于今年夏天在美国的Search和Gemini应用中推出Universal Cart,随后将与YouTube和Gmail整合。这些就是我们今天向各位展示的构建模块,它们不仅为智能体商业奠定了基础,还将彻底改变您在Google上的购物方式,使其功能更强大、更智能且更有趣。祝购物愉快,现在把时间交还给Liz!

10.体验全面焕新:Gemini App重绘、Daily Brief与Mac原生应用

LIZ REID:今天你们已经看到了我们如何将搜索引擎的精华与AI的优势结合在一起,打造一个比以往任何时候都更实用、更强大的Google Search。在这里,搜索智能体(Search agents)全天候为您工作,智能体化编程意味着搜索可以构建出与您的问题一样独特的体验,而智能体电商的力量并非遥不可及的未来,它现在就在这里。因此,在AI搜索的这一篇章中,Google可以帮助您寻找、理解、构建、做任何事情。所以,尽管开口问吧。

JOSH WOODWARD:大家好!很高兴再次见到各位。今天早上你们已经看到了一些惊人的突破,而我们才刚刚开始。在Gemini应用中我们还有更多内容要展示给各位,让我们直接开始吧。

在过去的这个夏天,Gemini展现出了令人难以置信的发展势头。每月有超过9亿用户访问Gemini应用,这种增长很大程度上归功于我们极快的发布速度。一年前这些功能都还不存在,而现在Gemini已成为每个人的终极创意工具。你可以创作图像、视频以及以人们从未想象过的方式处理音乐。我们通过个人智能(Personal Intelligence)使Gemini更加个性化,让您可以安全地连接Gmail、Photos和其他应用,从而获得定制化的帮助。就在上周,我们将个人智能直接扩展到了全球范围内的应用中。每天都有数百万人正在使用它,他们发现它在很多方面都非常有帮助,比如个性化的产品和旅行推荐,或者作为构思伙伴协助应对人生中的重大决策,比如职业变动,或者就我而言,寻找合适的一套轮胎,为我们将要在街区派对上展示的超酷面包车做准备。

在过去的一年里,我们也让Gemini变得非常适合学生使用。你可以用它来创建引导式学习、生成模拟测试,甚至可以使用专门的笔记本将你所有的笔记和作业保存在同一个地方,而这些笔记本会直接同步到NotebookLM。目前NotebookLM已被用于创建超过15亿个笔记本、播客、幻灯片组等,将复杂的信息转化为易于理解的知识。

正如你刚才从Sundar那里听到的,我们正在推出全新的Gemini 3.5 Flash模型,它正在开启一系列全新的功能,我今天将向你们展示这些。所有这一切都发生在Gemini应用中,该应用目前已在230多个国家和地区推出,支持70多种语言,使Gemini成为全球可用范围最广的AI系统。

Gemini正在成为人们所依赖的通用助手。它是为人们的日常生活而设计的,说到设计,这就引出了我们今天三大更新中的第一个。

今天我很高兴地宣布,我们已经从底层开始彻底重新设计了Gemini。从你打开它的那一刻起,我们便为你呈现了一种令人惊叹的全新设计语言,我们称之为Neural Expressive。我们在整个应用中加入了流畅的动画、鲜艳的色彩、全新的地形设计以及触感反馈。但好的设计不仅仅关乎外观,更关乎其运作方式。因此我们对整个体验进行了演进。我们让发现和生成那些精美的图像、视频和音乐变得更加简单,并内置了可以轻松进行二次创作的模板。此外我们还彻底改造了Gemini Live的体验。它现在开启了立即且流畅的互动模式。很快你将能够选择一种让你产生共鸣的方言口音,听到各种口音的巧妙融合,比如利物浦口音。

非常酷。我们将在接下来的几周内推出这些以及更多地区方言。我最喜欢的部分是我们如何通过全新的Neural Expressive设计语言来处理模型响应,这正是它真正焕发生机的地方。你将不再看到大段的文字,相反,Gemini会实时为你精心排版其回复,就像你在Search中看到的生成式UI那样。当你滚动时,你可能会看到由Gemini自定义生成的交互式图像,你可以深入其中进行探索,将信息获取提升到了一个全新的水平。你甚至可能会看到可以快速浏览的时间轴或内嵌视频。因此无论你处于深色模式还是浅色模式,整个体验都感觉非常流畅、充满未来感且极其自然。最棒的是,Neural Expressive即刻起将在全球范围内的Android、iOS和Web端上线。

以全新设计的Gemini应用作为新基础,我们可以进一步发挥Gemini的创意能力。这就是第二项更新。Gemini Omni今天即将面向付费订阅用户登陆Gemini应用。它将让你通过文本、图像和视频输入的任意组合,将创意变为现实。在我使用它的过程中,感觉视频领域的Nano Banana时刻已经到来。创建和编辑视频从未如此简单。让我们来看看这在现实世界中是如何实现的。

来看看Sashu,她正在创作一首新歌,并想制作一段简短的视频预告片。她分享了原始视频,添加了一些参考视觉效果,而最酷的部分是她可以转换视频的风格,甚至将摄像机角度切换为360度全景镜头。Gemini将这一切完美融合在一起。

如你所见,Omni理解她动作的物理原理,并智能地将特效融入现实世界,同时又不失镜头的灵魂。创作、混剪和编辑视频从未如此简单。因此无论她脑海中有什么构思,现在都可以利用Gemini将其变为现实。全球范围内的Google AI Plus、Pro和Ultra订阅用户今天就可以立即在应用程序中体验Gemini Omni。

今天的第三项更新是关于智能体(agents)如何引入Gemini。这对Gemini来说是一个巨大的转变,因为智能体不仅是回答问题,它们还会主动代表您开展工作。

为了向您展示这意味着什么,我想介绍我们最新推出的开箱即用型智能体,名为每日简报(Daily Brief)。这是一个个性化的摘要,旨在成为你每天早晨的第一站。它的工作原理是这样的:它正在综合处理来自我的收件箱、日历和任务的信息,为我找出最需要意识到的重要事项。我完全可能会忘记把东西还回去等琐事,但这不仅仅是总结数据,它还在按主题进行整理,甚至在建议后续步骤。有了这些旅行信息,我可以直接在当前界面执行下一步。所有这些内容都非常简洁地呈现在这个专为快速浏览而设计的早间摘要中。Daily Brief同样于今日开始向Google AI Plus、Pro和Ultra订阅用户推出,首发地区就在美国。

除了每日简报,我们还允许高级用户使用我之前展示过的Gemini Spark来创建他们自己的自定义工作流。你们还记得在节目开始时我发送了几个任务,现在让我们去查看一下进展。之前我是在手机上操作的,现在要在笔记本电脑上把它调出来,看看它是如何跨设备同步的。在笔记本电脑上你可以看到它已经把那三个任务细分到了这里。它实际上有一个非常棒的功能,对于某些任务,它会请求你的输入进行批准,所以它不会擅自去做你不希望它做的事情。我检查一下学年规划清单,我曾要求它创建一个关于现在到年底之间我想记住的所有事情的摘要文件。令人惊叹的是,它利用了Google Docs的所有格式功能,所以我可以立即点击进入,查看为我们各个孩子准备的清单,所有内容都已细分。日期、活动以及颜色编码全部集成在一个地方,轻松逐一查看。这能节省多少时间,真是令人难以置信。

在所有这些案例中体现出来的是,我们希望让智能体既易于使用又安全。提醒一下,Spark将于本周开始向受信任的测试人员推出,我们计划下周在美国向Google AI Ultra订阅者推出测试版。

我们还将把Spark的一个版本引入Gemini Workspace以及Gemini Enterprise。而这仅仅是个开始,我们已经制定了密集的路线图,将在整个夏季陆续发布各项功能。我对MCP集成感到非常兴奋,这将使Spark能够以更加主动且强大的方式处理诸多任务。想象一下,Spark将能够提前查看你的日历,发现你在周六负责孩子们T-ball比赛的零食供应。它会主动自行设置好你的Instacart订单,这样你就不会忘记带那些零食。它甚至还会记得挑选不含坚果的零食。我们拥有一系列令人赞叹的合作伙伴,他们将在今年夏天陆续接入Spark。

我知道我曾承诺只发布三项更新,但我们还有最后一项。上个月我们发布了适用于Mac OS的Gemini应用,这是一个小团队利用Antigravity从零开始构建的原生应用。他们在不到100天的时间里开发了超过100项功能。就在两个周末前我们还在开发Mac应用,当时想到了一些很酷的东西,想把它偷偷带到节目中。

我们今年夏天有一场长途旅行即将开始,得给家里的两只狗找个寄养中心。当你去一家新犬舍时,会有大量的文书工作、过敏史、疫苗接种等需要整理的历史记录。这太痛苦了。所以你可以在Mac OS上的Gemini中选中这些文档,然后长按Function键,直接向犬舍口述邮件内容。它的工作原理大概是这样的:“你好,我需要为我的两只狗Louis Cinnamon和Hank办理短期的寄养,从这周四开始,哦,等等,不实际上是这个周五。它们以前从未在你们那里住过,但它们是非常善于社交的狗狗。另外,你能把这些文件转换成一个表格吗?包含它们的详细信息、过敏史、最近的疫苗接种情况,并让这封电子邮件听起来更友好一些,以便我们能留下一个良好的第一印象。”

我发布了语音指令,你可以看到Gemini正在后台思考。因为它利用多模态理解能力,查阅了我选中的PDF和发票图像,这一切都由我的语音控制。所以它实际上可以处理所有这些复杂信息,直接生成了一个内联表格。这也太神奇了,因为它会进行修正,记得我说了周四又改口周五,它捕捉到了这一点并自动清理了我的输入。这就是Gemini通过你的语音所能展现的强大能力。Gemini Spark中这些全新的语音功能也将于今年夏天登陆Mac应用。

以上就是全部内容。今天是一个干货满满的Gemini之日。我们利用Neural Expressive完全重新设计了整个体验,发布了全新的Gemini Omni模型以及三款3.5 Flash模型,3.5 Pro也即将推出。得益于Daily Brief和Gemini Spark等新功能,即使在你睡觉时,它也会继续为你工作。这一切都让我们更接近愿景:打造一个个性化、主动且强大的通用助手,深入您的日常生活。因此无论您是学生、忙碌的家长还是小企业主,我们都期待您能通过Gemini实现无限可能。谢谢大家!

视频内容大家好,我是Holly。我于2005年从韩国移居美国。美食一直是我们家庭的热爱所在,所以我决定开一家餐厅。但是经营一家餐厅真的很难。我发现Gemini可以帮我处理很多事情,从菜单到营销,再到预算和库存。我甚至使用Antigravity和Stitch重建了我们的网站,为客户加入一个定制聊天机器人。但有一天我们需要在最后一刻紧急寻找一名洗碗工,那便是我的“灵光一现”时刻。我想要帮助小型企业和人们更快地找到彼此。于是我召集了一个小团队,利用Gemini模型构建了一个名为WorkOnward的包容性招聘平台。我们做到了其他招聘网站没有做到的事情。我们翻译了职位发布信息,并实现了仅通过文本即可发布职位。这有助于打破障碍,帮助那些不懂技术的人找到自己的位置。我们的小工具现在已经成为一个被纽约市超过13000人使用的平台。这关乎尊重劳动者和小企业的尊严,我认为这就是AI的力量。

11.下一代生产力设计工具:Google Pics与Stitch

SUZ CHAMBER:正如你们今天所听到的,我们的模型和产品正在开启新的突破,但真正的突破并非技术本身,而是你们如何运用它。无论你是一名设计师、企业家还是艺术家,我们的产品有助于缩短从产生创意到将其实现的差距。在理想状态下,技术是人类创造力的画布。

今天我想深入探讨三款能帮助你将创意变为现实的产品。让我们从一款利用Nano Banana强大功能的产品开始,它赋予了你更多的创意控制权。隆重推出Google Pics,这是Google Workspace中的一款新产品。Pics是我们的图像创建和编辑工具,它可以帮助你创作几乎任何内容,从派对传单到信息图表,并提供你所期望的创意控制。

看看这有多简单。你从一张基础图像开始作为画布,非常酷的一点是,Pics能够理解你创作的内容以及各个对象之间是如何协作的。你可以将鼠标悬停在某个元素上并点击将其删除,或者调整对象的大小以适应框架。布局设置完成后,你可以添加或编辑文本,只需点击一下即可翻译所有内容。我们创意工具(包括Pics)的每一份输出都通过SynthID添加了水印,Pics将于今年夏天推出。

如果你想超越图像的范畴呢?也许你想设计应用程序或网站。现在你可以以思维的速度构建UI。Google内部的团队都在使用我们名为Stitch的设计产品,将粗略的想法转化为精美的UI设计。

在过去的一年里,全世界使用Stitch生成了超过1亿个UI屏幕。为了延续这一势头,今天我们将推出全新的设计方式。来看看它是如何运作的。我的朋友Tyler和Jenny拥有一家披萨公司,他们拥有丰富的披萨制作经验,但在网站设计方面却毫无经验。只需一个提示词,Stitch就会开始工作,实时生成UI。这只是第一轮尝试,如果他们想要进行优化,可以实时与Stitch协作,无论是通过编写提示词还是使用语音。例如他们可以说“让页眉文本变大,并更新菜单以突出显示更多披萨选项”,布局会实时更新。由于Stitch连接了许多工具,他们只需点击几下就可以将设计导出为代码或发布网站。Stitch的这些更新今天将向全球用户推出。

每当一项新技术诞生,最令人兴奋的莫过于看到人们利用它创造出什么。这就是为什么从第一天起,我们不仅在为创意人士构建模型和工具,更是在与他们共同构建。正如我们去年在I/O大会上推出Google Flow,如今数百万人正在使用它以从未有过的方式创作图像、电影和音乐。为了在这一进展的基础上更进一步,我们正在推出Gemini Omni、一个新的智能体、自定义工具以及音乐混音功能。

让我们从Gemini Omni开始。看看这段原始素材,我非常喜欢这个人的走路方式、他的仪态以及他的节奏,我们不要改变其中的任何一点。只需简单的提示词和风格参考,Omni就能让我们转换环境、添加视觉特效及任何其他元素,同时保持原始性能。现在,你甚至可以添加新角色,并保持场景中的其他一切不变。

接下来看看我们的第二个重大更新,Google Flow中的一个新智能体。直到今天,Flow每次只能执行一个提示词。现在您的智能体可以同时执行多个操作。只需从一张图片开始,我就可以要求智能体帮我找到这个场景的最佳摄像机角度。它会分析图像中发生的内容,构思出最引人入胜的角度,然后一张静态图像就变成了16个独特的视频。该智能体还可以处理大规模的编辑工作,比如将所有这些场景从清晨转变为深夜。它对上下文的理解非常精准,沙漠的天空完全变暗,车灯亮起并照亮了尘埃。它是一个真正的协作伙伴,帮助你进行大规模的创作和编辑。

我们的下一项更新是Flow tools。现在你可以直接在Flow中通过vibe-code构建任何你能想到的创意工具。这些工具由你为自己独特的创意流程量身定制,例如设计视频特效、手绘动画或文字图层。从今天起你就可以开始构建、分享和重混工具。视觉魔力仅仅是故事的一半。

Google Flow Music带来了同样的创意控制力,帮助艺术家创作原创歌曲。几个月来我们的一位团队成员脑子里一直回响着一段钢琴乐句,让我们听一下原始录音。这是一个非常棒的基础,但他想把它变成一个Demo来引导乐队。于是他将钢琴录音导入Flow Music并提示它朝着R&B方向发展,同时加入女声伴唱以此启发乐队的主唱。这还不是他的最终曲目,但它帮助乐队决定接下来要录制什么。

Google Flow和Google Flow Music中的这些新功能现已上线。从音乐家到小型企业,从vibe coder到艺术家,真正的突破不在于技术本身,而在于你们如何运用它。我们迫不及待地想看到你们的创作。接下来我想把时间交给Shahram,由他来展示当我们把Google的最新创新成果带入现实世界时会发生什么。

12.XR硬件突破:Android XR平台与首款智能音频眼镜

SHAHRAM IZADI:对于XR来说这是一个激动人心的时刻。AI正持续在头显和眼镜上开启全新的体验以及其间的一切。Android XR这一我们与Samsung共同打造并针对Qualcomm的Snapdragon进行了优化的新平台,将这种先锋硬件与Gemini相结合。这能为您提供即时帮助而不会让您从中分心。

Android XR的下一个重大里程碑是Intelligent眼镜。将会有两款此类AI眼镜,它们可以连接到你的手机为你提供全天候的免提帮助。去年我们在I/O舞台上向你们展示了显示眼镜。通过镜片内的小型显示屏你就能在眼前直接获取有用的信息,比如扫一眼就能看到Uber的接送详情或者在旅行时获取实时翻译。你甚至可以使用Create My Widget等功能来制作一目了然的元素。第一批开发者已经在创建显示体验,今年晚些时候当我们扩大Trusted Tester Program时会分享更多关于这些眼镜的信息。

但让我们来谈谈今年将发布的产品。今天我很高兴地宣布我们的首款音频眼镜将于今年秋季面世。它们的设计旨在为您提供来自Gemini的全天候帮助,私密地传送到你的耳边而不是显示在屏幕上。

这些眼镜让你能够保持解放双手并抬头关注周围,无论是听音乐、拍照、打电话还是使用手机应用都无需从口袋里掏出手机。就我个人而言我非常喜欢烹饪,但我不是那种会死板遵循菜谱的人,所以能让Gemini在我开始大胆尝试之前提供一些建议真是太棒了。

这些音频眼镜汇集了全明星级别的合作伙伴阵容。其中包括全球顶尖眼镜设计品牌Gentle Monster和Warby Parker创造的标志性设计。全球领先的电子公司Samsung正在打造创新的新设备和体验,为整个行业树立了标杆。我们一直致力于带来最出色的硬件,也将Google的功能引入这些眼镜。它们将支持与Android和iOS设备配对。它们看起来棒极了而今天你们终于要亲眼见证了。让我们把时间交给来自合作伙伴Samsung的朋友Jay Kim开启全球首次亮相。

JAY KIM:在Samsung我们的愿景是丰富人们的生活并助力塑造我们未来的生活方式。通过与Google的紧密合作我们推出了智能眼镜,让您能够与世界建立联系并带来自信。凭借Samsung精密的工程设计与工艺,我们将外形、功能与实用的智能技术相结合打造出您心仪的佩戴之选。在眼镜设计中每一毫米都至关重要。今天我们非常激动地向大家展示这款产品的首次亮相。即将推出的款式是与我们的眼镜合作伙伴Warby Parker和Gentle Monster共同创作的,让我们来看看。

合作设计师:人们总是在说必须具有颠覆性,但我们必须思考什么是颠覆。我想创造比普通眼镜更美观的智能眼镜。这就是我们的目标,是技术与时尚之间的平衡。这不仅仅是产品更关乎感知与情感。心才是DNA所在,我想给人们带来自信。当他们戴上它时会感到与这种勇敢、叛逆的精神相连因为这就是我们的本色。这就是Gentle Monster与Google和Samsung合作的意义。眼镜是非常个性化的产品。它们塑造了你观察世界的方式以及世界看待你的方式。你在这里看到的是Warby Parker第一代智能眼镜设计的演进。我们对智能眼镜的愿景始于想要设计一副美观的眼镜。我们经常从不同的艺术品、艺术家和时代中汲取灵感。对我们来说重要的是不要隐藏技术而是去赞美它。这些不仅会帮助人们观察世界,还会帮助他们更深刻地理解世界。我们希望人们能够充分地体验这个世界而这正是这项技术的魔力所在。

SHAHRAM IZADI:它们难道不漂亮吗?这些是将于今年秋季推出的更大系列中的前两款设计。谁想看现场演示?Nishtha将和我一起上台,所以让Gemini为她播放一段入场音乐吧。它正在观察你周围的世界。你可以看到台下观众越兴奋音乐就会越劲爆。我想它已经完成了,奏乐!Nishtha欢迎你。

NISHTHA BHATIA:谢谢。

SHAHRAM IZADI:我穿着其中一款Warby Parker款式,Nishtha戴着一副Gentle Monster眼镜。看起来很棒。

NISHTHA BHATIA:谢谢Ram你也是。

SHAHRAM IZADI:在今天的演示之前先做一个简短的说明。我们将把音频传输到舞台音箱,但在日常使用中Gemini当然只会私下与我们交谈。上次我们登台时看到了显示眼镜上丰富的Google Maps体验。这些眼镜上的Maps同样好用,尤其是当与Personal Intelligence结合使用时。

NISHTHA BHATIA:无需掏出手机我只需要开口询问。Gemini你能导航我去上周我和朋友Gianna见面的那个地方吗?

GEMINI:我已经为你设置好了前往上周徒步地点Redwood Grove Natural Preserve的路线,需要添加经停点吗?正准备去买杯下午冷萃咖啡吗?

NISHTHA BHATIA:是的Gemini我很乐意。

GEMINI:好的。我正在开启步行导航,中途停靠Koopa Cafe。请掉头并向Bill Graham Parkway方向前进。

SHAHRAM IZADI:戴上眼镜你可以允许Maps进一步了解你的上下文以及你面前的事物。这样你就能获得详细的导航指引,例如咖啡店就在你的右侧。说到咖啡,Nishtha你想分享一下Gemini智能如何让你提前预订那杯冷萃咖啡吗?

NISHTHA BHATIA:这真是个好主意。Gemini你能帮我在我们刚才提到的那家咖啡店下单我常喝的饮品吗?

GEMINI:没问题,我这就为您在Doordash上下单Koopa Cafe的氮气冷萃咖啡到店自取。

SHAHRAM IZADI:在我身后的屏幕上你们可以看到Nishtha的手机放在她的口袋里。Gemini就能启动像Doordash这样的应用程序,然后点击所有不同的选项屏幕自动为她订购咖啡。稍等片刻它就会准备好等待Nishtha的确认。

GEMINI:我已经为您准备好了Koopa Cafe的氮气冷萃咖啡订单。您要确认吗?

NISHTHA BHATIA:是的请确认。另外再加20%的小费。

SHAHRAM IZADI:我想经过这么多轮排练这是她今天的第15杯冷萃咖啡,感谢咖啡店对我们的包容。

NISHTHA BHATIA:确实。说到准备工作我上台前其实把短信静音了,不过让我看看现在能不能跟上进度。嘿Gemini我错过了什么重要消息吗?

GEMINI:是的。您的家庭群聊决定今晚7:00聚餐,还有一个提醒叫您说出每日肯定语。您很强大。

NISHTHA BHATIA:好的,肯定语我们稍后再说。不过你能不能把那顿晚餐添加到我的日历里?

GEMINI:好的,我会为您在日历中添加一场晚上7:00的家庭晚宴活动。就在您的团队庆祝活动之后。

SHAHRAM IZADI:太棒了。Gemini不仅总结了她被静音的文本信息,还调用了她的日历应用来添加该活动。我们已经看到了眼镜如何与手机配合使用,但如果它们连接到你的手表上为你提供一个一瞥即见的显示屏呢?

NISHTHA BHATIA:如果没有观众合影那就不是Google I/O了,但这次我们要玩点新花样。大家能摆出自己最喜欢的姿势吗?Gemini给这些了不起的观众拍张照把它变成卡通风格。并在天空中添加一个巨大的飞艇上面用趣味色彩写着Google I/O 2026。

SHAHRAM IZADI:大家请摆好姿势。如果进展顺利请台下的各位尽情欢呼。眼镜上的Nano Banana简直太棒了。只需几秒钟你甚至就能在她的手表上看到无缝预览。随时可能出现,鼓点起,开始吧!谢谢你Nishtha。让我们为Nishtha鼓掌。演示成功了!智能眼镜的未来从未如此令人兴奋。来自标志性品牌的惊艳设计,来自Samsung的工程与工艺。来自Gemini的个性化且主动的帮助,定制化的应用以及来自Google的功能,还有开发者生态系统。全部将于今年秋季随我们的首款眼镜一同面世,敬请期待。现在我将把麦克风交给Demis由他来谈谈AI的未来。

13.赋能科学与网络安全:CodeMender API与Gemini for Science

DEMIS HASSABIS:看到我们在眼镜方面取得的巨大进步真是令人惊叹,我迫不及待想让每个人都体验到它们。今天我们向大家展示了我们的下一代模型Gemini 3.5和Omni。Antigravity 2.0中全新的编程能力,Search和Gemini Spark中的智能体以及更多精彩内容。很高兴看到Gemini正在改变数十亿人每天使用的众多Google产品。所有这些进步都展示了AI发展的惊人速度。即使对于我们这些一生都在致力于此的人来说这依然不可思议。

AGI已近在咫尺,它将成为人类历史上最深刻且有史以来最具影响力的技术。如果构建得当它将推动人类的进步与繁荣超出我们的想象。我们正处于一个充满巨大希望的时刻,但也肩负着巨大的责任。重要的是我们要对这种潜力保持清醒的认识,并利用我们所能支配的一切工具以确保我们的智能体系统以及最终AGI本身的安全。

最近备受关注的一个风险领域是网络安全。Google已在该领域投资了数十年,我们正将我们的前沿能力和深厚的专业知识用于保护全球的代码库。我们拥有Code Security Agent、CodeMender等工具,它们可以自动发现并修复关键的软件漏洞。

今天我们邀请了一批精选的专家来测试全新的CodeMender API,我们即将发布该接口并很快将其更广泛地应用。我整个职业生涯致力于AI研究的初衷,是因为我将其视为推动科学进步和探索世界的终极工具。看到这些梦想随着AI开始帮助几乎所有领域的科学家而成为现实,这种感觉太棒了。

基于这一势头我很高兴地宣布推出Gemini for Science。它汇集了多种强大的AI工具旨在帮助加速研究。Gemini已经可以协助解决复杂问题。但我们新的Labs原型简化了日常科学任务,无论是紧跟新发表的论文、将研究目标转化为可用的代码还是生成新的假设。

另一个强大的科学工具是模拟。AI模拟对于理解和预测那些在今天看来过于复杂、无法直接建模的动态系统至关重要。AlphaEarth Foundations就是一个令人惊叹的例子。它是我们目前拥有的最接近地球数字孪生的模型,能够帮助解决诸如森林砍伐和粮食安全等问题。模拟实验已经证明极其有用。我们最先进的WeatherNext模型可以比传统系统更快、更准确地预测飓风路径。让我们来看看天气预报在去年的飓风季节中是如何发挥作用的。

气象专家:热带风暴和飓风的变化可能非常迅速,这使得它们比其他类型的天气系统更难预测。在Google我们开发了WeatherNext,这是一个全球天气预报AI模型,它还能够预测飓风的走向以及它们将会变得多么强大。在2025年WeatherNext提前三天预测到一场5级飓风将袭击牙买加,其准确度高于以往的所有模型。这将造成灾难性的、威胁生命的破坏。正因为有了那次提前预警我们能够提前向公众发出通知告知他们撤离某些区域,从而挽救了他们的生命。WeatherNext是一个非常有价值的工具,帮助我们做出更准确更果断的预报。我认为展望未来WeatherNext和其他AI模型将成为我们常规预测工具包的一部分。

DEMIS HASSABIS:在未来我们将能够模拟更加复杂的涌现系统甚至可能是虚拟细胞。我们的生物模型如AlphaFold和AlphaGenome已经成为全球数百万科学家所使用的标准研究工具,用于在各自领域取得重要进展。

我喜欢将其称为数字速度的科学,这既体现在解决问题的速度上也体现在将其传播给能够利用这些成果的研究人员的速度上。我一直相信AI的第一大应用应该是改善人类健康。在Isomorphic Labs我们正在对分子相互作用进行建模,以大幅加速在新药研发领域的发展。我们目前有多个项目处于临床前阶段,包括针对免疫系统疾病和癌症的潜在疗法。我们的使命是重新构想药物研发流程,目标是有一天能攻克所有疾病。这在几年前似乎还是不可能的事情,但我深信现在已触手可及。

Google的前沿研究和产品将有助于释放AGI的巨大潜力造福全世界。当我们回首这段时光我想我们将意识到我们正站在奇点的前沿。这将是人类意义深远的时刻。这项技术将成为人类创造力的倍增器并开启科学发现与进步的新黄金时代,改善每个人的生活。我们期待着与各位共同构建未来。谢谢大家请继续享受Google I/O的后续议程。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平