外界还在消化最近一周的 Gemini 3 Deep Think、Opus 和 Sonnet 4.6、GLM-5、Minimax M2.5 等重磅更新时,今天,Google 又毫无预兆地掷除了最新核弹——升级版核心模型 Gemini 3.1 Pro 正式发布,并全面接入旗下消费级与开发者生态。
Gemini 3.1 Pro 的核心叙事非常清晰:专为复杂任务而生,将机器推理能力推向了前所未有的极境。
但需要指出的是:作为一个「.1」更新,Gemini 3.1 Pro 模型在「抽象推理解谜」类型的 ARC-AGI-2 基准测试中,居然拿到了比 3 Pro 高出整整一倍的成绩……(x26lt;a class=x26quot;wx_img_refer_linkx26quot; data-seq=x26quot;1x26quot; data-refer=x26quot;图一x26quot; style=x26quot;x26quot;x26gt;图一x26lt;/ax26gt;)
——有理由相信,主要原因可能不在于真有多么大的突破,而是测试集很有可能出现在了训练集里……
其它方面,Gemini 3.1 Pro 在科学知识测试 GPQA Diamond 上拿了 94.3%,智能体类基准 MCP Atlas 和 BrowseComp 分别拿下 69.2% 和 85.9%,高于 Anthropic 和 OpenAI 同级模型。(x26lt;a class=x26quot;wx_img_refer_linkx26quot; data-seq=x26quot;2x26quot; data-refer=x26quot;图二x26quot; style=x26quot;x26quot;x26gt;图二x26lt;/ax26gt;)
Google 大佬 Jeff Dean 也转发了一个使用 Gemini 3.1 Pro 模拟城市规划、设计全新城市的应用,从零生成可交互的规划界面 demo。(x26lt;a class=x26quot;wx_img_refer_linkx26quot; data-seq=x26quot;3x26quot; data-refer=x26quot;图三x26quot; style=x26quot;x26quot;x26gt;图三x26lt;/ax26gt;)这体现了 Gemini 3.1 Pro 强大的代码生成和复杂逻辑处理能力。
Google 官方展示了一个 demo,让模型直接接入公开遥测数据流,搭出了一个实时追踪国际空间站轨道的酷炫网页(x26lt;a class=x26quot;wx_img_refer_linkx26quot; data-seq=x26quot;4x26quot; data-refer=x26quot;图四x26quot; style=x26quot;x26quot;x26gt;图四x26lt;/ax26gt;)
Google AI Pro 与 Ultra 订阅用户已经可以使用 3.1 Pro 模型,并且使用限额比此前更高。另外在 Gemini 产品当中,3.1 Pro 模型也加入了音乐生成能力。不过爱范儿测试了几次音乐生成,一直失败。
价格方面,API 按分级付费,整体和上代 3 Pro 保持一致,但跟 Anthropic Opus 系列比还是相对便宜的。
开发者可以在 AI Studio、Gemini API、Gemini CLI、智能体开发平台 Antigravity 上,企业用户在 Vertex AI 和 Gemini Enterprise 调用 3.1 Pro 模型。
最后,该发的都发了……DeepSeek 啥时候出来再一次杀死游戏呢?

