Gemini 3 封神了,纯粹的强大

奥特曼发来贺电(说个八卦:Logan 以前是跟 Sam 的)
写这篇文章前,我把这段 Prompt 扔给了刚发布的 Gemini 3 Pro
Prompt:
「编写一个单文件 HTML 的拟真 GBA 模拟器,使用 CSS 绘制精致的紫色机身。游戏内容为《口袋妖怪》中文版回合制战斗(皮卡丘 VS 妙蛙种子),需引用 GitHub 原版像素素材并使用 Web Audio 合成音效」
自动播放
自动播放
自动播放
@YiTayML
自动播放
@skirano
当然了,你的提示词也不必是文字
自动播放
而下面这个,来自设计师藏师傅,:大厂前端,看着设计稿,figma 设计稿,他能写成这样,第一次走查的时候能写成这样,我就烧高香了

这就是今天凌晨,Google 发布的Gemini 3 。当然也不止这个哈基米3
• Gemini 3 Pro:地表最强模型,支持多模态推理、长上下文、Agentic Coding
• Google Antigravity:一个原生支持 Agent 开发的平台,管理 Agent 干活
• Generative UI:在 Google 搜索中,直接生成交互界面
• 全线落地:Android Studio、Firebase、Gemini CLI 全部接入,价格极其激进
自动播放
实打实的数值怪
先看下跑分吧,Gemini 3 Pro 在 LMArena Leaderboard 拿到了 1501 Elo,断层领先

LMArena 大模型竞技场
在各种榜单中,也是全面超越之前的王者

Gemini 3 跑分对比图
同时的,对于更长时间跨度的规划能力,Gemini 更是遥遥领先,比如这个 Vending-Bench 2 这个测试(你可以叫他做生意榜单)

Vending Bench 2
为了支撑这种执行力,Google 将思维链(Chain of Thought)做了产品化封装,引入了 Deep Think(深度思考) 模式:
• Thought Signatures(思维签名):API 返回中包含加密的“思维过程”,模型在输出前会多步推理、反思、验证。这解决了长链路逻辑中模型容易“想偏”的问题
• Thinking Levels(思考等级):开发者在 API 中配置模型“想多久”。对于简单任务选择快速响应,对于复杂逻辑选择深度思考

思考的结果
• 在 Humanity’s Last Exam(人类终极考试)中,开启 Deep Think 模式后,Gemini 3 Pro 的得分从 37.5% 飙升至 41.0%
• 在 GPQA Diamond 测试中更是达到了 93.8%。这是在没有任何外部工具辅助下,纯粹依靠模型推理达到的高度
Coding 工具
最近流行一个词:Vibe Coding,你只需要描述你想要的“感觉”(Vibe)和功能,模型就能把它实现出来
目前,Gemini 3 Pro 也是最强的 Vibe Coding 模型

遥遥领先
更牛逼的是,Google 还为此交付了两套重型生产力工具,Google Antigravity 和 Gemini CLI
全新的 Google Antigravity

Antigravity
这东西的定位,是 Agent 时代的 IDE,如果 VS Code 是为“人”设计的,Antigravity 就是为“人 + Agent”设计的
自动播放
Antigravity 作为一个全新的开发平台(MacOS/Windows/Linux 预览版),它的底层逻辑完全不同于传统 IDE:
• 任务导向(Task-Oriented):操作单元从“文件”变成了“任务”。开发者在 Inbox 中下发需求
• 多 Agent 协同:系统支持多 Agent 并行。左边开 Agent 写前端,右边开 Agent 写后端测试,中间 Agent 查文档
• 自主权(Autonomy):Agent 拥有编辑器、终端、浏览器控制权。它写完代码,自动跑终端,自动开浏览器测试,报错自己修
• Artifacts(产物):Agent 交付的不仅是对话,它生成标准化的“产物”——任务列表、实施计划、截图、代码变更
你成了 AI 的老板,去 Review 它的计划,批准它的操作,验收它的成果
更新的 Gemini CLI

Gemini CLI
npm install -g @google/gemini-cli@latest
Gemini CLI,可以理解为 Google 家的类似 Claude Code/ OpenAI Codex,一个命令行 AI 工具:
• 自然语言转 Shell:输入 gemini "找出上周我改坏的那个 git commit",它会自动解析并执行 git bisect 流程
• 系统级操作:它可以读写本地文件,重构代码,甚至通过视觉能力,解析图片并生成工程文件
Case:
官方演示中,开发者让他来做个3d的金门大桥,于是…就做好了
自动播放
Generative UI:搜索即应用
Google Search 迎来了交互层面的重大升级
自动播放
过去用户搜索“房贷计算器”,得到的是十个链接。现在 Gemini 3 在 AI Mode 下,现场为你写一个计算器

这被叫做 Generative UI(生成式用户界面):
• 动态生成:模型根据具体问题,实时编写 HTML/JS/CSS,并在前端直接渲染交互组件
• 千人千面:用户问“比较 A 和 B 两款车”,生成的是静态对比表;用户问“买哪款更划算”,生成的是可筛选、排序、高亮的交互决策工具
• 复杂模拟:用户问“三体引力如何作用”,模型直接生成物理模拟器,用户可以拖动星球观察轨道变化
话说,你觉得 Google 是不是看了我去年的文章啊
AI 的输出,不应是千篇一律的答案,而应像变色龙般适应环境。在手机上它是简洁的决策助手,在电脑前它是全面的分析工具,在嘈杂环境它侧重视觉,在运动场景它善用声音——始终以最适合当下场景的方式传递信息。
全栈生态:Android Studio 与 Firebase
Google 最核心的优势,是其庞大的开发者基建,Gemini 3 这次完成了对 Google 开发生态的底层覆盖。
Android Studio "Otter"
在最新的 Android Studio Otter 版本中,Gemini 3 Pro 被集成进了 IDE 的核心工作流,被称为 Agent Mode(代理模式)

Agent Mode
超越代码补全,你可以直接下达“重构登录模块以支持新的鉴权协议”这类模糊指令,Gemini 3 会分析整个项目结构,定位相关文件,并执行跨文件的代码修改。
生产级环境
为了支持 Agent Mode 的高频调用和长上下文需求(最高支持 100 万 Token),Google 允许开发者在 IDE 中直接绑定个人的 Gemini API Key

企业级管控
对于团队用户,IT 管理员现在可以通过 Google Cloud 控制台统一配置 Gemini 3 的访问权限,确保代码隐私符合企业合规要求
Firebase AI Logic
过去,移动端开发者要接入大模型,通常需要自己搭建后端服务来转发请求(以隐藏 API Key 并处理鉴权)。Firebase AI Logic SDK 的发布改变了这一架构

Serverless 直连
开发者现在可以通过 iOS、Android、Flutter 或 Web 的客户端 SDK 直接调用 Gemini 3 Pro Preview。Google 在 Firebase 层面托管了鉴权逻辑,开发者无需维护中间层服务器即可安全访问模型。
新增 Thought Signatures 字段
SDK 会自动处理加密的 thought_signature 字段,确保在多轮对话中,模型能够“记住”之前的推理路径。开发者无需手动解析或传递这些复杂的上下文数据,SDK 会在底层自动维护对话状态
Firebase App Check
防止 API 被未授权的客户端滥用;同时支持 Remote Config,允许开发者在不发版的情况下动态调整 Prompt 或模型参数。此外,Google 提供了专门的 AI 监控仪表盘,用于实时追踪 Token 消耗、延迟和错误率
没有废话,直接看数字
模型版本
gemini-3-pro-preview
上下文窗口
上下文:100 万 Token
最大输出:64k Token
价格策略:
• 输入:$2.00 / 100 万 Token
• 输出:$12.00 / 100 万 Token
适用于 200k 以内的上下文
多模态
可用性:
• 开发者:Google AI Studio / Vertex AI 现已开放
• 企业用户:Gemini Enterprise 集成
• 普通用户:美区 Google AI Pro/Ultra 订阅用户可在 Search 和 App 体验
总结:Google,牛逼!

