Google Gemini 3 完全指南:模型、API、生态全景
Google 把 Gemini 3 拍上桌的当晚,AGI 战局就被重新洗了一次。
LMArena 1501、Humanity’s Last Exam 37.5%、SWE-bench Verified 76.2%、Terminal-Bench 2.0 54.2%——一个模型把推理、编码、多模态三条赛道的 SOTA 全收了,同时把 Antigravity、Gemini CLI、Gemini App、Vertex AI 一整套生态在 24 小时内全推。
这篇文章是 Gemini 3 的完整说明书:模型本身、API 接入、官方工具链、第三方平台支持、以及在你已有的 Claude Code 工作流里怎么把 Gemini 3 用起来。
1. Gemini 3 Pro 是什么
Sundar Pichai 把 Gemini 3 称作”Google 迄今最智能的模型”。它在前代 Gemini 2.5 的三个支柱(原生多模态、长上下文、agentic 能力)上做了升级,推理深度和细节理解是这次最显著的提升点。
DeepMind CEO Demis Hassabis 把这次发布称为”通向 AGI 道路上的又一重要步骤”。
1.1 基准测试成绩
| 基准 | 得分 | 含义 |
|---|---|---|
| LMArena Leaderboard | 1501 Elo(榜首) | 综合对话排名第一 |
| Humanity’s Last Exam | 37.5% | 极难学术推理 |
| GPQA Diamond | 91.9% | 研究生级科学问答 |
| MathArena Apex | 23.4% | 高难度数学竞赛 |
| MMMU-Pro | 81% | 多模态学术理解 |
| Video-MMMU | 87.6% | 视频理解 |
| WebDev Arena | 1487 Elo(第一) | 网页开发实战 |
| Terminal-Bench 2.0 | 54.2% | 终端 agent 任务 |
| SWE-bench Verified | 76.2% | 真实 GitHub bug 修复 |
几个关键观察:
- WebDev Arena 1487 Elo:实战写网页能力第一,超过 Claude Opus 4 系列
- SWE-bench Verified 76.2%:实战修真实开源仓库 bug 的能力,进入第一梯队
- MMMU-Pro 81% / Video-MMMU 87.6%:多模态全面领先
1.2 即将推出:Deep Think 模式
Gemini 3 Deep Think 在内测中:
- Humanity’s Last Exam 和 GPQA Diamond 进一步提升
- ARC-AGI-2 达到 45.1%
Deep Think 走完安全评估后会优先向 Google AI Ultra 订阅者开放。
2. API 接入:定价、参数、最佳实践
2.1 定价(阶梯式)
| 提示长度 | 输入 | 输出 |
|---|---|---|
| ≤ 200K tokens | $2 / 百万 tokens | $12 / 百万 tokens |
| > 200K tokens | $4 / 百万 tokens | $18 / 百万 tokens |
比 GPT-5.1 略贵,比 Claude Sonnet 4.5 略便宜,超过 200K 长上下文价格翻倍——这点要在长会话里特别注意。
重要:Gemini API 没有 gemini-3-pro-preview 的免费层级。在 Google AI Studio 里网页交互式是免费的,API 调用必须 Paid Plan。
2.2 新参数:Thinking Level
| Level | 说明 |
|---|---|
low | 最小化延迟和成本,适合简单指令、聊天、高吞吐量场景 |
medium | 即将推出(发布时不支持) |
high(默认) | 最大化推理深度,首 token 响应时间显著延长,但输出经过更深推理 |
2.3 新参数:Media Resolution
| 媒体类型 | 推荐分辨率 | 最大 tokens | 适用场景 |
|---|---|---|---|
| 图像 | media_resolution_high | 1120 | 一般图像分析饱和点 |
media_resolution_medium | 560 | 文档理解最优 | |
| 普通视频 | low / medium | 70/帧 | 动作识别、描述 |
| 文本密集视频 | media_resolution_high | 280/帧 | OCR、视频帧细节 |
2.4 重要建议:Temperature 不要改
Gemini 3 强烈建议
temperature保持默认1.0。
改了它可能让模型在复杂数学或推理任务中出现循环输出或性能下降——这是 Google 文档里明确的告警。
3. Gemini 应用:消费端的全面升级
Gemini 3 Pro 集成进 Gemini 应用,带来三组新能力:
3.1 更智能的推理
- 响应更实用、格式更优、更简洁
- 最佳 Vibe Coding 模型——在 Canvas 中构建的应用功能更完整
- 全球最佳多模态理解模型——能处理作业照片或讲座笔记转录
3.2 实验性的生成式界面
- Visual Layout:生成沉浸式杂志风格视图,包含照片和可交互模块
- Dynamic View:用 Gemini 3 的 agentic coding 能力实时设计并编码定制 UI,输出可点击、可滚动的交互式体验
3.3 Gemini Agent
实验性功能,在 Gemini 内部直接处理多步骤任务:
- 连接 Google Workspace 应用管理日历、添加提醒
- 执行”整理收件箱”等命令
- 基于 Project Mariner 洞察构建
- 使用 Deep Research、Canvas、Gmail、Calendar 和实时网页浏览
- 首发限定:美国 + 网页版 + Google AI Ultra 订阅者
3.4 模型选择器
用户需在模型选择器里选 “Thinking” 模式才能用到 Gemini 3 Pro。
额度区分:
- 免费层级:低额度
- Google AI Plus / Pro / Ultra:更高额度
- 美国大学生:免费 1 年 Google AI Pro(含 Gemini 3)
4. Google Antigravity:agent-first 的 IDE
Antigravity 是 Google 全新发布的 agentic 开发平台,可以理解为 Google 版的 Cursor,但走了 agent-first 的路线。
4.1 核心特性
- Editor 界面:传统 IDE 体验
- Manager 界面:agent 优先的任务控制中心
- 生成、编排、观察跨多个工作区的多个 agent 并行工作
- 支持模型组合:
- Gemini 3 Pro(主力)
- Anthropic Claude Sonnet 4.5
- OpenAI GPT-OSS 模型
- 还集成两个辅助模型:
- Gemini 2.5 Computer Use(浏览器控制)
- Nano Banana(图像编辑)
- 公共预览版支持 macOS / Windows / Linux
- 限时免费,但有速率限制(每 5 小时刷新一次)
- 无限 Tab 补全 + 无限命令请求(Cursor 用户会羡慕)
4.2 适合谁
- 想从 Cursor 迁移、找新工作流的开发者
- 习惯 agent-first 思维(“先描述目标,再让 AI 自主规划”)
- 多 agent 并行任务(前端 + 后端 + 测试同时跑)
4.3 不适合谁
- 已经在 Claude Code 里建了完整工作流的(CLAUDE.md、子智能体、MCP 都得迁)
- 习惯 IDE-first 的开发者
5. Gemini CLI:终端使用 Gemini 3
Gemini 3 Pro 已集成进 Gemini CLI(命令行工具),带来顶尖推理 + 编码 + 工具调用。
5.1 访问门槛
- 立即可用:Google AI Ultra 订阅者 + 持有付费 API key 的开发者
- 等待名单:Google AI Pro、Gemini Code Assist Standard、免费用户(专用表单申请)
5.2 启用步骤
| 步骤 | 操作 |
|---|---|
| 1. 安装/更新 | npm install -g @google/gemini-cli@latest(≥ 0.16.x) |
| 2. 开启预览 | /settings,把 Preview features 切到 true |
| 3. 重启验证 | 重启 CLI,默认就是 Gemini 3 Pro。/model 手动切,/stats 验证 |
| 4. 额度回退 | 当日调用额度耗尽,自动回退到 Gemini 2.5 Pro |
详细命令见 Gemini CLI 全指令速查手册。
6. 第三方生态:全平台已上线
Gemini 3 Pro 在发布时就拿到了广泛的第三方生态支持:
- GitHub Copilot(公开预览)
- JetBrains IDEs(AI Chat 和 Junie)
- Cursor
- Manus
- Cline
- Replit
- Kilo Code
- flowith
- Genspark
- OpenRouter
这是 Google 这次发布里最被低估的信号——上线当天就让所有主流 AI 编码工具都接入,意味着 Gemini 3 的生态卡位远比 GPT-5.1 / Claude Opus 4 更激进。
7. 安全性:Google 迄今最安全的模型
Google 强调 Gemini 3 经过了全面安全评估:
- 更少的谄媚性(sycophancy)
- 更强的抗提示注入(prompt injection resistance)
- 改进了对网络攻击等滥用行为的防护
如果你做的是企业级或面向终端用户的产品,安全性这条值得单独评估。
8. 在 Claude Code 里用 Gemini 3:OpenClaw 拼车通道
很多读者已经在用 Claude Code 当主力——CLAUDE.md、子智能体、MCP 都已经搭好。这种情况你不需要换工具,直接把 Gemini 3 接进 Claude Code 就行。
8.1 OpenClaw 原生支持
OpenClaw 拼车在 Anthropic 协议层就把 Gemini 3 路由进了 Claude Code 的 Opus 槽位:
curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x然后在 ~/.claude/settings.json:
{
"env": {
"ANTHROPIC_BASE_URL": "https://cp.bizq.net",
"ANTHROPIC_AUTH_TOKEN": "<拼车令牌>",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "claude-haiku-4-5-20251001",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5-20250929",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "gemini-3-pro-preview"
}
}启动 Claude Code,/model opus 即可。
8.2 模型分配建议
| 槽位 | 模型 | 用途 |
|---|---|---|
| Haiku | claude-haiku-4-5 | 自动补全 / 子任务 |
| Sonnet | claude-sonnet-4-5 | 主力代码 |
| Opus | gemini-3-pro-preview | 长上下文 / 推理重活 / 多模态 |
**为什么这样配?**Sonnet 4.5 在日常代码任务上响应快、token 便宜;遇到大型代码库分析、复杂数学、多模态时切到 Opus(实际是 Gemini 3 Pro)拿满血推理。
详细步骤见 Gemini 3 + Claude Code 配置教程。
9. Deep Think 还没来:值得等吗?
Gemini 3 Deep Think 还在安全评估,ARC-AGI-2 45.1% 是一个值得期待的数字(GPT-5 大约在 30% 左右)。但发布时间未明,且会优先向 Google AI Ultra 订阅者开放。
结论:
- 如果你做的是学术 / 推理 / 复杂规划——值得等 Deep Think
- 如果你做的是日常开发 / Vibe Coding——Gemini 3 Pro 现在就够用
总结:Gemini 3 的三个意义
- 模型层:把推理、编码、多模态的 SOTA 一次性收齐,逼竞品在下一轮发布里全面追赶
- 产品层:Antigravity、Gemini Agent、Gemini App 同步推出,证明 Google 不仅追上了模型层,产品分发能力也在补课
- 生态层:GitHub Copilot、Cursor、JetBrains、Replit 同日上线,把第三方平台主导权再夺回来一些
接下来 6 个月最值得跟踪的两个变量:Deep Think 何时发布、Gemini 3 在 Vibe Coding 实战里能不能稳定跑长任务。
立即开始
把 Gemini 3 接入你已有的 Claude Code 工作流:
curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x按团队规模定制套餐 加微信咨询(微信号 qsobad)。
相关文章
- Gemini 3 + Claude Code 配置教程 — 在 CC 里跑 Gemini 3 的完整步骤
- Gemini 3 官方使用姿势 — 7 种官方渠道横评
- Gemini CLI 全指令速查手册 — Gemini CLI 完整命令参考
- Gemini CLI 能代替 Claude Code 吗? — 工具对比