全部教程Google Gemini 3 完全指南:模型、API、生态全景

Google Gemini 3 完全指南:模型、API、生态全景

Google 把 Gemini 3 拍上桌的当晚,AGI 战局就被重新洗了一次。

LMArena 1501、Humanity’s Last Exam 37.5%、SWE-bench Verified 76.2%、Terminal-Bench 2.0 54.2%——一个模型把推理、编码、多模态三条赛道的 SOTA 全收了,同时把 Antigravity、Gemini CLI、Gemini App、Vertex AI 一整套生态在 24 小时内全推。

这篇文章是 Gemini 3 的完整说明书:模型本身、API 接入、官方工具链、第三方平台支持、以及在你已有的 Claude Code 工作流里怎么把 Gemini 3 用起来。


1. Gemini 3 Pro 是什么

Sundar Pichai 把 Gemini 3 称作”Google 迄今最智能的模型”。它在前代 Gemini 2.5 的三个支柱(原生多模态、长上下文、agentic 能力)上做了升级,推理深度和细节理解是这次最显著的提升点。

DeepMind CEO Demis Hassabis 把这次发布称为”通向 AGI 道路上的又一重要步骤”。

1.1 基准测试成绩

基准得分含义
LMArena Leaderboard1501 Elo(榜首)综合对话排名第一
Humanity’s Last Exam37.5%极难学术推理
GPQA Diamond91.9%研究生级科学问答
MathArena Apex23.4%高难度数学竞赛
MMMU-Pro81%多模态学术理解
Video-MMMU87.6%视频理解
WebDev Arena1487 Elo(第一)网页开发实战
Terminal-Bench 2.054.2%终端 agent 任务
SWE-bench Verified76.2%真实 GitHub bug 修复

几个关键观察:

  • WebDev Arena 1487 Elo:实战写网页能力第一,超过 Claude Opus 4 系列
  • SWE-bench Verified 76.2%:实战修真实开源仓库 bug 的能力,进入第一梯队
  • MMMU-Pro 81% / Video-MMMU 87.6%:多模态全面领先

1.2 即将推出:Deep Think 模式

Gemini 3 Deep Think 在内测中:

  • Humanity’s Last ExamGPQA Diamond 进一步提升
  • ARC-AGI-2 达到 45.1%

Deep Think 走完安全评估后会优先向 Google AI Ultra 订阅者开放


2. API 接入:定价、参数、最佳实践

2.1 定价(阶梯式)

提示长度输入输出
≤ 200K tokens$2 / 百万 tokens$12 / 百万 tokens
> 200K tokens$4 / 百万 tokens$18 / 百万 tokens

比 GPT-5.1 略贵,比 Claude Sonnet 4.5 略便宜,超过 200K 长上下文价格翻倍——这点要在长会话里特别注意。

重要:Gemini API 没有 gemini-3-pro-preview 的免费层级。在 Google AI Studio 里网页交互式是免费的,API 调用必须 Paid Plan。

2.2 新参数:Thinking Level

Level说明
low最小化延迟和成本,适合简单指令、聊天、高吞吐量场景
medium即将推出(发布时不支持)
high(默认)最大化推理深度,首 token 响应时间显著延长,但输出经过更深推理

2.3 新参数:Media Resolution

媒体类型推荐分辨率最大 tokens适用场景
图像media_resolution_high1120一般图像分析饱和点
PDFmedia_resolution_medium560文档理解最优
普通视频low / medium70/帧动作识别、描述
文本密集视频media_resolution_high280/帧OCR、视频帧细节

2.4 重要建议:Temperature 不要改

Gemini 3 强烈建议 temperature 保持默认 1.0

改了它可能让模型在复杂数学或推理任务中出现循环输出性能下降——这是 Google 文档里明确的告警。


3. Gemini 应用:消费端的全面升级

Gemini 3 Pro 集成进 Gemini 应用,带来三组新能力:

3.1 更智能的推理

  • 响应更实用、格式更优、更简洁
  • 最佳 Vibe Coding 模型——在 Canvas 中构建的应用功能更完整
  • 全球最佳多模态理解模型——能处理作业照片或讲座笔记转录

3.2 实验性的生成式界面

  • Visual Layout:生成沉浸式杂志风格视图,包含照片和可交互模块
  • Dynamic View:用 Gemini 3 的 agentic coding 能力实时设计并编码定制 UI,输出可点击、可滚动的交互式体验

3.3 Gemini Agent

实验性功能,在 Gemini 内部直接处理多步骤任务:

  • 连接 Google Workspace 应用管理日历、添加提醒
  • 执行”整理收件箱”等命令
  • 基于 Project Mariner 洞察构建
  • 使用 Deep Research、Canvas、Gmail、Calendar 和实时网页浏览
  • 首发限定:美国 + 网页版 + Google AI Ultra 订阅者

3.4 模型选择器

用户需在模型选择器里选 “Thinking” 模式才能用到 Gemini 3 Pro。

额度区分

  • 免费层级:低额度
  • Google AI Plus / Pro / Ultra:更高额度
  • 美国大学生:免费 1 年 Google AI Pro(含 Gemini 3)

4. Google Antigravity:agent-first 的 IDE

Antigravity 是 Google 全新发布的 agentic 开发平台,可以理解为 Google 版的 Cursor,但走了 agent-first 的路线。

4.1 核心特性

  • Editor 界面:传统 IDE 体验
  • Manager 界面:agent 优先的任务控制中心
    • 生成、编排、观察跨多个工作区的多个 agent 并行工作
  • 支持模型组合:
    • Gemini 3 Pro(主力)
    • Anthropic Claude Sonnet 4.5
    • OpenAI GPT-OSS 模型
  • 还集成两个辅助模型:
    • Gemini 2.5 Computer Use(浏览器控制)
    • Nano Banana(图像编辑)
  • 公共预览版支持 macOS / Windows / Linux
  • 限时免费,但有速率限制(每 5 小时刷新一次)
  • 无限 Tab 补全 + 无限命令请求(Cursor 用户会羡慕)

4.2 适合谁

  • 想从 Cursor 迁移、找新工作流的开发者
  • 习惯 agent-first 思维(“先描述目标,再让 AI 自主规划”)
  • 多 agent 并行任务(前端 + 后端 + 测试同时跑)

4.3 不适合谁

  • 已经在 Claude Code 里建了完整工作流的(CLAUDE.md、子智能体、MCP 都得迁)
  • 习惯 IDE-first 的开发者

5. Gemini CLI:终端使用 Gemini 3

Gemini 3 Pro 已集成进 Gemini CLI(命令行工具),带来顶尖推理 + 编码 + 工具调用。

5.1 访问门槛

  • 立即可用:Google AI Ultra 订阅者 + 持有付费 API key 的开发者
  • 等待名单:Google AI Pro、Gemini Code Assist Standard、免费用户(专用表单申请)

5.2 启用步骤

步骤操作
1. 安装/更新npm install -g @google/gemini-cli@latest(≥ 0.16.x)
2. 开启预览/settings,把 Preview features 切到 true
3. 重启验证重启 CLI,默认就是 Gemini 3 Pro。/model 手动切,/stats 验证
4. 额度回退当日调用额度耗尽,自动回退到 Gemini 2.5 Pro

详细命令见 Gemini CLI 全指令速查手册


6. 第三方生态:全平台已上线

Gemini 3 Pro 在发布时就拿到了广泛的第三方生态支持:

  • GitHub Copilot(公开预览)
  • JetBrains IDEs(AI Chat 和 Junie)
  • Cursor
  • Manus
  • Cline
  • Replit
  • Kilo Code
  • flowith
  • Genspark
  • OpenRouter

这是 Google 这次发布里最被低估的信号——上线当天就让所有主流 AI 编码工具都接入,意味着 Gemini 3 的生态卡位远比 GPT-5.1 / Claude Opus 4 更激进。


7. 安全性:Google 迄今最安全的模型

Google 强调 Gemini 3 经过了全面安全评估:

  • 更少的谄媚性(sycophancy)
  • 更强的抗提示注入(prompt injection resistance)
  • 改进了对网络攻击等滥用行为的防护

如果你做的是企业级或面向终端用户的产品,安全性这条值得单独评估。


8. 在 Claude Code 里用 Gemini 3:OpenClaw 拼车通道

很多读者已经在用 Claude Code 当主力——CLAUDE.md、子智能体、MCP 都已经搭好。这种情况你不需要换工具,直接把 Gemini 3 接进 Claude Code 就行。

8.1 OpenClaw 原生支持

OpenClaw 拼车在 Anthropic 协议层就把 Gemini 3 路由进了 Claude Code 的 Opus 槽位:

curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x

然后在 ~/.claude/settings.json

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://cp.bizq.net",
    "ANTHROPIC_AUTH_TOKEN": "<拼车令牌>",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "claude-haiku-4-5-20251001",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5-20250929",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "gemini-3-pro-preview"
  }
}

启动 Claude Code,/model opus 即可。

8.2 模型分配建议

槽位模型用途
Haikuclaude-haiku-4-5自动补全 / 子任务
Sonnetclaude-sonnet-4-5主力代码
Opusgemini-3-pro-preview长上下文 / 推理重活 / 多模态

**为什么这样配?**Sonnet 4.5 在日常代码任务上响应快、token 便宜;遇到大型代码库分析、复杂数学、多模态时切到 Opus(实际是 Gemini 3 Pro)拿满血推理。

详细步骤见 Gemini 3 + Claude Code 配置教程


9. Deep Think 还没来:值得等吗?

Gemini 3 Deep Think 还在安全评估,ARC-AGI-2 45.1% 是一个值得期待的数字(GPT-5 大约在 30% 左右)。但发布时间未明,且会优先向 Google AI Ultra 订阅者开放。

结论:

  • 如果你做的是学术 / 推理 / 复杂规划——值得等 Deep Think
  • 如果你做的是日常开发 / Vibe Coding——Gemini 3 Pro 现在就够用

总结:Gemini 3 的三个意义

  1. 模型层:把推理、编码、多模态的 SOTA 一次性收齐,逼竞品在下一轮发布里全面追赶
  2. 产品层:Antigravity、Gemini Agent、Gemini App 同步推出,证明 Google 不仅追上了模型层,产品分发能力也在补课
  3. 生态层:GitHub Copilot、Cursor、JetBrains、Replit 同日上线,把第三方平台主导权再夺回来一些

接下来 6 个月最值得跟踪的两个变量:Deep Think 何时发布、Gemini 3 在 Vibe Coding 实战里能不能稳定跑长任务


立即开始

把 Gemini 3 接入你已有的 Claude Code 工作流:

curl -fsSL https://cp.bizq.net/setup.sh | bash -s -- claude-max-20x

按团队规模定制套餐 加微信咨询(微信号 qsobad)。


相关文章