AI模型

谷歌的 AI 能力建立在一系列模型之上，覆盖推理、多模态、端侧、创作与专业行业场景。

模型目录

先判断任务，再选模型路线

模型对比

模型页不只是列表，它更像一个选型总控台。你可以先判断自己更在意推理上限、响应速度、多模态输入、端侧运行还是行业专业性，再进入对应分组继续看。

每张卡片保留五行摘要和三个标签，方便快速区分定位、能力边界与适用任务；如果要做团队选型，建议结合模型对比页、API 模型页和订阅页一起看。

先看旗舰模型

如果你做研究、复杂规划、代码协作或高价值问答，先看 Pro 系列，能更快理解能力上限。

先看默认主力

如果你做聊天、摘要、批处理和大规模接口调用，优先看 Flash 系列，更容易兼顾速度和成本。

再看专业模型

当任务转向图像、视频、语音、医疗或开源部署，再从更多模型组里挑更贴合的专门入口。

Gemini 系列（核心多模态模型）

围绕推理、多模态、端侧与实时交互形成完整谱系，适合从原型验证到生产落地的不同阶段。

Gemini 3.5

- Gemini 3.5 Flash 已于 Google I/O 2026 正式发布。
- 重点强化 Agent、编码、长任务规划与工具协同。
- 支持文本、图像、视频、音频与 PDF 输入。
- 提供 1M 输入上下文与最高 64K 文本输出。
- 3.5 Pro 仍处于官方预告阶段，尚未正式开放。

正式发布Agent1M上下文

Gemini 2.5 Pro

- 旗舰级推理模型，复杂任务表现稳定。
- Deep Think 模式适合长链路分析与规划。
- 支持超长上下文，便于处理大文档和代码库。
- 在数学、科学、编程类基准中持续领先。
- 适合高价值问答、研究和复杂开发协作。

旗舰深度推理长上下文

Gemini 2.5 Flash

- 面向高频调用场景的高效主力模型。
- 速度、成本与质量保持均衡，易于批量接入。
- 支持思维预算控制，便于精细化分配算力。
- 适合聊天、摘要、分类、轻量推理等任务。
- 常用于 API 默认模型和高并发业务入口。

高效低成本高并发

Gemini 2.0 Flash

- 原生多模态模型，兼顾文本、图像与工具调用。
- 支持图像生成、代理执行和实时响应体验。
- 适合构建需要多输入协同的应用流程。
- 在交互性与生产效率之间保持良好平衡。
- 常见于助手、创作和流程自动化场景。

多模态Agent工具调用

Gemini 3.1 Pro

- 当前站内已整理的高阶旗舰模型，综合能力进一步增强。
- 在代码、推理与复杂决策任务上更稳健。
- 支持更细致的上下文理解与多步执行。
- 适合企业级分析、创作和自动化工作流。
- 适用于对效果上限要求更高的关键任务。

旗舰高质量Agent

Gemini 3.1 Flash

- 新一代高效模型，响应速度表现突出。
- 支持大上下文处理与原生音频交互能力。
- 适合实时助手、客服和前台交互应用。
- 比旗舰模型更容易控制成本与时延。
- 适合需要速度优先的大规模调用场景。

Gemini Nano

- 面向移动设备与边缘终端的轻量模型。
- 支持设备本地运行，降低网络依赖。
- 在隐私敏感场景中具备更高可控性。
- 适合离线摘要、键盘建议和本地智能能力。
- 常用于手机、可穿戴设备与嵌入式终端。

端侧隐私离线

Nano Banana

- 面向图像编辑与内容再创作的热门模型。
- 擅长局部修改、风格调整与细节保留。
- 适合社媒图、海报、电商图等快速制作。
- 能根据指令进行多轮细化和视觉修正。
- 更适合创意团队和内容生产场景。

图像编辑热点创意出图

Gemini Omni

- 统一视频模型，强调生成与编辑一体化。
- 支持对话式剪辑、模板套用与镜头调整。
- 可结合音频生成形成更完整的输出链路。
- 适合营销视频、教程视频和演示片段制作。
- 更适用于强调可控镜头语言的创作流程。

视频生成多模态编辑

把模型、调用方式和预算放在一起看

- 面向生产接入时，建议把模型页与 `API 模型列表`、`Node.js SDK`、`安全指南` 联动阅读。
- 如果你还不确定是否需要更高档位能力，可以继续看 `订阅计划` 页对照升级路径。
- 如果你想先试效果，再写代码，通常从 `Google AI Studio` 开始效率更高。

API 模型列表

从调用参数和能力范围角度继续确认模型差异。

Google AI Studio

先把模型效果跑出来，再决定是否进入正式开发。

订阅计划

把使用门槛、价格层级和高级能力一起纳入判断。

模型导览

Google AI 模型体系如何理解

Google AI 的模型体系不是一条单线，而是围绕推理强度、响应速度、多模态输入、端侧运行和成本效率形成多层组合。真正有用的阅读方式，不是先记住名称，而是先判断自己面对的是复杂分析、日常问答、内容创作、编程协作还是设备本地任务。

如果任务强调长文档阅读、复杂规划、代码理解或高质量最终输出，通常应优先看 Pro 路线；如果任务更看重速度、调用频率和成本控制，则 Flash 系列更容易成为长期主力。端侧、隐私、本地离线和轻量场景，则需要继续关注 Nano 或开源路线。

模型目录的重要性，在于它把抽象的模型名称翻译成可比较的能力边界。上下文长度、多模态支持、速度、调用入口和典型任务之间的关系越清晰，后续接入、试用和升级时的判断就越稳定。

阅读模型页时，建议同时结合功能页、API 文档和订阅页。模型页负责解释能力基础，功能页负责解释使用方式，API 文档负责解释接入方法，订阅页则帮助判断不同层级的使用门槛和资源投入。

阅读重点

先按任务复杂度筛模型，再看速度和成本。
长上下文、多模态和稳定性通常需要一起判断。
模型、功能、API、订阅四类页面适合联动阅读。

延伸阅读

模型对比 Gemini 2.5 Pro Gemini 2.5 Flash API 文档

模型选型时最值得补充理解的内容

模型选择通常不是一次性动作，而是随着任务复杂度、团队规模和调用频率不断调整。很多项目在原型阶段用的是一个模型，但到了稳定运行阶段，会逐步把旗舰模型、速度型模型和特定模态模型分配到不同环节。

如果你经常处理资料总结、研究分析、图文理解、视频创作或代码辅助，最好不要只关注单一指标。模型真正的差别，往往体现在长任务中的稳定度、多轮追问下的上下文保持，以及面对复杂输入时的输出组织能力。

对普通用户来说，模型页也能帮助理解为什么不同产品入口体验会出现差异。很多时候，看起来像同一类 AI 功能，背后实际依赖的是不同档位的模型能力，因此阅读模型页本身就能减少很多模糊判断。

先看任务形态

先判断是研究、创作、编程、客服还是日常问答，再进入对应模型路线。

再看资源约束

预算、响应速度、调用频率和部署方式，往往会直接影响模型是否适合长期使用。

最后看组合方式

很多真实工作流并不是单模型完成，而是多模型分工协作。