API 定价

集中查看 Gemini API 各模型和相关增值服务的价格区间,方便做模型选型与预算预估。

模型定价

模型输入 (<=200K)输出 (<=200K)输入 (>200K)输出 (>200K)上下文
Gemini 3.1 Pro$2.00$12.00$4.00$18.00200K / 1M
Gemini 3.1 Flash-Lite$0.25$1.50$0.50$3.001M
Gemini 3.1 Flash$0.50$3.00$1.00$6.001M
Gemini 2.5 Pro$1.25$10.00$2.50$15.001M
Gemini 2.5 Flash$0.30$2.50$0.60$5.001M
Gemini 2.0 Flash$0.10$0.40--1M
Gemini 1.5 Pro$1.25$5.00$2.50$10.002M
Gemini 1.5 Flash$0.075$0.30$0.15$0.601M
Gemini 1.5 Flash-8B$0.0375$0.15$0.075$0.301M

其他服务定价

Imagen 4 Fast

$0.02

每张 - 快速图像生成

Imagen 4 Standard

$0.04

每张 - 标准质量图像输出

Imagen 4 Ultra

$0.06

每张 - 更高精细度图像

Veo 3.1 Standard

$0.40

每秒 - 720p-1080p 视频

Veo 3.1 Fast

$0.15

每秒 - 更快的视频生成

Gemini Embedding

$0.15

/1M - 文本向量嵌入

TTS (2.5 Flash)

$0.50

/1M - 文本转语音输入

TTS Audio Out

$10.00

/1M - 语音输出

免费额度与预算建议

Google AI Studio 为开发者提供一定的免费调用额度,适合做原型验证、功能试验和早期学习。 如果你只是想先验证模型效果,通常可以先从免费层级开始,不必一开始就进入正式付费环境。

当应用开始进入真实用户环境时,更建议按场景选模型,而不是一味追求最高阶模型。大多数场景可以先用 Flash 系列控制成本, 把少量复杂任务再交给 Pro,这样更容易在预算和效果之间取得平衡。

开发说明

API 定价 在 Gemini 接入流程中的作用

API 定价 更适合放在完整接入链路中去理解,而不是孤立阅读。对于 Gemini API 来说,开发者通常不会只靠一页文档完成所有工作,而是需要在快速入门、认证、模型选择、错误处理、安全控制和计费规则之间不断来回对照。

当前页面所覆盖的内容,更多是在帮助你补齐某一个关键环节。集中查看 Gemini API 各模型和相关增值服务的价格区间,方便做模型选型与预算预估。 如果这部分理解不够充分,前期也许能跑通,但到了业务扩容、多人协作和生产环境阶段,问题往往会逐渐放大。

阅读这类页面时,最好同时思考自己的项目状态:你是处于试验阶段、正式接入阶段,还是正在做稳定性补强。不同阶段关注的重点不同,页面里的同一段内容,在不同时间点的价值也会不同。

如果你希望当前页面的内容真正服务实际开发,建议边读边确认自己的模型、语言、部署环境和权限策略。这样再回看相关链接时,会更容易形成可执行的开发方案,而不是停留在概念层。

阅读重点

  • 单页文档更适合放回完整接入链路里理解。
  • 开发文档应服务实际项目而不是只解释名词。
  • 上线前建议把认证、异常、成本和安全一起检查。

阅读 API 定价 时可以顺手确认的细节

很多技术主题看起来像局部问题,但一旦进入真实项目,就会和模型选择、日志记录、部署环境和调用成本产生连锁关系。因此,单页文档越是基础,越值得结合整体流程去看。

如果当前主题涉及 SDK、接口格式、异常状态或鉴权方式,最好马上用自己的项目场景试着对应一遍。这样可以更快发现还有哪些缺口需要回到其他文档补齐。

对于正式商用场景,建议把文档中的默认用法进一步改造成符合自己环境的实现,例如更明确的重试策略、密钥隔离和监控记录。这样更接近长期可维护的接入方式。

看上下游关系

当前页面通常只是开发链路中的一个节点,前后内容往往同样关键。

看实际环境

浏览器试验、服务端接入和企业环境,对同一主题的要求并不完全相同。

看后续维护

越早把异常处理和权限边界想清楚,后面越容易稳定扩展。