API 定价
集中查看 Gemini API 各模型和相关增值服务的价格区间,方便做模型选型与预算预估。
模型定价
| 模型 | 输入 (<=200K) | 输出 (<=200K) | 输入 (>200K) | 输出 (>200K) | 上下文 |
|---|---|---|---|---|---|
| Gemini 3.1 Pro | $2.00 | $12.00 | $4.00 | $18.00 | 200K / 1M |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.50 | $3.00 | 1M |
| Gemini 3.1 Flash | $0.50 | $3.00 | $1.00 | $6.00 | 1M |
| Gemini 2.5 Pro | $1.25 | $10.00 | $2.50 | $15.00 | 1M |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.60 | $5.00 | 1M |
| Gemini 2.0 Flash | $0.10 | $0.40 | - | - | 1M |
| Gemini 1.5 Pro | $1.25 | $5.00 | $2.50 | $10.00 | 2M |
| Gemini 1.5 Flash | $0.075 | $0.30 | $0.15 | $0.60 | 1M |
| Gemini 1.5 Flash-8B | $0.0375 | $0.15 | $0.075 | $0.30 | 1M |
其他服务定价
Imagen 4 Fast
$0.02
每张 - 快速图像生成
Imagen 4 Standard
$0.04
每张 - 标准质量图像输出
Imagen 4 Ultra
$0.06
每张 - 更高精细度图像
Veo 3.1 Standard
$0.40
每秒 - 720p-1080p 视频
Veo 3.1 Fast
$0.15
每秒 - 更快的视频生成
Gemini Embedding
$0.15
/1M - 文本向量嵌入
TTS (2.5 Flash)
$0.50
/1M - 文本转语音输入
TTS Audio Out
$10.00
/1M - 语音输出
免费额度与预算建议
Google AI Studio 为开发者提供一定的免费调用额度,适合做原型验证、功能试验和早期学习。 如果你只是想先验证模型效果,通常可以先从免费层级开始,不必一开始就进入正式付费环境。
当应用开始进入真实用户环境时,更建议按场景选模型,而不是一味追求最高阶模型。大多数场景可以先用 Flash 系列控制成本, 把少量复杂任务再交给 Pro,这样更容易在预算和效果之间取得平衡。
API 定价 在 Gemini 接入流程中的作用
API 定价 更适合放在完整接入链路中去理解,而不是孤立阅读。对于 Gemini API 来说,开发者通常不会只靠一页文档完成所有工作,而是需要在快速入门、认证、模型选择、错误处理、安全控制和计费规则之间不断来回对照。
当前页面所覆盖的内容,更多是在帮助你补齐某一个关键环节。集中查看 Gemini API 各模型和相关增值服务的价格区间,方便做模型选型与预算预估。 如果这部分理解不够充分,前期也许能跑通,但到了业务扩容、多人协作和生产环境阶段,问题往往会逐渐放大。
阅读这类页面时,最好同时思考自己的项目状态:你是处于试验阶段、正式接入阶段,还是正在做稳定性补强。不同阶段关注的重点不同,页面里的同一段内容,在不同时间点的价值也会不同。
如果你希望当前页面的内容真正服务实际开发,建议边读边确认自己的模型、语言、部署环境和权限策略。这样再回看相关链接时,会更容易形成可执行的开发方案,而不是停留在概念层。
阅读 API 定价 时可以顺手确认的细节
很多技术主题看起来像局部问题,但一旦进入真实项目,就会和模型选择、日志记录、部署环境和调用成本产生连锁关系。因此,单页文档越是基础,越值得结合整体流程去看。
如果当前主题涉及 SDK、接口格式、异常状态或鉴权方式,最好马上用自己的项目场景试着对应一遍。这样可以更快发现还有哪些缺口需要回到其他文档补齐。
对于正式商用场景,建议把文档中的默认用法进一步改造成符合自己环境的实现,例如更明确的重试策略、密钥隔离和监控记录。这样更接近长期可维护的接入方式。
看上下游关系
当前页面通常只是开发链路中的一个节点,前后内容往往同样关键。
看实际环境
浏览器试验、服务端接入和企业环境,对同一主题的要求并不完全相同。
看后续维护
越早把异常处理和权限边界想清楚,后面越容易稳定扩展。