长上下文
支持高达 200 万 Token 的上下文窗口,处理海量信息
技术突破
Gemini 1.5 Pro 支持高达 200 万 Token 的上下文窗口,是当时业界最大的上下文长度之一。 这意味着模型可以一次性处理相当于 900 页 PDF 文档、1 小时视频或大型代码库的内容。
长上下文能力使得 Gemini 可以进行深度文档分析、长视频理解、 大型代码库审查和多轮深度对话,无需对内容进行切分处理。
900 页 PDF
一次性处理整本书籍
1 小时视频
完整视频内容分析
大型代码库
百万行代码审查
海量数据
复杂数据集分析
上下文缓存
Gemini 1.5 Pro 和 Flash 支持上下文缓存(Context Caching)功能。 对于需要反复引用同一大型文档的场景,可以将文档内容缓存起来, 后续查询只需发送新的问题部分,大幅降低 API 调用成本(最高可节省 90%)。
长上下文 能解决什么问题
长上下文 更重要的作用,不是告诉你它“听起来很强”,而是帮助你判断它到底适合什么场景、能节省哪些步骤,以及和其他能力之间如何配合。只有把这些问题讲清楚,用户才更容易把当前能力放进真实工作流。
这类页面越具体,越容易帮助你做判断。支持高达 200 万 Token 的上下文窗口,处理海量信息 当页面能把适合的任务、使用边界、典型入口和延伸路径讲明白后,用户就更知道该如何使用它,而不是只停留在概念印象。
阅读功能详情页时,最好同时思考它更适合做前期探索、持续协作、最终输出还是流程自动化。不同能力在同一任务中的位置并不一样,理解这一点之后,很多看似相近的功能差别会更容易看清。
如果你已经知道这项能力有价值,下一步最值得做的是继续查看相关教程和使用入口,把它从“知道存在”推进到“能稳定使用”。
把 长上下文 放进工作流时可以怎么想
单项能力往往最适合某一种环节,而不是所有环节都适合。例如有些能力擅长前期探索,有些擅长持续互动,有些擅长结构化整理,有些擅长最终交付。
如果你把 长上下文 放在不合适的位置,可能会感觉效果一般;但一旦放在更契合的任务环节,它的价值往往会非常明显。理解这一点,通常比追求更多功能更重要。
继续阅读时,建议把当前能力与模型页、教程页和具体产品入口结合起来看。这样更容易从能力本身,延伸到真正可用的工作方式。
找准环节
先判断当前能力更适合探索、整理、互动、创作还是执行。
搭配其他能力
单项能力常常需要与模型、教程或产品入口一起使用才更完整。
关注长期可用性
最有价值的能力通常是能反复进入日常任务的能力。