DeepMind · 大模型

DeepMind 发布 Gemini 3 Flash

DeepMind 推出 Gemini 3 Flash，这是一款以速度为核心设计的前沿智能模型，在保持高性能的同时大幅降低了推理成本。该模型延续了 Gemini 系列在语言理解与生成上的优势，针对实时交互场景进行了优化，适合需要快速响应的应用。

域名: deepmind.google
评分: 5 · 重大发布
发布: 2025-12-17

访问项目本体

导读

DeepMind 发布 Gemini 3 Flash，Gemini 3 系列中速度与价格的甜点档位。Flash 这个名字从 Gemini 1.5 时代沿用至今，定位始终是"性能 80%、成本 20%、延迟 30%"的工程取舍。Gemini 3 Flash 在保持这条曲线的同时把质量基线整体往上推了一个等级。

和 3.1 Flash-Lite 相比，3 Flash 的复杂推理能力更接近 Pro，适合那些质量要求不能妥协但又对延迟敏感的应用场景：实时聊天助手、代码补全、文档摘要、智能搜索。原生支持工具调用和 1M token 上下文。

发布时 Google 同时把 Gemini 3 Flash 接入 Search Generative Experience，作为搜索结果里 AI 答案的底层模型。这一升级让 Google 搜索的 AI 摘要质量明显提升，延迟却没有明显上涨。开发者通过 Vertex AI 和 Gemini API 都能调用，价格大约是 Pro 的五分之一。

原文摘要

Gemini 3 Flash offers frontier intelligence built for speed at a fraction of the cost.

Back to Latest