DeepMind · 大模型

DeepMind 发布 Gemini 3 Flash

DeepMind 推出 Gemini 3 Flash,这是一款以速度为核心设计的前沿智能模型,在保持高性能的同时大幅降低了推理成本。该模型延续了 Gemini 系列在语言理解与生成上的优势,针对实时交互场景进行了优化,适合需要快速响应的应用。

域名
deepmind.google
评分
5 · 重大发布
发布
2025-12-17
DeepMind 发布 Gemini 3 Flash

导读

DeepMind 发布 Gemini 3 Flash,Gemini 3 系列中速度与价格的甜点档位。Flash 这个名字从 Gemini 1.5 时代沿用至今,定位始终是"性能 80%、成本 20%、延迟 30%"的工程取舍。Gemini 3 Flash 在保持这条曲线的同时把质量基线整体往上推了一个等级。

和 3.1 Flash-Lite 相比,3 Flash 的复杂推理能力更接近 Pro,适合那些质量要求不能妥协 但又对延迟敏感的应用场景:实时聊天助手、代码补全、文档摘要、智能搜索。原生支持工具 调用和 1M token 上下文。

发布时 Google 同时把 Gemini 3 Flash 接入 Search Generative Experience,作为搜索结果 里 AI 答案的底层模型。这一升级让 Google 搜索的 AI 摘要质量明显提升,延迟却没有明显 上涨。开发者通过 Vertex AI 和 Gemini API 都能调用,价格大约是 Pro 的五分之一。

原文摘要

Gemini 3 Flash offers frontier intelligence built for speed at a fraction of the cost.