Google AI · 训练

Google 发布第八代 TPU 芯片

Google 在 Cloud Next 大会上推出第八代 TPU,包含两款专用芯片,分别针对训练与推理场景优化。新芯片面向 agent 时代设计,旨在为大规模 AI 工作负载提供更高算力与能效。这是 Google 在自研 AI 硬件上的又一次重要迭代,将直接服务于 Gemini 等前沿模型的训练与部署。

域名
blog.google
评分
5 · 重大发布
发布
2026-04-22
Google 发布第八代 TPU 芯片

导读

Google 在 Cloud Next 2026 大会上发布第八代 TPU,包括 8t 和 8i 两款芯片,分别针对训练 与推理两类负载做了专门优化。这是自 TPU v1 在 2015 年上线以来的第八次硬件迭代,也是 Google 第一次把 agent 时代的工作负载特性直接写进硬件设计目标。

8t 训练芯片强化的是大规模分布式训练时的内存带宽和互连吞吐,配合 Decoupled DiLoCo 这 样的分布式训练方法可以撑住更大模型的预训练。8i 推理芯片把延迟和能效摆在首位,面向 agent 应用里频繁的小批次调用和长上下文推理。两款芯片共用 Pathways 软件栈,开发者 无需改代码即可在两种角色间切换。

外部能拿到 TPU 8 的渠道是 Google Cloud,Anthropic 早期采用方之一被点名提及。TPU 8 真 正的战略价值不只是性能数字,而是 Google 在 AI 算力基础设施上保持自主可控——Gemini 系列 的训练与服务完全跑在自研芯片上,与依赖 NVIDIA H100/B100 的同业拉开了供应链层面的差异。

原文摘要

The eighth generation of Google’s TPU includes two specialized chips that will power the future of AI.