Google AI · 训练

Google 发布第八代 TPU 芯片

Google 在 Cloud Next 大会上推出第八代 TPU，包含两款专用芯片，分别针对训练与推理场景优化。新芯片面向 agent 时代设计，旨在为大规模 AI 工作负载提供更高算力与能效。这是 Google 在自研 AI 硬件上的又一次重要迭代，将直接服务于 Gemini 等前沿模型的训练与部署。

域名: blog.google
评分: 5 · 重大发布
发布: 2026-04-22

访问项目本体

导读

Google 在 Cloud Next 2026 大会上发布第八代 TPU，包括 8t 和 8i 两款芯片，分别针对训练与推理两类负载做了专门优化。这是自 TPU v1 在 2015 年上线以来的第八次硬件迭代，也是 Google 第一次把 agent 时代的工作负载特性直接写进硬件设计目标。

8t 训练芯片强化的是大规模分布式训练时的内存带宽和互连吞吐，配合 Decoupled DiLoCo 这样的分布式训练方法可以撑住更大模型的预训练。8i 推理芯片把延迟和能效摆在首位，面向 agent 应用里频繁的小批次调用和长上下文推理。两款芯片共用 Pathways 软件栈，开发者无需改代码即可在两种角色间切换。

外部能拿到 TPU 8 的渠道是 Google Cloud，Anthropic 早期采用方之一被点名提及。TPU 8 真正的战略价值不只是性能数字，而是 Google 在 AI 算力基础设施上保持自主可控——Gemini 系列的训练与服务完全跑在自研芯片上，与依赖 NVIDIA H100/B100 的同业拉开了供应链层面的差异。

原文摘要

The eighth generation of Google’s TPU includes two specialized chips that will power the future of AI.

Back to Latest