DeepMind · 安全

DeepMind 发布 Gemma Scope 2 可解释性工具

DeepMind 发布了 Gemma Scope 2，一套面向 Gemma 3 全系列模型的开源可解释性工具。该项目旨在帮助 AI 安全社区更深入地理解复杂语言模型的内部行为，通过提供稀疏自编码器与激活分析接口，让研究者能够观察模型在推理过程中的神经元响应模式。这是继第一代 Gemma Scope 之后，对可解释性基础设施的重要扩展。

域名: deepmind.google
评分: 4 · 重要更新
发布: 2025-12-16

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

原文摘要

Open interpretability tools for language models are now available across the entire Gemma 3 family with the release of Gemma Scope 2.

Back to Latest