xAI · 大模型

xAI 发布 Grok 3 Beta

xAI 正式推出 Grok 3 测试版，强调推理能力的跃升。新模型在前代基础上强化了逻辑推理、多步骤问题解决和 agent 式任务执行，能够自主拆解复杂指令并逐步验证结果。Grok 3 Beta 的发布标志着 xAI 从对话助手向推理 agent 平台过渡，为后续更高级的自主智能体奠定了基础。

导读

xAI 发布 Grok 3 Beta，自称"推理 agent 时代"的开始。Grok 3 是 Grok 系列第一个在测试时计算（test-time compute）上做大投入的版本，引入 Think 和 Big Brain 两种推理模式，对位 OpenAI o 系列。

Think 模式让模型在回答前进行可见的链式推理，速度变慢但准确率提升明显，特别在数学、逻辑、代码 debug 上效果显著。Big Brain 模式则使用更多计算资源做更深推理，适合极难的问题。两种模式都通过 grok.com 和 X 客户端开放给订阅用户。

Grok 3 的关键意义在于把 xAI 从"追赶者"变成"参与者"——之前 Grok 1/2 都被认为是同代落后产品，3 这一代在 LMSys Arena 和多项独立评测上首次和 GPT/Claude 同档位竞争。从 Grok 3 起，xAI 在 LLM 圈才开始被认真当作四巨头之一来讨论。