xAI · 大模型

xAI 发布 Grok 3 Beta

xAI 正式推出 Grok 3 测试版,强调推理能力的跃升。新模型在前代基础上强化了逻辑推理、多步骤问题解决和 agent 式任务执行,能够自主拆解复杂指令并逐步验证结果。Grok 3 Beta 的发布标志着 xAI 从对话助手向推理 agent 平台过渡,为后续更高级的自主智能体奠定了基础。

域名
x.ai
评分
5 · 重大发布
发布
2025-02-19
xAI 发布 Grok 3 Beta

导读

xAI 发布 Grok 3 Beta,自称"推理 agent 时代"的开始。Grok 3 是 Grok 系列第一个在测试 时计算(test-time compute)上做大投入的版本,引入 Think 和 Big Brain 两种推理模式, 对位 OpenAI o 系列。

Think 模式让模型在回答前进行可见的链式推理,速度变慢但准确率提升明显,特别在数学、 逻辑、代码 debug 上效果显著。Big Brain 模式则使用更多计算资源做更深推理,适合极难 的问题。两种模式都通过 grok.com 和 X 客户端开放给订阅用户。

Grok 3 的关键意义在于把 xAI 从"追赶者"变成"参与者"——之前 Grok 1/2 都被认为是同代 落后产品,3 这一代在 LMSys Arena 和多项独立评测上首次和 GPT/Claude 同档位竞争。从 Grok 3 起,xAI 在 LLM 圈才开始被认真当作四巨头之一来讨论。