xAI · 大模型
xAI 发布 Grok 4 Fast
xAI 发布 Grok 4 Fast,该版本针对推理速度进行了优化,相比标准 Grok 4 降低了响应延迟。模型现已在 X Premium+ 订阅和 API 中上线,适用于需要快速交互的对话和 agent 场景。
- 域名
x.ai- 评分
- 5 · 重大发布
- 发布
- 2025-09-19
导读
xAI 发布 Grok 4 Fast,Grok 4 的快速变体,优化了延迟和成本。Fast 这一档定位与 OpenAI GPT-4o、Anthropic Claude Haiku 类似,面向需要高频低延迟调用的场景。
Grok 4 Fast 保留了 Grok 4 的基础架构和大部分推理能力,通过模型蒸馏和注意力优化把 推理延迟压低到 Grok 4 的 1/3,单 token 价格降到 1/4。在主流 benchmark 上分数比 4 低 5-8 分,但对高频应用来说性价比显著好转。
这一档位的实际使用场景是 RAG 检索后的答案生成、批量数据处理、客服聊天初轮、代码补 全等。xAI 通过价格优势抢占成本敏感的开发者群体,配合 X 平台数据访问形成差异化。 Grok 4 Fast 也是 xAI 第一个在 OpenRouter 上线时定价低于 GPT-4o-mini 的模型。
