Latest · AI 最新动态 — Field Notes

Snapshotbuilt 2026-05-17 · refreshed every 6 hours

225 items

AI Labs · 厂商一手发布

102 items

OpenAI、Anthropic、DeepMind、Google AI、NVIDIA、Mistral、Meta AI、xAI 的官方公告，覆盖新模型与新能力发布。

Mistral大模型2026-03-16
Mistral 发布 Mistral Small 4
Mistral 推出 Mistral Small 4，一款面向低延迟与本地部署场景的轻量级语言模型。该模型在保持较小参数规模的同时，优化了推理速度与多语言能力，适合在边缘设备或资源受限环境中运行。Mistral Small 4 延续了 Mistral 系列高效、开放的路线，为开发者提供了又一个兼顾性能与部署灵活性的选择。
阅读详情
Meta AI大模型2026-05-17
Meta AI 发布 Muse Spark 模型
Meta AI 推出 Muse Spark，一款面向个人超级智能场景的新模型。该模型在推理、多模态理解和个性化交互方面进行了深度优化，旨在让 AI 更贴近个人用户的实际需求。Muse Spark 的发布标志着 Meta 在通用智能与个性化之间寻找平衡的重要一步，也为未来个人 AI 助手的发展提供了新的技术方向。
阅读详情
Meta AI其他2026-05-17
Meta 两年内推出四款 MTIA 芯片
Meta 自研的 AI 加速芯片 MTIA 在过去两年间已推出四款，涵盖训练与推理场景。这些芯片专为 Meta 的社交网络、推荐系统及生成式 AI 工作负载设计，旨在以更低功耗提供更高算力。最新一代芯片在性能与能效上均有显著提升，帮助 Meta 在数十亿用户规模的 AI 应用中降低成本、提升响应速度。
阅读详情
xAI大模型2025-11-19
xAI 发布 Grok 4.1 Fast 与 Agent Tools API
xAI 推出 Grok 4.1 Fast，这是 Grok 系列的最新快速推理版本，同时开放了 Agent Tools API，允许开发者将 Grok 的对话与工具调用能力集成到自主 agent 工作流中。新模型在推理速度和指令遵循上做了针对性优化，API 支持函数调用、代码执行和外部数据检索，为构建端到端 agent 应用提供了更直接的入口。
阅读详情
xAI大模型2025-11-17
xAI 发布 Grok 4.1
xAI 正式推出 Grok 4.1，这是其最新一代语言模型。新模型。新版本在推理、编程和指令遵循等核心能力上均有提升，并优化了长上下文处理与多轮对话表现。Grok 4.1 的发布为开发者与用户提供了更强大的 AI 交互基础。
阅读详情
xAI大模型2025-09-19
xAI 发布 Grok 4 Fast
xAI 发布 Grok 4 Fast，该版本针对推理速度进行了优化，相比标准 Grok 4 降低了响应延迟。模型现已在 X Premium+ 订阅和 API 中上线，适用于需要快速交互的对话和 agent 场景。
阅读详情
xAI大模型2025-07-09
xAI 发布 Grok 4
xAI 正式发布 Grok 4，这是其新一代大语言模型，在推理、编码和指令遵循方面相比前代有显著提升。Grok 4 采用更大规模的训练数据和优化架构，支持更长的上下文窗口，并增强了多轮对话的连贯性。该模型目前已在 xAI 平台上开放使用，后续将逐步集成到更多应用中。
阅读详情
xAI大模型2025-02-19
xAI 发布 Grok 3 Beta
xAI 正式推出 Grok 3 测试版，强调推理能力的跃升。新模型在前代基础上强化了逻辑推理、多步骤问题解决和 agent 式任务执行，能够自主拆解复杂指令并逐步验证结果。Grok 3 Beta 的发布标志着 xAI 从对话助手向推理 agent 平台过渡，为后续更高级的自主智能体奠定了基础。
阅读详情
xAI大模型2024-12-12
xAI 向所有用户开放 Grok
xAI 宣布将 Grok 开放给所有用户，不再局限于 X Premium 订阅者。Grok 是 xAI 开发的大语言模型，以对话模型，以实时信息获取和幽默风格为特色。此次开放意味着更广泛的用户群体可以直接体验 Grok 的问答能力，无需付费订阅 X 平台。xAI 此举旨在扩大用户基础，并收集更多反馈以持续改进模型性能。
阅读详情
xAI图像模型2024-12-09
xAI 发布 Grok 图像生成功能
xAI 在 Grok 中加入了图像生成能力，用户可通过文字描述实时生成图片。该功能基于自研模型，并融入了对话上下文理解，使生成的图像更贴合用户意图。此次更新让 Grok 从纯文本模型扩展至多模态交互，为用户提供了更丰富的表达方式。
阅读详情
xAI大模型2024-08-13
xAI 发布 Grok-2 测试版
xAI 推出 Grok-2 测试版，这是其第二代大语言模型，在推理、编码和指令跟随方面较前代有显著提升。Grok-2 同时具备图像理解能力，可处理视觉输入并生成回答，扩展了多模态交互场景。该模型已在 X 平台上对 Premium 用户开放体验，xAI 还同步提供了 API 接口供开发者接入。
阅读详情
Mistral大模型2026-04-29
Mistral 发布 Mistral Medium 3.5 及 Vibe 远程 Agent
Mistral 发布 Mistral Medium 3.5 模型，并将其直接整合到 Vibe 平台中，提供远程编码 Agent 能力，开发者可通过自然语言描述在云端执行代码编写与调试等任务。同时，Le Chat 新增 Work mode，针对需要多步推理的复杂任务优化了上下文处理与对话管理。
阅读详情

查看全部 102 条

中文厂商 · Chinese vendors

5 items

阿里通义、月之暗面、小米、智谱、字节、腾讯等中文厂商的模型与产品发布，含 HuggingFace 上托管的中文模型卡。

学术 · research & papers

46 items

arXiv 预印本、Nature 等期刊以及研究机构博客（research.google 等）的 AI 相关原始研究。

查看全部 46 条

开源 OSS · indie projects

42 items

GitHub 上的独立开源项目，多为个人或小团队发起的工具与原型。长存的高 star 项目整理在 /ai 下按主题归组。

查看全部 42 条

Hacker News · AI

15 items

GitHub · 上升中

15 items

数据由 GitHub Actions cron 每 6 小时跑一次 scripts/extract-content.mjs 与 scripts/extract-feed.mjs 从 HackerNews Algolia、GitHub Search 与 8 家 AI lab 一手发布源抓取，过 LLM 打分归类后 commit 回仓库随构建部署。访客 0 外部请求。

AI 最新动态

AI Labs · 厂商一手发布

Mistral 发布 Mistral Small 4

Meta AI 发布 Muse Spark 模型

Meta 两年内推出四款 MTIA 芯片

xAI 发布 Grok 4.1 Fast 与 Agent Tools API

xAI 发布 Grok 4.1

xAI 发布 Grok 4 Fast

xAI 发布 Grok 4

xAI 发布 Grok 3 Beta

xAI 向所有用户开放 Grok

xAI 发布 Grok 图像生成功能

xAI 发布 Grok-2 测试版

Mistral 发布 Mistral Medium 3.5 及 Vibe 远程 Agent

中文厂商 · Chinese vendors

月之暗面开源 Kimi K2.6，聚焦编程与智能体集群

阿里通义实验室发布 Fun-ASR 1.5

阿里开源 Qwen3.6-35B-A3B 智能体编程模型

阿里发布 PrismAudio 环境音/音效模型

小米发布全栈 Agent 模型 MiMo-V2-Pro、Omni、TTS

学术 · research & papers

Nexus 发布时间序列预测 agent 框架

自适应教师暴露方法用于 LLM 推理自蒸馏

RewardHarness 提出自进化 agent 后训练方法

HuggingFace 发布 Dynamic Latent Routing 论文

随机少样本指导提升可验证奖励强化学习性能

BEAM 提出二进制专家激活掩码实现 MoE 动态路由

视频世界模型几何一致性定量评估方法

SPIN 提出基于迭代导航的结构化 LLM 规划方法

Hodge 分解实现保拓扑神经网络算子学习

HuggingFace 发布 PreScam 诈骗对话预测基准

SANA-WM 提出 Hybrid Linear Diffusion Transformer 实现分钟级世界建模

RAVEN 发布实时自回归视频外推模型

开源 OSS · indie projects

llama.cpp 在 RTX 5090 上测试 Qwen3.6 MTP 支持

Meta 开源人脑活动基础模型 TRIBE v2

社区发布 G4-Meromero-31B-uncensored-heretic 微调模型

用户对比 Strix Halo、RTX 3090 与 RTX 5070 的模型推理性能

社区发布 Gemma 4 31B 创意写作微调模型 Ortenzya

用户对比 Qwen 3.6 本地量化版与前沿模型的编程能力

Strix Halo 发布 Llama.cpp MTP 基准测试：27B 提速显著，35B 表现不一

llama.cpp 合并多 token 预测（MTP）支持

llama.cpp 即将支持 MTP 多 token 预测

ArXiv 拟对含 LLM 幻觉引用的论文作者实施一年封禁引发争议

arXiv 实施 1 年封禁，针对含 LLM 生成错误证据的论文

Horizon 开源 AI 新闻雷达系统，多源抓取并 AI 评分筛选

Hacker News · AI

How to buy cheap Claude tokens in China

Zerostack – A Unix-inspired coding agent written in pure Rust

I tried to make Claude make me money on open-source bounties

OpenAI and Government of Malta partner to roll out ChatGPT Plus to all citizens

DeepSeek-V4-Flash means LLM steering is interesting again

A Meta employee gets real about the horror of working there

SANA-WM, a 2.6B open-source world model for 1-minute 720p video

OpenClaw Creator Spent $1.3M on OpenAI Tokens in 30 Days

The 52-Page Memo That Nearly Destroyed OpenAI: Ilya Sutskever's Deposition

OpenAI's KOSA Endorsement Is Regulatory Capture with a Smiley Face

Show HN: Sx – an open-source package manager for AI skills, MCPs, and commands

OpenAI is connecting ChatGPT to bank accounts via Plaid

UK sovereign LLM inference

Show HN: Find the best local LLM for your hardware, ranked by benchmarks

Where's Ed: Anthropic Told Court $5B but Public $19B

GitHub · 上升中

affaan-m/everything-claude-code

Significant-Gravitas/AutoGPT

ollama/ollama

f/prompts.chat

huggingface/transformers

NousResearch/hermes-agent

langgenius/dify

open-webui/open-webui

langchain-ai/langchain

firecrawl/firecrawl

ChatGPTNextWeb/NextChat

nextlevelbuilder/ui-ux-pro-max-skill

lobehub/lobehub

thedotmack/claude-mem

bytedance/deer-flow