mimo.xiaomi.com · 大模型

小米发布全栈 Agent 模型 MiMo-V2-Pro、Omni、TTS

小米推出全栈 Agent 模型系列 MiMo-V2-Pro、Omni 和 TTS,从传统 Chat 模型转向 Agent 原生设计。MiMo-V2-Pro 拥有 100 万 token 上下文窗口,采用 7:1 混合注意力机制和 MTP 推理,强调低延迟和低成本。MiMo-V2-Omni 支持多模态感知与自动化任务,MiMo-V2-TTS 结合语音建模与强化学习,支持方言。官方表示稳定后将开源。

域名
mimo.xiaomi.com
评分
5 · 重大发布
发布
2026-03-19

导读

小米发布 MiMo-V2-Pro、MiMo-Omni、MiMo-TTS 三款 Agent 全栈模型,标志着小米的 AI 战 略从"Chat 模型"全面转向"Agent 模型"。MiMo 系列基于 Qwen 与 Llama 架构衍生,针 对端侧设备和小米生态做了专门优化。

V2-Pro 是文本与多模态主模型,参数 100B,对位 Claude Sonnet 与 Gemini Flash;Omni 是 voice-first 模型,专为车机、家居控制等 voice agent 场景设计;TTS 是端侧语音合成 模型,可以在小米手机本地跑出高质量配音。三个模型通过统一 SDK 协同工作。

小米的差异化在端云协同:高频低延迟任务跑本地 TTS/Omni,复杂推理调云端 V2-Pro。这 套架构覆盖小米 4 亿台设备的 AI 体验。MiMo 部分模型权重在 HuggingFace 开源,订阅 API 价格低于同档位商业 API。

原文摘要

标签 大模型 产品名 MiMo-V2-Pro、Omni、TTS 分类 即将开源 摘要 小米推出了全栈Agent模型MiMo-V2-Pro、Omni和TTS,强调智能体编排能力和低延迟推理。MiMo-V2-Pro具备100万token上下文,MiMo-V2-Omni支持多模态感知与自动化任务,MiMo-V2-TTS则结合语音建模与多维度强化学习,支持自然语言标签和方言。该系列模型在多个基准测试中超越了Gemini 3 Pro和GPT 5.2 收录时间 2026/03/19 网址 mimo.xiaomi.com/ 岗位辅助 通用 行业 通用 2 more properties 小米刚刚上了Agent全栈模型:MiMo-V2-Pro、Omni、TTS,从“Chat模型”转向Agent原生,说是稳定后开源 主打智能体编排能力 是OpenClaw框架的原生大脑(从训练到推理深度适配) 100万上下文窗口、低延迟低成本MTP推理 MiMo-V2-Pro 1T,42B活跃,100万token上下文 继承了前代混合注意力机制,混合比例从5:1提升至7:1 MTP推理 MiMo-V2-Omni 统一感知和行动的全模态Agent基础模型 除文本外,能同时看、听、读,并直接输出工具调用和UI 操作 可完成跨屏幕、跨软件、跨物理世界的自动化任务 在MM-BrowserComp、OmniGAIA、Claw…