DeepMind · 大模型

DeepMind 更新 Gemini 音频模型，提升语音交互能力

DeepMind 发布了改进版 Gemini 音频模型，在语音理解与生成方面取得显著提升。新模型能够更自然地处理多轮对话中的语气、语速和情感表达，同时支持更复杂的语音指令识别。这一更新让 Gemini 在语音助手、实时翻译和有声内容创作等场景中的表现更加流畅，为开发者提供了更强大的语音交互基础能力。

域名: deepmind.google
评分: 4 · 重要更新
发布: 2025-12-12

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest