DeepMind · 大模型

DeepMind 更新 Gemini 音频模型,提升语音交互能力

DeepMind 发布了改进版 Gemini 音频模型,在语音理解与生成方面取得显著提升。新模型能够更自然地处理多轮对话中的语气、语速和情感表达,同时支持更复杂的语音指令识别。这一更新让 Gemini 在语音助手、实时翻译和有声内容创作等场景中的表现更加流畅,为开发者提供了更强大的语音交互基础能力。

域名
deepmind.google
评分
4 · 重要更新
发布
2025-12-12
DeepMind 更新 Gemini 音频模型,提升语音交互能力

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。