Alibaba Cloud · ASR
阿里通义实验室发布 Fun-ASR 1.5
阿里通义实验室发布 Fun-ASR 1.5,单模型即可覆盖30种语言、汉语七大方言体系及20余种地方口音,古诗词字符级准确率达97%。相比上一代,典型方言场景字符错误率下降56.2%,其中5种方言准确率超90%、15种超80%。模型能还原方言特色词汇,并支持同一段对话中30种语言跨语种混合切换,适用于方言纪录片、法律笔录、国学课程等场景。
- 域名
bailian.console.aliyun.com- 评分
- 4 · 重要更新
- 发布
- 2026-04-20
导读
阿里通义实验室发布 Fun-ASR 1.5,自称"方言工业级可用"的统一语音识别模型。单一模型 覆盖 30 种语言、汉语七大方言体系(官话、吴、湘、赣、客、闽、粤)及 20+ 地方口音, 古诗词吟诵也能精准转写。
典型方言场景字错率(CER)较上一代下降 56.2%,5 种方言准确率破 90%,15 种超过 80%。 能还原方言特色词汇,比如上海话的"侬"、苏州话的"倷"。古诗词字符级准确率达 97%, 支持跨语种混合对话(中英夹杂、粤普切换等)。
这套能力的实际场景是方言文化纪录片制作、地方戏曲数字化、法律笔录、医疗问诊辅助等 对文本规范性要求高的场景。Fun-ASR 1.5 通过通义实验室开源,并集成进阿里云百炼平台。 和 OpenAI Whisper、Google Speech-to-Text 相比,中文方言能力是 Fun-ASR 的明显优势。
原文摘要
标签 ASR 产品名 Fun-ASR 1.5 分类 闭源 摘要 阿里通义实验室发布的Fun-ASR 1.5支持30种语言和汉语七大方言,准确率显著提升,适用于方言文化纪录片和法律笔录等场景。古诗词的字符级准确率达到97%,同时支持跨语种混合对话,展现了强大的方言识别能力 收录时间 2026/04/20 网址 bailian.console.aliyun.com/cn-…un-asr 岗位辅助 通用 行业 通用 2 more properties 阿里通义实验室最新发布了款ASR:Fun-ASR 1.5,核心能力:方言工业级可用 单模型即可无缝覆盖30种语言、汉语七大方言体系及20+ 地方口音,古诗词吟诵也能精准转写 典型方言场景CER相对上代下降56.2%,有5种方言准确率破 90%,15种超过 80% 从效果看,模型能还原方言特色词汇,比如上海话的"侬"、苏州话的"倷" 支持汉语传统七大方言体系(官话/吴/湘/赣/客/闽/粤),并深度适配20+地区口音官话 这就可以做来做方言文化纪录片制作、法律笔录等对文本规范性要求比较高的场景 其对古诗词的字符级准确率达到了97%,可以做国学课程、或有声诗词等场景 另外,支持同一段对话中30种语言跨语种混合自由切换 阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/e…