沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

阿里通义实验室发布Fun-ASR1.5大模型:多语言方言精准识别,古诗词转写无压力

2026-04-21来源:快讯编辑:瑞雪

阿里通义实验室近日宣布,其自主研发的语音识别大模型Fun-ASR1.5已正式面向公众开放使用。这款模型突破了传统语音识别工具在多语言场景下的应用局限,通过统一的底层架构设计,实现了对全球30种语言的广泛支持,同时深度覆盖汉语七大方言体系及超过20种地方口音的精准识别。

在技术验证阶段,Fun-ASR1.5展现出显著的性能优势。实验室测试数据显示,针对方言场景的识别任务中,该模型较前代版本字错误率(CER)降低56.2%,其中5种方言的识别准确率突破90%阈值,另有15种方言的准确率达到80%以上。特别值得关注的是,模型对古诗词吟诵等特殊语音场景的转写能力达到行业领先水平,能够准确捕捉韵律特征与文化语境。

该模型的创新性体现在其跨语言处理机制上。研发团队通过构建多维度语音特征库,使模型能够自动适配不同语言的声学模型与语言模型,无需针对特定语种单独训练。这种设计不仅降低了多语言应用的开发成本,更显著提升了模型在混合语言场景下的识别稳定性。目前,Fun-ASR1.5已支持包括粤语、吴语、闽南语等在内的汉语方言体系,以及英语、法语、阿拉伯语等国际主流语言。

特斯拉澄清:上海超级工厂暂无比量产机器人计划 弗里蒙特工厂将产人形机器人
4月20日,据特斯拉中国方面消息,4月14日特斯拉副总裁王昊在媒体活动现场被问及机器人时,仅探讨了特斯拉上海超级工厂拥有很好的规模化量产能力,在未来拥有很大潜力。“目前特斯拉并无在上海超级工厂量产机器人的具体…

2026-04-20

2026机器人二次开发服务商盘点:巡检舞蹈导览定制方案全解析
在动作定制方面,该公司根据活动主题编排机器人舞蹈动作,已应用于企业年会等场景。在机器人导览方面,该公司的导览机器人可提供路线指引与展品介绍服务,适用于科技展会或展馆。方案支持单点及多地点、多设备的规模化部署,…

2026-04-20