新加坡国家人工智能计划(AI Singapore,简称AISG)近日宣布,其最新版本的“Sea-Lion”大语言模型(LLM)——Qwen-Sea-Lion-v4,将由阿里巴巴集团旗下的阿里云提供全面技术支持。这一合作标志着AISG在区域人工智能领域迈出了重要一步,同时也反映出国际科技合作在推动本地化创新中的关键作用。
Qwen-Sea-Lion-v4基于阿里云的Qwen3-32B基础模型构建,该模型经过特别优化,以适应东南亚地区多样化的语言需求。阿里云在新闻稿中强调,Qwen3-32B不仅接受了超过119种语言与方言的预训练,总数据量达到36万亿词元,还额外使用了超过1000亿个东南亚语种词元进行强化训练。这一举措显著提升了模型对本地表达方式、对话细微差别以及区域性知识领域的理解能力。
此次合作中,阿里云不仅提供了基础模型架构,还深度参与了Qwen-Sea-Lion-v4的高级后训练阶段。通过这一阶段的技术支撑,模型在处理复杂语言任务时的表现得到了进一步提升。与此同时,AI Singapore贡献了其开源的区域性数据集,包括针对东南亚语言任务的数据整理、优化与评估工作,为模型的本地化适配提供了重要支持。
在性能评估方面,Qwen-Sea-Lion-v4在参数规模低于2000亿的开源大模型中表现突出,位居“东南亚语言模型综合评估排行榜”首位。这一成果不仅验证了模型的技术实力,也为其在区域内的广泛应用奠定了基础。目前,该模型已在AI Singapore官网及Hugging Face平台开放免费下载,供研究人员和开发者使用。
新加坡在人工智能领域的投入持续加大。2023年12月,该国启动了一项总额7000万新元(约合3.81亿元人民币)的国家级计划,旨在全面提升多模态大语言模型的科研与工程能力。该项目由新加坡国家研究基金会(NRF)提供资金支持,并获得资讯通信媒体发展局(IMDA)的认可,进一步凸显了新加坡在人工智能领域的战略布局。
此次阿里云与AI Singapore的合作,不仅为东南亚地区的人工智能发展提供了新的技术范式,也为全球科技企业如何通过本地化创新满足区域需求提供了参考。随着Qwen-Sea-Lion-v4的推广应用,预计将在教育、医疗、金融等多个领域产生积极影响。