沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

新加坡AI计划战略转向:弃Meta选阿里千问 破解东南亚语言适配难题

2025-11-26来源:快讯编辑:瑞雪

新加坡国家人工智能计划(AISG)近日在东南亚语言大模型领域迈出关键一步,宣布放弃meta的Llama系列开源架构,转而采用阿里巴巴通义千问(Qwen)的开源技术框架。这一决策不仅标志着技术路线的重大调整,更凸显中国开源AI模型在国际市场的影响力持续攀升。基于Qwen架构开发的“Qwen-SEA-LION-v4”模型,在东南亚语言能力评估榜单中迅速登顶,为区域性语言适配难题提供了创新解决方案。

长期以来,以Llama为代表的西方开源模型在东南亚市场面临显著挑战。尽管这些模型在英语处理性能上表现优异,但其“英语中心主义”的设计逻辑导致在印尼语、泰语、马来语等非拉丁语系文字处理中效率低下。例如,泰语和缅甸语等无空格语言需要特殊分词技术,而Llama的默认分词器难以适应这种需求,直接制约了本地化AI应用的开发效率。AISG在对比测试中发现,依赖硅谷技术路线无法满足东南亚多语言环境的实际需求,迫使团队重新评估基础模型的选择标准。

阿里巴巴的Qwen3系列模型凭借其原生多语言能力脱颖而出。该模型在预训练阶段使用了36万亿个token的数据集,覆盖全球119种语言和方言,其中东南亚语言占比显著。这种设计使其不仅能识别区域性文字,更能从语法结构层面理解语言逻辑。AISG以Qwen3-32B版本为基座开发的Sea-Lion模型,通过针对性优化大幅降低了训练技术门槛。为适配东南亚语言特性,研发团队特别采用字节对编码(BPE)分词器替代传统方案,使泰语、缅甸语等语言的字符切分精度提升40%,翻译准确率与推理速度同步优化。

商业落地层面的考量同样关键。东南亚地区中小企业占比超90%,普遍缺乏部署高端GPU集群的算力资源。Qwen-Sea-LION-v4通过模型压缩技术,实现了在32GB内存消费级设备上的流畅运行。这种“工业级性能、消费级门槛”的特性,使普通开发者无需依赖云端服务即可本地部署国家级模型,精准解决了区域市场算力稀缺的痛点。测试数据显示,该模型在同等硬件条件下的推理速度比西方同类产品快2.3倍,能耗降低65%。

此次合作呈现显著的双向赋能特征。阿里巴巴提供通用推理底座的同时,AISG贡献了经过严格清洗的1000亿个东南亚语言token数据集。这批数据不仅完全规避版权风险,其东南亚内容浓度高达13%,是Llama2数据集的26倍。在Sea-Helm评估榜单中,融合双方技术优势的Sea-Lion v4模型在同量级开源模型中表现卓越,验证了技术路线调整的战略价值。该模型现已在金融、医疗、教育等多个领域展开试点应用,预计将推动东南亚AI生态进入快速发展期。

谷歌AI逆袭:Gemini 3强势登顶,创始人回归与TPU助力重夺霸主地位
【新智元导读】两年时间,谷歌从被OpenAI按在地上摩擦,到用Gemini 3.0 Pro把「落后」两个字彻底撕碎,狠狠甩了奥特曼一脸。布林的存在直接催化了Gemini 3项目的加速,他专注于解决模型在长…

2025-11-26

AI赋能内容创新 海外体验双突破 爱奇艺绘就增长新图景
在巩固国内市场领先地位的同时,爱奇艺积极推进“IP生态从线上拓展到线下、从国内拓展到海外”的战略布局,海外业务与体验业务在三季度均取得突破性进展,成为公司收入增长的重要引擎,为未来发展打开了广阔空间。 财…

2025-11-26

VR全景技术革新企业营销:佛山南海区公司以轻量化方案破解展示难题
直到遇见广州全景科技,这家深耕VR技术多年的佛山南海区360度VR全景拍摄公司,用一组数据刷新了她的认知:画面加载速度提升300%,客户停留时长延长5倍,而成本仅为传统三维动画的1/4。其佛山南海区360度V…

2025-11-26

科大讯飞数字人新突破:多模态交互技术领先,两项国际标准结项待发
超拟人数字人能通过多模态前端定位说话人方位,像真人一样能视线跟随看向当前交互的对象,增强交互的真实感;数字人的回复也更加自然、共情,得益于多情感语音合成技术创新性研发了多轮上下文信息建模方案,能够对语音交互中…

2025-11-26

华为2025报告:智能体互联网架构解析与关键技术全景展望
定义内涵:智能体互联网是以高度自主的 AI 智能体为核心交互主体的新型互联网范式,基于 IPv6 + 构建智能叠加层,融合 6G、SDN、边缘计算等技术,打破异构智能体壁垒,实现开放互联、安全高效的万智协同…

2025-11-26

我国卫星物联网商用试验启航 两年探索赋能新兴产业安全发展
湖北日报讯(记者李朝霞、刘宇、通讯员何述锋、周晓)11月22日,2025中国5G+工业互联网大会开幕式在武汉举办。工业和信息化部宣布,我国卫星物联网业务商用试验正式启动。卫星物联网业务商用试验正式启动 什…

2025-11-26

从机器学习到AI前沿:杨震原揭秘字节跳动近十年技术探索之路
我们在模型结构、自研服务器上也有很多探索,这也让我们实现了大模型的低调用成本。即便在数字世界,虽然目前的大模型,在视频、图片合成方面的能力已经超过人类,但是在众多内容理解、界面操作等方面,模型还是和人有比较…

2025-11-26