沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

淘天集团AI技术大放异彩,开源模型领跑开源社区新趋势

2025-04-14来源:ITBEAR编辑:瑞雪

在科技日新月异的今天,淘天集团凭借其在AI领域的深度布局,正逐步成为业界的焦点。近日,该集团详细揭示了其AIGX技术体系及大模型家族的最新进展,这一系列技术突破迅速吸引了外界的广泛关注。

据统计,过去五年间,淘天集团在国际顶级学术会议上发表的论文数量已突破300篇大关,彰显了其在AI研究领域的深厚底蕴。同时,其阿里妈妈团队在技术创新上同样不遗余力,已申请中国专利超过130项,其中20余项已成功获得授权。

不仅如此,淘天集团还积极拥抱开源文化,已有多个AI项目面向全球开发者开放。这些项目在开源社区中表现抢眼,多个模型更是稳居趋势榜前列,赢得了业界的广泛赞誉。

尤为在即将举行的NeurIPS 2024大会上,淘天集团阿里妈妈团队将开源一项具有里程碑意义的技术——AuctionNet。作为全球首个标准化的自动出价Benchmark,AuctionNet数据集涵盖了48个不同出价智能体的竞价日志,总计5亿条记录,数据量高达80GB。这一技术的推出,不仅将极大地推动广告拍卖中出价决策算法的研究,还将为大型博弈场景的决策智能算法提供有力支持。在NeurIPS 2024竞赛中,AuctionNet已成功应用,为1500支参赛队伍提供了精准的算法效果评估,助力他们开发出更多元、更具创新性的解决方案。

在智能创意领域,淘宝天猫同样表现不俗。去年,该平台开源了多个项目,其中包括基于FLUX的配套模型ControlNet图像修复模型和Turbo模型。这两个模型可相互兼容,配合使用能够大幅提升图像修复速度。自开源以来,它们迅速获得了开源社区的积极反馈,并在HuggingFace社区趋势榜上名列前茅。

在ChatGPT掀起大模型浪潮的背景下,淘天集团也紧跟时代步伐。去年9月,该集团联合爱橙科技开源了大模型训练框架Megatron-LLaMA。这一框架的推出,使得开发者们能够更便捷地提升大语言模型的训练性能,同时降低训练成本,并保持与LLaMA社区的兼容性。测试结果显示,在32卡训练环境下,Megatron-LLaMA相比HuggingFace上的直接代码版本,能够实现176%的加速。在大规模训练场景下,Megatron-LLaMA更是展现出了近乎线性的扩展性,并对网络不稳定表现出极高的容忍度。

一直以来,淘宝天猫都秉持着开源共享的理念,与业界共同分享AI技术的红利。除了上述项目外,该平台还开源了包括DIN(深度兴趣网络)、XDL(阿里自研深度学习框架)、EULER(分布式高性能图表示学习框架)、CLF(曲率空间学习框架)、EFLS(联邦学习解决方案)等在内的众多AI模型和平台,为AI技术的发展贡献了自己的力量。

面对AI电商的蓬勃发展态势,淘天集团也在持续加大AI领域技术人才的储备力度。据相关报道,过去两年间,该集团启动了多轮校招活动,技术类岗位的占比持续增加。同时,集团还连续两年发起了T-Star全球顶尖技术人才计划,以定制化培养和百万年薪等优厚待遇吸引全球顶尖人才加盟。