沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

Code Arena榜单更新:阿里Qwen3.7-Max编程能力跻身全球第二

2026-05-27来源:快讯编辑:瑞雪

在AI编程能力评测领域,第三方大模型盲测平台LMArena旗下的Code Arena榜单更新引发关注。阿里最新旗舰模型Qwen3.7-Max以1541分的成绩跻身全球第二,成为唯一突破1540分的中国大模型,标志着中国在代码生成与理解领域的技术实力已跻身世界前列。

与传统代码基准测试不同,Code Arena的评测机制更具挑战性。该榜单由全球开发者自主命题,要求参评模型从零构建完整的可交互Web应用,再通过用户对匿名模型生成结果的盲测投票综合评分。这种"实战化"的评测方式,更贴近真实开发场景,对模型的代码生成质量、逻辑完整性和用户体验提出了更高要求。

作为面向智能体(Agent)场景优化的模型,Qwen3.7-Max在编程能力上实现了突破性提升。其核心优势在于能够独立完成复杂项目的端到端交付,支持长达35小时的持续运行,并可处理累计超过1000次工具调用的复杂长程任务。这种能力使其在自动化开发、智能系统构建等场景中展现出显著优势。

此次排名不仅验证了Qwen3.7-Max在代码生成领域的领先地位,更凸显了中国大模型在应对实际工程挑战时的技术积累。随着AI技术向专业化、场景化方向发展,这类具备长程任务处理能力的模型将在工业自动化、智能软件开发等领域发挥关键作用。

AI找漏洞效率惊人!Claude Mythos玻璃翼项目首月挖出超万高危漏洞
尚未公开发布的Claude Mythos Preview模型,在短短几周内,就在全球最重要的软件中找出了超1万个高危或严重漏洞。 UK AISecurity Institute(英国人工智能安全研究所)报…

2026-05-27

数字技术助力治理升级 厦门翔安智慧城中村项目7月将全面完工
为破解城中村人口密集、设施薄弱、监管难度大、服务覆盖不足等治理难题,近日,厦门市翔安区智慧城中村(三期)项目正加紧推进建设,预计今年7月将全面完工。 据厦门智慧翔安数据有限公司智慧城中村项目负责人介绍,全区1…

2026-05-27

机器人与自动化浪潮下,网络安全如何筑牢企业运营防护网?
监控异常流量模式:在OT网络中,异常模式往往格外显眼:控制器突然与陌生地址通信、设备在异常时段频繁交互、与正常运营不符的大规模数据传输、反复出现的登录失败,或突然出现的新型管理工具。 A:远程访问是自动化环…

2026-05-27