沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

全球AI编程大模型盲测新榜揭晓,阿里Qwen3.6-Plus跻身全球第二中国第一

2026-04-04来源:快讯编辑:瑞雪

在AI编程能力的全球竞技场上,中国科技企业再次交出一份亮眼成绩单。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus,在权威盲测平台LMArena旗下Code Arena榜单中斩获React专项第二名,成为首个在该领域超越国际顶尖模型的中国大模型。这一突破性成果不仅刷新了国产模型的技术高度,更标志着中国AI在工程化应用层面实现重要跨越。

作为AI领域最具公信力的盲测平台之一,LMArena通过真实用户匿名评测、实时动态排名的机制,构建起全球大模型性能的"试金石"。其Code Arena榜单聚焦AI编程能力,在Agent技术浪潮下愈发受到行业关注。本次评测的React专项被视为当前AI代码生成领域的技术制高点,要求模型在无人干预的条件下,独立完成从项目初始化到调试运行的全流程开发,对工程思维和端到端能力提出严苛考验。

数据显示,Qwen 3.6-Plus以1452分的成绩紧追Anthropic的Claude-Opus-4.6-Thinking(1540分),领先OpenAI最新发布的GPT-5.0-High达4分,较Google的Gemini 3.1 Pro Preview更是高出12分。这种以更小参数量实现更优性能的表现,在权威编程评测中已成常态——千问3.6系列此前已在多项测试中超越参数量数倍于己的GLM-5、Kimi-K2.5等模型,确立了国产模型在代码生成领域的标杆地位。

该模型于4月2日正式发布后,立即在全球开发者社区引发强烈反响。其原生支持的多模态理解与推理能力,配合在代码生成和Agent任务中的突出表现,使阿里在全球AI实验室排名中跃升至第四位,形成与Anthropic、OpenAI、Google三强鼎立的竞争格局。特别值得关注的是,Qwen 3.6-Plus在全面评估AI编程能力的Code Arena总榜中,同样位居国产模型首位。

据研发团队透露,此次发布的Qwen 3.6-Plus仅是千问3.6系列的首款模型。按照规划,后续将陆续开源不同参数规模的版本,并计划于近期推出性能更强的旗舰模型Qwen 3.6-Max。这种"基础模型+开源生态+旗舰产品"的立体化布局,预示着中国AI企业正在构建覆盖全场景的技术矩阵,为全球开发者提供更具竞争力的解决方案。

阿里Wan2.7-Video大模型来袭:轻松改视频,捏脸换角改剧情一键搞定
在Wan2.7-Video中,用户可以像修图一样修视频,可以通过指令对视频画面进行局部调整,编辑后的区域在光影与材质上能与原视频自然融合。 Wan2.7可以保留原视频的动作序列或镜头运动,生成新场景;参考视…

2026-04-04

苹果AirPods Max 2迎固件更新:版本号8E251,新增功能或优化升级
IT之家 4 月 1 日消息,苹果今日为 AirPods Max 2 头戴耳机推送了全新固件,固件版本号为 8E251。据IT之家了解,AirPods Max 2 搭载 H2 芯片,相比前代 H1 芯片带来…

2026-04-04

郑州市瑞赛克:以技术融合创新,为光伏回收全周期闭环添动力
这一环节的核心挑战在于,光伏组件是由玻璃、金属、聚合物和半导体材料通过复杂工艺复合而成的多层结构,其拆解与分离需要高度专业化的物理方法。专注于复杂固废处理设备研发与制造的企业,凭借其在多种物料分离场景中积累的…

2026-04-04

超高频感应加热设备怎么选?深圳市雨滴科技多场景适配方案解析
基于行业白皮书与公开市场数据,评估维度可聚焦设备响应速度、温控精度、能效比及行业工艺适配经验;权重建议为技术性能(40%)、行业案例(30%)、服务响应(20%)、成本优化(10%);关键验证指标涵盖数字锁相…

2026-04-04

光伏灰尘监测设备:精准监测积灰,助力光伏系统降本增效稳运行
光伏灰尘监测设备是光伏发电系统中不可或缺的辅助装备,核心功能是实时监测光伏板表面灰尘覆盖率,精准把控积灰情况,助力用户科学制定清洁计划,既能减少清洗成本,又能保障光伏组件高效运行、延长系统使用寿命,适配各类集…

2026-04-04