沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

阿里千问Qwen3-Coder-Next发布:以低推理成本解锁高效编程智能体新可能

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴旗下千问团队近日发布了一款名为Qwen3-Coder-Next的开放权重语言模型,该模型专为编码代理和本地开发场景设计,通过创新架构与训练方法实现了性能与效率的双重突破。基于Qwen3-Next-80B-A3B-Base构建的混合注意力与MoE架构,使模型在保持低推理成本的同时,展现出强大的编程和智能体能力。

与传统依赖参数扩展的模型不同,Qwen3-Coder-Next聚焦于智能体训练信号的扩展。研发团队采用大规模可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包含四个关键阶段:在代码与智能体数据上进行持续预训练,在高质量智能体轨迹数据上开展监督微调,针对软件工程、QA、Web/UX等领域进行专家训练,最后将专家能力蒸馏至单一可部署模型。这种训练方式特别强化了长程推理、工具使用和执行失败恢复能力,这些特性对现实编程场景至关重要。

在编程智能体基准测试中,Qwen3-Coder-Next展现出显著优势。使用SWE-Agent框架时,该模型在SWE-Bench Verified基准上取得超过70%的成绩,在多语言设置和更具挑战性的SWE-Bench-Pro测试中保持竞争力。值得注意的是,尽管其激活参数规模较小,但在多项评测中仍能比肩甚至超越参数规模大10-20倍的开源模型。特别是在TerminalBench 2.0和Aider等基准测试中,模型证明了其在复杂编程任务中的实用价值。

效率与性能的平衡是该模型的另一大亮点。测试数据显示,3B激活参数版本的Qwen3-Coder-Next在SWE-Bench-Pro上的表现,可与激活参数量高10-20倍的模型相媲美。虽然专有全注意力模型在绝对性能上仍占优势,但Qwen3-Coder-Next在低成本智能体部署场景中展现出明显的帕累托前沿优势,为资源受限环境下的编程智能体应用提供了新选择。

目前,Qwen3-Coder-Next已通过ModelScope和Hugging Face平台开源,开发者可自由获取模型权重及相关文档。研发团队表示,后续将重点提升模型的推理决策能力,扩展任务支持范围,并根据用户反馈持续优化模型性能。这一创新成果有望推动编程智能体在软件开发、自动化测试等领域的广泛应用。

京东政企3C方案中心开业,以体验驱动采购升级,开启政企数智转型新篇
该中心系统规划了多个主题体验区,其中,Apple产品方案展示区不仅呈现了全线产品在企业协同办公、移动研发及创意设计等场景中的深度整合应用,更重磅展示MacStudio 集群部署671B超大模型的落地实践,…

2026-02-04

智能建造新力量!国内首个自研机器人生态集群进军建筑领域
2月1日,国内首个自研智能建造机器人生态集群在成都发布,标志着有着20余年机器人研制经验的沈阳新松机器人自动化股份有限公司正式进军建筑领域,将与合作伙伴联手解决危、繁、脏、重等作业难题。 智能建造机器人生态…

2026-02-04

青岛街头“黑科技”上线!“颐驰06”无人驾驶网约车开启智慧出行新体验
在青岛高新区的街头,近期出现了一道引人注目的风景线——白色车身的无人驾驶网约车“颐驰06”正在有序穿梭。这款由百度旗下的“萝卜快跑”运营的智能车辆,正式开启了在高新区部分路段的试点服务,迅速成为市民热议的新出…

2026-02-04

科创AIETF富国(589380)2月3日涨1.99%,年内份额规模双增超一成
2月3日,富国上证科创板人工智能ETF(589380)收盘涨1.99%,成交额712.09万元。 科创AIETF富国(589380)成立于2025年6月20日,基金全称为富国上证科创板人工智能交易型开放式指…

2026-02-04