沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

阿里千问Qwen3-Coder-Next发布:以低推理成本解锁高效编程智能体新可能

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴千问团队近日正式发布了一款名为Qwen3-Coder-Next的开放权重语言模型,该模型专为编码代理和本地开发场景设计,通过创新架构与训练方法实现了性能与效率的显著提升。与传统的参数扩展模式不同,新模型聚焦于智能体训练信号的扩展,采用混合注意力机制与MoE(专家混合)架构,在降低推理成本的同时强化了编程能力与智能体交互水平。

在训练方法上,团队构建了多阶段强化体系:首先通过持续预训练让模型吸收代码与智能体相关数据,随后利用高质量智能体轨迹数据进行监督微调,并针对软件工程、QA测试、Web/UX开发等垂直领域开展专家训练。最终通过知识蒸馏技术将专家能力整合到单一可部署模型中。这种训练策略特别强化了长程推理、工具调用及错误恢复能力,使其更适应真实开发环境的需求。

基准测试数据显示,当集成SWE-Agent框架时,该模型在SWE-Bench Verified基准上取得超过70%的准确率,在多语言版本及更具挑战性的Pro版本中仍保持竞争力。值得注意的是,尽管其激活参数规模仅为30亿,但在TerminalBench 2.0和Aider等智能体评测中,性能表现可与激活参数量高10-20倍的开源模型媲美,展现出显著的效率优势。

效率对比图表进一步证实,在SWE-Bench-Pro任务中,Qwen3-Coder-Next的3B激活参数版本已达到行业领先水平,其性能曲线处于帕累托前沿位置。虽然全注意力架构的专有模型在绝对指标上仍占优势,但新模型在低成本智能体部署场景中展现出更强的实用性,特别适合资源受限的开发环境。

该模型现已通过ModelScope和Hugging Face平台开源,开发团队表示将持续优化模型的推理决策能力,扩展其任务支持范围,并根据用户反馈进行快速迭代。此次发布标志着编程智能体领域在效率优化方向取得重要突破,为开发者提供了更具性价比的选择。

京东政企3C方案中心开业,以体验驱动政企采购升级与数智转型
该中心系统规划了多个主题体验区,其中,Apple产品方案展示区不仅呈现了全线产品在企业协同办公、移动研发及创意设计等场景中的深度整合应用,更重磅展示MacStudio 集群部署671B超大模型的落地实践,…

2026-02-04

数据中心供电选型难?创稳电气以案例详解UPS与HVDC的适配之道
常州创稳电气作为国内领先的工业供电解决方案提供商,凭借15年深耕经验和数百个落地项目,为行业带来科学选型思路。华东某制造业数据中心,曾因选用非适配传统UPS,年运维成本超70万元,每年出现2-3次供电波动影响…

2026-02-04

TDengine:以创新架构破解时序数据困局,赋能物联网与工业互联网发展
传统的数据库在面对每秒数百万甚至上亿的数据点写入、以及需要毫秒级响应的复杂查询时,往往显得力不从心,不仅性能低下,而且存储成本高昂,难以满足现代物联网与工业互联网对数据处理的严苛要求。时序数据库专为处理时间序…

2026-02-04

2026年青岛城阳红岛开启新出行篇章,百度萝卜快跑无人出租车9时正式运营!
2026年,青岛城阳区红岛将迎来一项颠覆传统出行方式的创新服务——百度旗下的萝卜快跑无人出租车将在某日9时正式投入运营。用户可以通过萝卜快跑App或小程序登录百度账号进行车辆预订,系统将在车辆抵达前发送短信提…

2026-02-04

青岛街头“智”行新体验:“颐驰06”无人驾驶网约车开启科技出行新篇章
在青岛高新区的街头,近期出现了一道引人注目的风景线——白色车身的无人驾驶网约车“颐驰06”正在有序穿梭。这款由百度旗下的“萝卜快跑”运营的智能车辆,正式开启了在高新区部分路段的试点服务,迅速成为市民热议的新出…

2026-02-04

马斯克再布局:SpaceX收购xAI,为超级IPO铺路估值达1.25万亿美元
据CCTV国际时讯报道,美国东部时间2月2日,美国企业家、亿万富翁马斯克旗下的太空探索技术公司(SpaceX)发表声明,宣布已收购同属于马斯克旗下的人工智能企业xAI公司。xAI公司同时也发表声明,证明已“…

2026-02-04