阿里巴巴近日宣布推出全新旗舰推理模型——通义千问Qwen3-Max-Thinking,标志着国产大模型技术迈入新阶段。这款模型以超万亿参数规模和创新的混合专家(MoE)架构为核心,在性能优化与工程实现上取得显著突破,成为千问3系列的重要升级版本。
技术团队通过36万亿tokens的海量数据预训练,结合自主研发的PAI-FlashMoE并行计算策略,使模型计算效率较前代提升30%。针对长文本处理场景,创新采用的Chunk Flow技术将训练吞吐量提升至传统方法的3倍,支持百万级token的上下文理解能力。这些优化使模型在复杂推理任务中展现出更强的逻辑连贯性与信息整合能力。
在基准测试中,Qwen3-Max-Thinking多项指标超越国际顶尖模型,包括GPT-5.2、Claude Opus 4.5及Gemini 3 Pro等。特别在数学推理、代码生成和跨领域知识应用等场景,模型展现出更精准的答案生成与更低的错误率。通过大规模强化学习训练,其自主调用工具的原生Agent能力得到质的提升,可更高效地完成多步骤任务规划与执行。
针对大模型普遍存在的幻觉问题,研发团队通过多维度优化显著降低错误信息生成概率。在事实核查、逻辑验证等场景中,模型输出的可靠性较前代提升40%以上,为金融、医疗等高精度需求领域的应用奠定基础。
目前,普通用户已可通过千问PC端和网页版体验新模型,移动端APP接入工作正在最后测试阶段。阿里云智能集团表示,此次升级不仅体现技术实力,更致力于推动大模型在产业端的深度应用,后续将开放更多行业定制化解决方案。
该模型的架构设计采用动态路由机制,使不同专家模块可针对特定任务自动激活,在保证推理效率的同时降低计算资源消耗。测试数据显示,在相同硬件条件下,Qwen3-Max-Thinking的响应速度较同类万亿参数模型提升25%,为大规模商业化部署提供了可行路径。



