沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

阿里发布Qwen-Robot系列具身智能大模型 助力机器人“手脑脚”协同进化

2026-06-17来源:快讯编辑:瑞雪

阿里巴巴正式推出千问具身智能大模型Qwen-Robot系列,涵盖三大核心模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav以及世界模型Qwen-RobotWorld。这一系列模型通过为机器人赋予"灵巧的手""认路的脚"和"会思考的大脑",构建起完整的具身智能解决方案,既支持独立部署,也可协同运作。

作为具身智能的基础架构,VLA(视觉-语言-动作)模型通过融合视觉感知、语言理解和动作决策,使机器人具备理解环境并执行操作的能力。传统VLA模型存在跨场景适应性差的问题,更换硬件或环境后性能显著下降。Qwen-RobotManip通过创新设计解决了这一难题:其采用80维统一动作表征体系,为不同形态的机器人定义通用"肢体语言",使机械臂能够理解基础物理规律与动作逻辑。该模型支持快速硬件适配,仅需数次反馈即可在新设备上稳定运行,彻底摆脱生硬的动作模仿模式。

在空间导航领域,Qwen-RobotNav基于Qwen-VL框架构建,创新性地将语言指令导航、目标搜索、自动驾驶等五大任务模块整合到统一系统。这种设计使机器人面对复杂任务时无需人工切换模型,例如在执行"将咖啡送到会议室"的指令时,系统可自动完成路径规划、障碍规避和物品抓取等全流程操作。测试数据显示,该模型在跨场景任务中的导航效率提升40%以上。

作为系列模型的"大脑",Qwen-RobotWorld通过构建物理世界模拟器,实现对机器人动作的预判与优化。该模型基于对物体运动规律、空间关系等物理特性的深度理解,能够预测机器人在特定环境中的合理行为轨迹。这种预测能力使机器人在现实场景中可按照模拟路径精准执行任务,显著降低实际部署中的试错成本。目前该模型已支持动态环境下的实时推理,响应延迟控制在毫秒级。

司庆日展现AI新进展,科大讯飞多领域布局角逐全球科技之巅
走过27年,科大讯飞正在把"能理解、会思考"延伸到"能干活、能感知"。在刚过去的司庆日,这家公司以几项实质进展,勾勒出其AI产业化纵深布局的完整轮廓。首先是工业具身智能的突破。其次是消费端AI眼镜的即将落地,…

2026-06-17

MiniMax M3大模型开源:MSA技术优化计算,综合智能指数居全球开源模型首位
该模型从训练初始阶段便开展多模态混合训练,通过文本、图像等多类型数据交错学习,在预训练环节完成不同模态语义的深度融合,搭建起统一的跨模态语义体系,为多模态理解、内容生成以及复杂任务处理打下底层基础,也是业内首…

2026-06-17

慧与科技发力AI网络市场:推推理专用交换机,西门子能源成新合作典范
分析人士认为,此类企业级AI部署案例的落地,是传统企业客户加速拥抱AI的直接体现,也印证了慧与科技以网络为核心切入AI市场的战略逻辑。该产品线建立在慧与科技去年以约130亿美元收购Juniper Netw…

2026-06-17