阿里发布Qwen-Robot系列具身智能大模型助力机器人“手脑脚”协同进化-科技-沃资讯

阿里巴巴正式推出千问具身智能大模型Qwen-Robot系列，涵盖三大核心模型：VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav以及世界模型Qwen-RobotWorld。这一系列模型通过为机器人赋予"灵巧的手""认路的脚"和"会思考的大脑"，构建起完整的具身智能解决方案，既支持独立部署，也可协同运作。

作为具身智能的基础架构，VLA（视觉-语言-动作）模型通过融合视觉感知、语言理解和动作决策，使机器人具备理解环境并执行操作的能力。传统VLA模型存在跨场景适应性差的问题，更换硬件或环境后性能显著下降。Qwen-RobotManip通过创新设计解决了这一难题：其采用80维统一动作表征体系，为不同形态的机器人定义通用"肢体语言"，使机械臂能够理解基础物理规律与动作逻辑。该模型支持快速硬件适配，仅需数次反馈即可在新设备上稳定运行，彻底摆脱生硬的动作模仿模式。

在空间导航领域，Qwen-RobotNav基于Qwen-VL框架构建，创新性地将语言指令导航、目标搜索、自动驾驶等五大任务模块整合到统一系统。这种设计使机器人面对复杂任务时无需人工切换模型，例如在执行"将咖啡送到会议室"的指令时，系统可自动完成路径规划、障碍规避和物品抓取等全流程操作。测试数据显示，该模型在跨场景任务中的导航效率提升40%以上。

作为系列模型的"大脑"，Qwen-RobotWorld通过构建物理世界模拟器，实现对机器人动作的预判与优化。该模型基于对物体运动规律、空间关系等物理特性的深度理解，能够预测机器人在特定环境中的合理行为轨迹。这种预测能力使机器人在现实场景中可按照模拟路径精准执行任务，显著降低实际部署中的试错成本。目前该模型已支持动态环境下的实时推理，响应延迟控制在毫秒级。

司庆日展现AI新进展，科大讯飞多领域布局角逐全球科技之巅

走过27年，科大讯飞正在把"能理解、会思考"延伸到"能干活、能感知"。在刚过去的司庆日，这家公司以几项实质进展，勾勒出其AI产业化纵深布局的完整轮廓。首先是工业具身智能的突破。其次是消费端AI眼镜的即将落地，…

2026-06-17

MiniMax M3大模型开源：MSA技术优化计算，综合智能指数居全球开源模型首位

该模型从训练初始阶段便开展多模态混合训练，通过文本、图像等多类型数据交错学习，在预训练环节完成不同模态语义的深度融合，搭建起统一的跨模态语义体系，为多模态理解、内容生成以及复杂任务处理打下底层基础，也是业内首…

2026-06-17

步步高布局湘潭：全资成立大信京迪科技公司注册资本达千万

2026-06-17

航空领域专家领航，腾盾科创冲刺创业板，董事长聂海涛成就斐然

2026-06-17

刚被SpaceX收购的Cursor发布新模型：1.5万亿+参数，10万块GPU预训练

2026-06-17