沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

英伟达Cosmos 3问世:全开源全模态,为物理人工智能发展注入新动力

2026-06-01来源:快讯编辑:瑞雪

英伟达今日宣布推出全球首款全开源全模态大模型——Cosmos 3,这款专为物理人工智能设计的开放世界基础模型,通过混合Transformer架构实现了视觉推理、世界生成与动作预测的深度融合。该模型能够原生处理文本、图像、视频、环境音效及动作轨迹等多模态数据,其物理仿真精度达到行业领先水平,可将物理AI系统的训练与评估周期从数月压缩至数日。

针对物理AI领域长期存在的数据泛化难题,Cosmos 3创新性地采用双阶段处理机制:先通过推理Transformer解析物体交互规律、运动轨迹及时空关联,再利用生成类Transformer完成视频生成与动作预测。这种架构设计使其能够基于有限训练数据,在真实场景中实现高效迁移。该模型基于数十亿级多模态数据集训练,涵盖文本描述、环境图像、动态视频、空间音效及机械动作轨迹等多元数据类型,显著降低了开发者构建物理AI系统的数据门槛与成本。

为加速技术生态建设,英伟达同步发起"宇宙联盟",联合Agile Robots、Black Forest Labs、Generalist等六家顶尖机构,共同推进世界模型技术研发。联盟成员将共享预训练模型资源,并针对机器人控制、自动驾驶等垂直领域开展联合优化。英伟达CEO黄仁勋强调:"当多模态推理与世界模型实现突破,物理AI的变革浪潮已不可阻挡。Cosmos 3的开源将赋能开发者跨越技术鸿沟,打造具备真实世界感知与决策能力的智能系统。"

在权威评测中,Cosmos 3展现卓越性能:其世界生成精度在Artificial Analysis等四大基准测试中登顶,动作策略能力领跑RoboLab系列榜单,视觉理解指标刷新VANTAGE-Bench纪录。针对不同应用场景,该模型提供三大专用版本:追求极致精度的Super版支持机器人与自动驾驶模型二次训练;轻量化Nano版可在数秒内完成视频解析与动作推理;即将发布的Edge版将实现边缘设备实时推理,满足工业巡检、物流分拣等低延迟场景需求。

开发者可通过三种模式调用Cosmos 3能力:作为多模态图文大模型实现跨模态理解,作为世界模型构建物理环境仿真系统,或作为动作模型主干网络训练专项任务机器人。目前Super与Nano版本已开放下载,配套开发工具包包含数据预处理管道、模型微调指南及200+预置场景模板,帮助开发者快速构建定制化物理AI解决方案。

京东近150亿重仓武汉:物流零售科技协同,打造产业融合新样本
但你把京东、阿里在武汉的账翻一遍,会发现一件有意思的事:两家企业早已在此重金落子、深度布局,但唯有京东,在武汉把物流、零售、科技三张牌打成了深度协同的完整生态。评判一家企业对一座城市的诚意,从来不是看首次投…

2026-06-01

苹果Apple Glass野心勃勃:欲重塑眼镜行业生态 剑指大众消费市场
报道称,苹果旗下首款智能眼镜 Apple Glass 将通过自身品牌影响力、工业设计能力以及与 iPhone的深度联动吸引消费者,目标价格区间预计锁定在 200 至 500 美元(IT之家注:现汇率约合 …

2026-06-01

OpenAI CEO发布招聘启事:加速进军机器人领域,助力人类未来生活
OpenAI CEO萨姆·奥尔特曼(Sam Altman)今日在X平台发布OpenAI Robotics招聘信息,称公司正在招聘优秀的全栈硬件、运营、系统及机器学习工程师,研发和制造出对人类社会有用的机器人。…

2026-06-01

星迈创新:以AI技术为翼 引领全球泳池机器人行业开启智慧清洁新篇章
尤其是 AquaSense X的推出,首次将AI环境感知、智能路径规划、全域清洁与自清洁基站整合为完整系统,推动泳池机器人从“自动化工具”迈向具备环境理解与自主清洁能力的“AI智能化清洁伙伴”。 在这一行业…

2026-06-01

宇树科技科创板IPO过会,人形机器人领跑,未来业绩波动受关注
报告期内,公司四足机器人销量合计超33,000台,奠定了公司在全球四足机器人市场的优势地位。 同时,公司预计2026年1-6月营收约为10.52亿元至11.28亿元,同比增幅约为35.62%至45.41%…

2026-06-01

星际荣耀SQX-3运载火箭:海上回收高精度导航系统无人机挂飞试验圆满成功
月 1 日消息,星际荣耀今日宣布,近日利用“星际归航”号海上回收船,在广东阳江海域圆满完成了SQX-3运载火箭海上回收高精度导航系统无人机挂飞试验,各项技术指标满足设计要求。 官方表示,此次试验的顺利完成,…

2026-06-01