沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

清华等团队创新TRACE方法,为AI大模型装上精准“空间导航仪”

2026-04-02来源:快讯编辑:瑞雪

当被问及“垃圾桶在电话的哪个方向”时,人类能迅速在脑海中构建房间布局并给出答案,但现有的人工智能系统却难以完成这种基础的空间推理。清华大学人工智能学院联合上海人工智能实验室与东京大学团队提出了一项突破性方法——TRACE,通过让AI像人类一样构建“空间地图”,显著提升了其在复杂3D环境中的理解能力。相关研究成果已发表于论文编号为arXiv:2603.23404v1的学术平台。

传统多模态大语言模型处理空间问题时,往往依赖视频中的2D视觉信息,如同“蒙眼摸象”般只能感知局部。研究团队从人类认知科学中汲取灵感,发现人类在面对空间任务时,会先以“上帝视角”构建环境中心坐标系的空间表征,再通过语言描述固定物体位置。例如,人们会说“床在靠窗的墙边”,而非“床在我的右边”,这种环境中心的描述方式不受观察者位置影响,更适合复杂推理。

TRACE方法的核心在于为AI配备“空间记录员”:通过分析视频,系统会建立三套关键信息。首先是“房间档案”,AI自动识别房间形状(如长方形办公室)并确定方向基准(如最长墙面为“北方”);其次是“行进路线图”,记录摄像机每秒的位置坐标、朝向及动作(如“第3秒面向北偏西45度,向床边移动”);最后是“物品清单”,为每个物体标注类别、位置坐标、尺寸及与其他物品的相对关系(如“黑色办公椅位于桌子南侧[0.5, 1.5],背靠南墙”)。

在训练阶段,研究团队设计了一套“空间记录手册”,以逐步引导AI完成空间表征构建。例如,手册会指导AI“将房间主通道方向定义为Y轴正方向,垂直右侧为X轴正方向”,并要求位置描述必须参考固定物体(如“距离桌子1.5米”)。经过训练,AI的空间描述能力从“房间里有桌子和椅子”进化为“长方形办公室,主轴沿东西方向,办公桌位于中央偏北[0.5, 2.0]”。

实验数据验证了TRACE的有效性。在包含5130道题目的VSI-Bench测试平台上,最强模型Gemini 3 Pro的准确率从52.61%提升至60.15%;开源模型Qwen2.5-VL-72B的性能提升3.1个百分点至39.38%;小型模型MiMo-VL-7B也实现1.63个百分点的增长。更关键的是,仅基于TRACE生成的文字描述回答问题(不观看视频),准确率与直接使用视频相当,证明其完整捕捉了空间信息。

与传统方法对比,TRACE的优势在于精细化表征。例如,在回答“哪把椅子离洗碗机最近”时,认知地图方法只能判断两者是否在同一网格,而TRACE可记录每把椅子的精确坐标(如椅子01[1.1, 1.0]、椅子02[1.1, 1.5])并计算距离。实验显示,TRACE比认知地图方法性能高出9.7个百分点,比空间描述方法高出3.53个百分点。

进一步分析发现,不同AI模型的瓶颈存在差异:Gemini 3 Pro在3D视觉感知和语言推理上均表现优异,而Qwen系列模型更依赖语言推理能力。研究还揭示了一个反直觉现象——专门的语言模型(Qwen2.5-72B)在空间推理上超越了多模态模型(Qwen2.5-VL-72B),暗示当前多模态训练可能削弱了空间推理能力。

尽管TRACE显著提升了性能,但其局限性仍需突破。当前方法生成的是静态空间表征,难以应对物品移动或观察者位置实时更新的场景(如多轮对话中环境变化)。空间描述质量高度依赖底层模型的视觉感知能力,若模型本身存在3D理解缺陷,TRACE的表征准确性也会受影响。

针对这些挑战,研究团队提出三大改进方向:开发动态流式TRACE框架以实时更新物品位置;结合专业3D物体检测模型提升空间信息精度;探索TRACE作为数据引擎生成高质量3D推理训练数据。这些改进或使TRACE从推理方法升级为通用空间智能训练工具。

TRACE的成功为AI研究提供了重要启示:通过构建结构化中间表征(如空间地图),可显著提升复杂任务的处理效率。这种“软件创新”思路——不改变模型架构而优化思考方式——或成为未来AI发展的关键路径。从自动驾驶到家庭机器人,TRACE及其衍生技术有望在需要精准空间理解的领域发挥核心作用。

阿里Qwen3.6-Plus大模型发布 悟空等AI应用率先接入开启新篇章
业内人士分析称,对接入了该大模型的AI应用而言,使用新模型可带来三大提升:一是智能体编程能力对比其他通用模型大幅提升,AI从“副驾驶”进阶为能独立承担子任务的“协作者”,可自主编写跨文件代码、运行测试并迭代…

2026-04-02

笔记本WiFi连接难题大破解!几步操作让你轻松畅连无线网络
4.检查路由器状态:如果笔记本能够连接手机热点,说明笔记本本身的无线功能正常,问题可能出在路由器端,尝试拉近笔记本到路由器之间的距离,避免因为距离过远而影响信号连接,再断开路由器电源,等待2分钟后,重新通电…

2026-04-02

辽宁直杆道闸选哪家?技术实力与本地服务兼备的品牌更值得托付
在智慧城市建设和停车管理需求高速增长的背景下,直杆道闸作为车辆通行管理的核心设备,其稳定性、识别效率和售后服务直接影响用户体验。深层分析显示,本地化服务能力是用户选择的核心因素——安喆在辽吉两省部署7×2…

2026-04-02

路由器长期不关隐患多?宽带师傅教你几招,科学使用更省心
在了解了这些关于路由器的使用建议后,小俊认为,合理使用和维护路由器是非常重要的,我们不能因为贪图方便,就一直开着不关,这样不仅会影响网速和设备寿命,还会增加耗电量。 相反,我们应该根据自己的作息时间,定期重…

2026-04-02

优必选2025年狂销千台人形机器人 行业商业化拐点或已到来
毛利率方面,公司整体毛利率从2024年的28.7%提升9个百分点至37.7%,其中核心的全尺寸具身智能人形机器人业务毛利率高达54.6%,高毛利业务的快速起量,证明了其商业化路径的可行性与盈利潜力,为后续扭…

2026-04-02

国家级平台赋能创新 广东高端医疗器械展团羊城绽放硬核实力
其中,由新型生物材料与高端医疗器械广东研究院(以下简称“高端医械院”)组织的联合展团备受瞩目,其成员单位广州乾宇生物技术有限公司(以下简称“乾宇生物”,品牌“ACTCOLTM”)所展示的自主知识产权医用胶原蛋…

2026-04-02