沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

斯坦福MIT联合推出ReCAP:攻克长上下文难题,性能显著超越ReAct

2025-12-05来源:快讯编辑:瑞雪

斯坦福大学与麻省理工学院(MIT)联合研究团队近日宣布,推出一种名为ReCAP的新型AI推理框架,在长上下文任务中展现出显著优势,全面超越当前主流的ReAct框架。这一突破性成果标志着AI智能体推理领域迎来新一代通用架构,为解决大语言模型在复杂任务中的核心挑战提供了创新方案。

自2022年ReAct框架问世以来,AI推理领域涌现出众多复杂架构,但多数因结构冗余导致泛化能力不足。研究团队指出,现有框架在处理长序列任务时普遍存在三大瓶颈:目标漂移(执行过程中偏离初始目标)、上下文断层(高层规划与底层执行脱节)以及成本爆炸(递归推理导致计算资源指数级增长)。这些问题使得ReAct成为过去三年中最稳定、通用的基准框架。

ReCAP通过递归树结构与三大核心机制,首次实现了序列推理与层级推理的有机统一。其"计划前瞻分解"机制允许模型生成完整子任务列表后动态优化后续计划;"结构化父任务再注入"机制确保所有任务共享单一上下文,通过父任务思维回溯保持目标一致性;"滑动窗口记忆"机制则通过关键历史保留机制控制内存占用,从根本上避免成本失控。研究负责人表示:"这种设计让模型既具备全局视野,又能聚焦当前步骤,类似人类在复杂任务中'边规划边调整'的思维方式。"

在严格遵循pass@1评测标准(不使用重试或投票机制)的实验中,ReCAP在多项基准测试中取得突破性进展:在长序列具身任务Robotouille(同步模式)中成功率达70%,较ReAct提升84.2%;异步模式下成功率53%,提升112.5%;在代码编辑任务SWE-bench Verified中成功率44.8%,优于ReAct基线5.2个百分点。更关键的是,这种性能提升不依赖样本层面的优化,展现了真正的执行稳定性。

技术突破背后是计算成本的权衡。实验数据显示,ReCAP的总计算量约为ReAct的三倍,主要源于计划前瞻分解机制带来的额外模型调用。但研究团队强调,在医疗诊断、自动驾驶等对准确性要求极高的场景中,这种成本增加完全可接受。麻省理工学院Alex Pentland教授指出:"当性能提升幅度超过成本增速时,这就不是简单的技术迭代,而是范式转移的开始。"

该框架的潜力已延伸至具身智能与空间智能的交叉领域。研究演示中,ReCAP成功规划了机器人完成多步骤厨房任务,其递归规划能力与空间感知模型形成互补——前者负责长期目标分解,后者处理实时环境交互。这种协同模式为自主机器人、复杂系统维护等应用开辟了新路径。斯坦福博士后研究员Jiaxin Pei透露,团队正在探索将ReCAP与多模态大模型结合,使其能处理包含图像、文本、传感器数据的混合输入。

目前,ReCAP的代码已开源,其模块化设计允许开发者根据需求调整递归深度与记忆窗口大小。这项研究不仅为AI推理提供了新基准,更揭示了递归结构在通用智能中的核心价值。正如论文所论:"从图灵机到人类认知,递归始终是处理复杂性的基础逻辑。ReCAP的实践表明,这种逻辑可以通过工程化手段转化为可计算的智能形态。"

IDC报告:2025年前三季度全球智能扫地机器人出货1742.4万台,中欧市场领涨
IDC《全球智能家居设备市场季度跟踪报告,2025年第三季度》显示,2025年前三季度,全球智能扫地机器人市场累计出货1742.4万台,同比增长18.7%;其中三季度出货616.1万台,同比增幅达22.9%。…

2025-12-05

四年筑基“算力黑土地”,张平安履新董事长,华为云引领AI新征程
这样的性能表现,让国有六大行逐渐将核心业务迁移至GaussDB,截至2025年,其在六大行核心系统的应用占比已位居行业第一。从水泥窑炉到钢铁热轧线,从高铁轨道到露天矿山,华为云以昇腾 AI 为算力底座、盘古…

2025-12-05

京东“TGT燃力之旅”启幕,与青年技术人才共绘AI时代新蓝图
活动聚焦人工智能等前沿技术趋势与产业融合,通过高管对话、技术圆桌、业务参访等环节,为已通过及有意加入京东的优秀技术人才提供了与技术负责人面对面交流的平台,全面展现了京东的技术战略、产业实践与人才理念。京东方面…

2025-12-05

超声波液位传感器:户外楼顶水箱液位监测的智慧之选与高效方案
对于楼顶水箱的液位实时监测,超声波液位传感器的安装通常需要在水箱顶部开孔,以便传感器能够准确地测量到液面的反射回波。它不仅能够精准测量水箱中的水位,还能用于测量其他液体,如污水、净水、饮料、化学试剂等,甚至…

2025-12-05

山东科嘉220V充电机:高效恒流恒压,多场景适用安全又智能
山东科嘉电气的 220V 高效快速充电机(恒流恒压可调式) 是一款技术先进、功能全面、安全可靠的高性能充电设备,适用于电动车、工业设备、通信基站、储能系统及应急供电等多个领域。某物流中心部署后,电池循环寿命…

2025-12-05

罗永浩谈5G:虽无“杀手级”应用 却已在多领域默默发力
2025-12-04 13:20:49 作者:狼叫兽 2025年12月4日,近日,罗永浩在与数码博主交流时谈及5G技术,表示从普通用户日常使用体验来看,5G带来的改变并不显著。全国已建成5G行业虚拟专网6.…

2025-12-05

任正非:华为不盲目追量子“虚火”,聚焦当下可落地的硬科技
在量子计算被全球热炒为“下一代算力核弹”的狂潮中,华为创始人任正非近日一语惊人: “量子研究是国家命题,华为无法承担。”同理,即便量子计算终将颠覆加密体系、重塑算力格局,但在其尚未稳定、不可控、难量产的当下,…

2025-12-05