沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

哈佛携手Perplexity研究:AI智能体协作显著提升效率,成本大幅降低

2026-06-10来源:快讯编辑:瑞雪

哈佛大学与Perplexity公司联合开展的一项研究显示,在人机协作场景中,AI智能体系统显著提升了任务处理效率。研究团队基于90天内的1万组真实生产数据对比发现,采用Perplexity Computer智能体系统完成任务的时间较传统对话式搜索缩短87%,综合成本降低94%。这项成果为AI工具在复杂工作场景中的应用提供了量化依据。

研究选取2026年2月27日至5月27日期间的数据,重点对比Perplexity Search(对话式答案引擎)与Perplexity Computer(具备工具调用能力的智能体系统)在相同任务中的表现。为确保对比有效性,研究团队仅保留涉及代码执行、浏览器操作、文件写入等实质性工具调用的会话样本,最终筛选出1万组高度相似的任务数据集。

在自主性维度,智能体系统展现出显著优势。Computer单次会话平均持续26分钟,是Search(33秒)的48倍。这种差距在不同领域表现各异:本地任务处理时长差距达75倍,科学类任务为26倍。值得注意的是,效率提升并未牺牲任务质量——Computer的有效不满率仅为1.3%,低于Search的2.9%。

成本分析揭示了效率提升的底层逻辑。虽然单个任务模型成本(4-10美元)远高于搜索(0.05美元),但智能体系统将人力边际成本从2.05美元降至0.16美元。以完成路径估算,"Search+人工"模式平均耗时269分钟,而"Computer+人工"模式仅需36分钟,时间压缩效果在需要多步骤工具调用的复杂任务中尤为明显。

研究同时指出两类工具的适用边界:对于简单、单步骤、可直接获取答案的问题,对话式搜索仍具优势;而涉及跨知识域协作、需要调用外部工具的复杂任务,智能体系统更能发挥其规划与执行能力。这种差异化定位为AI工具的场景化应用提供了实践参考。

中兴GUI手机智能体测评夺冠,技术领先开启手机智能交互新篇章
这种方式在这次测评里表现普遍更好,前三名都是API调用方案,比本地部署的模型得分高不少。本地部署的方案里,阿里的MAI-UI得分最高,也只有65.91分,字节的UI-TARS只拿到了30.19分。 现在大家…

2026-06-10

七千年文明与现代智造交织 郑州行见证河南传统与创新的交响乐章
大河网讯(记者 张磊 申华 刘思嘉 马绍坤)从七千年前的彩陶星空到中医问诊的机器人,从一杯甜蜜的国民茶饮到百米长的“地下蛟龙”再到奔跑全球的智能客车……6月8日至9日,“中国式现代化的万千气象”网络名人河南行…

2026-06-10