在COMPUTEX 2026的开幕演讲中,高通公司总裁兼CEO安蒙抛出一个引人注目的观点:2026年将成为“智能体之年”。这一论断并非空穴来风,而是基于对AI行业发展趋势的深刻洞察。过去两年,AI领域的竞争焦点集中在云端,从大模型参数规模到GPU算力集群,再到训练成本,每一次技术突破都引发关于算力与模型能力的激烈讨论。然而,随着算力增长逐渐触及物理极限,行业目光开始转向应用端,寻找AI真正落地的方式——智能体应运而生。
传统AI与智能体AI的核心差异在于交互模式。前者更像是一个“问答机器”,用户输入指令,模型输出答案,主动权始终掌握在人类手中。而智能体AI则试图模拟人类思维,通过理解用户意图、分析上下文、拆解任务并调用工具,在多个系统间协同完成目标。例如,当用户要求“准备今天的工作简报”时,智能体不会直接生成文字,而是会读取邮件、日历、本地文档,整理待办事项,最终调用办公软件输出成果。这种转变意味着AI从“辅助回答”升级为“主动执行”,其能力边界被大幅拓展。
然而,智能体的普及面临现实挑战。如果所有计算任务都依赖云端,高昂的Token成本、网络延迟、能源消耗以及隐私风险将成为规模化落地的障碍。安蒙在演讲中指出,随着任务复杂度提升,对话式AI、推理AI和智能体AI的Token需求呈指数级增长。例如,简单问答可能仅消耗少量资源,但多轮推理、多工具协作等场景会迅速放大算力需求。因此,单纯堆砌云端算力已非可持续路径,如何高效利用算力成为关键问题。
高通的解决方案是“计算连续体”——一种将计算任务动态分配至终端、边缘、本地服务器和云端的架构。根据任务特性,简单、隐私敏感的操作可在设备端完成;需要大模型支持的高复杂度任务则交由云端处理;边缘设备和本地工作站则承担过渡角色。这种分工并非取代云端或终端,而是通过重新定义计算层级,实现成本、性能、时延和隐私的平衡。例如,文件索引、局部摘要等轻量任务可在本地完成,避免不必要的云端传输,既降低成本又保护隐私。
高通的战略与其技术积累密切相关。过去几十年,该公司在移动计算领域专注于在有限功耗和体积内提供强算力,这一经验可无缝迁移至智能体时代。从毫瓦级的可穿戴设备到千瓦级的数据中心推理系统,高通试图构建覆盖全场景的算力生态。安蒙强调,智能体时代需要的不只是单点突破,而是从芯片到网络、从终端到云端的完整体系。例如,其推出的Qualcomm AI200、AI250服务器已与云服务商合作部署,标志着其算力覆盖范围从个人设备延伸至数据中心。
对普通用户而言,智能体的影响将首先体现在个人设备上。安蒙预测,未来数字生态的中心将从手机或操作系统转向智能体本身,设备则成为其入口。例如,用户在手机发起任务后,若设备处理能力不足,可无缝切换至PC继续执行;戴上智能眼镜时,智能体可通过摄像头和麦克风获取新输入,结合此前任务提供服务。这种跨设备协同要求硬件具备更强性能:CPU需支持任务编排和系统协调,NPU和GPU负责本地模型推理,传感器则需捕捉环境数据以理解用户需求。
高通正将这一理念扩展至更多领域。在汽车场景中,智能体需同时理解用户需求和道路环境,分别由个性化智能和实体AI处理;机器人则需融合推理、控制、传感器融合等能力,成为移动计算、边缘AI和连接的综合体。高通还在探索6G与计算体系的融合,未来网络可能承担部分计算和感知任务,进一步紧密设备、边缘和云端的协作。
从芯片供应商到平台提供者,高通的转型折射出AI行业的深层变革。当智能体成为新的计算入口,终端设备、边缘计算和连接技术的重要性日益凸显。安蒙的“2026年之问”背后,是高通对AI竞争焦点的判断:从模型能力转向智能体生态,从云端算力转向全链路协同。在这场变革中,高通希望凭借其在移动计算和连接领域的技术积淀,成为支撑智能体运行的关键基础设施。