沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

Kimi携手阿里云:AI Agent落地背后的技术协同与生产级底座构建

2026-01-29来源:快讯编辑:瑞雪

在人工智能领域,AI Agent正逐步从概念走向实际应用,成为推动行业创新的重要力量。Kimi作为这一领域的先行者,通过将Agent能力融入具体产品,不仅推出了“深度研究”、“Agentic PPT”、“OK Computer”及“数据分析”等多项创新技能,更在C端业务中成功承载了数以万计的并发请求,展现了强大的技术实力和市场潜力。

面对如此庞大的用户需求,Kimi在基础设施层面进行了深度布局。为了确保每一次请求都能得到快速响应,Kimi与阿里云展开了深度合作,以阿里云容器服务Kubernetes版ACK和阿里云容器计算服务ACS的Agent Sandbox为核心,构建了一套端到端的Agent Infra基础设施体系。这一体系不仅为Kimi的Agent产品提供了强大的算力支持,更在弹性、成本、稳定性等方面实现了全面优化。

AI Agent的落地并非易事,它要求系统能够理解复杂的用户意图,并自主分解任务、调用工具、执行并完成一系列多步骤工作流。在“深度研究”和“OK Computer”等场景中,Kimi的Agent通过自然语言指令,驱动虚拟计算机沙箱环境自动化执行复杂任务流,包括工具调用、联网搜索、代码调测等。这一过程中,系统需要同时处理数以万计的用户请求,每个请求都可能触发一次或多次Agent的复杂推理和工具调用,对系统的即时响应能力和资源分配效率提出了极高要求。

为了应对这些挑战,Kimi在沙箱环境的弹性能力与启动速度上进行了重点突破。传统的虚拟机或容器部署方式启动时间较长,对于需要即时响应的Agent服务而言难以接受。为此,Kimi采用了ACS Agent Sandbox技术,该技术基于轻量级虚拟机(MicroVM)技术,将虚拟化开销降低90%,实现了大规模并发弹性下的秒级启动。同时,通过预测预调度、资源复用等手段,进一步节省了沙箱环境的调度、创建时间,确保了系统的高效运行。

除了即时响应能力外,Kimi还注重沙箱环境的隔离性与安全性。由于Agent会执行由大模型生成的未经人工验证的代码,沙箱必须提供强隔离能力,防止其对其他租户、宿主机或其他关键系统造成影响。为此,Kimi采用了硬件级别的计算安全隔离环境,结合Network Policy、Fluid等能力增强,提供了Pod级别网络、存储的端到端安全运行环境。

在满足即时响应和安全隔离的同时,Kimi还面临着如何保持沙箱状态连续性以及应对大规模并发带来的调度压力等挑战。对于需要长时间运行的Agent任务,沙箱需要具备灵活的状态保持与恢复能力,以便在任务暂停后能够快速恢复到之前的执行点。为此,Kimi引入了实例休眠及唤醒能力,支持沙箱环境的一键休眠和快速唤醒,确保了任务的连续性。同时,通过构建常态算力与Serverless算力的分级调度体系,Kimi成功应对了大规模并发带来的系统稳定性问题,实现了容量确定性、弹性速度与成本优化的平衡。

在成本控制方面,Kimi同样表现出色。通过合理的资源调度策略,Kimi实现了按需弹性进行稳定的资源调度,以最低的成本支撑了海量并发。特别是在使用ACS Agent Sandbox的过程中,Kimi通过内存状态的持久化技术,在休眠期间释放了沙箱的CPU和内存资源,降低了休眠期间的资源成本。同时,支持数秒快速唤醒Pod的功能,使得Kimi在成本与体验之间找到了最佳平衡点。

随着用户规模的扩大和业务需求的不断升级,Kimi对基础设施的要求也越来越高。为了确保在如此大规模的负载下集群依然能够稳定运行,Kimi对Kubernetes的核心组件进行了深度优化和加固。在调度器层面通过参数调整提高了队列处理深度以及单个Pod的处理速度;在API Server层面则通过全链路端到端参数优化和管控组件动态弹性扩容等手段,满足了Agent沙箱秒级弹性、高并发API访问的诉求。

高质量的搜索和记忆服务是构建复杂Agent的关键基础。为此,Kimi借助阿里云多模数据库Lindorm构建了具备高效检索和海量存储能力的记忆与搜索模块。Lindorm作为一个多模数据库,集成了宽表引擎、搜索引擎、向量引擎、AI引擎四大核心组件,数据在内部自动流转无需自建同步链路。这一特点为Kimi快速构建Agent背后的AI搜索基础设施提供了有力支持。

2025年中国开源AI崛起:阿里千问下载量超10亿 成全球最热门模型家族
今日,全球最大开源社区Hugging Face最新数据显示,阿里千问大模型开源数量突破400个,是全球AI开源社区采用率最高的模型。2025年12月Hugging Face数据显示,全球开源模型采用率排名…

2026-01-29

科大讯飞2025年净利预增40%-70% “讯飞星火”生态助力行业加速赋能
同时,“讯飞星火”产业生态进一步加强,讯飞开放平台开发者数量突破1000万,其中,海外开发者56.4万。2025年全年新增开发者数量超过224万,其中大模型开发者新增127万,开发者数量持续高速增长,加速行…

2026-01-29

山东未来机器人再获数亿融资,技术突破与产业化并进深耕深海赛道
通过组建软件、硬件、液压等多个研发项目组,公司在深海耐压密封、远距离信号传输、深海液压动力等关键技术领域取得了突破,完成了多项核心部件的国产化替代。资本的支持为企业提供了研发和扩张所需的资金,但如何将技术优势…

2026-01-29

解锁人工智能算法奥秘:多领域应用场景深度剖析与实践指南
工业产品性能预测及故障检测、工业元器件质量检测与故障类型推测等场景,运用图像识别和机器学习算法,如卷积神经网络、XGBoost、随机森林等,实现产品故障快速识别、质量检测和故障原因分析,预测准确率高、速度快…

2026-01-28

KHX50煤矿本安型避雷器:井口通讯防雷关键,选型安装维护要点全解析
井口电话线路防雷箱是矿井通讯系统防雷工程中最重要、最前端的屏障。 它的选型、安装和维护都必须严格按照规范执行,任何疏忽都可能意味着整套井下通讯系统在雷击面前“裸奔”,后果不堪设想。投资一个高质量、高可靠性的…

2026-01-28

乐聚机器人冷晓琨:从春晚舞台到入选2025行业十大杰出人物
瑞财经1月28日,由瑞财经推出的“2025年度机器人行业十大杰出人物”榜单揭晓,乐聚机器人董事长冷晓琨入选。 “2025年度机器人行业十大杰出人物”榜单围绕专业能力、业绩表现、行业影响力等维度综合评选得出。…

2026-01-28

范式智能戴文渊:AI应用生态待破局 携手国产算力共筑低成本算力云
但非常遗憾的一点,我们现在99%的,哪怕是在中国的中国人做的AI应用,也是英伟达体系下的,不是在国产的信创体系下。”当然,在干这件事情之前,我们也要看到这方面的差距,因为没有差距就没有我们的价值,也不需要我们…

2026-01-28