沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

智能体深度应用词元消耗激增 降本增效路在何方?

2026-04-04来源:快讯编辑:瑞雪

随着人工智能技术在各领域的渗透,关于大模型使用中Token消耗与成本控制的讨论日益成为焦点。Token作为大模型处理信息的最小单元,无论是日常提问还是生成内容,每一次交互都伴随着它的消耗。近期,智能体应用如“龙虾”的兴起,进一步推高了Token的使用需求,也让成本问题愈发凸显。

记者调查发现,智能体产品落地初期,简单交互场景的成本变化并不显著,但深度使用场景中,Token消耗量会呈指数级增长,直接推高使用成本。个人用户秦先生表示:“任务复杂度稍有提升,成本就明显增加,Token消耗与任务难度不成正比,超出预期。”企业层面的感受更为强烈——规模化应用AI的企业日均Token消耗已达百亿级,以中交AI中心为例,其开发的数千个智能体日均消耗上百亿Token,对应成本约十万元。

持续增长的Token需求对算力系统构成挑战。MiniMax稀宇科技副总裁严奕骏透露,公司每周都要进行算力扩容,算力资源始终处于“紧平衡”状态。中国电信北京公司AI技术负责人陈哲诗观察到,大模型技术演进拉动了应用层需求,算力租赁市场火爆,但客户对成本敏感度较高,优化基础设施效率、降低Token成本成为行业共同诉求。

Token与手机流量的计费逻辑本质不同。手机流量按传输量计费,缓存内容可重复使用,成本清晰可控;而Token作为AI处理信息的计量单位,用户需支付模型空间占用费、服务套餐费,每条指令执行都会产生实时消耗,功能扩展或权限开放还会带来额外支出。这种差异导致深度使用场景下,Token成本增长远高于流量成本。

降低Token成本已成为行业共识。中国信息通信研究院云计算与数字化研究所主任马飞分析,当前成本偏高源于行业处于发展初期,高端算力硬件成本高、资源利用率不足等多重因素叠加。随着技术成熟和算力供给优化,单位Token成本将逐步下降,需求爆发也将倒逼产业加速迭代。

企业正在通过多路径降本。月之暗面Kimi企业业务负责人黄震昕表示,公司通过底层模型架构创新提升效率,直接降低Token成本;阶跃星辰首席技术官朱亦博提出“智价比”概念,强调在保持模型智力水平的同时尽可能压缩成本。云服务机构则从资源配置入手,天翼云智算平台产品专家王曼介绍,通过算电协同、算网融合调度等技术,持续优化成本结构。

国家层面算力布局为普惠化提供支撑。中国信通院发布的《算力互联网体系架构研究报告》显示,我国智能算力规模已居全球第二,但高端算力、核心算法仍存在外部依赖。当前,全国一体化算力网络建设加速推进,通过统一调度优化资源配置,算力服务可触达性显著提升。同时,轻量化、低功耗本土大模型的发展,让更多普通用户能够以较低成本享受AI服务。

中国信通院云计算与数字化研究所副所长栗蔚认为,Token作为AI产业度量衡,其消耗总量反映应用深度,成本则体现算法算力效率。要实现Token普惠化,需构建优质算法、持续优化模型,降低单Token算力消耗,并搭建随需接入的算力节点网络,让AI服务真正走进千家万户。

国网黑龙江电力“人机协同”新实践:双臂机器人助力电网春检更安全高效
人民网哈尔滨4月3日电 3月31日,在黑龙江省七台河市10千伏中心线电网检修作业现场,智能带电作业机器人在地面作业人员的远程操控下,精准完成负荷侧接地环加装任务。这是国网黑龙江电力首次应用双臂带电作业机器人进…

2026-04-04

长三角低空经济“加速起飞”:首个室内无人机风洞投用破测试困局
别小看这阵“人造风”,这个风洞的投用可以有效破解现有风场测试环境的痛点——室外自然风场测试“追风跑”、室外人工风场测试“躲风测”,同时解决了传统测试中干扰因素多、测试误差大、数据重复性差等难题,填补了长三角…

2026-04-04

华为iMaster NCE-Fabric:以SDN技术赋能云数据中心高效运维与智能转型
华为iMaster NCE-Fabric作为面向企业和运营商数据中心市场的新一代SDN控制器,是构建云数据中心的核心组件,旨在解决传统数据中心网络与IT系统割裂、业务发放效率低、资源利用率不足等问题,通过软…

2026-04-04

关停Sora视频应用后 OpenAI收购TBPN播客 布局内容传播新路径
TBPN 主持人同时也将加入 OpenAI 的市场与传播团队,利用其对行业趋势的敏锐度,帮助 OpenAI 创新 AI技术的推广方式。对于一家 AI 公司而言,直接拥有媒体平台是否会对其编辑独立性构成潜在…

2026-04-04

谷歌Gemma 4开源模型系列登场:多版本适配不同场景,支持140余种语言
谷歌提供四个不同版本的Gemma 4模型,它们的区别在于参数数量。 A:Gemma 4在Apache2.0许可证下发布,模型权重可通过Hugging Face、Kaggle和Ollama平台获取,用户可以…

2026-04-04