沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

Step-3:颠覆性AI模型,低成本高效能引领AI新时代

2025-08-07来源:ITBEAR编辑:瑞雪

在2025年7月,StepFun公司的研究团队发布了一项革命性的研究,题为《Step-3 is Large yet Affordable: Model-system Co-design for Cost-effective Decoding》。这项研究彻底颠覆了大型AI模型成本高昂的传统认知,展示了一个拥有321亿参数的模型,通过创新设计,其运行成本竟然比许多参数更少的模型更低。该研究的完整论文可通过arXiv:2507.19427v1访问。

在AI技术飞速发展的今天,大型语言模型被视为数字世界的超级大脑。然而,这些“大脑”在思考时消耗的计算资源巨大,运行成本高昂。StepFun团队面临的挑战是,如何设计一个既聪明又经济的“超级大脑”——Step-3。他们的解决方案是引入了一种全新的设计思维,即“注意力-前馈网络分离”(AFD)和多矩阵分解注意力(MFA)。

传统的AI模型设计往往将注意力机制和前馈网络层层堆叠,类似于建造大楼的“叠积木”方式。而StepFun团队则采用了“工厂流水线”的思维,将注意力计算和前馈网络分别放在不同的“车间”独立运行,并通过精心设计的“传送带”传递中间结果。这种设计使得整个系统能够像现代汽车制造厂一样高效协调运作。

更引人注目的是,Step-3采用了一种全新的注意力机制——多矩阵分解注意力(MFA)。传统的注意力机制需要记住所有对话内容,而MFA则像是一个聪明的秘书,用更少的“记忆空间”处理同样复杂的信息,同时保持极高的理解准确度。这一设计显著减少了Step-3在处理长篇对话时的存储空间需求,提高了计算效率。

研究结果显示,在相同的硬件条件下,Step-3的解码成本比同类模型DeepSeek-V3降低了约40%,比Qwen3 MoE 235B也有显著优势。在H800 GPU上,Step-3的解码吞吐量达到每秒每GPU 4039个词汇单元,远超DeepSeek-V3的2324个。这些发现表明,通过硬件感知的模型-系统协同设计,可以在不牺牲模型能力的前提下,大幅降低AI服务的运营成本。

Step-3的创新不仅在于技术突破,更在于其设计理念。研究团队发现,当前AI模型设计中存在两个普遍误区:一是过度追求减少“记忆负担”而忽视“思考效率”,二是盲目追求“专家系统”的稀疏性而忽略硬件特性。Step-3通过精心平衡注意力机制的计算强度、混合专家系统的稀疏度,以及硬件适配性,找到了这些因素之间的最佳平衡点。

Step-3的核心架构创新在于将注意力和前馈网络完全分离,让它们各自在最适合的硬件上运行。这种设计不仅提高了计算效率,还使得系统可以根据实际负载动态调整配置比例,实现灵活的资源分配。Step-3的多矩阵分解注意力机制通过减少缓存需求并保持适中的计算强度,在各种硬件平台上都表现出色。

为了充分发挥Step-3的性能,研究团队还开发了StepMesh通信库,这是一个高效的“神经系统”,用于协调各个部分的工作。StepMesh采用了异步处理架构、基于CPU的操作执行、预注册张量机制等多项创新技术,实现了超低延迟的数据传输,确保了Step-3各个组件的高效协调运行。

在实际测试中,Step-3展现了压倒性的性能优势。与DeepSeek-V3相比,Step-3在H800硬件上的处理速度提升了74%,且在不同硬件平台上都能维持相对稳定的高性能表现。在成本效益方面,Step-3也表现出色,处理8K上下文长度的对话时,每100万词汇单元的成本仅为0.055美元,明显低于竞争对手。

Step-3的成功不仅为AI技术的未来发展指明了方向,也为整个行业树立了新的标杆。它证明了通过精心的模型-系统协同设计,可以在保持模型能力的同时,显著降低AI服务的运营成本。这一成果有望推动AI技术的更广泛普及,为更多企业和开发者带来实惠。

对于普通用户而言,虽然目前Step-3主要面向企业级AI服务提供商,但他们有望通过各种AI应用间接体验到Step-3带来的好处,如更便宜的AI服务或更快的响应速度。随着StepFun团队开源部分核心技术,预计将有更多基于Step-3理念的产品出现,逐步惠及广大用户。

《缔造者放逐之地》更新卡顿?三招助你快速解决更新难题
《缔造者放逐之地》作为一款深受欢迎的沙盒创造游戏,玩家在更新时常会遇到“正在更新服务”或“卡更新服务”的问题,导致无法正常进入游戏。这类问题通常与网络环境、系统缓存或文件完整性有关,下面提供三个实用的解决方…

2025-10-23

筑牢CAD图纸安全防线:四大策略加专业软件,守护企业核心资产
真正的“终极武器”,是部署如域智盾这类专业的CAD图纸防泄密软件,实现从“防”到“控”的全面升级。 在员工查看CAD图纸时,自动在屏幕上叠加动态水印(含用户名、IP、时间等),任何拍照、截图行为都将暴露泄密者…

2025-10-23

苹果手机双卡全攻略:从流量切换到高级设置,新手也能轻松掌握
苹果手机双卡切换与流量设置终极指南

2025-10-23

枣庄网络布线好帮手:Microscanner2测试仪MS2-100与MS-POE实用指南
一种名为Microscanner2的测试设备,具体型号包括MS2-100和MS-POE,在枣庄地区的应用逐渐增多,为网络安装与维护提供了实用的解决方案。 Microscanner2测试仪是一类用于网络电缆诊断…

2025-10-22

烽火通信“光足迹”赋能巴西:实现哑资源可视管理,推动光纤网络绿色数智升级
如何高效管理这些资源,是提升网络质量与运营效益的关键。方案通过数字化平台实现对全链路损耗的实时监控与自动巡查,能够进行远程故障诊断与精准定位,将平均定障时间缩短至5分钟,显著压缩了业务中断时长,优化了最终用户…

2025-10-22

华为Mate 70 Air现身电信库,或携eSIM技术加入竞争与苹果同赛道角逐
iPhone Air马上就要在国内发售了,这是国内首款支持eSIM技术的手机,随着iPhoneAir的发售,后续也有更多支持该技术的手机,比如国产厂商的OPPO Find X9 Pro卫星通信版就支持了eS…

2025-10-22

硅碳负极电池赋能智能穿戴:续航突破,开启全天候健康监测新篇章
从市场前景看,硅碳负极电池技术已经在智能穿戴设备领域的应用正引发全球范围内的关注与布局,已经有不少相关品牌已经推出了搭载硅碳负极电池的产品。 以华为、荣耀、为首的品牌们,已经率先将硅碳负极电池技术应用于其最…

2025-10-21

牌面拉满!比亚迪成为多国元首的选择
近年来,我国新能源汽车产业在科技创新驱动下实现跨越式发展,比亚迪作为行业领军企业,技术领先全球瞩目,凭借过硬的技术实力与产品品质,赢得多国元首青睐,成为“中国制造”向“中国智造”转型升级的典型代表,更

2025-10-21

抖音电商持续治理虚假宣传保健功效,清退违规达人4.3万名,违规商家793家
10月20日,抖音电商安全与信任中心发布治理虚假宣传保健功效的进展,公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象,已成为食品行业的顽疾。据了解,部分不良商家、达人将普通食品包装为“保健品”或

2025-10-21

Steam购买遇“意外错误”别慌!多招教你轻松化解购买难题
当网络传输存在较高丢包率时,支付网关的通信可能被强制切断,导致交易验证信息无法完整传递给Steam服务器。下次当你在Steam购物时遇到"发生意外错误购买尚未完成"的提示,不妨尝试这些方案,相信能帮你顺利完成…

2025-10-21