沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

摩尔线程开源两大AI框架:加速国产GPU训练与推理效率

2025-03-17来源:ITBEAR编辑:瑞雪

摩尔线程今日宣布了一项重大开源举措,正式推出了MT-MegatronLM与MT-TransformerEngine两大AI框架。这一举措标志着摩尔线程在国产全功能GPU上实现了混合并行训练和推理的重大突破。

据摩尔线程官方介绍,MT-MegatronLM是一个专为全功能GPU设计的开源混合并行训练框架。它不仅能够支持dense模型和多模态模型的高效训练,还特别擅长处理MoE(混合专家)模型。而MT-TransformerEngine则专注于Transformer模型的训练与推理优化,通过一系列技术革新,如算子融合和并行加速策略,充分挖掘了摩尔线程全功能GPU的计算潜力。

两大框架的技术亮点在于硬件适配与算法创新的深度融合。其中,混合并行训练技术能够灵活应对不同模型架构的复杂运算场景,而FP8混合训练策略则结合摩尔线程GPU原生支持的FP8混合精度训练,有效提升了训练效率。高性能算子库muDNN与通信库MCCL的深度集成,进一步优化了计算密集型任务和多卡协同的通信开销。

在实际应用方面,摩尔线程展示了令人瞩目的成果。在全功能GPU集群上,Llama3 8B模型的训练任务在FP8混合精度加速技术的加持下,实现了28%的加速,且loss几乎无损。同时,摩尔线程还成功复现了DeepSeek满血版训练流程,展示了其对复杂AI训练任务的高效支持。

两大框架还具备完善的异常处理和兼容性。内置的rewind异常恢复机制能够自动回滚至最近稳定节点继续训练,确保了大规模训练的稳定性。同时,两大框架兼容GPU主流生态,为开发者构建自有的AI技术栈提供了底层支撑。

摩尔线程官方表示,他们将持续优化MT-MegatronLM与MT-TransformerEngine框架,并引入更多先进功能。未来,用户将能够体验到Dual Pipe / ZeroBubble并行策略带来的更高并行训练效率,以及多种FP8优化策略带来的性能和稳定性提升。异步checkpoint策略和优化后的重计算策略也将进一步提高训练过程中的容错能力和效率。

摩尔线程的这一开源举措无疑为AI领域注入了新的活力。通过开放两大核心框架,摩尔线程不仅展示了其在国产GPU技术上的深厚积累,也为广大开发者提供了一个强大的AI开发平台。未来,随着框架的不断优化和功能的持续引入,我们有理由相信,摩尔线程将在AI领域取得更加辉煌的成就。

对于感兴趣的开发者和研究人员,可以通过以下链接获取两大框架的开源代码:

MT-MegatronLM开源地址:https://github.com/MooreThreads/MT-MegatronLM

MT-TransformerEngine开源地址:https://github.com/MooreThreads/MT-TransformerEngine

摩尔线程Simumax开源地址:https://github.com/MooreThreads/SimuMax

“祖冲之三号”同款芯片赋能!我国超导量子计算机“天衍-287”搭建完成并开放服务
据了解,该量子计算系统具备“量子计算优越性”能Q力,处理特定问题的速度比目前最快的超级计算机快4.5亿倍,未来将接入“天衍”量子计算云平台并首次面向全球开放应用服务,这也将是我国首个具备“量子计算优越性”的量…

2025-11-14

小天互连IM系统:打破政企信息孤岛 驱动一体化协作新变革
某省级政务大厅在信创升级中,通过小天互连IM系统实现了与政务服务平台、电子证照系统的无缝对接,群众办事进度可直接通过即时通讯推送,办理效率提升50%,印证了其国产化集成的稳定性。 从国产化生态适配到开放 A…

2025-11-14

虚拟化与超融合:从架构到应用,一文读懂如何选择适合的IT方案
超融合平台通常基于成熟的虚拟化技术,例如它可能内置虚拟机管理功能,但更强调整体资源的统一管理。性能上,虚拟化可能因资源竞争而出现波动,而超融合的分布式存储设计可以提供更一致的I/O性能,特别是在高并发场景下,…

2025-11-14

安科瑞ASCB3-80m智能微断:全参量监测+远程操控,筑牢低压配电安全防线
智能微型断路器配合智能网关使用,对用电线路的关键电气参数,如电压、电流、功率、温度、漏电、能耗等进行实时监测,具有远程操控、异常预警、事故跳闸告警、电能计量统计、故障定位等功能。ASCB3-80m 系列智能…

2025-11-14

杭州上城第三批50个“人工智能+”场景发布 涵盖多领域促发展
11月13日,杭州市上城区第三批“人工智能+”机会场景发布会暨场景供需对接会活动举行,推出50个高价值场景,涵盖社会治理、金融服务、民生服务、城市管理、智能建造、文化旅游、时尚消费等多个热门领域。如,由上城…

2025-11-14

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

SK海力士VFO工艺打造HBS技术,为移动设备AI性能提升带来新突破
据闪德资讯获悉,SK海力士正在研发结合移动DRAM和NAND的高带宽存储(HBS)技术,可提高智能手机和平板电脑等移动设备的AI性能。 相比HBM使用的硅通孔(TSV)技术,VFO无需穿孔,成本更低、良率更高…

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12