沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

摩尔线程发布MUTLASS:助力国产GPU高性能线性代数计算,加速算子开发与算法创新

2024-11-12来源:ITBEAR编辑:瑞雪

摩尔线程近日宣布,已开源其高性能线性代数模板库MUTLASS,旨在助力开发者更高效地利用摩尔线程全功能GPU的MUSA Core与Tensor Core进行编程。此举有望加快基于国产GPU的算子开发与算法创新步伐。

MUTLASS,即MUSA Templates for Linear Algebra Subroutines,是摩尔线程专为MUSA架构打造的高性能计算库。该库基于开源模板库CUTLASS进行了MUSA适配与深度定制化开发,以优化性能。

在矩阵乘法及相关操作方面,MUTLASS提供了一系列高性能的C++模板组件。这些组件采用了与muDNN库相似的分层分解及数据搬运策略,以确保GPU性能得以充分发挥。

此次开源的版本中,摩尔线程对CuTe后端库进行了适配,增加了对第三代MUSA架构的MMA计算原语的支持。同时,该版本还支持TF32、FP16、BF16及INT8等多种数据精度,为矩阵乘法、默认实例库、性能测试器及相关工具包提供了初步支持。

开发者可通过访问MUTLASS的开源地址:https://github.com/MooreThreads/mutlass,获取该库并应用于其项目中,从而提升基于摩尔线程GPU的开发效率与性能。

摩尔线程的这一开源举措,有望推动国产GPU在高性能计算领域的应用与发展,为国内外开发者提供更多选择与可能。

外勤管理难题如何破?专业防作弊软件五大技术守护真实数据
通过外勤轨迹软件,管理员查看该员工的轨迹回放,发现其轨迹呈现出“两点一线”的特点,中间没有去往门店的记录,却在多个地方打卡。经检测,发现该员工使用虚拟定位软件在家打卡,系统通过轨迹异常和位置跳变揭穿了这一骗局…

2026-01-24

2026年AI智能体:或成重塑大学生未来观的关键“变量”
参考依据:在某高校的调研中发现,计算机专业且积极参与创新项目的学生,通过利用AI智能体获取跨学科知识,对未来职业和学术发展有了新的认知和规划;而一些文科专业课程压力大的学生,虽然知道AI智能体的存在,但因没…

2026-01-24

百度新设个人超级智能事业群组 文库与网盘合并共促AI创新发展
红星资本局1月24日消息,今日,红星资本局从百度集团(09888.HK;BIDU.US)方面获悉,百度新设个人超级智能事业群组。 该事业群组将合并文库和网盘事业部,由百度集团副总裁、文库事业部及网盘事业部负责…

2026-01-24