沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

腾讯发布Hunyuan-Large大模型:389B总参数与52B激活参数,业界领先!

2024-11-05来源:ITBEAR编辑:瑞雪

腾讯近日推出了业界领先的Hunyuan-Large大模型,该模型基于Transformer架构,并采用了MoE(Mixture of Experts)设计。据悉,这是目前业界已经开源的最大规模的MoE模型,拥有惊人的3890亿总参数和520亿激活参数。

腾讯在Hugging Face平台上开源了Hunyuan-A52B的三个版本,包括预训练版、指令版和指令版FP8,同时发布了详尽的技术报告与操作手册,供开发者深入了解模型的功能及操作方法。

Hunyuan-Large模型具备多项技术优势,例如通过高质量合成数据增强训练,使模型能够学习到更为丰富的数据表示,有效处理长上下文输入,并提升了对未见数据的泛化能力。模型还采用了创新的KV缓存压缩技术,通过分组查询注意力和跨层注意力策略,大幅降低了内存占用和计算成本,从而提高了推理效率。

该模型还引入了专家特定学习率缩放技术,为不同的专家子模型设定了差异化的学习率,确保了每个子模型都能从数据中高效学习,并为模型的整体性能作出贡献。在长上下文处理能力方面,Hunyuan-Large也表现出色,其预训练模型支持处理长达256K的文本序列,而指令版模型则支持128K的文本序列,显著增强了处理长上下文任务的能力。

为了验证模型的实际应用效果和安全性,腾讯在多种语言和任务上进行了广泛的基准测试。测试结果充分证明了Hunyuan-Large模型的卓越性能和广泛适用性。

对于想要深入了解Hunyuan-Large模型的开发者和研究者,腾讯提供了丰富的资源链接,包括论文、Github仓库、Huggingface模型库以及腾讯云上的相关产品页面。

第一个夜骑的她找到了,开封大学生开始“反击”!
上万名郑州大学生组团夜骑开封 多个景区将在夜间对大学生免费开放 面对热情洋溢的郑州大学生 从开封骑来的共享单车“还回去”“对骑行到郑州的开封在校大学生 从郑州夜骑开封的女生及其好友 4位女生想品尝开封的灌…

2024-11-05

特斯拉OTA更新:中国车主首试可视化车牌功能,还有更多新体验!
快科技11月5日消息,据媒体报道,特斯拉最近推出了2024.38软件更新。在此次更新当中,中国车主将率先体验在车辆屏幕上显示车牌号码的功能。据悉,该功能可通过手动输入实现,因此可以输入任何内容,不仅仅局限于自…

2024-11-05