沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

腾讯推出业界最大规模MoE大语言模型Hunyuan-large:总参数389B领先行业

2024-11-05来源:ITBEAR编辑:瑞雪

腾讯近日揭晓了旗下全新的开源MoE大语言模型——Hunyuan-Large,该模型凭借业界领先的参数规模和卓越性能,一举成为行业焦点。

据悉,Hunyuan-large不仅在参数数量上达到了惊人的389B,同时其激活参数也高达52B,训练token数量更是攀升至7T。这一系列的数字背后,代表着该模型在处理长文本上下文时的强大能力,其最大上下文长度支持到256K,词表大小扩展至12.8w,为长文本任务的高效完成提供了坚实的技术支撑。

在技术创新层面,Hunyuan-large展现了其独特的魅力。通过巧妙地运用高质量的合成数据,该模型成功强化了训练过程,有效弥补了自然数据的不足之处。这一创新举措不仅提升了模型的训练效率,更进一步保证了其在处理复杂任务时的准确性和稳定性。

Hunyuan-large在多学科综合评测集上展现了卓越的性能。无论是在CMMLU、MMLU,还是在CEva1、MATH等评测集上,该模型均取得了令人瞩目的成绩。其在中英文自然语言处理、代码生成以及数学运算等九大能力维度上全面领先,甚至超越了Llama3.1和Mixtral等业内知名的一流开源模型。

为了进一步推动长文本处理技术的发展,腾讯还宣布将推出自研的长文评测集——“企鹅卷轴(PenguinScrolls)”。这一评测集的推出,旨在填补当前行业在真实长文评测方面的空白,为相关技术的研发和应用提供更为全面、客观的评估标准。

“企鹅卷轴”基于公开的金融、法律、学术论文等长文本构建而成,文本长度覆盖从1K到128K的广泛范围。这一设计使得该评测集能够全面覆盖深度阅读理解和长文推理等关键任务,为相关技术的深入研究和应用提供了宝贵的资源。

宝马M5旅行版投产:4.4T V8插电混动,727马力强势来袭!
11月5日消息,2025款宝马M5旅行版已在宝马位于德国丁格芬的工厂正式投产,该车搭载了一套由4.4升V8双涡轮增压发动机和电动机组成的插电式混合动力系统,综合输出功率高达535千瓦(约727.6马力…

2024-11-05

俄罗斯“一箭55星”成功发射!创造航天新纪录,所有卫星顺利入轨
11 月 5 日消息,据央视新闻报道,当地时间 11 月 5日,俄罗斯国家航天集团公司使用“联盟-2.1b”火箭从东方发射场发射了“电离层-M”1 号和“电离层-M”2 号两颗太阳同步轨道探测卫星以…

2024-11-05

特斯拉盲区警示系统再升级,静止状态也能防“开门杀”!
11月5日消息,据NotaTeslaApp报道,特斯拉近期向员工推送了2024.44更新,升级了其车辆的盲区警示系统,进一步提高了车辆的安全性。据了解,此前特斯拉的盲区监测系统主要用于在车辆行…

2024-11-05

一起为人民空军庆生 这些主题活动不能错过→
今天(11月5日)上午空军在北京举行新闻发布会,空军新闻发言人介绍,在人民空军成立75周年之际,空军围绕“寻根逐梦、制胜长空”主题开展系列宣传活动,结合参加第十五届中国航展组织飞行表演、装备静态展示、主题军乐…

2024-11-05

苹果悄然启动“Atlas”计划,意在挑战Meta智能眼镜市场霸主地位!
快科技11月5日消息,据媒体报道,苹果正在秘密启动一项名为“Atlas”新计划,主要工作是收集苹果员工对于智能眼镜的反馈意见。同时苹果正对当前市场上的一款已有产品展开内部调研,旨在进军智能眼镜领域。 据内部…

2024-11-05