沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

ClawBench大模型榜单揭晓:智谱字节小米四款模型闪耀全球前十

2026-04-01来源:快讯编辑:瑞雪

评测机构ClawBench最新发布的大型模型榜单引发行业关注,北京三家人工智能企业的四款模型成功跻身全球前十。其中,智谱科技的GLM-5-Turbo以93.9分的成绩登顶榜首,字节跳动旗下的豆包模型Doubao-Seed-2.0-lite紧随其后位列第二,并凭借最低使用成本成为全榜单中最具性价比的选择。小米公司则凭借MiMo-V2系列两款模型实现突破,MiMo-V2-Omni和MiMo-V2-Pro分别占据第九和第五名。

小米官方披露的技术细节显示,MiMo-V2-Pro在复杂逻辑推理、长指令执行和多轮对话稳定性等核心指标上表现突出。该模型在Model Rank全球排名中位列第五,同时在实验室综合研发能力评估体系LabRank中取得双料佳绩:在Text Arena(ArenaExpert)榜单中排名全球第四,Code Arena榜单中排名全球第五,综合研发实力仅次于Anthropic、OpenAI和谷歌三家国际顶尖机构。

ClawBench榜单的评测机制具有显著创新性,其关联的Text Arena榜单采用双盲测试模式,通过隐藏模型身份的方式,由全球真实用户根据回答质量直接投票评选。这种设计有效规避了传统评测中针对特定数据集优化导致的"刷榜"现象,使得评测结果更能反映模型在实际应用场景中的表现。字节跳动的豆包模型正是凭借这种评测机制下的成本优势,在保持高性能的同时实现了更低的使用门槛。

B站入局AI创作赛道!内测Updream工具助力视频内容生产新探索
3月31日消息,继视频网站爱奇艺推出AI影视工具纳逗Pro后,另一家视频网站B站被曝正内测一款名为Updream的AI创作工具。 同时,纳逗Pro结合影视创作的分工,构建多个岗位智能体,辅助用户制作视频内容,…

2026-03-31

高德开源ABot-M0:全球首创统一架构,赋能具身机器人“通用大脑”新突破
通过统一动作表示、坐标系与控制频率,该数据集让分散全球的异构机器人数据能够统一使用,大幅提升预训练效率。 算法层面,ABot-M0同步开源了模型架构与训练框架,其中包含高德创新提出的动作流形学习(AML)算…

2026-03-31

太空算力崛起:突破地面桎梏,开启人类数字文明新纪元
太空算力将其升级为“天数天算”:卫星在数据产生的源头,直接完成 AI 分析与决策,彻底重构数据价值链。未来将构建天地一体协同计算网络,在特定轨道部署超大规模 “太空计算中心”,形成能与地面互补,甚至部分替…

2026-03-31

X-GAME电竞馆入选十大领军品牌 引领电竞连锁行业迈向品牌化新征程
X-GAME电竞馆凭借卓越的品牌影响力、规模化连锁运营能力及行业领先的用户口碑,从全国众多电竞连锁品牌中脱颖而出,成功入选“中国电竞连锁行业十大领军品牌”榜单。 X-GAME电竞馆品牌负责人表示:“此次入选中…

2026-03-31