沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

Meta闭源新篇:Muse Spark“偏科”逆袭,AI赛道开启新角逐?

2026-04-10来源:快讯编辑:瑞雪

meta全新大模型Muse Spark的登场,犹如一颗重磅炸弹投入科技圈,激起层层涟漪。这款内部代号为Avocado的模型,不仅是meta超级智能实验室(MSL)成立9个月后的首个成果,更是扎克伯格在经历Llama 4的挫折后,大刀阔斧进行组织与战略调整后的首份答卷。令人意外的是,曾经高举“开源对抗闭源”大旗的meta,此次给Muse Spark贴上了“闭源”标签,API也仅向少数指定合作伙伴开放预览。

回顾Llama 4的发布,可谓开局不利。它承载着meta的厚望,却很快陷入信誉危机。社区质疑声不断,更有爆料称meta在基准测试中弄虚作假,用针对特定任务微调的“特供版”刷榜,而普通用户使用的版本表现大相径庭。这一事件对meta AI品牌造成了致命打击,就连图灵奖得主、meta前首席科学家Yann LeCun离职后也承认,Llama 4的测试结果“确实被修饰了一点”。

扎克伯格对此怒不可遏,据外媒报道,他对相关人员失去信心,直接架空了整个生成式AI团队,大批人员离开。这不仅仅是某个模型的失败,更意味着过去从模型架构到研发流程,从开源路线到组织文化的道路可能都行不通了。扎克伯格面临艰难抉择,最终选择全部推翻,在废墟上重建。

2025年夏天,扎克伯格做出震惊硅谷的决策,以143亿美元的天价拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是,时年不到30岁的华裔创始人Alexandr Wang被请进meta,出任首席AI官,统管全新组建的MSL。这位MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪行列的年轻人,被扎克伯格评价为“同辈创业者中最杰出的一位,深刻理解超级智能的历史重要性”。

Alexandr Wang上任后雷厉风行,从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里,以天价薪酬挖来一整支“复仇者联盟”。翻看MSL首批11人名单,7位核心研究员都有华人背景,包括浙大校友毕树超、清华校友赵晟佳、中科大校友于佳慧等业内顶尖高手。这支“亿元天团”的目标明确,就是从零开始,重写meta的AI命运。

Muse Spark究竟实力如何?meta此次态度格外坦诚,在官方博客里列出了一张优缺点分明的成绩单。在医疗和视觉多模态领域,Muse Spark表现堪称惊艳。在极高难度的医学开放式问答评测HealthBench Hard中,它取得42.8分,而GPT - 5.4只有40.1分,Gemini 3.1 Pro仅20.6分,差距明显。这得益于meta与超过1000名专业医生合作整理训练数据,为模型配备了强大的专家顾问团。在科研论文图表的深度理解测试(CharXiv Reasoning)中,Muse Spark以86.4分力压GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的应用场景也十分丰富。官方案例显示,对着食物拍照,它能分析出每种食物的卡路里;能识别瑜伽动作,指出发力肌群并纠正姿态;甚至还会操作咖啡机。可以想象,若应用在AI眼镜上,将带来极大便利。

然而,Muse Spark并非完美无缺。在纯逻辑推理和代码编程方面,它的表现不尽如人意。在ARC AGI 2抽象推理测试中,仅拿到42.5分,与Gemini 3.1 Pro(76.5分)和GPT - 5.4(76.1分)差距巨大。在软件工程实测(SWE - bench Pro)中,通过率(52.4%)也略逊于GPT - 5.4的57.7%。

Muse Spark背后真正令人瞩目的,是meta公布的一项技术数据。在新重建的技术栈下,它达到与上一代Llama 4 Maverick同等性能水平所需的计算量,减少了超过一个数量级,实现了10倍以上的效率跃升。这得益于MSL团队提出的“思维压缩”(Thought Compression)核心技术。在强化学习训练阶段,引入“思考时间惩罚”机制,模型回答问题时若思考过久就会被“扣分”,从而被迫进化,学会用更少的推理token、更短的逻辑链条解决复杂问题,且准确率不降反升。Muse Spark还推出多Agent并行推理的“沉思模式”(Contemplating Mode),传统推理模式是一个模型独自思考,而它是同时拉起多个子智能体处理不同维度信息后汇总,在相近响应时间内,在Humanity‘s Last Exam等评测中表现出色。

Muse Spark虽不完美,但用9个月时间将meta从Llama 4的舆论困境中拉出,重新回到与GPT - 5.4、Gemini 3.1 Pro同场竞技的第一梯队。对于扎克伯格和这支“华人天团”来说,它更像是一个宣言,标志着靠开源攒口碑的meta已成为过去,一个更务实、更有技术野心的新meta正崭露头角。

Create2026百度AI开发者大会将启,全景展示AI新突破与多元应用场景
开幕式上,百度创始人李彦宏将发表主题演讲,分享最新AI趋势判断;2场主论坛由百度智能云承办,“技术与产品”主论坛将发布百度全栈AI产品进展,深度解码AI价值落地全路径,助力企业迈向Agent时代,“超级个体”…

2026-04-10

阿里云领投生数科技B轮近20亿融资,携手共建AI视频工业化生态
新京报贝壳财经讯(记者张晓慧)4月10日,生数科技宣布完成近20亿元人民币B轮融资。 目前,生数科技推出的核心产品为多模态视频模型Vidu系列模型;2025年12月,生数科技开源基于视频生成大模型的统一架构的…

2026-04-10

北京智慧共享获红外光谱成像技术非制冷型气云成像摄像机专利授权
国家知识产权局信息显示,北京智慧共享技术服务有限公司取得一项名为“一种基于红外光谱成像技术的非制冷型气云成像摄像机”的专利,授权公告号CN120881372B,申请日期为2025年9月。 天眼查资料显示,北京…

2026-04-10

爱芯科技与爱芯元智携手申请专利,创新方法提升环境亮度检测精准度
国家知识产权局信息显示,北京爱芯科技有限公司;爱芯元智半导体(重庆)有限公司申请一项名为“一种环境亮度检测方法以及环境亮度检测装置”的专利,公开号CN121829749A,申请日期为2026年1月。通过天眼查…

2026-04-10

山东大学携手两企业获云服务机器人复杂场景视频问答新专利
国家知识产权局信息显示,山东大学、山东芯辰人工智能科技有限公司、山东正晨科技股份有限公司取得一项名为“一种云服务机器人的复杂场景视频问答方法及系统”的专利,授权公告号CN116541490B,申请日期为202…

2026-04-10

卡奥斯双公司联合申请专利,以创新技术提升用户问题应答效率与精准度
国家知识产权局信息显示,卡奥斯物联科技股份有限公司;卡奥斯工业智能研究院(青岛)有限公司申请一项名为“一种用户问题的应答方法、装置、电子设备及存储介质”的专利,公开号CN121833885A,申请日期为202…

2026-04-10