沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

谷歌AI掌舵人点赞!清华姚班校友新研究突破,现双双入职Meta

2025-11-21来源:快讯编辑:瑞雪

谷歌AI掌门人Jeff Dean近日点赞了一项突破性研究,这项由清华姚班校友钟沛林团队主导的嵌套学习(Nested Learning,简称NL)范式,为解决大语言模型长期存在的灾难性遗忘问题提供了新思路。研究团队提出的Hope模型在语言建模与长上下文任务中展现出显著优势,相关论文已被NeurIPS 2025接收。

传统深度学习模型采用扁平化参数更新模式,通过堆叠网络层数或扩大模型规模提升性能,但这种"暴力堆参"的方式已逐渐触及瓶颈。研究指出,当前主流的Transformer架构本质上是NL范式的简化版本,其线性层结构未能充分发挥多层级协同的潜力。NL范式借鉴人类大脑的记忆机制,将模型重构为嵌套式优化体系,不同层级以差异化频率更新,实现短期记忆与长期规律的分层管理。

该研究提出三大核心创新:深度优化器通过神经网络预判梯度变化,替代传统优化器的固定公式;自我修改模型使架构在训练中自主调整参数,无需人工干预;连续记忆系统将二元记忆结构升级为多尺度记忆链,不同模块分别处理实时细节与长期规律。这些创新最终凝聚为Hope模型,在760M至1.3B参数规模下,其语言建模能力与推理水平均超越Transformer等主流模型,在Wiki文本困惑度、物理常识推理等指标上表现尤为突出。

这项研究的背后站着一位特殊的清华姚班校友——钟沛林。这位2016届毕业生在高中时期已是国际信息学竞赛的明星选手,2012年代表雅礼中学夺得IOI金牌,与发小艾雨青并称"雅礼双子星"。哥伦比亚大学博士毕业后,他加入谷歌纽约研究院担任算法科学家,期间主导了嵌套学习范式的研究。如今这对双子星已先后入职meta,分别担任AI科学家与软件工程师,继续在人工智能领域开拓新方向。

嵌套学习范式的提出标志着深度学习架构的范式转移。通过模拟人类认知机制,该研究为模型持续学习、长上下文推理等难题提供了全新解决方案。当AI模型从静态计算网络进化为分层协作的智能系统,或许将开启真正具备终身学习能力的通用人工智能新时代。

百度世界大会“真实”亮相:成果频出,AI创新之路有挑战亦有突破
新京报贝壳财经记者现场注意到,相比两年零八个月之前顶着Chat GPT的压力发布文心一言时选择给观众看demo的小心谨慎,这次大会上,百度主打“真实”——百度创始人李彦宏实时连线了阿布扎比行驶中无人车上的员…

2025-11-21

李彦宏AI数字人亮相业绩会20分钟流畅英文介绍 百度AI应用再获新进展
在最新举办的百度三季度业绩电话会上,百度创始人李彦宏的AI数字人完成了近20分钟的全英文业绩介绍,语速流畅,停顿自然,全场没有分析师察觉。北京某互联网人士对记者分析说,倘若AI数字人在百度业绩交流会上“跑通”…

2025-11-21

谷歌Gemini3重磅登场:多维度能力跃升,多领域成绩亮眼
【11月20日国泰海通研报:谷歌推出新一代大模型Gemini3多维度领先】北美时间周二,谷歌正式推出新一代大模型Gemini3,实现多维度断层式领先。新模型核心推理能力显著进步,在Humanity'sLast…

2025-11-21

谷歌Gemini 3模型发布引市场热捧,Alphabet股价飙升创年内新高
Alphabet股价周三飙升5%,投资者看好谷歌最新发布的Gemini 3人工智能模型带来的竞争优势。 D.A.Davidson分析师在周二的研报中称,Gemini 3是"真正强大的模型",在初步测试和AI…

2025-11-21

阿里千问APP公测版上线,免费开放,携生活场景生态力战ChatGPT
当地时间11月12日,OpenAI 正式官宣推出新一代旗舰模型GPT-5.1 系列,官方表示此次升级旨在“让ChatGPT 更智能,对话体验更有趣”。阿里集团董事兼首席执行官吴泳铭表示,大模型是下一代操作系…

2025-11-21

百度世界大会亮点纷呈:AI成果升级,李彦宏畅谈智能生产力新未来
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-21

贝索斯携62亿美元入局实体AI,与马斯克再掀科技新赛道争夺战
此举不仅是贝索斯职业生涯的再启航,也可能改写实体产业与AI竞赛的权力版图。在近期于意大利都灵举办的「意大利科技周2025」上,贝索斯在炉边对谈中谈及当前AI浪潮时坦言:「确实有泡沫迹象」。 贝索斯、马斯克…

2025-11-21

马斯克xAI新突破:Grok 4.1智商情商双提升,团队华人力量引关注
马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。 整体来看,本次Grok 4.1的发…

2025-11-21

智元远征A2跨越苏沪创百公里行走纪录,人形机器人商用前景可期
近日,智元远征A2(SNA210041BA00652号机器人)成功完成了从苏州金鸡湖到上海外滩的百公里跨省行走挑战,创造了一项足以记录在全球机器人发展史上的新纪录。11月20日,吉尼斯世界纪录认证官向智元远征…

2025-11-21