沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

百度文心Moment大会启幕 文心5.0正式发布 引领AI应用新变革

2026-01-23来源:快讯编辑:瑞雪

百度近日正式推出原生全模态大模型文心5.0,标志着其在人工智能领域的技术突破迈入新阶段。该模型采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一框架下联合训练,实现了真正的多模态统一理解与生成。与传统的“后期融合”方案不同,这一技术路线使多模态特征在统一架构下充分融合,避免了拼接式处理的局限性。

文心5.0的参数规模达2.4万亿,通过超大规模混合专家结构实现超稀疏激活,激活参数比低于3%,在保持强大能力的同时显著提升了推理效率。模型还引入了基于思维链和行动链的端到端多轮强化学习训练方法,结合大规模工具环境合成的长程任务轨迹数据,大幅增强了智能体和工具调用能力。在40余项权威基准测试中,其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等国际主流模型,图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。

应用层面,文心5.0已构建起覆盖通用场景与行业需求的模型矩阵。矩阵模型包括文心Lite、视频大模型和语音大模型,面向产品级应用快速落地;专精模型则针对搜索、电商、数字人等垂直领域开发,如搜索闪电专精模型、电商蒸汽机模型等。百度应用模型研发部负责人透露,基于声音Token的端到端合成大模型通过离散语音表示、MoE韵律建模和Unet自重构特征等技术,实现了高质量语音合成;5分钟直播技术通过少量音色采样和韵律模式匹配,使合成语音具备直播带货所需的情绪感染力;实时交互数字人技术采用三态Token联动架构,突破传统模态串联模式,实现文本、语音、视频的流式控制,百度罗永浩数字人即基于此技术开发。

为推动大模型在产业中的落地,百度千帆平台推出Agent Infra解决方案,提供包括文心5.0在内的150余个全场景模型服务,集成百度AI搜索等工具及MCP和Agent工具链,结合数据管理和企业级服务,为企业提供全周期、多场景的业务运行环境。目前,千帆平台已累计开发超130万个Agents,以百度AI搜索为代表的工具日均调用量突破千万次。此前,百度数字人技术已在直播带货等领域广泛应用,2025年罗永浩数字人直播曾创下行业纪录。

作为国内大模型领域的先行者,百度正通过“芯云模体”全栈自研生态闭环持续探索AI赋能行业的路径。该生态以芯片为底座、智能云为平台框架、模型为支撑,形成覆盖硬件、算法、应用的完整链条,为AI技术从实验室走向真实场景提供了可复制的解决方案。当前,全球AI行业正加速向应用层拓展,如何让技术真正服务于产业需求成为关键课题,百度的实践为这一方向提供了重要参考。

华为苹果怎么选?从性能影像到系统体验,三大维度助你找到适配之选
随着华为在技术研发和用户体验上的持续突破,越来越多的人开始重新审视自己与手机品牌之间的关系,不再仅仅追随市场潮流或品牌光环,而是基于实际需求做出理性选择。其支持的卫星通信功能和无缝连接的5G 网络,确保了用…

2026-01-23

2026蓝牙耳机选购指南:从技术趋势到场景适配,权威推荐这些品牌
塞那(Sanag)作为近年来在开放式音频领域持续深耕并取得技术突破的品牌,其S7S Ultra在2026年市场上扮演了“技术普惠者”与“体验革新者”的双重角色。2026年新款WF-1000XM6在前代基础上…

2026-01-23