沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

谷歌Gemini与Veo模型融合,迈向全能AI助手新时代?

2025-04-13来源:ITBEAR编辑:瑞雪

谷歌DeepMind的首席执行官Demis Hassabis在近期的一次播客访谈中,揭示了谷歌AI发展的最新动向。在与领英联合创始人Reid Hoffman共同主持的节目Possible中,Hassabis透露,谷歌正计划将Gemini AI模型与Veo视频生成模型进行深度整合,旨在增强Gemini对物理世界的认知与理解能力。

Hassabis强调,Gemini从一开始就被设计为具备多模态特性的基础模型,这一决策背后承载着谷歌构建一个能够在实际生活中为用户提供切实帮助的通用数字助手的宏伟愿景。

当前,AI领域正迈向“全能”模型的新纪元,这类模型能够跨越图像、文本、音频等多种媒体形式,实现信息的全面理解和整合。谷歌的Gemini模型便是这一趋势的佼佼者,它不仅擅长图像与文本的生成,还具备音频创作的能力。与此同时,OpenAI的ChatGPT模型也已进化至能够绘制图像,包括独具宫崎骏风格的艺术作品,展现了AI在艺术领域的新探索。亚马逊同样不甘落后,宣布将在今年晚些时候推出一款能够实现“任意到任意”转换的模型,进一步拓宽了AI的应用边界。

为了实现这些“全能”模型的训练,海量的数据资源是必不可少的。据Hassabis透露,Veo视频模型的数据主要源自谷歌旗下的YouTube平台。通过大量观看YouTube视频,Veo 2得以深入理解世界的物理规律,从而提升了其视频生成与内容理解的准确性。此前,谷歌已向外界透露,其模型可能会依据与YouTube创作者达成的协议,使用部分YouTube内容进行训练。为了获取更多数据以优化AI模型,谷歌去年还对其服务条款进行了部分调整。

2024连云港企业获客新路径:百度智能营销解锁精准转化新密码
全链路智能营销:本地企业的数字化转型实战方案 百拓基于百度生态体系,为连云港企业提供从品牌建设、效果投放到达成转化的整合服务。百拓建议连云港企业重点关注三方面:首先利用百度地图商户标识强化地理半径内的精准…

2026-01-27

农业AI大模型领航:江苏叁拾叁打造智慧农业新基建,驱动产业新未来
江苏叁拾叁智慧农业有限公司通过其多年实践,给出了一个清晰的答案:以农业AI大模型为核心,构建贯通数据、知识、装备与服务的智能化基础设施,正在成为驱动农业现代化的“数字底座”。这一新基建以标准化、智能化和服务化…

2026-01-27