沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

谷歌发布Gemini 3.5系列模型及Omni世界模型 推动AI应用与视频生成新进展

2026-05-20来源:快讯编辑:瑞雪

在人工智能技术竞争愈发激烈的当下,谷歌在年度开发者大会上宣布推出Gemini 3.5系列模型,并展示了一款新型物理世界模拟AI模型。这一举措被视为谷歌在模型开发领域保持领先地位的重要布局,同时也为其庞大的用户群体提供了更多AI智能服务选项。

此次发布的Gemini 3.5系列中,轻量级产品Gemini 3.5 Flash成为焦点。谷歌首席执行官桑达尔·皮查伊介绍称,该模型在保持尖端能力的同时,成本仅为同类顶尖模型的一半,部分场景下甚至不到三分之一,且响应速度极快。谷歌已决定将其设为全球Gemini应用和搜索AI模式的默认模型,并强调用户无需在质量与速度之间做出妥协。公司通过强化网络安全防护,使该模型生成有害内容的概率显著降低,同时减少了因安全问题拒绝回答的情况。

重量级版本Gemini 3.5 Pro目前仍处于内部测试阶段,预计下个月向更广泛的用户开放。皮查伊表示,谷歌正致力于将智能体技术从开发者与企业端扩展至消费者市场,确保前沿能力以安全可靠的方式惠及更多人群。这一战略调整与谷歌近期资本支出上升的背景密切相关,华尔街正密切关注其能否通过产品深度整合实现商业价值,智能代理功能被视为关键突破口。

另一款引人注目的产品是Gemini Omni——一款专注于物理环境模拟的世界模型。该模型可精准预测用户操作后的场景变化,在重力、流体动力学等物理特性模拟方面表现突出。谷歌DeepMind首席AI架构师Koray Kavukcuoglu称,Omni不仅能生成高质量视频,还允许用户在生成后与内容进行互动,为学习与探索提供了类似教程的功能。例如,用户可编辑视频中的动作、添加新角色或物体,甚至改变正在发生的事件。

目前,Omni已集成至Gemini Flash、Gemini应用、Google Flow及YouTube Shorts等平台,支持图像与音频功能。谷歌在技术文档中举例说明,用户可通过简单指令让Omni修改视频中的场景细节,生成更逼真的图像效果。这一能力突破了传统AI工具在视频生成领域的局限,尽管其对计算资源的需求仍高于文本或图像模型。

行业观察人士指出,谷歌此次发布的产品组合直指当前AI市场的核心痛点:成本、速度与实用性。尤其在视频生成领域,OpenAI今年早些时候因算力分配问题放弃Sora项目,而谷歌选择持续投入,显示出其对技术突破的坚定信心。与此同时,Anthropic近期发布的Mythos模型因能发现全球软件基础设施中的未知漏洞而备受关注,进一步加剧了AI领域的竞争态势。

石头科技持续突破:从智能扫地到户外割草,开启家居清洁多维新体验
在智能家居清洁领域,石头科技正以技术创新为动力,不断扩展其产品线,提升用户的生活品质。如今,石头科技已经构建起覆盖智能扫地机器人、洗地机和智能割草机的多元化产品矩阵,旨在通过不断的迭代与升级,为全球用户提供更…

2026-05-20

第十届全国青少年无人机大赛厦门市赛启幕 近700名选手展航空科创风采
本次大赛是厦门市首届青少年无人机专项赛事,由中国航空学会主办,福建省航空协会、厦门市教育学会、厦门市科技工作者服务中心、厦门路桥百城信息产业建设发展有限公司承办。 选手们熟练编写程序,默契配合,在应用场景模…

2026-05-20

杭州柯林豪掷3亿控股开普勒 人形机器人行业整合大幕或就此拉开
除了杨华以外,汉威科技、乔锋智能、福然德、涛涛车业等上市公司也计划在此次交易中,向杭州柯林出售部分开普勒股权。订单和资源正快速向技术、资本、人才综合实力更强的头部公司汇聚,未来三年,行业可能迎来第一轮淘汰赛…

2026-05-20

Figure AI机器人与人类10小时包裹分拣对决 人类虽险胜但机器人潜力引热议
自上周三起,多款人形机器人便在 Figure AI总部的环形传送带上分拣包裹。不少观众直言这场直播“莫名上头”,还将其称作“机器人治愈白噪音”,Figure AI 甚至顺势推出了这款分拣包裹人形机器人的周…

2026-05-20