沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

Gemini 2.5挑战AI界!谷歌新一代大语言模型能否超越OpenAI?

2025-03-26来源:ITBEAR编辑:瑞雪

在科技巨头谷歌的最新动作中,其倾力打造的Gemini 2.5大语言模型正式亮相,标榜为迄今为止谷歌“智慧之巅”的AI成果。这款模型在逻辑推理、数学计算及科学任务上的表现,据称已超越OpenAI、Anthropic、xAI及DeepSeek等竞争对手的同类产品。

尽管谷歌方面坦诚,Gemini 2.5 Pro版本与OpenAI的o1-pro相比,仍存在一定的差距,但这并未削弱Gemini 2.5的光芒。该模型并非依赖外部图像处理能力,而是采用了一种创新的统一架构,通过共享注意力机制,实现了图像、文本、音频及代码的协同处理,展现了其全面的处理能力。

Gemini 2.5 Pro作为一款全新的思考型AI模型,其逻辑推理、代码生成及复杂任务处理能力得到了显著提升。目前,该模型已支持100万tokens的上下文识别,并计划在未来扩展至200万tokens,这将使其在撰写报告等任务中展现出惊人的实力。从已曝光的演示来看,Gemini 2.5 Pro的生成能力确实令人眼前一亮。

谷歌已通过其AI Studio平台和Gemini app,向Gemini Advanced订阅用户开放了Gemini 2.5的试用。然而,首批用户也发现了一些局限性,如模型目前无法联网,且不支持Deep Research和Canvas工具。但谷歌强调,这只是Gemini 2.5的初步版本,未来还将推出更多升级版本,并逐步将模型功能集成到谷歌的搜索、Gmail、Docs等生态系统中。关于定价细节,谷歌表示将在后续逐步公布。

与此同时,OpenAI也在积极行动,为ChatGPT Plus和Pro用户推送了内置于GPT-4o的图像生成模型。这款新模型支持多轮对话中的图像修改和编辑,上下文理解能力显著增强。用户可以要求GPT-4o保留图像的某些元素,如帽子或服饰,同时修改其他部分。每个物品的属性、关系都可以被独立控制,为用户提供了前所未有的创作自由度。

例如,用户要求GPT-4o创建一张两个20岁左右女巫阅读路标的照片级真实感图像,其中一位女巫拥有灰白渐变发色,另一位则拥有长波浪红棕色头发。随后,用户还可以在上下文中修改路牌上的时间、注释,甚至让女巫卷起魔毯、微倾身体,调整街边汽车、路标及女巫的位置等细节。这种多模态、推理及上下文理解能力的结合,无论是谷歌还是OpenAI,都在通过强大的性能和开放的体验策略,为用户带来更多的想象空间。

中国医疗康养机器人新篇开启:分会成立,锚定“健康中国2030”谋发展
大会随即依次审议并推进多项核心议程:协会秘书长助理兼会员部主任陈敬宣宣读《关于同意成立中国机电一体化技术应用协会医疗与康养机器人分会的批复》,正式宣告分会成立具备坚实的政策依据与组织基础;分会筹备工作组副组…

2026-01-22

“巧手机器人”升级:双面抓握自主爬行,工业服务野外勘探迎新助力
这一由洛桑联邦理工学院(EPFL)研发的可拆卸机械手,能抓取超出常规尺寸范围的物体,并能连续处理多个目标,在工业自动化、服务协助及野外勘探等领域具有极大应用价值。 研究团队演示了“巧手机器人”连续抓取最多3个…

2026-01-22

信通电子“小黄人”防冰机器人走红 人工智能赋能电力领域再添新动力
目前,该产品已在国内多地实际应用,成为“人工智能+机器人”赋能电力领域的“中国智造”标杆。 信通电子自主研发的防冰机器人在社交媒体上火出圈公司供图 作为工业物联网领域的专精特新“小巨人”企业,信通电子深耕行…

2026-01-22

安科瑞能碳一体化平台:实时监控与智慧调度,解锁企业能源管理新路径
多维度数据采集:集成智能电表、传感器等设备,支持多协议接入,实时采集外购电力、燃气、蒸汽等传统能源数据,以及光伏、储能、充电桩等分布式能源运行状态,实现能源消耗全链路监测。平台依托工业大模型与AI算法,实现…

2026-01-22