沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

谷歌Gemini 2.5 Pro挑战成功!29年前《宝可梦蓝》被AI通关

2025-05-04来源:ITBEAR编辑:瑞雪

谷歌的人工智能领域传来振奋人心的消息,其最新研发的Gemini 2.5 Pro模型在一款经典电子游戏中取得了历史性成就——成功攻克了发布于29年前的《宝可梦蓝》。

这一突破性进展由谷歌首席执行官桑达尔·皮查伊在社交媒体上激动宣布:“真是令人惊叹!Gemini 2.5 Pro已经成功通关《宝可梦蓝》!”这场名为“Gemini Plays Pokemon”的直播活动,由一位非谷歌员工的30岁软件工程师Joel Z发起,却获得了谷歌高层的鼎力支持。

据悉,早在直播活动前一个月,谷歌AI Studio的产品负责人洛根·基尔帕特里克就已透露,Gemini在《宝可梦》系列游戏上取得了显著进展,并已斩获第五个徽章。相比之下,当前表现第二的模型仅获得三个徽章,尽管它们使用的是不同的代理框架。皮查伊还幽默地表示:“我们正在研发API,即‘人工宝可梦智能’。”

为何谷歌选择《宝可梦》作为挑战对象?这背后有其深意。早在今年2月,Anthropic公司便展示了其Claude AI模型在《宝可梦红》中的卓越表现,强调Claude的“深度思考和代理训练”能力使其在处理复杂任务时更具优势。然而,尽管Claude表现出色,却似乎未能完全通关《宝可梦红》。这是否意味着Gemini在游戏领域的能力更胜一筹?对此,Joel Z在Twitch页面上提醒观众:“请勿将此次成就视为衡量大型语言模型(LLM)在《宝可梦》游戏中表现的唯一标准。Gemini和Claude使用不同的工具和接收到的信息差异较大,因此无法进行直接比较。”

值得注意的是,两款AI模型在玩游戏时都需要借助代理框架。这些框架为模型提供带有额外信息的游戏截图,帮助模型做出决策,并按下与AI指令相对应的按钮。尽管在帮助Gemini完成游戏的过程中,Joel Z进行了一些“开发干预”,但他坚称这并非作弊,而是为了提升Gemini的整体决策和推理能力。

“我的干预并未涉及给出具体提示词或为特定挑战提供攻略或直接指令。”Joel Z解释道,“唯一接近这种情况的是,我告诉Gemini需要与火箭队小兵对话两次才能获得升空钥匙,这实际上是一个在《宝可梦黄》中被修复的漏洞。”他进一步表示,“Gemini Plays Pokémon仍在积极开发中,其框架也在不断演进和完善。”