支付宝近期推出了一款名为“探一下”的全新AI视觉搜索功能,该功能旨在为用户提供一种便捷且富有趣味性的探索方式。当用户遇到感兴趣的事物时,只需通过支付宝的摄像头功能,即可让AI进行识别,并获取关于该事物的详细信息、背景知识或是相关商品链接。
自蚂蚁集团去年正式宣布AI战略以来,AI技术已经迅速渗透到支付宝的各项传统应用中。今年,支付宝不仅发布了“支小宝”等AI独立应用和智能体开发平台,还在其App中集成了多种智能助理功能。而此次的“探一下”则是支付宝在视觉多模态领域的一次全新尝试。
“探一下”的操作界面简洁直观,用户进入主界面后,只需定格摄像头所捕捉的画面,系统便会开始分析并生成结果。这一功能并非作为一个独立的App存在,而是作为支付宝扫一扫功能的扩展,这样的设计使得用户无需下载额外的应用即可体验。
“探一下”的功能划分十分明确,主要包括“探知识”、“探灵感”、“探文字”和“AR”四个选项。其中,“探知识”和“探灵感”是其核心功能。前者能够识别并分析画面中的主体,提供相关的背景知识和商品链接;后者则能够根据画面内容生成幽默或治愈的文案,为用户带来不同的视觉体验。
与其他视觉识别型AI相比,“探一下”在识别结果生成后会进行进一步的发散。例如,当用户识别一份肠粉时,系统不仅会提供肠粉的起源地等信息,还会根据用户的兴趣生成更多相关的内容选项。这种设计使得“探一下”在面对未知事物时,能够成为用户的“随身讲解员”。
在识别准确性方面,“探一下”目前仍有提升空间。例如,在某些情况下,系统可能会将用户手中的手机型号识别错误。不过,当面对具有明显商品特征的画面时,如菊花茶等,“探一下”能够准确识别并接入商品链接,为用户提供便捷的购物体验。
为了更深入地了解“探一下”的特点,我们将其与理想同学、智谱等支持视觉识别的App进行了对比。结果显示,“探一下”在识别方式上更加简洁,不需要用户主动提问,而是直接提供发散性的知识和文案。这种设计使得“探一下”在视觉上更加直观,同时也降低了用户与AI交互的门槛。
“探一下”在识别花草等自然景物方面也表现出色。在与理想同学、智谱的对比中,“探一下”能够准确识别出花卉的品种,而智谱则出现了误识别。这进一步证明了“探一下”在视觉识别方面的实力。
支付宝推出“探一下”的目的并非与主流AI大模型竞争,而是希望通过这一功能进一步普及AI技术,并引导用户养成全新的搜索习惯。随着AI技术的不断发展,以视觉为中心的人工智能产品已经成为一种新趋势。而“探一下”这种既有趣又实用的视觉AI产品,无疑将在这一领域占据一席之地。