沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

HiMo-CLIP来袭:让AI精准捕捉长文本关键,图像检索准确率大幅提升

2025-12-03来源:快讯编辑:瑞雪

在图像检索领域,传统模型处理复杂文本描述时常常力不从心。以CLIP为代表的现有技术面对"白色福特F250皮卡配备有色车窗和超大轮胎"这类包含多个细节的查询时,往往难以精准匹配目标图像。这种"描述越详细匹配越差"的现象,成为制约技术发展的关键瓶颈。

中国联通数据科学与人工智能研究院团队推出的HiMo-CLIP模型,通过创新性的动态语义指纹技术破解了这一难题。该模型搭载的HiDe模块采用统计学方法,能在海量文本中自动识别最具区分度的特征。例如在汽车检索场景中,系统会优先捕捉"超大轮胎"这类核心特征,而非泛化的"有色车窗"描述,使匹配准确率提升至89.3%。

研发团队设计的MoLo损失机制构建了双重保障体系,既确保整体语义匹配,又强化核心特征对齐。这种设计使模型在处理长文本时得分随信息量增加而提升,彻底改变了"多说多错"的行业痛点。在MSCOCO-Long测试集上,新模型的mAP指标较前代提升近20%,同时在Flickr30K短文本测试中保持98.3%的原始性能。

技术落地应用已显现显著成效。京东商品搜索系统接入该模型后,用户使用"黑色连帽卫衣带白色抽绳和刺绣logo"等复杂描述时,搜索转化率提升27%。自动驾驶领域正探索将其用于解析"前方施工区域有黄色警示牌和穿橙色背心的工人"等场景描述,帮助车载系统更精准识别环境要素。

这个开源项目在GitHub上线半年即获得2.3k星标,字节跳动、商汤科技等企业已开展技术验证。当前版本在处理"碳纤维车身包围"等专业术语时仍存在局限,研发团队计划2026年第三季度推出多语言版本,届时将支持外语描述的精准匹配。该成果标志着中国团队在AI基础研究领域取得重要突破,其模拟人类认知逻辑的创新思路,为多模态智能发展提供了新方向。

浙大“斫月”月面微型机器人亮相 影石创新助力航天影像技术新探索
IT之家 11 月 28 日消息,据浙江大学教育基金会消息,11 月 26 日下午,探月微型探索机器人研制项目捐赠仪式暨样机发布会在浙江大学紫金港校区举行,星奥传媒与影石创新捐资设立“探月微型探索机器人研制项…

2025-12-03

Omdia报告:2025Q3全球可穿戴腕带设备高端化,头部厂商主导市场新格局
IT之家 12 月 2 日消息,市场调查机构 Omdia 昨日(12 月 1 日)发布博文,报告 2025 年第 3季度全球可穿戴腕带设备呈现显著的高端化趋势,呈现“量稳价升”态势,出货量 5460 万台、…

2025-12-03

港科大团队创新突破:戴盟机器人获亿元融资,中国移动助力触觉感知升级
机器人前瞻12月2日报道,今天,戴盟机器人宣布完成亿元级战略轮融资,由中国移动链长基金独家投资。王煜在机器人控制与智能制造领域拥有40余年研究经验,毕业于西安交通大学,后在美国卡内基-梅隆大学获得博士学位,…

2025-12-03

清华成立具身智能与机器人研究院,学界大牛齐聚加速布局新赛道
具身智能与机器人研究院院长张涛,是清华大学自动化系主任、信息科学技术学院副院长,主要研究方向包括机器人学、智能控制、导航与控制技术、飞行器控制技术等。研究院成立”具身智能机器人项目制实验班”,采用”理论+项…

2025-12-03

众擎T800人形机器人正式发布!18万元起售 搭载固态电池续航强劲
【太平洋科技】12 月 2 日消息,众擎公司今日正式发布 T800 全尺寸通用人形机器人,并同步开启发售。 T800搭载全栈自研的多维度感知灵巧手,单手具备 7 个自由度,负载能力达 5kg,集成触觉传…

2025-12-03