沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

寻找成都AI“向新力”丨近百款“成都造”备案 大模型和深度合成服务算法落地开花

2024-12-02来源:封面新闻编辑:瑞雪

编者按:

AI向新,融合发展。四川吹响了将人工智能作为一号创新工程的号角,成都明确提出,到2026年人工智能核心产业规模将达到1700亿元,带动相关产业规模突破1万亿元。哪些成都企业在矢志探索?有哪些值得关注的创新案例?获悉,天虎科技联合成都科技推出《寻找成都AI“向新力”》专题,从多个维度观察人工智能作为新质生产力带来的增长机遇和案例,系列聚焦成都人工智能企业在垂直行业大模型和深度合成算法的创新案例,自主可控领域的融合应用创新案例,具身智能与人形机器人领域发展案例,出海创新发展案例,以及科技金融赋能成都人工智能企业发展的案例。

本篇聚焦垂直行业大模型和深度合成算法。当前,越来越多的“成都造”大模型和深度合成服务算法,正在扎实落地开花。截至2024年11月,四川有9家企业的大模型通过网信备案或审核登记,其中注册地在成都的有8家。另有66家成都企业的84款深度合成服务算法通过备案。今年以来大模型和深度合成服务算法的成功备案或登记数量的增加,正反映了成都人工智能企业发展水平和综合竞争力的上升。

成都66家人工智能企业

通过深度合成服务算法备案

据统计,目前我国现有完成备案并上线为公众提供服务的生成式人工智能服务大模型200余个。四川9款大模型已通过相关备案或审核登记。

所谓备案或登记,主要区别在于适用对象不同。备案主要针对自行研发的大模型或进行了数据训练的模型。这意味着如果一个组织或个人开发了自己的AI模型,并且该模型已经过训练,则需要按照规定进行备案。登记则是针对接入第三方API来提供生成式服务的情况。例如,当一个应用或平台不是自己开发模型,而是通过调用其他服务商提供的API接口来实现某些功能时,这种情况下需要进行登记而不是备案。

今年3月,国家互联网信息办公室发布《生成式人工智能服务已备案信息》公告,四川长虹电器股份有限公司的“长虹云帆”成功备案,是四川首个成功备案大模型。5月,“晓模型XPT”“海艺绘画大模型”“MT-WorkGpt”等3款大模型通过备案,标志着成都行业大模型实现国家备案零的突破。7月到10月,“咪咕音乐AI视频彩铃”“智媒大模型”“明眸大模型”“银海闻语大模型”“智媒云大模型”等5款大模型陆续通过四川省网信办审核登记。这些大模型的应用范围主要是文本图像视频生成、电商客服、民生服务等领域。

算法方面,备案企业数量更多。截至2024年11月1日,通过梳理国家互联网信息办公室发布的前后八个批次的深度合成服务算法备案信息,其中属于成都企业的84款合成算法、服务算法通过备案,主要应用于图像合成、语音合成、文本生成、智能客服、个性化推荐等领域。

成都84款备案深度合成服务算法

经梳理发现,已备案的84款算法来自66家成都企业。企业注册地多在成都高新区、成都武侯区和四川天府新区,占比近九成。企业成立时间集中在2018年以后,尤其是2022年、2023年,说明成都人工智能企业近些年如雨后春笋般“冒头”较快。

在人工智能领域,近年来成都实现多项技术在全国领先,“AI成长潜力”排名全国第二,为科技前沿产业的高质量发展提供了有力支撑。数据显示,2023年成都共有人工智能企业852家,产业规模达780.3亿元。百花齐放,各有所长,可以用来形容当下成都做大模型和算法的企业态势。

潜在人工智能的行者AI数字文娱垂类大模型,考拉悠然的悠然多模态产业通用大模型,阿加犀智能的边缘端开源大模型,智慧途灵的SLM知识领域模型,万木健康的数字人驱动算法,凡瀚智创的凡瀚文本生成算法……一个个模型和算法,纵横人工智能“江湖”。

“一厘米宽一公里深”

探索垂直落地场景应用

大模型很热,可要实现商业化却很难。有业内人士直言,如今是“落地为王”的阶段,必须与场景相结合解决实际问题。成都人工智能企业研发的大模型和算法,在打法上更多是聚焦垂直行业,部分企业取得了不俗成绩,落地应用速度明显加快。

(一)AI+客服

AI客服问答

在主流电商平台购物的消费者,不知不觉中其实就已经享受到了晓多科技的服务。今年双十一期间,晓多科技以“晓模型XPT”为动力,支撑晓多机器人共接待成交订单6537.3万单,晓多机器人的AI贡献率为42%,人机协同共计服务8812万人,AI有效回复数更是达到了6.98亿次。

曾在百度等领先互联网公司效力的江岭,2014年在成都创办晓多科技,如今他带领团队走在国内智能客服机器人行业的前列。面对复杂的销售场景,智能客服在岗前、岗中均有性能提升的需求。如今,利用大模型的强上下文理解能力、总结能力和自然语言多轮对话的特性,可以帮助智能客服完成从浏览推荐到下单付款的购物全生命周期旅程。

“晓模型已具备强大的意图理解、策略生成和领域知识挖掘能力,能够为企业提供智能化、个性化的服务。业务从纵向深耕电商行业,到目前已横向拓展到电信、政务、高校、教育等行业,目前业务遍布全国50多个城市。”晓多科技新媒体运营负责人柳傲嘉介绍。

(二)AI+数字人

数字人应用

“大家好,我是‘经经’,本区域有……”位于四川天府新区兴隆湖北岸的天府数智产业园内,四川省制造业智改数转赋能平台的数字人“经经”正和来访者交流。在展厅里的数字人交互一体机上,访客通过手机扫码,即可解锁展厅智能讲解服务。数字人“经经”将扮演导览员的角色,以语言、图片、视频等多媒体形式,为参观者提供展厅地图、路线推荐、智能讲解等全方位服务。这一场景是明途科技WorkBrain大模型、智能体技术与智能终端设备融合的成果。

明途科技是国内最早的工作AI技术研发厂商之一,作为讯飞战略投资的成员企业,专注于智能体的核心技术研发。对普通用户来说,智能体最常见和直观的展现形式就是数字人。明途科技经历了应用场景-数据沉淀-类脑模型-智能体平台的发展过程,早在2014年基于SAAS的云工作平台开展目标管理产品模型探索,2018年构建目标大数据中心,2020年构建类脑模型实验室,2021年开展办公机器人研发,2022年探索垂直模型WorkBrain,2024年推出智能体云平台,开创领域知识注入,基于智能体虚拟社交,实现在线智能体云平台应用。

明途科技初步选择五大行业推进智能体数量聚集:企业、政务、文旅、教育、健康。比如明途科技为某锻造企业打造的专家数字人,利用自然语言处理、对话生成、知识注入、私有数据训练等AIGC技术,能将积累的锻造经验进行价值转换,提供学徒培训、答疑等多方面应用。

(三)AI+医疗

AIGC数字医生应用

在成都高新区的一个摄影棚内,医生只需要利用空闲时间,拍摄并选取3至5分钟的视频素材,万木健康便能进行机器学习并训练建模,生成一个高度拟真的“数字分身”。只需录制30句语音,系统就能快速采集到医生的声音特征,赋予数字分身以鲜活的“人格”。再加上万木健康为每位医生梳理创建的知识数据模型,这样即使是临床一线繁忙的医生,也能轻松打造专属的数字化身。

万木健康的核心团队,既有来自成都知名独角兽企业“医联”的高层,也有曾就职于华为的高级算法工程师、华西医院临床医师、世界500强药企管理层等。他们对医生群体需求的理解非常深入。患者教育、医生教育核心逻辑都是“以高价值医生为中心”持续运转,但高价值医生核心矛盾是时间少工作忙,无法开展更多医患互动和其他活动。

万木健康致力打造开源的数字医生网络,基于真实世界中各专科医学顶尖专家的知识经验训练、共创高质量模型,同时开源赋能给全国的超写实虚拟数字人医生,特点是“快”和“省事”。原创产品包括FTOD(Face to One Doctor)自动化患教系统、数字医嘱、数字医生工作站等。“数字医嘱”已落地北京、上海、广州等地多家医院。

(四)AI+教育

AI诗歌音乐创作

大型游戏拥有庞大的数据和AI训练潜力,正因如此,国内许多游戏公司都在转向AI应用开发探索,渗透到社交娱乐、美术、音乐等领域。但在发展过程中面临着商业模式选择问题,是走游戏公司擅长的C端推广还是偏落地应用的B端?

成都潜在人工智能科技有限公司(行者AI)的创始团队,出自当地一家知名的游戏公司“龙渊网络”。行者AI曾尝试推出一款面向C端的AI音乐产品,用户可以用它创作属于自己的音乐,积累了10余万的用户量。“但发现愿意为此买单的人很少。”潜在人工智能首席运营官陈洪宇坦言,后来企业迅速作出调整,转向打造了行者AI音乐教育平台。

2024年,在成都七中初中学校锦城校区科技活动月期间,行者AI带来了AI音乐教育平台、AI美术实训室,例如AI诗歌作曲,系统以唐诗宋词作为歌词原型,提供AI推荐、笔画图形OCR输入等多种便捷的输入方式,AI自动演唱、编曲、混音,可以让学生零门槛轻松进行旋律编创,一站式地完成独一无二的国学音乐作品。AI音乐教育平台通过打造交互式“作词+作曲+人声合成+演唱”的一站式AI音乐教学方案,解决老师音乐教学中面临的“纸上谈兵”问题,实现了AI教学+AI测评的新教学模式。相关产品目前已在北京、上海、广东、四川、云南、重庆、贵州、青海等省市广泛应用。

(五)AI+珠宝设计

AI珠宝设计

在珠宝设计工作中,设计师常会遇到缺乏灵感、线稿转实物图渲染时间长、设计反复修改等问题。凡游在线科技(成都)有限公司旗下人工智能团队——凡瀚智创,抓住行业痛点,已率先协助国内一家头部珠宝企业探索AI+珠宝行业解决方案,满足其包括珠宝设计、供应链、中台、营销、终端导购等全产业链的AI降本增效需求。

借助凡瀚智创AI+珠宝设计,能够快速生成大量创新方案,作为设计师的灵感源泉。同时,只需几秒就能通过设计图,生成采用了不同材质、不同工艺的实物图作为参考,减少反复沟通与返工。AI功能也能够复用到更多与设计相关的工作中,例如一键精细抠图、文生图、图生图,生成AI人像模特、AI产品海报等。在实际应用中,凡瀚智创协助珠宝企业搭建了一套AI珠宝佩戴工作流,将AI珠宝实物图直接佩戴在AI模特身上,节省拍摄成本,也更加直观地展示了珠宝产品的上身效果。

目前,“凡瀚文本生成算法”已通过国家网信办备案,该算法显著提高文本生成场景的准确率和安全性,凡瀚智创基于此算法,能够为客户提供模型私有化部署方案,在提供AI服务的同时,保证数据资产的安全。凡瀚智创为该珠宝企业打造的专属AI广场,就基于该珠宝企业的内部知识库,搭建各业务模块专属智能体,例如BI查询助理,准确率达到97%,但不涉及模型进行数据库连接、插入、更新等功能,保证客户的数据隐私。

(六)AI+城市治理

高速公路智能分析决策应用

高速路上两车相撞,管理单位如何第一时间感知、研判并处理?这件事现在已经可以交给AI。在2024年9月,成都市大模型新技术新成果发布暨供需对接系列活动——考拉悠然专场活动上,考拉悠然依托悠然大模型及其应用平台,发布了“悠然视界 | 高速公路智能分析决策应用”等最新的AI产品和技术成果。

据了解,该产品致力于实现全要素事件检测与关注事件过滤,关注事件研判与交互式处置方案生成,事件处置决策方案自动执行与联动,辅助决策者进行高效决策。该应用可通过交通事件检测器,实时集成报警电话、道路监控等数据,全面感知交通事件,支持全部8类国标事件检测并超过国标要求;结合部署了悠然交通大模型的交通大脑,可对关注事件进行主动过滤,有效过滤一般性交通事件90%以上;同时支持语音及视频等交互式生成处置方案,并通过Agent联动多终端执行,缩短交通事故研判时间30倍以上。

考拉悠然是业界领先的多模态大模型行业解决方案提供商。凭借自主研发的全球首款多模态AI操作系统——码极客,推出了悠然多模态产业通用大模型及其应用平台,该平台专注于多模态行业大模型的生成及应用,可以快速构建行业AI应用,累计为国内外包括高端屏显、半导体、烟草、轨道交通、生态环保、城市治理等行业在内的500+客户提供了全球领先的AI产品和服务。

观察小结:

从本文列举的几个创新案例,可以看到在AI+客服、数字人、医疗、教育、工业设计、城市治理等细分赛道,成都人工智能企业正在探索将通过备案的大模型或深度合成算法扎实落地。

为了使静止的飞轮转动起来,一开始必须使很大的力气,每转一圈都很费力,但是每一圈的努力都不会白费,飞轮会转动得越来越快。作为人工智能领域的创业公司,他们的共同点都在于,核心团队都有着长期的行业经验和研发积累,主要基于所擅长行业开展人工智能的主场景应用,并适当延伸落地场景和范围,有足够的坚持并稳扎稳打,才能让飞轮转得越来越快。

记者 杨鑫 温彦博 罗曙驰