沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

蔡浩宇AI公司发力:LPM 1.0视频大模型亮相 探索虚拟世界新可能

2026-04-11来源:快讯编辑:瑞雪

近日,AI领域迎来一项重要突破——Anuttacon技术团队发布了名为LPM 1.0的基于视频的角色表演模型。该模型由24位研究人员共同参与开发,能够实现实时说话、唱歌、倾听、反应及表情生成,为角色对话、虚拟直播、游戏NPC等场景提供了全新的技术解决方案。

据介绍,LPM 1.0是面向单人全双工音视频对话的表演大模型,针对现有视频生成模型在表现力、实时推理和长时身份稳定性等方面的不足进行了针对性优化。团队构建了以人为中心的多模态数据集,通过训练17B参数的Base LPM并蒸馏为低延迟流式的Online LPM,实现了无限时长下身份一致的实时视频生成与细腻拟人化表演。团队还打造了首个交互角色表演基准LPM-Bench,在各项评估中取得领先成果,为对话代理、直播角色和游戏NPC提供了通用视觉引擎。

从技术实现来看,LPM 1.0支持多模态输入,用户可通过1张图片、可选参考图片、音频及文本生成角色表演视频。模型采用全局外观参考、多视角身体图像与面部表情参考素材等多维度身份稳定要素,有效规避了牙齿、表情纹路等细节的错误生成问题。同时,该模型无需微调即可支持写实、2D动漫、3D游戏及非类人生物等不同角色风格,展现出强大的泛化能力。

在互动体验方面,LPM 1.0支持全双工实时对话,双方可同时说话、倾听并随时打断,模型会通过停顿、身体节奏和目光转移等细节增强真实感。非对话场景中,角色独处时也会展现自然的呼吸节奏和情感表达。与同类技术相比,LPM 1.0在视觉忠实度、口型精准度、身份保护及自然感等方面表现突出,且支持任意长度内容生成,突破了Kling-Avatar 2.0和OmniHuman 1.5等模型30秒的时长限制。

尽管技术优势显著,但Anuttacon团队目前并无公开模型权重、源代码或在线演示的计划。此次发布主要用于展示研究进展,供学术交流使用。不过,这一动作被解读为团队扩大AI人才招聘的信号。据悉,Anuttacon由米哈游创始人蔡浩宇创办,其技术探索方向与米哈游在AI领域的布局密切相关。例如,米哈游此前已在《崩坏:星穹铁道》中尝试应用AI工具管理角色行为、优化3D建模及生成NPC台词,并计划通过AI驱动实现“对话永不重复的智能NPC”。

米哈游的AI布局不仅限于游戏开发。2025年,该公司发布崩坏IP项目组AI专项招募计划,聚焦“AI驱动提效”与“AI驱动创新”,已搭建AI Agent平台Echo及多个游戏开发管线应用。米哈游三位创始人还通过捐赠助力上海交通大学“AI未来基石基金”,为技术人才储备铺路。从试验性AI游戏《Whispers from the Star》到AI聊天产品AnuNeko,再到如今的LPM 1.0,米哈游的技术进化路径逐渐清晰。其生活模拟新作《星布谷地》首次测试中已推出支持自由文字对话的AI NPC,进一步验证了AI与游戏结合的可行性。

四川大学深圳大学团队突破海水制氢瓶颈 构建全链条理论助力“海洋绿氢”发展
记者10日获悉,四川大学/深圳大学谢和平院士团队首次将真实海洋环境多因素耦合作用纳入海水制氢研究,打通从微观反应机制到宏观工程放大的全链条认知,构建规模化产业化系统评估框架,为“海洋绿氢”产业发展提供核心理…

2026-04-11

白马湖实验室获氨分解制氢新专利 二氧化铈反相催化剂助力技术突破
国家知识产权局信息显示,浙江省白马湖实验室有限公司取得一项名为“一种基于二氧化铈反相催化剂进行氨分解制氢的方法”的专利,授权公告号CN121513890B,申请日期为2026年1月。 天眼查资料显示,浙江省白…

2026-04-11