昆仑万维近期在视频生成技术领域取得了重大进展,正式推出了其创新性的无限时长电影生成模型SkyReels-V2,并宣布将此技术开源。这一举措标志着视频生成技术正迈向一个崭新的发展阶段。
传统视频生成技术在追求高质量视觉效果的同时,往往面临着运动动态效果受限的问题。为了保持高分辨率,视频时长常常被限制在极短的5至10秒内。现有的通用多模态大语言模型(MLLM)在解读电影语法方面存在明显不足,如镜头构图、演员表情及摄像机运动等关键元素,这导致生成的视频在镜头感知上显得力不从心。这些技术瓶颈相互交织,严重制约了长视频的真实合成以及专业电影风格的生成。
SkyReels-V2的推出,正是为了解决这些行业难题。该模型采用了创新的扩散强迫(Diffusion-forcing)框架,并融合了多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)以及强化学习(Reinforcement Learning)技术,实现了技术上的重大突破。它能够生成流畅且逼真的视频内容,满足电影制作中对高质量运动动态的高标准需求。
值得注意的是,SkyReels-V2已支持生成30秒至40秒的视频,并且具备生成高运动质量、高一致性和高保真视频的能力。这一技术的突破,不仅打破了传统视频生成技术的时长限制,更在视觉质量上实现了显著提升。
SkyReels-V2的应用场景广泛,涵盖了故事生成、图生视频、运镜专家以及多主体一致性视频生成(SkyReels-A2)等多个领域。这为内容创作者提供了前所未有的强大工具,使他们能够轻松生成具有专业电影风格的视频内容,极大地提升了内容创作的效率和创意空间。内容创作者现在可以利用这一技术,快速制作出高质量的视频作品,满足各种创作需求。
昆仑万维已将SkyReels-V2的开源地址和相关论文地址公之于众,包括GitHub和HuggingFace等平台。这意味着,任何对视频生成技术感兴趣的人都可以免费获取并使用这一先进技术,共同推动视频生成技术的发展和创新。