Open-Sora开源项目大升级!16秒720P高清视频轻松生成

科技 2024-04-29 10:03 阅读:9

潞晨科技旗下文生视频模型开源项目Open-Sora最新版本更新,带来了令人振奋的好消息:现在可以生成长达16秒、720P高清视频了!这个消息简直让人欣喜若狂!

在这次更新中,团队对1.0版本的STDiT架构进行了重大改进,提升了模型的训练稳定性和整体性能。通过采用多阶段训练方法,视频生成质量得到了有效提升,同时引入了QK归一化技术和旋转位置编码,让整个训练流程更加顺畅高效。

除此之外,Open-Sora还支持多时间、分辨率、长宽比和帧率的训练,具备多模态功能,可以轻松应对文本到图像、文本到视频、图像到视频等多种任务。这种全方位的功能让用户体验更加丰富多彩!

团队还引入了掩码策略来支持图像和视频的条件化处理,提供了详细的掩码策略配置指南,增强了模型在处理图像条件化任务时的学习效果。同时,在数据收集和预处理方面,团队建立了自动化流程,包括场景分割、字幕处理、数据评分与筛选等步骤,优化了数据集的质量和数量,让用户体验更加顺畅。

Open-Sora的更新版本在模型稳定性、训练效率和功能扩展等方面都取得了显著进展,为用户提供了更加强大和多样化的视频生成能力。想要体验这一切的精彩?赶紧点击项目入口,开启你的视频创作之旅吧!