StoryDiffusion 是一个强大的图像和视频生成模型,通过一致自注意力机制和运动预测器,能够生成连贯的长序列图像和视频。
主要优点:
能够生成具有角色一致性的图像,并且可以扩展到视频生成,为用户提供了一个创造长视频的新方法。
它可热插拔,并兼容所有基于 SD1.5 和 SDXL 的图像扩散模型。对于当前的实现,用户需要为一致的自注意力模块提供至少3个文本提示。
目前该项目上线不到5天,Github上已有1.4k标星,可见该模型打破了短视频生成限制,为长视频生成提供了新的途径。
数据统计
相关导航
暂无评论...