LOADING

热门

StoryDiffusion

2年前更新 1,941 00

强大的图像和视频生成模型

收录时间：

2024-06-25

AI漫剧全流程

StoryDiffusion 是一个强大的图像和视频生成模型，通过一致自注意力机制和运动预测器，能够生成连贯的长序列图像和视频。

主要优点：

能够生成具有角色一致性的图像，并且可以扩展到视频生成，为用户提供了一个创造长视频的新方法。

它可热插拔，并兼容所有基于 SD1.5 和 SDXL 的图像扩散模型。对于当前的实现，用户需要为一致的自注意力模块提供至少3个文本提示。

目前该项目上线不到5天，Github上已有1.4k标星，可见该模型打破了短视频生成限制，为长视频生成提供了新的途径。

数据统计

相关导航

SuperDuperDB

简单而强大的AI开发和部署框架

FunAudioLLM

开源语音框架终结机械对话，支持多语言实时交互与情感化语音生成

Seed-VC

突破传统的声音转换工具，提供开源免费的AI声纹克隆解决方案

DiffusionGPT

DiffusionGPT最厉害的是通过树状思维架构，智能调度最适合的开源模型生成极致匹配需求的高质量图像

SUPIR

基于大规模扩散模型的智能图像修复与增强解决方案

Roop

深度学习、面部替换、AI换脸、开源工具、数字内容创作

Audiocraft/MusicGen

开源神器Audiocraft让普通人敲几行字、哼段旋律，就能搞出专业级音乐/音效。

PDF2Audio

能随时随地"听论文"的感觉有多爽？这么说吧，现在我的运动手环都统计到——用PDF2Audio后思维活跃度提升46%，真是学习工作两开花！