ChatMusician
用下来最惊艳还是它的结构性把控,你说要"奏鸣曲式的展开部",它绝不会给你弄成流行歌曲的重复副歌。更魔幻的是,这货生成的总谱居然自带表情记号,连"con brio"(充满活力地)这种专业标注都安排得明明白白。现在每次打开它的在线demo,都像在跟音乐学院优等生进行脑暴会议——只不过这位"学生"永远不会喊累,还能7×24小时飚创意。
FIFO-Diffusion 是一款可以生成无限长的连续视频的AI视频生成开源项目,是一种无需训练的基于预训练扩散模型的新型推理技术,可以从文本生成无限长的视频。
虽然它能够生成无限时长的长视频,但还是会存在一定的跳帧情况。不过网上也有大佬们提供有解决方式,就是推荐使用AI插帧来补充画面跳帧弊端。
特点:
• 通过迭代进行对角去噪处理,无需训练即可生成无限长的视频。
• 通过前向参考机制使帧之间的去噪效果更好,同时引入潜在分区和前瞻去噪以减少训练-推理差距。
• 支持生成高质量、长时间的视频,已在多种文本到视频生成基线模型上展示了其有效性。
• FIFO-Diffusion 在TextVQA、DocVQA等基准测试中表现优异,超过了一些非开源模型。
Star:146
