AniSora翻译站点

14小时前发布 175 0 0

哔哩哔哩开源动漫视频生成模型

所在地:
美国
语言:
英语
收录时间:
2026-01-14

AniSora:B站开源的动漫视频生成革命

AniSora是由哔哩哔哩(B站)自主研发并开源的综合系统,专为动漫视频生成而设计。它旨在攻克动画创作中的核心难题,如精准还原艺术家独特风格、处理违反物理定律的夸张动作以及实现高度风格化的表现。该系统代表了当前最强大的开源动漫生成模型,为二次元内容创作带来了颠覆性的工具。

AniSora的核心技术架构

该系统由三大核心组件构成,确保了其强大的生成能力:

  • 数据处理管道:通过高效的数据飞轮机制,收集并清洗了超过1000万个高质量文本-视频对,为模型训练提供了坚实、丰富的数据基础。
  • 可控生成模型:采用先进的扩散Transformer架构,并创新性地引入了时空掩码模块。该设计支持关键帧插帧、精细的运动控制等功能,实现了视频的平滑过渡与局部区域的可控生成。
  • 评估基准数据集:构建了包含948个多样化动画视频的专用数据集,用于系统性地评估生成视频在角色一致性动作连贯性等方面的表现。

主要功能与应用场景

AniSora支持多样化的动漫视频生成模式,满足不同创作需求:

  • 文生视频:直接根据文本描述生成动漫视频镜头。
  • 视频插帧:在现有视频序列中插入中间帧,使动作更加流畅。
  • 局部图像引导动画:通过指定局部图像(如角色面部)来引导整体动画的生成。

其应用场景广泛覆盖番剧片段国创动画漫画改编VTuber内容动画PV以及鬼畜(MAD)视频等多种风格。

显著优势与已验证的成果

AniSora在多项测试中展现出卓越性能,已成功应用于实际生产:

  • 在权威的VBench评估中,其在运动平滑度美学质量内容一致性等关键指标上表现优异。
  • 在人工双盲测试中,其生成效果尤其在主体一致性运动平滑度方面超越了其他同类方法。
  • 已成功赋能超过10部B站自有IP作品的动态漫制作,显著降低了制作成本并提升了生产效率。

未来发展方向

展望未来,AniSora团队计划进一步扩展系统能力,重点方向包括:建立全面的自动评分系统、持续优化高质量模型的性能,以及积极研究并应对生成动画中的伦理与版权问题

AniSora通过其创新的技术框架与强大的实用性能,为动画视频生成领域带来了突破性进展,极大拓宽了动漫内容创作的可能性,是B站献给全球二次元创作者的一份重磅礼物。

数据统计

相关导航

暂无评论

none
暂无评论...