AniSora翻译站点

6个月前发布 423 00

哔哩哔哩开源动漫视频生成模型

所在地：

美国

语言：

英语

收录时间：

2026-01-14

打开网站

AniSora：B站开源的动漫视频生成革命

AniSora是由哔哩哔哩（B站）自主研发并开源的综合系统，专为动漫视频生成而设计。它旨在攻克动画创作中的核心难题，如精准还原艺术家独特风格、处理违反物理定律的夸张动作以及实现高度风格化的表现。该系统代表了当前最强大的开源动漫生成模型，为二次元内容创作带来了颠覆性的工具。

AniSora的核心技术架构

该系统由三大核心组件构成，确保了其强大的生成能力：

数据处理管道：通过高效的数据飞轮机制，收集并清洗了超过1000万个高质量文本-视频对，为模型训练提供了坚实、丰富的数据基础。
可控生成模型：采用先进的扩散Transformer架构，并创新性地引入了时空掩码模块。该设计支持关键帧插帧、精细的运动控制等功能，实现了视频的平滑过渡与局部区域的可控生成。
评估基准数据集：构建了包含948个多样化动画视频的专用数据集，用于系统性地评估生成视频在角色一致性与动作连贯性等方面的表现。

主要功能与应用场景

AniSora支持多样化的动漫视频生成模式，满足不同创作需求：

文生视频：直接根据文本描述生成动漫视频镜头。
视频插帧：在现有视频序列中插入中间帧，使动作更加流畅。
局部图像引导动画：通过指定局部图像（如角色面部）来引导整体动画的生成。

其应用场景广泛覆盖番剧片段、国创动画、漫画改编、VTuber内容、动画PV以及鬼畜（MAD）视频等多种风格。

显著优势与已验证的成果

AniSora在多项测试中展现出卓越性能，已成功应用于实际生产：

在权威的VBench评估中，其在运动平滑度、美学质量、内容一致性等关键指标上表现优异。
在人工双盲测试中，其生成效果尤其在主体一致性和运动平滑度方面超越了其他同类方法。
已成功赋能超过10部B站自有IP作品的动态漫制作，显著降低了制作成本并提升了生产效率。

未来发展方向

展望未来，AniSora团队计划进一步扩展系统能力，重点方向包括：建立全面的自动评分系统、持续优化高质量模型的性能，以及积极研究并应对生成动画中的伦理与版权问题。

AniSora通过其创新的技术框架与强大的实用性能，为动画视频生成领域带来了突破性进展，极大拓宽了动漫内容创作的可能性，是B站献给全球二次元创作者的一份重磅礼物。

数据统计

AniSora翻译站点

AniSora：B站开源的动漫视频生成革命

AniSora的核心技术架构

主要功能与应用场景

显著优势与已验证的成果

未来发展方向

数据统计

相关导航

HiDream AI

语鲸大模型

Mistral

商量拟人大模型

Stable video diffusion online

Veo

书生·筑梦2.0

巨日禄AI漫画