Draw an Audio Draw an Audio通过多模态指令系统实现精准的视频到音频合成,开创音效创作新模式 04750 AI开发平台AI开源项目# AI开源项目# AI音效分层编辑# 多指令控制技术
AnimateDiff 特别提示:根据ComfyUI-AnimateDiff-Evolved的README,商业用途得额外授权。想靠这个接单的同学记得走官方渠道申请license! 04540 AI开发平台AI开源项目# AI开源项目# Stable Diffusion动画扩展# 个性化模型动画适配
VideoPoet Google VideoPoet突破传统视频制作流程,用大语言模型技术实现多模态零样本生成。 04490 AI开发平台AI开源项目# AI开源项目# LLM驱动创作# 多模态视频生成
Mochi 1 Mochi 1是一款开源免费的高精度视频生成模型,以真实物理运动建模和精准提示词响应重新定义AI视频创作 04350 AI开发平台AI开源项目# AI开源项目# Apache 2.0许可证# Asymmetric Diffusion Transformer
Snap Video 用一句话总结:基于十亿级参数的时空Transformer模型,Snap Video开创了文本驱动的高质量视频生成新范式 03990 AI开发平台AI开源项目# AI开源项目# 文本转视频生成# 时空一致性
DemoFusion 要我说这项目最绝的地方,是它把学术界的前沿成果真正落在了实处。不同于那些只能跑benchmark的论文,他们的项目主页直接给出现成的工作流,连Colab新手都能三天上手——这才是真正的技术民主化! 03970 AI开发平台AI开源项目# AI开源项目# ControlNet兼容# 开源AI框架
OpenVoice 一句话总结:多语种语音克隆、精准声纹复刻、全场景免费商用,这就是OpenVoice的三大杀招。 03940 AI开发平台AI开源项目# AI开源项目# MIT许可证# 关键词:即时语音克隆