Mochi 1Mochi 1是一款开源免费的高精度视频生成模型,以真实物理运动建模和精准提示词响应重新定义AI视频创作04840Ai开源项目# AI开源项目# Apache 2.0许可证# Asymmetric Diffusion Transformer
EchoMimic通过可编辑landmark技术与多模态训练策略,EchoMimic实现了影视级人像动画生成,是AIGC视频赛道的革新者01490Ai开源项目# AI开源项目# AI数字人播报# 多模态训练模型
CosyVoice2.0CosyVoice 2.0突破性实现150ms超低延迟语音合成,支持多语种混合生成与精准情感控制,重塑AI语音交互体验03490Ai开源项目# AI开源项目# 低延迟语音生成# 多语言语音合成
NotebookLlama一句话总结:Notebook Llama是PDF文档处理领域的一匹黑马,免费开源方案碾压付费软件04010Ai开源项目# AI开源项目# Llama3模型应用# 关键词:PDF转播客工具
MinerUMinerU证明了一个真理:专业的事就该用专业的工具。从符号转换到多语言支持,每个细节都透着开发团队的技术功底。虽然还在成长阶段,但作为开源工具已经展现出惊人的潜力。无论是配合大模型训练还是跨境业务处理,这都是个值得加入技术栈的实力派选手。04580Ai开源项目# AI开源项目# RAG应用预处理# 可定制工作流