Mochi 1 Mochi 1是一款开源免费的高精度视频生成模型,以真实物理运动建模和精准提示词响应重新定义AI视频创作 04340 AI开发平台AI开源项目# AI开源项目# Apache 2.0许可证# Asymmetric Diffusion Transformer
AtomoVideo 总结来说,AtomoVideo代表着图像转视频领域的新高度,通过创新的多粒度注入技术和超强兼容性,为动态内容创作提供了新范式。 01590 AI开发平台AI开源项目# AI开源项目
OpenVoice 一句话总结:多语种语音克隆、精准声纹复刻、全场景免费商用,这就是OpenVoice的三大杀招。 03930 AI开发平台AI开源项目# AI开源项目# MIT许可证# 关键词:即时语音克隆
EchoMimic 通过可编辑landmark技术与多模态训练策略,EchoMimic实现了影视级人像动画生成,是AIGC视频赛道的革新者 01020 AI开发平台AI开源项目# AI开源项目# AI数字人播报# 多模态训练模型
CosyVoice2.0 CosyVoice 2.0突破性实现150ms超低延迟语音合成,支持多语种混合生成与精准情感控制,重塑AI语音交互体验 02920 AI开发平台AI开源项目# AI开源项目# 低延迟语音生成# 多语言语音合成
EasyAnimate 阿里巴巴出品的长视频生成工具EasyAnimate,用开源技术实现电影级AI视频创作 01970 AI开发平台AI开源项目# AI开源项目# AI视频生成# Diffusion模型训练
NotebookLlama 一句话总结:Notebook Llama是PDF文档处理领域的一匹黑马,免费开源方案碾压付费软件 03440 AI开发平台AI开源项目# AI开源项目# Llama3模型应用# 关键词:PDF转播客工具
MinerU MinerU证明了一个真理:专业的事就该用专业的工具。从符号转换到多语言支持,每个细节都透着开发团队的技术功底。虽然还在成长阶段,但作为开源工具已经展现出惊人的潜力。无论是配合大模型训练还是跨境业务处理,这都是个值得加入技术栈的实力派选手。 03440 AI开发平台AI开源项目# AI开源项目# RAG应用预处理# 可定制工作流
WiseFlow WiseFlow这款信息挖掘工具,正在用大模型重新定义智能情报获取方式,让每个普通人都能低成本打造个人数据中枢。 02700 AI开发平台AI开源项目# AI开源项目# LLM内容提炼# 信息挖掘工具