AI开源项目

共 93 篇网址

排序

发布更新浏览点赞

Real-ESRGAN

AI图像修复领域的开源突破者

1,5320

Ai开源项目 # AI图像修复 # AI开源项目 # 动漫视频增强

Dify

AI工作流Agent，一站式AI应用构建平台

1,2060

Ai开发框架 Ai开源项目 # AI Agent # AI工作流 # AI应用开发平台

GPT-SoVITS

一款开源的跨语言语音克隆工具，支持5秒样本实时合成，无需编程即可通过WebUI实现专业级语音克隆

1,1100

Ai开源项目 # AI开源项目 # 声音转换 # 多语言支持

Dify

AI工作流Agent，一站式AI应用构建平台

1,0510

Ai开发框架 Ai开源项目 # AI Agent # AI工作流 # AI应用开发平台

EMO

让静态肖像开口说话唱歌的AI视频生成神器

1,0350

Ai开源项目 # AI开源项目 # 数字人创作工具 # 虚拟角色动画

eSearch

满足日常办公需求的智能效率工具包

9500

Ai开源项目 # AI开源项目 # AI截图工具 # AI智能翻译

SeedEdit

由字节跳动Seed团队开发的AI图像编辑工具，实现基于自然语言的多轮高精度图像修改

8420

Ai开源项目 # AI开源项目 # 商业设计应用 # 多轮无损修图

MinerU

MinerU证明了一个真理：专业的事就该用专业的工具。从符号转换到多语言支持，每个细节都透着开发团队的技术功底。虽然还在成长阶段，但作为开源工具已经展现出惊人的潜力。无论是配合大模型训练还是跨境业务处理，这都是个值得加入技术栈的实力派选手。

8070

Ai开源项目 # AI开源项目 # RAG应用预处理 # 可定制工作流

UniEdit

免调优视频编辑框架开创者，支持文字驱动运动与外观修改

7800

Ai开源项目 # AI开源项目 # 外观风格化 # 文字到视频生成

Roop

深度学习、面部替换、AI换脸、开源工具、数字内容创作

7490

Ai开源项目 # AI开源项目 # 技术宅的创意倍增器 # 用单张图片实现视频换脸的开源神器

HivisionIDPhotos

开源AI证件照生成工具，支持全流程离线处理与精准尺寸控制

7480

Ai开源项目 # AI开源项目 # AI证件照生成 # 人像抠图工具

MagicVideo-V2

让每个idea都能视觉化呈现的AI引擎

7210

Ai开源项目 # AI开源项目 # MagicVideo-V2 # 动态粒子特效

Reflection 70B

能够自主纠错的开源大语言模型，革新AI可信度与实用性

7200

Ai开源项目 # AI准确性提升 # AI开源项目 # Reflection-Tuning技术

Tailor

用AI重新定义视频创作流程的视频智能剪辑神器

7200

Ai开源项目 # AI开源项目 # Tailor AI # 人脸识别剪辑

F5-TTS

基于扩散式变压器实现零样本多语言合成的尖端语音生成技术

7170

Ai开源项目 # AI开源项目 # 多语言合成系统 # 实时推理加速

Outfit Anyone

当技术审美遇上算法创造力，虚拟世界的时尚革命早已悄然揭幕。

7100

Ai开源项目 # AI开源项目 # AI虚拟换装 # 动态布料解算

VideoPoet

Google VideoPoet突破传统视频制作流程，用大语言模型技术实现多模态零样本生成。

7090

Ai开源项目 # AI开源项目 # LLM驱动创作 # 多模态视频生成

Snap Video

用一句话总结：基于十亿级参数的时空Transformer模型，Snap Video开创了文本驱动的高质量视频生成新范式

6880

Ai开源项目 # AI开源项目 # 文本转视频生成 # 时空一致性

I2VGen-XL

阿里巴巴最新推出的图像转视频AI系统，通过级联扩散模型实现高清动态画面生成

6880

Ai开源项目 # AI开源项目 # 图像生成视频 # 扩散模型框架

AnimateDiff

特别提示：根据ComfyUI-AnimateDiff-Evolved的README，商业用途得额外授权。想靠这个接单的同学记得走官方渠道申请license！

6820

Ai开源项目 # AI开源项目 # Stable Diffusion动画扩展 # 个性化模型动画适配

ScreenAgent

计算机视觉操控革命：基于VLM的自主任务执行系统

6740

Ai开源项目 # AI开源项目 # VNC协议操作 # 人机协作增强

DreaMoving

扩散模型驱动的可控人体视频生成框架，实现高精度角色与动作解耦控制

6610

Ai开源项目 # AI内容创作工具 # AI开源项目 # 姿态驱动动画

OpenVoice

一句话总结：多语种语音克隆、精准声纹复刻、全场景免费商用，这就是OpenVoice的三大杀招。

6600

Ai开源项目 # AI开源项目 # MIT许可证 # 关键词：即时语音克隆

MetaGPT

MetaGPT将复杂软件开发流程压缩成一键式智能协作，重新定义AI辅助开发的生产力边界

6590

Ai开源项目 # AI开源项目 # 全流程项目管理 # 复杂需求解析

SUPIR

基于大规模扩散模型的智能图像修复与增强解决方案

6560

Ai开源项目 # AI图像修复 # AI开源项目 # AI负向提示词

FunAudioLLM

开源语音框架终结机械对话，支持多语言实时交互与情感化语音生成

6540

Ai开源项目 # AI开源项目 # 低延迟ASR # 多语言语音交互

GOT-OCR2.0

端到端OCR模型革新文字识别全流程

6370

Ai开源项目 # AI开源项目 # 多任务文本识别 # 多页PDF处理

MaskGCT

将零样本语音合成推进到工业级应用的非自回归创新模型

6290

Ai开源项目 # AI开源项目 # 声学代码转换 # 多语言语音生成

DemoFusion

要我说这项目最绝的地方，是它把学术界的前沿成果真正落在了实处。不同于那些只能跑benchmark的论文，他们的项目主页直接给出现成的工作流，连Colab新手都能三天上手——这才是真正的技术民主化！

6200

Ai开源项目 # AI开源项目 # ControlNet兼容 # 开源AI框架

PortraitGen

突破传统三维重建技术瓶颈的多模态肖像编辑神器

6180

Ai开源项目 # 3D一致渲染 # 4D高斯场重建 # AI开源项目