打工人Ai工具箱
  • Ai网址
    • Ai+智能对话
    • Ai+写作工具
    • Ai+图像工具
    • Ai+视频工具
    • Ai+音频工具
    • Ai+设计工具
    • Ai+编程助手
    • Ai+办公助手
    • Ai+开源项目
  • Ai应用商店
  • Ai学习教程
  • 投稿收录
  • 安装教程
  • 商务合作
      • 未登录
        登录后即可体验更多功能
    • Ai网址
      • Ai+智能对话
      • Ai+写作工具
      • Ai+图像工具
      • Ai+视频工具
      • Ai+音频工具
      • Ai+设计工具
      • Ai+编程助手
      • Ai+办公助手
      • Ai+开源项目
    • Ai应用商店
    • Ai学习教程
    • 投稿收录
    • 安装教程
    • 商务合作
    未登录
    登录后即可体验更多功能

    AI开源项目

    共 94 篇网址
    排序
    发布更新浏览点赞
    SafeEar

    SafeEar

    一款无需窃听内容即可识破语音伪造的跨时代安全工具
    03100
    AI开发平台AI开源项目# ACM CCS 2024# AI开源项目# 低错误率检测
    PDF2Audio

    PDF2Audio

    能随时随地"听论文"的感觉有多爽?这么说吧,现在我的运动手环都统计到——用PDF2Audio后思维活跃度提升46%,真是学习工作两开花!
    02060
    AI开发平台AI开源项目# AI开源项目# AI生成播客# PDF转音频工具
    MetaGPT

    MetaGPT

    MetaGPT将复杂软件开发流程压缩成一键式智能协作,重新定义AI辅助开发的生产力边界
    04080
    AI开发平台AI开源项目# AI开源项目# 全流程项目管理# 复杂需求解析
    OLMo

    OLMo

    全栈开源的AI大模型框架,推动技术民主化的关键基石
    03320
    AI开发平台AI开源项目# AI开源项目# 开源语言模型# 指令调优方案
    IP-Adapter

    IP-Adapter

    IP-Adapter:无需代码就能实现的跨模态AI图像生成方案
    01790
    AI开发平台AI开源项目# AI开源项目# 图像提示技术# 多模态生成
    Follow Your Pose

    Follow Your Pose

    通过姿势与文字的双重指引生成可编辑风格化视频
    01660
    AI开发平台AI开源项目# AI动作捕捉# AI开源项目# 多风格模型
    Lepton Search

    Lepton Search

    Lepton Search是一个开源的对话式搜索引擎,开发者可用不到500行代码快速构建类Perplexity的AI驱动搜索工具,支持谷歌/Bing并集成RAG技术。
    01810
    AI开发平台AI开源项目# AI开源项目# AI驱动搜索# Python代码构建搜索系统
    abab-music-1

    abab-music-1

    MiniMax AI通过海螺智能平台突破创意门槛,让文字、音乐、视频创作像发朋友圈一样简单
    03260
    AI开发平台AI开源项目# AI开源项目# 全链路音乐制作# 多语种情感语音
    Vary-toy

    Vary-toy

    专业级视觉语言处理 消费级硬件需求 多模态文档转换 科研效率工具 工业级物体识别
    01770
    AI开发平台AI开源项目# AI开源项目# 多模态任务处理# 开源视觉语言模型
    FineVideo

    FineVideo

    开源多模态训练领域的里程碑式资源库
    02430
    AI开发平台AI开源项目# AI开源项目# AI视频分析# 多模态AI训练
    ActAnywhere

    ActAnywhere

    全球首款实现电影级人景互动的AI视频生成解决方案
    03550
    AI开发平台AI开源项目# AI开源项目# AI影视特效# 动态光照模拟
    Draw an Audio

    Draw an Audio

    Draw an Audio通过多模态指令系统实现精准的视频到音频合成,开创音效创作新模式
    04760
    AI开发平台AI开源项目# AI开源项目# AI音效分层编辑# 多指令控制技术
    DemoFusion

    DemoFusion

    要我说这项目最绝的地方,是它把学术界的前沿成果真正落在了实处。不同于那些只能跑benchmark的论文,他们的项目主页直接给出现成的工作流,连Colab新手都能三天上手——这才是真正的技术民主化!
    03970
    AI开发平台AI开源项目# AI开源项目# ControlNet兼容# 开源AI框架
    Ovis1.6

    Ovis1.6

    多模态大语言模型领域的开源革命者,用结构对齐技术实现视觉与语言的精准对话
    03890
    AI开发平台AI开源项目# AI开源项目# HuggingFace集成# 图像识别
    Real-ESRGAN

    Real-ESRGAN

    AI图像修复领域的开源突破者
    03470
    AI开发平台AI开源项目# AI图像修复# AI开源项目# 动漫视频增强
    DDColor

    DDColor

    让尘封的影像重获新生,DDColor开启智能着色新时代
    02810
    AI开发平台AI开源项目# AI图像着色# AI开源项目# 动漫场景转换
    SFR-RAG

    SFR-RAG

    站在技术前线说句公道话,SFR-RAG把RAG技术的faithfulness(忠实度)指标提升到了新高度。虽然参数规模不算顶流,但这种以精度换规模的做法,倒是给吃算力吃到吐的AI行业吹来一阵清风。
    02080
    AI开发平台AI开源项目# AI开源项目# 企业RAG应用# 低参数高效模型
    Screenshot to Code

    Screenshot to Code

    通过AI技术实现设计稿到可用代码的秒级转换,支持多框架输出与智能迭代优化。
    02940
    AI开发平台AI开源项目# AI开源项目# AI生成代码# 多框架支持
    cogvlm2-llama3-caption

    cogvlm2-llama3-caption

    清华THUDM开源的多模态视频理解模型,为视频内容提供专家级文本描述
    01610
    AI开发平台AI开源项目# AI开源项目# CogVLM2架构# Llama3微调模型
    AnyText

    AnyText

    AnyText正在重新定义智能设计的边界:支持21种语言的精准文本渲染
    01410
    AI开发平台AI开源项目# AI图像生成# AI开源项目# AI生图工具
    MagicVideo-V2

    MagicVideo-V2

    让每个idea都能视觉化呈现的AI引擎
    04910
    AI开发平台AI开源项目# AI开源项目# MagicVideo-V2# 动态粒子特效
    书生·物华2.0(3DTopia 2.0)

    书生·物华2.0(3DTopia 2.0)

    一款能让建模效率翻十倍的国产开源神器
    02210
    AI开发平台AI开源项目# 3D模型生成# AI建模工具# AI开源项目
    FaceChain

    FaceChain

    全球首个支持个性化数字分身定制的开源AI写真平台
    04220
    AI开发平台AI开源项目# AI写真生成# AI开源项目# SD插件开发
    Outfit Anyone

    Outfit Anyone

    当技术审美遇上算法创造力,虚拟世界的时尚革命早已悄然揭幕。
    04660
    AI开发平台AI开源项目# AI开源项目# AI虚拟换装# 动态布料解算
    StoryMaker

    StoryMaker

    AI智能生成儿童教育故事的创新解决方案
    03490
    AI开发平台AI开源项目# AI开源项目# AI故事生成# 个性化儿童故事
    Animate Anyone

    Animate Anyone

    通答AI打造的企业级人工智能应用生态闭环
    03430
    AI开发平台AI开源项目# AI开源项目# 智能语义分析# 自动化流程引擎
    CogVideoX-Fun

    CogVideoX-Fun

    专治各类视频顽疾的AI外科医生
    02070
    AI开发平台AI开源项目# AI开源项目# 动态补帧技术# 智能帧率优化
    PhotoMaker V2

    PhotoMaker V2

    PhotoMaker V2通过深度学习算法实现个性化人像的高保真生成
    03870
    AI开发平台AI开源项目# AI开源项目# AI身份保真# LoRA模型优化
    I2VGen-XL

    I2VGen-XL

    阿里巴巴最新推出的图像转视频AI系统,通过级联扩散模型实现高清动态画面生成
    04540
    AI开发平台AI开源项目# AI开源项目# 图像生成视频# 扩散模型框架
    RAGFlow

    RAGFlow

    RAGFlow 是一款开源的企业级 RAG 系统,支持多模型并发、结构化数据集成、Web UI 配置等特性。本文详解其部署方式、核心架构与实战应用,助你快速搭建高性能问答系统。
    01880
    AI开发平台AI开源项目# AI开源项目# AI搜索增强# RAGFlow 部署
    加载更多

    <script>

    Copyright © 2023 打工人Ai工具箱
    桂ICP备2023002501号-1
      
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍