PDF2Audio 能随时随地"听论文"的感觉有多爽?这么说吧,现在我的运动手环都统计到——用PDF2Audio后思维活跃度提升46%,真是学习工作两开花! 02060 AI开发平台AI开源项目# AI开源项目# AI生成播客# PDF转音频工具
Lepton Search Lepton Search是一个开源的对话式搜索引擎,开发者可用不到500行代码快速构建类Perplexity的AI驱动搜索工具,支持谷歌/Bing并集成RAG技术。 01810 AI开发平台AI开源项目# AI开源项目# AI驱动搜索# Python代码构建搜索系统
abab-music-1 MiniMax AI通过海螺智能平台突破创意门槛,让文字、音乐、视频创作像发朋友圈一样简单 03260 AI开发平台AI开源项目# AI开源项目# 全链路音乐制作# 多语种情感语音
Draw an Audio Draw an Audio通过多模态指令系统实现精准的视频到音频合成,开创音效创作新模式 04760 AI开发平台AI开源项目# AI开源项目# AI音效分层编辑# 多指令控制技术
DemoFusion 要我说这项目最绝的地方,是它把学术界的前沿成果真正落在了实处。不同于那些只能跑benchmark的论文,他们的项目主页直接给出现成的工作流,连Colab新手都能三天上手——这才是真正的技术民主化! 03970 AI开发平台AI开源项目# AI开源项目# ControlNet兼容# 开源AI框架
SFR-RAG 站在技术前线说句公道话,SFR-RAG把RAG技术的faithfulness(忠实度)指标提升到了新高度。虽然参数规模不算顶流,但这种以精度换规模的做法,倒是给吃算力吃到吐的AI行业吹来一阵清风。 02080 AI开发平台AI开源项目# AI开源项目# 企业RAG应用# 低参数高效模型
cogvlm2-llama3-caption 清华THUDM开源的多模态视频理解模型,为视频内容提供专家级文本描述 01610 AI开发平台AI开源项目# AI开源项目# CogVLM2架构# Llama3微调模型
RAGFlow RAGFlow 是一款开源的企业级 RAG 系统,支持多模型并发、结构化数据集成、Web UI 配置等特性。本文详解其部署方式、核心架构与实战应用,助你快速搭建高性能问答系统。 01880 AI开发平台AI开源项目# AI开源项目# AI搜索增强# RAGFlow 部署