点击关注👉

帅气的我简直无法用语言描述!
Eleven Labs

Eleven Labs

ElevenLabs文本转语音平台、AI情感语音合成、多语言语音克隆、多角色AI对话生成、AI音频安全与溯源
6320
加州理工学院

加州理工学院

加州理工学院(Caltech)是一座以极小规模撬动最大科学影响力的顶尖研究型大学,其核心价值在于精英培养模式、深度管理NASA喷气推进实验室(JPL)的资源优势以及驱动纯粹科学探索的学术文化。
5580
OmniGen

OmniGen

北京人工智能研究院多任务扩散模型开创者,支持文本/图像/指令混合输入的跨模态创作引擎
3740
Verbatik

Verbatik

让创作不再被文字束缚,Verbatik 智能构建声动世界的想象力
5910
加利福尼亚大学圣迭戈分校

加利福尼亚大学圣迭戈分校

加州大学圣迭戈分校(UC San Diego)以世界级海洋科研与跨学科人工智能项目为核心,为全球学子提供融合创新与多元文化的学术生态。
4600
UniEdit

UniEdit

免调优视频编辑框架开创者,支持文字驱动运动与外观修改
6680
TTS-Voice-Wizard

TTS-Voice-Wizard

TTS Voice Wizard 是一款免费的、高度可集成的开源STT/TTS工具箱,专为VRChat、VTubing及直播场景打造无缝的实时语音转文字解决方案,核心功能零成本使用。
4490
普林斯顿大学

普林斯顿大学

普林斯顿大学通过严苛的学术训练与顶尖资源配置,锻造着未来各领域领军者
3590
TextDiffuser-2

TextDiffuser-2

为创意工作者量身打造的智能文本渲染神器
3740
Snap Video

Snap Video

用一句话总结:基于十亿级参数的时空Transformer模型,Snap Video开创了文本驱动的高质量视频生成新范式
5810
Speech Studio

Speech Studio

微软AI语音技术带来的不只是效率革命,更是声音世界的表达革新
4010
密歇根大学安娜堡分校

密歇根大学安娜堡分校

顶尖公立常春藤开创人工智能新纪元,是前沿研究与卓越学术成就的全球领导者。
4570