cogvlm2-llama3-caption 清华THUDM开源的多模态视频理解模型,为视频内容提供专家级文本描述 01610 AI开发平台AI开源项目# AI开源项目# CogVLM2架构# Llama3微调模型