打工人Ai工具箱
  • Ai网址
    • Ai+智能对话
    • Ai+写作工具
    • Ai+图像工具
    • Ai+视频工具
    • Ai+音频工具
    • Ai+创意设计
    • Ai编程助手
    • Ai+办公助手
    • Ai开源项目
  • Ai应用商店
  • Ai学习教程
  • 投稿收录
  • 安装教程
  • 商务合作
      • 未登录
        登录后即可体验更多功能
    • Ai网址
      • Ai+智能对话
      • Ai+写作工具
      • Ai+图像工具
      • Ai+视频工具
      • Ai+音频工具
      • Ai+创意设计
      • Ai编程助手
      • Ai+办公助手
      • Ai开源项目
    • Ai应用商店
    • Ai学习教程
    • 投稿收录
    • 安装教程
    • 商务合作
    未登录
    登录后即可体验更多功能

    AI模型评测

    共 14 篇网址
    Ai+写作工具Ai+图像工具Ai+音频工具Ai+视频工具Ai+创意设计Ai+智能对话Ai+办公助手热门Ai网址Ai+学习平台Ai+大模型AI+智能体AI开发生态AI应用场景AI写作Ai+趣味应用
    AI模型评测AI训练模型大语言模型行业模型AI视觉模型多模态模型AI语音模型AI视频模型端侧模型AI绘画模型
    排序
    发布更新浏览点赞
    FlagEval

    FlagEval

    学术圈公认的模型擂台,FlagEval一站式搞定AI模型的多语言盲测与可信认证
    04390
    AI模型评测
    SuperCLUE

    SuperCLUE

    中文通用大模型综合性测评基准
    01070
    AI模型评测
    AGI-Eval

    AGI-Eval

    一个AI大模型评测社区
    0900
    AI模型评测
    FlagEval

    FlagEval

    北京智源人工智能研究院推出的大模型评测体系及开放平台
    0740
    AI模型评测
    MMLU

    MMLU

    用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具
    02070
    AI模型评测
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台
    0660
    AI模型评测
    C-Eval

    C-Eval

    上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件
    0650
    AI模型评测
    CMMLU

    CMMLU

    专为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准
    0640
    AI模型评测
    Helm Lite

    Helm Lite

    斯坦福大学CRFM团队开发的轻量级语言模型评估基准
    0870
    AI模型评测
    MMBench

    MMBench

    OpenCompass社区开发的多模态基准测试工具
    0690
    AI模型评测
    Chatbot Arena

    Chatbot Arena

    基于人类偏好评估AI聊天机器人性能的开放平台
    0720
    AI模型评测
    PubMedQA

    PubMedQA

    用于生物医学研究问题回答的数据集
    0690
    AI模型评测
    H2O Eval Studio

    H2O Eval Studio

    H2O.ai开发的一款企业级AI模型评估平台
    0730
    AI模型评测
    AI Ping

    AI Ping

    大模型服务性能评测与统一 API 调用平台
    0870
    AI模型评测
    没有了

    <script>

    Copyright © 2023 打工人Ai工具箱
    桂ICP备2023002501号-1
      
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍