LOADING

打工人Ai工具箱
  • Ai网址
    • Ai+智能对话
    • Ai+写作工具
    • Ai+图像工具
    • Ai+视频工具
    • Ai+音频工具
    • Ai+设计工具
    • Ai+编程助手
    • Ai+办公助手
    • Ai+开源项目
  • Ai应用商店
  • Ai学习教程
  • 投稿收录
  • 安装教程
  • 商务合作
      • 未登录
        登录后即可体验更多功能
    • Ai网址
      • Ai+智能对话
      • Ai+写作工具
      • Ai+图像工具
      • Ai+视频工具
      • Ai+音频工具
      • Ai+设计工具
      • Ai+编程助手
      • Ai+办公助手
      • Ai+开源项目
    • Ai应用商店
    • Ai学习教程
    • 投稿收录
    • 安装教程
    • 商务合作
    未登录
    登录后即可体验更多功能

    AI模型评测

    共 13 篇网址
    Ai+写作工具Ai+图像工具Ai+音频工具Ai+视频工具Ai+设计工具Ai+编程助手Ai+智能对话Ai+办公助手Ai+开源项目热门Ai网址Ai+学习网站Ai+提示词Ai+语言模型
    AI模型评测AI训练模型
    排序
    发布更新浏览点赞
    AI Ping

    AI Ping

    大模型服务性能评测与统一 API 调用平台
    070
    AI模型评测
    H2O Eval Studio

    H2O Eval Studio

    H2O.ai开发的一款企业级AI模型评估平台
    050
    AI模型评测
    PubMedQA

    PubMedQA

    用于生物医学研究问题回答的数据集
    040
    AI模型评测
    Chatbot Arena

    Chatbot Arena

    基于人类偏好评估AI聊天机器人性能的开放平台
    040
    AI模型评测
    MMBench

    MMBench

    OpenCompass社区开发的多模态基准测试工具
    040
    AI模型评测
    Helm Lite

    Helm Lite

    斯坦福大学CRFM团队开发的轻量级语言模型评估基准
    040
    AI模型评测
    CMMLU

    CMMLU

    专为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准
    040
    AI模型评测
    SuperCLUE

    SuperCLUE

    中文通用大模型综合性测评基准
    040
    AI模型评测
    AGI-Eval

    AGI-Eval

    一个AI大模型评测社区
    040
    AI模型评测
    C-Eval

    C-Eval

    上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件
    040
    AI模型评测
    FlagEval

    FlagEval

    北京智源人工智能研究院推出的大模型评测体系及开放平台
    040
    AI模型评测
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台
    050
    AI模型评测
    MMLU

    MMLU

    用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具
    040
    AI模型评测
    没有了

    <script>

    Copyright © 2023 打工人Ai工具箱
    桂ICP备2023002501号-1
      
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍