Loading...
Ai网址
智能对话
写作工具
图像工具
视频工具
音频工具
创意设计
办公助手
大模型
学习平台
应用场景
智能体
趣味应用
开发生态
Ai应用商店
AI书籍
Ai学习教程
投稿收录
安装教程
商务合作
未登录
登录后即可体验更多功能
登录
注册
找回密码
Ai网址
智能对话
写作工具
图像工具
视频工具
音频工具
创意设计
办公助手
大模型
学习平台
应用场景
智能体
趣味应用
开发生态
Ai应用商店
AI书籍
Ai学习教程
投稿收录
安装教程
商务合作
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI模型评测
共 14 篇网址
Ai+写作工具
Ai+图像工具
Ai+音频工具
Ai+视频工具
Ai+创意设计
Ai+智能对话
Ai+办公助手
热门Ai网址
Ai+学习平台
Ai+大模型
AI+智能体
AI+开发生态
AI+应用场景
Ai+趣味应用
AI模型评测
AI训练模型
大语言模型
行业模型
AI视觉模型
多模态模型
AI语音模型
AI视频模型
端侧模型
AI绘画模型
排序
发布
更新
浏览
点赞
MMLU
用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具
614
0
AI模型评测
FlagEval
学术圈公认的模型擂台,FlagEval一站式搞定AI模型的多语言盲测与可信认证
523
0
AI模型评测
AGI-Eval
一个AI大模型评测社区
405
0
AI模型评测
Open LLM Leaderboard
Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台
341
0
AI模型评测
SuperCLUE
中文通用大模型综合性测评基准
335
0
AI模型评测
AI Ping
大模型服务性能评测与统一 API 调用平台
183
0
AI模型评测
Chatbot Arena
基于人类偏好评估AI聊天机器人性能的开放平台
174
0
AI模型评测
Helm Lite
斯坦福大学CRFM团队开发的轻量级语言模型评估基准
162
0
AI模型评测
CMMLU
专为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准
155
0
AI模型评测
FlagEval
北京智源人工智能研究院推出的大模型评测体系及开放平台
153
0
AI模型评测
H2O Eval Studio
H2O.ai开发的一款企业级AI模型评估平台
152
0
AI模型评测
MMBench
OpenCompass社区开发的多模态基准测试工具
144
0
AI模型评测
C-Eval
上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件
144
0
AI模型评测
PubMedQA
用于生物医学研究问题回答的数据集
140
0
AI模型评测
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍