AI模型评测
debug诊断信息需要在index.php文件中开启开发者模式才能查看
- AGI-Eval
- MMLU
- Open LLM Leaderboard
- C-Eval
- FlagEval
- SuperCLUE
- OpenCompass
- CMMLU
- MMBench
- HELM debug诊断信息需要在index.php文件中开启开发者模式才能查看
- PubMedQA
- H2O EvalGPT
- LLMEval3
- Chatbot Arena
- HELM
- MMBench
- CMMLU
- OpenCompass
- SuperCLUE
- FlagEval debug诊断信息需要在index.php文件中开启开发者模式才能查看 debug诊断信息需要在index.php文件中开启开发者模式才能查看
ICP备案:沪ICP备2026056879号