正在前往 C-Eval

C-Eval,中文基础模型评估套件,C-Eval概述 C-Eval是一个由香港科技大学自然语言处理团队开发的中文评估套件，旨在对基础模型的高级知识和推理能力进行评估。 C-Eval主要功能 C-Eval的核心功能是提供一套全面的中文评估题目，用于衡量基础模型在各个学科和难度级别上的表现。这些题目覆盖了从中学到大学不同难度级别的52个学

https://cevalbenchmark.com/static/leaderboard_zh.html

如果没有自动跳转，请点击这里

返回开心鸟首页