正在前往 C-Eval
C-Eval,中文基础模型评估套件,C-Eval概述 C-Eval是一个由香港科技大学自然语言处理团队开发的中文评估套件,旨在对基础模型的高级知识和推理能力进行评估。 C-Eval主要功能 C-Eval的核心功能是提供一套全面的中文评估题目,用于衡量基础模型在各个学科和难度级别上的表现。这些题目覆盖了从中学到大学不同难度级别的52个学
https://cevalbenchmark.com/static/leaderboard_zh.html
如果没有自动跳转,请 点击这里
返回开心鸟首页