FlagEval,AI大模型的评估工具包,FlagEval概述 FlagEval(天秤)是由北京智源人工智能研究院(BAAI)推出的大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,为AI界的开发者和研究者提供一个全面、公正、高效的模型评估解决方案。FlagEval专注于AI大模型的评测,特别是针对基础模型、预训练
如果没有自动跳转,请 点击这里