Open LLM Leaderboard

产品概述

Open LLM Leaderboard是Hugging Face平台上的开源大语言模型排行榜，系统性地评估和比较各种开源语言模型的性能。它集成了多个重要基准测试，为社区提供模型性能的透明视图。

聚合多个重要评估基准，包括MMLU、HellaSwag等。提供模型性能的实时排名和比较。支持不同规模模型的分类展示。包含详细的评估指标和分数分析。允许用户提交新模型的评估结果。提供历史数据追踪和性能趋势分析。

模型选型参考、技术研究、性能比较、开源社区建设、学术评估。

AI研究者、开发者、技术决策者、学术机构、对企业技术评估人员。

帮助社区了解各种开源LLM的性能表现，促进模型技术的透明发展和合理选型。